Дата-инженер с нуля до middle от Нетология

Смотреть курс на Нетология
Дешевле на 15% с промокодом

Полная стоимость

245 000 ₽/курс 147 000 ₽/курс
-40%

Минимальный платеж в месяц

4 083 ₽/мес

на 24 месяца

Длительность

Длительность:

17 месяцев

Дата начала

Дата начала:

05 Декабря
Дешевле на 15% с промокодом
Смотреть курс на Нетология

Для кого

Курс ориентирован на амбициозных индивидов, стремящихся к мастерству в области Дата-инженерии, без ограничений по предшествующему опыту.

Чему научитесь

В рамках курса участники осваивают техники автоматизированного управления информационными массивами, проектирование структур для хранения данных, создание и оптимизацию конвейеров обработки информации, конфигурирование процессов извлечения, трансформации и загрузки данных, а также разработку приложений с использованием доменно-специфичного языка потоковой обработки Kafka Streams.

Программа обучения

1. Разъяснение конструкции и организации информационных репозиториев.
2. Разработка архитектуры хранения данных и подбор системы для анализа данных, соответствующей финансовым возможностям и задачам компании.
3. Создание механизмов для обработки информационных массивов.
4. Налаживание и настройка процессов извлечения, трансформации и загрузки данных с использованием различных инструментов.
5. Разработка программного обеспечения с применением Kafka Streams DSL.
6. Конфигурирование системы для инициирования оповещений в случае возникновения определенных событий.
7. Применение Spark SQL для анализа данных и управления DataFrame API.
8. Использование навыков анализа данных для интерпретации, разъяснения и улучшения информации в отчетах.

Пункты для резюме

Ключевые компетенции:
- Разъяснение концепции и организации данных в базах
- Разработка архитектуры хранилищ данных и подбор соответствующего DWH в соответствии с финансовыми возможностями и потребностями компании
- Реализация механизмов обработки информационных массивов
- Наладка и настройка процессов ETL / ELT с использованием различных инструментов для работы с данными
- Программирование на DSL для потоков Kafka
- Применение Spark для работы с SQL-запросами
- Владение навыками работы с данными (data literacy)
- Демонстрация ключевых данных, имеющих значение для бизнеса
- Сбор и систематизация данных в многомерные структуры для последующего анализа и отчетности

Инструменты и технологии:
- Tableau
- Metabase
- PostgreSQL
- Python
- Apache Spark
- Apache Airflow
- Docker
- Apache Kafka
- ClickHouse
- Yandex Cloud
- Kubernetes
- Prometheus

Сертификат/Диплом

Диплом переподготовки удостоверяет новую квалификацию.

О курсе

Перейдёте в профессию с высоким окладом на низкоконкурентном рынке. Научитесь автоматизировать работу с данными и разрабатывать архитектуру данных. Сможете претендовать на позицию инженера данных через 12 месяцев обучения.
Все курсы "Нетология"

О школе

Нетология — это образовательная платформа. Над курсами работает большая команда: авторы, методисты, продюсеры, преподаватели, маркетологи, редакторы. Каждый следит за трендами на рынке, чтобы запустить качественную программу. Студент попадает в комфортную образовательную среду: быстро вовлекается в учебный процесс, получает обратную связь от экспертов и обменивается опытом с единомышленниками.

Программа обучения

209 часов теории
304 часа практики
Дипломный проект

 

1. SQL и получение данных

  • Введение в SQL. Установка и знакомство
  • Основы и работа с базами данных
  • Основы SQL
  • Углубление в SQL
  • Работа с базой данных PostgreSQL

 

2. SQL PRO

  • Командная строка. DCL и TCL
  • Зависимости. Нормализация. Денормализация
  • Масштабирование функций
  • Интеграция: API, Redis
  • Хранимые процедуры и триггеры событий
  • Основы проектирования: архитектурные модели, модели данных

 

3. Data Warehouse

  • Введение в хранилища данных
  • Проектирование хранилища данных
  • Pentaho как инструмент ETL
  • Ускорение трансформаций
  • Автоматизация обновлений
  • Data governance и Data quality

 

4. Выбор и подключение Business Intelligence-решений

  • Business Intelligence (BI) как сердце аналитики
  • Многомерное представление данных
  • Разработка многомерных баз (кубов) на платформе MS SSAS
  • Принципы визуализации данных
  • Современные подходы к BI в облаке
  • Отчётность real-time

 

5. Python для анализа данных

  • Управляющие конструкции и коллекции
  • Работа с файловой системой и модули
  • Исключения и обработка ошибок
  • Регулярные выражения и основы синтаксического разбора
  • Библиотека NumPy
  • Библиотека Pandas

 

6. Data Lake & Hadoop

  • Основы Hadoop: архитектура
  • Data Lake vs Data Warehouse
  • HDFS: логика работы, Namenode и Datanode
  • MapReduce: алгоритм и решение задач
  • Yarn, Pig & Hive
  • HBase & Cassandra: возможности и основные характеристики
  • Управление и администрирование кластера
  • Обзор Apache Ambari, Apache Ranger, Apache Atlas

 

7. Продвинутые методы работы с данными

  • Apache Spark: основные команды и RDD
  • Spark SQL: DataFrame API и Dataset API
  • Архитектура Spark: компоненты и идеи
  • Apache Airflow: основные сущности для построения задач и взаимодействие сущностей
  • Работа с Airflow: запуск DAG и механизм XCom
  • Data Build Tool как инструмент ETL

 

8. Работа с потоковыми данными

  • Устройство Clickhouse и загрузка данных в корпоративное хранилище
  • Устройство Kafka и работа с кластером
  • Конфигурация Kafka Streams
  • Kafka Streams Interactive Queries, Kafka Streams Processor API, Kafka Connect
  • Spark Streaming: характеристики и особенности использования
  • Создание простого приложения на Spark Structure Streaming + Kafka

 

9. Работа с данными в облаке

  • Построение пайплайна в облачной среде
  • Работа с виртуальными машинами
  • Хранение и анализ данных в облаке
  • Прогнозирование затрат и оптимизация расходов
  • Обеспечение безопасности в облаке
  • DevOps и автоматизация

 

10. Введение в DS & ML

  • Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
  • Классификация: Логистическая регрессия и SVM
  • Оценка точности модели, переобучение, регуляризация
  • Работа с качеством данных
  • Деревья решений
  • Поиск выбросов и генерация новых признаков
  • Feature Selection
  • Ансамблирование

 

11. MLOps

  • Что такое DevOps / MLOps
  • Docker и микросервисная архитектура
  • Технологии контейнеризации, k8s
  • Оркестраторы
  • CI/CD
  • Мониторинг
  • Инструменты DevOps для обучения ML-моделей
  • Deploy ML-моделей

 

12. Английский язык для начинающих инженеров

  • Лексика, без которой не обойтись IT-специалисту
  • Как вести переписку на английском
  • Чтение документации и анализ требований
  • Программирование
  • Стрессовые ситуации
  • Работа и роли в команде
  • Как поддержать любую беседу на английском
  • Собрания, презентации

 

13. Карьерное планирование

  • Создание резюме: как поменять сферу, используя опыт предыдущих компаний
  • Отработка навыков написания резюме
  • Карьерное консультирование

 

Дипломный проект

Под руководством ментора вы обработаете данные, сформируете нормализованную схему данных, опишите ETL-процессы для заливки данных и создания витрин. Сформируйте набор метрик и дашбордов на их основе.

Отзывы о Нетология
4.80
4.0 4
Семён,

Ответить

next0 комментариев

 
5.0 5
Женя,

Сделал выбор и не прогадал

Всем привет! У меня обучение прошло на столько гладко, что и расказать особо нечего) Но если кто выбирает и этот отзыв будет полезен, то будет здорово.

Все излагают понятным языком, как для дурака. Во всяком случае в первом блоке - точно. Разбираются темы и впоросы, прямо во время лекции. Удобно что не нужно дополнительно ничего искать, весь материал и дополнительные книги указаны в методичках к урокам. Учился машинному обучению, сейчас занимаюсь соответствующими приложениями. Оч круто!

Ответить

next1 комментарий

 
5.0 5
Жанна Анатольевна,

Ответить

next0 комментариев