Профессия Data Scientist + курс по Soft skills от Skillfactory

Смотреть курс на Skillfactory
Дешевле на 5% с промокодом

Полная стоимость

362 994 ₽/курс 181 497 ₽/курс
-50%

Минимальный платеж в месяц

4 992 ₽/мес

Это минимальный платеж в рассрочку. Рассрочка в Skillfactory без % и первый платеж через 3 месяца.

Длительность

Длительность:

24 месяца

Дата начала

Дата начала:

27 Ноября
Дешевле на 5% с промокодом
Смотреть курс на Skillfactory

О курсе

Программа рассчитана на обучение науке о данных с нуля. Вы начнете с SQL и Python. Получите необходимую теорию по математике, статистике и теории вероятности и отработаете ее на практике. А через год легко сможете решать задачи и устроитесь на новую работу.
Все курсы "Skillfactory"

О школе

SkillFactory — узкоспециализированная школа: учит Data Science, аналитике данных и программированию. Многолетний фокус на инженерных специальностях помогает наращивать экспертизу и постоянно совершенствовать курсы.

Программа обучения

24 месяцев обучения
Формат: Онлайн, гибкий график занятий
Уровень: с нуля

 

 

БАЗА

На этом этапе вы изучите основы программирования на Python, научитесь предобрабатывать и анализировать данные, а также познакомитесь с основными задачами дата-сайентиста.

1. Введение

Вы сможете сформулировать для себя реальные цели обучения, узнаете, в чем ценность DS для бизнеса, познакомитесь с основными задачами дата-сайентиста и разберетесь, как строится разработка любого DS-проекта.

  • INTRO-1. Как учиться эффективно — онбординг в обучение
  • INTRO-2. Обзор профессии. Типы задач в Data Science. Этапы и подходы к разработке Data Science проекта

 

2. Проектирование разработки

Вы научитесь работать с основными типами данных с помощью языка Python и сможете применять в повседневной работе циклические конструкции, условные операторы и функции.

  • PYTHON-1. Основы Python
  • PYTHON-2. Погружение в типы данных
  • PYTHON-3. Условные операторы
  • PYTHON-4. Циклы
  • PYTHON-5. Функции и функциональное программирование
  • PYTHON-6. Практика
  • PYTHON-7. Гид по стилю в среде Python (бонусный)

 

3. Работа с данными

Вы сможете выгружать данные из разных форматов и источников. А поможет вам в этом SQL — язык структурированных запросов. Вы научитесь использовать агрегатные функции, соединения таблиц и сложные объединения.

  • PYTHON-16. Как выгружать данные из файлов разных форматов
  • PYTHON-17. Получение данных из веб-источников и API
  • SQL-0. Привет, SQL!
  • SQL-1. Основы SQL
  • SQL-2. Агрегатные функции
  • SQL-3. Соединение таблиц
  • SQL-4. Сложные объединения
  • Проект 2. Подгрузка новых данных. Уточнение анализа

 

4. Статистический анализ данных

Разведывательный анализ данных (EDA) — вот, что окажется в центре вашего внимания. Вы познакомитесь со всеми этапами такого анализа и научитесь проводить его с помощью библиотек Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Кроме того, вам удастся поработать на Kaggle, популярном сервисе по участию в соревнованиях.

  • EDA-1. Введение в разведывательный анализ данных. Алгоритмы и методы EDA
  • EDA-2. Математическая статистика в контексте EDA. Типы признаков
  • EDA-3. Проектирование признаков (Feature Engineering)
  • EDA-4. Статистический анализ данных на Питоне
  • EDA-5. Статистический анализ данных на Питоне. Часть 2
  • EDA-6. Проектирование экспериментов
  • EDA-7. Kaggle площадка
  • Проект 2

 

5. Введение в машинное обучение

Вы познакомитесь с ML-библиотеками для моделирования зависимостей в данных. Вы сможете обучить основные виды ML-моделей, провести валидацию, интерпретировать результаты работы и выбрать важные признаки (feature importance).

  • ML-1. Теория машинного обучения
  • ML-2. Обучение с учителем: Регрессия
  • ML-3. Обучение с учителем: Классификация
  • ML-4. Обучение без учителя: Кластеризация и техники понижение размерности
  • ML-5. Валидация данных и оценка модели
  • ML-6. Отбор и селекция признаков
  • ML-7. Оптимизация гиперпараметров модели
  • ML-8. ML Cookbook
  • Проект 3. Задача классификации

 

ОСНОВНОЙ БЛОК

Линейная алгебра, математический анализ, дискретная математика — звучит страшно, но не пугайтесь: разберем все эти предметы и научим с ними работать! На втором этапе вы погрузитесь в математику и основы машинного обучения, узнаете больше о профессиях DS, а также благодаря профориентации выберите трек обучения второго года.

6. Математика и машинное обчение. Часть 1

Вы сможете решать практические задачи с помощью ручного счета и Python (векторные и матричные вычисления, работа с множествами, исследование функций с помощью дифференциального анализа).

  • MATH&ML-1. Линейная алгебра в контексте Линейных методов. Часть 1
  • MATH&ML-2. Линейная алгебра в контексте Линейных методов. Часть 2
  • MATH&ML-3. Математический анализ в контексте задачи оптимизации Часть 1
  • MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть 2
  • MATH&ML-5. Математический анализ в контексте задачи оптимизации. Часть 3
  • Проект 4. Задача регрессии

 

7. Математика и машинное обчение. Часть 2

Вы познакомитесь с основными понятиями теории вероятности и математической статистики, алгоритмами кластеризации, а также научитесь оценивать качество произведенной кластеризации и представлять результаты в графическом виде.

  • MATH&ML-6. Теория вероятностей в контексте Наивного Байесовского классификатора
  • MATH&ML-7. Алгоритмы на основе Деревьев решений
  • MATH&ML-8. Бустинг & Стекинг
  • MATH&ML-9. Кластеризация и техники понижение размерности. Часть 1
  • MATH&ML-10. Кластеризация и техники понижение размерности. Часть 2
  • Проект 5. Ансамблевые методы

 

8. ML в бизнесе

Вы научитесь использовать ML-библиотеки для решения задачи временных рядов и рекомендательных систем. Вы сможете обучить ML-модель и провести её валидацию, а также создать работающий прототип и запустить модель в веб-интерфейсе. А ещё получите навыки A/B-тестирования, чтобы можно было оценить модель.

  • MATH&ML-11. Временные ряды. Часть 1
  • MATH&ML-12. Временные ряды. Часть 2
  • MATH&ML-13. Рекомендательные системы. Часть 1
  • MATH&ML-14. Рекомендательные системы. Часть 2
  • PROD-1. Подготовка модели к Production
  • PROD-2. ПрототипStreamlit+Heroku
  • PROD-3. Бизнес понимание. Кейс
  • Проект 6. Тема на выбор: Временные ряды или Рекомендательные системы

 

Уровень PRO

На третьем этапе вы познакомитесь с одним из методов машинного обучения — глубоким обучением (DL). А также вас ждет полноценный блок выбранной специализации: вы можете освоить навыки машинного обучения (ML), познакомиться с рутиной CV (компьютерного зрения) или прокачаться в NLP*, обработке естественного языка.

9. Профориентация

  • ML, CV или NLP: на этом этапе вам наконец предстоит сделать выбор, по какому пути двигаться дальше. Мы расскажем о каждой специализации и предложим решить несколько практических задач, чтобы вам было проще определиться.

 

10. Трек ML - Engineer

В ML-треке вы научитесь решать углубленные задачи машинного обучения, овладеете компетенциями дата-инженера, отточите навык работы с библиотеками Python. Также вы научитесь создавать MVP (минимально жизнеспособную версию продукта), узнаете все тонкости вывода ML-модели в продакшн и узнаете, как работают ML-инженеры в реальной жизни.

  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в Production
  • Углубленное изучение ML-разработки и выпускной проект по выбранной теме

 

11. Трек CV - Engineer

На CV-треке вы научитесь решать такие задачи компьютерного зрения, как классификация изображений, сегментация и детекция, генерация и стилизация картинок, восстановление и повышение качества фотографий. Кроме того, вы узнаете, как выкатывать нейронные сети в продакшн.

  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в Production
  • Углубленное изучение ML-разработки и выпускной проект по выбранной теме

 

12. Трек NLP - Engineer

В ходе обучения на NLP-треке вы узнаете, как решаются основные задачи обработки естественного языка, в том числе классификация, суммаризация и генерация текста, машинный перевод и создание диалоговых систем.

  • Введение в Deep Learning
  • Математика нейронных сетей для NLP
  • Hard & Software для решения задач NLP
  • Задачи и алгоритмы NLP
  • Нейронные сети в Production
  • Углубленное изучение NLP-разработки и выпускной проект по выбранной теме

 

13. Deep Learning и нейронные сети

Где применяются нейросети? Как обучить нейронную сеть? Что такое Deep Learning? Ответы на эти вопросы вы узнаете в бонусном разделе DL.

 

14. Введение в Data Engineering

Вы узнаете, в чём различие ролей дата-сайентиста и дата-инженера, какими инструментами пользуется последний в своей работе, какие задачи ежедневно решает. Слова «снежинка», «звезда» и «озеро» обретут новые значения :)

Отзывы о Skillfactory
4.80
5.0 5
Денис,

Fullstack-разработчик на Python

Закончив курсы по фуллстек разработке на Питоне, хочу поделиться своими впечатлениями. Начинал я имею небольшую базу знаний и поначалу не верилось что смогу пройти до конца, но по мере прохождения курса стало понятно что мне нравится обучение и становится всё интереснее, по мере того как видишь какой-то результат. JavaScript для меня был темным лесом, но оказалось что после курса бэкенда и того знания Python, что дается на курсе, это не так сложно. Безусловно были моменты когда опускались руки, но главное перебороть этот момент, в любом случае если что тебе помогут менторы. Я очень доволен тем что обратился именно в SkillFactory и однозначно могу советовать его всем.

Ответить

next1 комментарий

 
5.0 5
Ирина Сафонцева,

Профессия Аналитик данных

О школе узнала из случайной рекламы в соц.сети. Заинтересовала специальность - Аналитика данных. Попросила менеджеров школы выслать подробную информацию о курсе. Программа достаточно обширная, рассматривается много различных тем, инструментов для работы с данными. Привлекло, что курс по времени занимает примерно 18 месяцев, т.е. примерно такое же время, как дается в ВУЗе на специализацию (не общие дисциплины).
Сразу хочу отметить, что работаю в области ИТ, имею дело с БД и данными. Программа не для новичков в области ИТ, если вы не работаете с данными и не сталкивались с анализом, SQL, программированием, то будет непросто.
Материалов много, заданий много, вебинары - каждую неделю. Поддержка студентов замечательная. Ответ практически на любое задание можно найти в чате поддержки. Кураторы отвечают оперативно, записывают видео с пояснениями.
Могу порекомендовать курс тем, кто действительно хочет много учиться и осваивать новую профессию.

Ответить

next0 комментариев

 
5.0 5
Галина,

Тестирование на Python

Учусь на курсе тестировщик-автоматизатор на Python. Учиться интересно, в целом все нравится. Написано понятно, если тема не раскрыта достаточно подробно есть ссылки на сторонние ресурсы. В конце каждого модуля - практическое задание на закрепление материала. Также, пока проходишь модуль, делаешь маленькие простые задания "на усвоение" прочитанного. Есть мелкие недочеты, но не критично(довольно долгая проверка практических заданий, открытие модулей по календарному расписанию). В целом, в дальнейшем взяла бы здесь еще один курс.

Ответить

next0 комментариев