Навыки, которые вы получите:
Linux
Data structure
Data science
Functional programming
Python
Для кого
- Аналитикам
- Разработчикам
Необходимые знания
- Линейная алгебра
- Статистика
- Фитон
Чему вы научитесь
- очистка данных и поиск отсутствующих значений
- прогнозирование и классификация
- кластерный анализ данных и поиск взаимосвязей
- запуск a/b-тестирований и валидация теории
- запуск a/b-тестирований и валидация теории
- Инструменты: Научитесь работать с цифрами и математическими формулами в NumPy, с табличными данными ― в Pandas, с визуализацией ― в Matplotlib, Seaborn и Plotly. И освойте еще 6 библиотек Python для науки о данных
- Сильный контент: Получите обзор основных задач Data Science, разберите базовые типы визуализаций и моделей регрессий, техники построения ансамблей и моделей машинного обучения.
- Практика: Во время обучения вас ждет очень много практики. Вы будете выполнять сложные домашние задания и получать фидбек от лектора по каждому
- Карьера: Значительно расширите стек навыков, сможете внедрить новые решения на текущей работе и заложите фундамент для развития в Data Science
Программа
- Введение в Data Science. Знакомство с задачами и инструментами
- NumPy. Линейная алгебра и статистика
- Pandas. Работа с табличными данными
- Matplotlib и Seaborn. Визуализация данных
- Продвинутые и интерактивные визуализации с Plotly. Exploratory Data Analysis и очистка данных
- Прогнозирование. Линейная регрессия и градиентный спуск
- Прогнозирование. Выбор наилучшей модели и перекрестная валидация
- Прогнозирование. Другие виды регрессий
- Классификация. Логистическая регрессия
- Деревья принятия решений
- Ансамбли моделей
- Алгоритмы бустинга: адаптивный и градиентный бустинг. Библиотеки CatBoost и XGBoost
- Кластерный анализ данных
- Отбор признаков и уменьшение соразмерности данных
- Поиск и устранение отсутствующих значений
- Статистический анализ данных