Вы научитесь собирать и анализировать данные, извлекать полезную информацию и находить закономерности. После обучения сможете проверять гипотезы и помогать бизнесу принимать взвешенные решения.
Аналитик Big Data извлекает ценные данные из большого массива информации: отзывов, прогнозов, результатов исследований. Он помогает бизнесу принимать взвешенные решения: строить гипотезы, запускать продукты, улучшать процессы, планировать развитие.
Кому подойдет курс
- Новичкам. Даже если вы никогда не работали в IT, вы получите востребованную и высокооплачиваемую специальность.
- Начинающим аналитикам. У вас будет всё для ускоренного карьерного роста: комплексные знания и опыт работы с продвинутыми инструментами, методологиями и стандартами.
- ПрактикующимIT-специалистам. Подскажем, как перейти в востребованное направление и зарабатывать больше.
Программа
Фундамент анализа данных
Студенты научатся главному инструменту аналитика — языку SQL. Также изучат основы языка Python и базовые библиотеки Python для анализа данных (NumPy, Pandas, Matplotlib, Scikit-learn).
Сбор, обработка и хранение данных
Это основы Big Data. Студенты научатся собирать данные из различных источников. Также проработают процессы предобработки неструктурированных данных и их хранения в различных базах данных для дальнейшего анализа. На заключительном этапе познакомятся с популярным инструментом по работе с большими данными — Hadoop.
Алгоритмы обработки и анализа данных. Совместно с компанией X5 Retail Group
Студенты начнут изучение теории вероятностей и математической статистики для понимания работы алгоритмов анализа данных. Также узнают базовые алгоритмы для решения основных задач анализа данных, научатся реализовать их с помощью Python и смогут применять их на практике в дальнейшем.
Системы машинного обучения
Студенты погрузятся в прикладное машинное обучение: решат несколько бизнес-кейсов с применением ML, а также подробно изучат популярный фреймворк для работы с BigData — Apache Spark.
Аналитика Big Data для бизнеса
Студенты научатся решать задачи ML с отзывами клиентов, геоданными и соцсетями. Также освоят несколько задач бизнес-аналитика в современных BI-системах: построение витрин данных, прогнозирование, управление знаниями и отчетность.Также студенты познакомятся с real-time системой обработки и анализа больших данных на основе Kafka и Apache Streaming.
Чему вы научитесь
- Владеть методами анализа больших данных и методами машинного обучения.
- Использовать в работе методы прикладной статистики и теории вероятностей.
- Уметь обрабатывать большие данные с помощью разных технологий (Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming).
- Владеть SQL и NoSQL СУБД.
- Работать с BI-системами (Power BI), формировать отчёты анализа данных.
- Программировать на Python и работать с библиотеками для анализа данных (NumPy, Matplotlib, scikit-learn).