Навыки, которые вы получите:
Kubernetes
Apache Spark
Apache airflow
PostgreSQL
Apache Kafka
Prometheus
Pentaho
BigQuery
Redshift
Apache hive
ClickHouse
Azure DataBricks
Python
Инженер данных оптимизирует пайплайны и схемы хранения данных, настраивает всевозможные мониторинги, отлавливает и исправляет неоптимальные запросы и помогает команде аналитики делать свою работу продуктивно.
Изучать современные подходы стоит для того, чтобы находить оптимальное решение задач бизнеса: не просто нажать пару кнопок и добавить несколько узлов в облачном кластере — а с оглядкой на эффективность использования ресурсов и стоимость решения задачи.
Кому подойдет курс
- Системным и сетевым администраторам.
- Backend или Fullstack-разработчикам.
- Новичкам, желающим войти в сферу Data Science.
Программа
- SQL и получение данных.
- Data Warehouse.
- Business Intelligence решения и многомерная модель данных.
- Python.
- Data Lake & Hadoop.
- Продвинутые методы работы с данными.
- Работа с потоковыми данными.
- Работа с данными в облаке.
- Введение в DS & ML.
- MLOps.
- Дипломный проект.
Чему вы научитесь
- Проектировать схемы хранилищ и выбирать DWH под задачу и бюджет бизнеса среди популярных решений: Snowflake, BigQuery, Azure SQL DW, Redshift.
- Настраивать и конфигурировать ETL / ELT-процессы в нескольких дата-инструментах.
- Lambda architecture, kappa architecture, а также hdfs, yarn, hive и другими обязательными частями инфраструктуры.
- Построите свой конвейер обработки даннных, сборщик событий, RTDM-систему с выводом в массовые enterprise BI-решения.
- Сможете понимать, пояснять и обогащать данные отчётов, дашбордов и других источников информации.
- Включать в него модели машинного обучения, нейронные сети, сервисы оркестрирования контейнеров и проверку версионности.