Навыки, которые вы получите:
Hadoop
BigData
NoSQL
MapReduce
Apache hive
HDFS
ETL
Этот курс дает представление об основах BigData и Hadoop. Участники познакомятся с HDFS — стандартом де факто для долговременного надежного хранения больших объемов данных, фреймворком MapReduce, автоматически управляющим параллельным выполнением приложений на кластере, и сопутствующими проектами, составляющими экосистему Hadoop.
Кому подойдет курс
- Data-инженерам.
- Администраторам.
- DevOps-инженерам.
- Программистам.
- Всем, кому интересно повысить свой профессиональный уровень в направлении Hadoop и Big Data.
Программа
- Основные понятия.
- NoSQL базы данных.
- Начало работы с Hadoop.
- Работа с HDFS.
- MapReduce и YARN.
- Работа с Hive и Impala.
- Форматы файлов в Hadoop.
- Практическая работа со Standalone кластером, с HDFS, Spark on YARN.