Сегодня информация — это основа любого бизнеса, инструмент эффективного управления и оптимизации рабочих процессов. Аналитика больших данных (Big Data) вашего бизнеса поможет своевременно выявить и даже предупредить множество проблем, от оттока клиентов до утечки персональных данных. Чтобы понимать возможности современных технологий и выбирать среди них наилучшее соотношение «стоимость/результат», менеджеру необходимо разбираться в базовых понятиях и прикладных решениях.
Теоретический курс Аналитика больших данных для руководителей ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса.
На практических примерах вы узнаете все особенности процессов инициации проектов цифровой трансформации, от сбора данных до формирования команды. Также детально познакомитесь с каждой фазой жизненного цикла работы с Big Data: подготовка данных, выбор модели, пилотное развертывание и тестирование прототипа, промышленная эксплуатация.
Программа
Введение в Big Data
- Большие данные и цифровизация бизнеса.
- Методы аналитики больших данных.
- Отраслевая специфика аналитики больших данных.
- Сценарии применения технологий больших данных.
- Жизненный цикл аналитики данных: получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение.
- Формирование озера данных Data Lake.
Data Mining — извлечение знаний из больших данных
- Задачи и техники Data Mining.
- Классификация и кластеризация.
- Прогнозирование и визуализация.
- Ассоциативные правила и обнаружение аномалий.
- Методология CRISP-DM, SEMMA.
- Инструменты Data Mining.
- Специфика применения Data Mining для разных отраслей бизнеса с примерами.
Машинное обучение для Data mining
- Основные определения.
- Задачи и область применения машинного обучения.
- Supervised/unsupervised машинное обучение.
- Инструменты и технологии машинного обучения.
Data mining в социальных сетях
- Введение в анализ социальных сетей и теорию графов.
- Базовые алгоритмы на графах и основные возможности графового анализа.
- Феномен маленького мира.
- Выделение важных узлов в социальных сетях.
- Инструменты и методы визуализации графов для применения в бизнесе.
Инструментарий для работы с Big Data
- Специфика работы с Big Data.
- Аналитика для неструктурированных данных с использованием Hadoop.
- Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data (MapReduce, HDFS, YARN, Spark, HBase, Hive, и т. д.).
- Сравнительный анализ Hadoop дистрибутивов (Arenadata Hadoop, Cloudera, ванильный Apache Hadoop) и инструментарий аналитика данных на примерах использования.
- Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.
- Облачные платформы (AWS, YandexCloud, Azure, MailCloud) для реализации решений по Big Data.
- Средства визуализации для аналитики данных.
Интеграция Больших данных
- Основные принципы работы с BigData.
- Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети).
- Пакетная и динамическая загрузка данных.
Правовые аспекты организации защиты персональных данных (опционально)
- Правовое регулирование в области защиты персональных данных.
- Международная практика в области защиты персональных данных.
- Права субъекта и обязанности оператора при обработке персональных данных.
- Виды нарушений безопасности персональных данных Стандарт GDRP.
С чего начать?
- Формирование команды проекта Big Data. Ключевые роли.
- Специфика рынка данных и аналитики.
- Использование подходов Agile и DevOps.
- Методологии для стандарты.
- Отличия подходов Business Intelligence и Data Science.
- Сравнительные характеристики программных и аппаратных решений для реализации решений по BigData.