Школа Больших данных

Мы предлагаем уникальные практические курсы по Big Data (большие данные) а также материалы, новости, документы по следующим направлениям: Большие данные, Data Mining, Internet of Things, Industrial Internet of Things, цифровая трансформация, компоненты экосистемы Hadoop, Apache Spark, NoSQL и многое другое.

События

Серия событий, идет сейчас

6 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database. www.bigdataschool.ru/courses/data-f...

Далее

Серия событий, идет сейчас

4х-дневный курс для специалистов, желающих получить и систематизировать знания по использованию Apache Kafka для программирования распределенной обработки потоков событий (Event Stream Processing) на практических примерах с потоковыми данными в реальном времени. Программа курса: www.bigdataschool.ru/courses/apache...

Далее

Серия событий, идет сейчас

6-дневный курс о том, как организовать полный цикл разработки и внедрения систем машинного обучения и нейронных сетей, включая LLM, и эффективно сопровождать их в промышленных решениях с использованием современных подходов и технологий.

Далее

Серия событий, ближайшее 16 июня

4-дневный практический курс для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для обработки и анализа больших данных. Подробная программа курса: www.bigdataschool.ru/courses/apache...

Далее

Серия событий, ближайшее 16 июня

Курс обучения содержит теоретический минимум, необходимый для эффективного использования всех компонентов Apache Spark: от основ RDD до современных инструментов (Delta Lake, Spark on Kubernetes). Практическая часть включает запуск и настройку компонентов, работу в среде Jupyter Notebook, прикладное использование Спарк для разработки собственных распределенных приложений пакетной и потоковой обработки информации и анализа больших данных.

Далее

Серия событий, ближайшее 23 июня

MLOPS: РАЗРАБОТКА И ВНЕДРЕНИЕ ML-РЕШЕНИЙ Подходы к разработке ML-решений + средства их реализации и внедрения в production. Вы пройдете все шаги создания ML-продукта от сбора данных до интеграции ML-модели в эксплуатацию. Познакомитесь с популярными инструментами командной разработки: Git, MLFlow, DVC. Узнаете главные архитектуры ML-решений и основы менеджмента DS-проектов*. Записаться на обучение Подробнее описание программы можно посмотреть по ссылке: www.bigdataschool.ru/courses/mlo...

Далее

Серия событий, ближайшее 25 июня

3-дневный практический курс по эксплуатации кластера Apache NiFi для дата-инженеров, проектирующих конвейеры потоковой обработки данных и администраторов кластера Apache NiFi.

Далее

Серия событий, ближайшее 30 июня

6-дневный курс обучения, на котором вы рассмотрите классические методы, современные подходы и лучшие практики к построению корпоративной архитектуры данных. Проведете сравнительный анализ фреймворков, научитесь строить модели архитектуры платформ данных

Далее

Серия событий, ближайшее 30 июня

Курс «Нейронные сети на Python» представляет собой прикладные основы наиболее популярного метода Machine Learning, включая всю необходимую теорию и практику по этой области искусственного интеллекта. В программе рассмотрена математическая база современных нейросетевых алгоритмов. В курсе приведены базовые задачи, которые могут быть решены с помощью методов нейросетей: классификация изображений и другие прикладные кейсы распознавания образов.

Далее

Серия событий, ближайшее 2 июля

Интенсивный 3-хдневный практический курс по установке, настройке и администрированию кластера Apache Kafka 4.0, распределенной потоковой обработке событий (Event Stream Processing), конфигурации безопасности Kerberos, интеграции с Apache NiFi и Greenplum.

Далее

Серия событий, ближайшее 7 июля

4-дневный обучающий курс «Администрирование базы данных Arenadata DB (Greenplum)» предоставляет необходимые знания и навыки по сопровождению и поддержке кластера Arenadata DB при эксплуатации в облачной инфраструктуре и дата центре.

Далее

Серия событий, ближайшее 7 июля

5 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.

Далее

Серия событий, ближайшее 14 июля

5-дневный курс обучения по ClickHouse позволит систематизировать необходимые знания и навыки для работы с СУБД ClickHouse. Курс позволит понять, как устроена платформа ClickHouse, её возможности и ограничения для решения различных сценариев, связанных с обработкой и анализом больших объемов данных.

Далее

21 июля c 10:00 до 17:00, через 48 дней

1-дневный интенсивный курс для подготовки к сдаче сертификационного экзамена ClickHouse Certified Developer позволит систематизировать необходимые знания и навыки для успешной сдачи сертификационного экзамена ClickHouse Certified Developer. Курс построен на отработке практических примеров необходимых для выполнения заданий в экзаменационном практикуме.

Далее

Серия событий, ближайшее 21 июля

4-дневный курс по работе с данными с помощью распределённого SQL-движка Trino, на котором вы научитесь решать задачи, требующие быстрой аналитики разнородных данных без миграции в единое хранилище

Далее

Серия событий, ближайшее 21 июля

2-хдневный курс обучения по Flink позволит вам получить и систематизировать знания по использованию Flink для построения систем потоковой обработки данных. Курс нацелен на вопросы использования возможностей Apache Flink для обработки прежде всего потоковых данных, включая нюансы извлечения меток времени и генерации watermarks, лучшие практики (best practices) использования механизмов временных окон, работы с локальным состоянием, вопросы эффективности и параллелизма обработки, тонкости работы с

Далее

Серия событий, ближайшее 21 июля

Чтобы оперативно принимать управленческие решения, прогнозируя и предупреждая любые внештатные ситуации, современный бизнес переходит к парадигме data-driven управления. Это позволяет в режиме реального времени выявить отклонения в технологических или производственных процессах и своевременно предупредить сбой. С коммерческой точки зрения потоковая аналитика больших данных позволяет «на лету» понять потребности каждого своего клиента и сформировать для него персональное КП.

Далее

Серия событий, ближайшее 21 июля

Чтобы оперативно принимать управленческие решения, прогнозируя и предупреждая любые внештатные ситуации, современный бизнес переходит к парадигме data-driven управления. Это позволяет в режиме реального времени выявить отклонения в технологических или производственных процессах и своевременно предупредить сбой. С коммерческой точки зрения потоковая аналитика больших данных позволяет «на лету» понять потребности каждого своего клиента и сформировать для него персональное КП.

Далее

Серия событий, ближайшее 28 июля

Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.

Далее

с 15:00 4 августа до 18:00 11 августа, через 62 дня

6-дневный курс обучения, на котором вы узнаете, как использовать Big Data для принятия стратегических решений. Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, объектных S3-like хранилищ, безопасность озера данных, цифровизация бизнеса, обзор технологий, кейсы из бизнеса и практические рекомендации для руководителей.

Далее