Школа Больших данных

Мы предлагаем уникальные практические курсы по Big Data (большие данные) а также материалы, новости, документы по следующим направлениям: Большие данные, Data Mining, Internet of Things, Industrial Internet of Things, цифровая трансформация, компоненты экосистемы Hadoop, Apache Spark, NoSQL и многое другое.

События

Серия событий, идет сейчас

Интенсивный 3-хдневный практический курс по установке, настройке и администрированию кластера Apache Kafka 4.0, распределенной потоковой обработке событий (Event Stream Processing), конфигурации безопасности Kerberos, интеграции с Apache NiFi и Greenplum.

Далее

Серия событий, ближайшее 20 октября

Чтобы оперативно принимать управленческие решения, прогнозируя и предупреждая любые внештатные ситуации, современный бизнес переходит к парадигме data-driven управления. Это позволяет в режиме реального времени выявить отклонения в технологических или производственных процессах и своевременно предупредить сбой. С коммерческой точки зрения потоковая аналитика больших данных позволяет «на лету» понять потребности каждого своего клиента и сформировать для него персональное КП.

Далее

Серия событий, ближайшее 20 октября

Чтобы оперативно принимать управленческие решения, прогнозируя и предупреждая любые внештатные ситуации, современный бизнес переходит к парадигме data-driven управления. Это позволяет в режиме реального времени выявить отклонения в технологических или производственных процессах и своевременно предупредить сбой. С коммерческой точки зрения потоковая аналитика больших данных позволяет «на лету» понять потребности каждого своего клиента и сформировать для него персональное КП.

Далее

Серия событий, ближайшее 1 декабря

6-дневный курс обучения, на котором вы рассмотрите классические методы, современные подходы и лучшие практики к построению корпоративной архитектуры данных. Проведете сравнительный анализ фреймворков, научитесь строить модели архитектуры платформ данных

Далее

Серия событий

Курс «Нейронные сети на Python» представляет собой прикладные основы наиболее популярного метода Machine Learning, включая всю необходимую теорию и практику по этой области искусственного интеллекта. В программе рассмотрена математическая база современных нейросетевых алгоритмов. В курсе приведены базовые задачи, которые могут быть решены с помощью методов нейросетей: классификация изображений и другие прикладные кейсы распознавания образов.

Далее

Серия событий

MLOPS: РАЗРАБОТКА И ВНЕДРЕНИЕ ML-РЕШЕНИЙ Подходы к разработке ML-решений + средства их реализации и внедрения в production. Вы пройдете все шаги создания ML-продукта от сбора данных до интеграции ML-модели в эксплуатацию. Познакомитесь с популярными инструментами командной разработки: Git, MLFlow, DVC. Узнаете главные архитектуры ML-решений и основы менеджмента DS-проектов*. Записаться на обучение Подробнее описание программы можно посмотреть по ссылке: www.bigdataschool.ru/courses/mlo...

Далее

с 15:00 29 сентября до 18:00 6 октября, 15 дней назад

6-дневный курс содержит базовую теорию про искусственный интеллект и AI-агентов, а также инструментальный стек для их создания и эффективной эксплуатации.

Далее

Серия событий

Курс обучения содержит теоретический минимум, необходимый для эффективного использования всех компонентов Apache Spark: от основ RDD до современных инструментов (Delta Lake, Spark on Kubernetes). Практическая часть включает запуск и настройку компонентов, работу в среде Jupyter Notebook, прикладное использование Спарк для разработки собственных распределенных приложений пакетной и потоковой обработки информации и анализа больших данных.

Далее

Серия событий

6-дневный курс о том, как организовать полный цикл разработки и внедрения систем машинного обучения и нейронных сетей, включая LLM, и эффективно сопровождать их в промышленных решениях с использованием современных подходов и технологий.

Далее

Серия событий

5 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.

Далее

Серия событий

4-дневный практический курс для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для обработки и анализа больших данных. Подробная программа курса: www.bigdataschool.ru/courses/apache...

Далее

Серия событий

3-дневный практический курс по эксплуатации кластера Apache NiFi для дата-инженеров, проектирующих конвейеры потоковой обработки данных и администраторов кластера Apache NiFi.

Далее

Серия событий

6 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database. www.bigdataschool.ru/courses/data-f...

Далее

Серия событий

6-дневный курс обучения по ClickHouse позволит систематизировать необходимые знания и навыки для работы с Yandex Managed Service for ClickHouse.

Далее

Серия событий

4х-дневный курс для специалистов, желающих получить и систематизировать знания по использованию Apache Kafka для программирования распределенной обработки потоков событий (Event Stream Processing) на практических примерах с потоковыми данными в реальном времени. Программа курса: www.bigdataschool.ru/courses/apache...

Далее

Серия событий

4-х часовой практический мастер-класс об обработке данных с использованием моделей и ключевых паттернов управления распределенными приложениями Apache Spark и Apache Flink на Kubernetes.

Далее

Серия событий

6-дневный интенсивный практикум предназначен для специалистов, которые хотят не только освоить современные методы машинного обучения, но и научиться внедрять их в реальные бизнес-процессы. Вы получите навыки, которые сразу можно применять в работе: от предобработки данных и построения моделей до их промышленной реализации, и взаимодействия с бизнесом.

Далее

с 15:00 4 августа до 18:00 11 августа, 71 день назад

6-дневный курс обучения, на котором вы узнаете, как использовать Big Data для принятия стратегических решений. Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, объектных S3-like хранилищ, безопасность озера данных, цифровизация бизнеса, обзор технологий, кейсы из бизнеса и практические рекомендации для руководителей.

Далее

Серия событий

Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.

Далее

Серия событий

2-хдневный курс обучения по Flink позволит вам получить и систематизировать знания по использованию Flink для построения систем потоковой обработки данных. Курс нацелен на вопросы использования возможностей Apache Flink для обработки прежде всего потоковых данных, включая нюансы извлечения меток времени и генерации watermarks, лучшие практики (best practices) использования механизмов временных окон, работы с локальным состоянием, вопросы эффективности и параллелизма обработки, тонкости работы с

Далее