CORS: ОСНОВЫ APACHE SPARK ДЛЯ РАЗРАБОТЧИКОВ

2-дневный практический курс для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для обработки и анализа больших данных.

ИТ и интернет 18+

ПРОГРАММА КУРСА

1. Обзор Apache Spark

  • Архитектура Spark
  • Обзор компонентов Spark и их назначения
  • Spark API и разработка программ.

2. Основные абстракции – знакомство со Spark RDD и Dataframe

  • Low Level API, использование Resilient Distributed Dataset
  • Structured API и основная абстракция Spark – Dataframe
  • Основные трансформации и действия.

3. Работа с источниками данных

  • Ввод и вывод данных в Spark
  • Работа с файлами и базами данных
  • Совместная работа с Apache Hive

4. Apache Spark SQL

  • Получение данных из SQL-источников
  • Обработка данных с помощью Spark SQL
  • Интероперабельность Dataframe и SQL

5. Основы настройки и конфигурирования

  • Знакомство с основными Shell
  • Запуск приложений с помощью spark-submit
  • Конфигурирование Spark
  • Планы запросов и Web GUI

Поделиться:

719 дней назад
30 мая 10:00 — 31 мая 2022 18:00

Событие пройдет онлайн

Уже есть билет
Ссылка на онлайн-событие рассылается за час до его начала.
Получить ссылку

Поделиться:

Связь с организатором

На этот адрес придёт ответ от организатора.

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов