TRINO: Trino для инженеров данных

4-дневный курс по работе с данными с помощью распределённого SQL-движка Trino, на котором вы научитесь решать задачи, требующие быстрой аналитики разнородных данных без миграции в единое хранилище

ИТ и интернет 18+

1. Встречаем Trino – 4 часа

    • История возникновения
    • Архитектура
    • Установка и настройка
    • Встроенные коннекторы

Практическое задание

Запуск запросов бенчмарка TPC-DS, используя встроенный коннектор

2. Connector Based архитектура – 4 часа

    • Федеративные запросы
    • Источники, коннекторы и каталоги – разделение функций
    • Наиболее популярные источники данных и особенности работы с ними

Практическое задание

Практика в федеративных запросах и работа с данными, хранящимися в разных источниках (S3, PostgreSQL)

3. Работа с потоковыми данными – 2 часа

    • Apache Kafka и работа с ней в Trino

4. Исполнение кода в Trino – 2 часа

    • Координатор, обработчики, stage, task…
    • Разбираемся и читаем планы запросов

Практическое задание

Работа с потоковыми данными из Apache Kafka

5. Оптимизация запросов – 2 часа

    • оптимизация запросов в Trino
    • как помочь Trino в оптимизации запросов

6. Мониторинг и другие практические аспекты использования Trino – 2 часа

    • системный каталог
    • лог файлы
    • Trino WEB UI

Практическое финальное задание

Собираем все воедино: решаем финальную задачу.

Подробное описание по ссылке: bigdataschool.ru/courses/trino-trin...

 

Поделиться:

Серия событий
Ближайшее через 46 дней в 10:58

Событие пройдет онлайн

Поделиться:

Связь с организатором

Напоминаем, что для того чтобы сделать возврат организатору можно не писать.

На этот адрес придёт ответ от организатора.

По номеру с вами свяжется организатор

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов