PYML: ML Практикум: от теории к промышленному использованию

6-дневный интенсивный практикум предназначен для специалистов, которые хотят не только освоить современные методы машинного обучения, но и научиться внедрять их в реальные бизнес-процессы. Вы получите навыки, которые сразу можно применять в работе: от предобработки данных и построения моделей до их промышленной реализации, и взаимодействия с бизнесом.

ИТ и интернет 18+

Данный курс является практическим руководством для специалистов, которым предстоит столкнуться в рабочих задачах с методами машинного обучения.  В курсе будет рассказано о формализации таких задачах и современных подходах к их решению. Большое внимание в курсе уделено практической реализации методов ML на языке Python.

Продолжительность: 6 дней, 24 академических часа.

Соотношение теории к практике 50/50

Программа курса “ML Практикум: от теории к промышленному использованию”

1. Задачи машинного обучения и основные подходы к их решению

Теоретическая часть: основные понятия; классификация задач, решаемых с помощью методов машинного обучения; виды данных, понятие датасета. (1,5 часа)

Практическая часть: первичный анализ датасета, предобработка данных, сквозной пример решения задачи машинного обучения. (2,5 часа)

2. Базовые методы решения задач классификации и регрессии

Теоретическая часть: определение и примеры задач классификации и регрессии. Линейные методы. Деревья решений. Проблема переобучения. Основные проблемы с данными. (1,5 часа)

Практическая часть: решение задач классификации и регрессии линейными методами и методами на основе деревьев решений. Подбор гиперпараметров. Примеры переобученных моделей. (2,5 часа)

3. Продвинутые методы решения задач классификации и регрессии

Теоретическая часть: Стэкинг, бэггинг. Градиентные бустинги на примере LightGBM, xgboost, catboost. GridSearch для подбора гиперпараметров. AutoML. (1,5 часа)

Практическая часть: подбор гиперпараметров по сетке значений для базовых алгоритмов. Разбор кейсов по обучению моделей градиентного бустинга. (2,5 часа)

4. Продвинутые методы обработки данных и работа с признаковым пространством

Теоретическая часть: Тематика обучения без учителя – кластеризация, понижение размерности. Визуализация и формирование гипотез о данных. Feature Engineering и Feature extraction. (1,5 часа)

Практическая часть: примеры решения задач кластеризации и понижения размерности. Feature Engineering для улучшения качества работы ML моделей. (2,5 часа)

5. Нейронные сети для решения задач машинного обучения

Теоретическая часть: нейронные сети, задачи CV, NLP. Предобученные сети, файнтюнинг. (1,5 часа)

Практическая часть: Примеры решения задач классификации изображений и текстов. Применение полносвязных сетей для решения задач классификации и регрессии. Сравнение с алгоритмами бустинга. (2,5 часа)

6. Практическое руководство по реализации моделей машинного обучения

Теоретическая часть: сохранение результатов экспериментов и версионирование моделей и датасетов. Воспроизводимость экспериментов. Форматы сериализации моделей и пути продуктивизации: функциональная обертка, REST API сервис. Лучшие практики. (1,5 часа)

Практическая часть: создание веб-сервиса на фреймворке FastApi. Демонстрация MLFlow и AirFlow. (2,5 часа)

Поделиться:

Серия событий
Ближайшее через 39 дней в 15:00

Событие пройдет онлайн

Поделиться:

Связь с организатором

Напоминаем, что для того чтобы сделать возврат организатору можно не писать.

На этот адрес придёт ответ от организатора.

По номеру с вами свяжется организатор

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов