Теоретическая часть: основные понятия; классификация задач, решаемых с помощью методов NLP, стандартный pipeline обработки текстовых данных (очистка, стемминг, лемматизация, классические представления текстовых данных: Bow, Tf-Idf). Обзор алгоритмов стемминга и лемматизации. Популярные библиотеки для работы с текстовыми данными (nltk, spacy, gensim, TextBlob).
Практическая часть: первичный анализ текстовых данных, предобработка текстовых данных, построение простейшей модели бинарной классификации на примере задачи определения спама в смс сообщениях.
Домашняя работа: улучшение простейшей модели классификации. Использование различных подходов к обработке текстовых данных и различных моделей машинного обучения.
Теоретическая часть: векторные представления слов/текста. Алгоритмы обучения векторных представлений: word2vec, Glove. Векторные представления текста: doc2vec. Embedding своими руками с помощью SVD разложения. Предобученные векторные представления для английского и русского языка.
Практическая часть: обучение векторного представления слов и его использование в задаче множественной классификации на примере датасета 20 News groups.
Домашняя работа: улучшение результатов работы построенной модели с использованием предобученных векторных представлений.
Теоретическая часть: сверточные нейронные сети, параметры сверточных нейронных сетей, параметры обучения сверточных нейронных сетей, архитектура сверточных нейронных сетей в NLP. Ответ на вопроc когда использовать сверточные сети, а когда классические модели машинного обучения в NLP.
Практическая часть: использование сверточных нейронных сетей на примере задачи классификации твитов (датасет Рубцовой).
Домашняя работа: улучшение качества работы построенной модели.
Теоретическая часть: архитектура RNN, CRNN, LSTM, GRU. Нейронные сети с attention. Задачи класса sequence to sequence. Машинный перевод. Архитектура нейронных сетей для машинного перевода.
Практическая часть: пишем нейронную сеть для машинного перевода “from scratch”.
Домашняя работа: тюнинг нейронной сети/обучение своей нейронной сети на другой паре языков.
Теоретическая часть: физическая природа звука, оцифровка звукового сигнала. Виды цифровых представлений звукового сигнала (ряды, изображения). Speech to text / text to speech, подходы к решению. SOTA нейронные сети для Speech to text.
Практическая часть: пишем рекуррентную нейронную сеть классификации музыкальных жанров (речевых команд).
Домашняя работа: обучить сверточную нейронную сеть на представлениях звуковых сигналов в виде изображения на датасете с речевыми командами.
Теоретическая часть: предобученные нейронные сети в NLP, обзор архитектур нейронных сетей Bert и GPT-2. Режимы работы Bert и GPT-2. Использование Bert в задаче определения близких по смыслу текстов.
Практическая часть: решение задачи определения близких по смыслу текстов. Использование подхода без учителя. Использование Bert.
Домашняя работа: решение задачи с помощью GPT-2.
Теоретическая часть: подходы к решению задач key word extraction, text summarization. Алгоритм PageRank. Архитектуры нейронных сетей для задач key word extraction и text summarization
Практическая часть: пишем нейронную сеть для key word extraction.
Домашняя работа: пишем нейронную сеть для text summarization.
Теоретическая часть: подходы к решению задач NER. Condition Random Fields. Нейронные сети для решения задачи NER.
Практическая часть: решаем NER c помощью CRF.
Домашняя работа: пишем нейронную сеть для NER.
Теоретическая часть: сериализация/десериализация объектов в Python, фреймворки Flask, Flacon, Django. Контейнеризация, Docker. Использование сервиса с нейронной сетью в облаке, AWS. Специализированные серверы для использования нейронных сетей (tensorflow serving, torchServe)
Практическая часть: создание API с нейронной сетью с использованием специализированных серверов.
Домашняя работа: создание API с несколькими нейронными сетями.
Если вы оплатили участие в событии, организатор должен был прислать вам ссылку. Если этого не произошло, обязательно свяжитесь с ним.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.