Модуль 1. Введение в NLP и эмбеддинги слов
Знакомство с базовыми понятиями обработки естественного языка и методами представления слов в виде эмбеддингов.
Домашнее задание: ранжирование текстов на основе эмбеддингов.
Модуль 2. Рекуррентные нейронные сети (RNN)
Изучение рекуррентных архитектур (RNN, LSTM, GRU) и их применение для классификации текстов.
Домашнее задание: классификация текста с помощью RNN.
Модуль 3. Языковое моделирование
Разбор классических и нейросетевых подходов к языковому моделированию, метрик качества и методов генерации текста. Практика по обучению языковой модели на уровне слов.
Домашнее задание: построение языковой модели на RNN.
Модуль 4. Машинный перевод и Attention
Задача машинного перевода: от базовых архитектур к механизму Attention, который значительно улучшает качество перевода.