- Машинное обучение
- Полносвязные нейросети
- Сверточные нейросети
- Сегментация изображений
- Детекция объектов
- Генерация изображений
- Vision transformers
- CLIP model
- SSL for training fundamental models, DINO
- VLM
- Знакомство с диффузионными моделями, диффузионные модели в непрерывном
пространстве
- Flow matching
- Современные архитектуры и применение
- Основы обработки текста
- Векторные представления слов
- Рекуррентные нейросети
- Языковые модели и машинный перевод
- Механизм внимания и Трансформеры
- Большие языковые модели: ChatGPT, GPT‑4 и др.
- Задачи NLP
- Введение в аудио, спектрограммы, mel‑спектрограммы
- SSL для аудио
- Кодеки для аудио
- Распознавание речи
- Основы генерации речи
- Дипфейки и их детекция
- Voice assistant pipeline
- Low‑resource языки и non‑English языки
- Speech LLMs
- Машинное обучение
- Полносвязные нейросети
- Сверточные нейросети
- Сегментация изображений
- Детекция объектов
- Генерация изображений
- Vision transformers
- CLIP model
- SSL for training fundamental models, DINO
- VLM
- Знакомство с диффузионными моделями, диффузионные модели в непрерывном
пространстве
- Flow matching
- Современные архитектуры и применение
- Основы обработки текста
- Векторные представления слов
- Рекуррентные нейросети
- Языковые модели и машинный перевод
- Механизм внимания и Трансформеры
- Большие языковые модели: ChatGPT, GPT‑4 и др.
- Задачи NLP
- Введение в аудио, спектрограммы, mel‑спектрограммы
- SSL для аудио
- Кодеки для аудио
- Распознавание речи
- Основы генерации речи
- Дипфейки и их детекция
- Voice assistant pipeline
- Low‑resource языки и non‑English языки
- Speech LLMs