Для покупки необходимо зарегистрироваться на платформе Талант и отметить, что вы приобрели Premium тариф в специальном поле; это нужно, чтобы мы распознали ваш платеж.
Совершая покупку, вы даете согласие на обработку персональных данныхи соглашаетесь c политикой конфиденциальности.
Даты: 19 сентября – 16 октября Регистрация завершена
Workshop «NLP ИНТЕНСИВ»
Решаем задачу множественной классификации текстов обратной связи пользователей сервиса быстрой доставки «Самокат» и выигрываем личные консультации с профессионалами из ML-команды ecom.tech (ex Samokat. tech).
— 19 сентября 19:00* — Старт интенсива и постановка задачи — 21 сентября 19:00 — Лекция про подходы к решению задач классификации текстов — 24 сентября 19:00 — Практика про модерацию пользовательского контента — 25 сентября 19:00 — Разбор бейзлайна соревнования — 26 сентября 19:00 — Мастер-класс по ML-моделям в Production — 28 сентября 23:59 — Завершение приема заявок для участия в интенсиве — 2 октября 19:00 — Вебинар с ответами на вопросы воркшопа — 5 октября — Лекция от участников интенсива — 9 октября 19:00 — Завершение приема решений участников соревнования — 9 октября 19:00 — Обсуждение карьеры в ML. Как это видит нанимающая сторона? — 10 октября 10:00 — Сбор решений на итоговое код-ревью — 16 октября 19:00 — Финал соревнования с разбором решения задачи и награждением авторов Топ-20 решений * — здесь и далее по Московскому времени.
Deep Learning School и ecom. tech приглашают пройти интенсив по обработке естественного языка с уклоном в практику. Вас ждут обучающие лекции по NLP от DLS и реальный кейс от ML-команды ecom.tech. На соревновании будем решать задачу множественной классификации текстов для автоматизации исследования обратной связи пользователей сервиса быстрой доставки.
Даты: 19 сентября – 16 октября Регистрация завершена
Workshop «NLP ИНТЕНСИВ»
О задаче
Для оценки удовлетворенности клиентским сервисом было проведено исследование, в ходе которого пользователи заполняли опросник с закрытыми и открытыми вопросами. Исследователи получили сотни тысяч ответов, которые нужно интерпретировать. Необходимо распределить все ответы по 50 тематикам, которые были затронуты респондентами. В одном ответе может затрагиваться сразу несколько тематик.
Призы
ТОП-20 участников соревнования получат памятные подарки от ecom. tech: мерч и промокоды на покупки в Самокате. ТОП-3 получат личные консультации с ML-специалистами из ecom.tech.
Курс проходит полностью онлайн на платформах Stepik и Google Colab. Для обучения нужны ноутбук и доступ в интернет.
Курс длится 16 недель:
12 недель занятий;
4 недели на итоговый проект.
Как устроены занятия: каждую неделю на Stepik появляются новые лекция, семинар и домашнее задание. Лекция и семинар занимают в сумме не более 3 часов, время на выполнение домашнего задания может быть разным. Как правило, сложность домашних заданий и время на их выполнение возрастает к концу курса.
Итоговый проект — ваша большая самостоятельная работа, где на протяжении месяца вы разберетесь в одной из предложенных тем. Вот примеры тем, которые можно взять:
пройдя 1-ую часть курса:
Создание telegram-бота для работы с нейросетями;
Реализация веб-демо с моделью для детекции объектов на изображении;
Погружение в задачу Face Recognition, разработка пайплайна для ее реализации;
Реализация модели для генерации изображений на основе других изображений (image2image);
пройдя 2-ую часть курса:
Создание нейросетевого пайплайна для задачи Image Captioning;
Применение модели Трансформер для решения задачи машинного перевода. Исследование методов уменьшения моделей, прунинг голов;
Классификация картинок с помощью архитектуры Transformer;
Архитектуры и методы в задаче Closed Domain Question Answering.
Коммьюнити и поддержка
Вас поддержит сообщество из учеников и преподавателей. Это важная часть образовательного процесса. У каждого потока есть telegram-чат, где можно задать вопросы.
Живое взаимодействие не ограничивается чатом: некоторые домашние задания курса проверяются менторами и преподавателями вручную.
Стоимость обучения
Основной курс полностью бесплатный. Если вы хотите дополнительные опции поддержки, ты мы предлагаем вам платный Premium-тариф. В него входят:
доступ в приватный чат с преподавателями и менторами;
персональный ментор для ответов на вопросы;
дополнительные вебинары от преподавателей;
приоритетная проверка домашних заданий.
Узнать подробнее и купить платный тариф можно на странице тарифа.
Основы Python. Работа с циклами и функциями. Основы ООП (классы);
Основы линейной алгебры. Работа с векторами и матрицами. Умножение матриц;
Основы теории вероятностей и математической статистики. Понятие вероятности, распределения вероятностей. Нормальное распределение;
Производная и градиент.
Помочь вам получить или освежить знания по этим темам поможет наш бесплатный курс ИИ Старт. Это курс на Stepik, его можно пройти в любое время.
Для второй части курса (NLP, Audio): она считается продолжением первой части нашего курса (ML, DL, CV). Мы предполагаем, что студенты второй части прошли первую часть и обладают всеми необходимыми знаниями и навыками. Эти знания и навыки включают:
Основы Python и ООП;
Основы высшей математики;
Основы машинного обучения;
Основы нейросетей и CV.
Мы настоятельно рекомендуем проходить вторую часть только после первой части нашего курса.
Сертификаты
Студенты получают сертификат о прохождении курса в зависимости от количества баллов, которые они набрали за домашние задания:
диплом 1, 2 и 3 степени;
сертификат о прохождении курса.
Как правило, сертификат выдается студентам, набравшим больше половины возможных баллов за домашние задания и итоговый проект. Пороги для дипломов 1, 2 и 3 степени меняются в зависимости от количества студентов, набравших определенное количество баллов.
Обратите внимание, что дипломы НЕ государственного образца и НЕ считаются сертификатом о повышении квалификации!
Программа 1-ой части курса (Введение в ML, DL и CV)
Лекция: введение в искусственный интеллект
Лекция: Введение в машинное обучение Семинар: Библиотека Sklearn Домашнее задание: Решение задачи машинного обучения с помощью библиотеки Sklearn
Лекция: Линейные модели машинного обучения Семинар: Линейные модели на практике Домашнее задание: Реализация логистической регрессии и ее обучения в Numpy
Лекция: Метрики машинного обучения. Решающие деревья Семинар: Пайплайн машинного обучения и выбор модели на практике Домашнее задание: Решение конкурса по машинному обучению на Kaggle
Лекция: Введение в нейронные сети. Нейрон, нейросеть и обратное распространение ошибки Семинар: Введение в библиотеку PyTorch Домашнее задание: Создание и обучение нейросети на PyTorch
Лекция: Операция свертки и сверточная нейросеть. Операция Pooling Семинар: Сверточная нейросеть на PyTorch Домашнее задание: Решение задачи классификации с помощью нейросетей
Лекция: Продвинутое обучение нейросетей. Регуляризация Семинар: Продвинутое обучение нейросетей на практике
Лекция: Популярные архитектуры CNN. Transfer Learning, Fine-Tuning Семинар: Transfer Learning на практике Домашнее задание: Решение конкурса на Kaggle по классификации картинок
Лекция: Семантическая сегментация. Архитектуры нейросети для этой задачи Домашнее задание: Нейросеть для семантической сегментации
Лекция: Детекция объектов. Архитектуры нейросети для этой задачи Семинар: Нейронная детекции объектов на практике
Лекция: Устройство автоэнкодеров Семинар: Построение и обучение автоэнкодера
Лекция: Устройство и виды GAN Семинар: GAN на практике Домашнее задание: GAN на практике
Реализация студентами самостоятельного итогового проекта
Лекция: Обзор задач NLP. Эмбеддинги слов Семинар: Методы предобработки текста. Обучение эмбеддингов Домашнее задание: Решение задачи классификации на эмбеддингах текста
екция: Рекуррентные нейросети. RNN, GRU, LSTM Семинар: Применение RNN к задаче классификации текста Домашнее задание: Применение RNN к задаче классификации текста
Лекция: Языковое моделирование. Виды архитектур для этой задачи Семинар: Обучение языковой модели с помощью RNN Домашнее задание: Обучение языковой модели с помощью RNN
Лекция: Задача машинного перевода. Архитектура encoder-decoder. Идея механизма attention Семинар: Обучение модели машинного перевода на основе RNN. Подсчет метрик Домашнее задание: Реализация Attention для модели машинного перевода
Лекция: Self-attention. Архитектура Transformer Семинар: Добучение Transformer из Huggingface Домашнее задание: Реализация Self-attention и Transformer для задачи оценки тональности текста
Лекция: Обучение больших языковых моделей (LLM) на практике. Трюки и подходы Семинар и домашнее задание: Дообучение модели BART для задачи суммаризации с использованием Huggingface
Лекция: Zero-shot learning. Идеи обучения GPT, GPT-2, GPT-3, ChatGPT. Instruction tuning, RLHF Семинар и домашнее задание: ДообучениеGPT-2 с использованием инструкций. Использование методов few shot и zero shot для решения задач
Лекция: Задачи, часто возникающие в индустрии. Ограничения и подходы к преодолению этих ограничений Семинар и домашнее задание: Создание диалогового чат-бота с деплоем в телеграм-бота на основе генеративной LLM
Лекция: Задачи суммаризации текста и диалоговых систем. Подходы к их решению Семинар и домашнее задание: Суммаризация текста на практике
Лекция: Проблема, которую решает дистилляция. Подходы к дистилляции Семинар и домашнее задание: Дистилляция модели на практике
Лекция: Введение в обработку аудио Семинар и домашнее задание: Обработка аудио на практике
Лекция: Введение в распознавание речи Семинар и домашнее задание: Введение в распознавание речи
Реализация студентами самостоятельного итогового проекта