ML-моделей не доходят до продакшна
Большинство ML-моделей остаются прототипами. Причина почти всегда одна и та же: между моделью и промышленной системой нет грамотного инженера данных и MLOps-инфраструктуры.
Стоимость и условия оплаты — у контактного лица программы.
Программа в одном абзаце
ЦБО-МФТИ-001 «Инженерия данных и MLOps» — программа профессиональной переподготовки ЦБО МФТИ. ИТ-специалисты с опытом программирования. Длительность — 10 месяцев, объём — 720 академических часов. Формат — онлайн, вечерний режим. Python обязателен. По итогам — диплом мфти о профессиональной переподготовке установленного образца. Стоимость — от 250 тысяч ₽. Ближайший поток — 10 сентября 2026.
По разным оценкам, до восьмидесяти процентов ML-моделей, обученных в компаниях, в промышленную эксплуатацию так и не попадают. Они остаются в ноутбуках, в демо-презентациях, в PoC-папках. Причина почти всегда не в качестве модели. Её просто некому довести до продакшна и поддерживать там в рабочем состоянии.
Программа собрана как ответ на эту проблему. Мы не готовим ещё одного data scientist: таких специалистов в стране уже больше, чем инфраструктуры под их работу. Мы готовим инженера, который соберёт трубопровод для данных, упакует модель в контейнер, развернёт её в кластере, настроит мониторинг и вовремя заметит, что модель устарела.
На выходе у слушателя — сквозной дипломный проект: от загрузки сырых данных через обучение модели до развёртывания, мониторинга и автоматического переобучения. Это не абстрактная учебная задача, а рабочий шаблон. С ним можно идти на собеседование или применить его на своей текущей работе.
««Модель в Jupyter-ноутбуке — ещё не продукт».»
Записка академического руководителя
Рынок ML-инженерии устроен так: обученных моделей много, доведённых до стабильного промышленного режима — заметно меньше. Это и есть зазор, в котором живёт MLOps. Три цифры из открытых отчётов, на которые мы опираемся.
Большинство ML-моделей остаются прототипами. Причина почти всегда одна и та же: между моделью и промышленной системой нет грамотного инженера данных и MLOps-инфраструктуры.
Среднегодовой рост — 41%. Спрос на инженеров, способных не учить модели, а ставить их на поток, растёт быстрее, чем на любую другую ML-специализацию.
Это и есть точка дефицита. Компании ищут не тех, кто умеет обучить модель в Jupyter, а тех, кто умеет довести её до промышленной системы с мониторингом, тестами и откатами.
Источник: Anaconda · State of Data Science, 2024
Подтягиваем базу до уровня, на котором можно строить промышленные системы. Программировать с нуля здесь не учат. Учат писать код, который продержится в продакшне годами.
Ядро профессии «инженер данных» — построение трубопроводов, по которым данные идут от источников к местам потребления. Самый объёмный блок программы.
Задача блока — не подготовить data scientist, а дать инженеру понимание того, что именно он будет выводить в продакшн. Объём знаний достаточен, чтобы разговаривать с ML-командой на одном языке.
Профильный блок программы. Набор практик, при которых модели в продакшне не ломаются и не превращаются в непрозрачный чёрный ящик. Здесь снимается та самая «проблема 80%».
Среда, в которой сегодня живут данные и модели. Российский контур: Yandex Cloud, VK Cloud, Selectel. Без compliance и информационной безопасности промышленный ML просто не запустится.
Шаг от частных инструментов к общей картине. Как из разрозненных компонентов собирается единая data- и ML-платформа предприятия.
Команда из 2–3 человек делает сквозной проект: загрузка сырых данных → обучение модели → развёртывание, мониторинг, автоматическое переобучение. Защита перед комиссией МФТИ и приглашёнными представителями индустрии.
Академический руководитель портфеля ЦБО МФТИ
«Мы запускаем программы, которые сами хотели бы пройти, если бы оказались на другой стороне стола.»
Программа TechExport — экспортный консалтинг для технологических компаний, серия выпусков с действующими российскими экспортёрами.
Автоматически проверяемые задачи: Python на уровне уверенного джуниора, базовый SQL, математика в объёме первого курса технического вуза. Без проходного балла к собеседованию не допускаем.
Короткий разговор с куратором программы: текущий опыт, причина перехода в MLOps, готовность работать 14–16 часов в неделю в течение десяти месяцев. Тех, кто не потянет нагрузку, отсеиваем на этом шаге.
Ответ направляем в течение пяти рабочих дней. Кандидатам, у которых результат пограничный из-за провала в одном блоке, предлагаем платный подготовительный модуль на четыре недели. Зачисление — в ближайший поток.
Онлайн, вечерний режим. Открытие потока, знакомство группы, разбор стартовых задач. Далее — регулярные вебинары, лабораторные на инфраструктуре ЦБО, работа над дипломным проектом.
Контактное лицо программы перезвонит в течение рабочего дня. Расскажет про программу, ответит на вопросы. Если речь о группе от компании — укажите это в поле «О чём поговорить».
Если программа уже изучена и вы готовы к мотивационному собеседованию — подавайте заявку напрямую. Прикладывайте короткое или развёрнутое эссе: какую задачу планируете решать на программе.