Где начинающему ML-специалисту набираться опыта
На 2800 вакансий для специалистов по машинному обучению приходится 4000 соискателей с опытом до года — такая картина на HeadHunter в июне 2025.
Содержание
Чтобы выделиться на фоне конкурентов, нужно показать работодателям навыки, проекты, богатый бэкграунд в сфере. Где его взять, подсказывает Максим Шапошников, Applied Scientist в одной из бигтех-компаний Лондона.
С чего начать развитие в индустрии
Единого плана нет. Все зависит от цели, которую вы ставите: освоить библиотеку, вывести в прод модель для стартапа, устроиться ML-специалистом в крупную компанию. Вариантов много — и к каждому свой подход.
Для дальнейших рекомендаций возьму в фокус трудоустройство, потому что оно частично охватывает и другие направления. Упростим путь до трех основных пунктов.
Программирование
Сфера подразумевает взаимодействие со специфическим кодом обучения моделей, валидацией, выводом в прод. Из-за этого компании требуют от ML-специалистов быть и инженерами, и разработчиками. То есть уметь писать аккуратный, надежный, высококачественный код. Поэтому, прежде чем продвигаться дальше, займитесь изучением темы.
Потребуются не просто основы, а понимание, как работает язык программирования. Проще всего будет разобраться с Python.
Фундаментальные знания
Чем лучше ориентируетесь в основах, тем легче изучать более сложную информацию. Вот мои любимые ресурсы, которые помогут разобраться в теории.
- Курс лекций от преподавателя ВШЭ Евгения Соколова. Внутри линейные модели и методы градиентного обучения, приложения в рекомендательных системах, методы кластеризации и визуализации. Бонусом — вставки из опыта работы руководителем команды в «Яндексе», которые дают представление, как устроено ML в реальной жизни.
- Специализация «Глубокое обучение» на Coursera. На понятном языке объяснит матанализ, концепцию сверточных нейросетей и трансформеров. В чистом виде информация из лекций уже не используется, но любая современная технология базируется на ней.
- Курс «Аналитик данных» karpov.courses на Stepik. Подходит для первых шагов в Data Science. В программе уроки по анализу данных на Python, библиотеке Pandas, Matplotlib и Seaborn, практические задания и разбор проектов от преподавателей.
Если возникнут вопросы, ответы на них найдете в книге Deep Learning Яна Гудфеллоу — научного сотрудника Google DeepMind и одного из первых работников OpenAI.
Связка неформальных видеолекций со строгой литературой — лучший способ пропустить через себя теорию и при этом не забросить обучение из-за сложности материала. На YouTube-канале karpov.courses, например, есть интересное видео о дисперсии.
Выбор направления
После освоения базы начнется специализация, например CV, NLP, рекомендательные системы. Почти на каждое из них у Стэнфорда есть бесплатные курсы: обработка естественного языка, большие языковые модели, глубокие генеративные модели.
Идея в том, чтобы выбрать область и начать в нее погружаться. Исходя из того, на чем сконцентрируете внимание, искать материалы по теме, изучать их, открывать новое — и раскручивать термин за термином.
Когда общее представление о машинном обучении и выбранном домене получено, переходите к практике.
Где получать практический опыт
Собрал шесть вариантов для развития навыков. Попробуйте каждый из них, чтобы эффект был быстрее и заметнее.
Курсы
Способ хороший, но у него есть обратная сторона — ложное понимание темы. Чтобы не попасть в эту ловушку, смотрите, заложена ли в программу реализация с нуля хотя бы части решений.
Часто для выполнения домашнего задания дают готовую библиотеку. Студент учится адаптировать архитектуру под свои цели, но не понимает логику работы. В будущем у него вряд ли получится разработать специфический ML-метод или найти выход из нетривиальной ситуации.
Да, в полевых условиях специалисты используют решения из коробки. Но на этапе обучения стоит разобраться в тонкостях. Без этого даже ChatGPT будет бесполезен, потому что человек не отличит неэффективное решение от качественного.
На курсе «Инженер машинного обучения» учтен этот момент. Студенты работают на настоящей инфраструктуре и многое делают с нуля, например считают метрики и реализуют градиентный спуск. |
Хакатоны
Полезный формат, но не с точки зрения технических знаний. Он развивает другие навыки: командная работа, распределение задач, создание презентаций, принятие решений в режиме сжатых сроков. То есть это аспекты, с которыми вы столкнетесь при работе в компании.
Участвую на хакатоне от VK
Для участия выбирайте хакатоны от крупных игроков: «Яндекса», «Сбера», «Т-Банка», мероприятия от Phystech.Genesis. Так вы получите минимум стресса, потому что будет больше понимания задачи, структуры соревнования, его тайминга. Следите, чтобы на сайте был четкий регламент, описание треков и профессий, ожиданий от результата.
И помните, что это про команду. Приходите с друзьями, коллегами или пишите в соответствующие чаты, которые предусматривают организаторы. Чтобы правильно подобрать состав группы, обращайте внимание на цель проекта:
- Если нужно предсказать стоимость жилья, пригодятся специалисты по машинному обучению, аналитики данных и дата-сайентисты.
- Если требуют создать голосового ассистента, возьмите человека, который займется фронтенд-разработкой — он эффектно покажет результаты вашей работы.
- Если предлагают построить сервис рекомендаций для путешественников, берите дизайнера, потому что в такой задаче важен ее внешний вид.
Аналоги Kaggle competitions
В отличие от хакатонов, соревнования по машинному обучению Kaggle развивают технические навыки. Участникам дают задачу и метрику, которую нужно оптимизировать. В России есть активности с похожей механикой.
- Олимпиада DLS. Построение модели машинного обучения по темам классического ML, компьютерного зрения и обработки естественного языка.
- Data Fusion. В 2025 году специалисты проходили три задания: предсказывали категории товаров и динамику платежей, решали образовательную задачу.
- Yandex Cup ML challenge. Вызовы, с которыми сталкивались специалисты компании, например предсказание движения беспилотного автомобиля и определение кавер-версий музыкальных треков.
Чтобы следить за обновлениями по этому направлению, подпишитесь на Telegram-каналы Boosters.Lenta и ODS Events.
Онлайн-тренажеры
Пригодятся для развития конкретных навыков. Подобные ресурсы часто используют интерактивный формат, поэтому с ними легче разобраться в сложных явлениях.
- Brilliant. Наглядные анимации и интересные задачи, после решения которых ощущаешь, как вырос уровень понимания темы.
- HackerRank. Раньше платформа специализировалась на подготовке к собеседованиям. Сейчас к ней добавилась возможность выполнять задания, связанные с программированием, анализом данных, SQL, методами машинного обучения.
- NeetCode. Здесь тоже упор на интервью, но есть образовательный блок для тех, кто интересуется Deep Learning, ML, LLM. Ресурс предлагает упражнения на реализацию семплирования, архитектуру GPT-2.
Стажировки
Идите в известные компании, например «Т-Банк», «Яндекс», SberDevices. У них развита командная культура, выстроены процессы, есть устоявшийся продукт и эксперты. Вы попадете в комфортные условия с четкой зоной ответственности и возможностью наблюдать за действиями людей с большим опытом.
Еще хороший вариант — небольшие организации или бизнес, в котором только зарождается ML-направление.
Когда я был junior-специалистом, устроился в лабораторию машинного обучения «Альфа-Банка». Меня окружала сильная команда, но не было инфраструктуры, пайплайна, прода. Зато была возможность делать продукт с нуля и влиять на процессы. При таком сценарии уровень ответственности выше, как и уровень стресса — но это того стоит.
Рассказываю о машинном обучении в летней школе «Альфа-банка»
Рекомендую искать вакансии на ODS Mattermost или в Telegram-каналах ODS #jobs, Нескучный Data Science Jobs, SNS: Jobs feed. Еще можете присоединиться к чату sns_internships. В нем обмениваются опытом, поддерживают друг друга на пути к цели, делятся полезными материалами.
При выборе стажировки задавайте вопросы. Потому что часто ожидания к кандидату, описанные в тексте, не совпадают с реальными запросами работодателя и ситуацией в коллективе. Спросите о следующем.
- Сколько человек в отделе, какие у них навыки. Например, обилие продакт-менеджеров не подойдет тому, кто ищет прикладной опыт машинного обучения.
- Какой уровень подготовки у команды. Отлично, если будут все грейды. Потому что senior ответственны за распределение задач и контроль работы, middle — за тяжелую ручную работу, junior и стажеры занимаются отдельно взятыми вопросами.
- Будет ли ментор. Тот, кто будет курировать проект или просто общаться с вами на регулярной основе.
Если будет возможность, уточните технические нюансы: над чем будете работать, какой стек, какие ожидания, как распределено время.
Pet-проекты
Их создают для души и отработки навыков. Из плюсов — вы определяете стек, сроки работы, внешний вид и функционал. Еще IT-продукт может стать популярным и начать приносить прибыль, как случилось с «ВКонтакте», Linux, GitHub и Slack.
Pet-проект определяется выбранной ранее специализацией — то, о чем говорил в начале статьи. К его реализации стоит приступать, когда есть понимание специфики области, ее терминов, технологий и инструментов.
Вот несколько идей:
- NLP. Классификатор эмоций по тексту.
- Компьютерное зрение. Детектор для определения наличия маски или очков на лице.
- MLOps. Построение пайплайнов для тренировки и их диплоя на платформе для оркестрации контейнеров Kubernetes.
- Text-to-speech модель. Клонирование голоса на основе нескольких минут аудио.
Что еще поможет
Если хотите серьезно заниматься машинным обучением, инвестируйте в академические программы, например магистратуру МФТИ или совместную магистратуру НИУ ВШЭ и karpov.courses. Через них прошло много студентов, поэтому учебный план откалиброван. Из дополнительных плюсов: четкая структура, опытные лекторы, работа над дипломными и курсовыми проектами.
Еще рекомендую присоединиться к исследовательским группам. Часто университет на базе кафедры ведет прикладное исследование, как правило, это означает, что они хотят написать статью.
Если вы студент, найдите научного руководителя, с которыми сделаете диплом или поучаствуете в эксперименте. Или станьте вольным слушателем вуза и поговорите с преподавателями — вдруг им как раз не хватает рук. Получите доступ к вычислительным мощностям, познакомитесь с экспертами области, решите сложную задачу — это хороший опыт.
Если ничего не выйдет, присмотритесь к опенсорс-проектам, например библиотеке Transformers от Hugging Face. На GitHub он развивается за счет комьюнити. Вы тоже можете стать контрибьютором и вносить свой вклад в большой популярный зарубежный проект, чем сильно выделитесь на рынке.
Представим человека, который прошел курсы и понял, как работают условные трансформеры. Затем он закоммитил что-то в библиотеку, которую все используют для взаимодействия с ними. Получился уникальный путь: специалист разобрался в теории, затем посмотрел, как это устроено на практике и углубился в детали. Подобных примеров мало, потому что путь сложный. Готовых инструкций нет — придется читать код, вникать в тонкости, тратить на это много времени. Но позитивные карьерные последствия того стоят.
Что в итоге
Развитие в сфере машинного обучения начинается с программирования и твердой теоретической базы. Когда получите общее представление о фундаментальных методах и идеях выбранной специализации, запускайте бесконечный цикл практики. Придется постоянно искать, читать, изучать, узнавать что-то новое — и повторять процесс снова.
Больше о карьере и образовании в индустрии рассказываю в Telegram-канале max_dot_sh.