Главная

Где начинающему ML-специалисту набираться опыта

На 2800 вакансий для специалистов по машинному обучению приходится 4000 соискателей с опытом до года — такая картина на HeadHunter в июне 2025.  

Содержание

Чтобы выделиться на фоне конкурентов, нужно показать работодателям навыки, проекты, богатый бэкграунд в сфере. Где его взять, подсказывает Максим Шапошников, Applied Scientist в одной из бигтех-компаний Лондона.

С чего начать развитие в индустрии

Единого плана нет. Все зависит от цели, которую вы ставите: освоить библиотеку, вывести в прод модель для стартапа, устроиться ML-специалистом в крупную компанию. Вариантов много — и к каждому свой подход.  

Для дальнейших рекомендаций возьму в фокус трудоустройство, потому что оно частично охватывает и другие направления. Упростим путь до трех основных пунктов. 

Программирование 

Сфера подразумевает взаимодействие со специфическим кодом обучения моделей, валидацией, выводом в прод. Из-за этого компании требуют от ML-специалистов быть и инженерами, и разработчиками. То есть уметь писать аккуратный, надежный, высококачественный код. Поэтому, прежде чем продвигаться дальше, займитесь изучением темы. 

Потребуются не просто основы, а понимание, как работает язык программирования. Проще всего будет разобраться с Python.

Фундаментальные знания 

Чем лучше ориентируетесь в основах, тем легче изучать более сложную информацию. Вот мои любимые ресурсы, которые помогут разобраться в теории.

  1. Курс лекций от преподавателя ВШЭ Евгения Соколова. Внутри линейные модели и методы градиентного обучения, приложения в рекомендательных системах, методы кластеризации и визуализации. Бонусом — вставки из опыта работы руководителем команды в «Яндексе», которые дают представление, как устроено ML в реальной жизни. 
  2. Специализация «Глубокое обучение» на Coursera. На понятном языке объяснит матанализ, концепцию сверточных нейросетей и трансформеров. В чистом виде информация из лекций уже не используется, но любая современная технология базируется на ней. 
  3. Курс «Аналитик данных» karpov.courses на Stepik. Подходит для первых шагов в Data Science. В программе уроки по анализу данных на Python, библиотеке Pandas, Matplotlib и Seaborn, практические задания и разбор проектов от преподавателей. 

Если возникнут вопросы, ответы на них найдете в книге Deep Learning Яна Гудфеллоу — научного сотрудника Google DeepMind и одного из первых работников OpenAI. 

Связка неформальных видеолекций со строгой литературой — лучший способ пропустить через себя теорию и при этом не забросить обучение из-за сложности материала. На YouTube-канале karpov.courses, например, есть интересное видео о дисперсии.

Выбор направления

После освоения базы начнется специализация, например CV, NLP, рекомендательные системы. Почти на каждое из них у Стэнфорда есть бесплатные курсы: обработка естественного языка, большие языковые модели, глубокие генеративные модели. 

Идея в том, чтобы выбрать область и начать в нее погружаться. Исходя из того, на чем сконцентрируете внимание, искать материалы по теме, изучать их, открывать новое — и раскручивать термин за термином. 

Когда общее представление о машинном обучении и выбранном домене получено, переходите к практике. 

Где получать практический опыт

Собрал шесть вариантов для развития навыков. Попробуйте каждый из них, чтобы эффект был быстрее и заметнее.  

Курсы 

Способ хороший, но у него есть обратная сторона — ложное понимание темы. Чтобы не попасть в эту ловушку, смотрите, заложена ли в программу реализация с нуля хотя бы части решений. 

Часто для выполнения домашнего задания дают готовую библиотеку. Студент учится адаптировать архитектуру под свои цели, но не понимает логику работы. В будущем у него вряд ли получится разработать специфический ML-метод или найти выход из нетривиальной ситуации. 

Да, в полевых условиях специалисты используют решения из коробки. Но на этапе обучения стоит разобраться в тонкостях. Без этого даже ChatGPT будет бесполезен, потому что человек не отличит неэффективное решение от качественного.  

На курсе «Инженер машинного обучения» учтен этот момент. Студенты работают на настоящей инфраструктуре и многое делают с нуля, например считают метрики и реализуют градиентный спуск.

Хакатоны

Полезный формат, но не с точки зрения технических знаний. Он развивает другие навыки: командная работа, распределение задач, создание презентаций, принятие решений в режиме сжатых сроков. То есть это аспекты, с которыми вы столкнетесь при работе в компании. 

Участвую на хакатоне от VK

Для участия выбирайте хакатоны от крупных игроков: «Яндекса», «Сбера», «Т-Банка», мероприятия от Phystech.Genesis. Так вы получите минимум стресса, потому что будет больше понимания задачи, структуры соревнования, его тайминга. Следите, чтобы на сайте был четкий регламент, описание треков и профессий, ожиданий от результата.

И помните, что это про команду. Приходите с друзьями, коллегами или пишите в соответствующие чаты, которые предусматривают организаторы. Чтобы правильно подобрать состав группы, обращайте внимание на цель проекта:

  • Если нужно предсказать стоимость жилья, пригодятся специалисты по машинному обучению, аналитики данных и дата-сайентисты.
  • Если требуют создать голосового ассистента, возьмите человека, который займется фронтенд-разработкой — он эффектно покажет результаты вашей работы.
  • Если предлагают построить сервис рекомендаций для путешественников, берите дизайнера, потому что в такой задаче важен ее внешний вид. 

Аналоги Kaggle competitions 

В отличие от хакатонов, соревнования по машинному обучению Kaggle развивают технические навыки. Участникам дают задачу и метрику, которую нужно оптимизировать. В России есть активности с похожей механикой.

  • Олимпиада DLS. Построение модели машинного обучения по темам классического ML, компьютерного зрения и обработки естественного языка.
  • Data Fusion. В 2025 году специалисты проходили три задания: предсказывали категории товаров и динамику платежей, решали образовательную задачу.   
  • Yandex Cup ML challenge. Вызовы, с которыми сталкивались специалисты компании, например предсказание движения беспилотного автомобиля и определение кавер-версий музыкальных треков.

Чтобы следить за обновлениями по этому направлению, подпишитесь на Telegram-каналы Boosters.Lenta и ODS Events. 

Онлайн-тренажеры 

Пригодятся для развития конкретных навыков. Подобные ресурсы часто используют интерактивный формат, поэтому с ними легче разобраться в сложных явлениях. 

  • Brilliant. Наглядные анимации и интересные задачи, после решения которых ощущаешь, как вырос уровень понимания темы. 
  • HackerRank. Раньше платформа специализировалась на подготовке к собеседованиям. Сейчас к ней добавилась возможность выполнять задания, связанные с программированием, анализом данных, SQL, методами машинного обучения. 
  • NeetCode. Здесь тоже упор на интервью, но есть образовательный блок для тех, кто интересуется Deep Learning, ML, LLM. Ресурс предлагает упражнения на реализацию семплирования, архитектуру GPT-2.   

Стажировки

Идите в известные компании, например «Т-Банк», «Яндекс», SberDevices. У них развита командная культура, выстроены процессы, есть устоявшийся продукт и эксперты. Вы попадете в комфортные условия с четкой зоной ответственности и возможностью наблюдать за действиями людей с большим опытом. 

Еще хороший вариант — небольшие организации или бизнес, в котором только зарождается ML-направление. 

Когда я был junior-специалистом, устроился в лабораторию машинного обучения «Альфа-Банка». Меня окружала сильная команда, но не было инфраструктуры, пайплайна, прода. Зато была возможность делать продукт с нуля и влиять на процессы. При таком сценарии уровень ответственности выше, как и уровень стресса — но это того стоит. 

Рассказываю о машинном обучении в летней школе «Альфа-банка»

Рекомендую искать вакансии на ODS Mattermost или в Telegram-каналах ODS #jobs, Нескучный Data Science Jobs, SNS: Jobs feed. Еще можете присоединиться к чату sns_internships. В нем обмениваются опытом, поддерживают друг друга на пути к цели, делятся полезными материалами. 

При выборе стажировки задавайте вопросы. Потому что часто ожидания к кандидату, описанные в тексте, не совпадают с реальными запросами работодателя и ситуацией в коллективе. Спросите о следующем.

  • Сколько человек в отделе, какие у них навыки. Например, обилие продакт-менеджеров не подойдет тому, кто ищет прикладной опыт машинного обучения. 
  • Какой уровень подготовки у команды. Отлично, если будут все грейды. Потому что senior ответственны за распределение задач и контроль работы, middle — за тяжелую ручную работу, junior и стажеры занимаются отдельно взятыми вопросами.  
  • Будет ли ментор. Тот, кто будет курировать проект или просто общаться с вами на регулярной основе. 

Если будет возможность, уточните технические нюансы: над чем будете работать, какой стек, какие ожидания, как распределено время. 

Pet-проекты

Их создают для души и отработки навыков. Из плюсов — вы определяете стек, сроки работы, внешний вид и функционал. Еще IT-продукт может стать популярным и начать приносить прибыль, как случилось с «ВКонтакте», Linux, GitHub и Slack.

Pet-проект определяется выбранной ранее специализацией — то, о чем говорил в начале статьи. К его реализации стоит приступать, когда есть понимание специфики области, ее терминов, технологий и инструментов.

Вот несколько идей:

  • NLP. Классификатор эмоций по тексту. 
  • Компьютерное зрение. Детектор для определения наличия маски или очков на лице. 
  • MLOps. Построение пайплайнов для тренировки и их диплоя на платформе для оркестрации контейнеров Kubernetes.
  • Text-to-speech модель. Клонирование голоса на основе нескольких минут аудио. 

Что еще поможет

Если хотите серьезно заниматься машинным обучением, инвестируйте в академические программы, например магистратуру МФТИ или совместную магистратуру НИУ ВШЭ и karpov.courses. Через них прошло много студентов, поэтому учебный план откалиброван. Из дополнительных плюсов: четкая структура, опытные лекторы, работа над дипломными и курсовыми проектами.  

Еще рекомендую присоединиться к исследовательским группам. Часто университет на базе кафедры ведет прикладное исследование, как правило, это означает, что они хотят написать статью. 

Если вы студент, найдите научного руководителя, с которыми сделаете диплом или поучаствуете в эксперименте. Или станьте вольным слушателем вуза и поговорите с преподавателями — вдруг им как раз не хватает рук. Получите доступ к вычислительным мощностям, познакомитесь с экспертами области, решите сложную задачу — это хороший опыт. 

Если ничего не выйдет, присмотритесь к опенсорс-проектам, например библиотеке Transformers от Hugging Face. На GitHub он развивается за счет комьюнити. Вы тоже можете стать контрибьютором и вносить свой вклад в большой популярный зарубежный проект, чем сильно выделитесь на рынке. 

Представим человека, который прошел курсы и понял, как работают условные трансформеры. Затем он закоммитил что-то в библиотеку, которую все используют для взаимодействия с ними. Получился уникальный путь: специалист разобрался в теории, затем посмотрел, как это устроено на практике и углубился в детали. Подобных примеров мало, потому что путь сложный. Готовых инструкций нет — придется читать код, вникать в тонкости, тратить на это много времени. Но позитивные карьерные последствия того стоят.  

Что в итоге

Развитие в сфере машинного обучения начинается с программирования и твердой теоретической базы. Когда получите общее представление о фундаментальных методах и идеях выбранной специализации, запускайте бесконечный цикл практики. Придется постоянно искать, читать, изучать, узнавать что-то новое — и повторять процесс снова.  

Больше о карьере и образовании в индустрии рассказываю в Telegram-канале max_dot_sh.  

Сообщение отправлено!

Ваше сообщение успешно отправлено. Наш специалист скоро свяжется с вами!