Старший инженер по машинному обучению (Token Factory)

Амстердам, Нидерланды; Берлин, Германия; Израиль; Лондон, Великобритания; Прага, Чехия; Удалённо - Европа

Почему стоит работать в Nebius Nebius возглавляет новую эру в облачных вычислениях для обслуживания глобальной экономики ИИ. Мы создаём инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру или необходимости создавать большие внутренние команды по ИИ/МО. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.

Где мы работаем Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими и разработческими центрами по всей Европе, Северной Америке и Израилю. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в области аппаратного и программного обеспечения, а также внутреннюю команду по исследованию и разработке ИИ.

Роль

Token Factory — часть Nebius Cloud, одного из крупнейших в мире облаков с GPU, в котором работают десятки тысяч GPU. Мы создаём высокопроизводительную платформу для инференса и дообучения, предназначенную для максимального использования возможностей фундаментальных моделей на уровне аппаратного обеспечения. Наша миссия — максимизировать пропускную способность, минимизировать задержки и оптимизировать стоимость за токен на десятках тысяч GPU.

Некоторые направления, над которыми мы сейчас работаем и в которых вы можете принять участие:

Оптимизация инференса: выявление узких мест в инференсе больших языковых моделей (LLM) для ускорения производства. Максимальное извлечение производительности для широкого спектра архитектур LLM в масштабе (например, GPT-OSS, Kimi K2.5, DeepSeek V3.1/V3.2, GLM-5).
Поддержка движков инференса: внедрение новых архитектур спекулятивного декодирования, оптимизация компонентов различных дизайнов LLM (плотные/MoE, авторегрессивные/параллельные), а также вклад в open-source движки инференса.
Обучение и инференс с низкой точностью: разработка и внедрение конвейеров обучения и инференса с низкой точностью (FP8, NVFP4/MXFP4) с измеримыми улучшениями пропускной способности и экономичности.

Мы ожидаем, что у вас есть:

Глубокое понимание теоретических основ машинного обучения и архитектуры трансформеров.
Опыт профилирования нагрузок на GPU с использованием Nsight, PyTorch profiler или аналогичных инструментов.
Понимание иерархии памяти GPU и компромиссов между вычислениями и памятью.
Знакомство с важными концепциями в области LLM, такими как MHA, RoPE, KV-cache, Flash Attention и квантизация.
Понимание аспектов производительности при обучении больших нейронных сетей (стратегии шардирования, пользовательские ядра, аппаратные особенности и т.д.).
Сильные навыки программной инженерии (в основном мы используем Python).
Глубокий опыт работы с современными фреймворками глубокого обучения.
Владение современными подходами к программной инженерии, включая CI/CD, контроль версий и модульное тестирование.
Сильные коммуникативные и лидерские качества.

Желательно иметь:

Опыт работы с open-source движками инференса (vLLM, SGLang, TensorRT-LLM), включая вклад в проекты.
Опыт работы с языками ядра или DSL, такими как Triton, Cute, CUTLASS, CUDA.
Опыт создания и выпуска продуктов (не обязательно связанных с МО) в динамичной стартап-среде.
Сильные инженерные навыки, включая опыт разработки крупных распределённых систем или высоконагруженных веб-сервисов.
Open-source проекты, демонстрирующие ваши инженерные способности.
Отличное владение английским языком, а также превосходные навыки письма, артикуляции и коммуникации.

Что мы предлагаем

Конкурентоспособную зарплату и полный пакет социальных льгот.
Возможности профессионального роста внутри Nebius.
Гибкие условия работы.
Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.

Мы растём и ежедневно расширяем наши продукты. Если вы готовы к вызовам и так же увлечены ИИ и МО, как и мы, присоединяйтесь к нам!

ML Engineer (Token Factory)

Старший инженер по машинному обучению (Token Factory)

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

ML Engineer (Middle+/Senior)

ML разработчик (Token Factory)

Руководитель группы ML & AI | Тимлид группы Data Science | Главный специалист по разработкам ML, AI

AI Engineer (International AI Brand)

ML разработчик (Token Factory)

ML Engineer (Token Factory)