Старший инженер по машинному обучению (Token Factory)
Амстердам, Нидерланды; Берлин, Германия; Израиль; Лондон, Великобритания; Прага, Чехия; Удалённо - Европа
Почему стоит работать в Nebius Nebius возглавляет новую эру в облачных вычислениях для обслуживания глобальной экономики ИИ. Мы создаём инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру или необходимости создавать большие внутренние команды по ИИ/МО. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.
Где мы работаем Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими и разработческими центрами по всей Европе, Северной Америке и Израилю. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в области аппаратного и программного обеспечения, а также внутреннюю команду по исследованию и разработке ИИ.
Роль
Token Factory — часть Nebius Cloud, одного из крупнейших в мире облаков с GPU, в котором работают десятки тысяч GPU. Мы создаём высокопроизводительную платформу для инференса и дообучения, предназначенную для максимального использования возможностей фундаментальных моделей на уровне аппаратного обеспечения. Наша миссия — максимизировать пропускную способность, минимизировать задержки и оптимизировать стоимость за токен на десятках тысяч GPU.
Некоторые направления, над которыми мы сейчас работаем и в которых вы можете принять участие:
- Оптимизация инференса: выявление узких мест в инференсе больших языковых моделей (LLM) для ускорения производства. Максимальное извлечение производительности для широкого спектра архитектур LLM в масштабе (например, GPT-OSS, Kimi K2.5, DeepSeek V3.1/V3.2, GLM-5).
- Поддержка движков инференса: внедрение новых архитектур спекулятивного декодирования, оптимизация компонентов различных дизайнов LLM (плотные/MoE, авторегрессивные/параллельные), а также вклад в open-source движки инференса.
- Обучение и инференс с низкой точностью: разработка и внедрение конвейеров обучения и инференса с низкой точностью (FP8, NVFP4/MXFP4) с измеримыми улучшениями пропускной способности и экономичности.
Мы ожидаем, что у вас есть:
- Глубокое понимание теоретических основ машинного обучения и архитектуры трансформеров.
- Опыт профилирования нагрузок на GPU с использованием Nsight, PyTorch profiler или аналогичных инструментов.
- Понимание иерархии памяти GPU и компромиссов между вычислениями и памятью.
- Знакомство с важными концепциями в области LLM, такими как MHA, RoPE, KV-cache, Flash Attention и квантизация.
- Понимание аспектов производительности при обучении больших нейронных сетей (стратегии шардирования, пользовательские ядра, аппаратные особенности и т.д.).
- Сильные навыки программной инженерии (в основном мы используем Python).
- Глубокий опыт работы с современными фреймворками глубокого обучения.
- Владение современными подходами к программной инженерии, включая CI/CD, контроль версий и модульное тестирование.
- Сильные коммуникативные и лидерские качества.
Желательно иметь:
- Опыт работы с open-source движками инференса (vLLM, SGLang, TensorRT-LLM), включая вклад в проекты.
- Опыт работы с языками ядра или DSL, такими как Triton, Cute, CUTLASS, CUDA.
- Опыт создания и выпуска продуктов (не обязательно связанных с МО) в динамичной стартап-среде.
- Сильные инженерные навыки, включая опыт разработки крупных распределённых систем или высоконагруженных веб-сервисов.
- Open-source проекты, демонстрирующие ваши инженерные способности.
- Отличное владение английским языком, а также превосходные навыки письма, артикуляции и коммуникации.
Что мы предлагаем
- Конкурентоспособную зарплату и полный пакет социальных льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.
Мы растём и ежедневно расширяем наши продукты. Если вы готовы к вызовам и так же увлечены ИИ и МО, как и мы, присоединяйтесь к нам!