О роли:
Token Factory является частью Nebius Cloud, одного из крупнейших в мире облаков с GPU, в котором работают десятки тысяч GPU. Мы создаём платформу для инференса, которая делает любой тип фундаментальной модели — текстовой, визуальной, аудио и новые мультимодальные архитектуры — быстрой, надёжной и лёгкой в развертывании в масштабах крупного уровня.
Обязанности:
- Разработка и оптимизация низкоуровневых ядер и компонентов времени выполнения для инференса ИИ
- Улучшение производительности движков инференса на GPU платформах
- Профилирование и отладка проблем производительности на уровне системы и аппаратного обеспечения
- Интеграция поддержки новых аппаратных архитектур (Hopper, Blackwell, Rubin)
- Сотрудничество с командами машинного обучения и бэкенда для оптимизации сквозного выполнения
Требуемые квалификации:
- Глубокое владение C++ ИЛИ опыт программирования на GPU с акцентом на низкоуровневое высокопроизводительное кодирование и управление памятью
- Опыт программирования на GPU или разработки системного программного обеспечения, например, внутренностей операционных систем, модулей ядра или драйверов устройств
- Практический опыт работы с инструментами профилирования и отладки для выявления проблем производительности как на CPU, так и на GPU, а также способность оптимизировать код на основе этих данных.
- Твёрдое понимание архитектуры CPU/GPU и иерархии памяти
Желательные квалификации:
- Опыт программирования для вычислений на GPU: CUDA, ROCm, CUTLASS, Cute, ThunderKittens, Triton, Pallas, Mosaic GPU
- Знакомство с рантаймами инференса ML (например, TensorRT, TVM)
- Знание внутренностей Linux, драйверов или компиляторных тулчейнов
- Опыт работы с инструментами, такими как perf, VTune, Nsight или ROCm profiler
- Знакомство с популярными движками инференса (например, vLLM, sglang, TGI)
В рамках процесса мы проводим технические интервью с кодированием.
Что мы предлагаем
- Конкурентоспособную зарплату и полный пакет социальных льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.
Мы растём и ежедневно расширяем наши продукты. Если вы готовы к вызову и так же увлечены ИИ и машинным обучением, как и мы, присоединяйтесь к нам!