Старший архитектор решений в области машинного обучения - Token Factory
Соединённые Штаты
Почему стоит работать в Nebius Nebius возглавляет новую эру облачных вычислений для обслуживания глобальной экономики ИИ. Мы создаём инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру и необходимости создавать большие внутренние команды по ИИ/МО. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.
Где мы работаем Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими центрами в Европе, Северной Америке и Израиле. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в аппаратном и программном обеспечении, а также внутреннюю команду по исследованию и разработке ИИ.
Роль
Мы ищем опытного старшего архитектора решений в области машинного обучения, который будет поддерживать клиентов, использующих безсерверную платформу вывода Nebius Token Factory для открытых LLM (больших языковых моделей) в нескольких модальностях. В этой роли вы будете сотрудничать с клиентами для проектирования и внедрения индивидуальных решений на базе LLM и архитектурно создавать масштабируемые AI-приложения с использованием наших обслуживаемых моделей, а также работать вместе с нашей командой бэкенда для улучшения платформы в соответствии с потребностями клиентов.
Ваши обязанности будут включать:
- Проектирование и внедрение решений на базе LLM с использованием сервисов вывода Nebius Token Factory для создания бизнес-ценности и поддержки целей клиентов.
- Создание готовых к производству приложений с использованием наших безсерверных LLM API, включая мультимодальные модели (текст, изображение, аудио) и модели, ориентированные на конкретные домены.
- Предоставление технической экспертизы в области prompt engineering, архитектур RAG, выбора моделей и оптимизации вывода.
- Сотрудничество с командами продукта и инженерии для сбора отзывов клиентов и формирования дорожной карты платформы.
- Помощь клиентам в масштабировании от прототипа (POC) до производства с акцентом на производительность, надёжность и экономическую эффективность.
Мы ожидаем, что у вас есть:
- Опыт работы в системах машинного обучения/ИИ не менее 5 лет, из которых минимум 2 года посвящены LLM и генеративному ИИ.
- Глубокие знания экосистемы LLM, включая архитектуры моделей и методы дообучения.
- Практический опыт в следующих областях:
- Prompt engineering и разработка конвейеров LLM, включая оценку.
- Агентские фреймворки, такие как Langchain, Langsmith, smolagents или эквиваленты.
- Векторные базы данных и паттерны реализации RAG.
- Развёртывание приложений на базе LLM с использованием API OpenAI, Anthropic или открытых моделей.
- Сильные навыки программирования на Python.
- Отличные коммуникативные навыки с умением ясно объяснять технические концепции разной аудитории.
Будет плюсом, если у вас есть:
- Опыт работы с фреймворками и библиотеками для вывода (например, vLLM, SGLang, TensorRT-LLM, Transformers).
- Знание методов оптимизации вывода, таких как квантизация, пакетирование, кэширование и маршрутизация.
- Опыт работы с мультимодальными моделями ИИ (например, визуально-языковыми, речевыми).
- Навыки работы с DevOps-инструментами (Docker, Kubernetes).
- Вклад в проекты с открытым исходным кодом в области машинного обучения/ИИ.
Предпочтительные инструменты:
- Языки программирования – Python
- Фреймворки и библиотеки для МО – vLLM, SGLang, TensorRT-LLM, Transformers, SDK OpenAI/Anthropic
- Фреймворки для агентских конвейеров: Langchain / Langsmith / smolagents / эквиваленты
- API и веб-фреймворки – FastAPI, Flask
- MLOps и DevOps инструменты – Kubernetes (K8s), Docker, Git
- Облачные платформы – AWS (SageMaker, Bedrock), GCP (Vertex AI), Azure (Azure ML)
Основные преимущества для сотрудников:
- Медицинская страховка: 100% оплачиваемое компанией медицинское, стоматологическое и офтальмологическое покрытие для сотрудников и их семей.
- Пенсионный план 401(k): До 4% софинансирования компанией с немедленным правом собственности.
- Отпуск по уходу за ребёнком: 20 недель оплачиваемого отпуска для основных опекунов, 12 недель для второстепенных.
- Компенсация за удалённую работу: До $85 в месяц на мобильную связь и интернет.
- Страхование по инвалидности и жизни: Оплачиваемое компанией краткосрочное, долгосрочное и страхование жизни.
Компенсация
Мы предлагаем конкурентоспособные зарплаты в диапазоне от 215 тыс. до 275 тыс. долларов США OTE (доход при достижении целей) и акции в зависимости от вашего опыта, навыков и местоположения.
Присоединяйтесь к Nebius сегодня!
Что мы предлагаем
- Конкурентоспособную зарплату и полный пакет льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.
Мы растём и ежедневно расширяем наши продукты. Если вы готовы к вызовам и так же увлечены ИИ и МО, как и мы, присоединяйтесь к нам!