Роль
Мы создаём высокопроизводительную платформу для AI-инференса для команд разработчиков, работающих с нагрузками, чувствительными к задержкам и затратам, в масштабах.
В инфраструктуре AI успех PoC (Proof of Concept) не всегда гарантирует успех в продакшене. Эта роль существует для того, чтобы гарантировать, что то, что мы обещаем клиентам, масштабируемо, эффективно и соответствует стратегии платформы.
Мы ищем старшего инженера по продажам, который станет основным техническим партнёром для наших клиентов и мультипликатором силы для отделов продаж и инженерии. Вы будете формировать сложные AI-нагрузки от первого этапа знакомства до проверки производственной реализуемости, обеспечивая техническую строгость, экономическую целесообразность и масштабируемые архитектурные решения.
Вы будете работать на пересечении амбиций клиентов, инженерной реальности и коммерческого роста, влияя на:
- Качество дохода
- Фокус инженерии
- Эволюцию продукта
- Доверие клиентов в масштабе
Ваши обязанности будут включать:
Стратегическое техническое исследование
- Вести глубокое техническое исследование с инженерными командами и техническими основателями
- Понимать требования к моделям, ожидания по трафику, ограничения по задержкам, экономику GPU и системные зависимости
- Переводить амбиции клиента в архитектуру, реализуемую в продакшене.
- Раннее выявление скрытых технических рисков
Коммерческое ускорение
- Тесно сотрудничать с отделом продаж по стратегическим сделкам
- Влиять на стратегию сделки через архитектурную ясность
- Предотвращать несогласованные обязательства до выделения инженерных ресурсов
- Повышать конверсию PoC в продакшен, обеспечивая технический реализм
Архитектура и валидация PoC
- Определять измеримые критерии успеха (задержка, TTFT, пропускная способность, бюджет затрат)
- Классифицировать сложность нагрузки и необходимую глубину оптимизации
- Согласовывать соответствующие ресурсы (архитекторы ML-решений, инженеры, GPU-ёмкость и т.д.)
- Вести структурированные решения Go / No-Go
- Предотвращать неконтролируемую кастомизацию или скрытые НИОКР
Распознавание шаблонов и использование платформы
- Выявлять повторяющиеся конфигурационные шаблоны среди клиентов
- Количественно оценивать спрос на продвинутые оптимизации (квантизация, спекулятивное декодирование и т.д.)
- Предоставлять структурированные инсайты продуктовой и инженерной командам
- Помогать развивать возможности платформы на основе реальных данных о нагрузках
Мы ожидаем от вас:
- Глубокое понимание систем AI-инференса и инфраструктуры на базе GPU
- Опыт работы с нагрузками LLM и средами, чувствительными к производительности
- Опыт работы с фреймворками и библиотеками для инференса (например, vLLM, SGLang, TensorRT-LLM).
- Умение рассуждать о задержках, пропускной способности, затратах и компромиссах архитектуры
- Сильное присутствие у клиентов с инженерным подходом
- Комфорт в вызове предположений и конструктивном возражении
- Коммерческая осведомлённость – вы понимаете, что инженерное время — это стратегический ресурс
Предпочтительный технический стек
- Языки программирования – Python
- Фреймворки и библиотеки – vLLM, SGLang, TensorRT-LLM, SDK OpenAI/Anthropic
- Фреймворки для агентных пайплайнов: Langchain / Langsmith / smolagents / эквиваленты
- API и веб-фреймворки – FastAPI, Flask
- MLOps и DevOps инструменты – Kubernetes (K8s), Docker, Git
- Облачные платформы – AWS (SageMaker, Bedrock), GCP (Vertex AI), Azure (Azure ML)
Как выглядит успех
- Стратегические сделки технически обоснованы до вовлечения инженерии
- PoC чётко определены и экономически оправданы
- Инженерные ресурсы выделяются предсказуемо
- Улучшение конверсии в продакшен
- Клиенты рассматривают вас как доверенного архитектурного советника
Основные преимущества для сотрудников в США:
- Медицинская страховка: 100% оплачиваемое компанией медицинское, стоматологическое и офтальмологическое покрытие для сотрудников и их семей.
- План 401(k): до 4% совпадения от компании с немедленной вестингом.
- Отпуск по уходу за ребёнком: 20 недель оплачиваемого отпуска для основных опекунов, 12 недель для вторичных опекунов.
- Возмещение расходов на удалённую работу: до $85 в месяц на мобильную связь и интернет.
- Страхование по инвалидности и жизни: оплачиваемое компанией краткосрочное, долгосрочное и страхование жизни.
Компенсация
Мы предлагаем конкурентоспособные зарплаты в диапазоне от $152k до $228k базовой части + RSU и бонусы за результаты.
Что мы предлагаем
- Конкурентоспособную зарплату и комплексный пакет льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.
Мы растём и ежедневно расширяем наши продукты. Если вы готовы к вызову и так же увлечены AI и ML, как и мы, присоединяйтесь к нам!