Инженер по полевым работам (доставка аппаратного обеспечения)
Бирмингем, Алабама, США
Почему стоит работать в Nebius Nebius возглавляет новую эру в облачных вычислениях для обслуживания глобальной экономики ИИ. Мы создаем инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру или необходимости создавать большие внутренние команды по ИИ/МО. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.
Где мы работаем Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими центрами в Европе, Северной Америке и Израиле. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в области аппаратного и программного обеспечения, а также внутреннюю команду по исследованиям и разработкам ИИ.
Роль
Nebius управляет масштабной инфраструктурой ИИ с высокой плотностью GPU в критически важных дата-центрах. В качестве старшего инженера по доставке и развертыванию вы будете отвечать за полный цикл доставки, развертывания и готовности к производству платформ следующего поколения на базе GPU внутри наших дата-центров. Эта роль находится на пересечении аппаратного обеспечения, систем Linux и операционного исполнения. Вы будете руководить запуском стоек на месте, проверять системы ИИ на базе NVIDIA, координировать ремонт и обеспечивать, чтобы инфраструктура серии GB переходила от установки к полностью рабочим производственным средам с точностью и надежностью. Вы будете тесно сотрудничать с командами аппаратного обеспечения, сетей и инфраструктуры для развертывания и стабилизации систем GPU на базе H200 и B200 в масштабах.
Ваши обязанности будут включать:
- Руководство полным развертыванием стоек серии GB в дата-центрах
- Контроль установки, запуска, проверки и готовности к производству серверов на базе NVIDIA H200 и B200
- Устранение сложных проблем с аппаратным обеспечением, прошивкой, Linux OS и сетями
- Выполнение структурированных процедур тестирования и проверки во время развертывания
- Разработка и поддержка базовых скриптов для проверки состояния аппаратного обеспечения и диагностики на базе Linux
- Координация ремонта аппаратного обеспечения на месте, замены деталей и эскалаций к поставщикам
- Проведение анализа первопричин и обеспечение реализации корректирующих действий
- Управление и приоритизация сроков развертывания при одновременном выполнении нескольких проектов
- Предоставление технического руководства и консультаций инженерам и техникам на месте
- Сотрудничество с командами сетей и инфраструктуры для обеспечения беспрепятственной интеграции
- Документирование процессов развертывания, стандартов проверки и эксплуатационных инструкций
Что мы ожидаем от вас:
- Сильный практический опыт развертывания и эксплуатации инфраструктуры дата-центров
- Глубокое знание систем с высокой плотностью GPU, желательно платформ NVIDIA серии H
- Опыт работы с развертыванием стоек высокой плотности (серия GB или аналогичные)
- Уверенные знания Linux, включая устранение неполадок и написание скриптов
- Способность диагностировать проблемы на уровне аппаратного обеспечения, ОС, прошивки и сети
- Опыт координации полевых ремонтов и работы напрямую с поставщиками аппаратного обеспечения
- Подтвержденный опыт руководства техническими командами или контроля полевых операций
- Высокая ответственность и способность работать в критически важных для производства условиях
- Четкие коммуникативные навыки и умение сотрудничать с распределенными командами
Будет преимуществом, если у вас есть:
- Опыт развертывания кластеров ИИ или высокопроизводительных вычислений в масштабе
- Знание автоматизированного предоставления ресурсов или систем жизненного цикла инфраструктуры
- Опыт квалификации аппаратного обеспечения, тестирования на выгорание или заводской проверки
- Опыт поддержки быстрого расширения инфраструктуры
- Знакомство с ARM-архитектурой или гетерогенными вычислительными средами
Условия работы:
Сотрудничество с глобально распределенными инженерными и операционными командами
Основные преимущества для сотрудников:
- Медицинская страховка: 100% оплата компанией медицинского, стоматологического и офтальмологического страхования для сотрудников и их семей
- Пенсионный план 401(k): до 4% софинансирования компанией с немедленным правом собственности
- Отпуск по уходу за ребенком: 20 недель оплачиваемого отпуска для основных опекунов, 12 недель для вторичных
- Компенсация за удаленную работу: до 85 долларов в месяц на мобильную связь и интернет
- Страхование от инвалидности и жизни: оплачиваемое компанией краткосрочное, долгосрочное и страхование жизни
Оплата труда
Мы предлагаем конкурентоспособные зарплаты в диапазоне от 125 000 до 180 000 долларов США в год + квартальные бонусы за результаты.
Присоединяйтесь к Nebius сегодня и помогайте создавать программное обеспечение, которое будет питать следующее поколение инфраструктуры ИИ.
Что мы предлагаем
- Конкурентоспособную зарплату и полный пакет льгот.
- Возможности профессионального роста внутри Nebius.
- Гибкие условия работы.
- Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.
Мы растем и ежедневно расширяем наши продукты. Если вы готовы к вызовам и так же увлечены ИИ и МО, как и мы, присоединяйтесь к нам!
Хотите строить карьеру в Nebius? Получайте будущие вакансии прямо на вашу электронную почту.