Инженер по полевым работам (доставка аппаратного обеспечения)

Бирмингем, Алабама, США

Почему стоит работать в Nebius Nebius возглавляет новую эру в облачных вычислениях для обслуживания глобальной экономики ИИ. Мы создаем инструменты и ресурсы, необходимые нашим клиентам для решения реальных задач и трансформации отраслей, без огромных затрат на инфраструктуру или необходимости создавать большие внутренние команды по ИИ/МО. Наши сотрудники работают на переднем крае облачной инфраструктуры ИИ вместе с одними из самых опытных и инновационных лидеров и инженеров в этой области.

Где мы работаем Штаб-квартира находится в Амстердаме, компания котируется на Nasdaq, Nebius имеет глобальное присутствие с исследовательскими центрами в Европе, Северной Америке и Израиле. Команда из более чем 800 сотрудников включает более 400 высококвалифицированных инженеров с глубокими знаниями в области аппаратного и программного обеспечения, а также внутреннюю команду по исследованиям и разработкам ИИ.

Роль

Nebius управляет масштабной инфраструктурой ИИ с высокой плотностью GPU в критически важных дата-центрах. В качестве старшего инженера по доставке и развертыванию вы будете отвечать за полный цикл доставки, развертывания и готовности к производству платформ следующего поколения на базе GPU внутри наших дата-центров. Эта роль находится на пересечении аппаратного обеспечения, систем Linux и операционного исполнения. Вы будете руководить запуском стоек на месте, проверять системы ИИ на базе NVIDIA, координировать ремонт и обеспечивать, чтобы инфраструктура серии GB переходила от установки к полностью рабочим производственным средам с точностью и надежностью. Вы будете тесно сотрудничать с командами аппаратного обеспечения, сетей и инфраструктуры для развертывания и стабилизации систем GPU на базе H200 и B200 в масштабах.

Ваши обязанности будут включать:

Руководство полным развертыванием стоек серии GB в дата-центрах
Контроль установки, запуска, проверки и готовности к производству серверов на базе NVIDIA H200 и B200
Устранение сложных проблем с аппаратным обеспечением, прошивкой, Linux OS и сетями
Выполнение структурированных процедур тестирования и проверки во время развертывания
Разработка и поддержка базовых скриптов для проверки состояния аппаратного обеспечения и диагностики на базе Linux
Координация ремонта аппаратного обеспечения на месте, замены деталей и эскалаций к поставщикам
Проведение анализа первопричин и обеспечение реализации корректирующих действий
Управление и приоритизация сроков развертывания при одновременном выполнении нескольких проектов
Предоставление технического руководства и консультаций инженерам и техникам на месте
Сотрудничество с командами сетей и инфраструктуры для обеспечения беспрепятственной интеграции
Документирование процессов развертывания, стандартов проверки и эксплуатационных инструкций

Что мы ожидаем от вас:

Сильный практический опыт развертывания и эксплуатации инфраструктуры дата-центров
Глубокое знание систем с высокой плотностью GPU, желательно платформ NVIDIA серии H
Опыт работы с развертыванием стоек высокой плотности (серия GB или аналогичные)
Уверенные знания Linux, включая устранение неполадок и написание скриптов
Способность диагностировать проблемы на уровне аппаратного обеспечения, ОС, прошивки и сети
Опыт координации полевых ремонтов и работы напрямую с поставщиками аппаратного обеспечения
Подтвержденный опыт руководства техническими командами или контроля полевых операций
Высокая ответственность и способность работать в критически важных для производства условиях
Четкие коммуникативные навыки и умение сотрудничать с распределенными командами

Будет преимуществом, если у вас есть:

Опыт развертывания кластеров ИИ или высокопроизводительных вычислений в масштабе
Знание автоматизированного предоставления ресурсов или систем жизненного цикла инфраструктуры
Опыт квалификации аппаратного обеспечения, тестирования на выгорание или заводской проверки
Опыт поддержки быстрого расширения инфраструктуры
Знакомство с ARM-архитектурой или гетерогенными вычислительными средами

Условия работы:

Сотрудничество с глобально распределенными инженерными и операционными командами

Основные преимущества для сотрудников:

Медицинская страховка: 100% оплата компанией медицинского, стоматологического и офтальмологического страхования для сотрудников и их семей
Пенсионный план 401(k): до 4% софинансирования компанией с немедленным правом собственности
Отпуск по уходу за ребенком: 20 недель оплачиваемого отпуска для основных опекунов, 12 недель для вторичных
Компенсация за удаленную работу: до 85 долларов в месяц на мобильную связь и интернет
Страхование от инвалидности и жизни: оплачиваемое компанией краткосрочное, долгосрочное и страхование жизни

Оплата труда

Мы предлагаем конкурентоспособные зарплаты в диапазоне от 125 000 до 180 000 долларов США в год + квартальные бонусы за результаты.

Присоединяйтесь к Nebius сегодня и помогайте создавать программное обеспечение, которое будет питать следующее поколение инфраструктуры ИИ.

Что мы предлагаем

Конкурентоспособную зарплату и полный пакет льгот.
Возможности профессионального роста внутри Nebius.
Гибкие условия работы.
Динамичную и совместную рабочую среду, которая ценит инициативу и инновации.

Мы растем и ежедневно расширяем наши продукты. Если вы готовы к вызовам и так же увлечены ИИ и МО, как и мы, присоединяйтесь к нам!

Хотите строить карьеру в Nebius? Получайте будущие вакансии прямо на вашу электронную почту.

Инженер по полевым работам (доставка аппаратного обеспечения)