Роль
Менеджер площадки дата-центра отвечает за полную надежность, безопасность, емкость и производительность одного из наших флагманских объектов в США. Вы будете руководить высокоэффективной многопрофильной операционной командой и тесно сотрудничать с отделами проектирования, строительства, сети, безопасности, планирования емкости и организациями дата-центров для обеспечения мирового класса доступности и экономической эффективности.
Ваши обязанности будут включать:
- Полная ответственность за площадку 24/7: обеспечение непрерывной доступности по всем направлениям — электропитание, охлаждение, структурированная кабельная система, сеть, безопасность и DCIM — с выполнением или превышением глобальных SLA.
- Формирование и руководство командой: найм, наставничество и развитие менеджеров/техников; управление моделями персонала, покрытием смен и ротацией дежурств, которые масштабируются.
- Руководство инцидентами: ведение крупных событий от начала до конца — триаж, коммуникации, брифинги для руководства, анализ коренных причин (RCA) и устойчивые корректирующие действия.
- Внедрение инженерии надежности: реализация RCM, предиктивного обслуживания, QA/QC, 5S и Lean/непрерывного улучшения для сокращения MTTR и увеличения MTBF.
- Своевременное обеспечение емкости: планирование и выполнение расширений/модернизаций; ввод в эксплуатацию систем MEP совместно с отделом проектирования/строительства; достижение безупречного контроля изменений (MOP/SOP/EOP).
- Масштабирование инструментов и автоматизации: развитие DCIM/BMS/EPMS, систем мониторинга/оповещения, управления работами (Jira/ServiceNow), базы знаний (Confluence) и легкого скриптинга/SQL для телеметрии и автоматизации рабочих процессов.
- Ведение операций, ориентированных на метрики: публикация дашбордов и ключевых показателей эффективности (доступность, PUE, MTBF/MTTR, соблюдение работ, безопасность) и использование их для принятия решений.
- Сотрудничество между функциями: работа с отделами облачных вычислений, сети, безопасности и планирования емкости для оптимизации производительности, стоимости и устойчивости по всему парку объектов.
- Управление поставщиками и колокациями: ответственность за контракты, SLA и выполнение по поставкам стоек, PDU, оптоволокна/медных кабелей и планов технического обслуживания; проверка топологии колокаций и соответствия требованиям.
- Повышение стандартов безопасности: обеспечение культуры EHS с нулевым уровнем травматизма; проведение учений/аудитов по безопасности жизни, физической безопасности и защите данных.
- Прогнозирование и бюджетирование: создание планов на основе данных для электроэнергии, запасных частей, численности персонала и проектов; тщательный контроль OpEx/CapEx.
Мы ожидаем, что у вас есть:
- Диплом младшего специалиста или профессиональный сертификат в области электротехники, машиностроения или промышленной инженерии (или эквивалентный опыт).
- Более 10 лет опыта в электротехнике/механике/ОВК/системах управления в промышленных или коммерческих условиях, из них более 5 лет — в дата-центрах или объектах с критически важными функциями.
- Опыт руководства командой на объектах с круглосуточной работой (управление руководителями/техниками, поставщиками и дежурными операциями).
- Глубокие практические знания ИБП/генераторов/распределительных устройств, чиллеров/CRAC/CRAH, систем обнаружения и подавления пожара, BMS/EPMS/DCIM и структурированной кабельной системы (медь и оптоволокно).
- Подтвержденные навыки управления инцидентами, анализа коренных причин/корректирующих действий, управления изменениями и контроля поставщиков/контрактов.
- Ориентация на данные с умением прогнозировать ресурсы и принимать решения на основе аналитики (Excel; SQL/скрипты приветствуются).
- Отличные письменные и устные коммуникативные навыки, уверенность в презентациях для руководства и руководстве полевыми командами во время живых событий.
- Готовность к командировкам до ~25% времени и поддержке внеурочных эскалаций при необходимости.
Будет дополнительным преимуществом, если у вас есть:
- Степень бакалавра в области электротехники, машиностроения, промышленной инженерии, управления инженерными проектами или инженерии надежности.
- Опыт работы в гипермасштабных или колокационных центрах с применением обслуживания, ориентированного на надежность, предиктивной аналитики и практик Lean/Six Sigma.
- Знание основ Linux, установки/устранения неполадок сетевого оборудования и тестирования оптоволокна.
- Опыт работы с Jira, Confluence, ServiceNow (или аналогичными системами); сильные навыки написания SOP/MOP/EOP.
- Наличие сертификатов, таких как CDCP, DCM, PMP, OSHA-30, ITIL или сертификатов, соответствующих стандартам Uptime.
Основные преимущества для сотрудников:
- Медицинское страхование: 100% оплата компанией медицинского, стоматологического и офтальмологического страхования для сотрудников и их семей.
- Пенсионный план 401(k): до 4% софинансирования компанией с немедленной полной принадлежностью средств.
- Отпуск по уходу за ребенком: 20 недель оплачиваемого отпуска для основных опекунов, 12 недель для вторичных опекунов.
- Компенсация расходов на удаленную работу: до 85 долларов в месяц на мобильную связь и интернет.
- Страхование от несчастных случаев и жизни: оплачиваемое компанией краткосрочное, долгосрочное и страхование жизни.
Оплата труда
Мы предлагаем конкурентоспособные зарплаты в диапазоне от 90 000 до 140 000 долларов США в год + квартальные бонусы за результаты.
Присоединяйтесь к Nebius сегодня!
Мы растем и ежедневно расширяем наши продукты. Если вы готовы к вызовам и так же увлечены ИИ и машинным обучением, как и мы, присоединяйтесь к нам!