Инженер по глубокому обучению
Humanoid — первая компания в Великобритании, занимающаяся искусственным интеллектом и робототехникой, создающая самые передовые, надежные, коммерчески масштабируемые и безопасные гуманоидные роботы в мире. Наш первый гуманоидный робот HMND 01 — это устройство следующего поколения для автоматизации труда, обеспечивающее высокоэффективные услуги в различных сферах применения, начиная с промышленных.
Наша миссия
В Humanoid мы стремимся создавать ведущие в мире, коммерчески масштабируемые, безопасные и передовые гуманоидные роботы, которые бесшовно интегрируются в повседневную жизнь и расширяют возможности человека.
О роли
В этой роли вы будете работать со всеми аспектами обучения способных политик, будь то предварительное обучение базовой модели на разнообразном корпусе траекторий с множеством воплощений, тонкая настройка политики для выполнения конкретной задачи, курирование процессов сбора данных или исследование продуктивных способов генерации и использования синтетических данных. Это в первую очередь роль, ориентированная на глубокое обучение, поэтому мы ищем опыт решения реальных задач с использованием современных нейронных сетей, хотя опыт в робототехнике не является строго обязательным. Однако, если у вас такого опыта нет, будьте готовы быстро освоить новую область.
Что вы будете делать
- Проводить постобучение политик с помощью клонирования поведения и обучения с подкреплением; отвечать за полный цикл от данных до развертывания.
- Сотрудничать с командой сбора данных для организации сбора новых данных: определять, что такое хорошие данные, выявлять режимы сбоев, обеспечивать разнообразие и покрытие.
- Тесно работать с внешними партнерами для обеспечения стабильного поступления высококачественных данных для предварительного обучения в масштабах.
- Запускать предварительное, промежуточное и последующее обучение на стеке VLA; исследовать новые модальности и изменения архитектуры.
- Создавать и поддерживать непрерывные конвейеры: загружать синтетические данные и телепортационные логи, версионировать их, применять слабое супервизорное маркирование, курировать сбалансированные наборы данных и автоматически выявлять свежие случаи сбоев для повторного обучения.
- Работать с командами MLOps и платформы данных для масштабирования распределенного обучения и оптимизации моделей для инференса в реальном времени на периферийных устройствах.
Кого мы ищем
- Опыт работы с системами глубокого обучения 3+ года (в индустрии или исследовательской деятельности) с реализованными моделями или опубликованными артефактами.
- Глубокий практический опыт хотя бы с одной из следующих областей: LLM (большие языковые модели), VLM (визуально-языковые модели) или генеративные модели изображений/видео — архитектура, обучение и инференс.
- Опыт работы с инфраструктурой глубокого обучения: потоковые наборы данных, контрольные точки и управление состоянием, стратегии распределенного обучения.
- Сильные навыки Python + PyTorch/JAX; умение профилировать, отлаживать численные вычисления и писать поддерживаемый исследовательский код.
- Знакомство с современными практиками разработки программного обеспечения.
- Вы четко документируете эксперименты и ясно коммуницируете компромиссы.
Желательно иметь
- Опыт в робототехнике или автономном вождении.
- Опыт применения обучения с подкреплением к LLM или робототехнике.
- Опыт работы с моделями VLA (визуально-языково-действующими).
- Доказанный опыт продуктовой реализации глубоких сетей (ограничения по задержке/пропускной способности, телеметрия, оптимизация на устройстве).
- Публикации на ведущих конференциях по глубокому обучению или эквивалентный вклад в открытое программное обеспечение.
- Знакомство с OpenVLA, моделями Physical Intelligence (π) или аналогичными открытыми VLA-фреймворками.
Что мы предлагаем
- Конкурентоспособную зарплату плюс участие в нашей программе опционов на акции
- Оплачиваемый отпуск с корректировками в зависимости от вашего местоположения для соблюдения местного трудового законодательства
- Возможности путешествий в наши офисы в Ванкувере и Бостоне
- Преимущества офиса: бесплатные завтраки, обеды, закуски и регулярные командные мероприятия
- Свободу влиять на продукт и вести ключевые инициативы
- Сотрудничество с ведущими инженерами, исследователями и экспертами по продукту в области ИИ и робототехники
- Культуру стартапа, ориентированную на скорость, прозрачность и минимальную бюрократию
Как подать заявку
Звучит ли эта роль как идеальное предложение для вас? Заполните форму и приложите ссылки или файлы, демонстрирующие лучшее из того, что вы создали и достигли.
Подать заявку сейчас
*обозначает обязательное поле