Описание
Направление ML Ops — неотъемлемая часть инфраструктурных и продуктовых команд, которые участвуют в доставке ML-моделей в продакшен.
Один из центров экспертизы ML Ops в Т‑Банке — команда ML Core Platform.
ML Core — передовая платформа для машинного обучения, которая ускоряет разработку и внедрение ML-моделей в бизнес-процессы. Мы добавляем в платформу инструменты, которые обеспечивают эффективную разработку, обучение и прототипирование моделей.
ML Core интегрирована с другими платформами и инструментами компании. Это позволяет нам внедрять и использовать модели в разных продуктах и сервисах.
Обязанности
- Разрабатывать и поддерживать ML-пайплайны дообучения моделей машинного обучения
- Развертывать AI-модели: настраивать CI/CD для ML, автоматизировать выкатку моделей, контролировать версионирование, создавать отказоустойчивую и масштабируемую среду, строить ML-пайплайны с Apache Airflow для обработки данных и внедрять open source-модели в инфраструктуру компании
- Проводить мониторинг и обслуживание AI-моделей
- Управлять инфраструктурой в виде GPU-серверов
- Разворачивать и поддерживать современные ML-инструменты
- Документировать и стандартизировать практики вокруг обслуживания инфраструктуры для машинного обучения
- Оптимизировать сервинг моделей: утилизация и виртуализация GPU, настройка GPU/CUDA-оптимизаций, конфигурирование сервинга для инференса, мониторинг работы моделей, алертинг
- Создавать программные модули для обучения и обслуживания AI-моделей
Требования
- Знаете Python или Go, умеете писать production-ready код
- Работали с библиотеками для данных Pandas и NumPy, вели эксперименты — Jupyter, ClearML
- Работали с хранилищами данных: S3, Postgres, Redis
- Понимаете жизненный цикл ML-модели: обучение, валидация, переобучение
- Знаете основные метрики качества моделей: AUC-ROC, Precision/Recall и другие
- Работали с Docker и Kubernetes
- Развертывали модели в продакшн: Triton, Seldon, BentoML или аналоги
- Настраивали мониторинг инфраструктуры Grafana и Prometheus, и самих моделей
- Умеете настраивать CI/CD пайплайны для ML: GitLab CI, AirFlow
- Понимаете принципы Infrastructure as a Code, знаете Terraform или его аналоги
Мы предлагаем
- Работу в офисе или удаленно — по договоренности
- Возможность работы в аккредитованной ИТ-компании
- ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней
- Рост по карьерному треку: проходите курсы по софт- и хард-скиллам, развивайтесь с поддержкой ментора и повышайте уровень с матрицей компетенций и регулярным ревью
- Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи
- Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни
- Компенсацию затрат на спортивные абонементы, приложение Т-Спорта для онлайн-занятий и командные тренировки с коллегами
- 3 дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию
- Специальные тарифы на продукты Т-Банка и широкую программу скидок от партнеров
- Достойную зарплату — обсудим ее на собеседовании