Описание вакансии
В TravelLine мы разрабатываем единую функциональную Платформу для автоматизации процессов гостиничного бизнеса. Всё, что связано с онлайн-бронированием и управлением номерным фондом в отелях — это к нам. Ежемесячно через наши системы бронируют более 1,5 миллионов гостей.
Основной офис компании находится в Йошкар-Оле, у нас есть филиал в Санкт-Петербурге и Казани, а также распределенная команда технических специалистов в разных городах России. Больше про работу у нас: https://travelline.tech/
Мы ищем опытного Senior SRE, который поможет нам строить и поддерживать высоконадежные, масштабируемые и эффективные системы. Если ты увлечен автоматизацией, мониторингом и обеспечением бесперебойной работы критически важных сервисов, то нам по пути!
Чем ты будешь заниматься:
- Обеспечение надежности:
- Проектирование и внедрение совместно с командами разработки отказоустойчивой и высокодоступной конфигурации проектов на проде.
- Разработка, внедрение и контроль проекта по модели SLA/SLO/SLI.
- Проектирование, внедрение и развитие наблюдаемости систем через мониторинг, логирование и алертинг.
- Автоматизация:
- Автоматизация рутинных операций (оркестрация, масштабирование, восстановление).
- Инциденты и post-mortem:
- Участие в устранение инцидентов, проведение post-mortem анализа и внедрение улучшений для предотвращения повторных сбоев.
- Работа в рамках blameless-культуры, фокус на решение проблем, а не поиск виноватых.
- Оптимизация производительности:
- Анализ и улучшение производительности систем, включая оптимизацию ресурсов и снижение затрат.
Наш стек технологий:
- Инфраструктура: Service Fabrice > Kubernetes, Docker, Terraform, VM+IIS (куда без них), Helm, ELK.
- CI/CD: Jenkins > GitLab CI, BitBucket.
- Базы данных: MS SQL, PostgreSQL, Redis.
- Мониторинг и алертинг: Zabbix, Prometheus, Grafana.
Мы ждем, что у тебя есть:
- 5+ лет опыта в DevOps/SRE или смежных областях.
- Глубокие знания Kubernetes (архитектура, операторы, Helm, CRD).
- Опыт работы с системами мониторинга и алертинга (Prometheus, Grafana).
- Навыки работы с инфраструктурой как код (Terraform, Ansible).
- Умение анализировать и оптимизировать производительность систем.
- Понимание принципов работы сетей, безопасности и Linux-систем.
Наша философия:
- Мы верим в баланс между скоростью и надежностью.
- Ценим blameless-культуру и фокус на решение проблем.
- Документация как код: все решения фиксируются в ADR, конфиги — в Git.
- Прагматизм: используем managed-сервисы там, где это экономит время и ресурсы.
Мы предлагаем:
- Оформление по ТК.
- Платим белую зарплату и все отчисления, оформляем больничные, не беспокоим во время оплачиваемого отпуска.
- Удалёнка или офис в городе присутствия.
- Рабочий инструмент — мощный ноут.
- ДМС, психологическая поддержка и компенсация спорта.
- Курсы, конференции, мастер-классы за счет компании.
- Подарки на праздники и важные даты.
Если ты готов решать сложные задачи, влиять на архитектуру и работать с современными технологиями, присоединяйся к нам!