Описание вакансии

В TravelLine мы разрабатываем единую функциональную Платформу для автоматизации процессов гостиничного бизнеса. Всё, что связано с онлайн-бронированием и управлением номерным фондом в отелях — это к нам. Ежемесячно через наши системы бронируют более 1,5 миллионов гостей.

Основной офис компании находится в Йошкар-Оле, у нас есть филиал в Санкт-Петербурге и Казани, а также распределенная команда технических специалистов в разных городах России. Больше про работу у нас: https://travelline.tech/

Мы ищем опытного Senior SRE, который поможет нам строить и поддерживать высоконадежные, масштабируемые и эффективные системы. Если ты увлечен автоматизацией, мониторингом и обеспечением бесперебойной работы критически важных сервисов, то нам по пути!

Чем ты будешь заниматься:

Обеспечение надежности:
- Проектирование и внедрение совместно с командами разработки отказоустойчивой и высокодоступной конфигурации проектов на проде.
- Разработка, внедрение и контроль проекта по модели SLA/SLO/SLI.
- Проектирование, внедрение и развитие наблюдаемости систем через мониторинг, логирование и алертинг.
Автоматизация:
- Автоматизация рутинных операций (оркестрация, масштабирование, восстановление).
Инциденты и post-mortem:
- Участие в устранение инцидентов, проведение post-mortem анализа и внедрение улучшений для предотвращения повторных сбоев.
- Работа в рамках blameless-культуры, фокус на решение проблем, а не поиск виноватых.
Оптимизация производительности:
- Анализ и улучшение производительности систем, включая оптимизацию ресурсов и снижение затрат.

Наш стек технологий:

Инфраструктура: Service Fabrice > Kubernetes, Docker, Terraform, VM+IIS (куда без них), Helm, ELK.
CI/CD: Jenkins > GitLab CI, BitBucket.
Базы данных: MS SQL, PostgreSQL, Redis.
Мониторинг и алертинг: Zabbix, Prometheus, Grafana.

Мы ждем, что у тебя есть:

5+ лет опыта в DevOps/SRE или смежных областях.
Глубокие знания Kubernetes (архитектура, операторы, Helm, CRD).
Опыт работы с системами мониторинга и алертинга (Prometheus, Grafana).
Навыки работы с инфраструктурой как код (Terraform, Ansible).
Умение анализировать и оптимизировать производительность систем.
Понимание принципов работы сетей, безопасности и Linux-систем.

Наша философия:

Мы верим в баланс между скоростью и надежностью.
Ценим blameless-культуру и фокус на решение проблем.
Документация как код: все решения фиксируются в ADR, конфиги — в Git.
Прагматизм: используем managed-сервисы там, где это экономит время и ресурсы.

Мы предлагаем:

Оформление по ТК.
Платим белую зарплату и все отчисления, оформляем больничные, не беспокоим во время оплачиваемого отпуска.
Удалёнка или офис в городе присутствия.
Рабочий инструмент — мощный ноут.
ДМС, психологическая поддержка и компенсация спорта.
Курсы, конференции, мастер-классы за счет компании.
Подарки на праздники и важные даты.

Если ты готов решать сложные задачи, влиять на архитектуру и работать с современными технологиями, присоединяйся к нам!

Site Reliability Engineer

Описание вакансии

Чем ты будешь заниматься:

Наш стек технологий:

Мы ждем, что у тебя есть:

Наша философия:

Мы предлагаем:

Сопроводим до оффера

Сопроводим до оффера

Похожие вакансии

DevOps-инженер

DevOps Engineer

DevOps Engineer

Инженер по сопровождению

DevOps-инженер

DevOps/Инженер SRE (Avanpost CloudMFA)