Выполнение работ по развертыванию и конфигурированию приложений
Моделирование поведения приложений при отказе различных компонентов и проработка механизмов обеспечения их отказоустойчивости
Развертывание и поддержание высоконагруженных систем API-менеджмента
Настройка сбора диагностических данных и метрик
Настройка проверок доступности бизнес функционала
Настройка мониторинга (пороговые значения, условия отправки оповещений)
Настройка резервного копирования данных, выполнение работ по восстановлению из резервных копий
Оказание консультаций по использованию инструментов, при проектировании архитектуры ПО с использованием прикладных компонентов, предоставляемых как сервис
Решение инцидентов и проблем
Планирование и проведение работ по оптимизации конфигурации и обновлению компонентов ПО и инфраструктуры
Ведение сопроводительной документации по эксплуатации, разработка инструкций и рекомендаций
Что для этого нужно
Знание и практический опыт администрирования Linux-систем
Навыки написания скриптов на bash / python
Понимание работы реляционных / NoSQL баз данных, опыт написания SQL-запросов
Опыт работы с платформой виртуализации (VMware), оркестрации (Kubernetes / OpenShift)
Понимание работы и опыт настройки инфраструктурных сервисов: DNS, DHCP, балансировки нагрузки, мониторинга, резервного копирования
Знание и опыт использования инструментов автоматизации CI/CD: Jenkins / Gitlab CI и др.
Навыки работы с системами управления конфигурацией Ansible и др.
Навыки администрирования как минимум нескольких решений из списка: - ElasticSearch, Kibana, Logstash / FluentD / Filebeat; - Zabbix / Prometheus, Grafana; - Nginx, HAProxy; - RabbitMQ, Kafka; - HashiCorp Vault, Consul
Понимание методологий гибкой разработки ПО (Agile, Scrum, Kanban)