Text copied to clipboard!

Название

Text copied to clipboard!

Инженер по надежности сайтов (SRE)

Описание

Text copied to clipboard!

Мы ищем инженера по надежности сайтов (SRE), который будет отвечать за поддержание высокой доступности, производительности и надежности наших веб-приложений и сервисов. Ваша задача — разработка и внедрение автоматизированных решений для мониторинга, предупреждения и устранения сбоев, а также оптимизация инфраструктуры для обеспечения бесперебойной работы систем. Вы будете тесно сотрудничать с командами разработки и эксплуатации, чтобы выявлять узкие места, анализировать инциденты и внедрять лучшие практики надежности. Важной частью работы является создание и поддержка систем резервного копирования, аварийного восстановления и масштабирования. Мы ценим инициативность, аналитический подход и умение работать в динамичной среде, где качество и стабильность сервисов имеют первостепенное значение.

Обязанности

Text copied to clipboard!

Разработка и поддержка систем мониторинга и алертинга.
Анализ инцидентов и проведение постмортемов для предотвращения повторных сбоев.
Оптимизация производительности и масштабируемости сервисов.
Автоматизация процессов развертывания и управления инфраструктурой.
Внедрение практик DevOps и CI/CD для повышения эффективности работы.
Обеспечение безопасности и соответствия стандартам надежности.
Сотрудничество с командами разработки для улучшения качества кода и архитектуры.
Поддержка и развитие систем резервного копирования и аварийного восстановления.
Документирование процессов и создание обучающих материалов.
Участие в планировании и реализации проектов по улучшению инфраструктуры.