Text copied to clipboard!
Заглавие
Text copied to clipboard!Инженер по надеждност на сайта (SRE)
Описание
Text copied to clipboard!
Търсим Инженер по надеждност на сайта (SRE), който да се присъедини към нашия екип и да осигури висока надеждност, мащабируемост и ефективност на нашите системи и услуги. Като SRE ще работите в тясно сътрудничество с екипите по разработка и операции, за да автоматизирате процесите, да наблюдавате системите и да реагирате бързо на инциденти. Вашата роля е ключова за поддържане на стабилността и непрекъснатата работа на критичните инфраструктури, като същевременно оптимизирате производителността и намалявате риска от прекъсвания. Вие ще разработвате и внедрявате инструменти и практики за мониторинг, логване и аварийно възстановяване, както и ще участвате в планирането на капацитета и управлението на инциденти. Търсим човек с аналитично мислене, умения за програмиране и опит в облачни среди, който да допринесе за подобряване на надеждността и ефективността на нашите услуги.
Отговорности
Text copied to clipboard!- Проектиране, изграждане и поддръжка на надеждни системи и услуги.
- Автоматизиране на операции и процеси за подобряване на ефективността.
- Мониторинг и анализ на производителността на системите.
- Управление и реакция при инциденти и аварийни ситуации.
- Сътрудничество с екипи по разработка за подобряване на инфраструктурата.
- Планиране на капацитета и оптимизация на ресурсите.
- Разработване на инструменти за логване и наблюдение.
- Документиране на процеси и процедури за поддръжка.
- Обучение на екипи за най-добри практики в надеждността.
- Участие в ревюта на архитектура и код за подобряване на стабилността.
Изисквания
Text copied to clipboard!- Опит като инженер по надеждност на сайта или сходна роля.
- Добри познания по програмиране (Python, Go, Java и др.).
- Опит с облачни платформи като AWS, Azure или GCP.
- Знания по системна администрация и мрежови технологии.
- Умения за работа с инструменти за мониторинг и логване (Prometheus, Grafana, ELK).
- Опит с контейнери и оркестрация (Docker, Kubernetes).
- Разбиране на CI/CD процеси и инструменти.
- Аналитично мислене и умения за решаване на проблеми.
- Добри комуникационни умения и работа в екип.
- Способност за работа под напрежение и управление на инциденти.
Потенциални въпроси за интервю
Text copied to clipboard!- Какъв е вашият опит с автоматизация на операции?
- Кои инструменти за мониторинг сте използвали?
- Как бихте реагирали при сериозен инцидент в продукционна среда?
- Опишете опит с облачни платформи и услуги.
- Какви са вашите умения по програмиране и скриптиране?
- Как подхождате към оптимизацията на производителността на системите?
- Имате ли опит с контейнери и оркестрация?
- Как управлявате комуникацията в екипа при инциденти?
- Какви практики прилагате за осигуряване на надеждност?
- Как поддържате документацията и знанията в екипа?