Text copied to clipboard!

Název

Text copied to clipboard!

Inženýr spolehlivosti provozu (SRE)

Popis

Text copied to clipboard!
Hledáme Inženýra spolehlivosti provozu (SRE), který bude klíčovým členem našeho týmu zodpovědným za zajištění vysoké dostupnosti, škálovatelnosti a výkonu našich IT systémů a služeb. Vaším úkolem bude navrhovat, implementovat a udržovat automatizované řešení pro monitorování, správu incidentů a optimalizaci infrastruktury. Budete spolupracovat s vývojovými týmy na zlepšování procesů nasazení a zajištění bezproblémového provozu aplikací v produkčním prostředí. Dále budete analyzovat provozní data, identifikovat slabá místa a navrhovat opatření ke zvýšení spolehlivosti a bezpečnosti systémů. Požadujeme hluboké znalosti cloudových platforem, kontejnerizace, CI/CD pipeline a zkušenosti s programováním skriptů pro automatizaci. Pokud máte vášeň pro technologie a chcete přispět k bezproblémovému fungování kritických systémů, rádi vás přivítáme v našem týmu.

Odpovědnosti

Text copied to clipboard!
  • Navrhovat a implementovat spolehlivé IT systémy a služby.
  • Monitorovat výkon a dostupnost systémů.
  • Automatizovat provozní procesy a nasazení aplikací.
  • Řešit incidenty a analyzovat jejich příčiny.
  • Spolupracovat s vývojovými týmy na zlepšení infrastruktury.
  • Optimalizovat škálovatelnost a bezpečnost systémů.
  • Vytvářet a udržovat dokumentaci k provozním postupům.
  • Provádět pravidelné testy zotavení po havárii.
  • Sledovat trendy v oblasti SRE a navrhovat inovace.
  • Školit kolegy v oblasti spolehlivosti a automatizace.

Požadavky

Text copied to clipboard!
  • Zkušenosti s cloudovými platformami (AWS, Azure, GCP).
  • Znalost kontejnerizace (Docker, Kubernetes).
  • Schopnost programovat v jazycích jako Python, Go nebo Bash.
  • Zkušenosti s CI/CD nástroji (Jenkins, GitLab CI).
  • Znalost monitorovacích nástrojů (Prometheus, Grafana).
  • Schopnost analyzovat a řešit složité technické problémy.
  • Znalost sítí a bezpečnostních principů.
  • Schopnost pracovat v týmu a komunikovat efektivně.
  • Zkušenost s automatizací infrastruktury (Terraform, Ansible).
  • Vysoká míra samostatnosti a zodpovědnosti.

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké máte zkušenosti s cloudovými platformami?
  • Jak byste řešil výpadek kritické služby?
  • Popište svůj přístup k automatizaci nasazení aplikací.
  • Jak monitorujete a analyzujete výkon systémů?
  • Jaké nástroje používáte pro správu kontejnerů?
  • Jak byste zlepšil spolehlivost existující infrastruktury?
  • Jaké máte zkušenosti s řešením bezpečnostních incidentů?
  • Jakým způsobem dokumentujete provozní postupy?
  • Jaké jsou vaše zkušenosti s CI/CD pipeline?
  • Jak zvládáte práci pod tlakem během incidentů?