Text copied to clipboard!

Název

Text copied to clipboard!

Inženýr spolehlivosti provozu

Popis

Text copied to clipboard!
Hledáme Inženýra spolehlivosti provozu, který bude klíčovým členem našeho týmu zodpovědným za zajištění vysoké dostupnosti, škálovatelnosti a spolehlivosti našich IT systémů a služeb. Vaším úkolem bude navrhovat, implementovat a udržovat infrastrukturu, která podporuje nepřetržitý provoz a minimalizuje výpadky. Budete spolupracovat s vývojáři, provozními týmy a dalšími zainteresovanými stranami na automatizaci procesů, monitorování systémů a řešení incidentů. Dále budete analyzovat výkon systémů a navrhovat zlepšení, která povedou ke zvýšení efektivity a bezpečnosti. Požadujeme hluboké znalosti cloudových technologií, kontejnerizace, CI/CD pipeline a zkušenosti s programováním skriptů. Pokud máte vášeň pro optimalizaci IT prostředí a chcete přispět k bezproblémovému fungování kritických služeb, rádi vás přivítáme v našem týmu.

Odpovědnosti

Text copied to clipboard!
  • Navrhovat a implementovat spolehlivé IT infrastruktury.
  • Monitorovat výkon a dostupnost systémů.
  • Automatizovat nasazení a správu aplikací.
  • Řešit incidenty a analyzovat jejich příčiny.
  • Spolupracovat s vývojovými a provozními týmy.
  • Zajišťovat bezpečnost a zálohování dat.
  • Optimalizovat škálovatelnost systémů.
  • Vytvářet a udržovat dokumentaci.
  • Provádět testování obnovy po havárii.
  • Sledovat trendy v oblasti SRE a navrhovat inovace.

Požadavky

Text copied to clipboard!
  • Zkušenosti s cloudovými platformami (AWS, Azure, GCP).
  • Znalost kontejnerových technologií (Docker, Kubernetes).
  • Schopnost psát skripty (Python, Bash, Go).
  • Zkušenosti s monitorovacími nástroji (Prometheus, Grafana).
  • Pochopení CI/CD procesů a nástrojů.
  • Znalost sítí a bezpečnostních principů.
  • Schopnost analyzovat a řešit komplexní problémy.
  • Dobré komunikační a týmové dovednosti.
  • Znalost databází a jejich správy.
  • Zkušenosti s automatizací infrastruktury (Terraform, Ansible).

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké máte zkušenosti s cloudovými platformami?
  • Jak byste řešil výpadek kritické služby?
  • Popište svůj přístup k automatizaci nasazení aplikací.
  • Jak monitorujete a analyzujete výkon systémů?
  • Jaké nástroje používáte pro správu kontejnerů?
  • Jak zajišťujete bezpečnost a zálohování dat?
  • Jaké máte zkušenosti s CI/CD pipeline?
  • Jak byste vysvětlil pojem škálovatelnost?
  • Jak řešíte komunikaci mezi týmy při incidentu?
  • Jak sledujete nové trendy v oblasti SRE?