Text copied to clipboard!

Název

Text copied to clipboard!

Inženýr spolehlivosti webových služeb

Popis

Text copied to clipboard!
Hledáme Inženýra spolehlivosti webových služeb, který bude zodpovědný za udržování vysoké dostupnosti, škálovatelnosti a výkonu našich webových aplikací a služeb. Vaším úkolem bude navrhovat, implementovat a spravovat systémy, které zajistí stabilní provoz a rychlou odezvu našich služeb. Budete spolupracovat s vývojovými týmy na optimalizaci infrastruktury, monitorování systémů a řešení incidentů. Dále budete analyzovat provozní data a navrhovat zlepšení, která zvýší efektivitu a spolehlivost našich služeb. Požadujeme hluboké znalosti cloudových technologií, automatizace, skriptování a zkušenosti s nástroji pro monitorování a správu systémů. Pokud máte vášeň pro technologie a chcete přispět k bezproblémovému chodu webových služeb, rádi vás přivítáme v našem týmu.

Odpovědnosti

Text copied to clipboard!
  • Navrhovat a implementovat spolehlivé a škálovatelné systémy.
  • Monitorovat výkon a dostupnost webových služeb.
  • Řešit incidenty a provádět root cause analýzy.
  • Automatizovat nasazení a správu infrastruktury.
  • Spolupracovat s vývojovými týmy na optimalizaci aplikací.
  • Analyzovat provozní data a navrhovat zlepšení.
  • Zajišťovat bezpečnost a dodržování standardů.
  • Vytvářet a udržovat dokumentaci systémů.
  • Provádět testování odolnosti a zotavení po havárii.
  • Školit ostatní členy týmu v oblasti spolehlivosti.

Požadavky

Text copied to clipboard!
  • Zkušenosti s cloudovými platformami (AWS, Azure, GCP).
  • Znalost kontejnerizace a orchestrace (Docker, Kubernetes).
  • Schopnost psát skripty (Python, Bash, atd.).
  • Zkušenosti s monitorovacími nástroji (Prometheus, Grafana).
  • Znalost CI/CD procesů a nástrojů.
  • Schopnost analyzovat a řešit komplexní problémy.
  • Znalost sítí a bezpečnostních principů.
  • Dobré komunikační a týmové dovednosti.
  • Zkušenosti s databázemi a jejich správou.
  • Schopnost pracovat v agilním prostředí.

Potenciální otázky na pohovor

Text copied to clipboard!
  • Jaké máte zkušenosti s cloudovými platformami?
  • Jak byste řešil výpadek kritické služby?
  • Jaké nástroje používáte pro monitorování systémů?
  • Popište zkušenost s automatizací nasazení.
  • Jak přistupujete k optimalizaci výkonu aplikací?
  • Jaké máte zkušenosti s kontejnerizací?
  • Jak řešíte bezpečnostní incidenty?
  • Jaké metriky považujete za klíčové pro spolehlivost služeb?
  • Jak byste školil nový tým v oblasti SRE?
  • Jaké jsou vaše zkušenosti s CI/CD procesy?