Text copied to clipboard!
Název
Text copied to clipboard!Inženýr spolehlivosti webových služeb
Popis
Text copied to clipboard!
Hledáme Inženýra spolehlivosti webových služeb, který bude zodpovědný za udržování vysoké dostupnosti, škálovatelnosti a výkonu našich webových aplikací a služeb. Vaším úkolem bude navrhovat, implementovat a spravovat systémy, které zajistí stabilní provoz a rychlou odezvu našich služeb. Budete spolupracovat s vývojovými týmy na optimalizaci infrastruktury, monitorování systémů a řešení incidentů. Dále budete analyzovat provozní data a navrhovat zlepšení, která zvýší efektivitu a spolehlivost našich služeb. Požadujeme hluboké znalosti cloudových technologií, automatizace, skriptování a zkušenosti s nástroji pro monitorování a správu systémů. Pokud máte vášeň pro technologie a chcete přispět k bezproblémovému chodu webových služeb, rádi vás přivítáme v našem týmu.
Odpovědnosti
Text copied to clipboard!- Navrhovat a implementovat spolehlivé a škálovatelné systémy.
- Monitorovat výkon a dostupnost webových služeb.
- Řešit incidenty a provádět root cause analýzy.
- Automatizovat nasazení a správu infrastruktury.
- Spolupracovat s vývojovými týmy na optimalizaci aplikací.
- Analyzovat provozní data a navrhovat zlepšení.
- Zajišťovat bezpečnost a dodržování standardů.
- Vytvářet a udržovat dokumentaci systémů.
- Provádět testování odolnosti a zotavení po havárii.
- Školit ostatní členy týmu v oblasti spolehlivosti.
Požadavky
Text copied to clipboard!- Zkušenosti s cloudovými platformami (AWS, Azure, GCP).
- Znalost kontejnerizace a orchestrace (Docker, Kubernetes).
- Schopnost psát skripty (Python, Bash, atd.).
- Zkušenosti s monitorovacími nástroji (Prometheus, Grafana).
- Znalost CI/CD procesů a nástrojů.
- Schopnost analyzovat a řešit komplexní problémy.
- Znalost sítí a bezpečnostních principů.
- Dobré komunikační a týmové dovednosti.
- Zkušenosti s databázemi a jejich správou.
- Schopnost pracovat v agilním prostředí.
Potenciální otázky na pohovor
Text copied to clipboard!- Jaké máte zkušenosti s cloudovými platformami?
- Jak byste řešil výpadek kritické služby?
- Jaké nástroje používáte pro monitorování systémů?
- Popište zkušenost s automatizací nasazení.
- Jak přistupujete k optimalizaci výkonu aplikací?
- Jaké máte zkušenosti s kontejnerizací?
- Jak řešíte bezpečnostní incidenty?
- Jaké metriky považujete za klíčové pro spolehlivost služeb?
- Jak byste školil nový tým v oblasti SRE?
- Jaké jsou vaše zkušenosti s CI/CD procesy?