Text copied to clipboard!
Název
Text copied to clipboard!Inženýr spolehlivosti webu SRE
Popis
Text copied to clipboard!
Hledáme inženýra spolehlivosti webu, který se připojí k našemu týmu a pomůže nám zajistit stabilitu, škálovatelnost a vysokou dostupnost našich webových aplikací a služeb. Tento odborník bude úzce spolupracovat s vývojáři, provozními týmy a dalšími technickými specialisty na navrhování, implementaci a správě systémů, které podporují naše klíčové produkty a služby.
Vaší hlavní odpovědností bude udržovat provozuschopnost systémů, automatizovat procesy, monitorovat výkon a reagovat na incidenty. Budete se podílet na vývoji nástrojů a skriptů pro zajištění efektivního provozu a budete hrát klíčovou roli při zavádění osvědčených postupů v oblasti DevOps a Site Reliability Engineering (SRE).
Ideální kandidát má silné technické znalosti v oblasti správy systémů, cloudových technologií, skriptování a monitorovacích nástrojů. Měl by být schopen rychle identifikovat a řešit problémy, navrhovat preventivní opatření a přispívat k neustálému zlepšování infrastruktury.
Tato pozice je ideální pro někoho, kdo má vášeň pro automatizaci, optimalizaci a zajištění bezproblémového chodu rozsáhlých systémů. Pokud hledáte výzvu v dynamickém prostředí a chcete mít přímý dopad na kvalitu a dostupnost služeb, které používají miliony uživatelů, pak je tato role právě pro vás.
Odpovědnosti
Text copied to clipboard!- Monitorování a zajištění dostupnosti webových služeb
- Automatizace opakujících se úloh a procesů
- Řešení incidentů a analýza příčin výpadků
- Spolupráce s vývojáři na zlepšení spolehlivosti aplikací
- Návrh a implementace škálovatelných systémů
- Zavádění a správa monitorovacích a alertovacích nástrojů
- Zajištění bezpečnosti a souladu s předpisy
- Vytváření a údržba dokumentace infrastruktury
- Podpora CI/CD procesů
- Zlepšování výkonu a optimalizace systémů
Požadavky
Text copied to clipboard!- Zkušenosti s Linux/Unix systémy
- Znalost cloudových platforem (např. AWS, GCP, Azure)
- Zkušenosti s nástroji jako Prometheus, Grafana, ELK stack
- Schopnost skriptovat v jazycích jako Bash, Python nebo Go
- Znalost kontejnerizace (Docker, Kubernetes)
- Zkušenosti s CI/CD nástroji (např. Jenkins, GitLab CI)
- Schopnost analyzovat a řešit problémy v produkčním prostředí
- Znalost principů DevOps a SRE
- Dobré komunikační schopnosti a týmová spolupráce
- Angličtina na technické úrovni
Potenciální otázky na pohovor
Text copied to clipboard!- Jaké máte zkušenosti s monitorováním a alertováním systémů?
- Jak byste řešil(a) výpadek produkční služby?
- Jaké nástroje používáte pro automatizaci?
- Jaké cloudové platformy jste používal(a) a v jakém rozsahu?
- Jaké jsou vaše zkušenosti s Kubernetes?
- Jak přistupujete k zajištění vysoké dostupnosti systémů?
- Jaké metriky považujete za klíčové pro sledování výkonu?
- Jaké skriptovací jazyky ovládáte a jak je používáte?
- Jaké máte zkušenosti s CI/CD procesy?
- Jak byste zlepšil(a) spolehlivost existující aplikace?