Text copied to clipboard!

Naslov

Text copied to clipboard!

Inženir za zanesljivost sistema (SRE)

Opis

Text copied to clipboard!
Iščemo inženirja za zanesljivost sistema (SRE), ki bo odgovoren za zagotavljanje visoke razpoložljivosti, zanesljivosti in učinkovitosti naših IT sistemov. Vaša naloga bo spremljanje, vzdrževanje in izboljševanje infrastrukture ter avtomatizacija procesov za podporo skalabilnim in robustnim storitvam. Sodelovali boste z razvojnimi ekipami za optimizacijo delovanja aplikacij in reševanje težav v produkcijskem okolju. Pričakujemo, da boste uporabljali najboljše prakse za upravljanje incidentov, izvajali analize vzrokov in predlagali izboljšave za preprečevanje ponavljajočih se težav. Vaše delo bo ključno za zagotavljanje nemotenega delovanja sistemov, ki podpirajo poslovne cilje podjetja. Iščemo nekoga z močnim tehničnim znanjem, izkušnjami z avtomatizacijo in strastjo do reševanja kompleksnih problemov v dinamičnem okolju.

Odgovornosti

Text copied to clipboard!
  • Vzdrževanje in nadzorovanje produkcijskih sistemov za zagotavljanje visoke razpoložljivosti.
  • Avtomatizacija rutinskih opravil in procesov za izboljšanje učinkovitosti.
  • Sodelovanje z razvojnimi ekipami pri načrtovanju in implementaciji novih funkcionalnosti.
  • Upravljanje incidentov in hitro reševanje težav v produkcijskem okolju.
  • Izvajanje analiz vzrokov za preprečevanje ponavljajočih se napak.
  • Razvijanje in vzdrževanje orodij za spremljanje in opozarjanje na težave.
  • Optimizacija zmogljivosti sistemov in aplikacij.
  • Dokumentiranje postopkov in najboljših praks.
  • Izobraževanje in podpora drugim članom ekipe.
  • Spremljanje trendov in uvajanje novih tehnologij za izboljšave.

Zahteve

Text copied to clipboard!
  • Izkušnje z upravljanjem in vzdrževanjem velikih IT sistemov.
  • Znanje programskih jezikov, kot so Python, Go ali Ruby.
  • Izkušnje z avtomatizacijo in orodji za konfiguracijsko upravljanje (npr. Ansible, Puppet).
  • Poznavanje sistemov za spremljanje in opozarjanje (npr. Prometheus, Grafana).
  • Razumevanje omrežnih protokolov in varnostnih praks.
  • Sposobnost hitrega reševanja težav in dela pod pritiskom.
  • Izkušnje z oblakom in virtualizacijo (AWS, Azure, GCP).
  • Dobre komunikacijske in sodelovalne veščine.
  • Sposobnost dokumentiranja in standardizacije procesov.
  • Natančnost in proaktivnost pri delu.

Možna vprašanja na razgovoru

Text copied to clipboard!
  • Kako bi pristopili k reševanju ponavljajočih se incidentov v produkciji?
  • Katere avtomatizacijske tehnologije ste uporabljali in zakaj?
  • Kako spremljate in merite zanesljivost sistema?
  • Kako sodelujete z razvojnimi ekipami pri izboljšavah?
  • Kaj je vaš pristop k upravljanju incidentov?
  • Kako ostajate na tekočem z novimi tehnologijami v SRE področju?
  • Kako bi optimizirali delovanje obstoječega sistema?
  • Kakšne izkušnje imate z oblačnimi platformami?
  • Kako dokumentirate in delite znanje v ekipi?
  • Kako bi opisali svojo vlogo pri zagotavljanju varnosti sistemov?