Text copied to clipboard!
Titel
Text copied to clipboard!Webbplats Tillförlitlighetsingenjör
Beskrivning
Text copied to clipboard!
Vi söker en webbplatsens tillförlitlighetsingenjör som kommer att spela en nyckelroll i att säkerställa att våra webbapplikationer är tillgängliga, pålitliga och presterar på högsta nivå. Som en del av vårt teknikteam kommer du att arbeta nära utvecklare, drifttekniker och produktägare för att bygga och underhålla robusta system som kan hantera hög trafik och komplexa användningsfall.
I denna roll kommer du att ansvara för att övervaka systemens hälsa, identifiera flaskhalsar och implementera lösningar som förbättrar tillförlitligheten. Du kommer att använda verktyg för logghantering, övervakning och automatisering för att snabbt identifiera och åtgärda problem. Du kommer också att bidra till att utveckla och implementera bästa praxis för incidenthantering, kapacitetsplanering och systemdesign.
Vi letar efter någon med stark teknisk bakgrund inom systemadministration, nätverk och molninfrastruktur. Du bör ha erfarenhet av att arbeta med containerteknologier som Docker och Kubernetes, samt ha god förståelse för CI/CD-processer. Erfarenhet av programmering i språk som Python, Go eller Bash är också önskvärt.
Som webbplatsens tillförlitlighetsingenjör kommer du att vara en del av ett team som värdesätter samarbete, innovation och ständig förbättring. Du kommer att ha möjlighet att påverka hur vi bygger och skalar våra system, och bidra till att skapa en bättre upplevelse för våra användare.
Om du är passionerad för att bygga tillförlitliga system och vill arbeta i en dynamisk och tekniskt utmanande miljö, ser vi fram emot att höra från dig.
Ansvar
Text copied to clipboard!- Övervaka och förbättra webbplatsens tillgänglighet och prestanda
- Implementera och underhålla övervaknings- och larmverktyg
- Automatisera driftuppgifter och processer
- Delta i incidenthantering och rotorsaksanalyser
- Samarbeta med utvecklingsteam för att förbättra systemdesign
- Utföra kapacitetsplanering och prestandatester
- Utveckla och dokumentera bästa praxis för tillförlitlighet
- Delta i beredskapsschema för att hantera kritiska incidenter
- Analysera loggar och metrik för att identifiera problemområden
- Bidra till förbättring av CI/CD-pipelines
Krav
Text copied to clipboard!- Kandidatexamen i datavetenskap eller motsvarande erfarenhet
- Minst 3 års erfarenhet av systemadministration eller DevOps
- Erfarenhet av molnplattformar som AWS, Azure eller GCP
- Kunskap om containerteknologier som Docker och Kubernetes
- Färdighet i skriptspråk som Bash, Python eller Go
- Erfarenhet av övervakningsverktyg som Prometheus, Grafana eller Datadog
- Förståelse för nätverksprotokoll och säkerhetsprinciper
- Förmåga att felsöka komplexa systemproblem
- Erfarenhet av CI/CD-verktyg som Jenkins, GitLab CI eller CircleCI
- Starka kommunikations- och samarbetsförmågor
Potentiella intervjufrågor
Text copied to clipboard!- Vilka övervakningsverktyg har du erfarenhet av att använda?
- Hur hanterar du en kritisk incident på en produktionsmiljö?
- Beskriv en gång du förbättrade systemets tillförlitlighet.
- Vilka molnplattformar har du arbetat med?
- Hur arbetar du med utvecklingsteam för att förbättra systemdesign?
- Har du erfarenhet av att arbeta med Kubernetes i produktion?
- Hur säkerställer du att dina automatiseringar är tillförlitliga?
- Vilka metoder använder du för kapacitetsplanering?
- Hur hanterar du logghantering och analys?
- Vilka CI/CD-verktyg har du använt och hur har du konfigurerat dem?