TheProtocol.IT Praca zdalna Senior New

Senior Site Reliability Engineer

CodeTalent Sp. z o.o.

⚲ Warszawa

32 000 - 39 400 zł netto (+ VAT)

Wymagania

Kubernetes
ArgoCD
GitLab CI
Prometheus
Grafana
ELK
Opsgenie
PagerDuty
Python
Go
Microsoft Azure (nice to have)
AWS (nice to have)
Google Cloud Platform (nice to have)
Terraform (nice to have)
CloudFormation (nice to have)

Opis stanowiska

Wymagania: - min. 5-6 lat doświadczenia w SRE, DevOps lub Platform Engineering - bardzo dobra znajomość Kubernetes (operational level, mile widziane doświadczenie z dużymi klastrami) - praktyczna znajomość jednej z chmur Azure/GCP/AWS (architektura, usługi, best practices) - doświadczenie z IaC: Terraform, CloudFormation lub podobne - znajomość GitOps (Argo CD) i umiejętność tworzenia helm chartów - doświadczenie w budowie i utrzymaniu CI/CD (GitLab CI) - biegłość w narzędziach monitoringu i incident management: Prometheus, Grafana, ELK, Opsgenie/PagerDuty - dobra znajomość koncepcji sieciowych, systemów operacyjnych, optymalizacji wydajności - umiejętność programowania (Python, Go) - znajomość ITIL w obszarze zarządzania incydentami i problemami - bardzo dobre umiejętności komunikacyjne i zdolność współpracy z klientami oraz zespołami technicznymi Mile widziane: - doświadczenie w projektowaniu systemów high‑availability i high‑scale - wiedza z zakresu matematyki, algorytmów i optymalizacji niskopoziomowej - prowadzenie małych zespołów lub koordynacja prac technicznych O firmie: - Jesteśmy technologicznym partnerem outsourcingowym w którym transparentność jest fundamentem, a nie dodatkiem. Wykorzystujemy autorskie narzędzia analityczne, by dostarczać przejrzyste modele współpracy i realnie skracać czas onboardingu ekspertów w projektach outsourcingowych. Odwróciliśmy tradycyjny model współpracy, stawiając na jasne zasady finansowe i bezpośredni kontakt, co czyni nas najbardziej przewidywalnym partnerem na rynku technologicznym. Zakres obowiązków: - projektowanie, rozwój i utrzymanie systemów monitoringu oraz observability (metrics, logs, tracing) - analiza incydentów, root cause analysis, prowadzenie post‑mortem i wdrażanie usprawnień - rozwój i utrzymanie narzędzi do alertowania, diagnostyki i automatyzacji operacji - monitorowanie i optymalizacja wydajności aplikacji oraz infrastruktury - rozwój infrastruktury wspierającej systemy produkcyjne (Kubernetes, IaC, CI/CD) - projektowanie i wdrażanie rozwiązań chmurowych dla systemów o dużej skali - współpraca z zespołami developerskimi i architektami w zakresie reliability, kosztów i bezpieczeństwa - doradztwo techniczne w obszarze chmury i automatyzacji, udział w projektowaniu nowych komponentów - rozwiązywanie złożonych problemów technicznych, których nie potrafią rozwiązać standardowe zespoły Oferujemy: - pełne zaangażowanie w projekt o dużej skali i wysokiej odpowiedzialności technicznej - praca zdalna lub hybrydowa - Warszawa Wola - elastyczne godziny 7-18.00 - współpraca B2B

2026-04-24 Aplikuj - przejdz do oferty ↗