Pracuj.pl Praca zdalna Mid

Site Reliability Engineer - IT Contracting

Michael Page

⚲ Warszawa

110–140 zł netto (+ VAT) / godz.

Opis stanowiska

Nasze wymagania: Masz 4+ lat doświadczenia operacyjnego na stanowiskach SysOps / DevOps / SRE. Silne podstawy sieciowe: DNS, TCP, HTTP, routing (BGP), cache, proxy. Pasjonujesz się tematami automatyzacji, obserwowalności i optymalizacji wydajności. Dobra znajomość środowisk monitoringu (Datadog, Grafana…). Bardzo dobra znajomość narzędzi DevOps (Terraform, Ansible, AWS Lambdas, pipeline'y GitLab CI/CD…). Unix/Linux nie mają przed Tobą tajemnic. Doświadczenie z technologiami CDN lub tematami QoS w streamingach OTT będzie dużym plusem. Biegła znajomość języka angielskiego (znajomość francuskiego będzie dodatkowym atutem). Mile widziane jest doświadczenie w branży mediowej Zakres obowiązków: Zapewnienie dostępności, odporności i wydajności wszystkich platform CDN (usługi chmurowe, serwery bare-metal, międzynarodowe sieci, punkty wymiany ruchu, cache hostowane przez ISP). Regularne przeglądanie pojemności CDN, trendów wydajności oraz prognoz użycia w celu wspierania globalnego wzrostu ruchu. Udział w wdrożeniach, rolloutach produkcyjnych oraz analizie wzorców konsumpcji OTT we wszystkich regionach. Monitorowanie i analizowanie kluczowych wskaźników wydajności (opóźnienia, przepustowość, efektywność cache, współczynniki błędów…) oraz ciągłe proponowanie optymalizacji poprawiających jakość usług i efektywność kosztową platform. Uczestnictwo w reakcjach na incydenty, analizie przyczyn źródłowych oraz planach poprawy niezawodności. Okazjonalne wsparcie zespołów DevOps w sytuacjach przeciążenia zadaniami operacyjnymi. Budowanie i utrzymywanie stosu narzędzi obserwowalności dla wszystkich platform CDN (logi, metryki, trace'y, alerty), obecnie opartego na Datadogu, z silnym naciskiem na skalowalność i standaryzację pomiędzy regionami i spółkami zależnymi. Projektowanie i utrzymywanie wielokrotnego użytku szablonów (dashboardy, reguły alertów, widoki SLO/SLA, potoki przetwarzania logów), aby zindustrializować proces obserwowalności i zapewnić spójne praktyki monitoringu dla wszystkich środowisk CDN (chmurowych i bare‑metal). Rozwijanie skalowalnych rozwiązań monitorujących, zdolnych obsługiwać duże wolumeny ruchu i danych, tak aby obserwowalność pozostawała niezawodna i opłacalna wraz ze wzrostem platformy. Implementacja zautomatyzowanych kontroli zdrowia systemu, wykrywania anomalii i workflowów alertowania wspierających operacje 24/7, ograniczających pracę manualną i powtarzalne zadania. Ciągłe ulepszanie procesów gromadzenia, korelacji i wizualizacji danych, aby zespoły inżynieryjne, operacyjne i biznesowe mogły szybko zrozumieć zachowanie platformy i doświadczenie użytkownika. Opracowywanie i dostosowywanie systemów operacyjnych, skryptów oraz workflowów automatyzacji (Python/Bash/wywołania API…) do zbierania metryk operacyjnych, wskaźników kosztowych i danych o wydajności na dużą skalę. Budowanie wewnętrznych narzędzi wykorzystywanych we wszystkich spółkach zależnych, takich jak: narzędzia do analizy logów, wizualizacja widowni i ruchu walidatory konfiguracji CDN, narzędzia diagnostyczne i do troubleshooting'u, testowanie cache Wspieranie industrializacji operacji poprzez Infrastructure as Code (Terraform), pipeline'y CI/CD oraz automatyczne rollouty konfiguracji. Ścisła współpraca z zespołami OTT engineering, DevOps, Network, Security, Data oraz jednostkami biznesowymi na całym świecie. Współtworzenie zasad zarządzania CDN, w tym definiowanie globalnych standardów dotyczących opóźnień (Latency), TTL, zasad cache'owania, obserwowalności, praktyk bezpieczeństwa i optymalizacji kosztów. Dzielenie się najlepszymi praktykami technicznymi z lokalnymi zespołami w wielu regionach (Afryka, Polska, Europa, Azja…). Tworzenie dokumentacji technicznej, wytycznych i materiałów onboardingowych. Współpraca z operatorami ISP, dostawcami chmury oraz zespołami wewnętrznymi w celu diagnozowania problemów dystrybucyjnych i zapewniania optymalnych ścieżek dostarczania treści. Wsparcie dużych wydarzeń generujących wysokie obciążenie (sport, treści na żywo, piki ruchu) poprzez przygotowanie, monitoring, reakcję i analizę po wydarzeniu. Oferujemy: Praca w 100% zdalna Umowa B2B via Michael Page Start: kwiecień/maj 2026