Senior Software Engineer-MLOps & Observability
⚲ Warszawa
18 000 - 27 000 PLN netto (B2B) | 18 000 - 27 000 PLN brutto (UoP)
Wymagania
- Python
- API integrations
- Kubernetes
- English
- Distributed Systems Design
- Go
Opis stanowiska
Szukasz miejsca, w którym Twoja praca naprawdę ma znaczenie? W CloudFerro tworzymy technologie, z których na co dzień korzystają europejscy liderzy nauki i sektora kosmicznego - m.in. ESA, EUMETSAT, ECMWF, Mercator Ocean International, DLR czy EGI. Pracując blisko sektora Earth Observation możesz realnie wspierać analizy i lepsze zrozumienie naszej planety. Jeśli interesują Cię nowoczesne technologie, duże zbiory danych i środowisko, w którym możesz rozwijać swoje umiejętności i mieć wpływ - jesteśmy miejscem dla Ciebie. Więcej informacji: www.cloudferro.com Aktualnie poszukujemy osób, które chcą z nami współtworzyć od podstaw suwerenną europejską platformę chmurową, tworząc realną alternatywę dla globalnych hyperscalerów. Tworzymy kompletny stack PaaS oparty na Kubernetes i open source. Od serverless i baz danych w modelu managed, po MLOps, monitoring i observability. Dołączając do nas, stajesz się częścią zespołu, który projektuje fundamenty platformy, a nie rozwija gotowy produkt. Pracujemy w modelu pełnego ownershipu, gdzie każda decyzja architektoniczna zostaje z produktem na lata. To miejsce dla osób, które chcą realnie wpływać na kształt europejskiej chmury. Rola: W tej roli rozwijasz ofertę MLOps i Observability dla naszej platformy chmurowej. Odpowiadasz end‑to‑end za Kubeflow, Airflow, Jupyter Notebooks oraz platformę monitoringową. Od warstwy Kubernetes po API i dokumentację.Pracujesz w modelu you build it, you own it, definiując to, jak klienci trenują modele, budują pipeline’y danych i monitorują swoje aplikacje. To rola z realnym wpływem na kształt całej platformy ML. Do Twoich zadań należeć będzie: • Pełny ownership MLOps i Observability: odpowiedzialność za Kubeflow, Airflow, Jupyter Notebooks oraz Observability as a Service w modelu you build it, you own it. Od architektury i kodu po API, dokumentację i stabilność operacyjną. • Rozwój platformy monitoringowej: budowanie usług observability dla klientów na fundamencie przygotowanym przez Platform DevOps / SRE Engineerów. • End‑to‑end delivery: od operatora/integracji, przez API endpoint i komendę CLI, po Terraform resource i dokumentację. • Integracja z usługami wspólnymi: łączenie usług z IAM, billingiem i systemem quota rozwijanymi przez zespół Common Services. • Współtworzenie standardów technicznych. Wymagania: • Doświadczenie z Kubernetes: samodzielne budowanie lub operowanie złożonymi systemami działającymi na K8s. • Projektowanie systemów rozproszonych: praktyczna umiejętność tworzenia skalowalnych, niezawodnych usług. • Biegłość w Go oraz dobra znajomość Pythona: tworzenie operatorów, kontrolerów, API i narzędzi CLI. • Integracje i API: umiejętność budowania API wrapperów i integracji z frameworkami REST/gRPC. • AI‑assisted development: swobodne korzystanie z narzędzi takich jak Claude Code czy Copilot jako naturalnej części codziennej pracy. Mile widziane: • Doświadczenie z ML platformami: Kubeflow, JupyterHub, GPU scheduling na Kubernetes. • Znajomość Airflow lub innych narzędzi do orkiestracji workflowów. • Observability stack: Prometheus/Thanos, Grafana, Loki, OpenTelemetry. • Monitoring multi‑tenant: ekspozycja metryk i logów per klient. • Terraform providers: tworzenie custom resource’ów. • Doświadczenie u cloud providera: praca w środowisku usług chmurowych. • Kontrybucje open source: szczególnie w ekosystemie CNCF. Dlaczego warto do nas dołączyć: • Budowa platformy chmurowej: tworzysz od podstaw nowoczesny ekosystem, który wspiera europejski przemysł kosmiczny, badania klimatu i projekty naukowe o realnym znaczeniu. • Autonomiczny zespół: dołączasz do nowo formowanej grupy działającej jak startup, ale w ramach stabilnej, dużej organizacji z dostępem do zasobów, których małe firmy nie zapewniają. • Technologie CNCF na produkcji: pracujesz z Kubernetes, KNative, Cilium, ArgoCD, Kubeflow i innymi projektami open‑source, z możliwością kontrybuowania do nich. • Realny wpływ: masz głos w decyzjach architektonicznych i produktowych, a Twoje pomysły naprawdę kształtują kierunek rozwoju platformy. • AI‑native workflow: korzystamy z narzędzi takich jak Claude Code na co dzień, nie jako eksperyment, lecz jako integralny element pracy. • Autonomia i stabilność: oferujemy dużą swobodę w organizacji pracy, przejrzyste zasady współpracy oraz stabilne formy zatrudnienia z atrakcyjnym wynagrodzeniem. • Otrzymasz pakiet socjalny – opiekę medyczną, multisport, ubezpieczenie na życie. • Będziesz mieć możliwość korzystania z zajęć językowych.