Pracuj.pl Praca zdalna Mid

Google Cloud AI Platform Engineer

IN4GE sp. z o.o.

⚲ Warszawa

200–260 zł netto (+ VAT) / godz.

Wymagania

  • Docker
  • Kubernetes
  • Python
  • Terraform
  • Triton
  • KServe
  • Vertex AI
  • Kubeflow
  • MLflow
  • LangChain

Opis stanowiska

Nasze wymagania:
Poparte doświadczeniem kompetencje w budowaniu systemów infrastrukturalnych dedykowanych dla AI, Machine Learningu lub projektów GenAI.
Praktyczna znajomość narzędzi do serwowania modeli na skalę produkcyjną (Triton, KServe lub pokrewne).
Doświadczenie w obszarze MLOps z wykorzystaniem platform takich jak Vertex AI, Kubeflow lub MLflow.
Znajomość ekosystemu LLM i frameworków integracyjnych (np. LangChain) oraz doświadczenie w pracy z bazami wektorowymi.
Bardzo dobra znajomość kontenerów (Docker) oraz orkiestracji w środowisku Kubernetes.
Biegłość w programowaniu w języku Python oraz zarządzaniu infrastrukturą przez Terraform.
Samodzielność, innowacyjne podejście do technologii i ukierunkowanie na optymalizację wydajnościową systemów AI.

O projekcie:
Dla naszego klienta, firmy realizującej pionierskie projekty w obszarze sztucznej inteligencji, poszukujemy doświadczonej osoby do roli AI / GenAI Platform Engineer.
Osoba zaangażowana w ten projekt będzie odpowiedzialna za budowanie i rozwój nowoczesnych platform dedykowanych AI/GenAI. Do kluczowych zadań należeć będzie produkcyjne wdrażanie modeli, skalowanie infrastruktury, automatyzacja procesów w duchu MLOps/LLMOps oraz integracja zaawansowanych rozwiązań sztucznej inteligencji z systemami biznesowymi.
Stack technologiczny projektu:
• Platforma AI & MLOps: Vertex AI, Kubeflow, MLflow
• Frameworki & Serwowanie modeli: LangChain, Triton Inference Server, KServe
• Bazy wektorowe: Vertex AI Vector Search, Pinecone
• Infrastruktura & Narzędzia: Terraform, Python, Docker, Kubernetes (K8s)

Zakres obowiązków:
Projektowanie, budowanie i utrzymanie skalowalnych platform oraz infrastruktury pod rozwiązania AI oraz Generative AI.
Produkcyjne wdrażanie (deployment) i serwowanie modeli uczenia maszynowego oraz dużych modeli językowych (LLM).
Automatyzacja cyklu życia modeli poprzez wdrażanie i rozwijanie praktyk MLOps oraz LLMOps.
Architektura i optymalizacja systemów wyszukiwania opartych na bazach wektorowych (Vector Databases).
Konteneryzacja rozwiązań oraz orkiestracja mikroserwisów AI w celu zapewnienia wysokiej wydajności i niskich opóźnień.
Zarządzanie infrastrukturą jako kod (IaC) dla komponentów chmurowych AI.

Oferujemy:
Wynagrodzenie: Stawkę godzinową na poziomie 200 - 260 PLN netto + VAT na kontrakcie B2B (ostateczna oferta uzależniona od poziomu kompetencji).
Model działań: W pełni zdalny projekt z elastycznymi godzinami zaangażowania.
Rozwój: Udział w przełomowym, zaawansowanym technologicznie projekcie GenAI, pozwalającym na pracę z najnowszymi trendami rynkowymi.
Stabilność: Długofalowa współpraca i jasne, partnerskie warunki kontraktowe.

🔍 Dekoder Ogłoszenia

🟡
Poparte doświadczeniem kompetencje w budowaniu systemów infrastrukturalnych dedykowanych dla AI, Machine Learningu lub projektów GenAI.
Oczekuje się, że kandydat będzie miał udokumentowane sukcesy w tworzeniu infrastruktury dla projektów AI, a nie tylko teoretyczną wiedzę.
🔴
Praktyczna znajomość narzędzi do serwowania modeli na skalę produkcyjną (Triton, KServe lub pokrewne).
Nie wystarczy znać te narzędzia teoretycznie, trzeba umieć je wdrożyć i utrzymać w środowisku produkcyjnym.
🟡
Doświadczenie w obszarze MLOps z wykorzystaniem platform takich jak Vertex AI, Kubeflow lub MLflow.
Poszukują kogoś, kto faktycznie pracował z tymi narzędziami w kontekście automatyzacji i zarządzania cyklem życia modeli ML.
🟡
Znajomość ekosystemu LLM i frameworków integracyjnych (np. LangChain) oraz doświadczenie w pracy z bazami wektorowymi.
Oczekuje się praktycznego zastosowania tych technologii w budowaniu rozwiązań opartych o duże modele językowe.
🟡
Samodzielność, innowacyjne podejście do technologii i ukierunkowanie na optymalizację wydajnościową systemów AI.
Oczekuje się proaktywności, inicjatywy w znajdowaniu lepszych rozwiązań i realnego wpływu na poprawę działania systemów.