Google Cloud AI Platform Engineer
⚲ Warszawa
200–260 zł netto (+ VAT) / godz.
Wymagania
- Docker
- Kubernetes
- Python
- Terraform
- Triton
- KServe
- Vertex AI
- Kubeflow
- MLflow
- LangChain
Opis stanowiska
Nasze wymagania:
Poparte doświadczeniem kompetencje w budowaniu systemów infrastrukturalnych dedykowanych dla AI, Machine Learningu lub projektów GenAI.
Praktyczna znajomość narzędzi do serwowania modeli na skalę produkcyjną (Triton, KServe lub pokrewne).
Doświadczenie w obszarze MLOps z wykorzystaniem platform takich jak Vertex AI, Kubeflow lub MLflow.
Znajomość ekosystemu LLM i frameworków integracyjnych (np. LangChain) oraz doświadczenie w pracy z bazami wektorowymi.
Bardzo dobra znajomość kontenerów (Docker) oraz orkiestracji w środowisku Kubernetes.
Biegłość w programowaniu w języku Python oraz zarządzaniu infrastrukturą przez Terraform.
Samodzielność, innowacyjne podejście do technologii i ukierunkowanie na optymalizację wydajnościową systemów AI.
O projekcie:
Dla naszego klienta, firmy realizującej pionierskie projekty w obszarze sztucznej inteligencji, poszukujemy doświadczonej osoby do roli AI / GenAI Platform Engineer.
Osoba zaangażowana w ten projekt będzie odpowiedzialna za budowanie i rozwój nowoczesnych platform dedykowanych AI/GenAI. Do kluczowych zadań należeć będzie produkcyjne wdrażanie modeli, skalowanie infrastruktury, automatyzacja procesów w duchu MLOps/LLMOps oraz integracja zaawansowanych rozwiązań sztucznej inteligencji z systemami biznesowymi.
Stack technologiczny projektu:
• Platforma AI & MLOps: Vertex AI, Kubeflow, MLflow
• Frameworki & Serwowanie modeli: LangChain, Triton Inference Server, KServe
• Bazy wektorowe: Vertex AI Vector Search, Pinecone
• Infrastruktura & Narzędzia: Terraform, Python, Docker, Kubernetes (K8s)
Zakres obowiązków:
Projektowanie, budowanie i utrzymanie skalowalnych platform oraz infrastruktury pod rozwiązania AI oraz Generative AI.
Produkcyjne wdrażanie (deployment) i serwowanie modeli uczenia maszynowego oraz dużych modeli językowych (LLM).
Automatyzacja cyklu życia modeli poprzez wdrażanie i rozwijanie praktyk MLOps oraz LLMOps.
Architektura i optymalizacja systemów wyszukiwania opartych na bazach wektorowych (Vector Databases).
Konteneryzacja rozwiązań oraz orkiestracja mikroserwisów AI w celu zapewnienia wysokiej wydajności i niskich opóźnień.
Zarządzanie infrastrukturą jako kod (IaC) dla komponentów chmurowych AI.
Oferujemy:
Wynagrodzenie: Stawkę godzinową na poziomie 200 - 260 PLN netto + VAT na kontrakcie B2B (ostateczna oferta uzależniona od poziomu kompetencji).
Model działań: W pełni zdalny projekt z elastycznymi godzinami zaangażowania.
Rozwój: Udział w przełomowym, zaawansowanym technologicznie projekcie GenAI, pozwalającym na pracę z najnowszymi trendami rynkowymi.
Stabilność: Długofalowa współpraca i jasne, partnerskie warunki kontraktowe.
Poparte doświadczeniem kompetencje w budowaniu systemów infrastrukturalnych dedykowanych dla AI, Machine Learningu lub projektów GenAI.
Praktyczna znajomość narzędzi do serwowania modeli na skalę produkcyjną (Triton, KServe lub pokrewne).
Doświadczenie w obszarze MLOps z wykorzystaniem platform takich jak Vertex AI, Kubeflow lub MLflow.
Znajomość ekosystemu LLM i frameworków integracyjnych (np. LangChain) oraz doświadczenie w pracy z bazami wektorowymi.
Bardzo dobra znajomość kontenerów (Docker) oraz orkiestracji w środowisku Kubernetes.
Biegłość w programowaniu w języku Python oraz zarządzaniu infrastrukturą przez Terraform.
Samodzielność, innowacyjne podejście do technologii i ukierunkowanie na optymalizację wydajnościową systemów AI.
O projekcie:
Dla naszego klienta, firmy realizującej pionierskie projekty w obszarze sztucznej inteligencji, poszukujemy doświadczonej osoby do roli AI / GenAI Platform Engineer.
Osoba zaangażowana w ten projekt będzie odpowiedzialna za budowanie i rozwój nowoczesnych platform dedykowanych AI/GenAI. Do kluczowych zadań należeć będzie produkcyjne wdrażanie modeli, skalowanie infrastruktury, automatyzacja procesów w duchu MLOps/LLMOps oraz integracja zaawansowanych rozwiązań sztucznej inteligencji z systemami biznesowymi.
Stack technologiczny projektu:
• Platforma AI & MLOps: Vertex AI, Kubeflow, MLflow
• Frameworki & Serwowanie modeli: LangChain, Triton Inference Server, KServe
• Bazy wektorowe: Vertex AI Vector Search, Pinecone
• Infrastruktura & Narzędzia: Terraform, Python, Docker, Kubernetes (K8s)
Zakres obowiązków:
Projektowanie, budowanie i utrzymanie skalowalnych platform oraz infrastruktury pod rozwiązania AI oraz Generative AI.
Produkcyjne wdrażanie (deployment) i serwowanie modeli uczenia maszynowego oraz dużych modeli językowych (LLM).
Automatyzacja cyklu życia modeli poprzez wdrażanie i rozwijanie praktyk MLOps oraz LLMOps.
Architektura i optymalizacja systemów wyszukiwania opartych na bazach wektorowych (Vector Databases).
Konteneryzacja rozwiązań oraz orkiestracja mikroserwisów AI w celu zapewnienia wysokiej wydajności i niskich opóźnień.
Zarządzanie infrastrukturą jako kod (IaC) dla komponentów chmurowych AI.
Oferujemy:
Wynagrodzenie: Stawkę godzinową na poziomie 200 - 260 PLN netto + VAT na kontrakcie B2B (ostateczna oferta uzależniona od poziomu kompetencji).
Model działań: W pełni zdalny projekt z elastycznymi godzinami zaangażowania.
Rozwój: Udział w przełomowym, zaawansowanym technologicznie projekcie GenAI, pozwalającym na pracę z najnowszymi trendami rynkowymi.
Stabilność: Długofalowa współpraca i jasne, partnerskie warunki kontraktowe.
🔍 Dekoder Ogłoszenia
🟡
Poparte doświadczeniem kompetencje w budowaniu systemów infrastrukturalnych dedykowanych dla AI, Machine Learningu lub projektów GenAI.
Oczekuje się, że kandydat będzie miał udokumentowane sukcesy w tworzeniu infrastruktury dla projektów AI, a nie tylko teoretyczną wiedzę.
🔴
Praktyczna znajomość narzędzi do serwowania modeli na skalę produkcyjną (Triton, KServe lub pokrewne).
Nie wystarczy znać te narzędzia teoretycznie, trzeba umieć je wdrożyć i utrzymać w środowisku produkcyjnym.
🟡
Doświadczenie w obszarze MLOps z wykorzystaniem platform takich jak Vertex AI, Kubeflow lub MLflow.
Poszukują kogoś, kto faktycznie pracował z tymi narzędziami w kontekście automatyzacji i zarządzania cyklem życia modeli ML.
🟡
Znajomość ekosystemu LLM i frameworków integracyjnych (np. LangChain) oraz doświadczenie w pracy z bazami wektorowymi.
Oczekuje się praktycznego zastosowania tych technologii w budowaniu rozwiązań opartych o duże modele językowe.
🟡
Samodzielność, innowacyjne podejście do technologii i ukierunkowanie na optymalizację wydajnościową systemów AI.
Oczekuje się proaktywności, inicjatywy w znajdowaniu lepszych rozwiązań i realnego wpływu na poprawę działania systemów.