Pracuj.pl Praca zdalna Mid

LLM / AI Engineer

NUMLABS sp. z o.o.

⚲ Kraków, Zwierzyniec

120–160 zł netto (+ VAT) / godz.

Wymagania

  • Python
  • Linux
  • Bash
  • LangChain
  • LangGraph
  • CrewAI
  • Langfuse
  • RAGAS
  • Arize
  • Qdrant
  • Weaviate
  • pgvector
  • Google Cloud Platform
  • Vertex AI Studio
  • Matching Engine
  • Gemini API
  • Docker
  • Kubernetes
  • Terraform

Opis stanowiska

Nasze wymagania:
Min. 2 lata komercyjnego doświadczenia z LLM — prompt engineering, fine-tuning, ewaluacja
Solidna znajomość Pythona — piszesz testowalny, czytelny kod, nie tylko skrypty
Praktyczne doświadczenie z RAG — wiesz co to dense i sparse retrieval i kiedy co wybrać
Znajomość frameworków agentowych (LangChain, LangGraph, CrewAI lub podobnych)
Doświadczenie z narzędziami do ewaluacji i obserwowaln ości LLM (Langfuse, RAGAS, Arize lub inne)
Doświadczenie z vector databases — Qdrant, Weaviate, pgvector lub podobnymi
Pewna praca w środowisku Linux — bash, SSH, praca na zdalnych maszynach
Biegła znajomość języka polskiego i angielskiego (komunikacja z zespołem i dokumentacja)

Mile widziane:
Znajomość Google Cloud i ekosystemu Vertex AI (Vertex AI Studio, Matching Engine, Gemini API)
Doświadczenie z Azure AI / Azure OpenAI Service i integracją z innymi usługami Azure
Rozumienie koncepcji MLOps — CI/CD dla modeli, wersjonowanie, rejestry artefaktów
Znajomość konteneryzacji (Docker, Kubernetes) i podstaw IaC (Terraform)

O projekcie:
Budujemy systemy agentowe, które naprawdę działają na produkcji
Szukamy inżyniera, który nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne. Będziesz projektować i budować pipelines RAG, systemy agentowe oraz dbać o ich jakość i stabilność w czasie. Pracujemy głównie na Linuksie, piszemy porządny Python i monitorujemy każdy token.
Stack, z którym pracujemy
Python 3.11+, LangChain / LangGraph,OpenAI API, Langfuse, RAGAS, Vertex AI, Azure OpenAI, Qdrant, Docker, Linux / Ubuntu, Git, FastAPI

Zakres obowiązków:
Projektowanie i implementacja systemów agentowych opartych na LLM (multi-agent, tool-use, memory)
Budowanie i optymalizacja pipeline’ów RAG — chunking, embedding, re-ranking, hybrid search
Ewaluacja i monitorowanie jakości systemów AI przy użyciu narzędzi takich jak Langfuse i RAGAS
Codzienna praca w środowisku Linux — skrypty, automatyzacja, debugowanie na serwerach
Utrzymanie stabilności i obserwowaln ości modeli na produkcji (logi, traces, alerty)
Ścisła współpraca z product ownerem i innymi inżynierami — po polsku i angielsku

Oferujemy:
Roczny budżet na kursy i szkolenia.
Elastyczne środowisko pracy - 100% zdalnie lub hybrydowo.
Karta Multisport.
Solidne wsparcie merytoryczne i praktyczne – jesteśmy oddani ciągłemu uczeniu się.
Pracę w szybko rozwijającej się branży związanej z AI, ML i Data Science.

🔍 Dekoder Ogłoszenia

🔴
nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne
Oczekuje się, że kandydat będzie zajmował się wszystkimi etapami cyklu życia modelu, w tym potencjalnie żmudnymi i mniej ekscytującymi zadaniami związanymi z przygotowaniem danych i debugowaniem.
🟡
piszesz testowalny, czytelny kod, nie tylko skrypty
Oczekuje się, że kod będzie zgodny z dobrymi praktykami inżynierskimi, a nie tylko szybkim rozwiązaniem problemu.
🔴
monitorujemy każdy token
Oznacza to bardzo szczegółowe śledzenie i analizę działania modeli, co może wiązać się z dużą ilością danych do analizy i potencjalnie skomplikowanym procesem monitorowania.
🟡
Solidna znajomość Pythona
Wymaga się nie tylko podstawowej znajomości języka, ale głębokiego zrozumienia jego możliwości i dobrych praktyk programistycznych.
🟡
Pewna praca w środowisku Linux
Oczekuje się samodzielności i biegłości w obsłudze systemu operacyjnego Linux, w tym w rozwiązywaniu problemów.