Pracuj.pl Praca zdalna Mid

LLM / AI Engineer

NUMLABS sp. z o.o.

⚲ Kraków, Zwierzyniec

120–160 zł netto (+ VAT) / godz.

Wymagania

Python
Linux
Bash
LangChain
LangGraph
CrewAI
Langfuse
RAGAS
Arize
Qdrant
Weaviate
pgvector
Google Cloud Platform
Vertex AI Studio
Matching Engine
Gemini API
Docker
Kubernetes
Terraform

Opis stanowiska

Nasze wymagania:
Min. 2 lata komercyjnego doświadczenia z LLM — prompt engineering, fine-tuning, ewaluacja
Solidna znajomość Pythona — piszesz testowalny, czytelny kod, nie tylko skrypty
Praktyczne doświadczenie z RAG — wiesz co to dense i sparse retrieval i kiedy co wybrać
Znajomość frameworków agentowych (LangChain, LangGraph, CrewAI lub podobnych)
Doświadczenie z narzędziami do ewaluacji i obserwowaln ości LLM (Langfuse, RAGAS, Arize lub inne)
Doświadczenie z vector databases — Qdrant, Weaviate, pgvector lub podobnymi
Pewna praca w środowisku Linux — bash, SSH, praca na zdalnych maszynach
Biegła znajomość języka polskiego i angielskiego (komunikacja z zespołem i dokumentacja)

Mile widziane:
Znajomość Google Cloud i ekosystemu Vertex AI (Vertex AI Studio, Matching Engine, Gemini API)
Doświadczenie z Azure AI / Azure OpenAI Service i integracją z innymi usługami Azure
Rozumienie koncepcji MLOps — CI/CD dla modeli, wersjonowanie, rejestry artefaktów
Znajomość konteneryzacji (Docker, Kubernetes) i podstaw IaC (Terraform)

O projekcie:
Budujemy systemy agentowe, które naprawdę działają na produkcji
Szukamy inżyniera, który nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne. Będziesz projektować i budować pipelines RAG, systemy agentowe oraz dbać o ich jakość i stabilność w czasie. Pracujemy głównie na Linuksie, piszemy porządny Python i monitorujemy każdy token.
Stack, z którym pracujemy
Python 3.11+, LangChain / LangGraph,OpenAI API, Langfuse, RAGAS, Vertex AI, Azure OpenAI, Qdrant, Docker, Linux / Ubuntu, Git, FastAPI

Zakres obowiązków:
Projektowanie i implementacja systemów agentowych opartych na LLM (multi-agent, tool-use, memory)
Budowanie i optymalizacja pipeline’ów RAG — chunking, embedding, re-ranking, hybrid search
Ewaluacja i monitorowanie jakości systemów AI przy użyciu narzędzi takich jak Langfuse i RAGAS
Codzienna praca w środowisku Linux — skrypty, automatyzacja, debugowanie na serwerach
Utrzymanie stabilności i obserwowaln ości modeli na produkcji (logi, traces, alerty)
Ścisła współpraca z product ownerem i innymi inżynierami — po polsku i angielsku

Oferujemy:
Roczny budżet na kursy i szkolenia.
Elastyczne środowisko pracy - 100% zdalnie lub hybrydowo.
Karta Multisport.
Solidne wsparcie merytoryczne i praktyczne – jesteśmy oddani ciągłemu uczeniu się.
Pracę w szybko rozwijającej się branży związanej z AI, ML i Data Science.

🔍 Dekoder Ogłoszenia

🔴

nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne

Oczekuje się, że kandydat będzie zajmował się wszystkimi etapami cyklu życia modelu, w tym potencjalnie żmudnymi i mniej ekscytującymi zadaniami związanymi z przygotowaniem danych i debugowaniem.

🟡

piszesz testowalny, czytelny kod, nie tylko skrypty

Oczekuje się, że kod będzie zgodny z dobrymi praktykami inżynierskimi, a nie tylko szybkim rozwiązaniem problemu.

🔴

monitorujemy każdy token

Oznacza to bardzo szczegółowe śledzenie i analizę działania modeli, co może wiązać się z dużą ilością danych do analizy i potencjalnie skomplikowanym procesem monitorowania.

🟡

Solidna znajomość Pythona

Wymaga się nie tylko podstawowej znajomości języka, ale głębokiego zrozumienia jego możliwości i dobrych praktyk programistycznych.

🟡

Pewna praca w środowisku Linux

Oczekuje się samodzielności i biegłości w obsłudze systemu operacyjnego Linux, w tym w rozwiązywaniu problemów.

2026-06-01

Aplikuj - przejdz do oferty ↗