LLM / AI Engineer
⚲ Kraków, Zwierzyniec
120–160 zł netto (+ VAT) / godz.
Wymagania
- Python
- Linux
- Bash
- LangChain
- LangGraph
- CrewAI
- Langfuse
- RAGAS
- Arize
- Qdrant
- Weaviate
- pgvector
- Google Cloud Platform
- Vertex AI Studio
- Matching Engine
- Gemini API
- Docker
- Kubernetes
- Terraform
Opis stanowiska
Nasze wymagania:
Min. 2 lata komercyjnego doświadczenia z LLM — prompt engineering, fine-tuning, ewaluacja
Solidna znajomość Pythona — piszesz testowalny, czytelny kod, nie tylko skrypty
Praktyczne doświadczenie z RAG — wiesz co to dense i sparse retrieval i kiedy co wybrać
Znajomość frameworków agentowych (LangChain, LangGraph, CrewAI lub podobnych)
Doświadczenie z narzędziami do ewaluacji i obserwowaln ości LLM (Langfuse, RAGAS, Arize lub inne)
Doświadczenie z vector databases — Qdrant, Weaviate, pgvector lub podobnymi
Pewna praca w środowisku Linux — bash, SSH, praca na zdalnych maszynach
Biegła znajomość języka polskiego i angielskiego (komunikacja z zespołem i dokumentacja)
Mile widziane:
Znajomość Google Cloud i ekosystemu Vertex AI (Vertex AI Studio, Matching Engine, Gemini API)
Doświadczenie z Azure AI / Azure OpenAI Service i integracją z innymi usługami Azure
Rozumienie koncepcji MLOps — CI/CD dla modeli, wersjonowanie, rejestry artefaktów
Znajomość konteneryzacji (Docker, Kubernetes) i podstaw IaC (Terraform)
O projekcie:
Budujemy systemy agentowe, które naprawdę działają na produkcji
Szukamy inżyniera, który nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne. Będziesz projektować i budować pipelines RAG, systemy agentowe oraz dbać o ich jakość i stabilność w czasie. Pracujemy głównie na Linuksie, piszemy porządny Python i monitorujemy każdy token.
Stack, z którym pracujemy
Python 3.11+, LangChain / LangGraph,OpenAI API, Langfuse, RAGAS, Vertex AI, Azure OpenAI, Qdrant, Docker, Linux / Ubuntu, Git, FastAPI
Zakres obowiązków:
Projektowanie i implementacja systemów agentowych opartych na LLM (multi-agent, tool-use, memory)
Budowanie i optymalizacja pipeline’ów RAG — chunking, embedding, re-ranking, hybrid search
Ewaluacja i monitorowanie jakości systemów AI przy użyciu narzędzi takich jak Langfuse i RAGAS
Codzienna praca w środowisku Linux — skrypty, automatyzacja, debugowanie na serwerach
Utrzymanie stabilności i obserwowaln ości modeli na produkcji (logi, traces, alerty)
Ścisła współpraca z product ownerem i innymi inżynierami — po polsku i angielsku
Oferujemy:
Roczny budżet na kursy i szkolenia.
Elastyczne środowisko pracy - 100% zdalnie lub hybrydowo.
Karta Multisport.
Solidne wsparcie merytoryczne i praktyczne – jesteśmy oddani ciągłemu uczeniu się.
Pracę w szybko rozwijającej się branży związanej z AI, ML i Data Science.
Min. 2 lata komercyjnego doświadczenia z LLM — prompt engineering, fine-tuning, ewaluacja
Solidna znajomość Pythona — piszesz testowalny, czytelny kod, nie tylko skrypty
Praktyczne doświadczenie z RAG — wiesz co to dense i sparse retrieval i kiedy co wybrać
Znajomość frameworków agentowych (LangChain, LangGraph, CrewAI lub podobnych)
Doświadczenie z narzędziami do ewaluacji i obserwowaln ości LLM (Langfuse, RAGAS, Arize lub inne)
Doświadczenie z vector databases — Qdrant, Weaviate, pgvector lub podobnymi
Pewna praca w środowisku Linux — bash, SSH, praca na zdalnych maszynach
Biegła znajomość języka polskiego i angielskiego (komunikacja z zespołem i dokumentacja)
Mile widziane:
Znajomość Google Cloud i ekosystemu Vertex AI (Vertex AI Studio, Matching Engine, Gemini API)
Doświadczenie z Azure AI / Azure OpenAI Service i integracją z innymi usługami Azure
Rozumienie koncepcji MLOps — CI/CD dla modeli, wersjonowanie, rejestry artefaktów
Znajomość konteneryzacji (Docker, Kubernetes) i podstaw IaC (Terraform)
O projekcie:
Budujemy systemy agentowe, które naprawdę działają na produkcji
Szukamy inżyniera, który nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne. Będziesz projektować i budować pipelines RAG, systemy agentowe oraz dbać o ich jakość i stabilność w czasie. Pracujemy głównie na Linuksie, piszemy porządny Python i monitorujemy każdy token.
Stack, z którym pracujemy
Python 3.11+, LangChain / LangGraph,OpenAI API, Langfuse, RAGAS, Vertex AI, Azure OpenAI, Qdrant, Docker, Linux / Ubuntu, Git, FastAPI
Zakres obowiązków:
Projektowanie i implementacja systemów agentowych opartych na LLM (multi-agent, tool-use, memory)
Budowanie i optymalizacja pipeline’ów RAG — chunking, embedding, re-ranking, hybrid search
Ewaluacja i monitorowanie jakości systemów AI przy użyciu narzędzi takich jak Langfuse i RAGAS
Codzienna praca w środowisku Linux — skrypty, automatyzacja, debugowanie na serwerach
Utrzymanie stabilności i obserwowaln ości modeli na produkcji (logi, traces, alerty)
Ścisła współpraca z product ownerem i innymi inżynierami — po polsku i angielsku
Oferujemy:
Roczny budżet na kursy i szkolenia.
Elastyczne środowisko pracy - 100% zdalnie lub hybrydowo.
Karta Multisport.
Solidne wsparcie merytoryczne i praktyczne – jesteśmy oddani ciągłemu uczeniu się.
Pracę w szybko rozwijającej się branży związanej z AI, ML i Data Science.
🔍 Dekoder Ogłoszenia
🔴
nie boi się brudnej roboty z modelami językowymi — od prototypu po wdrożenie produkcyjne
Oczekuje się, że kandydat będzie zajmował się wszystkimi etapami cyklu życia modelu, w tym potencjalnie żmudnymi i mniej ekscytującymi zadaniami związanymi z przygotowaniem danych i debugowaniem.
🟡
piszesz testowalny, czytelny kod, nie tylko skrypty
Oczekuje się, że kod będzie zgodny z dobrymi praktykami inżynierskimi, a nie tylko szybkim rozwiązaniem problemu.
🔴
monitorujemy każdy token
Oznacza to bardzo szczegółowe śledzenie i analizę działania modeli, co może wiązać się z dużą ilością danych do analizy i potencjalnie skomplikowanym procesem monitorowania.
🟡
Solidna znajomość Pythona
Wymaga się nie tylko podstawowej znajomości języka, ale głębokiego zrozumienia jego możliwości i dobrych praktyk programistycznych.
🟡
Pewna praca w środowisku Linux
Oczekuje się samodzielności i biegłości w obsłudze systemu operacyjnego Linux, w tym w rozwiązywaniu problemów.