Regular Machine Learning - AI Engineer (k/m/x)
SquareOne
⚲ Warsaw
15 120 - 18 480 PLN (B2B)
Wymagania
- Python
- PySpark
- Apache Spark
- Databricks
- Azure ML
- azure ai
- restapi
- Microservices
- Kubernetes
- Machine learning
- MLOps
- RAG
- LLM
- prompt engineering
- SQL
- Azure cosmos db
- GCP
- Docker
Opis stanowiska
O projekcie: - Projekt dotyczy zaprojektowania i wdrożenia skalowalnej platformy przetwarzania danych oraz rozwiązań opartych o sztuczną inteligencję. Głównym celem jest umożliwienie automatyzacji procesów analitycznych oraz integracji modeli Machine Learning i rozwiązań GenAI w środowisku produkcyjnym. - Zakres prac obejmuje budowę i optymalizację pipeline’ów danych, implementację modeli ML/LLM, a także rozwój praktyk MLOps/LLMOps zapewniających stabilność, monitoring i ciągłe doskonalenie rozwiązań. System jest rozwijany w środowisku chmurowym, z naciskiem na wydajność, skalowalność i łatwość utrzymania. - Szukamy 3 osób, na okres kwiecień - czerwiec z potencjałem przedłużenia kontraktu. Wymagania: - Doświadczenie w inżynierii danych i budowie pipeline’ów danych - Bardzo dobra znajomość Pythona w zastosowaniach produkcyjnych (API, mikroserwisy) - Doświadczenie w pracy z modelami ML oraz ich wdrażaniem - Znajomość narzędzi MLOps/LLMOps (np. Azure ML, Azure AI) - Doświadczenie z platformami Big Data (np. Databricks, Spark/PySpark) - Znajomość architektury chmurowej (Azure lub GCP) - Doświadczenie z integracją i przetwarzaniem danych (Data Lake, ETL/ELT) - Podstawowa znajomość GenAI (LLM, RAG, prompt engineering) - Znajomość praktyk CI/CD i DevOps - Umiejętność pracy zespołowej oraz komunikacji techniczne Codzienne zadania: - Współpraca z zespołami Data Science przy wdrażaniu modeli ML do środowiska produkcyjnego - Projektowanie i implementacja rozwiązań GenAI (m.in. integracje LLM, RAG, prompt engineering) - Budowa i rozwój pipeline’ów przetwarzania danych (batch oraz near real-time) - Implementacja i rozwój praktyk MLOps/LLMOps (monitoring, CI/CD, versioning modeli) - Tworzenie mikroserwisów i API w Pythonie wspierających systemy ML - Optymalizacja wydajności przetwarzania danych i modeli - Zbieranie wymagań technicznych oraz estymacja prac - Przygotowywanie dokumentacji technicznej - Prezentowanie rozwiązań i wyników interesariuszom