Senior Machine Learning Engineer
H2B Group
⚲ Gdańsk
130 - 155 PLN/h netto (B2B)
Wymagania
- Python
- Pandas
- ScikitLearn
- AWS tools
- SQL
- Data modeling
- GenAI
Opis stanowiska
Kim jest H2B Group? Jesteśmy firmą konsultingową, która pomaga klientom w automatyzacji procesów biznesowych przy pomocy AI, a specjalistom IT rozwijać karierę w modelu B2B. Oferujemy projekty z branż takich jak fintech, medtech, edutech czy automatyka przemysłowa. Dzięki ścisłej współpracy wspieramy rozwój naszych klientów poprzez dostarczanie szybkich i mierzalnych efektów, jednocześnie zapewniając specjalistom IT możliwości rozwoju kariery i zdobywania cennego doświadczenia. Dlaczego warto z nami współpracować? ✨ Elastyczność – Wybierasz projekty dopasowane do swoich umiejętności i zainteresowań, z możliwością zmiany w ramach naszej firmy lub grupy Euvic, której jesteśmy częścią. 💡 Przejrzystość – Masz jasne zasady współpracy i pełną transparentność wynagrodzenia oraz warunków. 🚀 Szybkość działania – Dzięki naszej efektywności szybko znajdziesz lub zmienisz projekt, który idealnie odpowiada Twoim kompetencjom. 🌟 Możliwość rozwoju – Pracujesz przy innowacyjnych projektach, rozwijając kluczowe kompetencje i zdobywając cenne doświadczenie. Do projektu naszego klienta poszukujemy Machine Learning Engineer (Document Intelligence)! Zakres obowiązków: • Projektowanie i wdrażanie kompleksowych potoków (pipelines) inteligencji dokumentowej na AWS. • Rozwijanie i optymalizacja modeli ML do klasyfikacji, segmentacji oraz ekstrakcji pól z dokumentów. • Budowa skalowalnych systemów przetwarzania danych obsługujących pliki PDF o objętości do 2000 stron. • Współpraca z ekspertami merytorycznymi w celu tworzenia i doprecyzowania wymagań dotyczących ekstrakcji danych. • Samodzielne prowadzenie funkcji (features) – od etapu badań, przez wdrożenie produkcyjne, aż po monitorowanie. • Ustanawianie ram ewaluacyjnych oraz wskaźników jakości dla dokładności ekstrakcji. Wymagania: • Zaawansowana znajomość języka Python (Native, Pandas, ScikitLearn, TensorFlow lub PyTorch, PyStats, Pydantic). • Doświadczenie z narzędziami AWS do inżynierii i wdrażania ML (SageMaker, Lambda, CloudFormation/CDK, Step Functions). • Zaawansowana znajomość SQL oraz modelowania danych. • Doświadczenie z GenAI w kontekście inteligencji dokumentowej, w tym: prompt engineering, RAG (Retrieval Augmented Generation), modele multimodalne (Vision + Text) oraz wdrażanie produkcyjne z użyciem AWS Bedrock lub Azure OpenAI API. • Doświadczenie w projektowaniu eksperymentów (analiza mocy i testowanie hipotez). • Biegłość w komunikacji pisemnej i ustnej, niezbędna w zdalnym i asynchronicznym środowisku pracy. • Umiejętność jasnego komunikowania złożonych problemów technicznych i proponowania iteracyjnych rozwiązań. • Znajomość języka angielskiego na poziomie min. Upper-intermediate. Nice to have: • Doświadczenie z narzędziami do przetwarzania dokumentów (AWS Textract, Azure Document Intelligence lub podobne systemy OCR/layout detection). • Znajomość bibliotek do przetwarzania plików PDF i obrazów (np. PyMuPDF, OpenCV, Pillow). • Szerokie doświadczenie w Data Science (dobór algorytmów, inżynieria cech, tuning hiperparametrów, uczenie nadzorowane i nienadzorowane). • Doświadczenie z technologiami Big Data w AWS (Redshift, S3, EMR, Glue itp.).