JustJoin.IT Hybrydowo Mid New

Data Scientist

e-point SA

⚲ Warszawa

100 - 120 PLN/h netto (B2B)

Wymagania

  • Python
  • SQL
  • Machine Learning
  • Pandas
  • scikit-learn
  • NumPy

Opis stanowiska

Opis projektu Nasz Klient to państwowa jednostka o znaczeniu strategicznym, odpowiedzialna za utrzymanie i rozwój kluczowej infrastruktury w sektorze lotnictwa cywilnego. Instytucja ta pełni nadrzędną rolę w zapewnianiu ciągłości i bezpieczeństwa operacji transportowych na skalę krajową, działając w oparciu o rygorystyczne normy publiczne oraz międzynarodowe standardy regulacyjne. Zadania: • Zbieranie i przygotowanie danych: pozyskiwanie ze źródeł wewnętrznych/zewnętrznych, czyszczenie, transformacje, agregacje. • Eksploracyjna analiza danych (EDA), profilowanie danych, identyfikacja wzorców, trendów, korelacji i anomalii. • Inżynieria cech i selekcja zmiennych, przygotowanie zestawów treningowych/walidacyjnych/testowych. • Projektowanie, trening, strojenie hiperparametrów i walidacja modeli ML dla klasyfikacji, regresji, szeregów czasowych, NLP itp. • Ocena modeli z użyciem odpowiednich metryk (np. dokładność, precyzja, czułość, F1, ROC‐AUC, RMSE, MAE). • Dokumentowanie eksperymentów, śledzenie wersji danych i modeli, replikowalność wyników. • Współpraca z Product Ownerem przy definiowaniu hipotez, KPI i kryteriów sukcesu. • Planowanie pracy w Scrum, przeglądy wyników i rekomendacji, udział w refinementach. • Przygotowanie modeli do wdrożenia we współpracy z Data/ML Engineerami oraz wsparcie w integracji. • Monitorowanie modeli w środowisku produkcyjnym (drift, stabilność, degradacja), planowanie retraningu. • Analiza i wizualizacja wyników, storytelling danych, przygotowanie materiałów decyzyjnych dla interesariuszy. • Projektowanie i analiza eksperymentów A/B, walidacja zmian modeli lub polityk decyzyjnych. • Badanie i porównywanie nowych algorytmów, narzędzi i bibliotek pod kątem użyteczności w produktach. • Przygotowanie i utrzymanie dokumentacji technicznej, kart modelu i zaleceń dotyczących użycia. • Optymalizacja pracy zespołu przez automatyzację analiz, szablony raportów i bibliotekę narzędziową. Wymagania: • Wykształcenie wyższe: sztuczna inteligencja, data science, informatyka, matematyka, statystyka, fizyka lub pokrewne. • Doświadczenie w budowie i walidacji modeli ML, prowadzeniu eksperymentów i analiz EDA. • Biegłość w ekosystemie Python do analizy i ML (np. NumPy, pandas, scikit‐learn, biblioteki głębokiego uczenia). • Umiejętność pracy z danymi z baz SQL/NoSQL, przygotowania danych i optymalizacji zapytań. • Znajomość metodyk eksperymentowania, doboru metryk oraz podstaw MLOps (rejestr eksperymentów, monitoring). • Umiejętność interpretacji modeli (np. techniki wyjaśnialności) i przygotowania wniosków dla biznesu. • Doświadczenie w pracy zespołowej, wersjonowaniu kodu, code review i dokumentowaniu. • Biegłe posługiwanie się językiem polskim. Co oferujemy? • Pracę zdalną z możliwością przyjazdów co jakiś czas do biura w Warszawie. • Pracę na naszym sprzęcie. • Płaską strukturę zarządzania. • Samoorganizujące się zespoły. • Dużo przestrzeni na własną inicjatywę. • Możliwość delegacji na terenie Unii Europejskiej lub Wielkiej Brytanii.