Data Scientist
NASK
⚲ Warszawa, Wola
9 000–14 000 zł brutto / mies.
Wymagania
- Python
- Pandas
- PyTorch
- TensorFlow
- scikit-learn
- Neo4j
Opis stanowiska
Nasze wymagania: Biegła znajomość języka Python oraz bibliotek do analizy i modelowania (Pandas, NumPy, Scikit-learn, PyTorch lub TensorFlow). Doświadczenie w przynajmniej trzech z wymienionych obszarów: klasyczne metody uczenia maszynowego (klasyfikacja, detekcja anomalii) przetwarzanie języka naturalnego NLP (Transformers, BERT, NER), komputerowe rozpoznawanie obrazu (CV), umiejętność przygotowania środowiska i wdrażanie opracowanych rozwiązań (podstawy MLOps). praca z wektorowymi bazami danych (RAG/Semantic Search) Język angielski (B2/C1): Swoboda w czytaniu dokumentacji technicznej, analizowaniu anglojęzycznych źródeł o zagrożeniach oraz pisaniu dokumentacji. Mile widziane: Zainteresowanie tematami cyberbezpieczeństwa: w szczególności zagrożenia typu phishing, malware, APT, znajomość cyklu życia ataku (Cyber Kill Chain) Znajomość baz grafowych: (np. Neo4j) oraz algorytmów analizy sieciowej do mapowania powiązań między infrastrukturą adwersarzy (domeny, IP, certyfikaty, próbki malware). Zakres obowiązków: Projektowanie i Rozwój Nowych Rozwiązań (R&D) Badanie i prototypowanie nowych rozwiązań AI/ML w obszarze Cyber Threat Intelligence Projektowanie od podstaw i wdrażanie innowacyjnych modułów analitycznych opartych na uczeniu maszynowym Dobór optymalnych technologii i architektur dla nowo powstających projektów analitycznych wewnątrz zespołu NIRT. Badanie i prototypowanie nowych rozwiązań AI/ML w obszarze Cyber Threat Intelligence Projektowanie od podstaw i wdrażanie innowacyjnych modułów analitycznych opartych na uczeniu maszynowym Dobór optymalnych technologii i architektur dla nowo powstających projektów analitycznych wewnątrz zespołu NIRT. Integracja i Optymalizacja Istniejących Systemów Wzbogacanie autorskich systemów monitorowania NIRT o funkcje modelowania predykcyjnego oraz automatyczną detekcję anomalii. Refaktoryzacja i optymalizacja istniejących potoków przetwarzania danych Transfer wyników prac badawczych do środowiska produkcyjnego (Mlopps) oraz zapewnienie ich skalowalności w ramach obecnej infrastruktury. Wzbogacanie autorskich systemów monitorowania NIRT o funkcje modelowania predykcyjnego oraz automatyczną detekcję anomalii. Refaktoryzacja i optymalizacja istniejących potoków przetwarzania danych Transfer wyników prac badawczych do środowiska produkcyjnego (Mlopps) oraz zapewnienie ich skalowalności w ramach obecnej infrastruktury. Jakość, Walidacja i Wsparcie Analityczne Prowadzenie walidacji statystycznej modeli wdrożonych operacyjnie. Przekładanie wyników analiz statystycznych na czytelne dashboardy i rekomendacje wspierające codzienną pracę analityków incydentów. Aktywne śledzenie trendów w AI/ML w cyberbezpieczeństwie i ich adaptacja do potrzeb operacyjnych zespołu. Prowadzenie walidacji statystycznej modeli wdrożonych operacyjnie. Przekładanie wyników analiz statystycznych na czytelne dashboardy i rekomendacje wspierające codzienną pracę analityków incydentów. Aktywne śledzenie trendów w AI/ML w cyberbezpieczeństwie i ich adaptacja do potrzeb operacyjnych zespołu.