NoFluffJobs Stacjonarnie Mid

Specjalista/-tka NLP - LLM Posttraining

NASK Państwowy Instytut Badawczy

⚲ Warszawa

9 000 - 12 000 PLN (PERMANENT)

Wymagania

NLP
Uczenie maszynowe
LLM
Analiza danych
Python
PyTorch
TensorFlow
Hugging Face
AWS (nice to have)
GCP (nice to have)
Azure (nice to have)
Docker (nice to have)
Kubernetes (nice to have)
Open source (nice to have)
RAG (nice to have)

Opis stanowiska

O projekcie: Dołącz do naszego zespołu pracującego nad projektem budowy polskojęzycznego dużego modelu językowego PLLuM. Poszukujemy osoby, która wzmocni zespół odpowiedzialny za etap post-trainingu i będzie miała realny wpływ na rozwój nowoczesnych technologii językowych w języku polskim. Szukamy osoby, która: - pasjonuje się przetwarzaniem języka naturalnego (NLP) oraz dużymi modelami językowymi (LLM), - chce mieć realny wpływ na rozwój polskojęzycznych modeli językowych, - lubi łączyć pracę badawczą z praktycznym wdrażaniem nowych technologii. O Zakładzie W Zakładzie Inżynierii Lingwistycznej i Analizy Tekstu zajmujemy się szeroko rozumianym NLP – od badań nad językiem po tworzenie innowacyjnych rozwiązań opartych na dużych modelach językowych. Tworzymy środowisko, w którym spotykają się nauka, inżynieria i pasja do języka. Pracujemy m.in. przy projekcie PLLuM, którego celem jest rozwój polskiego dużego modelu językowego. Nie ograniczamy się do wdrażania gotowych rozwiązań – aktywnie publikujemy wyniki naszych badań na międzynarodowych konferencjach (takich jak ACL, EMNLP, SIGIR czy NeurIPS). Dzielimy się wiedzą, rozwijamy własne narzędzia i stale eksperymentujemy z najnowszymi technologiami. Oferujemy: - Pracę w dynamicznie rozwijającym się zakładzie przy ambitnym projekcie, - Atrakcyjne benefity pracownicze, - Wynagrodzenie w przedziale 9 000 – 12 000 PLN brutto oraz kwartalny system premiowy. NASK SCIENCE, działając w ramach NASK, prowadzi prace badawczo-rozwojowe w dziedzinach cyberbezpieczeństwa, informatyki i sztucznej inteligencji. W NASK SCIENCE kształtujemy świat, odpowiedzialnie rozwijając technologię służącą społeczeństwu. Społeczne i komercyjne wyzwania ujmujemy w ramy nauki, by dojść do innowacyjnych wyników. Wykrywamy rozsiewanie (dez)informacji w sieciach społecznościowych. Rozwijamy ogólnokrajowe systemy cyberbezpieczeństwa. Tworzymy algorytmy sztucznej inteligencji wspomagające skomplikowane operacje chirurgiczne, sprawdzanie tożsamości, a nawet analizę ruchu zawodników na boisku. science.nask.pl Wymagania: - Wykształcenie wyższe (informatyka, matematyka lub kierunki pokrewne), - Minimum 2 lata doświadczenia w obszarze NLP/ML, - Doświadczenie w pracy z dużymi modelami językowymi (LLM): fine-tuning, prompt engineering, ewaluacja, - Bardzo dobra znajomość języka Python oraz frameworków (PyTorch, TensorFlow, Hugging Face), - Znajomość technik trenowania LLM (np. RLHF, LoRA, PEFT), - Umiejętność jasnej komunikacji oraz prezentowania wyników, - Bardzo dobra znajomość języka angielskiego (co najmniej poziom C1 w czytaniu i pracy z tekstem naukowym). Mile widziane: - Doświadczenie w pracy z chmurą (AWS, GCP, Azure) oraz konteneryzacją (Docker, Kubernetes), - Doświadczenie w zespole badawczo-inżynierskim, - Publikacje na renomowanych konferencjach (np. ACL, EMNLP, NeurIPS, SIGIR), - Projektowanie i modyfikacja architektur LLM, - Integracja LLM z zewnętrznymi narzędziami (tool use, function calling), - Udział w projektach open source z obszaru NLP/LLM, - Doświadczenie w systemach RAG (wektorowe bazy danych, embeddingi, wyszukiwanie semantyczne). Codzienne zadania: - Trenowanie oraz ewaluacja dużych modeli językowych, - Przygotowywanie i przetwarzanie danych do post-trainingu, - Tworzenie automatycznych procedur ewaluacyjnych, - Prowadzenie badań z zakresu NLP i uczenia maszynowego (ML).

2026-03-27 Aplikuj - przejdz do oferty ↗