Specjalista/-tka NLP - LLM Posttraining
NASK Państwowy Instytut Badawczy
⚲ Warszawa
9 000 - 12 000 PLN (PERMANENT)
Wymagania
- NLP
- Uczenie maszynowe
- LLM
- Analiza danych
- Python
- PyTorch
- TensorFlow
- Hugging Face
- AWS (nice to have)
- GCP (nice to have)
- Azure (nice to have)
- Docker (nice to have)
- Kubernetes (nice to have)
- Open source (nice to have)
- RAG (nice to have)
Opis stanowiska
O projekcie: Dołącz do naszego zespołu pracującego nad projektem budowy polskojęzycznego dużego modelu językowego PLLuM. Poszukujemy osoby, która wzmocni zespół odpowiedzialny za etap post-trainingu i będzie miała realny wpływ na rozwój nowoczesnych technologii językowych w języku polskim. Szukamy osoby, która: - pasjonuje się przetwarzaniem języka naturalnego (NLP) oraz dużymi modelami językowymi (LLM), - chce mieć realny wpływ na rozwój polskojęzycznych modeli językowych, - lubi łączyć pracę badawczą z praktycznym wdrażaniem nowych technologii. O Zakładzie W Zakładzie Inżynierii Lingwistycznej i Analizy Tekstu zajmujemy się szeroko rozumianym NLP – od badań nad językiem po tworzenie innowacyjnych rozwiązań opartych na dużych modelach językowych. Tworzymy środowisko, w którym spotykają się nauka, inżynieria i pasja do języka. Pracujemy m.in. przy projekcie PLLuM, którego celem jest rozwój polskiego dużego modelu językowego. Nie ograniczamy się do wdrażania gotowych rozwiązań – aktywnie publikujemy wyniki naszych badań na międzynarodowych konferencjach (takich jak ACL, EMNLP, SIGIR czy NeurIPS). Dzielimy się wiedzą, rozwijamy własne narzędzia i stale eksperymentujemy z najnowszymi technologiami. Oferujemy: - Pracę w dynamicznie rozwijającym się zakładzie przy ambitnym projekcie, - Atrakcyjne benefity pracownicze, - Wynagrodzenie w przedziale 9 000 – 12 000 PLN brutto oraz kwartalny system premiowy. NASK SCIENCE, działając w ramach NASK, prowadzi prace badawczo-rozwojowe w dziedzinach cyberbezpieczeństwa, informatyki i sztucznej inteligencji. W NASK SCIENCE kształtujemy świat, odpowiedzialnie rozwijając technologię służącą społeczeństwu. Społeczne i komercyjne wyzwania ujmujemy w ramy nauki, by dojść do innowacyjnych wyników. Wykrywamy rozsiewanie (dez)informacji w sieciach społecznościowych. Rozwijamy ogólnokrajowe systemy cyberbezpieczeństwa. Tworzymy algorytmy sztucznej inteligencji wspomagające skomplikowane operacje chirurgiczne, sprawdzanie tożsamości, a nawet analizę ruchu zawodników na boisku. science.nask.pl Wymagania: - Wykształcenie wyższe (informatyka, matematyka lub kierunki pokrewne), - Minimum 2 lata doświadczenia w obszarze NLP/ML, - Doświadczenie w pracy z dużymi modelami językowymi (LLM): fine-tuning, prompt engineering, ewaluacja, - Bardzo dobra znajomość języka Python oraz frameworków (PyTorch, TensorFlow, Hugging Face), - Znajomość technik trenowania LLM (np. RLHF, LoRA, PEFT), - Umiejętność jasnej komunikacji oraz prezentowania wyników, - Bardzo dobra znajomość języka angielskiego (co najmniej poziom C1 w czytaniu i pracy z tekstem naukowym). Mile widziane: - Doświadczenie w pracy z chmurą (AWS, GCP, Azure) oraz konteneryzacją (Docker, Kubernetes), - Doświadczenie w zespole badawczo-inżynierskim, - Publikacje na renomowanych konferencjach (np. ACL, EMNLP, NeurIPS, SIGIR), - Projektowanie i modyfikacja architektur LLM, - Integracja LLM z zewnętrznymi narzędziami (tool use, function calling), - Udział w projektach open source z obszaru NLP/LLM, - Doświadczenie w systemach RAG (wektorowe bazy danych, embeddingi, wyszukiwanie semantyczne). Codzienne zadania: - Trenowanie oraz ewaluacja dużych modeli językowych, - Przygotowywanie i przetwarzanie danych do post-trainingu, - Tworzenie automatycznych procedur ewaluacyjnych, - Prowadzenie badań z zakresu NLP i uczenia maszynowego (ML).