Młodszy Specjalista / Młodsza Specjalistka ds. IT
Salesandbetter Sp. z o.o.
⚲ Warszawa
Wymagania
- Python
- Docker
Opis stanowiska
Nasze wymagania: biegła znajomość inżynierii danych oraz uczenia maszynowego, mile widziane co najmniej 2-3 lata doświadczenia w pracy z językiem Python w środowisku chmury obliczeniowej. zaawansowana znajomość języka Python: biegła obsługa struktur danych, programowanie asynchroniczne i pobieranie danych za pośrednictwem interfejsów (API). doświadczenie w bazach danych wektorowych i pobieraniu danych: efektywne wyszukiwanie danych tekstowych przetworzonych matematycznie (wektorów). praktyczne doświadczenie w przetwarzaniu języka (NLP) z wykorzystaniem nowoczesnych modeli językowych (np. transformatorów). umiejętność automatyzacji (DevOps): konfigurowanie codziennych synchronizacji danych w środowisku chmury i konteneryzacja (Docker). precyzja w analizowaniu i przetwarzaniu złożonych struktur dokumentów, unikanie duplikatów w bazie danych. doświadczenie w hostingu w chmurze: zarządzanie instancjami wirtualnymi (Linux) i ich zabezpieczanie. samodzielne rozwiązywanie problemów związanych z przerwaniami połączenia lub zmianami w zewnętrznych źródłach danych. znajomość języka angielskiego. Mile widziane: wykształcenie inżynierskie z zakresu informatyki (licencjat/magister) doświadczenie na podobnym stanowisku znajmomość języka niemieckiego O projekcie: Projekt dotyczy stworzenia i automatyzacji skalowalnego procesu przetwarzania danych tekstowych w języku polskim, który ma wspierać zapytania oparte na sztucznej inteligencji. Zakres obowiązków: Tworzenie i automatyzacja skalowalnego potoku danych do przetwarzania dużych ilości danych tekstowych (polskich) oraz udostępnianie ich dla zapytań opartych na sztucznej inteligencji. Pipeline danych: opracowanie zautomatyzowanego procesu, który codziennie pobiera, filtruje i przetwarza nowe publiczne zestawy danych. Integracja backendowa: zapewnienie interfejsu, za pośrednictwem którego środowisko edytora wysyła zapytania do bazy danych i otrzymuje wyniki w ciągu milisekund. Zarządzanie infrastrukturą: monitorowanie kosztów chmury i optymalizacja mocy obliczeniowej dla codziennych cykli aktualizacji. Oferujemy: ofertujemy stabilne zatrudnienie długoletnią współpracę możliwość dokształcania i rozwoju pracę przy innowacyjnym projekcie pracę w międzynarodowym zespole