IT Architect
Integral Solutions
⚲ Warszawa
15 120 - 22 176 PLN (B2B)
Wymagania
- SQL
- Python
- Ontology
- NLP
- Data modeling
- API
- Git
- Knowledge Management
- RAG (nice to have)
- Graph Databases (nice to have)
- Neo4j (nice to have)
- SPARQL (nice to have)
- RDF (nice to have)
- LLMOps (nice to have)
- NER (nice to have)
- Banking (nice to have)
Opis stanowiska
O projekcie: Szukamy osoby, która pomoże nam budować i rozwijać inteligentne systemy wyszukiwania oparte na danych, ontologiach i AI. Twoim zadaniem będzie porządkowanie nieustrukturyzowanej wiedzy oraz projektowanie rozwiązań, które realnie poprawiają jakość wyszukiwania i dostęp do informacji. Co oferujemy - Pracę na kontrakcie B2B - Dostęp do systemu myBenefit, w tym prywatne ubezpieczenie medyczne, Multisport i wiele innych - Prezenty na różne okazje - Wydarzenia firmowe Wymagania: - 2–5 lat doświadczenia w pracy z danymi, wyszukiwaniem, NLP lub systemami zarządzania wiedzą. - Praktyczne doświadczenie w pracy z ontologiami i modelowaniem wiedzy. - Dobra znajomość SQL oraz podstawy Pythona (scripting). - Doświadczenie w pracy z API i pipeline’ami danych. - Umiejętność dokumentowania procesów i pracy z repozytoriami (np. Git). - Analityczne podejście do problemów i dbałość o jakość rozwiązań. Mile widziane - Technologie semantyczne (RDF, OWL, SPARQL). - Doświadczenie z bazami grafowymi (np. Neo4j). - Projekty RAG, LLMOps lub narzędzia do adnotacji danych. - Wiedza domenowa z bankowości lub środowisk regulowanych. Codzienne zadania: - Projektowanie i wdrażanie ontologii oraz struktur wiedzy w działających systemach. - Praca z nieustrukturyzowanymi źródłami danych (PDF, Word, SharePoint, Confluence, intranet). - Budowa i utrzymanie metadanych, słowników synonimów oraz aliasów. - Projektowanie procesów półautomatycznych: ekstrakcja encji (NER), normalizacja, deduplikacja i walidacja jakości. - Współtworzenie rozwiązań typu AI search (indeksowanie, chunking, embeddingi, retrieval, reranking). - Iteracyjne poprawianie jakości wyszukiwania na podstawie testów i realnych zapytań użytkowników.