Bulldogjob Praca zdalna Senior

Senior AI Data Engineer

Luxoft DXC

Wymagania

  • Python
  • SQL
  • PostgreSQL
  • Open Search
  • Elastic Search

Opis stanowiska

Join the Data Engineering team to contribute to the ongoing maintenance and improvement of an internal LLM-powered assistant that uses hosted LLM APIs and internal knowledge sources, with a focus on reliability, retrieval quality, and operational excellence. - Maintain and enhance ingestion/enrichment pipelines for internal content (parsing/extraction, normalization, metadata enrichment, deduplication, and quality monitoring) - Improve indexing and retrieval performance and quality (chunking/segmentation refinements, embedding/index update workflows, metadata filtering, caching) and support hybrid retrieval capabilities (vector + keyword/BM25 + metadata) - Implement and maintain access-aware retrieval by propagating/enforcing document permissions through indexing and query-time filters, including audit logs and validation tests - Improve source attribution so responses reliably point to the correct documents and sections in a consistent format. - Extend and harden tool/workflow execution and automations (scheduled/trigger-based), including retries, timeouts, idempotency, concurrency controls, and run history - Develop and maintain evaluation and regression testing (golden sets, automated scoring) and support structured comparisons across LLM providers/models as required - Operate the platform in production: observability (logs/metrics/tracing), alerting, incident support, performance tuning, and cost controls, plus runbooks and handover documentation

🔍 Dekoder Ogłoszenia

🔴
ongoing maintenance and improvement
Praca będzie polegać głównie na utrzymaniu istniejącego systemu i naprawianiu błędów, a nie na tworzeniu czegoś od zera.
🟡
operational excellence
Oczekuje się, że będziesz dbać o stabilność, wydajność i niezawodność systemu w środowisku produkcyjnym.
🔴
access-aware retrieval by propagating/enforcing document permissions
Będziesz musiał zaimplementować i zarządzać złożonym systemem uprawnień dostępu do danych, co może być trudne i czasochłonne.
🟡
retries, timeouts, idempotency, concurrency controls
Wymaga to głębokiego zrozumienia i implementacji zaawansowanych wzorców projektowych w celu zapewnienia niezawodności systemów rozproszonych.
🔴
incident support
Będziesz musiał być gotowy do reagowania na awarie i problemy w systemie, również poza standardowymi godzinami pracy.