NoFluffJobs Praca zdalna Senior New

Data Engineer with Cloud (m/f/d)

Square One Resources

⚲ Warsaw

20 160 - 23 520 PLN (B2B)

Wymagania

SQL
Python
Cloud
Spark (nice to have)
PySpark (nice to have)
Databricks (nice to have)
ML (nice to have)
AV (nice to have)
Airflow (nice to have)
Argo (nice to have)

Opis stanowiska

O projekcie: Projekt koncentruje się na wsparciu danych symulacyjnych dla rozwoju pojazdów autonomicznych (AV), szczególnie w obszarach takich jak wykrywanie przeszkód, planowanie trasy oraz złożone sytuacje drogowe. Wymagania: - Mocne umiejętności software engineering oraz rozwiązywania problemów.- Zaawansowana znajomość SQL i doświadczenie w pisaniu złożonych zapytań.- Zaawansowane umiejętności programowania w Pythonie.- Zrozumienie przetwarzania rozproszonego i workflowów danych na dużą skalę.- Praktyczne doświadczenie z technologiami chmurowymi i nowoczesnymi platformami danych.- Doświadczenie z narzędziami orkiestracji workflowów, takimi jak Airflow, Argo Workflows lub podobnymi frameworkami pipeline’ów.- Zrozumienie zagadnień infrastrukturalnych, w tym systemów storage, mikroserwisów i architektury pipeline’ów.- Doświadczenie w pracy z notebookami i workflowami analizy danych.- Znajomość troubleshootingu i wsparcia operacyjnego produkcyjnych pipeline’ów danych.- Zrozumienie zasad wyszukiwania i eksploracji danych (data search & data discovery) Codzienne zadania: - Wsparcie i utrzymanie infrastruktury pipeline’ów danych FST factory oraz pomoc w analizie incydentów i wsparciu operacyjnym. - Analiza dużych zbiorów danych przy użyciu SQL, Python, Spark i notebooków w celu badania problemów pipeline’ów i walidacji przepływów danych. - Praca z chmurowymi platformami danych oraz środowiskami przetwarzania rozproszonego w celu zapewnienia niezawodności i skalowalności workflowów danych. - Monitorowanie, diagnozowanie i optymalizacja pipeline’ów orkiestracji (np. Airflow, Argo Workflows lub podobne technologie). - Współpraca z zespołami backendowymi i infrastrukturalnymi przy mikroserwisach, systemach storage oraz usługach przetwarzania danych. - Wsparcie procesów wyszukiwania i eksploracji danych w zbiorach strukturalnych i półstrukturalnych. - Tworzenie i utrzymanie skryptów oraz narzędzi do przetwarzania danych, debugowania i automatyzacji operacyjnej. - Analiza niespójności danych, błędów pipeline’ów oraz problemów wydajnościowych na platformie. - Udział w poprawie obserwowalności (observability), monitoringu oraz stabilności operacyjnej workflowów danych. - Ścisła współpraca z zespołami cross-funkcyjnymi wspierającymi pipeline’y danych dla analityki, symulacji i ML

🔍 Dekoder Ogłoszenia

🔴

Wsparcie i utrzymanie infrastruktury pipeline’ów danych FST factory oraz pomoc w analizie incydentów i wsparciu operacyjnym.

Duża szansa, że będziesz głównie zajmować się gaszeniem pożarów i naprawianiem istniejących problemów, a nie budowaniem nowych rozwiązań.

🟡

Zrozumienie zagadnień infrastrukturalnych, w tym systemów storage, mikroserwisów i architektury pipeline’ów.

Oczekuje się od Ciebie nie tylko umiejętności programistycznych, ale także wiedzy o tym, jak działają podstawowe elementy infrastruktury IT.

🟡

Praca z chmurowymi platformami danych oraz środowiskami przetwarzania rozproszonego w celu zapewnienia niezawodności i skalowalności workflo

Może oznaczać pracę z bardzo dużymi i złożonymi systemami, które wymagają ciągłego monitorowania i optymalizacji.

🔴

Znajomość troubleshootingu i wsparcia operacyjnego produkcyjnych pipeline’ów danych.

Będziesz odpowiedzialny za rozwiązywanie problemów w systemach działających na produkcji, co może oznaczać pracę w trybie awaryjnym.

🟡

Wsparcie danych symulacyjnych dla rozwoju pojazdów autonomicznych (AV), szczególnie w obszarach takich jak wykrywanie przeszkód, planowanie trasy oraz złożone sytuacje drogowe.

Praca nad bardzo specyficznym i potencjalnie niszowym obszarem technologii, który może wymagać szybkiego przyswajania wiedzy domenowej.

2026-05-20

Aplikuj - przejdz do oferty ↗