Pracuj.pl Praca zdalna Mid

Data Engineer (Platforma Exposure) K/M

BCF Software Sp. z o.o.

⚲ Opole, Warszawa, Wrocław

130–140 zł netto (+ VAT) / godz.

Wymagania

  • Python
  • PySpark
  • Data bricks
  • Delta Lake
  • SQL
  • Bronze / Silver / Gold
  • Azure Data Factory
  • Azure DevOps
  • Git
  • CI/CD

Opis stanowiska

Nasze wymagania: Bardzo dobra znajomość Python oraz PySpark Doświadczenie z Databricks i Delta Lake Praca z dużymi repozytoriami kodu (nie tylko notebooki) Bardzo dobra znajomość SQL (analiza złożonej logiki) Doświadczenie w programowaniu obiektowym (OOP) Znajomość zasad clean code i utrzymywalności kodu Doświadczenie w pracy w środowiskach enterprise Umiejętność dokładnej analizy istniejącego kodu (linia po linii) Silne podstawy modelowania danych (transakcyjne i analityczne) Doświadczenie w przebudowie modeli danych podczas migracji Znajomość architektury warstwowej (Bronze / Silver / Gold) Bardzo dobra znajomość języka angielskiego Mile widziane: Azure Data Factory (orkiestracja) Azure DevOps, Git, CI/CD Power BI lub narzędzia analityczne Wiedza z zakresu DevOps / infrastruktury O projekcie: Obecnie poszukujemy Data Engineera. Projekt realizowany jest dla Munich Re i dotyczy dużej transformacji środowiska danych – migracji z systemów opartych o SQL Server do platformy Databricks / Delta Lake. Zakres obejmuje migrację 3500–4000 baz danych (ok. 2 TB) oraz replikację danych do Databricks w różnych strukturach i schematach, przy docelowych wolumenach sięgających petabajtów danych. Projekt koncentruje się na inżynierii danych klasy enterprise oraz developmentcie, a nie na analityce czy raportowaniu. Zakres obowiązków: Analiza i zrozumienie złożonej logiki biznesowej zapisanej w procedurach SQL (stored procedures) Przepisanie i przeprojektowanie tej logiki do Python / PySpark w środowisku Databricks Tworzenie produkcyjnego kodu transformacji danych (moduły, pakiety, komponenty wielokrotnego użytku) Stosowanie dobrych praktyk inżynierii oprogramowania (clean code, OOP, refaktoryzacja) Projektowanie i rozwój modeli danych w architekturze Medallion (Bronze / Silver / Gold) Praca na bardzo dużych wolumenach danych oraz w środowiskach przetwarzania równoległego Udział w code review oraz dyskusjach technicznych Oferujemy: Praca w firmie, która otrzymała nagrodę Great Place to Work Award i Diamentowy Certyfikat Forbesa. Pakiet benefitów (karta multisport, prywatna opieka medyczna, ubezpieczenie grupowe) Udział w projekcie dla międzynarodowego klienta Stabilną współpracę w profesjonalnym środowisku Środowisko pracy ludzi otwartych na dzielenie się i wymianę wiedzą IT.