Data Engineer (Scala&Spark)
⚲ Warszawa
23 520 - 28 560 PLN netto (B2B)
Wymagania
- Apache Spark
- Scala
- Databricks
- GCP
- Airflow
Opis stanowiska
Nasz Klient to organizacja realizująca projekty związane z rozwojem nowoczesnych platform danych oraz rozwiązań chmurowych wspierających procesy biznesowe i analityczne.
Projekt koncentruje się na budowie, rozwoju oraz optymalizacji środowisk danych wykorzystywanych do przetwarzania i udostępniania informacji w organizacjach operujących na dużych wolumenach danych. Zakres współpracy obejmuje rozwój procesów ETL, automatyzację przepływu danych oraz wdrażanie rozwiązań opartych o technologie chmurowe.
Do współpracy zapraszamy osoby posiadające doświadczenie w obszarze Data Engineering, które chcą rozwijać nowoczesne platformy danych i mieć realny wpływ na wydajność, jakość oraz skalowalność realizowanych rozwiązań.
📍 Tryb Współpracy: 100% remote⏱️ Dostępność: Start współpracy możliwy zgodnie z dostępnością wybranej osoby
🧑💻 CZYM BĘDZIESZ SIĘ ZAJMOWAĆ?
• Projektowaniem i rozwijaniem skalowalnych rozwiązań do przetwarzania danych z wykorzystaniem Scala oraz Apache Spark
• Budowaniem, optymalizacją i utrzymaniem procesów ETL w środowisku chmurowym opartym o Google Cloud Platform
• Tworzeniem oraz rozwijaniem rozwiązań Data Engineering z wykorzystaniem Databricks oraz Zeppelin Notebooks
• Pisaniem, optymalizacją i analizą złożonych zapytań w SQL wspierających potrzeby analityczne i biznesowe
• Orkiestracją, harmonogramowaniem oraz monitorowaniem procesów danych przy użyciu Apache Airflow
• Współpracą z zespołami technicznymi i biznesowymi przy definiowaniu wymagań oraz dostarczaniu rozwiązań opartych o dane
🔍 CZEGO OD CIEBIE OCZEKUJEMY?
Must have:
• Bardzo dobra znajomość Scala oraz Apache Spark zdobyta w projektach Data Engineering
• Praktyczne doświadczenie z Databricks oraz Zeppelin Notebooks
• Doświadczenie w pracy z Google Cloud Platform
• Zaawansowana znajomość SQL w zakresie modelowania danych, optymalizacji oraz tworzenia złożonych zapytań
• Doświadczenie w budowie i utrzymaniu procesów ETL z wykorzystaniem Apache Airflow
• Bardzo dobra znajomość języka polskiego oraz angielskiego (minimum B2)
• Doświadczenie w pracy w metodykach Agile z wykorzystaniem narzędzi takich jak Jira i Confluence
• Umiejętność efektywnej współpracy z zespołami technicznymi oraz interesariuszami biznesowymi
🤝 DLACZEGO WARTO?
• Współpraca w modelu B2B
• Projekt realizowany w 100% zdalnie
• Możliwość udziału w inicjatywach związanych z nowoczesnymi platformami danych i przetwarzaniem dużych wolumenów informacji
• Realny wpływ na rozwój rozwiązań produkcyjnych wykorzystywanych w środowisku biznesowym
• Współpraca w zespołach pracujących zgodnie z metodykami Agile
• Możliwość rozwoju kompetencji w obszarze technologii chmurowych, Data Engineering oraz zaawansowanego przetwarzania danych
📍 Dziękujemy za wszystkie zgłoszenia! Skontaktujemy się z wybranymi osobami.
TQLO Sp. z o.o. – Agencja Zatrudnienia (nr KRAZ 33580)
Projekt koncentruje się na budowie, rozwoju oraz optymalizacji środowisk danych wykorzystywanych do przetwarzania i udostępniania informacji w organizacjach operujących na dużych wolumenach danych. Zakres współpracy obejmuje rozwój procesów ETL, automatyzację przepływu danych oraz wdrażanie rozwiązań opartych o technologie chmurowe.
Do współpracy zapraszamy osoby posiadające doświadczenie w obszarze Data Engineering, które chcą rozwijać nowoczesne platformy danych i mieć realny wpływ na wydajność, jakość oraz skalowalność realizowanych rozwiązań.
📍 Tryb Współpracy: 100% remote⏱️ Dostępność: Start współpracy możliwy zgodnie z dostępnością wybranej osoby
🧑💻 CZYM BĘDZIESZ SIĘ ZAJMOWAĆ?
• Projektowaniem i rozwijaniem skalowalnych rozwiązań do przetwarzania danych z wykorzystaniem Scala oraz Apache Spark
• Budowaniem, optymalizacją i utrzymaniem procesów ETL w środowisku chmurowym opartym o Google Cloud Platform
• Tworzeniem oraz rozwijaniem rozwiązań Data Engineering z wykorzystaniem Databricks oraz Zeppelin Notebooks
• Pisaniem, optymalizacją i analizą złożonych zapytań w SQL wspierających potrzeby analityczne i biznesowe
• Orkiestracją, harmonogramowaniem oraz monitorowaniem procesów danych przy użyciu Apache Airflow
• Współpracą z zespołami technicznymi i biznesowymi przy definiowaniu wymagań oraz dostarczaniu rozwiązań opartych o dane
🔍 CZEGO OD CIEBIE OCZEKUJEMY?
Must have:
• Bardzo dobra znajomość Scala oraz Apache Spark zdobyta w projektach Data Engineering
• Praktyczne doświadczenie z Databricks oraz Zeppelin Notebooks
• Doświadczenie w pracy z Google Cloud Platform
• Zaawansowana znajomość SQL w zakresie modelowania danych, optymalizacji oraz tworzenia złożonych zapytań
• Doświadczenie w budowie i utrzymaniu procesów ETL z wykorzystaniem Apache Airflow
• Bardzo dobra znajomość języka polskiego oraz angielskiego (minimum B2)
• Doświadczenie w pracy w metodykach Agile z wykorzystaniem narzędzi takich jak Jira i Confluence
• Umiejętność efektywnej współpracy z zespołami technicznymi oraz interesariuszami biznesowymi
🤝 DLACZEGO WARTO?
• Współpraca w modelu B2B
• Projekt realizowany w 100% zdalnie
• Możliwość udziału w inicjatywach związanych z nowoczesnymi platformami danych i przetwarzaniem dużych wolumenów informacji
• Realny wpływ na rozwój rozwiązań produkcyjnych wykorzystywanych w środowisku biznesowym
• Współpraca w zespołach pracujących zgodnie z metodykami Agile
• Możliwość rozwoju kompetencji w obszarze technologii chmurowych, Data Engineering oraz zaawansowanego przetwarzania danych
📍 Dziękujemy za wszystkie zgłoszenia! Skontaktujemy się z wybranymi osobami.
TQLO Sp. z o.o. – Agencja Zatrudnienia (nr KRAZ 33580)
🔍 Dekoder Ogłoszenia
🔴
realny wpływ na wydajność, jakość oraz skalowalność realizowanych rozwiązań
Masz szansę coś faktycznie zmienić, ale nie ma gwarancji, że Twoje sugestie zostaną wdrożone.
🔴
rozwojem nowoczesnych platform danych
Może oznaczać pracę nad czymś nowym, ale równie dobrze nad rozbudową istniejących, starszych systemów.
🔴
rozwiązań chmurowych wspierających procesy biznesowe i analityczne
Praca może być bardzo ogólna i niekoniecznie skupiona na zaawansowanych technikach inżynierii danych.
🔴
optymalizacją środowisk danych
Może oznaczać poprawę istniejących rozwiązań, ale też walkę z problemami wynikającymi z zaniedbań lub złych decyzji w przeszłości.
🔴
Współpracą z zespołami technicznymi i biznesowymi przy definiowaniu wymagań oraz dostarcza
Oczekuje się, że będziesz aktywnie uczestniczyć w procesie zbierania wymagań, co może oznaczać dużo spotkań i potencjalnie niejasne oczekiwania.