JustJoin.IT Praca zdalna Mid

Mid Data Engineer with German

Link Group

⚲ Warszawa, Gdańsk, Białystok, Olsztyn, Szczecin, Łódź, Poznań, Kraków, Lublin, Wrocław

120 - 140 PLN/h netto (B2B)

Wymagania

  • PySpark
  • Data
  • SQL
  • Python

Opis stanowiska

Responsibilities • Design, build, and maintain scalable data pipelines and Big Data solutions • Develop and optimize ETL/ELT processes • Work with structured, semi-structured, and unstructured datasets • Build and maintain data models and data warehousing solutions • Develop distributed data processing solutions using modern Big Data technologies • Collaborate with cross-functional teams, including Data Scientists, Analysts, and Software Engineers • Ensure high quality, reliability, and performance of data solutions • Participate in cloud-based data platform development and optimization • Contribute to software engineering best practices and code quality improvements Requirements • At least 4 years of experience in Data Engineering • At least 3 years of hands-on experience in Big Data environments • Strong knowledge of:• SQL, • Python, • PySpark • Experience with: • data warehousing, • data pipelines, • distributed data processing, • data modeling concepts • Experience working with: • structured, • semi-structured, • unstructured data • Experience with at least one public cloud platform: • Azure or AWS • Very good German (spoken and written) • Very good English (spoken and written) Nice to Have • Experience with Databricks, Hadoop ecosystem, or streaming solutions • Experience working in Agile environments • Understanding of software engineering best practices and CI/CD concepts

🔍 Dekoder Ogłoszenia

🔴
Contribute to software engineering best practices and code quality improvements
Może oznaczać, że firma nie ma jeszcze ugruntowanych dobrych praktyk i oczekuje od kandydata ich wdrażania od zera.
🔴
Participate in cloud-based data platform development and optimization
Może oznaczać pracę nad istniejącą, ale niekoniecznie dobrze zaprojektowaną lub zoptymalizowaną platformą chmurową.
🔴
Work with structured, semi-structured, and unstructured datasets
Może oznaczać, że dane są w bardzo różnym stanie i wymagają znaczącego wysiłku w celu ich uporządkowania i przetworzenia.
🟡
Collaborate with cross-functional teams, including Data Scientists, Analysts, and Software Engineers
Może oznaczać, że będziesz musiał tłumaczyć techniczne aspekty danych na język zrozumiały dla osób nietechnicznych, a także rozwiązywać konflikty między różnymi zespołami.
🟡
Ensure high quality, reliability, and performance of data solutions
Jest to standardowe wymaganie, ale w praktyce może oznaczać, że obecne rozwiązania mają problemy z jakością, niezawodnością lub wydajnością.