Data Engineer z GCP (f/m/x)
Sii Sp. z o.o.
⚲ Białystok, Centrum, Bydgoszcz, Gdańsk, Oliwa, Katowice, Kraków, Podgórze, Lublin, Łódź, Śródmieście, Piła, Poznań, Wilda, Rzeszów, Szczecin, Toruń, Warszawa, Mokotów, Wrocław, Fabryczna
Wymagania
- BigQuery
- Cloud Computing
- SQL
- Python
- IaC (Infrastructure as Code)
- Google Cloud Platform
- Terraform
- Data Built Tool
- Apache Spark
- Databricks
- Snowflake
- Microsoft Fabric
- Apache Airflow
- Cloud Compose
Opis stanowiska
Nasze wymagania: Min. 4 lata doświadczenia w roli Data Engineer lub na podobnym stanowisku przy pracy z danymi w środowisku produkcyjnym Bardzo dobra znajomość Google Cloud Platform, w szczególności: BigQuery (modelowanie danych, optymalizacja zapytań) oraz Cloud Storage Umiejętność projektowania, budowy i utrzymania pipeline’ów danych (batch i/lub streaming) Bardzo dobra znajomość SQL oraz Pythona w kontekście przetwarzania i orkiestracji danych Doświadczenie w obszarze orkiestracji workflow (Apache Airflow / Cloud Composer) Praktyka w implementacji CI/CD dla rozwiązań data, np. GitHub Actions, GitLab CI, Cloud Build Znajomość podejścia Infrastructure as Code, ze wskazaniem na Terraform Wcześniejsza praca z dużymi wolumenami danych, z uwzględnieniem wydajności i niezawodności rozwiązań Swobodna komunikacja w języku angielskim Wymagane przebywanie na terenie Polski oraz płynna znajomość języka polskiego Mile widziane: Praktyczne doświadczenie w przetwarzaniu danych streamingowych (np. Dataflow / Apache Beam, Pub/Sub) Biegłość w Apache Spark / PySpark przy pracy z dużymi wolumenami danych Kompetencje w zakresie transformacji i modelowania danych z wykorzystaniem narzędzi takich jak dbt Umiejętność pracy z różnorodnymi platformami danych (np. Databricks, Snowflake, MS Fabric) Orientacja w narzędziach oraz dobrych praktykach z obszaru Data Governance, Data Lineage i Data Quality O projekcie: Chcesz rozwijać się w technologiach chmurowych i pracować na realnych danych? Dołącz do naszego zespołu Data & Analytics, gdzie budujemy i rozwijamy rozwiązania oparte na GCP. Pracuj z ekspertami, rozwijaj się w kierunku Data Engineeringu, Big Data lub Machine Learningu i miej realny wpływ na projekty. Zakres obowiązków: Projektowanie, implementacja i utrzymanie skalowalnych pipeline’ów danych w oparciu o Google Cloud Platform Praca z BigQuery jako główną hurtownią danych: modelowanie danych, optymalizacja zapytań i kosztów, dbanie o wydajność oraz niezawodność rozwiązań Integracja danych z różnych źródeł (pliki, bazy danych, API, eventy) oraz ich przetwarzanie i transformacja Orkiestracja workflow danych przy użyciu Apache Airflow / Cloud Composer Tworzenie i utrzymanie rozwiązań CI/CD dla pipeline’ów danych oraz infrastruktury Zarządzanie infrastrukturą w chmurze zgodnie z podejściem Infrastructure as Code (Terraform) Zapewnienie jakości danych, monitoringu pipeline’ów oraz szybkiego reagowania na incydenty Współpraca z zespołami analitycznymi, BI i produktowymi w celu dostarczania stabilnych i dobrze udokumentowanych danych Udział w rozwoju architektury danych oraz wspólne definiowanie dobrych praktyk data engineeringowych Oferujemy: Great Place to Work since 2015 - it’s thanks to feedback from our workers that we get this special title and constantly implement new ideas Employment stability - revenue of PLN 2.1BN, no debts, since 2006 on the market We share the profit with Workers - over PLN 76M has already been allocated for this aim since 2022 Attractive benefits package - private healthcare, benefits cafeteria platform, car discounts and more Comfortable workplace – class A offices or remote work Dozens of fascinating projects for prestigious brands from all over the world – you can change them thanks to Job Changer application PLN 1 000 000 per year for your ideas - with this amount, we support the passions and voluntary actions of our workers Investment in your growth – meetups, webinars, training platform and technology blog – you choose Fantastic atmosphere created by all Sii Power People