Dewei Zhai

/cv

De pijn uit je data halen — op elke schaal.

8+ jaar ervaring met 500TB–1PB datalakes op AWS, Azure, GCP en Alibaba Cloud — lang genoeg om de meeste fouten die jij nog gaat maken al gemaakt én opgelost te hebben.

Wat ik verkoop is zekerheid: het soort dat je verdient met idempotente ETL, platformbrede datakwaliteit, en de telefoontjes om 2 uur ’s nachts.

Projectwerk of langere engagements — beide prima. Wat ik niet aanneem, is werk dat ik niet zelf van begin tot eind kan begeleiden.

Track record

  1. 2026 — now

    Platform Architect (Azure + Alibaba Cloud) Enyquant

    Enige hands-on architect voor een dual-region Lakehouse (Azure EU + Alibaba Cloud China) bij een AI-first startup in energy trading. 100% IaC (CDKTF + Terraform), event-driven serverless pipelines, multi-team IAM. AI-augmented engineering practice opgezet (~3× delivery throughput).

  2. 2024 — 2025

    Lead Data Engineer (AWS Datalake) PVH Corp · 2nd engagement

    500+TB AWS data lake, 90+ bronnen, 1000+ datasets. Lead op ETL, platformarchitectuur, CI/CD, datakwaliteit. Real-time GDPR (de)anonimisatie-service: latency 2u → real-time, kosten 10× lager.

  3. 2022 — 2024

    Data Engineer & Infra Admin VodafoneZiggo

    1PB+ datalake. Snowflake-migratie vanaf Oracle DWH, CDC-ingestie (DMS), AWS IaC (CDK + Terraform). Nieuwe CI/CD ingevoerd die het team 60+ uur scheelde.

  4. 2020 — 2022

    Lead Data Engineer (AWS Datalake) PVH Corp · 1st engagement

    Data lake gemigreerd van Hadoop naar AWS. Externe integraties ontworpen (Adobe, Salesforce, SAP). Self-service analytics gebouwd: TTM van 2 weken naar 10 minuten.

  5. 2018 — 2020

    Data DevOps Engineer FedEx Digital

    ETL pipelines op AWS & GCP, data-science modellen geproductiseerd, Kinesis-based streaming.

  6. 2016 — 2018

    Data Engineer / Hadoop Admin ABN AMRO

    Hadoop-beheer, Hive/Spark ETL.

  7. 2016 — 2018

    Data Engineer / Hadoop Admin KPN

    Hadoop-beheer, Hive/Spark ETL, automatisering met Ansible & Jenkins.

Geselecteerd werk

De cases hieronder zijn openbaar; referenties met namen erbij op aanvraag.

Tech stack

Cloud
AWS (deepest), Azure, Alibaba Cloud, GCP
Lakehouse
Databricks, Snowflake, Unity Catalog, Iceberg, DuckDB
ETL
Spark, dbt, Glue, Kafka, AWS DMS (CDC)
Languages
Python, SQL, TypeScript, Scala, Shell, Solidity, Cython
Orchestration
Airflow, ADF, Step Functions, DataWorks, Oozie
IaC
Terraform, AWS CDK, CDKTF, Ansible
CICD
GitHub Actions, GitLab CI/CD, Jenkins
Quality
PyDeequ, Great Expectations

Certificeringen

Opleiding

MSc, Communication & Information Systems — Xidian University, China. IDW-evaluatie: gelijkwaardig aan MSc Computing Science (NL).