Enter Digital werkte aan e-mailcampagne-analyses voor een klant. Er was al een eerste versie van een ETL-script dat CSV-bronbestanden inlaadde in BigQuery, maar de structuur ontbrak om betrouwbare business insights te genereren. Digitaal strateeg Rutger Meekers zocht een specialist om de bestaande opzet te professionaliseren.

De uitdaging: een werkend script, maar geen architectuur

De basis was er: vijf CSV-bronbestanden met meer dan 500 MB aan mailingdata, ontvangstrecords, kliks en bedrijfsgegevens, en een script dat deze data in BigQuery laadde. Maar er was geen gelaagd datamodel, geen bedrijfslogica, en geen voorberekende metrieken. Elke analyse vereiste complexe queries rechtstreeks op de ruwe data.

“De data stond in BigQuery, maar we misten de structuur om er echt mee te sturen. We hadden iemand nodig die de brug kon slaan tussen de ruwe data en bruikbare inzichten.”

— Rutger Meekers, Digitaal Strateeg, Enter Digital

De oplossing: medallion-architectuur

In twee dagen professionaliseerde Xudo de bestaande pipeline naar een volwaardige medallion-architectuur in BigQuery:

  • Bronze laag — De bestaande CSV-ingestie aangevuld met basistransformaties: datumparsing, taaldetectie, tag-splitsing en deduplicatie
  • Silver laag — Verrijkte facttabellen met bedrijfslogica
  • Gold laag — 16 voorberekende metriekentabellen, geoptimaliseerd voor directe dashboardqueries

Het resultaat: 26 goed gedocumenteerde tabellen, circa 750 regels productie-SQL en een geautomatiseerd orchestratiescript dat de hele pipeline in enkele minuten draait.

Klaar voor Looker Studio

Alle zware berekeningen gebeuren in BigQuery. De gold-tabellen zijn zo ontworpen dat Looker Studio er direct op kan aansluiten — zonder joins, zonder berekeningen, zonder complexe filters. Enter Digital kon meteen aan de slag met het bouwen van dashboards voor:

  • Campagneprestaties — Open rates, click rates, CTOR en uitschrijfpercentages per mailing
  • E-maildruk analyse — Hoeveel mails ontvangt elke ontvanger per week/maand?
  • Bedrijfsbenchmarking — Prestaties vergelijken op organisatieniveau
  • Trendanalyse — Periode-over-periode vergelijkingen via een ingebouwde datumdimensie

Het resultaat

Doorlooptijd2 dagen
Brondata507 MB over 5 CSV-bestanden
Tabellen26 (bronze, silver, gold)
Dashboardsnelheid100-1000x sneller dan queries op ruwe data
Pipeline runtime2-5 minuten voor volledige verversing

“Wouter begeleidde ons dataproject van begin tot eind op een zeer professionele en vakkundige manier. Geen verrassingen, geen vertragingen, gewoon kwaliteit.”

Meer weten over Data Engineering?