Van eerste opzet naar professionele data-architectuur in 2 dagen
Enter Digital werkte aan e-mailcampagne-analyses voor een klant. Er was al een eerste versie van een ETL-script dat CSV-bronbestanden inlaadde in BigQuery, maar de structuur ontbrak om betrouwbare business insights te genereren. Digitaal strateeg Rutger Meekers zocht een specialist om de bestaande opzet te professionaliseren.
De uitdaging: een werkend script, maar geen architectuur
De basis was er: vijf CSV-bronbestanden met meer dan 500 MB aan mailingdata, ontvangstrecords, kliks en bedrijfsgegevens, en een script dat deze data in BigQuery laadde. Maar er was geen gelaagd datamodel, geen bedrijfslogica, en geen voorberekende metrieken. Elke analyse vereiste complexe queries rechtstreeks op de ruwe data.
“De data stond in BigQuery, maar we misten de structuur om er echt mee te sturen. We hadden iemand nodig die de brug kon slaan tussen de ruwe data en bruikbare inzichten.”
— Rutger Meekers, Digitaal Strateeg, Enter Digital
De oplossing: medallion-architectuur
In twee dagen professionaliseerde Xudo de bestaande pipeline naar een volwaardige medallion-architectuur in BigQuery:
- Bronze laag — De bestaande CSV-ingestie aangevuld met basistransformaties: datumparsing, taaldetectie, tag-splitsing en deduplicatie
- Silver laag — Verrijkte facttabellen met bedrijfslogica
- Gold laag — 16 voorberekende metriekentabellen, geoptimaliseerd voor directe dashboardqueries
Het resultaat: 26 goed gedocumenteerde tabellen, circa 750 regels productie-SQL en een geautomatiseerd orchestratiescript dat de hele pipeline in enkele minuten draait.
Klaar voor Looker Studio
Alle zware berekeningen gebeuren in BigQuery. De gold-tabellen zijn zo ontworpen dat Looker Studio er direct op kan aansluiten — zonder joins, zonder berekeningen, zonder complexe filters. Enter Digital kon meteen aan de slag met het bouwen van dashboards voor:
- Campagneprestaties — Open rates, click rates, CTOR en uitschrijfpercentages per mailing
- E-maildruk analyse — Hoeveel mails ontvangt elke ontvanger per week/maand?
- Bedrijfsbenchmarking — Prestaties vergelijken op organisatieniveau
- Trendanalyse — Periode-over-periode vergelijkingen via een ingebouwde datumdimensie
Het resultaat
| Doorlooptijd | 2 dagen |
| Brondata | 507 MB over 5 CSV-bestanden |
| Tabellen | 26 (bronze, silver, gold) |
| Dashboardsnelheid | 100-1000x sneller dan queries op ruwe data |
| Pipeline runtime | 2-5 minuten voor volledige verversing |
“Wouter begeleidde ons dataproject van begin tot eind op een zeer professionele en vakkundige manier. Geen verrassingen, geen vertragingen, gewoon kwaliteit.”