dbt ist die Transformationsschicht im Modern Data Stack, das T in ELT. Statt SQL in BI-Tools oder Skripten zu verstecken, definiert dbt versionierte, getestete Modelle direkt im Warehouse, mit Lineage und Dokumentation.

Brauche ich dbt, oder reicht SQL im BI-Tool?

Für einen einzelnen Report reicht SQL im BI-Tool. Sobald mehrere Quellen, Teams und Dashboards auf denselben Definitionen aufsetzen, wird handgepflegtes SQL zur Fehlerquelle. dbt versioniert die Logik an einer Stelle und testet sie.

dbt Core oder dbt Cloud?

dbt Core ist Open Source und läuft self-hosted, etwa über Dagster oder Airflow orchestriert. dbt Cloud bietet Scheduler, IDE und Hosting. Welche Variante passt, hängt von Team, Governance und vorhandener Orchestrierung ab.

Wie verhindert dbt stille Datenfehler?

Über Tests und Assertions: unique, not_null, accepted_values, Referenz-Checks und eigene Regeln laufen bei jedem Build. Bricht eine Annahme, schlägt der Build fehl, bevor ein falscher Wert im Dashboard landet.

Läuft dbt mit BigQuery?

Ja. dbt läuft nativ auf BigQuery, Snowflake und weiteren Warehouses. Die Modelle werden als SQL im Warehouse selbst ausgeführt, dbt orchestriert nur Reihenfolge, Tests und Doku.

dbt: Transformation & Modelling Setup

dbt ist die Transformationsschicht, die aus rohen Loads ein sauberes, nachvollziehbares Datenmodell macht. Versionierbar, testbar, dokumentiert. Genau das Fundament, auf dem belastbare BI und AI aufsetzen.

Was ist dbt?

dbt ist das T in ELT. Daten landen roh im Warehouse, dbt transformiert sie dort zu versionierten SQL-Modellen, mit Tests, Lineage und Doku. Die Logik lebt nicht mehr verstreut in BI-Tools und Skripten, sondern an einer Stelle, unter Versionskontrolle.

Das klingt nach Engineering-Disziplin, und genau das ist es. Der Effekt: Eine Kennzahl ist überall gleich definiert, ein Fehler ist nachvollziehbar, und neue Teammitglieder lesen das Modell statt es zu raten.

Wann dbt passt, und wann nicht

Sinnvoll, wenn:

mehrere Quellen zu einem konsistenten Modell zusammenlaufen
dieselben Definitionen mehrere Dashboards speisen
Datenqualität und Lineage prüfbar sein müssen
ein Team SQL und git-Disziplin mitbringt

Eher nicht, wenn:

nur ein einzelner Report gebraucht wird
es keine modellierte Datenbasis gibt, die transformiert werden will
niemand die Modelle pflegt

Ohne dbt vs. mit dbt

Kriterium	SQL im BI-Tool	dbt
Definitionen	pro Dashboard dupliziert	einmal, zentral
Tests	manuell, wenn überhaupt	bei jedem Build
Nachvollziehbarkeit	schwer	Lineage und Doku
Versionierung	keine	git
Onboarding	Wissen im Kopf	lesbares Modell

Was Datascale mit dbt baut

Wir setzen das Modell auf und machen es wartbar:

Projektstruktur, Staging- und Mart-Layer
Modelle für die zentralen Marketing- und Revenue-Kennzahlen
Tests gegen stille Datenfehler
Orchestrierung über Dagster oder dbt Cloud
Lineage und Doku für Ihr Team
Anbindung an BI und, wo sinnvoll, an den AI-Layer

Das ganze Bild steht in der Data Reliability & Governance und im Marketing Data Lakehouse. dbt läuft bei uns meist auf BigQuery, gespeist aus Quellen wie funnel.io oder Snowplow.

dbt: Versionierte Transformationsschicht für Ihr Warehouse