Was unterscheidet Data Reliability von klassischer Datenqualität?

Datenqualität misst einzelne Werte (Vollständigkeit, Format, Range). Data Reliability garantiert, dass eine Definition über mehrere Systeme hinweg dasselbe bedeutet, und dass automatische Tests dafür sorgen, dass es so bleibt, wenn jemand ein Schema ändert oder eine neue Quelle anbindet. Datenqualität ist eine Momentaufnahme, Data Reliability ist ein Prozess.

Brauchen wir vorher schon einen Data Lake oder ein Lakehouse?

Nein. Wir starten mit den Quellen, die bereits existieren. GA4, Plausible, CRM-Export, Ads-APIs. Wenn sich im Audit zeigt, dass ein zentraler Layer fehlt, ist das eine Empfehlung, kein Vorab-Investment. Viele Reliability-Probleme lassen sich auch ohne Lakehouse adressieren, sofern Definitionen und Tests einmal sauber dokumentiert sind.

Wer übernimmt die laufende Data-Steward-Rolle nach dem Setup?

Eine interne Person aus dem Daten- oder Analytics-Team. Wir bauen das Framework, dokumentieren die Prozesse und schulen den ersten Steward, aber Governance funktioniert nur, wenn sie intern verankert ist. Externe Steward-Rollen halten erfahrungsgemäß keine 12 Monate.

Wie lange dauert es, bis die ersten Quality-Alerts laufen?

Nach einem Audit-Sprint von 2 Wochen sind die kritischsten 3–5 Pipelines mit Alerts ausgestattet. Der vollständige Build mit Datenkatalog, RBAC-Modell und Governance-Prozessen läuft typischerweise als Build Sprint über 4–8 Wochen, gemeinsam mit Saloid für die technische Implementation.

Leistungen

✓ End-to-End-Umsetzung

Data Reliability & Governance

Daten, auf die Verlass ist. Wir implementieren automatisches Monitoring, Qualitäts-Checks und klare Zugriffsberechtigungen, damit die Daten-Infrastruktur skalierbar bleibt.

dbt
Great Expectations
Monte Carlo
Soda
BigQuery
Slack Alerts

Strategie-Gespräch anfragen →

Was wir bauen

Irgendwann vertraut niemand mehr den Zahlen. Marketing sagt 500 Leads, CRM zeigt 320, Finance kennt 280 bezahlte Kunden. Alle haben Recht, und alle haben Unrecht. Das Problem ist nicht, welches System stimmt. Das Problem ist, dass niemand definiert hat, was „Lead" bedeutet. Und dass niemand dafür verantwortlich ist, sicherzustellen, dass die Definition überall gleich umgesetzt wird.

Data Reliability & Governance ist die strukturelle Antwort: klare Definitionen, automatische Datenqualitäts-Tests, dokumentierte Prozesse und ein Zugriffsmodell, das verhindert, dass jemand aus Versehen produktive Dashboards kaputt macht.

Für wen?

Unternehmen mit Zahlen-Konflikten

Interne Meetings beginnen regelmäßig damit, welche Zahlen „die richtigen" sind. Das ist kein Datenproblem, das ist ein Governance-Problem. Und es kostet mehr Zeit als die Lösung.

BI-Teams mit Quellen-Last

Kämpfen mit schlechter Datenqualität aus Marketing-Systemen. Wenn die Upstream-Daten nicht verlässlich sind, ist jede Analyse nur so gut wie ihre schlechteste Quelle.

Skalierende Unternehmen

Das bisherige „jeder macht irgendwie Daten" funktioniert nicht mehr. Ab einer bestimmten Größe braucht Data eine eigene Governance-Struktur.

Pre-Data-Lake-Teams

Stehen vor dem Aufbau eines Data Lakes und wollen sicherstellen, dass die Grundlage stimmt, bevor sie skalieren.

Die drei Säulen des Service

Definitionen & Business-Glossar

Wenn „Lead" in Marketing, CRM und Finance dreimal etwas anderes bedeutet, hilft kein Dashboard. Wir bringen Stakeholder in einen Raum, definieren die zentralen Metriken einmal verbindlich und legen sie an einer Stelle ab, auf die alle nachgelagerten Systeme verweisen können.

Was wir konkret machen:

Stakeholder-Mapping: wer entscheidet auf Basis welcher Metrik
Business-Glossar mit verbindlichen Definitionen für Lead, MQL, SQL, Conversion, Revenue
Mapping der Definitionen auf die konkreten Felder in GA4, CRM und ERP
Change-Management-Prozess für Definitions-Updates

Tools: Notion / Confluence, dbt docs, DataHub

Automatisches Datenqualitäts-Monitoring

Definitionen ohne Tests werden wieder weich. Wir bauen automatische Checks für die kritischen Pipelines. Vollständigkeit, Freshness, Plausibilität, und sorgen dafür, dass Auffälligkeiten als Slack-Alert ankommen, bevor sie in einem Dashboard sichtbar werden.

Was wir konkret machen:

Definition der kritischen Tests pro Pipeline (Marketing, Revenue, Product)
Implementierung in dbt tests oder Great Expectations
Slack- oder E-Mail-Alerting mit Diagnose-Kontext (was, seit wann, Severity)
Datenqualitäts-Dashboard: welche Quellen sind grün, welche brauchen Eingriff

Tools: dbt tests, Great Expectations, BigQuery, Slack Alerts

Schema-Kontrolle & Zugriffsmodell

Skalierende Daten-Setups scheitern selten an Tools, sie scheitern daran, dass jemand aus Versehen ein Schema ändert oder einen Production-View überschreibt. Ein klares RBAC-Modell und Schema-Change-Management schliessen diese Lücke.

Was wir konkret machen:

Audit bestehender Zugriffsrechte: wer sieht was, wer kann was ändern
RBAC-Design für Data Lake und BI-Tools (BigQuery, Snowflake, Power BI)
Schema-Change-Management mit Review-Gates für breaking Changes
Datenkatalog mit Owner-Zuordnung pro Tabelle

Tools: BigQuery IAM, dbt, DataHub, OpenMetadata

Deliverables

Joint engagement mit klarer Verantwortungs-Trennung. Datascale liefert Definitionen, Schema-Architektur und Governance-Prozesse, Saloid die technische Implementation.

Datenqualitäts-Monitoring

Automatische Tests für kritische Datenpipelines (Vollständigkeit, Freshness, Plausibilität)
Alerting bei Datenqualitäts-Problemen via Slack oder E-Mail
Datenqualitäts-Dashboard: welche Quellen liefern zuverlässig, welche haben Probleme

Schema-Kontrolle & Dokumentation

Datenkatalog: alle relevanten Datenquellen, Tabellen, Felder, beschrieben und versioniert
Business-Glossar: Was bedeutet „Conversion"? Was bedeutet „Lead"? Einmal definiert, überall gültig
Schema-Change-Management: Prozess für Änderungen die Downstream-Reports brechen können

Rollen- & Zugriffsmodell

Audit bestehender Zugriffsrechte: wer sieht was, wer kann was ändern
RBAC-Design (Role-Based Access Control) für Data Lake und BI-Tools
Implementierung in BigQuery, Snowflake oder Power BI

Governance-Prozesse

Data Owner Definition: wer ist verantwortlich für welche Daten
Change-Management-Prozess für Metriken-Änderungen
Onboarding-Prozess für neue Datenquellen

Tools & Stack

Definitionen & Business-Glossar

Notion oder Confluence für Glossar-Pflege
dbt docs für technische Definitionen am Modell
DataHub oder OpenMetadata als Datenkatalog
Stakeholder-Workshop-Format für Definitions-Alignment

Monitoring & Alerting

dbt tests (Vollständigkeit, Freshness, Plausibilität)
Great Expectations für komplexere Test-Suiten
BigQuery EU-Region für Test-Ausführung
Slack-Alerts mit Severity und Diagnose-Kontext

Schema & Zugriffsmodell

BigQuery IAM oder Snowflake RBAC
Schema-Change-Management mit Review-Gates für breaking Changes
Owner-Zuordnung pro Tabelle im Datenkatalog
Audit-Logs für produktive Pipelines

Engagement-Tiefen

Drei Tiefen. Klare Scopes.
Kein Retainer ohne Bedarf.

Hier starten →

Audit Sprint

Wir prüfen was falsch läuft. Report + priorisierter Handlungsplan.

Dauer: 10 Arbeitstage
Preis: 2.400 € netto

zzgl. gesetzlicher MwSt. · Festpreis für klar begrenzten Scope

Eingeschlossen im Festpreis

1 Domain
1 Analytics Property
1 Tag Manager / Tracking Setup
1 CMP
bis zu 5 Kern-Conversions
10 Arbeitstage
PDF-Report + 90-Min Walkthrough

Lieferumfang

Vollständige Analyse des bestehenden Setups
Priorisierter Report mit konkreten Handlungsempfehlungen
Walkthrough-Call mit dem Team (90 Min)
Kein Folgevertrag, keine Retainer-Verpflichtung

Wann sinnvoll

Wenn das Setup läuft, aber die Zahlen intern angezweifelt werden. Oder wenn nach einer UA→GA4-Migration unklar ist, was davon belastbar geblieben ist.

Für E-Commerce, mehrere Domains oder App + Web: Audit Sprint Plus, 3.900 € netto Festpreis. Bonus: 50 % des Audit Sprint werden auf einen Build Sprint angerechnet, wenn innerhalb von 30 Tagen beauftragt.

Audit Sprint anfragen

Build Sprint

Neuaufbau oder Restrukturierung eines Tracking-Setups.

Dauer: 4–8 Wochen
Preis: ab 7.500 € netto

zzgl. gesetzlicher MwSt. · finaler Festpreis nach Scope-Definition

Typischer Scope

1 Domain (Multi-Domain auf Anfrage)
1 Analytics-Property (GA4 oder Piwik PRO)
Server-Side Container (Stape oder eigene Cloud)
1 CMP mit Consent Mode V2
bis zu 15 Events / Conversions
4–8 Wochen Umsetzung
Blueprint, QA-Sign-off, Handover-Doku

Lieferumfang

Measurement Blueprint für das Dev-Team
GTM + Server-Side Setup inkl. CMP-Integration
Vollständige QA gegen Blueprint mit Sign-off
Handover-Dokumentation + 30 Tage Post-Launch Support

Wann sinnvoll

Wenn Analytics strukturell falsch aufgebaut ist und Reparieren im laufenden Betrieb mehr kostet als ein sauberer Neuaufbau.

Build nach Audit besprechen

Managed Evolution

Laufende Partnerschaft. Analytics als Produkt, nicht als Einmal-Projekt.

Dauer: ab 3 Monate Mindestlaufzeit
Preis: ab 3.500 € / Monat netto

zzgl. gesetzlicher MwSt. · monatlich kündbar nach Mindestlaufzeit

Im Monatspreis enthalten

bis zu 3 Domains in laufender Betreuung
Wartung von GA4 + Server-Side Stack
monatliche Roadmap + Sprint-Planung
QA bei jedem Release-Deploy
Slack-Kanal, < 4 h Response (Mo–Fr)
monatlicher Report + Executive-Summary
3 Monate Mindestlaufzeit, dann monatlich

Lieferumfang

Monatliche Entwicklung + Feature-Rollouts
Laufende QA bei jedem Deploy
Executive-Reports + Dashboard-Evolution
Slack-Support mit garantierten Response-Zeiten

Wann sinnvoll

Wenn Analytics laufend mitwachsen muss. Neue Kampagnen, neue Produkte, neue Datenquellen, und der Aufbau eines internen Teams kommt nicht in Frage.

Laufende Betreuung besprechen

Alle Preise netto, zzgl. gesetzlicher MwSt. Für Unternehmen in Deutschland, Österreich und der Schweiz.

Full-Cycle Delivery. Wer macht was

Datascale verantwortet

Audit der Analytics-Datenqualität (GA4, Plausible, App-Tracking)
Business-Glossar: Definition von KPIs die Marketing und Finance teilen
Datenqualitäts-Dashboard für Marketing-relevante Metriken

Saloid liefert

Automatische Datenqualitäts-Tests in dbt (Vollständigkeit, Freshness, Plausibilität)
Schema-Change-Management und Versionierung
RBAC-Implementierung in BigQuery / Snowflake
Datenkatalog und technische Dokumentation

dbt tests
BigQuery IAM
DataHub / OpenMetadata
Slack Alerting

B2B SaaS. Einheitliche Definition von "MQL" und "SQL" in Marketing, CRM und Finance. Diskussionen über "welche Zahlen stimmen" von wöchentlich auf null reduziert.

Saloid: Data Engineering & Analytics Implementation

Q01
Was unterscheidet Data Reliability von klassischer Datenqualität?

Datenqualität misst einzelne Werte (Vollständigkeit, Format, Range). Data Reliability garantiert, dass eine Definition über mehrere Systeme hinweg dasselbe bedeutet, und dass automatische Tests dafür sorgen, dass es so bleibt, wenn jemand ein Schema ändert oder eine neue Quelle anbindet. Datenqualität ist eine Momentaufnahme, Data Reliability ist ein Prozess.
Q02
Brauchen wir vorher schon einen Data Lake oder ein Lakehouse?

Nein. Wir starten mit den Quellen, die bereits existieren. GA4, Plausible, CRM-Export, Ads-APIs. Wenn sich im Audit zeigt, dass ein zentraler Layer fehlt, ist das eine Empfehlung, kein Vorab-Investment. Viele Reliability-Probleme lassen sich auch ohne Lakehouse adressieren, sofern Definitionen und Tests einmal sauber dokumentiert sind.
Q03
Wer übernimmt die laufende Data-Steward-Rolle nach dem Setup?

Eine interne Person aus dem Daten- oder Analytics-Team. Wir bauen das Framework, dokumentieren die Prozesse und schulen den ersten Steward, aber Governance funktioniert nur, wenn sie intern verankert ist. Externe Steward-Rollen halten erfahrungsgemäß keine 12 Monate.
Q04
Wie lange dauert es, bis die ersten Quality-Alerts laufen?

Nach einem Audit-Sprint von 2 Wochen sind die kritischsten 3–5 Pipelines mit Alerts ausgestattet. Der vollständige Build mit Datenkatalog, RBAC-Modell und Governance-Prozessen läuft typischerweise als Build Sprint über 4–8 Wochen, gemeinsam mit Saloid für die technische Implementation.

Nächster Schritt

Daten, auf die das Team Verlass hat.

Strategie-Gespräch zu Monitoring, Qualitäts-Checks und Zugriffs-Architektur. Full-Cycle Implementation gemeinsam mit Saloid.

Strategie-Gespräch anfragen → hello@datascale.de

Data Reliability & Governance

Was wir bauen

Für wen?

Die drei Säulen des Service

Definitionen & Business-Glossar

Automatisches Datenqualitäts-Monitoring

Schema-Kontrolle & Zugriffsmodell

Deliverables

Datenqualitäts-Monitoring

Schema-Kontrolle & Dokumentation

Rollen- & Zugriffsmodell

Governance-Prozesse

Tools & Stack

Definitionen & Business-Glossar

Monitoring & Alerting

Schema & Zugriffsmodell

Drei Tiefen. Klare Scopes.Kein Retainer ohne Bedarf.

Full-Cycle Delivery. Wer macht was

Datascale verantwortet

Saloid liefert

Measurement Health Check

Daten, auf die das Team Verlass hat.

Drei Tiefen. Klare Scopes.
Kein Retainer ohne Bedarf.