Data Reliability & Governance
Daten, auf die Verlass ist. Wir implementieren automatisches Monitoring, Qualitäts-Checks und klare Zugriffsberechtigungen, damit die Daten-Infrastruktur skalierbar bleibt.
- dbt
- Great Expectations
- Monte Carlo
- Soda
- BigQuery
- Slack Alerts
Was wir bauen
Irgendwann vertraut niemand mehr den Zahlen. Marketing sagt 500 Leads, CRM zeigt 320, Finance kennt 280 bezahlte Kunden. Alle haben Recht, und alle haben Unrecht. Das Problem ist nicht, welches System stimmt. Das Problem ist, dass niemand definiert hat, was „Lead" bedeutet. Und dass niemand dafür verantwortlich ist, sicherzustellen, dass die Definition überall gleich umgesetzt wird.
Data Reliability & Governance ist die strukturelle Antwort: klare Definitionen, automatische Datenqualitäts-Tests, dokumentierte Prozesse und ein Zugriffsmodell, das verhindert, dass jemand aus Versehen produktive Dashboards kaputt macht.
Für wen?
Unternehmen mit Zahlen-Konflikten
Interne Meetings beginnen regelmäßig damit, welche Zahlen „die richtigen" sind. Das ist kein Datenproblem, das ist ein Governance-Problem. Und es kostet mehr Zeit als die Lösung.
BI-Teams mit Quellen-Last
Kämpfen mit schlechter Datenqualität aus Marketing-Systemen. Wenn die Upstream-Daten nicht verlässlich sind, ist jede Analyse nur so gut wie ihre schlechteste Quelle.
Skalierende Unternehmen
Das bisherige „jeder macht irgendwie Daten" funktioniert nicht mehr. Ab einer bestimmten Größe braucht Data eine eigene Governance-Struktur.
Pre-Data-Lake-Teams
Stehen vor dem Aufbau eines Data Lakes und wollen sicherstellen, dass die Grundlage stimmt, bevor sie skalieren.
Die drei Säulen des Service
Definitionen & Business-Glossar
Wenn „Lead" in Marketing, CRM und Finance dreimal etwas anderes bedeutet, hilft kein Dashboard. Wir bringen Stakeholder in einen Raum, definieren die zentralen Metriken einmal verbindlich und legen sie an einer Stelle ab, auf die alle nachgelagerten Systeme verweisen können.
Was wir konkret machen:
- Stakeholder-Mapping: wer entscheidet auf Basis welcher Metrik
- Business-Glossar mit verbindlichen Definitionen für Lead, MQL, SQL, Conversion, Revenue
- Mapping der Definitionen auf die konkreten Felder in GA4, CRM und ERP
- Change-Management-Prozess für Definitions-Updates
Tools: Notion / Confluence, dbt docs, DataHub
Automatisches Datenqualitäts-Monitoring
Definitionen ohne Tests werden wieder weich. Wir bauen automatische Checks für die kritischen Pipelines. Vollständigkeit, Freshness, Plausibilität, und sorgen dafür, dass Auffälligkeiten als Slack-Alert ankommen, bevor sie in einem Dashboard sichtbar werden.
Was wir konkret machen:
- Definition der kritischen Tests pro Pipeline (Marketing, Revenue, Product)
- Implementierung in dbt tests oder Great Expectations
- Slack- oder E-Mail-Alerting mit Diagnose-Kontext (was, seit wann, Severity)
- Datenqualitäts-Dashboard: welche Quellen sind grün, welche brauchen Eingriff
Tools: dbt tests, Great Expectations, BigQuery, Slack Alerts
Schema-Kontrolle & Zugriffsmodell
Skalierende Daten-Setups scheitern selten an Tools, sie scheitern daran, dass jemand aus Versehen ein Schema ändert oder einen Production-View überschreibt. Ein klares RBAC-Modell und Schema-Change-Management schliessen diese Lücke.
Was wir konkret machen:
- Audit bestehender Zugriffsrechte: wer sieht was, wer kann was ändern
- RBAC-Design für Data Lake und BI-Tools (BigQuery, Snowflake, Power BI)
- Schema-Change-Management mit Review-Gates für breaking Changes
- Datenkatalog mit Owner-Zuordnung pro Tabelle
Tools: BigQuery IAM, dbt, DataHub, OpenMetadata
Deliverables
Joint engagement mit klarer Verantwortungs-Trennung. Datascale liefert Definitionen, Schema-Architektur und Governance-Prozesse, Saloid die technische Implementation.
Datenqualitäts-Monitoring
- Automatische Tests für kritische Datenpipelines (Vollständigkeit, Freshness, Plausibilität)
- Alerting bei Datenqualitäts-Problemen via Slack oder E-Mail
- Datenqualitäts-Dashboard: welche Quellen liefern zuverlässig, welche haben Probleme
Schema-Kontrolle & Dokumentation
- Datenkatalog: alle relevanten Datenquellen, Tabellen, Felder, beschrieben und versioniert
- Business-Glossar: Was bedeutet „Conversion"? Was bedeutet „Lead"? Einmal definiert, überall gültig
- Schema-Change-Management: Prozess für Änderungen die Downstream-Reports brechen können
Rollen- & Zugriffsmodell
- Audit bestehender Zugriffsrechte: wer sieht was, wer kann was ändern
- RBAC-Design (Role-Based Access Control) für Data Lake und BI-Tools
- Implementierung in BigQuery, Snowflake oder Power BI
Governance-Prozesse
- Data Owner Definition: wer ist verantwortlich für welche Daten
- Change-Management-Prozess für Metriken-Änderungen
- Onboarding-Prozess für neue Datenquellen
Tools & Stack
Definitionen & Business-Glossar
- Notion oder Confluence für Glossar-Pflege
- dbt docs für technische Definitionen am Modell
- DataHub oder OpenMetadata als Datenkatalog
- Stakeholder-Workshop-Format für Definitions-Alignment
Monitoring & Alerting
- dbt tests (Vollständigkeit, Freshness, Plausibilität)
- Great Expectations für komplexere Test-Suiten
- BigQuery EU-Region für Test-Ausführung
- Slack-Alerts mit Severity und Diagnose-Kontext
Schema & Zugriffsmodell
- BigQuery IAM oder Snowflake RBAC
- Schema-Change-Management mit Review-Gates für breaking Changes
- Owner-Zuordnung pro Tabelle im Datenkatalog
- Audit-Logs für produktive Pipelines
Engagement-Tiefen
Drei Tiefen. Klare Scopes.
Kein Retainer ohne Bedarf.
Audit Sprint
Wir prüfen was falsch läuft. Report + priorisierter Handlungsplan.
zzgl. gesetzlicher MwSt. · Festpreis für klar begrenzten Scope
Eingeschlossen im Festpreis
- 1 Domain
- 1 Analytics Property
- 1 Tag Manager / Tracking Setup
- 1 CMP
- bis zu 5 Kern-Conversions
- 10 Arbeitstage
- PDF-Report + 90-Min Walkthrough
Lieferumfang
- Vollständige Analyse des bestehenden Setups
- Priorisierter Report mit konkreten Handlungsempfehlungen
- Walkthrough-Call mit dem Team (90 Min)
- Kein Folgevertrag, keine Retainer-Verpflichtung
Wann sinnvoll
Wenn das Setup läuft, aber die Zahlen intern angezweifelt werden. Oder wenn nach einer UA→GA4-Migration unklar ist, was davon belastbar geblieben ist.
Für E-Commerce, mehrere Domains oder App + Web: Audit Sprint Plus, 3.900 € netto Festpreis. Bonus: 50 % des Audit Sprint werden auf einen Build Sprint angerechnet, wenn innerhalb von 30 Tagen beauftragt.
Audit Sprint anfragenBuild Sprint
Neuaufbau oder Restrukturierung eines Tracking-Setups.
zzgl. gesetzlicher MwSt. · finaler Festpreis nach Scope-Definition
Typischer Scope
- 1 Domain (Multi-Domain auf Anfrage)
- 1 Analytics-Property (GA4 oder Piwik PRO)
- Server-Side Container (Stape oder eigene Cloud)
- 1 CMP mit Consent Mode V2
- bis zu 15 Events / Conversions
- 4–8 Wochen Umsetzung
- Blueprint, QA-Sign-off, Handover-Doku
Lieferumfang
- Measurement Blueprint für das Dev-Team
- GTM + Server-Side Setup inkl. CMP-Integration
- Vollständige QA gegen Blueprint mit Sign-off
- Handover-Dokumentation + 30 Tage Post-Launch Support
Wann sinnvoll
Wenn Analytics strukturell falsch aufgebaut ist und Reparieren im laufenden Betrieb mehr kostet als ein sauberer Neuaufbau.
Managed Evolution
Laufende Partnerschaft. Analytics als Produkt, nicht als Einmal-Projekt.
zzgl. gesetzlicher MwSt. · monatlich kündbar nach Mindestlaufzeit
Im Monatspreis enthalten
- bis zu 3 Domains in laufender Betreuung
- Wartung von GA4 + Server-Side Stack
- monatliche Roadmap + Sprint-Planung
- QA bei jedem Release-Deploy
- Slack-Kanal, < 4 h Response (Mo–Fr)
- monatlicher Report + Executive-Summary
- 3 Monate Mindestlaufzeit, dann monatlich
Lieferumfang
- Monatliche Entwicklung + Feature-Rollouts
- Laufende QA bei jedem Deploy
- Executive-Reports + Dashboard-Evolution
- Slack-Support mit garantierten Response-Zeiten
Wann sinnvoll
Wenn Analytics laufend mitwachsen muss. Neue Kampagnen, neue Produkte, neue Datenquellen, und der Aufbau eines internen Teams kommt nicht in Frage.
Alle Preise netto, zzgl. gesetzlicher MwSt. Für Unternehmen in Deutschland, Österreich und der Schweiz.
Full-Cycle Delivery. Wer macht was
Datascale verantwortet
- Audit der Analytics-Datenqualität (GA4, Plausible, App-Tracking)
- Business-Glossar: Definition von KPIs die Marketing und Finance teilen
- Datenqualitäts-Dashboard für Marketing-relevante Metriken
Saloid liefert
- Automatische Datenqualitäts-Tests in dbt (Vollständigkeit, Freshness, Plausibilität)
- Schema-Change-Management und Versionierung
- RBAC-Implementierung in BigQuery / Snowflake
- Datenkatalog und technische Dokumentation
- dbt tests
- BigQuery IAM
- DataHub / OpenMetadata
- Slack Alerting
B2B SaaS. Einheitliche Definition von "MQL" und "SQL" in Marketing, CRM und Finance. Diskussionen über "welche Zahlen stimmen" von wöchentlich auf null reduziert.
Saloid: Data Engineering & Analytics Implementation-
Was unterscheidet Data Reliability von klassischer Datenqualität?
Datenqualität misst einzelne Werte (Vollständigkeit, Format, Range). Data Reliability garantiert, dass eine Definition über mehrere Systeme hinweg dasselbe bedeutet, und dass automatische Tests dafür sorgen, dass es so bleibt, wenn jemand ein Schema ändert oder eine neue Quelle anbindet. Datenqualität ist eine Momentaufnahme, Data Reliability ist ein Prozess.
-
Brauchen wir vorher schon einen Data Lake oder ein Lakehouse?
Nein. Wir starten mit den Quellen, die bereits existieren. GA4, Plausible, CRM-Export, Ads-APIs. Wenn sich im Audit zeigt, dass ein zentraler Layer fehlt, ist das eine Empfehlung, kein Vorab-Investment. Viele Reliability-Probleme lassen sich auch ohne Lakehouse adressieren, sofern Definitionen und Tests einmal sauber dokumentiert sind.
-
Wer übernimmt die laufende Data-Steward-Rolle nach dem Setup?
Eine interne Person aus dem Daten- oder Analytics-Team. Wir bauen das Framework, dokumentieren die Prozesse und schulen den ersten Steward, aber Governance funktioniert nur, wenn sie intern verankert ist. Externe Steward-Rollen halten erfahrungsgemäß keine 12 Monate.
-
Wie lange dauert es, bis die ersten Quality-Alerts laufen?
Nach einem Audit-Sprint von 2 Wochen sind die kritischsten 3–5 Pipelines mit Alerts ausgestattet. Der vollständige Build mit Datenkatalog, RBAC-Modell und Governance-Prozessen läuft typischerweise als Build Sprint über 4–8 Wochen, gemeinsam mit Saloid für die technische Implementation.
Nächster Schritt
Daten, auf die das Team Verlass hat.
Strategie-Gespräch zu Monitoring, Qualitäts-Checks und Zugriffs-Architektur. Full-Cycle Implementation gemeinsam mit Saloid.