Data Warehouse Automation und Life Cycle Management mit AnalyticsCreator
AnalyticsCreator: Auf einen Blick
- 10x schnellerer Aufbau eines State-of-the-Art Data Warehouse: Der hohe Automatisierungsgrad senkt die Entwicklungszeit und Komplexität dramatisch und reduziert das Risiko von Fehlern in der Datenstruktur oder dem Datenfluss (ETL)
- Dauerhafter Nutzen: Auch alle späteren Änderungen und Erweiterungen am Data Warehouse können einfach und sicher mit dem AnalyticsCreator implementiert werden
- Keine Herstellerabhängigkeit: Als Output generiert AnalyticsCreator Standard SQL-Code für die Erstellung des kompletten Data Warehouse für den MS SQL Server inkl. der notwendigen SSIS-Packages für den kompletten ETL-Prozess. Für den Betrieb des Data Warehouse ist AnalyticsCreator nicht mehr notwendig.
- Abbildung des kompletten Lebenszyklus des Data Warehouse: Von der Definition der Datenquellen über die verschiedenen Ebenen der Transformationen und Data Cleansing bis zur Erstellung des DWH nach auswählbaren Methoden, z.B. Kimball oder Data Vault 2.0.
- Mehr als 15 Jahre Erfahrung und Best Practises: In die Generierung des Data Warehouse über AnalyticsCreator fließen mehr als 15 Jahre Erfahrung mit komplexen Data Warehouse Projekten und unzählige Best Practises ein.
- Grafische Modellierung: Die Modellierung des ETL-Prozesses und aller notwendigen Datendefinitionen erfolgt grafisch und über Konfigurationsmasken. Kein händisches Codieren von SQL o.ä.
- Wiederverwendbarkeit und einfache Wartung über Makros: Häufig benötigte SQL-Snippets, z.B. für Transformationen, Formatierungen oder Bereinigungen können als parametrierbare SQL-Makros erstellt und überall per Mausklick verwendet werden.
- Historisierung per Mausklick: Im Quellsystem nicht historisierte Dimensionen und Kennzahlen in einem manuell erstellten Data Warehouse zu historisieren, ist eine zeitraubende Herausforderung. AnalyticsCreator erledigt das per Mausklick.
- Vereinfachter Datenzugriff über Metadaten-Konnektoren: Metadaten-Konnektoren bieten ein vordefiniertes Datenmodell für eine Datenquelle und ermöglichen dadurch eine sehr einfache und intuitive Verwendung. Für bekannte Systeme wie SAP oder MS Dynamics werden diese mitgeliefert, können aber auch selbst definiert werden.
- Hohe Transparenz und keine Notwendigkeit von Spezialisten: Durch die grafische Modellierung bleiben auch sehr große Modelle übersichtlich und für Erweiterungen werden keine teuren SQL Server und Data Warehouse Spezialisten benötigt.
- Reduziertes Risiko bei Data Warehouse Aufbau und Wartung: Als Data Warehouse Entwickler arbeitet man im AnalyticsCreator auf einem abstrahierten Level mit reduzierter Komplexität, was das Projektrisiko und den Aufwand deutlich senkt.
- Validierung vor Deployment: Vor dem Deployment des Data Warehouse auf dem SQL Server wird das komplette Modell auf Konsistenz und Durchgängigkeit geprüft. Auf diese Weise entsteht ein robustes und performantes Data Warehouse.
- Data Warehouse nach anerkannten Methoden: Die Generierung des Data Warehouse aus dem konfigurierten Datenmodell erfolgt mit wenigen Mausklicks und erzeugt wahlweise Code für Methoden wie Kimball, Data Vault 2.0 oder Inmon.
- Unterstützung der EU-DSGVO: Personenbezogene Daten können automatisch anonymisiert werden
- Breite Unterstützung von Datenquellen: z.B. SAP, Oracle, MS SQL, CSV, ODBC, MS Dynamics, uvm.
- Schneller ROI: Durch die dramatisch verkürzten Entwicklungszeiten und den langfristigen Nutzen bringen nicht nur Erstentwicklungen, sondern auch klassische Redesign-Projekte einen schnellen ROI.
Mit dem Data Warehouse steht und fällt das BI- oder Planungsprojekt
Der Aufbau eines Data Warehouse macht 60-80% des Gesamtaufwandes in einem BI-Projekt aus, bei einem Planungsprojekt etwas weniger. Dies schließt die Anbindung der Datenquellen, Definition der Staging-Ebenen und den kompletten ETL-Prozess ein, bis zur Definition der Dimensionen und Fakten als Ergebnis und Grundlage für die Implementierung der Auswertungen.
Ein professionell modelliertes und nach anerkannten Methoden aufgebautes Data Warehouse ist die Grundlage für eine verlässliche und solide Datenbasis (Single Point of Truth). Bei der manuellen Entwicklung eines Data Warehouse werden unzählige Zeilen an SQL-Codes geschrieben und Datenflüsse über die SQL Server Integration Services (SSIS) definiert. Nur sehr erfahrene und damit teure Spezialisten schaffen dies in einer akzeptablen Zeit und Qualität. Schleichen sich hier Fehler ein, dann droht Akzeptanzverlust bei den Anwendern, wenn z.B. die Zahlen nicht stimmen oder die Performance schlecht ist.
Unterstützung des kompletten Data Warehouse Life Cycles
Mit AnalyticsCreator bieten wir ein Tool an, welches den kompletten Entwicklungsprozess des Data Warehouse von der Definition der Datenquellen, über die verschiedenen Staging-Ebenen inkl. der ETL-Prozesse komplett grafisch unterstützt. Als Ergebnis wird ein Data Warehouse Modell wahlweise nach Kimball oder Data Vault generiert, welches robust, performant und konsistent ist.
Vordefinierte Metadaten-Konnektoren, z.B. für SAP oder MS Dynamics, vereinfachen die Modellierung enorm, da sich der Entwickler nicht mit kryptischen Feldnamen oder unbekannten Beziehungen zwischen den Tabellen herumschlagen muss, sondern mit sprechenden Feldnamen und vordefinierten Beziehungen arbeiten kann. Für die Datenintegration mit SAP wird der Theobald-Konnektor unterstützt, d.h. es werden entsprechende SSIS-Packages für Theobald generiert.
Historisierung und Persistierung auf Knopfdruck
Eine Historisierung beliebiger Dimensionen und Fakten kann im AnalyticsCreator mit einem Mausklick aktiviert werden. Dabei kann bis auf Spaltenebene gesteuert werden, ob diese historisiert werden sollen. Bei einer manuellen Data Warehouse Entwicklung kann dies Tage und Wochen dauern und bedeutet einen enormen Mehraufwand für die Wartung.
Gleiches gilt für die Persistierung rechenintensiver SQL-Sichten. Wenn die Daten im Data Warehouse z.B. nur einmal nachts aktualisiert werden, dann kann die Performance beim Zugriff auf rechenintensive SQL-Sichten deutlich gesteigert werden, wenn diese in einem nachgelagerten Schritt persistiert, also als physische Tabellen zwischengespeichert werden. Auch dies wird mit wenigen Mausklicks eingerichtet.
Ergebnis basiert auf Standards
Der generierte Output besteht aus Standard SQL Code für den MS SQL Server für alle notwendigen Tabellen, Sichten, Stored Procedures und SSIS-Packages. Bei Bedarf können sogar Cubes und Dimensionen für ein tabulares oder dimensionales SQL Server Analysis Services (SSAS) Modell erzeugt werden. Für die Verwendung des generierten Data Warehouse ist der AnalyticsCreator nicht mehr notwendig, da es sich um ein reines Design Time Tool handelt (kein Vendor Lock-in).
Dauerhafter Nutzen
Dennoch empfiehlt es sich, den AnalyticsCreator auch für alle späteren Änderungen und Erweiterungen einzusetzen, da auch hier der Fokus auf einer schnellen und fehlerfreien Implementierung liegt. Egal ob nur neue Felder integriert werden müssen oder komplett neue Datenquellen angeschlossen werden, der AnalyticsCreator bietet dem Kunden einen dauerhaften Nutzen. Durch die Konsistenzprüfung vor dem Deployment wird sichergestellt, dass sich keine Fehler im Datenmodell oder in den ETL-Prozessen befinden. Vordefinierte Makros vereinfachen die Wartung zusätzlich, z.B. für Data Cleansing, Transformationen, etc.