Data Warehouse = AnalyticsCreator
Das Data Warehouse stellt die Achillesverse in BI, Reporting- und Analyseprojekten dar. Nur ein verlässliches Data Warehouse (Single Point of Truth) kann Daten aus verschiedenen heterogenen Datenquellen effizient kombinieren, transformieren, konsolidieren und als zuverlässige Datenbasis für Auswertungen und Analysen aller Art bereitstellen.
Um den ETL-Prozess (Extract – Transform – Load) nachvollziehbar und effizient abbilden zu können, sind verschiedene Staging-Layer erforderlich, bis aus den meist relationalen Ursprungsdaten verwertbare Informationen in Form eines analytischen Modells für Kennzahlen-Cubes (Fakten) und Dimensionen werden.
Ein Data Warehouse stellt daher ein komplexes Werk dar, welches aus Konnektoren, Datenstrukturen und Transformationslogik besteht. Nur wenn all diese Komponenten fehlerfrei, performant und stabil zusammenarbeiten, entsteht eine zuverlässige Datenbasis für das BI-Projekt.
Als Datenbankserver für das Data Warehouse hat sich der Microsoft SQL Server bestens in der Praxis bewährt, bringt dieser doch alle notwendigen Funktionen und Komponenten mit.
Aufwand für die manuelle Implementierung eines Data Warehouse ist enorm
Natürlich kann das Data Warehouse herkömmlich mittels Visual Studio und SQL Server Management Tools aufgebaut werden. Dies schließt die manuelle Erstellung aller Tabellen und Sichten ebenso mit ein, wie die Definition des analytischen Modells über die SQL Server Analysis Services (SSAS) und der Transformationen und Ladeprozesse über die SQL Server Integration Services (SSIS).
Auch ohne die Persistierung rechenintensiver SQL-Sichten oder Datenhistorisierung ist der Aufwand bei der manuellen Implementierung eines Data Warehouse enorm und das Ergebnis sehr stark abhängig von der Qualifikation und Verfügbarkeit der implementierenden Personen. Nehmen wir Persistierung und Historisierung als Anforderungen mit dazu, dann steigt der Aufwand nochmals deutlich an und das Data Warehouse ist mit hoher Wahrscheinlichkeit nur noch mit großem Aufwand wartbar und erweiterbar. Mit der Komplexität geht die Übersicht verloren und meistens mangelt es auch an einer aussagefähigen Dokumentation. Wenn spätere Änderungen von Personen durchgeführt werden müssen, die nicht an der Erstellung mitgewirkt haben, dann steigt die Gefahr von Datenfehlern und Inkonsistenzen an.
AnalyticsCreator reduziert Komplexität, Aufwand und Risiko
Beim AnalyticsCreator handelt es sich im ein Design-Time-Tool zur Abbildung des kompletten Data Warehouse Lebenszyklus. Über eine grafische Oberfläche werden alle Schichten und Transformationen definiert, von der Datenquelle bis zur Erzeugung des analytischen Modells. Persistierungen und Datenhistorisierung werden mit wenigen Mausklicks definiert. Die Komplexität des Data Warehouse wird auf diese Weise dramatisch reduziert, was gleichzeitig eine deutliche Verkürzung der Projektdauer bedeutet und auch das Projektrisiko reduziert.
Da der AnalyticsCreator standardisierte Outputs für verschiedene analytische Datenbanken generiert, z.B. SSAS, Qlik, Tableau, PowerPivot, wird der AnalyticsCreator für den Betrieb des Data Warehouse nicht mehr benötigt. Alle erforderlichen Datenbanken, Tabellen, Sichten, Stored Procedures und Scripte werden vollständig für das Zielsystem generiert. Natürlich muss kein analytisches Modell generiert werden, sondern die Ausgabe als übliches Star-Schema ist ebenfalls möglich. Damit können dann BI-Systeme angebunden werden, bei denen das analytische Modell direkt innerhalb der BI-Lösung generiert wird, z.B. bei der Reporting- und Planungssoftware BOARD.
Der maximale Nutzen wird natürlich dann erreicht, wenn nicht nur die initiale Erstellung des Data Warehouse, sondern auch alle zukünftigen Änderungen und Erweiterungen mit dem AnalyticsCreator abgebildet werden. Dann profitiert der Kunde dauerhaft von den Vorteilen der Data Warehouse Automation Lösung.