Was ist ein Data Warehouse?
Ein Data Warehouse ist eine optimierte Datenbank, die das Erstellen von Auswertungen und das Auswerten der Daten beschleunigt. Es ist dann besonders nützlich, wenn viele oder sehr komplexe Daten ausgewertet werden sollen. Das Data Warehouse ist zudem die Grundlage für multidimensionale Auswertungen, mit denen Daten intuitiv aus verschiedenen Perspektiven betrachtet werden können.
Komplexität reduzieren
Ein Data Warehouse reduziert die Komplexität bestehender Datenquellen. Dazu verwendet es ausschließlich ihre relevanten Daten und fügt sie als neues, einfaches Datenmodell in einer eigenen Datenbank wieder zusammen. So stellt ein Data Warehouse ausschließlich die Daten bereit, die wirklich ausgewertet werden sollen. Damit können verschiedene teils hochkomplexe Datenquellen wie beispielsweise Finanzbuchhaltungen, Warenwirtschaftssysteme, Dateidatenquellen oder Webdienste gemeinsam in einem einfachen und übersichtlichen Datenmodell zur Auswertung bereitgestellt werden.
Beim Erstellen einer neuen Auswertung wird keinerlei Kenntnis über die ursprüngliche komplexere Datenstruktur benötigt. Der Benutzer des bereitgestellten neuen Datenmodells erkennt anhand der eindeutig benannten Tabellen- und Feldnamen intuitiv die Inhalte der Daten. Die Erstellung von Auswertungen wird dadurch wesentlich einfacher, schneller und sicherer.
Komplexität reduzieren
Ein Data Warehouse reduziert die Komplexität bestehender Datenquellen. Dazu verwendet es ausschließlich ihre relevanten Daten und fügt sie als neues, einfaches Datenmodell in einer eigenen Datenbank wieder zusammen. So stellt ein Data Warehouse ausschließlich die Daten bereit, die wirklich ausgewertet werden sollen. Damit können verschiedene teils hochkomplexe Datenquellen wie beispielsweise Finanzbuchhaltungen, Warenwirtschaftssysteme, Dateidatenquellen oder Webdienste gemeinsam in einem einfachen und übersichtlichen Datenmodell zur Auswertung bereitgestellt werden. Beim Erstellen einer neuen Auswertung wird keinerlei Kenntnis über die ursprüngliche komplexere Datenstruktur benötigt. Der Benutzer des bereitgestellten neuen Datenmodells erkennt anhand der eindeutig benannten Tabellen- und Feldnamen intuitiv die Inhalte der Daten. Die Erstellung von Auswertungen wird dadurch wesentlich einfacher, schneller und sicherer.
Datenqualität verbessern
Ein Data Warehouse verbessert die Qualität bestehender Daten. Fehlende Werte werden anhand von vorab frei definierbaren Regeln automatisch in den betreffenden Datensätzen ergänzt. Die benötigten Werte werden entweder statisch vorgegeben oder aus anderen Datentabellen geladen.
Ein häufiger Fall ist die nachträgliche Bereitstellung von Kostenstellen oder Kostenträgern in Buchungssätzen der Vergangenheit, um Vorjahresvergleiche zu ermöglichen. Die Funktionen zur Datenverbesserung werden ebenfalls oft verwendet, um Daten anhand verschiedener Feldwerte eines Datensatzes zu gruppieren.
Ein weiteres Beispiel aus der Praxis ist die nachträgliche Einteilung jeder einzelnen Artikelbuchung in die Kategorien „Einzelstück“, „Bausatz“ oder „Bauteil“ anhand von Hilfsfeldern und Stammdaten des Warenwirtschaftssystems. Die Erstellung von Regeln ermöglicht auch die automatische Anreicherung bestehender Daten mit Werten aus ganz anderen Datenquellen. Ein typisches Beispiel hierfür ist die Ermittlung geografischer Koordinaten (Längen- und Breitengrade) anhand der Adressstammdaten eines Kunden, um Orte präzise auf Landkarten abzubilden.
Datenqualität verbessern
Ein Data Warehouse verbessert die Qualität bestehender Daten. Fehlende Werte werden anhand von vorab frei definierbaren Regeln automatisch in den betreffenden Datensätzen ergänzt. Die benötigten Werte werden entweder statisch vorgegeben oder aus anderen Datentabellen geladen. Ein häufiger Fall ist die nachträgliche Bereitstellung von Kostenstellen oder Kostenträgern in Buchungssätzen der Vergangenheit, um Vorjahresvergleiche zu ermöglichen. Die Funktionen zur Datenverbesserung werden ebenfalls oft verwendet, um Daten anhand verschiedener Feldwerte eines Datensatzes zu gruppieren. Ein weiteres Beispiel aus der Praxis ist die nachträgliche Einteilung jeder einzelnen Artikelbuchung in die Kategorien „Einzelstück“, „Bausatz“ oder „Bauteil“ anhand von Hilfsfeldern und Stammdaten des Warenwirtschaftssystems. Die Erstellung von Regeln ermöglicht auch die automatische Anreicherung bestehender Daten mit Werten aus ganz anderen Datenquellen. Ein typisches Beispiel hierfür ist die Ermittlung geografischer Koordinaten (Längen- und Breitengrade) anhand der Adressstammdaten eines Kunden, um Orte präzise auf Landkarten abzubilden.
Vergleichbare Auswertungen erreichen
Ein Data Warehouse stellt sicher, dass alle Auswertungen einer Organisation miteinander übereinstimmen. Die Berechnung einzelner Kennzahlen wird von Beginn an exakt definiert. Es wird genau beschrieben, was die Kennzahl bedeutet und anhand welcher Logik sie berechnet wird.
Die angewendeten Regeln und die zugrunde liegende Mathematik werden im Data Warehouse an genau einer Stelle implementiert und gründlich getestet. Das Ergebnis wird für die individuellen Auswertungsanforderungen in der Organisation bereitgestellt.
Ein einfaches Beispiel aus der Praxis ist der Umsatz. Die Finanzbuchhaltung prüft den gebuchten Umsatz anhand der Erlöskonten in der Gewinn- und Verlustrechnung. Das Controlling vergleicht den erzielten Umsatz einzelner Warengruppen mit den Planzahlen und Vorjahreswerten. Der Vertrieb nutzt den Umsatz für die Jahresgespräche mit dem Kunden. Die Geschäftsführung trifft anhand der Umsatzentwicklung strategische Entscheidungen für die verschiedenen Standorte. Da alle Abteilungen durch das Data Warehouse exakt die gleiche Logik für die Berechnung des Umsatzes verwenden, sind alle Auswertungen miteinander vergleichbar. Sollte sich die Logik der Berechnung in der Zukunft ändern, weil beispielsweise eine neue Umsatzart hinzugekommen ist, reicht die Anpassung der Logik im Data Warehouse, damit alle Umsatzauswertungen wieder korrekte und vergleichbare Werte ausweisen.
Vergleichbare Auswertungen erreichen
Ein Data Warehouse stellt sicher, dass alle Auswertungen einer Organisation miteinander übereinstimmen. Die Berechnung einzelner Kennzahlen wird von Beginn an exakt definiert. Es wird genau beschrieben, was die Kennzahl bedeutet und anhand welcher Logik sie berechnet wird. Die angewendeten Regeln und die zugrunde liegende Mathematik werden im Data Warehouse an genau einer Stelle implementiert und gründlich getestet. Das Ergebnis wird für die individuellen Auswertungsanforderungen in der Organisation bereitgestellt.
Ein einfaches Beispiel aus der Praxis ist der Umsatz. Die Finanzbuchhaltung prüft den gebuchten Umsatz anhand der Erlöskonten in der Gewinn- und Verlustrechnung. Das Controlling vergleicht den erzielten Umsatz einzelner Warengruppen mit den Planzahlen und Vorjahreswerten. Der Vertrieb nutzt den Umsatz für die Jahresgespräche mit dem Kunden. Die Geschäftsführung trifft anhand der Umsatzentwicklung strategische Entscheidungen für die verschiedenen Standorte. Da alle Abteilungen durch das Data Warehouse exakt die gleiche Logik für die Berechnung des Umsatzes verwenden, sind alle Auswertungen miteinander vergleichbar. Sollte sich die Logik der Berechnung in der Zukunft ändern, weil beispielsweise eine neue Umsatzart hinzugekommen ist, reicht die Anpassung der Logik im Data Warehouse, damit alle Umsatzauswertungen wieder korrekte und vergleichbare Werte ausweisen.
Datenbereitstellung automatisieren
Ein Data Warehouse stellt vollkommen automatisch ein definiertes, einfaches Datenmodell bereit. Alle erforderlichen Arbeitsschritte werden nacheinander ausgeführt.
Als Erstes überträgt das Data Warehouse die ausgewählten Daten auch aus komplexen Datenquellen in eine eigene Arbeitsdatenbank, die „Staging Area“ oder „Stage-Datenbank“. Die technische Belastung der ursprünglichen Datenquellen ist damit auf das absolute Minimum reduziert. Dieser Schritt wird „Extraktion“ genannt. In der Stage-Datenbank werden alle erforderlichen Vorgänge zur Verbesserung der Datenqualität durchgeführt. Dieser Schritt heißt im Fachjargon „Transformieren“ und ist der bei Weitem zeitaufwendigste Teil des Prozesses. Erst wenn die Transformation vollständig abgeschlossen ist, werden die Daten in die eigentliche Data-Warehouse-Datenbank übertragen. Auf diese Weise steht das Data Warehouse nahezu permanent für Auswertungen bereit. Dieser letzte Schritt wird als „Laden“ bezeichnet.
Alle drei Schritte zusammen werden als „ETL-Prozess“ (Extraction-Transform-Load) bezeichnet. Der ETL-Prozess kann auch in unabhängige Abschnitte aufgeteilt werden. Ein Beispiel dafür: Vertriebsdaten werden täglich ermittelt, während die Sachbuchungen jede halbe Stunde aktualisiert werden.
Datenbereitstellung automatisieren
Ein Data Warehouse stellt vollkommen automatisch ein definiertes, einfaches Datenmodell bereit. Alle erforderlichen Arbeitsschritte werden nacheinander ausgeführt. Als Erstes überträgt das Data Warehouse die ausgewählten Daten auch aus komplexen Datenquellen in eine eigene Arbeitsdatenbank, die „Staging Area“ oder „Stage-Datenbank“. Die technische Belastung der ursprünglichen Datenquellen ist damit auf das absolute Minimum reduziert. Dieser Schritt wird „Extraktion“ genannt. In der Stage-Datenbank werden alle erforderlichen Vorgänge zur Verbesserung der Datenqualität durchgeführt. Dieser Schritt heißt im Fachjargon „Transformieren“ und ist der bei Weitem zeitaufwendigste Teil des Prozesses. Erst wenn die Transformation vollständig abgeschlossen ist, werden die Daten in die eigentliche Data-Warehouse-Datenbank übertragen. Auf diese Weise steht das Data Warehouse nahezu permanent für Auswertungen bereit. Dieser letzte Schritt wird als „Laden“ bezeichnet. Alle drei Schritte zusammen werden als „ETL-Prozess“ (Extraction-Transform-Load) bezeichnet. Der ETL-Prozess kann auch in unabhängige Abschnitte aufgeteilt werden. Ein Beispiel dafür: Vertriebsdaten werden täglich ermittelt, während die Sachbuchungen jede halbe Stunde aktualisiert werden.
Auswertungen beschleunigen
Ein Data Warehouse beschleunigt die Auswertung von Daten erheblich. Das liegt unter anderem daran, dass die Verbesserungen der Datenqualität und die Reduktion der Komplexität bereits beim Transformations-Prozess erfolgen. Diese sehr komplexe und zeitintensive Arbeit muss nicht vom Analyse- oder Reporting-Werkzeug geleistet werden. Programme zur Anzeige der Daten (zum Beispiel Jet Reports, Power BI, Microsoft Analysis Services, Microsoft Reporting Services, Tableau, QlikView, CrystalReports usw.) können ihre individuellen Stärken bei der Präsentation von Daten voll zur Geltung bringen.
Mit einem Data Warehouse lassen sich diese Softwareprodukte auch kombiniert einsetzen. Da die Berechnungslogik im Data Warehouse implementiert ist, werden die Visualisierungen dennoch stets vergleichbare Daten liefern.
Ein weiterer Grund für die außerordentliche Performance eines Data Warehouse liegt in der Skalierbarkeit. Jede Data-Warehouse-Tabelle wird passgenau für den Auswertungsbedarf indiziert. Das beschleunigt den Datenzugriff erheblich, ohne produktive schreibende Prozesse zu stören. Meist liegt ein Data Warehouse ohnehin auf einem eigenen Datenbankserver. Bei sehr großem Datenbestand lassen sich aus einer Stage-Datenbank auch mehr als eine Data-Warehouse-Datenbank ableiten. Diese können bei Bedarf sogar auf unterschiedlichen Datenbankservern liegen. In solchen Szenarien werden selbst viele Milliarden Datensätze hochperformant ausgewertet.
Auswertungen beschleunigen
Ein Data Warehouse beschleunigt die Auswertung von Daten erheblich. Das liegt unter anderem daran, dass die Verbesserungen der Datenqualität und die Reduktion der Komplexität bereits beim Transformations-Prozess erfolgen. Diese sehr komplexe und zeitintensive Arbeit muss nicht vom Analyse- oder Reporting-Werkzeug geleistet werden. Programme zur Anzeige der Daten (zum Beispiel Jet Reports, Power BI, Microsoft Analysis Services, Microsoft Reporting Services, Tableau, QlikView, CrystalReports usw.) können ihre individuellen Stärken bei der Präsentation von Daten voll zur Geltung bringen. Mit einem Data Warehouse lassen sich diese Softwareprodukte auch kombiniert einsetzen. Da die Berechnungslogik im Data Warehouse implementiert ist, werden die Visualisierungen dennoch stets vergleichbare Daten liefern. Ein weiterer Grund für die außerordentliche Performance eines Data Warehouse liegt in der Skalierbarkeit. Jede Data-Warehouse-Tabelle wird passgenau für den Auswertungsbedarf indiziert. Das beschleunigt den Datenzugriff erheblich, ohne produktive schreibende Prozesse zu stören. Meist liegt ein Data Warehouse ohnehin auf einem eigenen Datenbankserver. Bei sehr großem Datenbestand lassen sich aus einer Stage-Datenbank auch mehr als eine Data-Warehouse-Datenbank ableiten. Diese können bei Bedarf sogar auf unterschiedlichen Datenbankservern liegen. In solchen Szenarien werden selbst viele Milliarden Datensätze hochperformant ausgewertet.
Warum wir Microsoft-Produkte anbieten
Microsoft bietet eine breite Palette an Softwareprodukten für Reporting, Analyse und Data Warehousing. Ein wesentlicher Eckstein ist dabei der Microsoft SQL Server. Die vier darin enthaltenen Dienste Datenbank, Integration Services, Analysis Services und Reporting Services mit ihren jeweiligen Programmierumgebungen stellen bereits eine komplette BI-Suite bereit. Die native Anbindung an Excel mittels Power Query und Analysis Services sowie die optimale Anbindung an Microsoft Power BI bieten zudem hervorragende Analyse- und Visualisierungsmöglichkeiten.
Darüber hinaus kann die gesamte Produktpalette wahlweise on-premises, in der Cloud oder sogar hybrid implementiert werden. Es verwundert daher nicht, dass die Business-Intelligence-Produkte von Microsoft mit einigem Abstand zu den Mitbewerbern als Marktführer eingestuft werden – ein Trend, der sich bereits seit Jahren fortsetzt.
Last, but not least bieten wir mit Jet Analytics ein Self-Service-BI-Werkzeug, mit dem das gesamte BI-Angebot von Microsoft ohne Kenntnis der jeweiligen Programmiersprachen entwickelt werden kann.
Fazit: Mit diesen Produkten bieten wir Ihnen preiswert professionelle und hochskalierbare BI, die Sie selbst jederzeit erweitern können.
Warum wir Microsoft-Produkte anbieten
Microsoft bietet eine breite Palette an Softwareprodukten für Reporting, Analyse und Data Warehousing. Ein wesentlicher Eckstein ist dabei der Microsoft SQL Server. Die vier darin enthaltenen Dienste Datenbank, Integration Services, Analysis Services und Reporting Services mit ihren jeweiligen Programmierumgebungen stellen bereits eine komplette BI-Suite bereit. Die native Anbindung an Excel mittels Power Query und Analysis Services sowie die optimale Anbindung an Microsoft Power BI bieten zudem hervorragende Analyse- und Visualisierungsmöglichkeiten. Darüber hinaus kann die gesamte Produktpalette wahlweise on-premises, in der Cloud oder sogar hybrid implementiert werden. Es verwundert daher nicht, dass die Business-Intelligence-Produkte von Microsoft mit einigem Abstand zu den Mitbewerbern als Marktführer eingestuft werden – ein Trend, der sich bereits seit Jahren fortsetzt. Last, but not least bieten wir mit Jet Analytics ein Self-Service-BI-Werkzeug, mit dem das gesamte BI-Angebot von Microsoft ohne Kenntnis der jeweiligen Programmiersprachen entwickelt werden kann. Fazit: Mit diesen Produkten bieten wir Ihnen preiswert professionelle und hochskalierbare BI, die Sie selbst jederzeit erweitern können.
Videoempfehlung: Zwei entscheidende Gründe für ein Data Warehouse
Sie müssen sich nicht mit den technischen Herausforderungen eines Data Warehouses (DWH) auskennen. Sie sollten aber wissen, warum ein DWH für Sie sinnvoll sein kann. Dazu müssen Sie nur zwei Gründe kennen, die wir Ihnen in diesem Video vorstellen.