Was ist ein Data Mart? Definition und Unterschied zum Data Warehouse
Werfen wir einen Blick auf den Data Mart. In den letzten etwa zehn Jahren hat die schwindelerregende Zunahme der produzierten Datenmenge die Entwicklung von Big Data beschleunigt. Die Welten der Softwareentwicklung und des Datenmanagements haben begonnen, ineinander überzugehen.
In diesem Zusammenhang ist es von wesentlicher Bedeutung, zu wissen, wie man eine Masse von Daten für ein bestimmtes Thema zentralisiert, strukturiert, verarbeitet und analysiert. Dies ist der ganze Zweck eines Data Mart. Doch was genau umfasst dieser Begriff? Und wie unterscheidet er sich von einem Data Warehouse?
Was ist ein Data Mart? — Definition
Ein Data Mart, auch bekannt als Datenspeicher oder Datenzähler, ist eine spezifische Datenbank für eine bestimmte Benutzergruppe.
Bei der Verwendung im Bereich Business Intelligence wird er aus den Quellsystemen extrahiert und bereinigt. Im Anschluss wird er einer begrenzten Gruppe von Benutzern in einem bestimmten Bereich des Unternehmens zur Verfügung gestellt.
👉 Der Data Mart steht im Dienste des finalen Anwenders. Daher sollte er die ursprünglich im Data Warehouse gespeicherten Daten auf möglichst verständliche Weise und nahe an der Geschäftssprache wiedergeben.
Data Mart vs. Data Warehouse: Wo liegt der Unterschied?
Abhängig vom Design kann das Data Warehouse als ein Satz von Data Marts und seinen Gateways gesehen werden. Es handelt sich um die Zentralisierung der Data Marts in einem einzigen System. Das Data Warehouse gewährt die Sicherheit, Verfügbarkeit und technische Konstanz aller Daten für die Nutzung der Data Marts.
Es nimmt daher eine eher technische Dimension an. In einem Data Warehouse findet man nie ein einziges Feld namens "Umsatz". Vielmehr werden mehrere Komponenten die Einnahmen und Ausgaben des Unternehmens beschreiben. So kann jedes Geschäftsfeld seinen eigenen Blick auf den Umsatz werfen.
Der Data Warehouse ermöglicht außerdem die Rückverfolgbarkeit von Informationen im gesamten Unternehmen. Der Data Mart ist auf die spezifischen Bedürfnisse eines Geschäftsbereich beschränkt.
Arten von Data Marts
Abhängige Data Marts
Es ist interessant, Data Marts um ein Data Warehouse herum aufzubauen, um ihr Potenzial zu maximieren. Ihre Integration kann auf unterschiedliche Weise geschehen:
️↗️ aufsteigend: Eine Reihe von Data Marts, die die Einrichtung eines Data Warehouse ermöglichen;
↘️ top-down: Die Zentralisierung der Daten im Data-Warehouse ermöglicht die Erstellung aller notwendigen Bausteine.
Vorteile:
- Verbindung mit anderen Unternehmensbereichen, wodurch Sie die Schlüsselindikatoren Ihrer Leistung verfeinern und genau erklären können. Zum Beispiel:
- Hervorhebung eines Zusammenhangs zwischen rückläufigen Ergebnissen in einem bestimmten Kreislauf Ihrer E-Learning-Plattform und einer Zunahme von Vorfällen in einer Produktionslinie.
- Optimierung einer Produktionsrate auf der Grundlage der Analyse der Pipe Ihres CRM-Tools.
- Durch die Anordnung dieser Bausteine innerhalb oder um ein Data Warehouse herum erhöhen sich Ihre Chancen, bestimmte Indikatoren bei einer funktionsübergreifenden Verwendung richtig zu interpretieren.
Nachteil:
Verlust der Unabhängigkeit
Unabhängige Data Marts
Dabei handelt es sich um eine fortgeschrittenere Version des vorherigen, da er zwar intern erstellt worden sein kann, aber immer von einer ganz bestimmten Quelle stammt, von der er sehr abhängig ist. Der Data Mart ist also nicht im Data Warehouse integriert.
Vorteil:
Sie haben mehr Spielraum bei Elementen der Restitution.
Nachteil:
Die Tatsache, dass er nicht in dem Rest Ihres Data Warehouses integriert ist, verringert immer noch Ihr Potenzial, den mittelfristigen Benutzerbedarf zu decken.
Hybride Data Marts
Wenn Sie Data Marts bevorzugen, die einer Anwendung gewidmet sind, liegt es vielleicht daran, dass die Anwendung Ihnen integrierte Analysewerkzeuge bietet. Dies scheint die ideale Lösung zu sein.
Vorteil:
Sie halten sich so nah wie möglich an den Bedarf der Anwendung und gewährleisten die Übereinstimmung zwischen den Daten.
Nachteile:
- mittel- und langfristige Kosten, da Sie keine Kontrolle über die Indikatoren haben;
- es ist schwieriger, die Daten der Anwendung mit den übrigen Daten Ihres Unternehmens anzureichern und umgekehrt;
- man übersieht schnell die Optionen, die es ermöglichen, diese Daten in das Data Warehouse hochzuladen.
👉 Was Sie an Geschwindigkeit bei der Umsetzung gewonnen haben, verlieren Sie also an Potenzial.
Vorteile eines Data Marts
Beispiel: Stellen wir uns vor, dass innerhalb der Personalabteilung eines Unternehmens ein erster Data Mart alle Indikatoren in Bezug auf die Nutzung des Haupt-ERP zusammenfasst. Außerdem sind weitere "Bausteine" der Personalabteilung, die mit anderen spezifischen Anwendungen verbunden sind, in weiteren Data Marts gespeichert. Zum Beispiel die Überwachung des E-Learning der Mitarbeiter.
Vorteile von Data Marts:
- Sie bieten Benutzern ein komplettes Spektrum an Indikatoren für die Daten, die sie täglich benötigen.
- Dieselbe Benutzergruppe kann Zugang zu einem einzelnen Data Mart oder zu mehreren Data Marts haben. Jeder Data Mart entspricht einem spezifischen Bedarf. Der Zugang variiert je nach der implementierten IT-Architekturen und der Vertraulichkeit der Daten.
Welches Tool für meine Data Marts?
Natürlich mangelt es nicht an ETL-Tools, um Big Data zu verarbeiten und schnell zu analysieren. Datenvisualisierungstools sind außerdem von großer Hilfe, um ihr Data Lake aufzubauen und Daten zu visualisieren.
Es gibt aber auch Cloud Services, Open-Source- oder urheberrechtlich geschützte, gebrauchsfertige Speicherwerkzeuge und Datenbanksysteme für Ihren Data Mart.
Wie bei jeder Entscheidung, die Open Source in Konkurrenz zu Editorenlösungen setzt, müssen Kriterien, wie die Unterstützung und die interne Fähigkeit zur Entwicklung oder Anpassung von Komponenten berücksichtigt werden.
Die Implementierung von Data Mart
Die Integration Ihrer Data Marts in ein Data Warehouse muss ein Hauptziel Ihrer Architektur sein. Und die richtige Entwicklung dieses Data Warehouse ist die logische Folge davon.
Die technischen Teams sind immer höheren Anforderungen ausgesetzt und benötigen eine größere Reaktionsfähigkeit. Deshalb mussten die Entwicklungs- und Einsatzmethoden mit Hilfe von Techniken der kontinuierlichen Integration, die sich in der Anwendungswelt bewährt haben, angepasst werden. Die Datentechnik muss sich daher einem neuen Konzept fügen: DataOps, abgeleitet von DevOps.
Kurz gesagt, die Anpassung der Prinzipien von DevOps Software an die Welt der Daten bietet eine neue Antwort auf die Herausforderungen der Implementierung von Data Marts in einem Kontext starken Wachstums.
Ursprünglicher Appvizer-Artikel des französischen Experten Laurent Hercé, auf deutsch übersetzt.