Big Data

Datenmodellierung 2022 – alles anders?

Wer hätte gedacht, dass das Thema Datenmodellierung für Informationssysteme noch mal so spannend werden könnte? Jahrelang waren mit der 3NF bzw. Entity-Relationship und der dimensionalen Modellierung die Optionen erschöpft. Abhängig vom Architekturansatz (Kimball vs. Inmon) wurden die Modellierungsparadigmen auf die unterschiedlichen Schichten im Data Warehouse angewandt und gut.

Christian Weinberger

Author

13.10.2022
Lesezeit: 3 Minuten
86 Views

Doch dann kamen auf einmal neue Ansätze ins Spiel: Semantische Modellierungsmethoden wurden propagiert und vor allem Data Vault fand eine breitere Basis von Nutzern und Fans. Gerade bei Data Vault stellt sich die Frage, warum der Ansatz erst in den 2010er-Jahren populär wurde, obwohl die Methode selbst auf die 1990er-Jahre zurückgeht.

Mittlerweile hat sich Data Vault als Standard für neue Data-Warehouse- /Informationssystemlösungen etabliert, insbesondere, aber nicht ausschließlich bei relationaler Datenhaltung. Die Treiber dafür sind:

Fachliche Anforderungen / Use-Cases: Anwender wünschen sich nicht erst seit der Ära der Data Lakes die Möglichkeit, Daten flexibel zu kombinieren. Neue Modellbereiche sollen einfach erstellbar und integrierbar sein, ohne dass das bestehende Modell in weiten Bereichen überarbeitet werden muss. Nicht „umbauen“, sondern „weiterbauen“ ist die Devise!
Organisation & Zusammenarbeitsmodell: Das gesamte Unternehmen möchte heute von den Daten profitieren. Damit werden die fachlichen Anforderungen naturgemäß dezentraler. Unternehmen stellen sich agil auf, die Weiterentwicklung der Informationssysteme erfolgt daher in kurzen Zyklen durch kleine Teams. DevOps- & DataOps-Konzepte unterstützen diesen Weg.
Technologie: Data Vault profitiert stark von einer hohen Join-Performanz im Datenbanksystem. Hier sind viele neue Player, insbesondere im Cloud-Bereich, in den Markt eingetreten. Tools für die Modellierung und die Data Pipelines sind da noch dünner gesät, aber es gibt sie.

Doch wo Licht ist, da ist auch Schatten. Data Vault bringt nicht nur Vorteile mit sich, sondern auch Defizite: Die Modellkomplexität oder zumindest die Anzahl der Tabellen erhöht sich deutlich. Wo Fachanwender sich noch gut in einem ER-Diagramm oder Star-Schema zurechtfinden, fällt das bei Data Vault deutlich schwerer.

Unterstützung durch Modellierungs- und Data-Warehouse-Automatisierungs-Tools ist zwar für Data Vault mittlerweile gegeben (und wird dringend empfohlen), aber viele dieser Werkzeuge sind für bestimmte Use-Cases optimiert und nicht so generisch nutzbar, wie man das von klassischen ETL-Tools oder Datenmodellierungswerkzeugen kennt. Bei der Abfrage von Daten aus dem Data-Vault-Modell ist die Unterstützung durch BI/Analytics-Lösungen noch sehr spärlich. Im Normalfall baut man deshalb heute einen dimensionalen Data Mart (gerne auch virtuell) als Presentation Layer über dem Data-Vault-Modell auf, womit man sich aber auch wieder Nachteile dieses Modellierungsparadigmas einhandelt.

Die Produkthersteller sind also weiter gefordert! Das bedeutet für sie aber auch ein großes Marktpotenzial – sollte also eine Win-win-Situation sein, oder?

. . .

Vorheriger Artikel

Mit modernen Tools vom Fachbereichsanwender zum Data Analyst

Nächster Artikel

Evolutionäre Organisationsform

Verwandte Inhalte

Testing Big Data

Wie funktioniert das automatisierte Testen von Software?

Von Wolfgang Grunewald & others
02.06.2022

BI Softwarearchitektur Big Data

Ein neuer Ansatz sorgt für hohe Skalierung und Lieferfähigkeit

Von Peter Kühni
18.08.2022

BI Big Data

Ein agiler und automatisierter Data Vault

Von Gunar Hofmann
13.11.2024

AI Big Data

Feature Learning

Von Franziska Ullmann
12.12.2023

Big Data

3, 2, 1 Data-Driven

Von Magnus Bobie
20.06.2023

AI Big Data

Macht ChatGPT die Datenmodellierung obsolet?

Von Tobias Otte
15.01.2024

AI Big Data

GenAI im Einsatz: Praxisnahe Use-Cases und Werkzeuge für Data Engineers

Von Matthias Fontanellaz
04.10.2024

Big Data

Datenqualitätsmanagement: Systematisch den richtigen Ansatzpunkt finden

Von Dr. Ina Humpert & others
07.10.2024

BI AI Big Data

KI lohnt in der Instandhaltung

Von Patrick Goldschmidt & others
17.06.2024

AI Big Data IT-Sicherheit

Compliance für Geschwindigkeit: Wie die EU-KI-Verordnung Stolpersteinen unerwartet

Von Heiko Detering & others
09.10.2023

Christian Weinberger

Author

Zu Inhalten

Christian Weinberger ist Data Architect & Engineer bei der metafinanz Informationssysteme GmbH. Seit über 25 Jahren beschäftigt er sich mit den Themen BI, Data Management, BI-Strategie und -Organisation. Er hat 2009 den TDWI Roundtable in München gegründet und ist Mitglied des Fachbeirats von BI-Spektrum.

Artikel teilen

Nächster Artikel