Das Wissensportal für IT-Professionals. Entdecke die Tiefe und Breite unseres IT-Contents in exklusiven Themenchannels und Magazinmarken.

SIGS DATACOM GmbH

Lindlaustraße 2c, 53842 Troisdorf

Tel: +49 (0)2241/2341-100

kundenservice@sigs-datacom.de

Interview mit Emma McGrattan: KI – Der Geist ist aus der Flasche

Emma McGrattan, Chief Technology Officer bei Actian, sprach mit BI-Spektrum über die Möglichkeiten, die durch die Akquisition von Zeenea entstanden sind, über GenAI und über die Unterschiede beim Datenschutz zwischen Europa und den USA.

Author Image
Christoph Witte

Chefredakteur IT Spektrum und BI-Spektrum


  • 09.12.2024
  • Lesezeit: 11 Minuten
  • 349 Views

BI-Spektrum: Frau McGrattan, Sie haben eine lange Geschichte bei Actian. Erzählen Sie kurz?

Emma McGrattan: Gerne. Ich bin 1992 zum Ingres Team gestoßen, das 1994 von Computer Associates übernommen wurde. 2005 leitete ich das Team, als wir uns durch Private Equity aus dem CA Konzern ausgliederten. Seitdem haben wir einige Zukäufe getätigt und Technologien organisch entwickelt. So verfügen wir heute über ein breites Portfolio im Datenbereich. 2011 haben wir uns dann umbenannt, da der Name Ingres zu sehr mit relationalen Datenbanken assoziiert wurde. Mit „Actian“ wollten wir verdeutlichen, dass wir in der Lage sind, schnell auf Daten zu reagieren und Probleme zu lösen.

Im Gespräch mit Kunden über GenAI ist die größte Sorge die Datenqualität und das Risiko, Fehler zu machen, die zu DSGVOVerstößen führen könnten.

BI-Spektrum: Sie haben also den Wandel von der klassischen Datenbank hin zur modernen Datenplattform miterlebt. Welche Herausforderungen sehen Unternehmen heute, insbesondere im Hinblick auf generative KI?

McGrattan: Weltweit sehen wir, dass Unternehmen GenAI Initiativen starten wollen. In Europa gibt es verständlicherweise große Bedenken hinsichtlich des Datenschutzes – Stichwort DSGVO. Daten könnten zum Beispiel in einem GenAI Projekt unbeabsichtigt offengelegt werden, fürchten nicht wenige. Deshalb haben wir die Actian Data Platform um Funktionen erweitert, die unsere Kunden bei der Vorbereitung von GenAI fähigen Daten unterstützen. Dazu gehört die Datenprofilierung, um sensible Spalten wie Geburtsdaten, Adressen oder Telefonnummern zu identifizieren. Wir suchen auch nach Doubletten, fehlenden Werten oder Anomalien, beispielsweise ein Geburtsdatum in der Zukunft, was auf einen Tippfehler hindeutet.

Die Datenprofilierung ist in die Plattform integriert. Kunden können „saubere“ von „schmutzigen“ Daten trennen, die nicht den definierten Regeln entsprechen. Die „schmutzigen“ Daten können dann korrigiert werden, beispielsweise durch Abgleich mit anderen Quellen oder die Korrektur von Datumsformaten.

BI-Spektrum: Handelt es sich dabei um eine Standardfunktion, wie man sie in ETL-Tools findet, oder ist das etwas Besonderes?

McGrattan: Es ist eine Bereinigungsfunktion, die wir speziell für die Vorbereitung von Daten für GenAI entwickelt haben. Im Gespräch mit Kunden über GenAI ist die größte Sorge die Datenqualität und das Risiko, Fehler zu machen, die zu DSGVOVerstößen führen könnten. Die möglichen Bußgelder und der Reputationsschaden sind enorm. Viele Kunden fragten nach einem Datenkatalog und Möglichkeiten zur Daten Governance. Deshalb haben wir uns nach einer passenden Akquisition umgesehen. Mit Zeenea fanden wir eine SaaS basierte Lösung, die wir in die Actian Plattform integrieren konnten, um ein breiteres Spektrum an Datenfunktionen anzubieten.

Im Zusammenhang mit GenAI und der DSGVO war es uns wichtig, Governance Funktionen einzuführen, um den Datenzugriff zu kontrollieren, gefährdete Felder zu identifizieren und die Datenherkunft lückenlos zu verfolgen. Zeenea ist ein innovatives Start up mit einer SaaS Lösung, die gut zu unseren bestehenden Actian Funktionen passte. Zeenea bot Funktionen zur Datenbestandserkennung und einen Datenmarktplatz, was für Unternehmen, die eine Data Mesh Infrastruktur einführen, sehr relevant ist.

BI-Spektrum: Sie hatten vorher keinen Datenkatalog?

McGrattan: Nicht im eigentlichen Sinne.

BI-Spektrum: Okay. Das war also der Hauptgrund für die Übernahme von Zeenea.

McGrattan: Es war eine Kombination aus dem Katalog und dem Datenmarktplatz. Viele Unternehmen, die eine Data Mesh Infrastruktur einführen, wollen einen Marktplatz für Datenprodukte einrichten. Die Innovation von Zeenea in diesem Bereich war ebenfalls ein wichtiger Faktor. Es gab keine Überschneidungen zwischen den Funktionen von Zeenea und Actian.

BI-Spektrum: Was ist die Herausforderung beim Aufbau eines Datenmarktplatzes? Ist das komplex?

McGrattan: Marktplätze sind aus unserem Alltag nicht mehr wegzudenken. Wir sind es gewohnt, Produkte in einen Warenkorb zu legen und zu bewerten. Diese Erfahrung wollten wir auf Datenprodukte übertragen. Es ist nicht wirklich schwierig zu bauen. Wir hatten einfach noch keinen, und es war leichter, einen zu erwerben, als einen selbst zu bauen, vor allem in Kombination mit den anderen Funktionen wie dem Katalog und den Funktionen für Datenherkunft und Governance.

Der Marktplatz von Zeenea zeigt alle Assets innerhalb des Unternehmens an, die man teilen möchte. Nehmen wir ein Datenprodukt mit Marketingkampagneninformationen für eine bestimmte Kampagne, Region und Zielgruppe. Dieses Datenprodukt und alle zugehörigen Berichte können auf dem Marktplatz angezeigt werden. Wenn jemand einen Bericht verwenden und leicht modifizieren möchte, hat er die Möglichkeit dazu. Der Marktplatz umfasst nicht nur die Datenprodukte, sondern alle zugehörigen Assets.

BI-Spektrum: Hilft der Marktplatz den Nutzern auch bei der Erstellung und Verwaltung von Datenprodukten?

McGrattan: Ja, er unterstützt den gesamten Lebenszyklus von Datenprodukten, von der Konzeption über die Entwicklung und Bereitstellung bis hin zur Pflege. Wir werden das in Zukunft automatisieren. Heute ist es noch ein manueller Prozess.

BI-Spektrum: Wie werden Sie Zeenea in Ihre Plattform integrieren?

McGrattan: Wir kombinieren die beiden Plattformen zur Actian Data Intelligence Platform. Wir werden mit der Zeenea Plattform beginnen, weil sie die Abstammungsgraphen, den Marktplatz etc. beinhaltet. Dann werden wir die Actian Funktionen einbinden. Wir können zum Beispiel einen Qualitätsindex für ein Datenprodukt oder eine Tabelle innerhalb einer Datenbank bereitstellen. Dieser Qualitätsindex berücksichtigt Faktoren wie die Anzahl der doppelten Werte, den Prozentsatz der leeren Felder und so weiter.

Der Kunde kann dann die Actian Technologien oder ein Datenqualitätswerkzeug eines Drittanbieters verwenden. Man kann auf den Qualitätsindex klicken und dann den Actian Profiler aufrufen. Wir werden also damit beginnen, die Profilerstellung von Actian in die Zeenea Plattform zu integrieren. Dann werden wir Korrekturregeln hinzufügen, um Probleme mit dem Datensatz zu beheben.

Viele Unternehmen, die eine Data-Mesh-Infrastruktur einführen, wollen einen Marktplatz für Datenprodukte einrichten.

BI-Spektrum: Die Zeenea-Plattform wird also das Frontend für die Actian-Plattform sein?

McGrattan: Wir haben heute zwei Plattformen, die Zeenea Plattform und die Actian Plattform. Beide haben ein Frontend, aber wenn wir sie zusammenführen, wird das Frontend von Zeenea der Ausgangspunkt für die zusammengeführte Funktionalität der Actian Data Intelligence Platform sein. Wir werden damit beginnen und dann die Funktionen von Actian hinzufügen. Die Customer Journey beginnt mit der Entdeckung der Datenbestände, dann erstellt man einen Katalog, möchte die Datenherkunft und Governance sicherstellen und betrachtet Dinge wie Profilerstellung und Datenqualität. Wir wollen mit der Customer Journey beginnen, die mit der Entdeckung beginnt, und das ist heute alles innerhalb der Zeenea Plattform.

Wir sind es gewohnt, Produkte in einen Warenkorb zu legen und zu bewerten. Diese Erfahrung wollten wir auf Datenprodukte übertragen.

BI-Spektrum: Wann wird die Integration abgeschlossen sein?

McGrattan: Wir erstellen gerade die Roadmap. Die Akquisition wurde im September 2024 abgeschlossen. Wir beabsichtigen, Anfang 2025 mit der Umsetzung zu beginnen.

BI-Spektrum: Müssen die Kunden ein neues Produkt kaufen oder wird das in das SaaS-Produkt integriert?

McGrattan: Die Zeenea Kunden werden einfach zusätzliche Funktionen in ihrer bestehenden Plattform erhalten.

BI-Spektrum: Und die Kunden der Actian-Plattform – bekommen die ein neues Produkt?

McGrattan: Wir werden zunächst mit beiden Produkten weitermachen, bis alle Funktionen der Actian Data Platform in der neuen Plattform verfügbar sind. Bestehende Actian Kunden bleiben also in der Actian Data Platform, bis alles in Zeenea verfügbar ist, es sei denn, sie wollen einige der Funktionen von Zeenea nutzen.

Der Marktplatz unterstützt den gesamten Lebenszyklus von Datenprodukten, von der Konzeption über die Entwicklung und Bereitstellung bis hin zur Pflege.

BI-Spektrum: Welche strategischen Ziele verfolgen Sie mit der Übernahme von Zeenea?

McGrattan: Unternehmen setzen unterschiedliche Datenarchitekturen ein. Es gibt Data Fabric, Data Mesh und meist eine Kombination aus beidem. Mit der Actian Data Intelligence Platform wollen wir beide Architekturen unterstützen und Funktionen für Discovery, Katalog, Lineage, Governance, Datenqualität und weitere Funktionalitäten in einer Plattform bereitstellen. Wir sehen den Trend, dass Kunden stärker zu Plattformen mit vielen Funktionen tendieren anstatt zu Best of Breed.

Wir sehen GenAI als einen Paradigmenwechsel, vergleichbar mit Client-Server oder der Einführung des World Wide Web.

BI-Spektrum: Sie sprachen von neuen Möglichkeiten durch die Integration von Zeenea. Welche sehen Sie konkret?

McGrattan: Unternehmen bereiten sich auf GenAI vor. Wir sehen GenAI als einen Paradigmenwechsel, vergleichbar mit Client Server oder der Einführung des World Wide Web. GenAI wird unseren Alltag verändern und die Art und Weise, wie wir Geschäfte machen. Es gibt jedoch Bedenken, die Verantwortung für Daten an etwas abzugeben, das außerhalb der eigenen Kontrolle liegt. Mit unserer Data Intelligence Platform stellen wir sicher, dass Unternehmen die Kontrolle über ihre Daten behalten. Sie verstehen, wie ihre Daten verwendet werden, und können sensible Spalten oder Datentypen identifizieren, die geschützt, anonymisiert oder maskiert werden müssen. Wir helfen unseren Kunden, GenAI fähige Daten vorzubereiten, damit sie KI Anwendungen erstellen können, ohne DSGVO Verstöße befürchten zu müssen.

Die Menschen in Europa sind sich der Datenschutzprobleme viel stärker bewusst.

BI-Spektrum: Gibt es Unterschiede zwischen den USA und Europa in Bezug auf die Nutzung und Vorbereitung von Daten für GenAI?

McGrattan: Ich verbringe die Hälfte meiner Zeit in Irland und die Hälfte in den USA. Die Menschen in Europa sind sich der Datenschutzprobleme viel stärker bewusst. In den USA gibt es zwar auf Bundesstaatsebene ähnliche Gesetze wie die DSGVO, beispielsweise den California Consumer Protection Act, aber kein bundesweites Mandat. In Europa werden die Herausforderungen besser verstanden. Die Vorschriften existieren schon länger und die Unternehmen sind besser vorbereitet.

BI-Spektrum: Was halten Sie vom europäischen AI Act: Hilft er oder behindert er?

McGrattan: Ich denke, es ist wichtig, dass wir Kontrollen und „Checks and Balances“ einrichten. Der AI Act hilft, auch wenn er den Fortschritt verlangsamt.

BI-Spektrum: Gefällt Ihnen die risikobasierte Herangehensweise der Regulierung?

McGrattan: Ja. Es wird interessant sein zu sehen, wie sich der AI Act entwickelt, aber ich denke, die EU hat es richtig gemacht. Wir müssen sichergehen, dass wir alle Implikationen durchdenken. Der Geist lässt sich nicht zurück in die Flasche zwingen.

BI-Spektrum: Zurück zu Actian. Sie sprachen von der Consumerisierung von Business-Anwendungen. Was bedeutet das für Ihre Data Intelligence Platform?

McGrattan: Wir unterstützen Microsoft Azure, AWS, Google Cloud und On Premises Installationen. Die Plattform muss einfach zu bedienen sein. Business Analysten erwarten heute, dass sie sich in einer Data Intelligence Platform intuitiv zurechtfinden und die benötigten Berichte, Daten und Dashboards schnell finden. Eine weitere wichtige Funktion, die Zeenea bietet, ist der Aufbau eines Glossars. Die Plattform identifiziert Begriffe, die im Unternehmen häufig verwendet werden. So kann ein gemeinsames Verständnis dafür geschaffen werden, was ein bestimmter Begriff im Unternehmen bedeutet.

BI-Spektrum: Die Übernahme von Zeenea war also ein wichtiger strategischer Schritt für Actian.

McGrattan: Absolut. Wir haben neue Funktionen für den Actian Kundenstamm und können ZeeneaKunden die Actian Funktionen anbieten. Wir sehen viele neue Möglichkeiten, da die Nachfrage nach einfach zu bedienenden Daten Plattformen aus der Cloud steigt. Wir glauben, dass Daten auch in Zukunft sowohl On Premises als auch in der Cloud gespeichert werden. Unsere Plattform ist so konzipiert, dass es keine Rolle spielt, wo sich die Daten befinden. Wir können auch Mainframe DB2 Datenbanken katalogisieren, was im Finanzwesen immer noch vorkommt.

BI-Spektrum: Können Sie die Positionierung der Plattform genauer erläutern?

McGrattan: Wir sehen die Plattform als eine Kontrollebene in der Cloud. Die Datenebene befindet sich dort, wo der Kunde sie haben möchte. Die meisten unserer Kunden haben eine hybride Datenebene – sie nutzen Snowflake, S3 Buckets etc. in der Cloud und On Premises Systeme. Unsere Plattform unterstützt beide Anwendungsfälle.

McGrattan

Emma McGrattan arbeitet insgesamt bereits seit über 30 Jahren in der Branche. 1992 war sie bei Computer Associates als Vice President Development tätig. Später wurde sie dann Senior Vice President Engineering, zunächst bei Ingres und dann nach der Umbenennung im Jahr 2011 bei Actian. Chief Technology Officer bei Actian ist sie seit Oktober 2024. Emma hat Electronic Engineering in Dublin studiert. Sie lebt in den USA und Irland.

((KI-generiertes Bild, canva.com))

. . .

Author Image

Christoph Witte

Chefredakteur IT Spektrum und BI-Spektrum
Zu Inhalten

Christoph Witte ist Gründer der Wittcomm Agentur für IT, Publishing und Kommunikation. Darüber hinaus ist er Chefredakteur von IT Spektrum sowie BI-Spektrum und wirkt zudem bei dem Magazin JavaSPEKTRUM mit.


Artikel teilen