Einsatzgebiete für Datenintegrationswerkzeuge

4 November 2009

Datenintegration ist kein Synonym für ETL. Dieser Irrglaube droht  die Funktionsbandbreite einschlägiger Werkzeuge für Datenintegration auf das Einsatzszenario „batch-orientierte Datenbewirtschaftung für Business Intelligence“  zu reduzieren.  Vielmehr entwickeln sich Werkzeuge für die Datenintegration hin zu Plattformen, die über eine Vielzahl an Funktionen den wachsenden unterschiedlichsten Anforderungen im Unternehmen gerecht werden möchten.

Abbildung 1 zeigt mögliche Einsatzszenarien von Datenintegrationswerkzeugen.



Über den Einsatz als Middleware oder dem nächtlichen Ladeprozess eines Data Warehouses hinaus werden grundlegende Entwicklungen der Werkzeuge in zwei Punkten deutlich. Funktional werden Technologien integriert um Daten neben Batch-Prozessen auch in kürzeren Zyklen analytisch verarbeiten zu können. Prominentes Beispiel hierfür soll eine Call-Center Agent sein, der beim Anruf Kundendaten wie Zahlungsverhalten „near-time“ benötigt um die Rechnungsmodalitäten (Vorkasse, Rechnung, …) richtig platzieren zu können. Über typische latenz-sensitive Szenarien wie Synchronisation oder Replikation hinaus rückt klassische Business Intelligence näher an die operativen Prozesse heran. Gerade hier entstehen neue Aufgabenstellungen, die auch neue Anforderungen an  Datenintegrationswerkzeuge nach sich ziehen. Das Ergebnis findet sich in der Integration von Technologien zur Realisierung  von near-time Szenarien wie Messaging oder WebServices in die bestehenden ETL-Technologien.

Der zweite Punkt betrifft die thematische Erweiterung der Datentransformationsfunktionen, wie auch die Marktentwicklung der letzten Jahre zeigt. Zahlreiche Anbieter für Datenintegration ergänzten ihre Produktpaletten durch Zukäufe von Spezialisten für Datenqualität. Kennzeichnend ist die weitentwickelte Integration der Datenqualitätskomponenten. Das Ergebnis sind oftmals funktional integrierte Datenqualitätskomponenten, die sich aus einer gemeinsam genutzten Entwicklungsoberfläche heraus in einen Datenintegrationsprozess integrieren lassen oder Standardkomponenten zur Integration von Drittanbieter-Komponenten bereitstellen.

Abbildung 2 zeigt einen idealtypischen Datenintegrationsprozess in seiner Endausbaustufe. Die Nutzung separater Funktionsblöcke ist üblich.




 

Schwieriger erweist sich die Integrationsthematik hinsichtlich der semantischen Integration,  die ein differenzierendes Merkmal von Datenintegrationslösungen ist. Zu erwarten sind die durchgängige Definition und Dokumentation von Objekten- und Prozessen für die valide Datenbewirtschaftung. Heutzutage gibt es oftmals Medienbrüche zwischen einzelnen Funktionsbausteinen im Datenbewirtschaftungsprozess.

Ein Beispiel dafür: In einem Projekt werden mittels Data-Profiler Daten analysiert. Auf Basis der Analyse-Ergebnisse werden technische Regeln zur Standardisierung von Daten oder inhaltliche Regeln für Plausibilitätsprüfungen erhoben. Die Überführung der Regeln aus dem Profiling in das Datenbereinigungs-/Datentransformationswerkzeug muss oftmals noch manuell – Eingabe per Hand – geschehen. Die Bereinigungs- und Transformationskomponente hingegen sind heutzutage bereits integriert und können Entwicklungsobjekte gemeinsam nutzen.

Weitere thematische Ergänzungen des Themas Datenintegration bahnen sich derzeit im Bereich Stammdatenmanagement (Master Data Management) sowie im Complex Event Processing (CEP) an.

Zusammenfassend bezeichnet eine funktionale wie auch thematische Erweiterung die Entwicklung und auch Einsatzgebiete von Datenintegrationswerkzeugen als Reaktion auf die wachsenden Anforderungen der Unternehmen insgesamt. Die Antwort der Softwarehersteller findet sich in breit aufgestellten Werkzeugen, die modular (oder lizenzrechtlich) an die Anforderungen angepasst werden können - zum Einen um die eigene Lösung als strategisch gesetzte Plattform positionieren zu können, zum Anderen um über eine Vielzahl an Möglichkeiten weitere Kunden gewinnen zu können.

Eine Übersicht über die funktionale Abdeckung finden Sie im aktuellen BARC Guide Business Intelligence 2009/2010 im Druckformat oder hier online.

Detaillierte Informationen zu marktgängigen Werkzeugen erfahren sie aus den Produkttests der BARC Studie Data Warehousing und Datenintegration.



SOURCE: Einsatzgebiete für Datenintegrationswerkzeuge

  • Timm Grosser
    Dipl.-Kfm. Timm Grosser ist Analyst am Business Application Research Center (BARC) im Bereich Business Intelligence. Seine Spezialgebiete sind entscheidungsunterstützende Informationssysteme mit besonderem Fokus auf die Bereiche Datenqualität, Datenmanagement und Business Activity Monitoring.

Aktuelle Artikel von Timm Grosser


Themenverwandte Beiträge


 

Kommentare

Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!