Blog von: Detlef Apel Subscribe to this blog's RSS feed!

Detlef Apel

Willkommen in meinem Blog zum Informationsqualitätsmanagement im Beyenetwork. Immer mehr Unternehmen begreifen ein erfolgreiches Informationsqualitätsmanagement als einen entscheidenden Wettbewerbsvorteil: Die IT-Kosten sinken, Projekte werden beschleunigt, auf änderungen am Markt oder in gesetzlichen Auflagen kann schneller und flexibler reagiert werden, Datenintegrationen über System-, Abteilungs- und Unternehmensgrenzen werden erleichtert, Imageverluste aufgrund negativer Schlagzeilen vermieden und falsche Entscheidungen basierend auf mangelhaften Informationen verhindert. In diesem Blog möchte ich Ihnen zeigen und mit Ihnen diskutieren, wie Sie die Qualität Ihrer Informationen zielgerichtet und erfolgreich steigern können. Lassen Sie uns gemeinsam die Ursachen und Auswirkungen schlechter Datenqualität analysieren und erfahren, welche Investitionen sich wirklich lohnen. Die Grundlagen des Datenqualitätsmanagements, die technische Umsetzung mit passgenauen Werkzeugen und die praktische Umsetzung in einem kompletten Zyklus eines BI-Projektes sind der Leitfaden für ein erfolgreiches Informationsqualitätsmanagement. Feedback ist ausdrücklich erwünscht! Bitte kommentieren Sie meine Einträge oder schreiben Sie mir unter detlef.apel@capgemini-sdm.com.

Über den Autor >

Detlef Apel ist Senior-Berater im Center of Competence Business Intelligence der Capgemini sd&m AG. Sein Spezialgebiet ist das Informationsqualitätsmanagement in allen Facetten, in dem er seit vielen Jahren große Unternehmen verschiedener Branchen erfolgreich bei der Konzeption, der IT-Architektur, der Optimierung, der Realisierung und der Einführung berät und unterstützt.

Als Redner auf verschiedenen Konferenzen sowie als Autor diverser Fachartikel und des Fachbuchs „Datenqualität erfolgreich steuern – Praxislösungen für Business-Intelligence-Projekte“ stellt er sein Wissen und seine langjährigen Projekterfahrungen der DWH-/BI-Gemeinschaft zur Verfügung.

Es existieren eine Vielzahl unterschiedlicher Data-Profiling-Verfahren, die sich in drei Gruppen einteilen lassen:

  1. Attribut-Ebene: Analyse der Werte und Eigenschaften eines Attributs (z. B. einer Tabellenspalte)
  2. Datensatz-Ebene: Analyse aller Sätze einer Struktur (z. B. alle Datensätze einer Tabelle)
  3. Tabellen-Ebene: Analyse aller Beziehungen zwischen Sammlungen von Strukturen (z. B. zwischen Tabellen oder zwischen den Datensätzen einer Tabelle)

 

Data-Profiling-Arten_low.jpg

Abb.: Data-Profiling-Arten (größeres Bild)

 Für jede dieser drei Gruppen existiert eine Vielzahl unterschiedlicher Data-Profiling-Verfahren. Diese Verfahren aber nur einzelne Mosaiksteinchen vom Bild der Datenqualität – erst die richtige, projektspezifische Kombination ergibt einen vollständigen Eindruck und sichert den Erfolg.
Die vorwiegend technisch orientierten unterstützten Standard-Verfahren beschränken sich zumeist auf formale Prüfungen (z. B. auf Vollständigkeit) und beinhalten kaum inhaltliche Prüfungen (z. B. auf Korrektheit). Deshalb bleiben die Ergebnisse unvollständig, werden dafür aber von den auf dem Markt verfügbaren Werkzeugen sehr gut unterstützt.

Um die Vollständigkeit und damit die Ergebnisse zu verbessern, sind diese Verfahren um fachliche Geschäftsregeln zu erweitern. Dabei werden die Prozess- und Fachkenntnisse der fachlichen Experten maschinell prüf- und auswertbare Geschäftsregeln überführt. Diese Regeln müssen sich einerseits anhand der Daten validieren lassen, andererseits müssen die Daten damit automatisiert und wiederholbar geprüft werden können.

Standardwerkzeuge bieten derzeit kaum die Möglichkeit zur Ergänzung mit i ndividuellen Geschäftsregeln, sodass man überwiegend auf Nischenanbieter oder Eigenentwicklungen zurückgreifen muss.
Oft findet man auf Konferenzen und in Werbemailings die Angebote von Standardwerkzeughersteller, dass man ihnen seine Daten zum Data Profiling schicken soll. Sie versprechen, dass man so einen realistischen Eindruck von der Qualität seiner Daten erhalte. Neben den rechtlichen Problemen bezüglich der Weitergabe von hochsensiblen Daten an Dritte gibt es noch ein inhaltliches Problem: Wie angesprochen, können nur fachliche Experten mit ausgeprägten Prozesskenntnissen die Ergebnisse und Hinweise der
Standard-Verfahren bewerten. Hinzu kommt, dass diese sehr spezifischen Geschäftsregeln bei diesem Check-up naturgemäß nicht verwendet werden. Woher soll der Werkzeughersteller
auch die Geschäftsregeln des ihm fremden Unternehmens kennen? Aus diesem Grund ist das Ergebnis in höchstem Maße unvollständig und gibt keinen realistischen Eindruck über die
Datenqualität. Solche Check-ups sind allerhöchstens ein erster Schritt; nur harte Arbeit führt zu verwendbaren Ergebnissen. Ein Werkzeug ist und bleibt eben nur ein Werkzeug – auch
beim Data Profiling.

Quelle: "Datenqualität erfolgreich steuern", TDWI, 2009.


Posted May 7, 2009 2:20 PM
Permalink | keine Kommentare |

Kommentieren