Es existieren eine Vielzahl unterschiedlicher Data-Profiling-Verfahren, die sich in drei Gruppen einteilen lassen:
- Attribut-Ebene: Analyse der Werte und Eigenschaften eines Attributs (z. B. einer Tabellenspalte)
- Datensatz-Ebene: Analyse aller Sätze einer Struktur (z. B. alle Datensätze einer Tabelle)
- Tabellen-Ebene: Analyse aller Beziehungen zwischen Sammlungen von Strukturen (z. B. zwischen Tabellen oder zwischen den Datensätzen einer Tabelle)

Abb.: Data-Profiling-Arten (größeres Bild)
Für jede dieser drei Gruppen existiert eine Vielzahl unterschiedlicher Data-Profiling-Verfahren. Diese Verfahren aber nur einzelne Mosaiksteinchen vom Bild der Datenqualität – erst die richtige, projektspezifische Kombination ergibt einen vollständigen Eindruck und sichert den Erfolg.
Die vorwiegend technisch orientierten unterstützten Standard-Verfahren beschränken sich zumeist auf formale Prüfungen (z. B. auf Vollständigkeit) und beinhalten kaum inhaltliche Prüfungen (z. B. auf Korrektheit). Deshalb bleiben die Ergebnisse unvollständig, werden dafür aber von den auf dem Markt verfügbaren Werkzeugen sehr gut unterstützt.
Standardwerkzeuge bieten derzeit kaum die Möglichkeit zur Ergänzung mit i ndividuellen Geschäftsregeln, sodass man überwiegend auf Nischenanbieter oder Eigenentwicklungen zurückgreifen muss.
Oft findet man auf Konferenzen und in Werbemailings die Angebote von Standardwerkzeughersteller, dass man ihnen seine Daten zum Data Profiling schicken soll. Sie versprechen, dass man so einen realistischen Eindruck von der Qualität seiner Daten erhalte. Neben den rechtlichen Problemen bezüglich der Weitergabe von hochsensiblen Daten an Dritte gibt es noch ein inhaltliches Problem: Wie angesprochen, können nur fachliche Experten mit ausgeprägten Prozesskenntnissen die Ergebnisse und Hinweise der
Standard-Verfahren bewerten. Hinzu kommt, dass diese sehr spezifischen Geschäftsregeln bei diesem Check-up naturgemäß nicht verwendet werden. Woher soll der Werkzeughersteller
auch die Geschäftsregeln des ihm fremden Unternehmens kennen? Aus diesem Grund ist das Ergebnis in höchstem Maße unvollständig und gibt keinen realistischen Eindruck über die
Datenqualität. Solche Check-ups sind allerhöchstens ein erster Schritt; nur harte Arbeit führt zu verwendbaren Ergebnissen. Ein Werkzeug ist und bleibt eben nur ein Werkzeug – auch
beim Data Profiling.
Quelle: "Datenqualität erfolgreich steuern", TDWI, 2009.
Posted May 7, 2009 2:20 PM
Permalink | keine Kommentare |




Kommentieren