Blog von: Detlef Apel Subscribe to this blog's RSS feed!

Detlef Apel

Willkommen in meinem Blog zum Informationsqualitätsmanagement im Beyenetwork. Immer mehr Unternehmen begreifen ein erfolgreiches Informationsqualitätsmanagement als einen entscheidenden Wettbewerbsvorteil: Die IT-Kosten sinken, Projekte werden beschleunigt, auf änderungen am Markt oder in gesetzlichen Auflagen kann schneller und flexibler reagiert werden, Datenintegrationen über System-, Abteilungs- und Unternehmensgrenzen werden erleichtert, Imageverluste aufgrund negativer Schlagzeilen vermieden und falsche Entscheidungen basierend auf mangelhaften Informationen verhindert. In diesem Blog möchte ich Ihnen zeigen und mit Ihnen diskutieren, wie Sie die Qualität Ihrer Informationen zielgerichtet und erfolgreich steigern können. Lassen Sie uns gemeinsam die Ursachen und Auswirkungen schlechter Datenqualität analysieren und erfahren, welche Investitionen sich wirklich lohnen. Die Grundlagen des Datenqualitätsmanagements, die technische Umsetzung mit passgenauen Werkzeugen und die praktische Umsetzung in einem kompletten Zyklus eines BI-Projektes sind der Leitfaden für ein erfolgreiches Informationsqualitätsmanagement. Feedback ist ausdrücklich erwünscht! Bitte kommentieren Sie meine Einträge oder schreiben Sie mir unter detlef.apel@capgemini-sdm.com.

Über den Autor >

Detlef Apel ist Senior-Berater im Center of Competence Business Intelligence der Capgemini sd&m AG. Sein Spezialgebiet ist das Informationsqualitätsmanagement in allen Facetten, in dem er seit vielen Jahren große Unternehmen verschiedener Branchen erfolgreich bei der Konzeption, der IT-Architektur, der Optimierung, der Realisierung und der Einführung berät und unterstützt.

Als Redner auf verschiedenen Konferenzen sowie als Autor diverser Fachartikel und des Fachbuchs „Datenqualität erfolgreich steuern – Praxislösungen für Business-Intelligence-Projekte“ stellt er sein Wissen und seine langjährigen Projekterfahrungen der DWH-/BI-Gemeinschaft zur Verfügung.

May 2009 Archives

Am 15.06.2009 halte ich auf der 9. Europäischen TDWI-Konferenz in München einen halbtägigen Workshop zum Thema "Datenqualität erfolgreich steuern Praxislösungen für BI-Projekte". Hier ein paar Informationen dazu:
Die Folgen von schlechter Datenqualität sind gravierend: Bis zu 25 Prozent des operativen Gewinns werden eingebüßt. Zudem überschreiten mehr als 80 Prozent aller datenlastigen Projekte Termine und Budgets. In vielen Unternehmen schwindet deshalb die Hoffnung, dieses Problem durch die bloße Einführung von Standardsoftware für Enterprise Resource Planning (ERP), Customer Relationship Management (CRM), Supply Chain Management (SCM) u. a. oder durch standhaftes Ignorieren lösen zu können. Erfahren Sie in diesem Workshop von den Autoren des ersten TDWI-Buchs "Datenqualität erfolgreich steuern - Praxislösungen für BI-Projekte" anhand praktischer Beispiele, wie Sie ganzheitlich die Qualität Ihrer Daten erfolgreich verbessern können. Erkennen Sie die Ursachen und Auswirkungen schlechter Datenqualität und welche Investitionen sich zur Verbesserung lohnen. Lernen Sie, wie eine Data-Governance-Organisation und eine Qualitätsarchitektur helfen, dieses Ziel zu erreichen. Testen Sie in einer Übung selbst, wie Daten durch Data Profiling mit dem Oracle Warehouse Builder 11g effizient analysiert werden können. Verstehen Sie, wie man am besten Daten validiert, filtert, standardisiert und mit zusätzlichen Informationen anreichert. Lassen Sie sich live zeigen, wie Namen & Adressdaten mit der Trillium Software Data Quality effizient und erfolgreich bereinigt werden können. Erleben Sie, wie Sie die Darstellung Ihrer Informationen verbessern und wie Sie mit Kennzahlen die Datenqualität im Betrieb überwachen können, um proaktiv neue Probleme mit der Datenqualität zu vermeiden. Ein Muss für alle Projektleiter, Architekten, Analysten, Designer und Entwickler, die die Wettbewerbsfähigkeit ihrer Unternehmen mit einer besseren Daten- und Informationsqualität steigern wollen.
Es würde mich freuen, den einen oder anderen Leser auf dieser Konferenz kennenzulernen. Entweder während meines Workshops, an dem TDWI-Konferenz-Stand von Capgemini sd&m oder irgendwo zwischendurch. Viele Grüße,
viel Spaß auf dieser tollen Konferenz
Detlef Apel

Posted May 29, 2009 1:54 AM
Permalink | keine Kommentare |

In dem News-Eintrag zur neuen Version wurden kurz die neuen, verbesserten Funktionen der aktuellen Version V12 des Trillium Software Systems beschrieben. Grund genug, diese einmal näher zu analysieren und zu bewerten.

Beginnen möchte ich mit der Centralized Business Rules Library, da diese Funktion mir in vielen Gesprächen mit den Toolherstellern wichtig war. Ab sofort ist es möglich, benutzerspezifische Geschäftsregeln in einer zentralen Bibliothek zu speichern und somit für verschiedene Benutzer zugänglich zu machen. Geschäftsregeln beschreiben fachlich die geltenden und in der Zukunft absehbaren Regeln für die Geschäftsprozesse und werden in der Regel innerhalb der Spezifikationsphase definiert. Sie leiten sich ab aus regulatorischen, externen oder unternehmensinternen Anforderungen und ändern sich typischerweise mit der Zeit. Mit diesen Geschäftsregeln werden die zulässigen Werte und Beziehungen zwischen verschiedenen Attributen definiert. Ein Beispiel für eine solche fachliche Regel ''In dem Unternehmen XY werden Freiberufler ausschließlich nach Stunden bezahlt.''

Die Regeln werden wie in dem Beispiel zunächst logisch definiert und später physikalisch an reale Attribute aus verschiedenen Datenquellen und Systemen gebunden. Für das Beispiel lautet die logische Definition : ''Wenn das Beschäftigungsverhältnis gleich FREIBERUFLER ist, so ist die Abrechnungseinheit gleich STUNDEN.'' Diese logische Definition wird nun an eine physikalische Entität gebunden und ein Mapping zwischen den logischen und den realen Attributen festgelegt. In der Abbildung sieht man, dass für das Beispiel die Regel an die Entität Mitarbeiter gebunden wurde. Das logische Attribut ''Beschäftigungsverhältnis'' wurde an das physikalische Attribut ''Anstellungsart'' gebunden, die ''Abrechnungseinheit'' an die ''Abrechneinheit''.

  binding business rule TS V12.jpg
Abbildung: Binden der logischen Attribute an reale Attribute in TSS V12>

Durch die Möglichkeit, die logisch definierten Regeln mehrfach an verschiedene Objekte zu binden, müssen nicht wie bisher gleiche fachliche Regeln für jedes Objekt redundant definiert und gepflegt werden. Sollte zum Beispiel die fachliche Regel ''In dem Unternehmen XY wird beim Geschlecht unterschieden nach Mann, Frau.'' an den Objekten KUNDE und MITARBEITER verwendet werden, mussten bisher zwei Regeln definiert werden. Eine für das Objekt KUNDE, eine für das Objekt MITARBEITER. Das reduzierte einerseits die Anzahl redundanter Regeln, zweitens erhöht sich damit der Pflegeaufwand. Muss eine Regel geändert werden (z. B. beim Geschlecht kommt die Ausprägung ''Unbekannt'' hinzu), mussten bisher alle redundanten Regeln aktualisiert werden. Mit der Version V12 reicht es hingegen aus, die zentrale Regel einmalig zu ändern. Diese Änderung kann dann an alle Objekte automatisch propagiert werden, die diese Regel verwenden.

Neben dem reduzierten Pflegeaufwand hat dieses neue Verfahren zwei weitere Vorteile. Erstens steigt dadurch die Übersichtlichkeit, da alle Geschäftsregeln zentral an einem Ort definiert sind. Zweitens erhöhen sich mittelbar die Korrektheit und die Aktualität dieser Geschäftsregeln. Der zuständige Data Steward kann in regelmäßigen Abständen diese Regeln vom Fachbereich überprüfen und aktualisieren lassen. Früher war das aufgrund der Vielzahl der redundanten Regeln, deren Verstreuung über verschiedene Systeme nur schwer möglich.

Diese Geschäftsregeln können z. B. zum Monitoring der Datenqualität genutzt werden. Im Verarbeitungsprozess wird automatisch geprüft, wie viele Datensätze die jeweilige Regel einhalten und wie viele nicht. Daraus lässt sich eine Gütekennzahl berechnen, aus den gewichteten Gütekennzahlen der einzelnen Geschäftsregelvalidierungen kann dann eine Qualitätskennzahl abgeleitet und z. B. in der Datenqualitäts-Scorecard angezeigt werden.

Fazit: Eine sehr nützliche neue Funktion dieser Version V12, deren hohen Wert die Entwickler und Benutzer hoffentlich möglichst früh erkennen und die Funktion nutzen sollten.

Quelle Bild: Abgeleitet aus Technical Bulletin TSS V12, Trillium Software, 04/2009


Posted May 29, 2009 12:31 AM
Permalink | 1 Kommentare |

Group 1 Software meldet den Abschluss der erfolgreichen Zertifizierung ihrer Customer Data Quality (CDQ) Platform™ für Siebel CRM 8 von Oracle.
Durch die Integration der CDQ-Plattform über den Data Quality Connector 5.5 kann die Vollständigkeit und Korrektheit der Daten gewährleistet werden. Dadurch wird ein wichtiger Mehrwert geschaffen, durch den automatisierten Datenabgleich, die Aktualisierung und Korrektur von Kundenstamm- und Adressdaten wird die Gefahr sinkender Benutzerakzeptanz für das CRM-System durch eine unzureichende Datenqualität reduziert. 

Mit der erfolgreiche Zertifizierung nach den strengen Richtlinien des Oracle PartnerNetworks wird die reibungslose Integration des Data Quality Connector 5.5 mit Siebel CRM bestätigt, für Kunden reduzieren sich dadurch die Risiken und die Implementierungsprozesse werden verbessert.

Quelle: Pressemitteilung und Pressemitteilung 2


Posted May 28, 2009 12:12 AM
Permalink | keine Kommentare |

Es existieren eine Vielzahl unterschiedlicher Data-Profiling-Verfahren, die sich in drei Gruppen einteilen lassen:

  1. Attribut-Ebene: Analyse der Werte und Eigenschaften eines Attributs (z. B. einer Tabellenspalte)
  2. Datensatz-Ebene: Analyse aller Sätze einer Struktur (z. B. alle Datensätze einer Tabelle)
  3. Tabellen-Ebene: Analyse aller Beziehungen zwischen Sammlungen von Strukturen (z. B. zwischen Tabellen oder zwischen den Datensätzen einer Tabelle)

 

Data-Profiling-Arten_low.jpg

Abb.: Data-Profiling-Arten (größeres Bild)

 Für jede dieser drei Gruppen existiert eine Vielzahl unterschiedlicher Data-Profiling-Verfahren. Diese Verfahren aber nur einzelne Mosaiksteinchen vom Bild der Datenqualität – erst die richtige, projektspezifische Kombination ergibt einen vollständigen Eindruck und sichert den Erfolg.
Die vorwiegend technisch orientierten unterstützten Standard-Verfahren beschränken sich zumeist auf formale Prüfungen (z. B. auf Vollständigkeit) und beinhalten kaum inhaltliche Prüfungen (z. B. auf Korrektheit). Deshalb bleiben die Ergebnisse unvollständig, werden dafür aber von den auf dem Markt verfügbaren Werkzeugen sehr gut unterstützt.

Um die Vollständigkeit und damit die Ergebnisse zu verbessern, sind diese Verfahren um fachliche Geschäftsregeln zu erweitern. Dabei werden die Prozess- und Fachkenntnisse der fachlichen Experten maschinell prüf- und auswertbare Geschäftsregeln überführt. Diese Regeln müssen sich einerseits anhand der Daten validieren lassen, andererseits müssen die Daten damit automatisiert und wiederholbar geprüft werden können.

Standardwerkzeuge bieten derzeit kaum die Möglichkeit zur Ergänzung mit i ndividuellen Geschäftsregeln, sodass man überwiegend auf Nischenanbieter oder Eigenentwicklungen zurückgreifen muss.
Oft findet man auf Konferenzen und in Werbemailings die Angebote von Standardwerkzeughersteller, dass man ihnen seine Daten zum Data Profiling schicken soll. Sie versprechen, dass man so einen realistischen Eindruck von der Qualität seiner Daten erhalte. Neben den rechtlichen Problemen bezüglich der Weitergabe von hochsensiblen Daten an Dritte gibt es noch ein inhaltliches Problem: Wie angesprochen, können nur fachliche Experten mit ausgeprägten Prozesskenntnissen die Ergebnisse und Hinweise der
Standard-Verfahren bewerten. Hinzu kommt, dass diese sehr spezifischen Geschäftsregeln bei diesem Check-up naturgemäß nicht verwendet werden. Woher soll der Werkzeughersteller
auch die Geschäftsregeln des ihm fremden Unternehmens kennen? Aus diesem Grund ist das Ergebnis in höchstem Maße unvollständig und gibt keinen realistischen Eindruck über die
Datenqualität. Solche Check-ups sind allerhöchstens ein erster Schritt; nur harte Arbeit führt zu verwendbaren Ergebnissen. Ein Werkzeug ist und bleibt eben nur ein Werkzeug – auch
beim Data Profiling.

Quelle: "Datenqualität erfolgreich steuern", TDWI, 2009.


Posted May 7, 2009 2:20 PM
Permalink | keine Kommentare |

Immer mehr Unternehmen begreifen erfolgreiches Datenqualitätsmanagement als entscheidenden Wettbewerbsvorteil: Die IT-Kosten sinken, Projekte werden beschleunigt und auf Änderungen am Markt oder in gesetzlichen Auflagen kann schneller und flexibler reagiert werden. Darüber hinaus wird die Datenintegration über System-, Abteilungs- und Unternehmensgrenzen hinweg erleichtert, Imageverluste aufgrund negativer Schlagzeilen werden vermieden und falsche Entscheidungen aufgrund mangelhafter Daten verhindert.

Das Buch ''Datenqualität erfolgreich steuern'' (Erscheinungstermin: Juni 2009) dreht sich um dieses aktuelle Thema und zeigt anhand von Beispielen, wie IT-Verantwortliche die Qualität ihrer Daten zielgerichtet verbessern können. Die praxisorientierte Neuerscheinung beschreibt erstmals detailliert die Lösungsansätze, Methoden und Werkzeuge für das Datenqualitätsmanagement entlang des gesamten Datenflusses von der Datenerfassung über das Data Profiling, die verschiedenen Schritte der Datenintegration bis hin zur Informationsbereitstellung. Wichtige querschnittliche Prozesse sind dabei das Metadaten-Management sowie das laufende Monitoring der Datenqualität.

Das Autorenteam stellt dar, wie man Data Profiling richtig einsetzt und den größten Nutzen aus den Ergebnissen zieht. Auch werden Produkte analysiert und bewertet, mit denen IT-Manager ihre Datenprobleme optimal lösen können. Das Buch geht den Ursachen und Auswirkungen schlechter Datenqualität auf den Grund und verdeutlicht, welche Investitionen sich wirklich lohnen. Das gebündelte Expertenwissen kann vielen Anwendern kostspielige und letztlich erfolglose Experimente ersparen, denn: Das Wissen um die Grundlagen des Datenqualitätsmanagements, die technische Umsetzung mit passgenauen Werkzeugen und die praktische Umsetzung in einem kompletten Zyklus eines BI-Projektes sind unabdingbar für erfolgreiches Datenqualitätsmanagement.

Weitere Informationen zu diesem Buch auf folgender Webseite. Inhalte daraus werden auch hier in meinem Blog veröffentlicht.

Viel Spaß beim Lesen und
viel Erfolg bei der der Umsetzung im nächsten Projekt wünscht

Detlef Apel


Posted May 4, 2009 10:15 AM
Permalink | keine Kommentare |