
3 Juni 2009
Laut einer kürzlich veröffentlichten weltweiten Studie des Marktforschungsunternehmens Economist Intelligence Unit beabsichtigt die Mehrheit der Finanzdienstleister angesichts der Krise in
den letzten Monaten eine Überprüfung ihres Risikomanagements. Maßnahmen zur Verbesserung der Datenqualität spielen dabei eine wichtige Rolle. Denn die mangelnde Qualität
vorhandener Kundendaten wurde von den Teilnehmern der Studie als eine der Hauptursachen für das unzulängliche Risikomanagement in ihren Unternehmen identifiziert. Viele Banken und
Sparkassen haben demnach erkannt, dass es gerade in Krisenzeiten wichtig ist, auf verlässliche Kundendaten zurückgreifen zu können, um schnell und effizient auf die neue Marktsituation
in der Finanzkrise reagieren zu können.
„Verschmutzte“ Datenbestände können gerade jetzt bei strategischen Entscheidungen ökonomischen Schaden verursachen, weil die Entscheidungsgrundlage nicht den
tatsächlichen Zuständen entspricht. Für eine optimale Steuerung von Chancen und Risiken ist eine hohe Datenqualität nun einmal unerlässlich. Denn dadurch lassen sich nicht
nur signifikante Kosteneinsparpotenziale erschließen, sondern auch die Grundlage für strategische Entscheidungen in wirtschaftlich angespannten Zeiten schaffen.
Mathematische Logik reicht nicht aus
Gerade mehrfach erfasste Kundendaten stellen einen enormen Kostentreiber dar und behindern die effiziente Arbeit in Marketing und Vertrieb. Durch Dubletten bedingte Mehrfachanrufe oder doppelte
Mailings etwa lösen beim Kunden nicht nur Verärgerung aus, sie kosten auch Zeit und damit Geld. Sind zum Beispiel in den Systemen für das Customer Relationship Management (CRM) Namen,
Postleitzahlen, Orte, Straßen und Hausnummern fehlerhaft, veraltet, unvollständig oder mehrfach vorhanden, läuft die Kundenbetreuung häufig ins Leere. Ein ganzheitlicher Ansatz
zur Sicherung der Datenqualität, der die einzelnen Teilprozesse miteinander verknüpft, kann hier Abhilfe schaffen. Diese umfassen das Data Profiling, das Data Cleansing und das
Monitoring.
Das Data Profiling gibt nicht nur Aufschluss darüber, welche Datentypen in einer Kundendatenbank vorhanden sind, sondern lässt auch erkennen, wie valide und gebräuchlich diese Daten
sind. Beim Data Cleansing werden die erkannten Probleme durch Anwendung verschiedener Algorithmen direkt behoben. Um dem ganzheitlichen Ansatz zur Qualitätssteigerung Rechnung zu tragen, bedarf
es schließlich einer kontinuierlichen Überprüfung der Konsistenz, Korrektheit und Zuverlässigkeit der Daten. Neue Daten werden deshalb im Teilprozess „Monitoring“ vor
der Speicherung in den operativen und analytischen Systemen überprüft, und in bestimmten Zeitabständen findet eine Prüfung der gesamten Kundendaten statt.
Da die manuelle Bereinigung großer Datenmengen nicht in effizienter Weise durchgeführt werden kann, ist der Einsatz von Data-Cleansing-Werkzeugen zu empfehlen. Mit ihrer Hilfe kann
teilweise auch der Prozess der Datenintegration automatisiert werden. Bei der Zusammenführung gleicher Datenbestände aus unterschiedlichen Datenquellen müssen diese Datensätze
zunächst identifiziert werden. Dann ist zu entscheiden, welche Bestandteile der Dubletten in den bereinigten Datenbestand übernommen werden sollen.
Menschliches Wissen ist gefragt
Um Dubletten in großen Kundendatenbanken von Banken und Sparkassen zu bereinigen, versprechen vor allem jene Verfahren Erfolg, die computergestützte Schlussfolgerungen mit der menschlichen
Intelligenz kombinieren. Denn wenn angesichts der zunehmenden Globalisierung die Namen unterschiedlichster Nationalitäten Einzug in die Kundendatenbanken der Geldinstitute halten, stoßen
die üblichen mathematischen Prozeduren zur Dublettenerkennung und Adressvalidierung schnell an ihre Grenzen. Dies gilt auch, wenn weltweit operierende Finanzkonzerne es bei ihren Adressdaten mit
verschiedenen landesspezifischen Schreibweisen zu tun haben.
Um hier „saubere“ Daten zu bekommen, ist länderspezifisches Wissen gefragt. Es muss zum Beispiel nationale Besonderheiten der Adressierung, Namen und deren Schreibweisen
berücksichtigen. Neben den herkömmlichen mathematischen Verfahren kommen deshalb in der Datenqualitätssoftware zunehmend auch wissensbasierte Methoden zum Einsatz, die Einsichten der
Computerlinguistik zur Spracherkennung und -synthese anwenden. Im Ergebnis wird eine deutlich höhere Erkennungsquote von Dubletten erreicht – über Länder- und Sprachgrenzen
hinweg.
Allerdings sollte man den notwendigen Aufwand nicht unterschätzen. Während der erste Schritt – das Data-Profiling – sofort nach Installation der Software durchgeführt
werden kann, nimmt die Beseitigung der Dubletten je nach Umfang der Datenbank und vorhandener Qualität unter Umständen mehrere Wochen oder Monate in Anspruch. Die Erfahrung zeigt, dass die
Gewährleistung einer hohen Datenqualität einige Zeit braucht. Ziel ist deshalb meist nicht eine sofortige Komplettbereinigung der Kundendaten, sondern vor allem eine stetige Verbesserung
und die Vermeidung von Dubletten direkt bei der Datenerfassung.
Kommentare
Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!