Banken erkennen die Bedeutung von Datenqualität in Krisenzeiten

3 Juni 2009

Laut einer kürzlich veröffentlichten weltweiten Studie des Marktforschungsunternehmens Economist Intelligence Unit beabsichtigt die Mehrheit der Finanzdienstleister angesichts der Krise in den letzten Monaten eine Überprüfung ihres Risikomanagements. Maßnahmen zur Verbesserung der Datenqualität spielen dabei eine wichtige Rolle. Denn die mangelnde Qualität vorhandener Kundendaten wurde von den Teilnehmern der Studie als eine der Hauptursachen für das unzulängliche Risikomanagement in ihren Unternehmen identifiziert. Viele Banken und Sparkassen haben demnach erkannt, dass es gerade in Krisenzeiten wichtig ist, auf verlässliche Kundendaten zurückgreifen zu können, um schnell und effizient auf die neue Marktsituation in der Finanzkrise reagieren zu können.

„Verschmutzte“ Datenbestände können gerade jetzt bei strategischen Entscheidungen ökonomischen Schaden verursachen, weil die Entscheidungsgrundlage nicht den tatsächlichen Zuständen entspricht. Für eine optimale Steuerung von Chancen und Risiken ist eine hohe Datenqualität nun einmal unerlässlich. Denn dadurch lassen sich nicht nur signifikante Kosteneinsparpotenziale erschließen, sondern auch die Grundlage für strategische Entscheidungen in wirtschaftlich angespannten Zeiten schaffen.

Mathematische Logik reicht nicht aus

Gerade mehrfach erfasste Kundendaten stellen einen enormen Kostentreiber dar und behindern die effiziente Arbeit in Marketing und Vertrieb. Durch Dubletten bedingte Mehrfachanrufe oder doppelte Mailings etwa lösen beim Kunden nicht nur Verärgerung aus, sie kosten auch Zeit und damit Geld. Sind zum Beispiel in den Systemen für das Customer Relationship Management (CRM) Namen, Postleitzahlen, Orte, Straßen und Hausnummern fehlerhaft, veraltet, unvollständig oder mehrfach vorhanden, läuft die Kundenbetreuung häufig ins Leere. Ein ganzheitlicher Ansatz zur Sicherung der Datenqualität, der die einzelnen Teilprozesse miteinander verknüpft, kann hier Abhilfe schaffen. Diese umfassen das Data Profiling, das Data Cleansing und das Monitoring.

Das Data Profiling gibt nicht nur Aufschluss darüber, welche Datentypen in einer Kundendatenbank vorhanden sind, sondern lässt auch erkennen, wie valide und gebräuchlich diese Daten sind. Beim Data Cleansing werden die erkannten Probleme durch Anwendung verschiedener Algorithmen direkt behoben. Um dem ganzheitlichen Ansatz zur Qualitätssteigerung Rechnung zu tragen, bedarf es schließlich einer kontinuierlichen Überprüfung der Konsistenz, Korrektheit und Zuverlässigkeit der Daten. Neue Daten werden deshalb im Teilprozess „Monitoring“ vor der Speicherung in den operativen und analytischen Systemen überprüft, und in bestimmten Zeitabständen findet eine Prüfung der gesamten Kundendaten statt.

Da die manuelle Bereinigung großer Datenmengen nicht in effizienter Weise durchgeführt werden kann, ist der Einsatz von Data-Cleansing-Werkzeugen zu empfehlen. Mit ihrer Hilfe kann teilweise auch der Prozess der Datenintegration automatisiert werden. Bei der Zusammenführung gleicher Datenbestände aus unterschiedlichen Datenquellen müssen diese Datensätze zunächst identifiziert werden. Dann ist zu entscheiden, welche Bestandteile der Dubletten in den bereinigten Datenbestand übernommen werden sollen.

Menschliches Wissen ist gefragt

Um Dubletten in großen Kundendatenbanken von Banken und Sparkassen zu bereinigen, versprechen vor allem jene Verfahren Erfolg, die computergestützte Schlussfolgerungen mit der menschlichen Intelligenz kombinieren. Denn wenn angesichts der zunehmenden Globalisierung die Namen unterschiedlichster Nationalitäten Einzug in die Kundendatenbanken der Geldinstitute halten, stoßen die üblichen mathematischen Prozeduren zur Dublettenerkennung und Adressvalidierung schnell an ihre Grenzen. Dies gilt auch, wenn weltweit operierende Finanzkonzerne es bei ihren Adressdaten mit verschiedenen landesspezifischen Schreibweisen zu tun haben.

Um hier „saubere“ Daten zu bekommen, ist länderspezifisches Wissen gefragt. Es muss zum Beispiel nationale Besonderheiten der Adressierung, Namen und deren Schreibweisen berücksichtigen. Neben den herkömmlichen mathematischen Verfahren kommen deshalb in der Datenqualitätssoftware zunehmend auch wissensbasierte Methoden zum Einsatz, die Einsichten der Computerlinguistik zur Spracherkennung und -synthese anwenden. Im Ergebnis wird eine deutlich höhere Erkennungsquote von Dubletten erreicht – über Länder- und Sprachgrenzen hinweg.

Allerdings sollte man den notwendigen Aufwand nicht unterschätzen. Während der erste Schritt – das Data-Profiling – sofort nach Installation der Software durchgeführt werden kann, nimmt die Beseitigung der Dubletten je nach Umfang der Datenbank und vorhandener Qualität unter Umständen mehrere Wochen oder Monate in Anspruch. Die Erfahrung zeigt, dass die Gewährleistung einer hohen Datenqualität einige Zeit braucht. Ziel ist deshalb meist nicht eine sofortige Komplettbereinigung der Kundendaten, sondern vor allem eine stetige Verbesserung und die Vermeidung von Dubletten direkt bei der Datenerfassung.


  • Holger Wandt
    Holger Wandt (geb. 1963) ist Principal Advisor bei Human Inference und verantwortlich für alle wissensbezogenen Fragen zur Datenqualität. Er ist als Experte zuständig für alle Aspekte der Standardisierung von Namen und Adressen auf nationaler und internationaler Ebene. Außerdem ist Herr Wandt Studienleiter der Masterclass Data Quality Management an der Nyenrode Buisnessuniversität und Dozent der linguistischen Fakultät an der Universität Utrecht.
 

Kommentare

Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!