6 April 2010
Zusammenfassung
In den Krisenzeiten der letzten zwei Jahre war oft das Thema Compliance in alle Munde. Denn das Gesetz und ein ethisches Verhalten hätten die Verursacher der Finanz- und Wirtschaftskrise abschrecken müssen. Dies war nicht der Fall, mit Konsequenzen für Millionen von Menschen in der ganzen Welt. Eine Erklärung von vielen ist: "Aufgrund von Kosten- und Zeitdruck bleiben Potentiale ungenutzt und ad-hoc-Lösungen werden zur Behebung von Kontrollschwächen eingesetzt" [1].
Ein Nutzen einer Compliance-Lösung ist die Verbesserung der Reputation des Unternehmens. Sentiment Analytics ist ein Anwendungsfeld von Text Analytics, das aus verschiedenen öffentlichen Informationsquellen anhand gut durchdachte Modellen ein Stimmungsbarometer für ein Unternehmen oder seine Produkte und Dienstleistungen bildet. Somit schließt sich der Kreis zwischen Sentiment Analysis und Compliance.
In einer neulich durchgeführten Umfrage "IT Kompass" hat IDC 470 Entscheider und IT-Spezialisten unter anderen folgendes gefragt: "Wie wichtig sind die Anforderungen von Business an die IT?". Ein Ergebnis dieser Frage war "Von der IT-Abteilung erwartet das Business-Management zudem, dass sie Compliance-Anforderungen umsetzt." [7]
Alle Anregungen aus diesem Artikel rufen die allgemeine Empfehlung hervor: die Datenschutz-Bestimmungen müssen angehalten werden. Vor allem ist diese Empfehlung deswegen wichtig, weil die Datenschutzbestimmungen unterschiedlich in verschiedenen Ländern gehandhabt werden.
Compliance und IT
Die Compliance-Anforderungen haben kontinuierlich zugenommen, so dass die meisten Unternehmen nicht in der Lage sind, das Thema angemessen anzugehen. Diese Anforderungen sind in eine Fülle von Gesetzen und Vorschriften, wie z.B.: Sarbanes-Oxley Act (SOX), Basel II, Mindestanforderungen an das Risikomanagement (MaRisk), EU-Geldwäscherichtlinie, Payment Card Industry Data Security Standard (PCI DSS), Solvency II, etc.
Die Bezeichnung "Compliance" kommt aus dem Englischen und bedeutet "Einhaltung" oder "Befolgung", sprich ein gesetzestreues Verhalten. Dies ist eine Managementaufgabe. Unter den Nutzen von einer Compliance-Lösung sind die Reduktion der Risiken und die Verbesserung der Reputation des Unternehmens zu finden. Beim letzteren kommen aus der Ecke Text Analytics viele interessante Ansätze, wie z.B. Sentiment Analytics oder Brand Management.
Sentiment Analytics ist ein Anwendungsfeld von Text Analytics, das aus verschiedenen öffentlichen Informationsquellen, anhand gut durchdachter Modelle, ein Stimmungsbarometer der Öffentlichkeit für ein Unternehmen herausbildet. Der Stimmungsbarometer beeinflusst entscheidend die Wahrnehmung und die Reputation eines Unternehmens. Somit schließt sich der Kreis zwischen Sentiment Analysis und Compliance.
Wessen Aufgabe ist Compliance? "Es handelt sich hierbei um eine Aufgabe, welche die IT oder ein Geschäftsbereich nicht im Alleingang regeln kann oder sollte, sondern um unternehmensweite Anstrengungen über Abteilungsgrenzen hinweg. Durch Compliance werden geeignete Organisationsstrukturen, Prozesse und Systeme in Unternehmen eingerichtet."[1]
Text Analytics
Eigentlich arbeiten wir in allen Bereichen seit Jahrhunderten mit Texten und vor allem sehr intensiv seit der Entstehung der Dienstleistungswirtschaft. Es ist jedoch merkwürdig, dass der Text von Zahlen in der Arbeitswelt verdrängt wurde. Text Analytics und das Internet haben den Platz des Textes wieder erobert. Es ist vielleicht nicht verwunderlich, dass die Suche in Internet durch Text Analytics "intelligent" gemacht wird.
Was ist Text Analytics? Die kurze Definition lautet: ein Möglichkeit, aus Texten Wissen zu gewinnen. Die längere Definition lautet: Es ist ein Bündel von Analyseverfahren, die anhand von statistischen, linguistischen und Maschinen gestützten Lernverfahren relevante Textstrukturen gewinnt. Diese Verfahren entdecken Fakten, Geschäftsregel und Beziehungen, die in Texten "versteckt" lagen. Um es genauer einzuordnen, Text Analytics, auch unter Text Mining bekannt, ist Bestandteil von Data Mining.
Der Unterschied zwischen Informationssuche (Information Retrieval) und Informationsextraktion (Information Extraction) im Kontext der Text Analytics ist im folgenden Bild veranschaulicht. 
(Quelle: http://www.lockheedmartin.com/products/AeroText/index.html)
Informationsextraktion bedeutet, eine Strukturierung, ins Beziehungsbringen von Fakten, während Informationssuche eher unscharfe Informationen liefert. Und das ist auch der entscheidende Unterschied zwischen Internet-Suche und Text Analytics.
Wir interpretieren Texte, linguistisch und grammatikalisch die ganze Zeit. Durch Text Analytics versuchen wir das gleiche mithilfe von Software und Computern zu erreichen, und zwar in einem Datenpool bestehend aus tausenden von Dokumenten. Diese Sammlung von Dokumenten wird in den Fachkreisen Corpus genannt. Für die Interpretation wird der Text mit Anmerkungen versehen, dann wird der Text neu strukturiert, in klaren syntaktischen Einheiten geteilt, und mit Kontextinformationen versehen. D.h. wir halten dadurch die Bedeutungen der Texte fest. Dafür werden so genannte Taxonomien benutzt, die Entitäten und Konzepte analog eines multidimensionales BI Model zusammen zu fassen.
Wie eine Taxonomie aussieht, kann man im folgenden Diagramm sehen. 
Quelle: http://www.ibm.com/developerworks/data/library/techarticle/dm-0907textanalysis2/taxonomy.gif )
Eine Taxonomie ist eine hierarchische Klassifizierung von Informationen durch die Bildung von Klassen unter dem Aspekt der Ähnlichkeitsbeziehungen zwischen den zu ordnenden Begriffen. Jeder Klasse, sprich Blatt in dem vorigen Diagramm, wird nur eine Oberklasse zugeordnet, so dass die gesamte Klassifikation eine Baumstruktur abbildet. Durch diese Art der Klassifizierung von Wissensbereichen innerhalb einer Hierarchie entsteht so eine einfache Semantik. [4]
Sentiment Analysis
Wenn wir im Internet "unterwegs" sind, dann sind wir sehr oft aufgefordert, Bewertungen abzugeben. Beispiele: Hotels, Restaurants, Produkte, Presseartikel, etc. Bekannten Plattformen wie eBay und Amazon schöpfen ihr Geschäftsmodell aus diesen Bewertungen. Diese Bewertungen sind natürlich auch mit Gefühle (Englisch Sentiment) verbunden und man versucht, mit Erfolg, diese Gefühle zu quantifizieren. Im Bereich Sentiment Analysis sind die Informationsquellen nicht mehr direkt die Antworten der Konsumenten (seine Sternchen), sondern sind es die Einträge in Foren, Blogs oder internen Emails.
Sentiment Analysis, als spezielles Thema innerhalb von der Text Analytics hat dadurch an Bedeutung gewonnen, dass die Wirtschaftskrise eine enorme "Masse" an Gefühle hervorgerufen hat. Diese Gefühle sind im Internet schon "protokolliert". Durch Sentiment Analysis werden aus diesen Protokollen wertvolle Informationen gewonnen, die für die Reputation eines Unternehmens, für seine Produktstrategie wichtig sind. Vor allem Finanzinstitutionen, als eine von vielen "Hauptverursacher" der Krise identifiziert, sind "gezwungen", die aggregierte Meinungen über sich zu kanalisieren und durch entsprechende Marketing- und Kommunikationsmaßnahmen zu entschärfen.
Sentiment Analysis kann auch als Quelle für Predictive Analytics dienlich sein. Trends und Voraussagen, die das Ergebnis von Predictive Analytics sein können, werden in Bereichen wie Betrugsprävention, Credit-Scoring, Risikoanalyse angewendet.
Quellen für “unstrukturierte" Informationen für ein Unternehmen beinhalten:
Um die Informationen für Text Analytics und Sentiment Analysis zu gewinnen, gibt es Verfahren, die in den meisten Fällen wie im folgenden Diagramm aussehen.
Architektur für ein generisches Text Mining System [3]
Im Detail sind diese Schritte von folgenden Aktivitäten unterstützt: Analyse (Parsen), Korrektur, Stammwörter identifizieren, “Stopwörter” wie “und”, “oder” eliminieren und Semantik bilden.
Die Analyse besteht aus der Identifizierung von Begriffen, Eliminierung von unerwünschten Zeichen, wie “/”, Komma “,”, Behandlung spezieller Zeichen, wie Umlaute. Die Korrektur der Ergebnisse der Analyse besteht unter anderen aus orthographischer Korrektur, Ersetzen von Abkürzungen mit den vollständigen Wörtern. Danach werden Stammwörter identifiziert. Dabei müssen die Konjugationen der Verben sowie die Pluralformen der Wörter berücksichtigt werden, so dass die Anzahl der Stammwörter klein gehalten wird. Unnötige Wörter werden dann eliminiert, und erst jetzt kann man semantische Bedeutungen aus dem Text gewinnen. Die semantischen Beziehungen zu bilden ist dann meistens die Arbeit von Menschen. Somit wird aus dem Rohtext Bedeutung, sprich Metadaten extrahiert. [5]
BI und Sentiment Analysis
Während traditionale BI Systeme aufgebaut wurden, und Fragen über Fakten zu beantworten, liefert Sentiment Analysis subjektive Informationen und beantworten Fragen über Gefühle und Meinungen. Deswegen ist bei Sentiment Analysis entscheidend, welche Wörter und Ausdrücke diese Gefühle und Meinungen beschreiben.
Seth Grimes [6], sieht folgende Ingredienzen als Erfolgsfaktoren für Sentiment Analysis:
Die Fähigkeit die Meinungsbilder zu identifizieren ist wichtig. Denn z.B., im Falle einer Beschwerde eines Kunden, sollte man anhand seiner Meinung die Transaktion herausfinden, die die geäußerte Meinung verursachte. Dann kann man dem Kunden gezielt was Gutes tun, um sein Vertrauen wieder zu gewinnen. Wer was im Internet sagt, ist auch deswegen wichtig zu wissen, da manchmal notorische Nörgler ihre negativen Gefühle abladen.
Somit ist Sentiment Analysis als Kontext für BI-Anwendungen zu sehen. Harte Fakten aus BI-Systemen werden mit weichen Indikatoren eines Stimmungsbarometers ergänzt. Dies kann als ein Teil für eine Compliance-Lösung für ein Unternehmen fungieren.
SOURCE: Compliance-Anforderungen, Text Analytics und Sentiment Analysis
Aktuelle Artikel von Alexandru Draghici
Kommentare
Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!