15 März 2009
Die globale Wirtschaft ächzt unter der derzeitigen Finanzkrise. Kaum ein Tag vergeht, an dem uns nicht neue Horrormeldungen erreichen: Sei es die drohende Insolvenz bei großen
Finanzinstituten, der angekündigte Abbau von zehntausenden Arbeitsplätzen im Automobilbereich oder die Gewinneinbrüche und -warnungen bei Dax-Unternehmen. In Zeiten wie diesen wird
nicht nur gerne Zurückhaltung bei geplanten Investitionen geübt, sondern auch verstärkt auf Potenziale für mögliche Kosteneinsparungen geachtet.
Dabei stehen vermehrt auch die eingesetzten Softwareprodukte auf dem Prüfstand. Waren in der Vergangenheit beispielsweise die immensen Anschaffungs- und Wartungskosten zwar stetiger Anlass zu
lauten Unmutsäußerungen bei den leidtragenden Unternehmen, so wird heute ernsthaft über einen Wechsel zu preiswerteren Anbietern nachgedacht. Die Formel: „Es wurde noch nie in
IT-Chef gefeuert, der die Software von XY eingesetzt hat…“ greift nicht mehr. Selbstverständlich sind Qualitätskriterien wie Stabilität, weltweite Verfügbarkeit und
weit reichende Funktionalität immer noch essenziell, wenn es darum geht, die richtige Softwarelösung für das eigene Unternehmen auszuwählen und einzusetzen. Längst jedoch
zeigen sich zahlreiche Anwender bereit, eine Second-Best-Lösung einzusetzen, wenn dadurch die Kostensituation deutlich entspannt werden kann. Schließlich, so wird oft argumentiert,
benötigen die meisten Nutzer im eigenen Hause nur einen Bruchteil der angebotenen Funktionalitäten, obwohl diese voll zu bezahlen sind. Man denke hier an die vielfältigen Optionen, die
beispielsweise die verbreiteten Tabellenkalkulations- oder Textverarbeitungsprogramme aufweisen.
Auch vor dem Business-Intelligence-Sektor machen diese Überlegungen nicht halt. Verstärkt treten hier Kosten-/Nutzen-Betrachtungen in den Vordergrund, wenn es darum geht, vorhandene Systeme
zu erweitern oder neue Softwarewerkzeuge einzusetzen. Während sich die Nutzengrößen dabei nicht immer nachvollziehbar quantifizieren lassen (Wie hoch ist der Wert der
„besseren“, „schnelleren“ oder „genaueren“ Information?), sind die Kostenbestandteile meist klar und gut rechenbar. Zumindest Faktoren wie Hard- und Softwarekosten
sowie benötigte interne und externe Mitarbeiterkapazitäten können relativ exakt - auch als Prognose für die nächsten Jahre - kalkuliert werden. Vor diesem Hintergrund stehen
auch die eigesetzten BI-Softwareprodukte auf dem Prüfstand, zumal sich diese als nicht zu unterschätzende Größe bei der Berechnung der BI-Gesamtkosten erweisen.
Schließlich sind inzwischen nicht nur kostengünstige Produkte am Markt verfügbar, die in der Vergangenheit vor allem durch mittelständische Unternehmen intensiv genutzt wurden,
sondern es existiert auch ein breites Spektrum leistungsfähiger Open Source BI-Werkzeuge für unterschiedliche Aufgabenstellungen und mit voneinander abweichendem Schwerpunkt, die
interessante Alternativen bieten, wenn es um klar abgrenzbare und etablierte Business-Intelligence-Funktionen geht. Unterscheiden lassen sich Open Source BI-Tools nach ihrer Positionierung in der
Architekturlandschaft in eher Backend- und eher Frontend-orientiert. Bei den Backend-Komponenten finden sich wiederum neben den Open Source Datenbanksystemen vor allem Datenintegrationswerkzeuge
für den Prozess des Extrahierens, Transformierens und Ladens von Daten (ETL-Tools).
Bereits seit vielen Jahren und ursprünglich aus dem universitären Bereich stammend stehen Open-Source-Datenbanksysteme zur Verfügung, die zunächst als relationale
Allround-Lösungen konzipiert waren und im geschäftlichen Umfeld verstärkt im operativen Tagesgeschäft zu Einsatz kamen. Um diverse Zusatzfunktionen und Erweiterungen ergänzt
lassen sie sich allerdings heute auch für dispositive Aufgabenstellungen als Data-Warehouse-Plattform nutzen. Als verbreitete Vertreter dieses Genres sind MySQL, Postgres und Ingres
anzuführen, wobei insbesondere Ingres den BI-Markt für sich entdeckt zu haben scheint und auf den einschlägigen Messen und Tagungen Präsenz zeigt. Für den Einsatz als
Data-Warehouse-Datenbank wichtige Funktionen wie Partitionierung und Parallelisierung sowie Materialized Views und Bitmap-Indizes werden auch von den Open-Source-Datenbanken vermehrt abgedeckt und
machen ihren Einsatz vor allem in Umgebungen mit nicht zu hohem Datenvolumen interessant.
Auch im ETL-Sektor tummeln sich verschiedene Projekte mit inzwischen ausgereiften und leistungsfähigen Produkten. Als bekannteste Vertreter lassen sich CloverETL, Kettle (Pentaho Data
Integration) und Talend Open Studio anführen, die auch den Vergleich mit kommerziellen ETL-Produkten nicht scheuen. Insbesondere der französische Anbieter Talend weist gute Sichtbarkeit am
deutschsprachigen Markt auf. Dies liegt nicht zuletzt an den erheblichen Fremdmitteln (im Januar 2009 12 Millionen Dollar), die Risikokapitalgeber in die Produktfamilie zu investieren bereit
sind.
Open Source BI-Tools für den Frontend-Bereich bieten Präsentations- und Analysefunktionalitäten für die Endbenutzer. Differenziert werden kann hier zwischen Lösungen für
das Reporting, für die multidimensionale Datenauswertung (OLAP) und für das Data Mining. Dabei blicken quelloffene Data Mining-Tools auf eine lange Historie zurück. Bereits vor mehr
als fünfzehn Jahren wurde im akademischen Umfeld mit der Entwicklung von WEKA begonnen und bis heute fortgeführt. Die in diesem Umfeld erarbeitete und inzwischen sehr breite Sammlung
verfügbarer Algorithmen wird auch von anderen Projekten eingebunden. Als erfreulich erweist sich der Umstand, dass gleich zwei deutsche Projekte zu sehr leistungsfähigen Open Source Data
Mining-Suiten geführt haben, die heute professionell weiterentwickelt und unterstützt werden, einschließlich kostenpflichtiger Supportangebote: Knime und RapidMiner.
Im OLAP-Bereich ergeben sich auch im kommerziellen Umfeld zwei grundlegende Gestaltungsalternativen: Auf der einen Seite kann versucht werden, die etablierte und ausgereifte relationale
Datenbanktechnologie als Speicherkomponente zur Ablage multidimensional strukturierter Daten einzusetzen und durch Zusatzfunktionalitäten die erforderliche Navigationsflexibilität im
mehrdimensionalen Datenraum zu erreichen. Einen entsprechenden ergänzenden Baustein repräsentiert die ROLAP-Engine Mondrian in Verbindung mit dem Front-End-Tool JPivot, das interaktive
Slice and Dice-Operationen im Web Browser unterstützt. Auf der anderen Seite bieten multidimensionale Datenbanksysteme eine auch physisch optimierte Ablage mehrdimensionaler Daten –
häufig als so genannte InMemory-Datenbank. Als multidimensionale Datenbank fungiert Palo, die Speicherkomponente des Freiburger Softwarehauses Jedox, die sich durch unterschiedliche
Endbenutzer-Tools in Excel oder im Web abfragen und verwalten lässt.
Das vielleicht umfangreichst Angebot an Open Source BI-Werkzeugen findet sich im Reporting, wenn es also darum geht, pixelgenau Standardberichte ohne ausgeprägte Navigationsfunktionalität
für den Endanwender zur Verfügung zu stellen. Als besonders leistungsfähig erweisen sich hier die Produkte Eclipse Birt (federführend entwickelt vom US-amerikanischen
Reporting-Spezialisten Actuate), Jasper Reports in Verbindung mit iReport (als Bestandteile der Jaspersoft BI-Suite) sowie Pentaho Reporting (ehemals JFree Reports als Baustein der Pentaho BI-Suite).
Alle Produkte bieten weit reichende Formatierungsfunktionalitäten in Verbindung mit zahlreichen Schnittstellen zu diversen Datenbanksystemen und sonstigen Datenquellen sowie vielfältigen
Optionen für die Verteilung und das Management von Berichten.
Die angesprochenen Open Source-Produkte für Data Mining, OLAP und Reporting wurden im Rahmen einer vergleichenden BARC-Studie einer kritischen Gegenüberstellung unterzogen (Gluchowski,
Schieder 2009). Zwar lassen sich aufgrund der doch teilweise unterschiedlichen Schwerpunktsetzung keine klaren Gewinner und Verlierer ermitteln, allerdings konnten die Stärken und Schwächen
und damit potenzielle Einsatzbereiche der einzelnen Tools klar herausgearbeitet und voneinander abgegrenzt werden.
Als Ergebnis der Studie bleibt festzuhalten, dass der Markt für Open Source Datenanalysewerkzeuge sehr dynamisch ist und die angebotenen Lösungen eine rasante Entwicklung aufweisen. Die
freien Werkzeuge sind in der Lage, bereits große Teile der Analysefunktionalitäten abzudecken, die Anwender heute von Business Intelligence erwarten. Gerade auch hinsichtlich Sicherheit,
Stabilität und Performance haben die Tools stark aufgeholt. In Punkto Anpassbarkeit und Offenheit sind die untersuchten Softwareprodukte – der Natur der Sache geschuldet - kommerziellen
Alternativen häufig sogar eine Nasenlänge voraus. Eine weitere Ausweitung der Funktionsumfänge ist zu erwarten, gleichwohl die vollständige Angleichung an das Funktionsspektrum
kommerzieller Werkzeuge derzeit nicht in Sicht ist. Zusammenfassend lässt sich feststellen, dass vor allem für die Entwicklung fachlich spezialisierter Lösungen in Eigenregie Open
Source BI-Werkzeuge eine solide Ausgangsbasis bilden können.
Gluchowski, Peter; Schieder, Christian (2009): Open Source Business Intelligence - Quelloffene Werkzeuge für Reporting, OLAP und Data Mining im Vergleich, Oxygon Verlag, o. O. 2009
Weitere Informationen zur Studie:
http://www.tu-chemnitz.de/wirtschaft/wi2/literatur/OSS.php
Aktuelle Artikel von Peter Gluchowski
Kommentare
Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!