21 April 2009
Es ist ein halbes Jahr her, dass Larry Ellison auf der Open World 2008 Oracle Exadata Storage Server und HP Oracle Database Machine vorgestellt hat. Zahlreiche Publikationen haben sich der Lösungsarchitektur gewidmet, die sich aufgrund ihrer Andersartigkeit im Vergleich zu bislang verfügbaren Data Warehouse Appliances nicht für jeden sofort erfassen lässt. Für Entscheider ist indes die Architektur nicht per se kaufrelevant. Vielmehr spielt die Leistungskraft in Relation zu den Gesamtkosten die zentrale Rolle, und das natürlich projiziert auf die Anforderungen des Unternehmens.
Oracle hat mit der Auslieferung von Exadata auf einen Markt reagiert, der bereits seit einigen Jahren in Bewegung geraten ist. Wachsende Datenmengen und erweiterte funktionale Anforderungen bei Data Warehouse Anwendungen setzen DBMS Anbieter nämlich zunehmend unter Druck. Neue Datenbankangebote für analytische Applikationen reichen von vorkonfigurierte, für den Einsatzzweck optimierte Hardware-/Software-Kombinationen auf Basis etablierter Technologien bis hin zu gänzlich neuen Lösungsansätzen von bislang unbekannten Anbietern. Hier wird häufig von „Data Warehouse Appliances“ gesprochen. Gemeinsam verfolgen diese Konzepte folgende Strategien:
Die Newcomer am Markt, wie beispielsweise Netezza (Netezza Performance Server) und Kognitio (Kognitio WX2) haben als Zielkunden bislang vor allem Oracle Anwender im Visier. Experten argumentieren, dass das Angebot von Oracle in den oben genannten Bereichen Schwächen aufweist, die vornehmlich bei Data Warehouses >10TB zum tragen kommen. Insofern kann das Erscheinen von Exadata als Antwort auf diese Kritik verstanden werden. Das lässt aber gleichzeitig die Frage aufkommen, inwiefern Exadata, mit oder ohne Database Machine, sich eignet, um alle vorhandenen Schwachpunkte zu adressieren. Dabei interessieren folgende Detailfragen ganz besonders:
Im Rahmen des Oracle Exadata Betatests wurde es ausgewählten Kunden möglich gemacht, in speziellen Testzentren die neue Infrastruktur zu prüfen. Im hier betrachteten Fall wurde der
Test im Oracle ETC in Reading (UK) durchgeführt. Es wurden Original-Daten aus der produktiven DWH-Umgebung des Kunden verwendet. Die Test-Hardware bestand aus der Standard HP Oracle Database
Machine, allerdings mit 300GB-SAS-Platten. Die Systemkonfiguration wurde von Oracle ohne Beteiligung des Kunden durchgeführt. Mitarbeiter des Kunden reisten zur Testdurchführung in das
Testzentrum.
In dem Anwendungsfall handelt es sich um typische Abfragen aus dem analytischen CRM. Der Datenbestand weist Kaufverhalten von sehr vielen Kunden aus, und zwar über eine große zeitliche
Historie. Die Test-Abfragen und deren Filter operieren auf Detaildatenebene, und spiegeln vor allem die Anforderungen komplexer Analytik im Sinne von Scoring wider.

Abbildung 1: Ausgewählte Ergebnisse Exadata Betatest im Oracle ETC (Quelle: Quelle GmbH, Frank Stoll)
Die Tabelle zeigt je Testfall Messergebnisse sowohl mit als auch ohne eingeschaltete SmartScan Software (SmartScan „on“ bzw. „off“). Hier ist zu sehen, dass SmartScan nicht
bei jeder Abfrage einen deutlichen, zeitlich messbaren Nutzen liefert.In den Fällen, wo Vergleichswerte aus der Originalumgebung vorhanden sind, ist die Verbesserung der Abfragezeit dazu
deutlich erkennbar. Zu berücksichtigen ist dabei, dass die aktuelle Produktivumgebung des Kunden auf zwischenzeitlich leicht überholter Hardware basiert.
Im Testfall Scoring mit und ohne Statistik handelt es sich um die Erzeugung einer Ergebnistabelle mit den Scoring Ergebnissen, die Basis einer Folgeabfrage ist. Im Falle der Statistik Erstellung wurden Indizes für diese Zwischentabelle angelegt. Der Testfall ohne Indexerstellung weist ein besseres Messergebnis aus. Dies kann als Indiz dafür gelten, dass mit Exadata potenziell weniger Indizes benötigt werden.
In einem weiteren Fall hat Winter Corporation in Kooperation mit Oracle ein Benchmark durchgeführt und die Ergebnisse im Rahmen eines White Papers verfügbar gemacht (http://www.wintercorp.com/WhitePapers/whitepapers.asp). Dem Test lag ebenfalls eine Standard HP Oracle Database Machine Hardware zugrunde. Die Testdaten und Testabfragen stammten von WinterCorp, die größte Tabelle umfasste über 172 Mrd. Zeilen (Kreditkartentransaktionen). Kern des Tests war es vor allem, den erreichbaren I/O-Durchsatz zu messen.
Im Testfall wird kein Vergleich zwischen Exadata und einer klassischen Oracle Implementierung gezogen. Vielmehr werden vier analytische CRM Abfragen zunächst sequentiell, im zweiten Schritt parallel gegen den Datenbank-Server abgesetzt. Die vier Abfragen enthielten Filterbedingungen sowohl auf Detaildatensätze als auch auf gruppierte Ergebnismengen.
Exadata zeigte hierbei unter paralleler Last einen recht kontinuierlich hohen I/O-Durchsatz. Bei der sequentiellen Abwicklung betrug die Gesamtlaufzeit 126 Sekunden. In etwa 4% der Gesamtlaufzeit wurde der maximale I/O-Durchsatz eines Exadata Storage Servers von 14 GB/s erreicht, in etwa einem Drittel der Gesamtlaufzeit lag der I/O-Durchsatz zwischen 10 und 14 GB/s. Bei der parallelen Abwicklung betrug die Gesamtlaufzeit 99 Sekunden, eine Verbesserung von 21% gegenüber der sequentiellen Variante. Zu etwa zwei Drittel der Gesamtlaufzeit lag der I/O-Durchsatz zwischen 10 und 14 GB/s.
Es erscheint zwar theoretisch möglich, einen solchen Durchsatz auf Basis konventioneller Speicherlösungen zu erreichen. Der Umfang der dediziert einzusetzenden Hardware würde nach
Winter jedoch aufgrund des Bedarfs an Standplatz, Betriebs- und Kühlenergie vermutlich wesentlich höhere Kosten implizieren als die getestete HP Oracle Database Machine. Zudem bietet die
Infrastruktur bei Bedarf noch Erweiterungsoptionen.
Das White Paper geht nicht darauf ein, wie sich der erreichte I/O-Durchsatz auf die Leistungen des Datenbankserver auswirkt. Es werden keine Aussagen getroffen hinsichtlich Verwendung von Indizes
oder Aufwände zur Systemkonfiguration. Allerdings weist Winter darauf hin, dass einige der verwendeten Abfragen mit Hilfe des Oracle SQL Tuning Advisor optimiert wurden.
Die Testergebnisse lassen zusammen betrachtet folgende Arbeitsthesen zu:
Die offiziellen Listenpreise für Exadata und Database Machine können unter „http://www.oracle.com/corporate/pricing/exadata-pricelist.pdf“ eingesehen werden. Hier eine Zusammenfassung:

In diesen Angaben nicht enthalten sind die Kosten für die Software des Datenbank-Servers. Unterstellt man die Standard-HW-Konfiguration der HP Oracle Database Machine wie empfohlen, belaufen sich die Gesamtkosten auf $650.000 für Hardware und etwa $1.700.000 für die Exadata Software (inkl. Support etwa $2.000.000). Hinzu kommen die Datenbank-Software-Lizenzen für das RAC Cluster der Database Machine.
Schon allein auf Grund der recht hohen Investitionskosten wird Oracle Exadata (mit oder ohne HP Oracle Database Machine) vor allem von bestehenden Oracle Kunden erwogen werden, die in ihrem Data Warehouse hohe Skalierungsanforderungen auf Basis sehr großer Datenvolumen zu befriedigen haben. In manchen Fällen wird es erst mit Einsatz von Exadata überhaupt gelingen, umfangreiche und komplexe Abfragen erfolgreich durchzuführen.
Dies spiegelt jedoch nicht die Bedürfnisse durchschnittlicher Oracle-Data-Warehouse-Anwender wider. Selbst bei großen Datenmengen im historisierten Warehouse greifen nicht alle Abfragen auf alle Zeitscheiben zu, entsprechen nicht alle Abfragen der analytischen Komplexität von Scoring. Eine pauschale Antwort auf die Eignung von Exadata zur Lösung der analytischen Anforderungen des Unternehmens kann daher nicht geliefert werden. Es gilt, die unternehmensspezifische, analytische Arbeitslast zu ermitteln und im Rahmen eines Tests zu prüfen. Hier sollte unbedingt auch auf die im Unternehmen eingesetzten BI-Werkzeuge zurückgegriffen werden.
Sehr schwierig zu beziffern ist weiterhin, welche Kosteneinsparung sich durch den Einsatz von Exadata erzielen lässt, etwa durch Einsparung von Betriebskosten (Hardware, Standplatz, Strom) oder Ressourcen im Rahmen des Tunings. Zudem gibt es Hardware Alternativen zur Database Machine. Exadata lässt sich auch in anderen Infiniband-fähigen Hardwarekonfigurationen einsetzen. So ist es beispielsweise denkbar, zugunsten reduzierter DB-Lizenz-Kosten auf den Einsatz eines RAC-Datenbankclusters zu verzichten. Gleichzeitig bleibt in der Praxis abzuwarten, welche zusätzliche Komplexität der Einsatz von Exadata mit sich bringt.
So bleibt Oracle-Warehouse-Anwendern eine Fülle von Handlungsoptionen, die es individuell zu prüfen gilt. Für neue Data-Warehouse Anwender, die auf der Suche nach einer Einstiegslösung sind, erscheint die Oracle-Lösung jedoch nur als eine Lösung unter vielen. Mit der Gesamtkomplexität und die recht hohen Listenpreise steht die Lösung einem bunten Markt von möglichen Alternativangeboten gegenüber.Weitere Informationen
Die knapp 30-seitige Kurzevaluation von Oracle Exadata Storage Server und HP Oracle Database Machine wird in Kürze im Rahmen der BARC Software-Evaluation Data Warehousing und Datenintegration veröffentlicht (siehe http://dw.barc.de). Die Studie bietet auch Vergleiche mit anderen Lösungsangeboten.
Aktuelle Artikel von Jacqueline Bloemen
Kommentare
Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!
Posted 19 Oktober 2009 by Anonymous
Nun, sind mittlerweile 5 Monate vergangen und Oracle hat mit Sun die Exadata V2 mit Sun Technik herausgebracht. Diese liefert nun die ein mehrfaches der Leistung der Exadata mit HP-Technik. Insbesondere dank der intelligenten Speicherarchitektur mit FlashFire Technologie. 1.000.000 IOs pro Sekunde sind mit Eigenbauten nicht zu "toppen".
Nach meiner Rechnung reicht eine (bzw. zwei halbe aus Redundanzgründen) solche ExadataV2 aus, um bei den größten Oracle Kunden Deutschlands ALLE Datenbanken auf eine (bzw. 2 halbe) solche Racks zu legen. Dann dürfte sich bei den Hardwarekosten und bei den Lizenkosten sicher 50% sparen lassen. Also Fazit: hochinteressant für Konsolidierungsvorhaben. Ich persönlich würde eine ExadataV3 gerne sehen, mit AMD Prozessoren, es sollte damit eine Menge Energie einsparbar sein (ca. 45Watt/core statt 70Watt/core, also 36% Energieeinsparung !) und trotz der geringeren Taktrate, sollte die Gesamtleistung (insbesondere der RAM-Zugriff über den Cache hinweg) etwas besser sein, als mit Intel. Eine GreenVariante mit CMT Chips wäre auch sehr schön, (35Watt/core, als 50% Energieinsparung). Inklusive Klimatisierung rechnet sich das auf jeden Fall.
Is this comment inappropriate? Click here to flag this comment.
Posted 4 Juni 2009 by Anonymous
Für wen rechnet sich EXADATA ? Nun ja, hier die technisch begründeten Antworten:
1. haben wir ja alle Larry's Ankündigungen hinsichtlich neuer geplanter Appliances gelesen und wissen, dass uns da ohnehin zahlreiche Produkte ins Haus stehen. Das sind noch Ankündigungen, aber ernst zu nehmende. 2. ich werde mal inhouse ein Experiment machen, um zu sehen, wie wir schon heute auf der verpönten "normalen" Serverhardware mit einem einzigen Server der 20.000 Euro Klasse mit SATA Platten im Realbetrieb so um die 500MByte pro Sekunde mit Oracle auf Platte bringen können (und 1GByte/s im Streaming Betrieb, so wie bei Exadata im besten Falle im Streaming Mode erreichbar, mit den teuren SAS Platten). 3. Wohlgemerkt: nix gegen EXADATA, immerhin endlich mal eine Infiniband-Lösung, nur der Preis von 650.000 Euro ist ja auch EXAorbitant. Und Infiniband für einen Server/Storage-Block, nun ja, Perlen vor die Säue. PCIe kann dann auch durchgehend verwendet werden. Mehr als 12TByte braucht man selten an einem Oracle Server, oder, also reicht eine Box. 4. Wir dürfen ferner nicht vergessen, dass die HCAs ja auch in einem normalen PCIe Bus stecken. Das Umsetzen kostet Zeit. Also ist eine reine PCIe Lösung immer schneller und vorallem viel billiger. 5. Wenn ich mal die 650.000 Euro für eine vollausgebaute Exadata durch 20.000 dividiere sind wir 32,5 solchen kleinen Servern also 32,5GByte/s Datendurchsatz brutto. Dagegen 750MByte/s im Streaming Modus der Exadata Variante mit SATA. Zwar erreichen alle Storage Extensons jeweils dann 750MByte/s aber was nützt es, wenn nur eine Database Machine daran hängt die streamt ? Dann doch lieber die 32,5 Server fürs gleiche Geld streamen lassen. Außerdem habe ich dann auch 32,5 mal 32Gb Ram und 32,5 mal 8 CPU Cores. Zusammenfassend: Exadata ist auch nur PC-Technik, und da gibt es besseres für weniger Geld.
Is this comment inappropriate? Click here to flag this comment.