Für wen rechnet sich der Oracle Exadata Storage Server?

21 April 2009

Es ist ein halbes Jahr her, dass Larry Ellison auf der Open World 2008 Oracle Exadata Storage Server und HP Oracle Database Machine vorgestellt hat. Zahlreiche Publikationen haben sich der Lösungsarchitektur gewidmet, die sich aufgrund ihrer Andersartigkeit im Vergleich zu bislang verfügbaren Data Warehouse Appliances nicht für jeden sofort erfassen lässt. Für Entscheider ist indes die Architektur nicht per se kaufrelevant. Vielmehr spielt die Leistungskraft in Relation zu den Gesamtkosten die zentrale Rolle, und das natürlich projiziert auf die Anforderungen des Unternehmens.

Weshalb Exadata?

Oracle hat mit der Auslieferung von Exadata auf einen Markt reagiert, der bereits seit einigen Jahren in Bewegung geraten ist. Wachsende Datenmengen und erweiterte funktionale Anforderungen bei Data Warehouse Anwendungen setzen DBMS Anbieter nämlich zunehmend unter Druck. Neue Datenbankangebote für analytische Applikationen reichen von vorkonfigurierte, für den Einsatzzweck optimierte Hardware-/Software-Kombinationen auf Basis etablierter Technologien bis hin zu gänzlich neuen Lösungsansätzen von bislang unbekannten Anbietern. Hier wird häufig von „Data Warehouse Appliances“ gesprochen. Gemeinsam verfolgen diese Konzepte folgende Strategien:

  • Steigerung der Hardware-Leistung mittels hochgradiger Parallelität auf Basis von scale-up und scale-out Architekturen sowie optimal aufeinander abgestimmte Systemkomponenten
  • Reduktion der zu bewegenden Datenmengen, um die notwendigen I/O-Operationen zu reduzieren – diese gelten nämlich als Flaschenhals der Datenbank-Operationen
  • Vereinfachung der Systemverwaltung durch Reduktion der notwendigen Konfigurationsmaßnahmen zwecks Einsparung von Zeit und Personalressourcen

Die Newcomer am Markt, wie beispielsweise Netezza (Netezza Performance Server) und Kognitio (Kognitio WX2) haben als Zielkunden bislang vor allem Oracle Anwender im Visier. Experten argumentieren, dass das Angebot von Oracle in den oben genannten Bereichen Schwächen aufweist, die vornehmlich bei Data Warehouses >10TB zum tragen kommen. Insofern kann das Erscheinen von Exadata als Antwort auf diese Kritik verstanden werden. Das lässt aber gleichzeitig die Frage aufkommen, inwiefern Exadata, mit oder ohne Database Machine, sich eignet, um alle vorhandenen Schwachpunkte zu adressieren. Dabei interessieren folgende Detailfragen ganz besonders:

  • Ist das Exadata-Konzept zur Lösung aller analytischen Anforderungen geeignet?
  • Exadata gilt als Kostenintensiv. Lassen sich durch den Einsatz von Exadata auch Kosten einsparen, die diese Investitionen rechtfertigen?

Beispielhafte Messergebnisse

Im Rahmen des Oracle Exadata Betatests wurde es ausgewählten Kunden möglich gemacht, in speziellen Testzentren die neue Infrastruktur zu prüfen. Im hier betrachteten Fall wurde der Test im Oracle ETC in Reading (UK) durchgeführt. Es wurden Original-Daten aus der produktiven DWH-Umgebung des Kunden verwendet. Die Test-Hardware bestand aus der Standard HP Oracle Database Machine, allerdings mit 300GB-SAS-Platten. Die Systemkonfiguration wurde von Oracle ohne Beteiligung des Kunden durchgeführt. Mitarbeiter des Kunden reisten zur Testdurchführung in das Testzentrum.

In dem Anwendungsfall handelt es sich um typische Abfragen aus dem analytischen CRM. Der Datenbestand weist Kaufverhalten von sehr vielen Kunden aus, und zwar über eine große zeitliche Historie. Die Test-Abfragen und deren Filter operieren auf Detaildatenebene, und spiegeln vor allem die Anforderungen komplexer Analytik im Sinne von Scoring wider.

alt

Abbildung 1: Ausgewählte Ergebnisse Exadata Betatest im Oracle ETC (Quelle: Quelle GmbH, Frank Stoll)


Die Tabelle zeigt je Testfall Messergebnisse sowohl mit als auch ohne eingeschaltete SmartScan Software (SmartScan „on“ bzw. „off“). Hier ist zu sehen, dass SmartScan nicht bei jeder Abfrage einen deutlichen, zeitlich messbaren Nutzen liefert.In den Fällen, wo Vergleichswerte aus der Originalumgebung vorhanden sind, ist die Verbesserung der Abfragezeit dazu deutlich erkennbar. Zu berücksichtigen ist dabei, dass die aktuelle Produktivumgebung des Kunden auf zwischenzeitlich leicht überholter Hardware basiert.

Im Testfall Scoring mit und ohne Statistik handelt es sich um die Erzeugung einer Ergebnistabelle mit den Scoring Ergebnissen, die Basis einer Folgeabfrage ist. Im Falle der Statistik Erstellung wurden Indizes für diese Zwischentabelle angelegt. Der Testfall ohne Indexerstellung weist ein besseres Messergebnis aus. Dies kann als Indiz dafür gelten, dass mit Exadata potenziell weniger Indizes benötigt werden.

In einem weiteren Fall hat Winter Corporation in Kooperation mit Oracle ein Benchmark durchgeführt und die Ergebnisse im Rahmen eines White Papers verfügbar gemacht   (http://www.wintercorp.com/WhitePapers/whitepapers.asp). Dem Test lag ebenfalls eine Standard HP Oracle Database Machine Hardware zugrunde. Die Testdaten und Testabfragen stammten von WinterCorp, die größte Tabelle umfasste über 172 Mrd. Zeilen (Kreditkartentransaktionen). Kern des Tests war es vor allem, den erreichbaren I/O-Durchsatz zu messen.

Im Testfall wird kein Vergleich zwischen Exadata und einer klassischen Oracle Implementierung gezogen. Vielmehr werden vier analytische CRM Abfragen zunächst sequentiell, im zweiten Schritt parallel gegen den Datenbank-Server abgesetzt. Die vier Abfragen enthielten Filterbedingungen sowohl auf Detaildatensätze als auch auf gruppierte Ergebnismengen.

Exadata zeigte hierbei unter paralleler Last einen recht kontinuierlich hohen I/O-Durchsatz. Bei der sequentiellen Abwicklung betrug die Gesamtlaufzeit 126 Sekunden. In etwa 4% der Gesamtlaufzeit wurde der maximale I/O-Durchsatz eines Exadata Storage Servers von 14 GB/s erreicht, in etwa einem Drittel der Gesamtlaufzeit lag der I/O-Durchsatz zwischen 10 und 14 GB/s. Bei der parallelen Abwicklung betrug die Gesamtlaufzeit 99 Sekunden, eine Verbesserung von 21% gegenüber der sequentiellen Variante. Zu etwa zwei Drittel der Gesamtlaufzeit lag der I/O-Durchsatz zwischen 10 und 14 GB/s.

Es erscheint zwar theoretisch möglich, einen solchen Durchsatz auf Basis konventioneller Speicherlösungen zu erreichen. Der Umfang der dediziert einzusetzenden Hardware würde nach Winter jedoch aufgrund des Bedarfs an Standplatz, Betriebs- und Kühlenergie vermutlich wesentlich höhere Kosten implizieren als die getestete HP Oracle Database Machine. Zudem bietet die Infrastruktur bei Bedarf noch Erweiterungsoptionen.

Das White Paper geht nicht darauf ein, wie sich der erreichte I/O-Durchsatz auf die Leistungen des Datenbankserver auswirkt. Es werden keine Aussagen getroffen hinsichtlich Verwendung von Indizes oder Aufwände zur Systemkonfiguration. Allerdings weist Winter darauf hin, dass einige der verwendeten Abfragen mit Hilfe des Oracle SQL Tuning Advisor optimiert wurden.

Die Testergebnisse lassen zusammen betrachtet folgende Arbeitsthesen zu:

  • Exadata mit dem SmartScan macht bislang nicht durchführbare Abfragen möglich, liefert aber nicht für jede Abfrage einen signifikanten Mehrwert
  • Der SQL Tuning Bedarf stellt die Einsatzfähigkeit von Exadata im Rahmen von BI-Werkzeugen einer Bewährungsprobe aus, schließlich ist das von diesen Werkzeugen generierte SQL nur teilweise konfigurierbar
  • Leistungs- und Skalierfähigkeit von Exadata und Database Machine lassen im Vergleich zu konventionellen HW-Konfigurationen mögliche Vorteile hinsichtlich Betriebskosten und Flexibilität erkennen
  • Modernste, optimal konfigurierte HW kann eine günstigere Alternative zu Exadata und/oder der Database Machine sein

Mögliche Kostenrechnung

Die offiziellen Listenpreise für Exadata und Database Machine können unter „http://www.oracle.com/corporate/pricing/exadata-pricelist.pdf“ eingesehen werden. Hier eine Zusammenfassung:

alt

Abbildung 2: Listenpreise für Exadata und Database Machine (Quelle: Oracle)

In diesen Angaben nicht enthalten sind die Kosten für die Software des Datenbank-Servers. Unterstellt man die Standard-HW-Konfiguration der HP Oracle Database Machine wie empfohlen, belaufen sich die Gesamtkosten auf $650.000 für Hardware und etwa $1.700.000 für die Exadata Software (inkl. Support etwa $2.000.000). Hinzu kommen die Datenbank-Software-Lizenzen für das RAC Cluster der Database Machine.

Mögliche Zielszenarien

Schon allein auf Grund der recht hohen Investitionskosten wird Oracle Exadata (mit oder ohne HP Oracle Database Machine) vor allem von bestehenden Oracle Kunden erwogen werden, die in ihrem Data Warehouse hohe Skalierungsanforderungen auf Basis sehr großer Datenvolumen zu befriedigen haben. In manchen Fällen wird es erst mit Einsatz von Exadata überhaupt gelingen, umfangreiche und komplexe Abfragen erfolgreich durchzuführen.

Dies spiegelt jedoch nicht die Bedürfnisse durchschnittlicher Oracle-Data-Warehouse-Anwender wider. Selbst bei großen Datenmengen im historisierten Warehouse greifen nicht alle Abfragen auf alle Zeitscheiben zu, entsprechen nicht alle Abfragen der analytischen Komplexität von Scoring. Eine pauschale Antwort auf die Eignung von Exadata zur Lösung der analytischen Anforderungen des Unternehmens kann daher nicht geliefert werden. Es gilt, die unternehmensspezifische, analytische Arbeitslast zu ermitteln und im Rahmen eines Tests zu prüfen. Hier sollte unbedingt auch auf die im Unternehmen eingesetzten BI-Werkzeuge zurückgegriffen werden.

Sehr schwierig zu beziffern ist weiterhin, welche Kosteneinsparung sich durch den Einsatz von Exadata erzielen lässt, etwa durch Einsparung von Betriebskosten (Hardware, Standplatz, Strom) oder Ressourcen im Rahmen des Tunings. Zudem gibt es Hardware Alternativen zur Database Machine. Exadata lässt sich auch in anderen Infiniband-fähigen Hardwarekonfigurationen einsetzen. So ist es beispielsweise denkbar, zugunsten reduzierter DB-Lizenz-Kosten auf den Einsatz eines RAC-Datenbankclusters zu verzichten. Gleichzeitig bleibt in der Praxis abzuwarten, welche zusätzliche Komplexität der Einsatz von Exadata mit sich bringt.

So bleibt Oracle-Warehouse-Anwendern eine Fülle von Handlungsoptionen, die es individuell zu prüfen gilt. Für neue Data-Warehouse Anwender, die auf der Suche nach einer Einstiegslösung sind, erscheint die Oracle-Lösung jedoch nur als eine Lösung unter vielen. Mit der Gesamtkomplexität und die recht hohen Listenpreise steht die Lösung einem bunten Markt von möglichen Alternativangeboten gegenüber.Weitere Informationen

Die knapp 30-seitige Kurzevaluation von Oracle Exadata Storage Server und HP Oracle Database Machine wird in Kürze im Rahmen der BARC Software-Evaluation Data Warehousing und Datenintegration veröffentlicht (siehe http://dw.barc.de). Die Studie bietet auch Vergleiche mit anderen Lösungsangeboten.

  • Jacqueline BloemenJacqueline Bloemen

    Jacqueline Bloemen ist Geschäftsführerin der BeKS (Business eKnowledge Solutions) sowie Senior Analystin Data Warehousing und Business Intelligence für BARC (Business Application Research Center).

    Als Beraterin und Coach unterstützt sie seit rund 20 Jahren Unternehmen verschiedener Branchen und Größen bei der IT Strategie- und Architekturentwicklung für Business Intelligence, Data Warehousing und Datenintegration. Hierzu zählen auch Technologie- und Architekturauswahl, Projektplanung und Durchführung basierend auf Best Practices, sowie Performance Optimierung für komplexe und umfangreiche Datenmanagementlösungen. Neben den umfangreichen Erfahrungen mit BI-Systemen und deren Implementierung unterstützt sie als langjährige Beobachterin und Beraterin des BI-Softwaremarktes internationale Anwendergemeinden mit Vorträgen, Erfahrungsberichten und Studien.

Aktuelle Artikel von Jacqueline Bloemen


Themenverwandte Beiträge


 

Kommentare

Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!

Posted 19 Oktober 2009 by Anonymous

Nun, sind mittlerweile 5 Monate vergangen und Oracle hat mit Sun die Exadata V2 mit Sun Technik herausgebracht. Diese liefert nun die ein mehrfaches der Leistung der Exadata mit HP-Technik. Insbesondere dank der intelligenten Speicherarchitektur mit FlashFire Technologie. 1.000.000 IOs pro Sekunde sind mit Eigenbauten nicht zu "toppen".

Nach meiner Rechnung reicht eine (bzw. zwei halbe aus Redundanzgründen) solche ExadataV2 aus, um bei den größten Oracle Kunden Deutschlands ALLE Datenbanken auf eine (bzw. 2 halbe) solche Racks zu legen. Dann dürfte sich bei den Hardwarekosten und bei den Lizenkosten sicher 50% sparen lassen. Also Fazit: hochinteressant für Konsolidierungsvorhaben. Ich persönlich würde eine ExadataV3 gerne sehen, mit AMD Prozessoren, es sollte damit eine Menge Energie einsparbar sein (ca. 45Watt/core statt 70Watt/core, also 36% Energieeinsparung !) und trotz der geringeren Taktrate, sollte die Gesamtleistung (insbesondere der RAM-Zugriff über den Cache hinweg) etwas besser sein, als mit Intel. Eine GreenVariante mit CMT Chips wäre auch sehr schön, (35Watt/core, als 50% Energieinsparung). Inklusive Klimatisierung rechnet sich das auf jeden Fall.

Is this comment inappropriate? Click here to flag this comment.

Posted 4 Juni 2009 by Anonymous

Für wen rechnet sich EXADATA ? Nun ja, hier die technisch begründeten Antworten:

1. haben wir ja alle Larry's Ankündigungen hinsichtlich neuer geplanter Appliances gelesen und wissen, dass uns da ohnehin zahlreiche Produkte ins Haus stehen. Das sind noch Ankündigungen, aber ernst zu nehmende. 2. ich werde mal inhouse ein Experiment machen, um zu sehen, wie wir schon heute auf der verpönten "normalen" Serverhardware mit einem einzigen Server der 20.000 Euro Klasse mit SATA Platten im Realbetrieb so um die 500MByte pro Sekunde mit Oracle auf Platte bringen können (und 1GByte/s im Streaming Betrieb, so wie bei Exadata im besten Falle im Streaming Mode erreichbar, mit den teuren SAS Platten). 3. Wohlgemerkt: nix gegen EXADATA, immerhin endlich mal eine Infiniband-Lösung, nur der Preis von 650.000 Euro ist ja auch EXAorbitant. Und Infiniband für einen Server/Storage-Block, nun ja, Perlen vor die Säue. PCIe kann dann auch durchgehend verwendet werden. Mehr als 12TByte braucht man selten an einem Oracle Server, oder, also reicht eine Box. 4. Wir dürfen ferner nicht vergessen, dass die HCAs ja auch in einem normalen PCIe Bus stecken. Das Umsetzen kostet Zeit. Also ist eine reine PCIe Lösung immer schneller und vorallem viel billiger. 5. Wenn ich mal die 650.000 Euro für eine vollausgebaute Exadata durch 20.000 dividiere sind wir 32,5 solchen kleinen Servern also 32,5GByte/s Datendurchsatz brutto. Dagegen 750MByte/s im Streaming Modus der Exadata Variante mit SATA. Zwar erreichen alle Storage Extensons jeweils dann 750MByte/s aber was nützt es, wenn nur eine Database Machine daran hängt die streamt ? Dann doch lieber die 32,5 Server fürs gleiche Geld streamen lassen. Außerdem habe ich dann auch 32,5 mal 32Gb Ram und 32,5 mal 8 CPU Cores. Zusammenfassend: Exadata ist auch nur PC-Technik, und da gibt es besseres für weniger Geld.

 

Is this comment inappropriate? Click here to flag this comment.