Oracle kündigt heute eine NoSQL Database an, die insbesondere zur Verarbeitung großer Mengen unstrukturierter Daten dient. In der „Big Data Appliance“ wird die NoSQL Datenbank um Hadoop und Werkzeuge für Hadoop ergänzt.
Damit springt Oracle auch auf den immer mehr Fahrt aufnehmenden NoSQL/Hadoop Zug auf. Big Data bedeutet insbesondere die Verarbeitung großer Mengen unterschiedlich strukturierter Daten, häufig mit dem Ziel strukturierte Information daraus zu erzeugen und letztlich in relationalen/analytischen Datenbanken zu speichern.
NoSQL hat sich als Überbegriff für verschiedenste Arten an Datenbanken etabliert, die nicht dem relationalen Modell folgen und damit vor allem auf die Ablage von Bild-, Text-, Netzwerk- und anderen schwach- oder unstrukturierten Daten dienen. Welche Vorgehensweisen genau in der Oracle NoSQL Datenbank umgesetzt werden, bleibt zu sehen wenn sich weitere Details klären.
Hadoop bietet insbesondere ein hochskalierbares File System zur Speicherung unstrukturierter Daten sowie eine Entwicklungsmöglichkeit für Programme zur parallelisierten Verarbeitung der Daten in Map/Reduce Form. Hadoop wird als first level Projekt auf der Apache Plattform schon länger von IBM stark unterstützt, aber auch viele andere Anbieter haben Hadoop inzwischen in ihre Palette aufgenommen. EMC Greenplum hat erst kürzlich seine Big Data Appliance mit einer Kombination aus seiner Greenplum analytischen Datenbank und seiner eigenen Hadoop Distribution angekündigt, Pervasive kann nicht nur Daten in Hadoop lesen und schreiben sondern kann auch innerhalb von Hadoop Nodes ablaufen, etc. etc.
Posted 3.10.11 17:46
Permalink | keine Kommentare |




Kommentieren