Strukturierte Daten auslagern – weshalb und wohin mit den Daten?

21 Oktober 2009

Es ist noch nicht allzu lange her, dass ein Data Warehouse (DWH) als so etwas wie ein allgemeiner Datenspeicher angesehen wurde. Es wurde dabei kein Unterschied gemacht, ob es sich um operative oder dispositive Daten handelte. Nachdem sich eine weitgehend allgemein gültige Sicht auf die Struktur und den Zweck eines DWH herausgebildet hat, nämlich im DWH Daten zur Unternehmenssteuerung abzulegen, macht sich in der Praxis die Frage bemerkbar, wie man den Lebenszyklus der im DWH aufbewahrten Daten und deren Zusammenhang mit den operativen Daten zu sehen hat. Und zum Lebenszyklus von Daten gehört auch die Auslagerung aus den Ursprungssystemen, was man auch mit „Archivierung“ bezeichnen kann. Wir bevorzugen hier jedoch eher die Begriffe „inaktiv“ bzw. „historisch“, da Archivierung eher die Sicht „ungenutzt“ assoziiert, was bei einem DWH falsch ist.

Wir von BARC treffen in diesem Zusammenhang immer mehr auf folgende Fragestellungen:

  • Wie geht man mit dem Thema „Auslagerung von strukturierten Daten“ im Umfeld „Business Intelligence“ um?
  • Was unterscheidet Daten, die aktiv, inaktiv oder historisch sind, voneinander?
  • Welche Schlüsselfragen hat man sich zu stellen, wenn man die Auslagerung strukturierter Daten ins Auge fasst?
  • Wie gehe ich dabei mit dem Thema um, das man etwa unter dem Begriff „Domänen von Geschäftsobjekten“ zusammenfasst?

Lassen Sie uns zunächst einige Begriffe klären:

  • Aktiv sind Daten in den operativen Systemen, wenn sie einem Änderungsprozess unterliegen. Inaktiv dann, wenn sie keinen Änderungen mehr unterliegen. Historisch, wenn sie für das operative Geschäft kaum mehr genutzt werden.
  • Im DWH sind die Begriffe „inaktiv“ und „historisch“ kaum zu unterscheiden. Die Zeitachse, damit die Historie ist ja gerade eine wichtige Sicht auf die Daten.

Daraus ergibt sich die Frage: kann man eigentlich DWH-Daten auslagern?

Allgemeiner: kann man strukturierte Daten so auslagern, dass deren Struktur im Zugriff erhalten bleibt?

Ja, dies ist möglich. Die Systeme, die man dazu benutzt, unterscheiden sich von Archivierungssystemen für Dateien (= unstrukturierte Daten) in dem Punkt, dass mit den Daten aus der Datenbank auch die Metadaten (=die Struktur der Modelle) mit ausgelagert werden. Für den Zugriff wird dann dieselbe Abfragesprache als Schnittstelle (Beispiel: SQL,…) zur Verfügung gestellt, wie wenn die Daten in den ursprünglichen Datenbanken abgespeichert wären. Was sich gegenüber den Originaldatenbanken ändert, sind u.a. folgende Parameter:

  • Kosten
  • Zugriffsgeschwindigkeit
Verwendet wird diese Auslagerungsmethode derzeit vor allem bei der Auflösung von  „Altapplikationen“, deren Datenbestand inaktiv, aber strukturell unverändert weiter zur Verfügung stehen soll.

Wenn Sie dem Thema „Auslagerung strukturierter Daten“ näher treten, sollten Sie sich folgende Fragen stellen:

  • Sind in Ihrem Unternehmen auch 80% der strukturierten Daten inaktiv ?
  • Gehört Ihr Datenzentrum zu den 50%, die auch auf Grund von unkontrollierbarem Datenwachstum bei den Kosten explodieren?
  • Gehören Sie zu den 70% Unternehmen, wo diese wachsenden Kosten die zweitwichtigste Position im  IT Budget darstellen?
  • Müssen Sie auch “mehr mit weniger tun”? Auslagerung von strukturierten Daten ist  kein Ideal mehr, sondern ein unmittelbares “Muss”.
  • Wie beeinflusst der Zwang, strukturierte Daten aufzubewahren und das damit verbundene Applikations- und Datenwachstum die Performanz der Applikationen und die Speicherkosten?
  • Worin unterscheidet sich die Auslagerung von strukturierten Daten von der Auslagerung  von unstrukturierten  und semistrukturierten Daten?
Die wichtigste Frage dabei  ist: Was wären Ihre Gründe dafür, strukturierte Daten  auszulagern?

Ein Beispiel dazu, das aus dem DWH-Umfeld stammt:

  • Ein DWH weist üblicherweise eine „geschichtete“ Granularität auf. Das bedeutet, dass verschiedene Verdichtungsstufen in einem DWH abgespeichert werden, die in sogenannten Drill-Down-Verfahren  bis zu den detaillierten operativen Daten zugänglich gemacht werden.
  • Eine Möglichkeit, selektiv die Auslagerung von strukturierten Daten zu betreiben, wäre somit, die feingranularen Daten, die eher seltener gebraucht werden, auszulagern.

Die zweitwichtigste Frage ist: welche Daten lagere ich aus?

Da es sich um strukturierte Daten handelt, sind die Daten in Geschäftsobjekte und deren Beziehungen zusammengefasst. Ausgelagert werden können daher nur logisch zusammengehörige Bereiche (= Domänen) von Geschäftsobjekten. Sie haben hier eine ähnliche Frage zu lösen, wie wenn Sie sich entscheiden, was in ihr ERP-System und was in ihr CRM-System kommt. Im DWH-Umfeld ist es jedoch einfacher: die Daten sind eingefroren, es sollte damit kein Abgleich zwischen den Daten im DWH-Originalspeicher und im Auslagerungsspeicher notwendig sein.

Was bleibt, ist die Frage der Kosten. Dazu werden von den Anbietern im Vorfeld Berechnungsmodelle zur Verfügung gestellt.

Ich denke, Sie sollten sich dem Thema „Auslagerung von Daten“ frühzeitig zuwenden. Auch DWH’s wachsen, und das ziemlich rasch.


SOURCE: Strukturierte Daten auslagern – weshalb und wohin mit den Daten?

  • Siegmund PriglingerSiegmund Priglinger
    Ist Analyst und Berater bei BARC und Repräsentant von BARC in Österreich. Sein fachlicher Schwerpunkt ist Data Governance und Master Data Management als Teil von IT Governance. Dr. Priglinger hat mehr als 25 Jahre Erfahrung als Produkt- und Lösungsanbieter, IT-Manager und Unternehmensberater für ICT. Er unterstützt sowohl Softwarehersteller bei deren „Business Development“ als auch Softwarenutzer im Einsatz und der Evaluierung von Software aus Sicht „Software enables the Business“.

Aktuelle Artikel von Siegmund Priglinger


Themenverwandte Beiträge


 

Kommentare

Möchten Sie den Beitrag kommentieren? Login oder Registrieren Sie sich heute!