Direkt zum Inhalt

Data Warehouse

GEPRÜFTES WISSEN
Über 100 Experten aus Wissenschaft und Praxis.
Mehr als 8.000 Stichwörter kostenlos Online.
Das Original: Gabler Banklexikon

zuletzt besuchte Definitionen...

    Ausführliche Definition

    1. Begriff: Ein Data Warehouse (DWH) ist ein Datenhaltungssystem dispositiver Daten, das von den operativen Datenbeständen getrennt, themenorientiert aufbereitet und logisch zentralisiert ist. Ein DWH integriert unternehmensweit Datenbestände aus verschiedenen operativen internen Systemen (z.B. Kernbanksystemen und Enterprise-Ressource-Planning-Systemen) sowie externen Systemen (z.B. Börseninformationssystemen und Systeme für externe Ratings) und dient idealtypisch als unternehmensweite, einheitliche und konsistente Datenbasis für alle Arten von Systemen der Entscheidungsunterstützung. Das Data Warehouse ist i.d.R. eine Kernkomponente umfassender Business-Intelligence-Konzepte. Aufgrund von verschärften regulatorischen Anforderungen aus v.a. europäischen Aufsichtsbehörde (z.B. BCBS 239), setzen immer mehr Banken DWHs als zentrale Softwarekomponenten ein, um solche Anforderungen zu erfüllen.

    2. Merkmale:
    Die Definition des Data Warehouses wurde von W.H. Inmon stark geprägt. Er charakterisiert ein Data Warehouse mithilfe von vier Eigenschaften:
    a) Themenorientierung: Dispositive Daten des DWH sind explizit an den Interessenslagen der Entscheidungsträger ausgerichtet. So werden die operativen bzw. externen Daten in ihrer Ausrichtung für die Ablage im DWH aufbereitet und z.B. auf Kunden-, Produkt- oder Lieferantensicht transformiert.
    b) Integration: Daten aus den unterschiedlichen operativen und externen Quellen werden im DWH zu einer inhaltlich widerspruchfreien Datensammlung zusammengeführt.
    c) Zeitraumbezug: Während Daten in operativen Quellsystemen in der Regel transaktionsorientiert und somit zeitpunktbezogen abgelegt werden, repräsentieren Daten im DWH meist einen Zeitraum, z.B. einen Tag, eine Woche oder einen Monat.
    d) Nicht-Volatilität: Daten im DWH werden dauerhaft abgelegt und für die Analyse zur Verfügung gestellt. DWH-Daten werden somit in der Regel nicht mehr geändert, überschrieben oder entfernt.

    3. Teilkomponenten eines DWH-Konzepts: Üblicherweise besteht ein unternehmensspezifisches DWH-Konzept aus einem Konglomerat verschiedener dispositiver Datenhaltungssysteme, die sich primär durch ihre Verdichtungsgrade und ihre Applikationsorientierung unterscheiden.
    a) Rückgrat der meisten Ansätze ist hierbei ein sog. Core Data Warehouse (C-DWH). Seine Befüllung erfolgt meist über sog. ETL-Prozesse (Extraktion, Transformation, Laden) direkt aus den operativen internen und externen Quellsystemen bzw. aus vorgeschalteten, unten näher erläuterten Operational Data Stores (ODS). C-DWHs basieren meist auf relationalen Datenhaltungssystemen, sind weitestgehend applikationsneutral modelliert und können heute Datenvolumina bis in den Terabyte-Bereich aufweisen.
    b) Häufig werden C-DWHs nicht direkt für die Analysezwecke herangezogen, sondern dienen primär der Befüllung sog. Data Marts. Diese sind kleinere Datenpools, die üblicherweise für einen eingeschränkten Benutzerkreis aufgebaut und auf deren Applikationsfeld ausgerichtet werden.
    c) Ein Operational Data Store (ODS) beinhaltet als Vorstufe eines C-DWHs aktuelle, transaktionsorientierte Daten aus verschiedenen Quellsystemen und stellt sie für spezielle Anwendungs- und Auswertungszwecke bereit. Operational Data Stores verfügen meist über keine Mechanismen der Historienbildung, sodass ein ODS in Abgrenzung zum DWH primär eine zeitpunktbezogene, volatile Datenhaltung darstellt. Ein ODS kann somit eine Vorstufe eines DWHs bilden und gleichzeitig als konsistente Datenquelle für geschäftsprozessorientierte Anwendungssysteme fungieren, die historisch gewachsene, meist funktional ausgerichtete IT-Landschaften auf der Datenebene integriert.

    4. DWH-Implementierungsansätze: Die Nutzung eines DWHs im konkreten Applikationsumfeld (Analyseumfeld) wird als Data Warehousing bezeichnet. Hierbei können grundsätzlich vier Implementierungsvarianten unterschieden werden: das klassische, Real-time, Closed-loop und Active Data Warehousing.
    a) Klassisches Data Warehousing erlaubt im Rahmen der Analyse ausschließlich lesende Zugriffe auf das in periodischen Abständen zu aktualisierende Data Warehouse. Diese Art der Datenversorgung ist die ursprüngliche, nach W. H. Inmon definierte Form der Datenanbindung und findet primär bei standardisierten Planungs- und Kontrollsystemen mit kurz- bis mittelfristigem Entscheidungshorizont Einsatz.
    b) Closed-loop Data Warehousing
    ermöglicht Rückkopplungen von Analyseergebnissen in die operativen und sonstigen dispositiven Datenbestände. Hierbei werden die Datenbestände um Zusatzinformationen erweitert, welche für die Entscheidungsumsetzung oder weitere Analysen von Relevanz sein können. Ein typisches Anwendungsgebiet findet sich im Customer Relationship Management. Hier können beispielsweise die auf der Basis von Business-Intelligence-Analysen identifizierten relevanten Kundensegmente als Zusatz- bzw. Strukturinformationen in die operativen Daten integriert werden, um eine automatisierte Kampagnendurchführung mit diesen Zielgruppen zu ermöglichen.
    c) Real-time Data Warehousing
    bezeichnet die direkte, transaktionsnahe Datenversorgung des DWH, sodass die Analysesysteme auf harmonisierte Echtzeitdaten aufsetzen können. Typische Anwendungsgebiete liegen demnach im Bereich der zeitkritischen Analysen, wie sie z.B. bei Börsen und Banken im Kontext des Wertpapierhandels von Relevanz sind.
    d) Active Data Warehousing setzt auf dem Closed-loop Data Warehousing auf und erweitert die Analysen um operative Komponenten, indem automatisierte Aktionen aufgrund spezifischer Datenkonstellationen angestoßen werden. Auf diese Weise lassen sich strukturierte, wiederkehrende Entscheidungssituationen wirkungsvoll unterstützen, z.B. im Rahmen der Lösung von logistischen Optimierungsproblemen im Liefer- und Frachtbereich. Abschließend lässt sich konstatieren, dass die o.a. Implementierungsansätze der wirksamen Entscheidungsunterstützung unterschiedlicher betrieblicher Problemstellungen dienen. Die Ansätze (Closed-loop, Realtime und Active Data Warehousing) vervollständigen auf diese Weise die traditionellen Lösungen, machen diese aber keineswegs obsolet. Aus diesem Grund werden in leistungsfähigen DWH-Konzepten in aller Regel mehrere Data-Warehousing-Ansätze parallel realisiert, deren konkrete Ausgestaltung stets organisationsindividuell vor dem Hintergrund der realen Anforderungen der Unternehmung zu erfolgen hat.

     

    Mindmap Data Warehouse Quelle: https://www.gabler-banklexikon.de/definition/data-warehouse-56847 node56847 Data Warehouse node70779 Business Intelligence node56847->node70779 node70782 Data Mart node56847->node70782 node70703 IT-Strategie node70703->node70779 node60032 natürliche Person node59084 juristische Person node55824 Auslagerung node56849 Datenschutz node55824->node56849 node56849->node56847 node56849->node60032 node56849->node59084 node58987 Intranet node70728 ETL node70728->node56847 node70779->node58987 node70779->node70728 node70784 Informationsmanagement node70784->node56847 node70785 IT-Alignment node70784->node70785 node70657 Informationsverarbeitung (IV) node70784->node70657 node58827 Informationstechnologie (IT) node70784->node58827 node70682 Produktkatalog node70704 Rechenkern node70704->node56847 node70704->node70682 node70782->node70728
    Mindmap Data Warehouse Quelle: https://www.gabler-banklexikon.de/definition/data-warehouse-56847 node56847 Data Warehouse node70779 Business Intelligence node56847->node70779 node70728 ETL node56847->node70728 node70784 Informationsmanagement node70784->node56847 node70704 Rechenkern node70704->node56847 node56849 Datenschutz node56849->node56847

    News SpringerProfessional.de

    Literaturhinweise SpringerProfessional.de

    Bücher auf springer.com

    Sachgebiete