Aggregation
 | |
Aggregation bezeichnet das Verdichten von Daten zu einem einzelnen Datum. Die Aggregation als eine Operation des Online Analytical Processing findet anlang der Klassifikationspfade statt.
Beispiele:
-
Aus einer Menge feingranularer Daten werden mittels sogenannter Aggregationsfunktionen z.B. der Mittelwert, das Maximum oder die Summe gebildet.
|
|
Analyse
 | |
Die Analyse umfasst als Oberbegriff alle Operationen, die mit den daten des Data Warehouse durchgeführt werden können. Es ist der Prozess zur Untersuchung und Präsentation der Daten mit unterschiedlichen Methoden. Dies reicht von der Präsentation der Einzeldaten, über einfache arithmetische Operationen bis hin zu komplexen statistischen Untersuchungen mit einer grafischen Aufbereitung der Ergebnisse.
Oberbegriff:
Data Warehouse System
Unterbegriff:
Analysewerkzeuge
,
Analysesystem
,
Freie Analysen
,
Geführte Analysen
,
RFMR Analyse
,
SWOT Analyse
,
Dokumentenanalyse
,
Zeitreihenanalyse
|
|
Analysewerkzeuge
 | |
Analysewerkzeuge stellen als Schnittstelle zwischen dem Data Warehouse und dem Anwender Funktionalitäten für die Präsentation der gesammelten Daten mit interaktiven Navigations- und Analysemöglichkeiten zur Verfügung.
Synonyme:
BI Werkzeuge
Oberbegriff:
Analyse
|
|
Anreicherung
 | |
Als Anreicherung bezeichnet man den Vorgang des Hinzufügens von Daten oder berechneten Werten zu den aus den Datenquellen extrahierten Daten in der Basisdatenbank. Diese Daten können dann zusätzlich, in Verindung mit den extrahierten Daten,im für den Analyseprozess bereitgestellt werden.
|
|
Arbeitsbereich
 | |
Zentrale Datenhaltungskomponente des Datenbeschaffungsbereich (Integration von Daten). Daten werden auf dem Weg von der Datenquelle zur Basisdatenbank temporär zwischengespeichert. Datentransformationen werden direkt im Zwischenspeicher ausgeführt. Nach Abschluss aller Bearbeitungsschritte werden die Daten in die Basisdatenbank geladen und aus dem Arbeitsbereich entfernt.
Übersetzungen:
Staging Area
Oberbegriff:
Data Warehouse System
|
|
Basisdatenbank
 | |
Physische Datenbank, die eine integrierte Sicht auf beliebige Daten darstellt. Die Basisdatenbank dient zur generellen Speicherung der aufbereiteten und bereinigten Daten und unterliegt deshalb nicht einem spezifischen Modellierungsansatz. Die Basisdatenbank dient als Quelle für das Data Warehouse und ist die Stufe zwischen dem Arbeitsbereich und dem Data Warehouse. Die Basisdatenbank hat zudem eine zentrale Verteilungsfunktion (Mehrfachverwendung, Flexibilität in der Verwendung der Daten) und kann als Datenbasis für andere operative Anwendungen dienen.
Oberbegriff:
Data Warehouse System
|
|
Business Intelligence
(BI)
 | |
Business Intelligence steht für die Integration von Strategien, Prozessen und Technologien, um aus verteilten und heterogenen Unternehmens-, Markt- und Wettbewerbsdaten erfolgskritisches Wissen über Status, Potenziale und Perspektiven des Unternehmens zu erzeugen.
|
|
Data Mart
 | |
Ein Data Mart bietet eine externe Sicht auf das Data Warehouse, die in der Regel durch kopieren und somit durch das Einführen von Redundanzen erreicht wird. Insofern bietet ein Data Mart einen inhaltlich beschränkten Fokus auf ein Unternehmen oder eine Abteilung. Gründe für die Einführung von Data Marts sind unter anderem sein: Eigenständigkeit, Datenschutz, Organisatorische Aspekte, Verringerung des Datenvolumen. Performancegewinn durch Aggregation, Verteilung der Last oder Unabhängigkeit von Aktualisierungszyklen des Data Warehouse. Eine Abgrenzung zwischen einem Data Mart und einem Data Warehouse ist jedoch nur schwer möglich. Der Begriff Data Mart ist somit optional und kann unter dem Begriff Data Warehouse subsumiert werden.
Oberbegriff:
Data Warehouse System
|
|
Data Mining
 | | Data Minig bezeichnet ein spezielles Analyseverfahren, mit dem nach unbekannten Mustern oder Beziehungen zwischen den Daten gesucht wird.
|
|
Data Warehouse
 | |
Das Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf die Daten darstellt. Im Unterschied zur Basisdatenbank steht hier der Auswertungsaspekt im Mittelpunkt, d.h. die Daten liegen in einem analyseorientierten Schema vor, das häufig durch ein multidimensionales Schema widerspiegelt.Häufig, aber nicht notwendigerweise, findet eine Historisierung der Daten statt. In Verbindung mit dem Repository und der Basisdatenbank enthält das Data Warehouse alle notwendigen Daten für die Analysen des Anwenders. Aufgabe ist die dauerhafte Verwaltung und Bereitstellung der für die jeweiligen Analysen benötigten Daten. Anfallende Metadaten (z.B. Datenbankschema) werden über den Metadatenmanager mit dem Repository synchronisiert.
Oberbegriff:
Data Warehouse System
|
|
Data Warehouse Manager
 | |
Zentrale Komponente des Data Warehouse Systems, zur Initiierung, Steuerung, Überwachung der Prozesse von der Extraktion bis hin zur Analyse. Wichtigste Aufgabe des Data Warehouse Managers ist der Datenbeschaffungsprozess, der ausgelöst und koordiniert wird.
Oberbegriff:
Data Warehouse System
|
|
Data Warehouse Process
 | | Der Data Warehouse Prozess umfasst alle Schritte vom Datenbeschaffungsprozesses, über das Speichern der Daten im Data Warehouse bis hin zur Analyse der Daten Synonyme:
Data Warehousing
|
|
Data Warehouse System
 | |
Das Data Warehouse System bezeichnet die Gesamtheit der Komponenten, die am Data Warehouse Prozess beteiligt sind.
Synonyme:
Data Warehouse Architektur
Unterbegriff:
Analyse
,
Arbeitsbereich
,
Basisdatenbank
,
Monitor
,
Datenquellen
,
Data Warehouse Manager
,
Data Mart
,
Data Warehouse
,
Repository
|
|
Datenbankmanagementsystem
(DBMS)
 | |
Das Datenbankmanagementsystem ist neben der Datenbank ein Bestandteil eines Datenbanksystems. Die Aufgaben eines Datenbankmanagementsystem sind u.A.: Speichern der Daten, Verwaltung der Metadaten, Datensicherheit, Mehrbenutzerbetrieb durch Transaktionen, Sicherstellen der Datenintegrität.
|
|
Datenbanksysteme
(DBS)
 | | Ein Datenbanksystem ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern und benötigte Teilmengen in unterschiedlichen, bedarfsgerechten Darstellungsformen für Benutzer und Anwendungsprogramme bereitzustellen.
|
|
Datenbeschaffungsprozess
 | |
Als Datenbeschaffungsprozess wird der Vorgang bezeichnet, indem Daten aus den Datenquellen in die Basisdatenbank gebracht werden. Der Datenbeschaffungsprozess gliedert sich in die Teilschritte Extraktion, Transformation und Laden.
|
|
Datenquellen
 | |
Als Datenquellen bezeichnet man Daten- und Metadatenlieferanten im Data Warehouse System. Diese können sowohl organisationintern als auch extern sein. Datenquellen können aus mehreren zu integrierenden, meist heterogenen realen Datenquellen bestehen. Datenquellen stellen den Ausgangspunkt des Datenflusses dar, werden aber nicht zu den Komponenten eines Data Warehouse Systems gezählt.
Oberbegriff:
Data Warehouse System
|
|
Detaildaten
 | |
Als Detaildaten werden Daten bezeichnet, die in der jeweils feinsten verfügbaren Granularität vorliegen.
|
|
Dimension
 | |
Eine Dimension ist innerhalb des multidimensionalen Datenmodells eine ausgewählte Entität, mit der eine Analysesicht eines Anwendungsbereichs definiert wird. Dimensionen dienen der eindeutigen, orthogonalen Strukturierung des Datenraums
Synonyme:
Dimensionstabelle
Oberbegriff:
Sternschema
Unterbegriff:
Dimensionselemente
,
Dimensionalität des Würfels
Beispiele:
- Zeit
- Kunde
- Verkäufer
- Produkt
|
|
Dimensionalität des Würfels
 | |
Anzahl der Dimensionen die einen Würfel (Cube) aufspannen.
Oberbegriff:
Dimension
|
|
Dimensionselemente
 | |
Basisgranulare Klassifikationsknoten in der Klassifikationshierarchie.
Oberbegriff:
Dimension
|
|
Extract - Transform - Load
(ETL)
 | |
Der Prozess, der sich aus den Teilschritten Extract, Transform und Load zusammensetzt, wird auch als ETL Prozess definiert.
Unterbegriff:
Extraktion
,
Transformation
,
Laden
|
|
Extraktion
 | |
Mit der Extraktion wird ein Teil der Daten aus der Datenquelle extrahiert, um sie anschließend der nachfolgenden Transformation zur Verfügung zu stellen.
Oberbegriff:
Extract - Transform - Load
Unterbegriff:
Extraktionskomponente
|
|
Extraktionskomponente
 | |
Komponente zur Extraktion der Daten aus der Datenquelle. Verfahren ist abhängig von der jeweiligen Monitoring Variante. Vom Monitor identifizierten Daten werden in den Arbeitsbereich geladen.
Oberbegriff:
Extraktion
|
|
Fakten
 | |
Die zu verwaltenden Daten werden als Fakten bezeichnet; sie werden typischerweise fortlaufend in der Faktentabelle gespeichert. Faktentabellen können sehr groß werden, was ein Data-Warehouse zwingt, die Daten nach und nach zu verdichten (aggregieren) und schließlich nach einer Halteperiode zu löschen oder auszulagern (Archivierung).
Synonyme:
Metriken
,
Messwerte
Oberbegriff:
Sternschema
Beispiele:
- Verkäufe
- Lohnzahlungen
- Kundenbesuche
|
|
Ladekomponente
 | |
Nach der Transformation befinden sich im Arbeitsbereich bereinigte und aufbereitete Daten zur Speicherung und späteren Auswertung. Für die Weiterleitung sind 2 Ladekomponenten zuständig: Eine zur Übertragung der analyseunabhängigen Daten aus dem Arbeitsbereich in die Basisdatenbank und eine zur Übertragung der analysespezifischen Daten (z.B. Aggregate) aus der Basisdatenbank in das Data Warehouse. Falls keine Basisdatenbank vorhanden ist, existiert nur eine Ladekomponente! Die Ladekomponenten nehmen üblicherweise das Ladewerkzeug des jeweils zugrundeliegenden DBMS zu Hilfe.
Oberbegriff:
Laden
|
|
Laden
 | |
Laden bezeichnet den letzten Schritt im Datenbeschaffungsprozess, bei dem die Daten aus dem Beschaffungsbereich in die Basisdatenbank oder von der Basisdatenbank in das Data Warehouse physisch eingebracht werden. Häufig wird der Ladeprozess mit einer Aggregierung der Daten verbunden.
Oberbegriff:
Extract - Transform - Load
Unterbegriff:
Ladekomponente
|
|
Metadaten
 | |
|
|
Metadatenmanager
 | |
Der Metadatenmanager steuert die Metadatenverwaltung des Data Warehouse System. Er wird als eine Anwendung definiert, die folgendes anbietet: Versions- und Konfigurationsmanagement, Integrations-, Zugriffs-, Anfrage- und Navigationsmöglichkeiten, Schnittstelle für Lese- und Schreibzugriffe auf das Repository. Der Metadatenmanager ermöglicht den Metadatenaustausch zwischen den verschiedenen Komponenten sowie den Kontrollfluss zwischen Metadatenmanager und Data Warehouse Manager der sich bei bei metadatengesteuerten Prozessen ergibt. Häufig verwenden Data Warehouse Systeme keine metadatengetriebenen Werkzeuge. In diesem Fall dient des Metadatenverwaltungssystem lediglich als Informationslieferant für die Anwender.
|
|
Monitor
 | |
Die Monitor Komponente im Data Warehouse System ist zuständig für die Entdeckung von relevanten Datenmanipulationen in einer Datenquelle. Es existiert im allgemeinen ein Monitor pro Datenquelle. Die Funktionsweise hängt unmittelbar von der angeschlossenen Datenquelle sowie den Anforderungen der Analysekomponente ab.
Oberbegriff:
Data Warehouse System
Unterbegriff:
Monitoring Variante
|
|
Monitoring Variante
 | |
Die Monitoring Variante bezeichnet die Variante wie der Monitor Veränderungen der Datenquellen "wahrnimmt". Mögliche Varianten sind hier: Triggerbasiert, Replikationsbasiert, Zeitstempelbasiert, Log-basiert oder Snapshot-basiert. Diese Varianten stehen im Zusammenhang mit den jeweils im Einsatz befindlichen Datenbankmanagement-Systemen.
Synonyme:
Monitoring Strategie
Oberbegriff:
Monitor
|
|
Multidimensionales Datenmodell
 | |
System von Strukturen und Operatoren zur Modellierung Dimensionen und klassifikationshirarchien innerhalb eines Analysekontextes.
|
|
Online Analytical Processing
(OLAP)
 | |
Analytical Processing stellt die explorative, interaktive Analyse auf Basis des konzeptuellen multidimesionalen Datenmodells dar.
|
|
Online Transaction Processing
(OLTP)
 | |
Online Transaction Processing bezeichnet ein Benutzungsparadigma von Datenbanksystemen, bei dem die Verarbeitung von Transaktionen, das heißt Lese- und Schreiboperationen auf kurzfristig veränderlichen Datenbeständen, im Vordergrund steht. OLTP-Datenbanken speichern typischerweise nur den aktuellen Datenzustand, der abgefragt oder mittels Transaktionen aktualisiert werden kann. OLTP steht damit im Gegensatz zum Online Analytical Processing (OLAP), das sich mit der Aufbereitung und Auswertung über einen längeren Zeitraum gesammelter Daten beschäftigt.
|
|
Repository
 | |
Das Repository dient der Ablage der Metadaten des Data Warehouse Systems. Metadaten sind alle Informationen, die den Aufbau, die Wartung und die Administration des DWH Systems vereinfachen.
Übersetzungen:
Datenspeicher
Oberbegriff:
Data Warehouse System
|
|
Sternschema
 | |
Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP-Anwendungen.
Die Bezeichnung Sternschema rührt daher, dass die Tabellen sternförmig angeordnet werden: Im Zentrum steht eine Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren.
Übersetzungen:
Star-Schema
Oberbegriff:
Würfel
Unterbegriff:
Dimension
,
Fakten
|
|
Transformation
 | |
Mit der Transformation werden die extrahierten Daten an vorgegebene Qualitäts- und Schemaanforderungen angepasst. Transfornmationen sind z. B. : Die transformation in (de)-normalisierte Datenstrukturen, Schlüsselbehandlungen, Anpassung von Datentypen, Konvertierung von Kodierungen, Vereinheitlichung von Zeichenetten, Vereinheitlichung von Datumsangaben, Umrechnung von Maßeinheiten / Skalierung, Kombination / Separierung von Attributwerten, Berechnung abgeleiteter Werte oder die Aggregierung von Werten.
Oberbegriff:
Extract - Transform - Load
Unterbegriff:
Transformationskomponente
|
|
Transformationskomponente
 | |
Übernimmt die Transformation der extrahierten Daten hinsichtlich struktureller Aspekte (Schemaintegration) oder inhaltlicher Aspekte (Datenintegration / Datenbereinigung). Mögliche, notwenige Transformationen sind unter anderem Filterung, Harmonisierung, Aggregation sowie Anreicherung.
Oberbegriff:
Transformation
|
|
Würfel
 | |
Mehrdimensionale Matrix, deren Zellen ein oder mehrere Kenngrößenwerte enthalten (z.B. Umsatz, Erlös, etc.). Der Würfel wird durch Dimensionen (z.B. Produkt, Kunde, Zeit) als Achsen mit den jeweiligen Ausprägungen aufgespannt.
Übersetzungen:
Cube
Unterbegriff:
Würfelschema
,
Sternschema
|
|
Würfelschema
 | |
Das Schema eines Würfels wird durch Dimensionen und Kenngrößen definiert. Ein würfel ensteht durch die Instanzierung eines multidimensionalen Schemas.
Übersetzungen:
Cube Schema
Oberbegriff:
Würfel
|
|