Glossar

Business Intelligence

   
   
   
Firma: QMETHODS - Business & IT Consulting GmbH
Autor: Konrad Diekmann
Sprache: de
Erstellungsdatum: 15.12.2008
Letzte Aktualisierung: 22.06.2009

   

Aggregation  Aggregation bezeichnet das Verdichten von Daten zu einem einzelnen Datum. Die Aggregation als eine Operation des Online Analytical Processing findet anlang der Klassifikationspfade statt.

Beispiele:

  • Aus einer Menge feingranularer Daten werden mittels sogenannter Aggregationsfunktionen z.B. der Mittelwert, das Maximum oder die Summe gebildet.



Analyse  Die Analyse umfasst als Oberbegriff alle Operationen, die mit den daten des Data Warehouse durchgeführt werden können. Es ist der Prozess zur Untersuchung und Präsentation der Daten mit unterschiedlichen Methoden. Dies reicht von der Präsentation der Einzeldaten, über einfache arithmetische Operationen bis hin zu komplexen statistischen Untersuchungen mit einer grafischen Aufbereitung der Ergebnisse.

Oberbegriff:  Data Warehouse System

Unterbegriff: Analysewerkzeuge , Analysesystem , Freie Analysen , Geführte Analysen , RFMR Analyse , SWOT Analyse , Dokumentenanalyse , Zeitreihenanalyse



Analysewerkzeuge  Analysewerkzeuge stellen als Schnittstelle zwischen dem Data Warehouse und dem Anwender Funktionalitäten für die Präsentation der gesammelten Daten mit interaktiven Navigations- und Analysemöglichkeiten zur Verfügung.

Synonyme: BI Werkzeuge

Oberbegriff:  Analyse



Anreicherung  Als Anreicherung bezeichnet man den Vorgang des Hinzufügens von Daten oder berechneten Werten zu den aus den Datenquellen extrahierten Daten in der Basisdatenbank. Diese Daten können dann zusätzlich, in Verindung mit den extrahierten Daten,im für den Analyseprozess bereitgestellt werden.



Arbeitsbereich  Zentrale Datenhaltungskomponente des Datenbeschaffungsbereich (Integration von Daten). Daten werden auf dem Weg von der Datenquelle zur Basisdatenbank temporär zwischengespeichert. Datentransformationen werden direkt im Zwischenspeicher ausgeführt. Nach Abschluss aller Bearbeitungsschritte werden die Daten in die Basisdatenbank geladen und aus dem Arbeitsbereich entfernt.

Übersetzungen: en   Staging Area

Oberbegriff:  Data Warehouse System



Basisdatenbank  Physische Datenbank, die eine integrierte Sicht auf beliebige Daten darstellt. Die Basisdatenbank dient zur generellen Speicherung der aufbereiteten und bereinigten Daten und unterliegt deshalb nicht einem spezifischen Modellierungsansatz. Die Basisdatenbank dient als Quelle für das Data Warehouse und ist die Stufe zwischen dem Arbeitsbereich und dem Data Warehouse. Die Basisdatenbank hat zudem eine zentrale Verteilungsfunktion (Mehrfachverwendung, Flexibilität in der Verwendung der Daten) und kann als Datenbasis für andere operative Anwendungen dienen.

Oberbegriff:  Data Warehouse System



Business Intelligence (BI)   en  Business Intelligence steht für die Integration von Strategien, Prozessen und Technologien, um aus verteilten und heterogenen Unternehmens-, Markt- und Wettbewerbsdaten erfolgskritisches Wissen über Status, Potenziale und Perspektiven des Unternehmens zu erzeugen.



Data Mart   en  Ein Data Mart bietet eine externe Sicht auf das Data Warehouse, die in der Regel durch kopieren und somit durch das Einführen von Redundanzen erreicht wird. Insofern bietet ein Data Mart einen inhaltlich beschränkten Fokus auf ein Unternehmen oder eine Abteilung. Gründe für die Einführung von Data Marts sind unter anderem sein: Eigenständigkeit, Datenschutz, Organisatorische Aspekte, Verringerung des Datenvolumen. Performancegewinn durch Aggregation, Verteilung der Last oder Unabhängigkeit von Aktualisierungszyklen des Data Warehouse. Eine Abgrenzung zwischen einem Data Mart und einem Data Warehouse ist jedoch nur schwer möglich. Der Begriff Data Mart ist somit optional und kann unter dem Begriff Data Warehouse subsumiert werden.

Oberbegriff:  Data Warehouse System



Data Mining   en Data Minig bezeichnet ein spezielles Analyseverfahren, mit dem nach unbekannten Mustern oder Beziehungen zwischen den Daten gesucht wird.



Data Warehouse   en  Das Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf die Daten darstellt. Im Unterschied zur Basisdatenbank steht hier der Auswertungsaspekt im Mittelpunkt, d.h. die Daten liegen in einem analyseorientierten Schema vor, das häufig durch ein multidimensionales Schema widerspiegelt.Häufig, aber nicht notwendigerweise, findet eine Historisierung der Daten statt. In Verbindung mit dem Repository und der Basisdatenbank enthält das Data Warehouse alle notwendigen Daten für die Analysen des Anwenders. Aufgabe ist die dauerhafte Verwaltung und Bereitstellung der für die jeweiligen Analysen benötigten Daten. Anfallende Metadaten (z.B. Datenbankschema) werden über den Metadatenmanager mit dem Repository synchronisiert.

Oberbegriff:  Data Warehouse System



Data Warehouse Manager   en  Zentrale Komponente des Data Warehouse Systems, zur Initiierung, Steuerung, Überwachung der Prozesse von der Extraktion bis hin zur Analyse. Wichtigste Aufgabe des Data Warehouse Managers ist der Datenbeschaffungsprozess, der ausgelöst und koordiniert wird.

Oberbegriff:  Data Warehouse System



Data Warehouse Process   en Der Data Warehouse Prozess umfasst alle Schritte vom Datenbeschaffungsprozesses, über das Speichern der Daten im Data Warehouse bis hin zur Analyse der Daten

Synonyme: Data Warehousing



Data Warehouse System   en  Das Data Warehouse System bezeichnet die Gesamtheit der Komponenten, die am Data Warehouse Prozess beteiligt sind.

Synonyme: Data Warehouse Architektur

Unterbegriff: Analyse , Arbeitsbereich , Basisdatenbank , Monitor , Datenquellen , Data Warehouse Manager , Data Mart , Data Warehouse , Repository



Datenbankmanagementsystem (DBMS)   Das Datenbankmanagementsystem ist neben der Datenbank ein Bestandteil eines Datenbanksystems. Die Aufgaben eines Datenbankmanagementsystem sind u.A.: Speichern der Daten, Verwaltung der Metadaten, Datensicherheit, Mehrbenutzerbetrieb durch Transaktionen, Sicherstellen der Datenintegrität.



Datenbanksysteme (DBS)  Ein Datenbanksystem ist ein System zur elektronischen Datenverwaltung. Die wesentliche Aufgabe eines DBS ist es, große Datenmengen effizient, widerspruchsfrei und dauerhaft zu speichern und benötigte Teilmengen in unterschiedlichen, bedarfsgerechten Darstellungsformen für Benutzer und Anwendungsprogramme bereitzustellen.



Datenbeschaffungsprozess  Als Datenbeschaffungsprozess wird der Vorgang bezeichnet, indem Daten aus den Datenquellen in die Basisdatenbank gebracht werden. Der Datenbeschaffungsprozess gliedert sich in die Teilschritte Extraktion, Transformation und Laden.



Datenquellen  Als Datenquellen bezeichnet man Daten- und Metadatenlieferanten im Data Warehouse System. Diese können sowohl organisationintern als auch extern sein. Datenquellen können aus mehreren zu integrierenden, meist heterogenen realen Datenquellen bestehen. Datenquellen stellen den Ausgangspunkt des Datenflusses dar, werden aber nicht zu den Komponenten eines Data Warehouse Systems gezählt.

Oberbegriff:  Data Warehouse System



Detaildaten   en  Als Detaildaten werden Daten bezeichnet, die in der jeweils feinsten verfügbaren Granularität vorliegen.



Dimension  Eine Dimension ist innerhalb des multidimensionalen Datenmodells eine ausgewählte Entität, mit der eine Analysesicht eines Anwendungsbereichs definiert wird. Dimensionen dienen der eindeutigen, orthogonalen Strukturierung des Datenraums

Synonyme: Dimensionstabelle

Oberbegriff:  Sternschema

Unterbegriff: Dimensionselemente , Dimensionalität des Würfels

Beispiele:

  • Zeit
  • Kunde
  • Verkäufer
  • Produkt



Dimensionalität des Würfels   en  Anzahl der Dimensionen die einen Würfel (Cube) aufspannen.

Oberbegriff:  Dimension



Dimensionselemente   en  Basisgranulare Klassifikationsknoten in der Klassifikationshierarchie.

Oberbegriff:  Dimension



Extract - Transform - Load (ETL)   en  Der Prozess, der sich aus den Teilschritten Extract, Transform und Load zusammensetzt, wird auch als ETL Prozess definiert.

Unterbegriff: Extraktion , Transformation , Laden



Extraktion  Mit der Extraktion wird ein Teil der Daten aus der Datenquelle extrahiert, um sie anschließend der nachfolgenden Transformation zur Verfügung zu stellen.

Oberbegriff:  Extract - Transform - Load

Unterbegriff: Extraktionskomponente



Extraktionskomponente  Komponente zur Extraktion der Daten aus der Datenquelle. Verfahren ist abhängig von der jeweiligen Monitoring Variante. Vom Monitor identifizierten Daten werden in den Arbeitsbereich geladen.

Oberbegriff:  Extraktion



Fakten  Die zu verwaltenden Daten werden als Fakten bezeichnet; sie werden typischerweise fortlaufend in der Faktentabelle gespeichert. Faktentabellen können sehr groß werden, was ein Data-Warehouse zwingt, die Daten nach und nach zu verdichten (aggregieren) und schließlich nach einer Halteperiode zu löschen oder auszulagern (Archivierung).

Synonyme: Metriken , Messwerte

Oberbegriff:  Sternschema

Beispiele:

  • Verkäufe
  • Lohnzahlungen
  • Kundenbesuche



Ladekomponente  Nach der Transformation befinden sich im Arbeitsbereich bereinigte und aufbereitete Daten zur Speicherung und späteren Auswertung. Für die Weiterleitung sind 2 Ladekomponenten zuständig: Eine zur Übertragung der analyseunabhängigen Daten aus dem Arbeitsbereich in die Basisdatenbank und eine zur Übertragung der analysespezifischen Daten (z.B. Aggregate) aus der Basisdatenbank in das Data Warehouse. Falls keine Basisdatenbank vorhanden ist, existiert nur eine Ladekomponente! Die Ladekomponenten nehmen üblicherweise das Ladewerkzeug des jeweils zugrundeliegenden DBMS zu Hilfe.

Oberbegriff:  Laden



Laden  Laden bezeichnet den letzten Schritt im Datenbeschaffungsprozess, bei dem die Daten aus dem Beschaffungsbereich in die Basisdatenbank oder von der Basisdatenbank in das Data Warehouse physisch eingebracht werden. Häufig wird der Ladeprozess mit einer Aggregierung der Daten verbunden.

Oberbegriff:  Extract - Transform - Load

Unterbegriff: Ladekomponente



Metadaten 



Metadatenmanager  Der Metadatenmanager steuert die Metadatenverwaltung des Data Warehouse System. Er wird als eine Anwendung definiert, die folgendes anbietet: Versions- und Konfigurationsmanagement, Integrations-, Zugriffs-, Anfrage- und Navigationsmöglichkeiten, Schnittstelle für Lese- und Schreibzugriffe auf das Repository. Der Metadatenmanager ermöglicht den Metadatenaustausch zwischen den verschiedenen Komponenten sowie den Kontrollfluss zwischen Metadatenmanager und Data Warehouse Manager der sich bei bei metadatengesteuerten Prozessen ergibt. Häufig verwenden Data Warehouse Systeme keine metadatengetriebenen Werkzeuge. In diesem Fall dient des Metadatenverwaltungssystem lediglich als Informationslieferant für die Anwender.



Monitor  Die Monitor Komponente im Data Warehouse System ist zuständig für die Entdeckung von relevanten Datenmanipulationen in einer Datenquelle. Es existiert im allgemeinen ein Monitor pro Datenquelle. Die Funktionsweise hängt unmittelbar von der angeschlossenen Datenquelle sowie den Anforderungen der Analysekomponente ab.

Oberbegriff:  Data Warehouse System

Unterbegriff: Monitoring Variante



Monitoring Variante  Die Monitoring Variante bezeichnet die Variante wie der Monitor Veränderungen der Datenquellen "wahrnimmt". Mögliche Varianten sind hier: Triggerbasiert, Replikationsbasiert, Zeitstempelbasiert, Log-basiert oder Snapshot-basiert. Diese Varianten stehen im Zusammenhang mit den jeweils im Einsatz befindlichen Datenbankmanagement-Systemen.

Synonyme: Monitoring Strategie

Oberbegriff:  Monitor



Multidimensionales Datenmodell  System von Strukturen und Operatoren zur Modellierung Dimensionen und klassifikationshirarchien innerhalb eines Analysekontextes.



Online Analytical Processing (OLAP)   en  Analytical Processing stellt die explorative, interaktive Analyse auf Basis des konzeptuellen multidimesionalen Datenmodells dar.



Online Transaction Processing (OLTP)   en  Online Transaction Processing bezeichnet ein Benutzungsparadigma von Datenbanksystemen, bei dem die Verarbeitung von Transaktionen, das heißt Lese- und Schreiboperationen auf kurzfristig veränderlichen Datenbeständen, im Vordergrund steht. OLTP-Datenbanken speichern typischerweise nur den aktuellen Datenzustand, der abgefragt oder mittels Transaktionen aktualisiert werden kann. OLTP steht damit im Gegensatz zum Online Analytical Processing (OLAP), das sich mit der Aufbereitung und Auswertung über einen längeren Zeitraum gesammelter Daten beschäftigt.



Repository   en  Das Repository dient der Ablage der Metadaten des Data Warehouse Systems. Metadaten sind alle Informationen, die den Aufbau, die Wartung und die Administration des DWH – Systems vereinfachen.

Übersetzungen: de   Datenspeicher

Oberbegriff:  Data Warehouse System



Sternschema  Das Sternschema ist eine besondere Form eines Datenmodells, dessen Ziel nicht die Normalisierung ist, sondern eine Optimierung auf effiziente Leseoperationen. Hauptanwendungsfeld sind Data Warehouses und OLAP-Anwendungen. Die Bezeichnung Sternschema rührt daher, dass die Tabellen sternförmig angeordnet werden: Im Zentrum steht eine Faktentabelle, um die sich mehrere Dimensionstabellen gruppieren.

Übersetzungen: en   Star-Schema

Oberbegriff:  Würfel

Unterbegriff: Dimension , Fakten



Transformation  Mit der Transformation werden die extrahierten Daten an vorgegebene Qualitäts- und Schemaanforderungen angepasst. Transfornmationen sind z. B. : Die transformation in (de)-normalisierte Datenstrukturen, Schlüsselbehandlungen, Anpassung von Datentypen, Konvertierung von Kodierungen, Vereinheitlichung von Zeichenetten, Vereinheitlichung von Datumsangaben, Umrechnung von Maßeinheiten / Skalierung, Kombination / Separierung von Attributwerten, Berechnung abgeleiteter Werte oder die Aggregierung von Werten.

Oberbegriff:  Extract - Transform - Load

Unterbegriff: Transformationskomponente



Transformationskomponente  Übernimmt die Transformation der extrahierten Daten hinsichtlich struktureller Aspekte (Schemaintegration) oder inhaltlicher Aspekte (Datenintegration / Datenbereinigung). Mögliche, notwenige Transformationen sind unter anderem Filterung, Harmonisierung, Aggregation sowie Anreicherung.

Oberbegriff:  Transformation



Würfel  Mehrdimensionale Matrix, deren Zellen ein oder mehrere Kenngrößenwerte enthalten (z.B. Umsatz, Erlös, etc.). Der Würfel wird durch Dimensionen (z.B. Produkt, Kunde, Zeit) als Achsen mit den jeweiligen Ausprägungen aufgespannt.

Übersetzungen: en   Cube

Unterbegriff: Würfelschema , Sternschema



Würfelschema  Das Schema eines Würfels wird durch Dimensionen und Kenngrößen definiert. Ein würfel ensteht durch die Instanzierung eines multidimensionalen Schemas.

Übersetzungen: en   Cube Schema

Oberbegriff:  Würfel




QGLOSSARY by QMETHODS - Business & IT Consulting GmbH