Online Analytical Processing (OLAP) ist eine effektive Datenverarbeitungstechnologie, bei der die endgültigen Informationen angezeigt werden, die auf riesigen Arrays von Daten aller Art basieren. Dies ist ein leistungsstarkes Produkt, mit dem Informationen auf einem PC abgerufen, angezeigt und aus verschiedenen Blickwinkeln analysiert werden können.
OLAP ist ein Tool, das eine strategische Position für die langfristige Planung bietet und die Basisinformationen von Betriebsdaten für eine Perspektive von 5, 10 oder mehr Jahren berücksichtigt. Die Daten werden in der Datenbank mit der Dimension gespeichert, bei der es sich um ihr Attribut handelt. Benutzer können denselben Datensatz mit unterschiedlichen Attributen anzeigen, abhängig vom Zweck der Analyse.
OLAP-Verlauf
OLAP ist kein neues Konzept und wird seit Jahrzehnten verwendet. In der Tat wurde der Ursprung der Technologie bis 1962 zurückverfolgt. Der Begriff wurde jedoch erst 1993 vom Datenbankautor Ted Coddom geprägt, der auch 12 Regeln für das Produkt festlegte. Wie in vielen anderen Anwendungen hat das Konzept mehrere Evolutionsstufen durchlaufen.
Die Geschichte der OLAP-Technologie selbst geht auf das Jahr 1970 zurück, als Express-Informationsressourcen und der erste Olap-Server veröffentlicht wurden. Sie wurden 1995 von Oracle übernommen und bildeten die Grundlage für die Online-Analyse des mehrdimensionalen Rechenmechanismus, den die renommierte Computermarke in ihrer Datenbank bereitstellte. 1992 wurde von Arbor Software ein weiteres bekanntes Online-Produkt für die analytische Verarbeitung Essbase veröffentlicht (2007 von Oracle übernommen).
1998 veröffentlichte Microsoft den Online-Analyse-Datenverarbeitungsserver MS Analysis Services. Dies trug zur Popularität der Technologie bei und veranlasste die Entwicklung anderer Produkte. Heute gibt es mehrere weltbekannte Anbieter von Olap-Anwendungen, darunter IBM, SAS, SAP, Essbase, Microsoft, Oracle und IcCube.
Online-Analyseverarbeitung
OLAP ist ein Tool, mit dem Sie Entscheidungen über geplante Ereignisse treffen können. Eine atypische Olap-Berechnung kann komplizierter sein als nur das Aggregieren von Daten. Analytical Queries per Minute (AQM) wird als Standardreferenz für den Vergleich der Leistung verschiedener Instrumente verwendet. Diese Systeme sollten Benutzer so weit wie möglich vor der Syntax komplexer Abfragen verbergen und allen Benutzern eine einheitliche Antwortzeit bieten (unabhängig davon, wie kompliziert sie sind).
Die folgenden Hauptfunktionen von OLAP sind vorhanden:
- Mehrdimensionale Datendarstellungen.
- Unterstützung für komplexes Computing.
- Temporäre Intelligenz.
Die mehrdimensionale Darstellung bietet die Grundlage für die analytische Verarbeitung durch flexiblen Zugriff auf Unternehmensdaten. Benutzer können Daten in jeder Dimension und auf jeder Aggregationsebene analysieren.
Die Unterstützung für komplexes Computing ist die Grundlage der OLAP-Software.
Temporäre Intelligenz wird verwendet, um die Wirksamkeit einer analytischen Anwendung über einen bestimmten Zeitraum zu bewerten. Zum Beispiel dieser Monat im Vergleich zum Vormonat, dieser Monat im Vergleich zum gleichen Monat des Vorjahres.
Mehrdimensionale Datenstruktur
Eines der Hauptmerkmale der analytischen Online-Verarbeitung ist die mehrdimensionale Datenstruktur. Ein Würfel kann mehrere Dimensionen haben. Dank dieses Modells ist der gesamte Prozess der intelligenten OLAP-Analyse für Manager und Führungskräfte einfach, da die in den Zellen dargestellten Objekte reale Geschäftsobjekte sind. Darüber hinaus können Benutzer mit diesem Datenmodell nicht nur strukturierte, sondern auch unstrukturierte und semi-strukturierte Arrays verarbeiten.All dies macht sie besonders beliebt für Datenanalyse- und BI-Anwendungen.
Hauptmerkmale von OLAP-Systemen:
- Verwenden Sie mehrdimensionale Datenanalysemethoden.
- Bieten Sie erweiterte Datenbankunterstützung.
- Erstellen Sie benutzerfreundliche Benutzeroberflächen.
- Unterstützung client / server architektur.
Eine der Hauptkomponenten von OLAP-Konzepten ist ein clientseitiger Server. Neben der Aggregation und Vorverarbeitung von Daten aus einer relationalen Datenbank werden erweiterte Berechnungs- und Aufzeichnungsparameter, zusätzliche Funktionen, grundlegende erweiterte Abfragefunktionen und andere Funktionen bereitgestellt.
Abhängig von der vom Benutzer ausgewählten Beispielanwendung stehen verschiedene Datenmodelle und Tools zur Verfügung, darunter Echtzeitwarnungen, eine Funktion zum Anwenden von Was-wäre-wenn-Szenarien, Optimierung und komplexe OLAP-Berichte.
Kubische Form
Das Konzept basiert auf einer kubischen Form. Die Position der darin enthaltenen Daten zeigt, wie sich OLAP an das Prinzip der multivariaten Analyse hält, wodurch eine Datenstruktur für eine schnelle und effiziente Analyse erstellt wird.
Ein OLAP-Cube wird auch als "Hypercube" bezeichnet. Es wird beschrieben, dass es aus numerischen Fakten (Maßen) besteht, die nach Facetten (Dimensionen) klassifiziert sind. Dimensionen beziehen sich auf Attribute, die ein Geschäftsproblem definieren. Einfach ausgedrückt ist eine Dimension eine Bezeichnung, die eine Kennzahl beschreibt. In Verkaufsberichten ist die Kennzahl beispielsweise das Verkaufsvolumen, und die Dimensionen umfassen den Verkaufszeitraum, die Verkäufer, ein Produkt oder eine Dienstleistung und die Verkaufsregion. Bei der Meldung von Produktionsvorgängen kann es sich um die Gesamtproduktionskosten und die Produktionseinheiten handeln. Dimensionen sind das Datum oder die Uhrzeit der Produktion, die Produktionsphase oder -phase, selbst die am Produktionsprozess beteiligten Mitarbeiter.
Der OLAP-Datenwürfel ist der Eckpfeiler des Systems. Die Daten im Cube werden entweder nach einem Stern- oder einem Schneeflockenmuster organisiert. In der Mitte befindet sich eine Faktentabelle mit Aggregaten (Kennzahlen). Es ist mit einer Reihe von Maßtabellen verknüpft, die Informationen zu Maßen enthalten. Dimensionen beschreiben, wie diese Maßnahmen analysiert werden können. Wenn ein Würfel mehr als drei Dimensionen enthält, wird er häufig als Hyperwürfel bezeichnet.
Eine der Hauptfunktionen des Würfels ist seine statische Natur, was bedeutet, dass der Würfel nach seiner Entwicklung nicht mehr geändert werden kann. Daher ist der Prozess des Erstellens eines Cubes und des Einrichtens eines Datenmodells ein entscheidender Schritt für eine angemessene Datenverarbeitung in der OLAP-Architektur.
Datenaggregation
Die Verwendung von Aggregationen ist der Hauptgrund, warum Anforderungen in OLAP-Tools viel schneller verarbeitet werden (im Vergleich zu OLTP). Aggregationen sind Zusammenfassungen von Daten, die zuvor während der Verarbeitung berechnet wurden. Alle in OLAP-Dimensionstabellen gespeicherten Elemente definieren die Abfragen, die der Cube empfangen kann.
In einem Würfel werden Informationsakkumulationen in Zellen gespeichert, deren Koordinaten durch bestimmte Größen angegeben werden. Die Anzahl der Aggregate, die ein Cube enthalten kann, hängt von allen möglichen Kombinationen von Dimensionselementen ab. Daher kann ein typischer Cube in einer Anwendung eine extrem große Anzahl von Aggregaten enthalten. Eine vorläufige Berechnung wird nur für Schlüsselaggregate durchgeführt, die im gesamten Analyse-Cube von Online Analytics verteilt sind. Dadurch wird der Zeitaufwand für die Ermittlung von Aggregationen beim Ausführen einer Abfrage in einem Datenmodell erheblich reduziert.
Es gibt auch zwei Optionen in Bezug auf Aggregationen, mit denen Sie die Leistung eines fertigen Cubes verbessern können: Erstellen Sie eine Aggregation des Capabilities-Caches und verwenden Sie die Aggregation basierend auf einer Analyse der Benutzeranforderungen.
Arbeitsprinzip
In der Regel kann die Analyse von Betriebsinformationen aus Transaktionen mithilfe einer einfachen Tabelle durchgeführt werden (Datenwerte werden in Zeilen und Spalten dargestellt). Dies ist angesichts der zweidimensionalen Natur der Daten gut. Bei OLAP gibt es Unterschiede aufgrund des mehrdimensionalen Datenarrays.Da sie häufig aus verschiedenen Quellen bezogen werden, kann eine Kalkulationstabelle sie möglicherweise nicht immer effizient verarbeiten.
Der Cube löst dieses Problem und stellt außerdem sicher, dass das OLAP-Data-Warehouse logisch und ordnungsgemäß funktioniert. Das Unternehmen sammelt Daten aus zahlreichen Quellen und präsentiert sie in verschiedenen Formaten wie Textdateien, Multimediadateien, Excel-Tabellen, Access-Datenbanken und sogar OLTP-Datenbanken.
Alle Daten werden in einem Repository gesammelt, das direkt aus den Quellen stammt. Darin werden die von OLTP und anderen Quellen erhaltenen Rohdaten von fehlerhaften, unvollständigen und inkonsistenten Transaktionen befreit.
Nach der Bereinigung und Konvertierung werden die Informationen in einer relationalen Datenbank gespeichert. Anschließend wird es zur Analyse auf den mehrdimensionalen OLAP-Server (oder Olap-Cube) hochgeladen. Endbenutzer, die für Geschäftsanwendungen, Data Mining und andere Geschäftsvorgänge verantwortlich sind, erhalten Zugriff auf die Informationen, die sie vom Olap-Cube benötigen.
Vorteile des Array-Modells
OLAP ist ein Tool, das eine schnelle Abfrageleistung bietet. Dies wird durch optimierten Speicher, mehrdimensionale Indizierung und Zwischenspeicherung erreicht, die wesentliche Vorteile des Systems sind. Darüber hinaus sind die Vorteile:
- Kleinere Daten auf der Festplatte.
- Automatisierte Berechnung von Aggregaten einer höheren Datenebene.
- Array-Modelle bieten eine natürliche Indizierung.
- Ein effizienter Datenabruf wird durch Vorstrukturierung erreicht.
- Kompakt für niedrig dimensionale Datensätze.
Zu den Nachteilen von OLAP gehört die Tatsache, dass einige Lösungen (Verarbeitungsschritt) sehr langwierig sein können, insbesondere bei großen Informationsmengen. Dies wird normalerweise korrigiert, indem nur eine inkrementelle Verarbeitung durchgeführt wird (Daten, die geändert wurden, werden untersucht).
Grundlegende analytische Operationen
Faltung (Roll-up / Drill-up) wird auch als "Konsolidierung" bezeichnet. Bei der Koagulation werden alle verfügbaren Daten gesammelt und in einer oder mehreren Dimensionen berechnet. In den meisten Fällen muss hierfür eine mathematische Formel angewendet werden. Als OLAP-Beispiel können wir ein Einzelhandelsnetz mit Filialen in verschiedenen Städten betrachten. Um Modelle zu identifizieren und zukünftige Verkaufstrends zu antizipieren, werden Daten von allen Punkten zur Konsolidierung und Berechnung in der Hauptverkaufsabteilung des Unternehmens zusammengefasst.
Offenlegung (Drilldown). Dies ist das Gegenteil von Gerinnung. Der Prozess beginnt mit einem großen Datensatz und zerfällt dann in kleinere Teile, sodass Benutzer Details anzeigen können. Im Beispiel des Einzelhandelsnetzwerks analysiert der Analyst Verkaufsdaten und betrachtet einzelne Marken oder Produkte, die in den einzelnen Filialen in verschiedenen Städten als Bestseller gelten.
Abschnitt (Scheibe und Würfel). Hierbei handelt es sich um einen Vorgang, bei dem Analysevorgänge zwei Aktionen umfassen: Ableiten eines bestimmten Datensatzes aus dem OLAP-Cube („Schneiden“ des Analyseaspekts) und Anzeigen aus verschiedenen Blickwinkeln oder Blickwinkeln. Dies kann passieren, wenn alle Daten der Filialen empfangen und in den Hypercube eingegeben werden. Der Analyst schneidet den Verkaufsdatensatz von OLAP Cube aus. Es wird dann bei der Analyse der Verkäufe einzelner Einheiten in jeder Region betrachtet. Zu diesem Zeitpunkt konzentrieren sich andere Benutzer möglicherweise darauf, die Kostenwirksamkeit des Verkaufs oder die Wirksamkeit einer Marketing- und Werbekampagne zu bewerten.
Wende dich (Drehpunkt). Die Datenachsen werden darin gedreht, um einen Ersatz für die Darstellung von Informationen bereitzustellen.
Vielzahl von Datenbanken
Im Prinzip handelt es sich um einen typischen OLAP-Cube, der die analytische Verarbeitung mehrdimensionaler Daten mithilfe des OLAP-Cubes oder eines beliebigen Daten-Cubes implementiert, sodass der analytische Prozess nach Bedarf Dimensionen hinzufügen kann. In eine mehrdimensionale Datenbank hochgeladene Informationen werden gespeichert oder archiviert und können bei Bedarf abgerufen werden.
OLAP-Typ | Wert |
Relationales OLAP (ROLAP) | ROLAP ist ein erweitertes DBMS zusammen mit einer mehrdimensionalen Datenzuordnung zur Ausführung von relationalen Standardoperationen |
Mehrdimensionales OLAP (MOLAP) | MOLAP - implementiert die Arbeit in mehrdimensionalen Daten |
Hybrid Online Analytical Processing (HOLAP) | Beim HOLAP-Ansatz werden aggregierte Gesamtsummen in einer mehrdimensionalen Datenbank und detaillierte Informationen in einer relationalen Datenbank gespeichert. Dies stellt sowohl die Effizienz des ROLAP-Modells als auch die Leistung des MOLAP-Modells sicher. |
OLAP Desktop (DOLAP) | In Desktop OLAP lädt der Benutzer einen Teil der Daten von der Datenbank lokal oder auf seinen Desktop herunter und analysiert sie. Die Bereitstellung von DOLAP ist relativ kostengünstig, da es im Vergleich zu anderen OLAP-Systemen nur sehr wenige Funktionen bietet |
Web OLAP (WOLAP) | Web OLAP ist ein OLAP-System, auf das über einen Webbrowser zugegriffen werden kann. WOLAP ist eine dreistufige Architektur. Es besteht aus drei Komponenten: Client, Middleware und Datenbankserver |
Mobiles OLAP | Mobile OLAP unterstützt Benutzer beim Empfangen und Analysieren von OLAP-Daten mit ihren Mobilgeräten |
Räumliches OLAP | SOLAP wurde entwickelt, um die Verwaltung von räumlichen und nicht räumlichen Daten in einem geografischen Informationssystem (GIS) zu erleichtern. |
Es gibt weniger bekannte OLAP-Systeme oder -Technologien, aber dies sind die wichtigsten, die derzeit von großen Unternehmen, Geschäftsstrukturen und sogar der Regierung verwendet werden.
OLAP-Tools
Tools für die Online-Analyseverarbeitung werden im Internet sowohl in Form von kostenpflichtigen als auch in Form von kostenlosen Versionen sehr gut präsentiert.
Die beliebtesten von ihnen:
- Dundas BI von Dundas Data Visualization ist eine browserbasierte Plattform für Business Intelligence und Datenvisualisierung, die integrierte Dashboards, OLAP-Berichterstellungstools und Datenanalysen umfasst.
- Yellowfin ist eine Business Intelligence-Plattform, eine integrierte Einzellösung für Unternehmen verschiedener Branchen und Größen. Dieses System ist für Unternehmen aus den Bereichen Rechnungswesen, Werbung und Landwirtschaft konfiguriert.
- ClicData ist eine Business Intelligence (BI) -Lösung, die in erster Linie für kleine und mittlere Unternehmen entwickelt wurde. Mit dem Tool können Endbenutzer Berichte und Dashboards erstellen. Board wurde geschaffen, um Business Intelligence und Corporate Performance Management zu kombinieren. Es ist ein voll funktionsfähiges System, das mittelständische Unternehmen und Unternehmen unterstützt.
- Domo ist ein Cloud-basiertes Geschäftsverwaltungspaket, das sich in mehrere Datenquellen integrieren lässt, darunter Tabellenkalkulationen, Datenbanken, soziale Netzwerke und alle vorhandenen Cloud- oder lokalen Softwarelösungen.
- InetSoft Style Intelligence ist eine Business Intelligence-Softwareplattform, mit der Benutzer Dashboards, visuelle OLAP-Analysetechnologien und Berichte mithilfe des Mashup-Mechanismus erstellen können.
- Birst von Infor Company ist eine vernetzte Lösung für Unternehmensanalysten und -analysen, die die Ideen verschiedener Teams kombiniert und fundierte Entscheidungen ermöglicht. Mit dem Tool können dezentrale Benutzer das Modell von Unternehmensteams erweitern.
- Halo ist ein umfassendes Supply-Chain-Management- und Business-Intelligence-System, das bei der Geschäftsplanung und Inventarprognose für das Supply-Chain-Management hilft. Das System verwendet Daten aus allen Quellen - groß, klein und mittelgroß.
- Chartio ist eine Cloud-basierte Business-Intelligence-Lösung, die Gründern, Geschäftsgruppen, Datenanalysten und Produktgruppen organisatorische Tools für die tägliche Arbeit bietet.
- Exago BI ist eine webbasierte Lösung, die für die Implementierung in Webanwendungen entwickelt wurde. Mit der Implementierung von Exago BI können Unternehmen jeder Größe ihren Kunden spezielle, zeitnahe und interaktive Berichte zur Verfügung stellen.
Geschäftsauswirkungen
Der Benutzer findet OLAP in den meisten Geschäftsanwendungen in verschiedenen Branchen.Die Analyse wird nicht nur von Unternehmen, sondern auch von anderen interessierten Parteien verwendet.
Einige der häufigsten Anwendungen sind:
- Marketing-OLAP-Datenanalyse.
- Finanzberichte, die Umsatz und Kosten, Budgetierung und Finanzplanung abdecken.
- Geschäftsprozessmanagement.
- Verkaufsanalyse.
- Datenbank-Marketing.
Die Branchen wachsen weiter, was bedeutet, dass Benutzer bald mehr OLAP-Anwendungen sehen werden. Die mehrdimensionale, maßgeschneiderte Verarbeitung bietet eine dynamischere Analyse. Aus diesem Grund werden diese OLAP-Systeme und -Technologien verwendet, um Was-wäre-wenn-Szenarien und alternative Geschäftsszenarien zu bewerten.