El procesamiento analítico en línea, u OLAP, es una tecnología efectiva de procesamiento de datos, como resultado de lo cual, en base a enormes conjuntos de todo tipo de datos, se muestra la información final. Este es un producto poderoso que ayuda a acceder, recuperar y ver información en una PC, analizándola desde diferentes puntos de vista.
OLAP es una herramienta que proporciona una posición estratégica para la planificación a largo plazo y considera la información básica de los datos operativos para una perspectiva de 5, 10 o más años. Los datos se almacenan en la base de datos con la dimensión, que es su atributo. Los usuarios pueden ver el mismo conjunto de datos con diferentes atributos, dependiendo del propósito del análisis.
Historia OLAP
OLAP no es un concepto nuevo y se ha utilizado durante décadas. De hecho, el origen de la tecnología se remonta a 1962. Pero el término fue acuñado solo en 1993 por el autor de la base de datos Ted Coddom, quien también estableció 12 reglas para el producto. Como en muchas otras aplicaciones, el concepto ha experimentado varias etapas de evolución.
La historia de la tecnología OLAP se remonta a 1970, cuando se lanzaron los recursos de información Express y el primer servidor Olap. Oracle los adquirió en 1995 y posteriormente se convirtió en la base del procesamiento analítico en línea del mecanismo de computación multidimensional que la reconocida marca de computadoras proporcionó en su base de datos. En 1992, otro conocido producto de procesamiento analítico en línea Essbase fue lanzado por Arbor Software (adquirido por Oracle en 2007).
En 1998, Microsoft lanzó el servidor de procesamiento de datos de análisis en línea, MS Analysis Services. Esto contribuyó a la popularidad de la tecnología y provocó el desarrollo de otros productos. Hoy en día, hay varios proveedores de renombre mundial que ofrecen aplicaciones Olap, incluidos IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.
Procesamiento analítico en línea
OLAP es una herramienta que le permite tomar decisiones sobre eventos planificados. El cálculo atípico de Olap puede ser más complicado que simplemente agregar datos. Las consultas analíticas por minuto (AQM) se utilizan como referencia estándar para comparar el rendimiento de diferentes instrumentos. Estos sistemas deben ocultar a los usuarios tanto como sea posible de la sintaxis de consultas complejas y proporcionar un tiempo de respuesta constante para todos (sin importar cuán complicados sean).
Existen las siguientes características clave de OLAP:
- Representaciones de datos multidimensionales.
- Soporte para informática compleja.
- Inteligencia temporal.
La presentación multidimensional proporciona la base para el procesamiento analítico a través del acceso flexible a los datos corporativos. Permite a los usuarios analizar datos en cualquier dimensión y en cualquier nivel de agregación.
La compatibilidad con la informática compleja es la base del software OLAP.
La inteligencia temporal se utiliza para evaluar la efectividad de cualquier aplicación analítica durante un período específico de tiempo. Por ejemplo, este mes en comparación con el mes anterior, este mes en comparación con el mismo mes del año pasado.
Estructura de datos multidimensional
Una de las principales características del procesamiento analítico en línea es la estructura de datos multidimensional. Un cubo puede tener varias dimensiones. Gracias a este modelo, todo el proceso de análisis inteligente OLAP es simple para gerentes y ejecutivos, ya que los objetos representados en las celdas son objetos comerciales del mundo real. Además, este modelo de datos permite a los usuarios procesar no solo matrices estructuradas, sino también no estructuradas y semiestructuradas.Todo esto los hace especialmente populares para el análisis de datos y las aplicaciones de BI.
Características clave de los sistemas OLAP:
- Utilice métodos de análisis de datos multidimensionales.
- Proporcionar soporte avanzado de base de datos.
- Cree interfaces de usuario final fáciles de usar.
- Soporta arquitectura cliente / servidor.
Uno de los componentes principales de los conceptos OLAP es un servidor del lado del cliente. Además de agregar y preprocesar datos de una base de datos relacional, proporciona parámetros avanzados de cálculo y registro, funciones adicionales, capacidades básicas de consulta avanzada y otras funciones.
Dependiendo de la aplicación de muestra seleccionada por el usuario, hay disponibles varios modelos de datos y herramientas, incluidas alertas en tiempo real, una función para aplicar escenarios hipotéticos, optimización e informes OLAP complejos.
Forma cúbica
El concepto se basa en una forma cúbica. La ubicación de los datos que contiene muestra cómo OLAP se adhiere al principio del análisis multivariado, como resultado de lo cual se crea una estructura de datos para un análisis rápido y eficiente.
Un cubo OLAP también se llama "hipercubo". Se describe como consistente en hechos numéricos (medidas), clasificados por facetas (dimensiones). Las dimensiones se relacionan con los atributos que definen un problema empresarial. En pocas palabras, una dimensión es una etiqueta que describe una medida. Por ejemplo, en los informes de ventas, la medida será el volumen de ventas y las dimensiones incluirán el período de ventas, vendedores, un producto o servicio y la región de ventas. En el informe de las operaciones de producción, la medida puede ser los costos totales de producción y las unidades de producción. Las dimensiones serán la fecha o la hora de producción, la fase o fase de producción, incluso los trabajadores involucrados en el proceso de producción.
El cubo de datos OLAP es la piedra angular del sistema. Los datos en el cubo se organizan utilizando un patrón de estrella o copo de nieve. En el centro hay una tabla de hechos que contiene agregados (medidas). Se asocia con una serie de tablas de medidas que contienen información sobre medidas. Las dimensiones describen cómo se pueden analizar estas medidas. Si un cubo contiene más de tres dimensiones, a menudo se le llama hipercubo.
Una de las funciones principales que pertenecen al cubo es su naturaleza estática, lo que implica que el cubo no se puede cambiar después de su desarrollo. Por lo tanto, el proceso de construir un cubo y configurar un modelo de datos es un paso crucial hacia el procesamiento adecuado de datos en la arquitectura OLAP.
Agregación de datos
El uso de agregaciones es la razón principal por la cual las solicitudes se procesan mucho más rápido en las herramientas OLAP (en comparación con OLTP). Las agregaciones son resúmenes de datos que se calcularon previamente durante el procesamiento. Todos los miembros almacenados en tablas de dimensiones OLAP definen las consultas que puede recibir el cubo.
En un cubo, las acumulaciones de información se almacenan en celdas, cuyas coordenadas se especifican por tamaños específicos. El número de agregados que puede contener un cubo depende de todas las combinaciones posibles de elementos de dimensión. Por lo tanto, un cubo típico en una aplicación puede contener una cantidad extremadamente grande de agregados. Se realizará un cálculo preliminar solo para los agregados clave que se distribuyen en todo el cubo analítico de análisis en línea. Esto reducirá significativamente el tiempo requerido para determinar cualquier agregación al ejecutar una consulta en un modelo de datos.
También hay dos opciones relacionadas con las agregaciones con las que puede mejorar el rendimiento de un cubo terminado: crear una agregación de las capacidades de caché y usar la agregación basada en un análisis de las solicitudes de los usuarios.
Principio de funcionamiento
Por lo general, el análisis de la información operativa obtenida de las transacciones se puede realizar utilizando una hoja de cálculo simple (los valores de los datos se presentan en filas y columnas). Esto es bueno dada la naturaleza bidimensional de los datos. En el caso de OLAP, existen diferencias debido a la matriz de datos multidimensional.Debido a que a menudo se obtienen de diferentes fuentes, una hoja de cálculo no siempre puede procesarlos de manera eficiente.
El cubo resuelve este problema y también garantiza que el almacén de datos OLAP funcione de manera lógica y ordenada. La empresa recopila datos de numerosas fuentes y se presenta en varios formatos, como archivos de texto, archivos multimedia, hojas de cálculo Excel, bases de datos de acceso e incluso bases de datos OLTP.
Todos los datos se recopilan en un repositorio lleno directamente de las fuentes. En él, la información en bruto recibida de OLTP y otras fuentes se borrará de cualquier transacción errónea, incompleta e inconsistente.
Después de la limpieza y la conversión, la información se almacenará en una base de datos relacional. Luego se cargará en el servidor OLAP multidimensional (o cubo Olap) para su análisis. Los usuarios finales responsables de las aplicaciones comerciales, la minería de datos y otras operaciones comerciales obtendrán acceso a la información que necesitan del cubo Olap.
Beneficios del modelo de matriz
OLAP es una herramienta que proporciona un rendimiento de consulta rápido, que se logra a través del almacenamiento optimizado, la indexación multidimensional y el almacenamiento en caché, que son ventajas significativas del sistema. Además, las ventajas son:
- Datos más pequeños en el disco.
- Cálculo automatizado de agregados de un mayor nivel de datos.
- Los modelos de matriz proporcionan indexación natural.
- La recuperación eficiente de datos se logra mediante la preestructuración.
- Compacto para conjuntos de datos de baja dimensión.
Las desventajas de OLAP incluyen el hecho de que algunas soluciones (paso de procesamiento) pueden ser bastante largas, especialmente con grandes cantidades de información. Esto generalmente se corrige realizando solo un procesamiento incremental (se estudian los datos que se han modificado).
Operaciones analíticas básicas
Convolución (roll-up / drill-up) también se conoce como "consolidación". La coagulación implica recopilar todos los datos que se pueden obtener y calcularlos en una o más dimensiones. Muy a menudo, esto puede requerir la aplicación de una fórmula matemática. Como ejemplo de OLAP, podemos considerar una red minorista con puntos de venta en diferentes ciudades. Para identificar modelos y anticipar tendencias de ventas futuras, los datos sobre ellos de todos los puntos se "colapsan" en el departamento de ventas principal de la compañía para su consolidación y cálculo.
Revelación (desglose). Esto es lo opuesto a la coagulación. El proceso comienza con un gran conjunto de datos y luego se divide en partes más pequeñas, lo que permite a los usuarios ver detalles. En el ejemplo de la red minorista, el analista analizará los datos de ventas y analizará las marcas o productos individuales que se consideran los más vendidos en cada uno de los puntos de venta en diferentes ciudades.
Seccion (Rebanada y dados). Este es un proceso cuando las operaciones analíticas incluyen dos acciones: derivar un conjunto de datos específico del cubo OLAP ("cortar" el aspecto del análisis) y verlo desde diferentes puntos de vista o ángulos. Esto puede suceder cuando todos los datos de las salidas se reciben e ingresan en el hipercubo. El analista corta el conjunto de datos de ventas de OLAP Cube. Luego se verá al analizar las ventas de unidades individuales en cada región. En este momento, otros usuarios pueden centrarse en evaluar la rentabilidad de las ventas o evaluar la efectividad de una campaña de marketing y publicidad.
Girar (Pivote) Los ejes de datos se giran para proporcionar un reemplazo para la presentación de información.
Variedades de bases de datos.
En principio, este es un cubo OLAP típico que implementa el procesamiento analítico de datos multidimensionales utilizando el Cubo OLAP o cualquier cubo de datos para que el proceso analítico pueda agregar dimensiones según sea necesario. Cualquier información cargada en una base de datos multidimensional se almacenará o archivará y se puede llamar cuando sea necesario.
Tipo OLAP | Valor |
OLAP relacional (ROLAP) | ROLAP es un DBMS avanzado junto con mapeo de datos multidimensionales para realizar operaciones relacionales estándar |
OLAP multidimensional (MOLAP) | MOLAP: implementa el trabajo en datos multidimensionales |
Procesamiento analítico en línea híbrido (HOLAP) | En el enfoque HOLAP, los totales agregados se almacenan en una base de datos multidimensional, y la información detallada se almacena en una base de datos relacional. Esto garantiza tanto la eficiencia del modelo ROLAP como el rendimiento del modelo MOLAP. |
Escritorio OLAP (DOLAP) | En Desktop OLAP, el usuario descarga parte de los datos de la base de datos localmente o en su escritorio y los analiza. DOLAP es relativamente más económico de implementar porque ofrece muy poca funcionalidad en comparación con otros sistemas OLAP |
Web OLAP (WOLAP) | Web OLAP es un sistema OLAP accesible a través de un navegador web. WOLAP es una arquitectura de tres niveles. Consta de tres componentes: cliente, middleware y servidor de bases de datos. |
OLAP móvil | Mobile OLAP ayuda a los usuarios a recibir y analizar datos OLAP utilizando sus dispositivos móviles |
OLAP espacial | SOLAP se creó para facilitar la gestión de datos espaciales y no espaciales en un sistema de información geográfica (SIG) |
Existen sistemas o tecnologías OLAP menos conocidos, pero estos son los principales que utilizan actualmente las grandes corporaciones, las estructuras comerciales e incluso el gobierno.
Herramientas OLAP
Las herramientas para el procesamiento analítico en línea están muy bien presentadas en Internet en forma de versiones pagas y gratuitas.
El más popular de ellos:
- Dundas BI de Dundas Data Visualization es una plataforma basada en navegador para inteligencia empresarial y visualización de datos, que incluye paneles integrados, herramientas de informes OLAP y análisis de datos.
- Yellowfin es una plataforma de inteligencia empresarial, que es una solución integrada única diseñada para empresas de diversas industrias y tamaños. Este sistema está configurado para empresas en el campo de la contabilidad, publicidad, agricultura.
- ClicData es una solución de inteligencia empresarial (BI) diseñada principalmente para su uso por pequeñas y medianas empresas. La herramienta permite a los usuarios finales crear informes y paneles. Board fue creado para combinar inteligencia empresarial, gestión del desempeño corporativo y es un sistema totalmente funcional que sirve a empresas de nivel medio y corporativas.
- Domo es un paquete de gestión empresarial basado en la nube que se integra con múltiples fuentes de datos, incluidas hojas de cálculo, bases de datos, redes sociales y cualquier solución de software local o en la nube existente.
- InetSoft Style Intelligence es una plataforma de software de inteligencia empresarial que permite a los usuarios crear paneles, tecnología de análisis OLAP visual e informes utilizando el mecanismo mashup.
- Birst de Infor Company es una solución en red para analistas y análisis de negocios, que combina las ideas de varios equipos y ayuda a tomar decisiones informadas. La herramienta permite a los usuarios descentralizados aumentar el modelo de los equipos corporativos.
- Halo es un sistema integral de gestión de la cadena de suministro e inteligencia empresarial que ayuda en la planificación empresarial y la previsión de inventario para la gestión de la cadena de suministro. El sistema utiliza datos de todas las fuentes: grandes, pequeños e intermedios.
- Chartio es una solución de inteligencia empresarial basada en la nube que proporciona a los fundadores, grupos empresariales, analistas de datos y grupos de productos herramientas organizativas para el trabajo diario.
- Exago BI es una solución basada en web diseñada para su implementación en aplicaciones web. La implementación de Exago BI permite a las empresas de todos los tamaños proporcionar a sus clientes informes especiales, oportunos e interactivos.
Impacto comercial
El usuario encontrará OLAP en la mayoría de las aplicaciones comerciales en todas las industrias.El análisis es utilizado no solo por empresas, sino también por otras partes interesadas.
Algunas de sus aplicaciones más comunes incluyen:
- Análisis de datos OLAP de marketing.
- Estados financieros que cubren ventas y gastos, presupuestos y planificación financiera.
- Gestión de procesos de negocio.
- Análisis de ventas.
- Marketing de bases de datos.
Las industrias continúan creciendo, lo que significa que los usuarios pronto verán más aplicaciones OLAP. El procesamiento a medida multidimensional proporciona un análisis más dinámico. Es por esta razón que estos sistemas y tecnologías OLAP se utilizan para evaluar escenarios hipotéticos y escenarios empresariales alternativos.