¿Qué es OLAP? Cubo, Operaciones y amp; Tipos en almacén de datos

Tabla de contenido:

Anonim

¿Qué es OLAP?

El procesamiento analítico en línea (OLAP) es una categoría de software que permite a los usuarios analizar información de múltiples sistemas de bases de datos al mismo tiempo. Es una tecnología que permite a los analistas extraer y ver datos comerciales desde diferentes puntos de vista.

Los analistas con frecuencia necesitan agrupar, agregar y unir datos. Estas operaciones en bases de datos relacionales requieren muchos recursos. Con OLAP, los datos se pueden calcular y agregar previamente, lo que agiliza el análisis.

Las bases de datos OLAP se dividen en uno o más cubos. Los cubos están diseñados de tal manera que la creación y visualización de informes resulten fáciles. OLAP significa procesamiento analítico en línea.

En este tutorial, aprenderá:

  • Cubo OLAP
  • Operaciones analíticas básicas de OLAP
  • Tipos de sistemas OLAP
  • ROLAP
  • MOLAP
  • OLAP híbrido
  • Ventajas de OLAP
  • Desventajas de OLAP

Cubo OLAP:

En el núcleo del concepto OLAP, se encuentra un cubo OLAP. El cubo OLAP es una estructura de datos optimizada para un análisis de datos muy rápido.

El Cubo OLAP consta de hechos numéricos llamados medidas que se clasifican por dimensiones. El Cubo OLAP también se llama hipercubo .

Por lo general, las operaciones y el análisis de datos se realizan utilizando una hoja de cálculo simple, donde los valores de los datos se organizan en formato de fila y columna. Esto es ideal para datos bidimensionales. Sin embargo, OLAP contiene datos multidimensionales, con datos que generalmente se obtienen de una fuente diferente y no relacionada. Usar una hoja de cálculo no es una opción óptima. El cubo puede almacenar y analizar datos multidimensionales de manera lógica y ordenada.

¿Como funciona?

Un almacén de datos extraería información de múltiples fuentes y formatos de datos, como archivos de texto, hojas de Excel, archivos multimedia, etc.

Los datos extraídos se limpian y transforman. Los datos se cargan en un servidor OLAP (o cubo OLAP) donde la información se calcula previamente para su posterior análisis.

Operaciones analíticas básicas de OLAP

Cuatro tipos de operaciones analíticas en OLAP son:

  1. Enrollar
  2. Profundizar
  3. Parte y pica
  4. Pivote (rotar)

1) Roll-up:

El roll-up también se conoce como "consolidación" o "agregación". La operación Roll-up se puede realizar de 2 formas

  1. Reducir dimensiones
  2. Subiendo la jerarquía de conceptos. La jerarquía de conceptos es un sistema de agrupación de cosas según su orden o nivel.

Considere el siguiente diagrama

  • En este ejemplo, las ciudades New jersey y Lost Angles y se acumulan en el país EE. UU.
  • Las cifras de ventas de Nueva Jersey y Los Ángeles son 440 y 1560 respectivamente. Se convierten en 2000 después del roll-up.
  • En este proceso de agregación, la jerarquía de la ubicación de los datos asciende de la ciudad al país.
  • En el proceso de enrollado, es necesario eliminar al menos una o más dimensiones. En este ejemplo, se elimina la dimensión Quater.

2) Desglose

En el desglose, los datos se fragmentan en partes más pequeñas. Es lo opuesto al proceso de acumulación. Se puede hacer a través de

  • Descendiendo en la jerarquía de conceptos
  • Incrementando una dimensión

Considere el diagrama de arriba

  • El trimestre Q1 se desglosa en los meses de enero, febrero y marzo. Las ventas correspondientes también son registros.
  • En este ejemplo, se agregan los meses de dimensión.

3) Rebanada:

Aquí, se selecciona una dimensión y se crea un nuevo subcubo.

El siguiente diagrama explica cómo se realizó la operación de corte:

  • El tiempo de dimensión se divide con Q1 como filtro.
  • Se crea un nuevo cubo por completo.

Dado:

Esta operación es similar a una rebanada. La diferencia en los dados es que seleccionas 2 o más dimensiones que dan como resultado la creación de un subcubo.

4) Pivote

En Pivot, rota los ejes de datos para proporcionar una presentación de datos sustituta.

En el siguiente ejemplo, el pivote se basa en tipos de elementos.

Tipos de sistemas OLAP

Estructura jerárquica OLAP

Tipo de OLAP Explicación
OLAP relacional (ROLAP): ROLAP es un RDBMS extendido junto con mapeo de datos multidimensionales para realizar la operación relacional estándar.
OLAP multidimensional (MOLAP) MOLAP Implementa operación en datos multidimensionales.
Procesamiento analítico en línea híbrido (HOLAP) En el enfoque HOLAP, los totales agregados se almacenan en una base de datos multidimensional, mientras que los datos detallados se almacenan en la base de datos relacional. Esto ofrece tanto la eficiencia de datos del modelo ROLAP como el rendimiento del modelo MOLAP.
Escritorio OLAP (DOLAP) En Desktop OLAP, un usuario descarga una parte de los datos de la base de datos localmente o en su escritorio y los analiza. DOLAP es relativamente más económico de implementar ya que ofrece muy pocas funcionalidades en comparación con otros sistemas OLAP.
Web OLAP (WOLAP) Web OLAP, que es un sistema OLAP accesible a través del navegador web. WOLAP es una arquitectura de tres niveles. Consta de tres componentes: cliente, middleware y servidor de base de datos.
OLAP móvil: OLAP móvil ayuda a los usuarios a acceder y analizar datos OLAP utilizando sus dispositivos móviles
OLAP espacial: SOLAP se crea para facilitar la gestión de datos espaciales y no espaciales en un sistema de información geográfica (SIG)

ROLAP

ROLAP trabaja con datos que existen en una base de datos relacional. Las tablas de hechos y dimensiones se almacenan como tablas relacionales. También permite el análisis multidimensional de datos y es el OLAP de más rápido crecimiento.

Ventajas del modelo ROLAP:

  • Alta eficiencia de datos. Ofrece una alta eficiencia de datos porque el rendimiento de las consultas y el lenguaje de acceso están optimizados particularmente para el análisis de datos multidimensionales.
  • Escalabilidad. Este tipo de sistema OLAP ofrece escalabilidad para administrar grandes volúmenes de datos, e incluso cuando los datos aumentan constantemente.

Inconvenientes del modelo ROLAP:

  • Demanda de mayores recursos: ROLAP necesita una alta utilización de recursos humanos, software y hardware.
  • Limitaciones de datos agregadas. Las herramientas ROLAP utilizan SQL para todos los cálculos de datos agregados. Sin embargo, no hay límites establecidos para el manejo de cálculos.
  • Rendimiento de consulta lento. El rendimiento de las consultas en este modelo es lento en comparación con MOLAP

MOLAP

MOLAP utiliza motores de almacenamiento multidimensionales basados ​​en matrices para mostrar vistas multidimensionales de datos. Básicamente, usan un cubo OLAP.

Obtenga más información sobre OLAP aquí

OLAP híbrido

OLAP híbrido es una mezcla de ROLAP y MOLAP. Ofrece un cálculo rápido de MOLAP y una mayor escalabilidad de ROLAP. HOLAP utiliza dos bases de datos.

  1. Los datos agregados o calculados se almacenan en un cubo OLAP multidimensional
  2. La información detallada se almacena en una base de datos relacional.

Beneficios de OLAP híbrido:

  • Este tipo de OLAP ayuda a economizar el espacio en disco y también permanece compacto, lo que ayuda a evitar problemas relacionados con la velocidad y la conveniencia del acceso.
  • HOLAP híbrido utiliza tecnología de cubo que permite un rendimiento más rápido para todo tipo de datos.
  • ROLAP se actualiza instantáneamente y los usuarios de HOLAP tienen acceso a estos datos actualizados instantáneamente en tiempo real. MOLAP aporta limpieza y conversión de datos, mejorando así la relevancia de los datos. Esto trae lo mejor de ambos mundos.

Inconvenientes de OLAP híbrido:

  • Mayor nivel de complejidad : el principal inconveniente de los sistemas HOLAP es que admite herramientas y aplicaciones ROLAP y MOLAP. Por tanto, es muy complicado.
  • Posibles superposiciones : hay mayores posibilidades de superposición, especialmente en sus funcionalidades.

Ventajas de OLAP

  • OLAP es una plataforma para todo tipo de negocios que incluye planificación, elaboración de presupuestos, informes y análisis.
  • La información y los cálculos son consistentes en un cubo OLAP. Este es un beneficio crucial.
  • Cree y analice rápidamente situaciones hipotéticas
  • Busque fácilmente términos generales o específicos en la base de datos OLAP.
  • OLAP proporciona los componentes básicos para las herramientas de modelado empresarial, herramientas de minería de datos y herramientas de informes de rendimiento.
  • Permite a los usuarios cortar y cortar datos de cubos, todo en varias dimensiones, medidas y filtros.
  • Es bueno para analizar series de tiempo.
  • Encontrar algunos clústeres y valores atípicos es fácil con OLAP.
  • Es un poderoso sistema de proceso analítico de visualización en línea que proporciona tiempos de respuesta más rápidos.

Desventajas de OLAP

  • OLAP requiere organizar los datos en un esquema de estrella o copo de nieve. Estos esquemas son complicados de implementar y administrar.
  • No puede tener una gran cantidad de dimensiones en un solo cubo OLAP
  • No se puede acceder a los datos transaccionales con el sistema OLAP.
  • Cualquier modificación en un cubo OLAP necesita una actualización completa del cubo. Este es un proceso que requiere mucho tiempo

Resumen:

  • OLAP es una tecnología que permite a los analistas extraer y ver datos comerciales desde diferentes puntos de vista.
  • En el núcleo del concepto OLAP, se encuentra un cubo OLAP.
  • Varias aplicaciones comerciales y otras operaciones de datos requieren el uso de OLAP Cube.
  • Hay cinco tipos principales de operaciones analíticas en OLAP 1) Roll-up 2) Drill-down 3) Slice 4) Dice y 5) Pivot
  • Tres tipos de sistemas OLAP ampliamente utilizados son MOLAP, ROLAP y OLAP híbrido.
  • Desktop OLAP, Web OLAP y Mobile OLAP son algunos otros tipos de sistemas OLAP.