¿Qué es el esquema multidimensional?
El esquema multidimensional está especialmente diseñado para modelar sistemas de almacenamiento de datos. Los esquemas están diseñados para abordar las necesidades únicas de bases de datos muy grandes diseñadas con fines analíticos (OLAP).
Tipos de esquema de almacenamiento de datos:
A continuación se muestran 3 tipos principales de esquemas multidimensionales, cada uno con sus ventajas únicas.
- Esquema de estrella
- Esquema de copo de nieve
- Esquema de galaxia
En este tutorial, aprenderá más sobre-
- ¿Qué es un esquema en estrella?
- ¿Qué es un esquema de copo de nieve?
- Esquema de estrella Vs esquema de copo de nieve: diferencias clave
- ¿Qué es un esquema de Galaxy?
- ¿Qué es el esquema del cúmulo estelar?
¿Qué es un esquema en estrella?
Esquema de estrella en el almacén de datos, en el que el centro de la estrella puede tener una tabla de hechos y varias tablas de dimensiones asociadas. Se le conoce como esquema de estrella porque su estructura se asemeja a una estrella. El modelo de datos de esquema en estrella es el tipo más simple de esquema de almacenamiento de datos. También se conoce como esquema de unión en estrella y está optimizado para consultar grandes conjuntos de datos.
En el siguiente ejemplo de esquema en estrella, la tabla de hechos está en el centro y contiene claves para cada tabla de dimensiones como Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID y otros atributos como Unidades vendidas e ingresos.
Características del esquema de estrella:
- Cada dimensión en un esquema en estrella se representa con la única tabla de una dimensión.
- La tabla de dimensiones debe contener el conjunto de atributos.
- La tabla de dimensiones se une a la tabla de hechos mediante una clave externa
- Las tablas de dimensiones no están unidas entre sí.
- La tabla de hechos contendría la clave y la medida
- El esquema de Star es fácil de entender y proporciona un uso óptimo del disco.
- Las tablas de dimensiones no están normalizadas. Por ejemplo, en la figura anterior, Country_ID no tiene una tabla de búsqueda de países como la tendría un diseño OLTP.
- El esquema es ampliamente compatible con las herramientas de BI
¿Qué es un esquema de copo de nieve?
El esquema de copo de nieve en el almacén de datos es una disposición lógica de tablas en una base de datos multidimensional de manera que el diagrama ER se asemeja a la forma de un copo de nieve. Un esquema de copo de nieve es una extensión de un esquema de estrella y agrega dimensiones adicionales. Las tablas de dimensiones están normalizadas, lo que divide los datos en tablas adicionales.
En el siguiente ejemplo de esquema de copo de nieve, Country se normaliza aún más en una tabla individual.
Características del esquema de copo de nieve:
- El principal beneficio del esquema de copo de nieve es que utiliza un espacio de disco más pequeño.
- Se agrega una dimensión al esquema más fácil de implementar
- Debido a las múltiples tablas, el rendimiento de las consultas se reduce
- El principal desafío al que se enfrentará al usar el esquema de copo de nieve es que debe realizar más esfuerzos de mantenimiento debido a la mayor cantidad de tablas de búsqueda.
Esquema de estrella Vs esquema de copo de nieve: diferencias clave
A continuación se muestra una diferencia clave entre el esquema de estrella y el esquema de copo de nieve:
Esquema de estrella | Esquema de copo de nieve |
---|---|
Las jerarquías de las dimensiones se almacenan en la tabla de dimensiones. | Las jerarquías se dividen en tablas independientes. |
Contiene una tabla de hechos rodeada de tablas de dimensiones. | Una tabla de hechos rodeada por una tabla de dimensiones que a su vez está rodeada por una tabla de dimensiones |
En un esquema en estrella, solo una combinación única crea la relación entre la tabla de hechos y las tablas de dimensiones. | Un esquema de copo de nieve requiere muchas combinaciones para obtener los datos. |
Diseño DB simple. | Diseño de base de datos muy complejo. |
La estructura de datos desnormalizados y la consulta también se ejecutan más rápido. | Estructura de datos normalizada. |
Alto nivel de redundancia de datos | Redundancia de datos de muy bajo nivel |
La tabla de dimensión única contiene datos agregados. | Datos divididos en diferentes tablas de dimensiones. |
El procesamiento de cubos es más rápido. | El procesamiento de cubos puede ser lento debido a la combinación compleja. |
Ofrece consultas de mayor rendimiento mediante la optimización de consultas de unión en estrella. Las tablas se pueden conectar con múltiples dimensiones. | El esquema de Snowflake está representado por una tabla de hechos centralizada que probablemente no esté conectada con múltiples dimensiones. |
¿Qué es un esquema de galaxia?
Un Galaxy Schema contiene dos tablas de hechos que comparten tablas de dimensiones entre ellas. También se llama esquema de constelación de hechos. El esquema se ve como una colección de estrellas, de ahí el nombre Galaxy Schema.
Como puede ver en el ejemplo anterior, hay dos tablas de hechos
- Ingresos
- Producto.
En el esquema de Galaxy, las dimensiones compartidas se denominan dimensiones conformadas.
Características de Galaxy Schema:
- Las dimensiones de este esquema se separan en dimensiones independientes según los distintos niveles de jerarquía.
- Por ejemplo, si la geografía tiene cuatro niveles de jerarquía como región, país, estado y ciudad, el esquema de Galaxy debería tener cuatro dimensiones.
- Además, es posible construir este tipo de esquema dividiendo el esquema de una estrella en más esquemas de estrella.
- Las dimensiones son grandes en este esquema que se necesita para construir en función de los niveles de jerarquía.
- Este esquema es útil para agregar tablas de hechos para una mejor comprensión.
¿Qué es el esquema del cúmulo estelar?
El esquema de copo de nieve contiene jerarquías completamente expandidas. Sin embargo, esto puede agregar complejidad al esquema y requiere combinaciones adicionales. Por otro lado, el esquema en estrella contiene jerarquías completamente colapsadas, lo que puede conducir a la redundancia. Por lo tanto, la mejor solución puede ser un equilibrio entre estos dos esquemas, que es el diseño del esquema del cúmulo estelar.
Las dimensiones superpuestas se pueden encontrar como bifurcaciones en las jerarquías. Una bifurcación ocurre cuando una entidad actúa como padre en dos jerarquías dimensionales diferentes. Las entidades de bifurcación luego se identificaron como clasificación con relaciones de uno a muchos.
Resumen:
- El esquema multidimensional está especialmente diseñado para modelar sistemas de almacenamiento de datos.
- El esquema en estrella es el tipo más simple de esquema de almacenamiento de datos. Se le conoce como esquema de estrella porque su estructura se asemeja a una estrella.
- Un esquema de copo de nieve es una extensión de un esquema de estrella y agrega dimensiones adicionales. Se llama copo de nieve porque su diagrama se parece a un copo de nieve.
- En un esquema en estrella, solo una combinación única define la relación entre la tabla de hechos y las tablas de dimensiones.
- El esquema en estrella contiene una tabla de hechos rodeada de tablas de dimensiones.
- El esquema de copo de nieve está rodeado por una tabla de dimensiones que a su vez está rodeada por una tabla de dimensiones
- Un esquema de copo de nieve requiere muchas combinaciones para obtener los datos.
- Un Galaxy Schema contiene dos tablas de hechos que comparten tablas de dimensiones. También se llama esquema de constelación de hechos.
- El esquema de cúmulo de estrellas contiene atributos del esquema de estrella y copo de nieve.