Tabla de dimensión

Tabla de dimensiones
Información sobre la plantilla
Tabla de dimensión.gif
Tablas de doble entrada

Tabla de dimensiones. En el modelo de almacen de datos multidimensional, se representan cada una de las posibles clasificaciones que se pueden aplicar a filas o columnas. Estas son tablas de doble entrada. A los datos almacenados de esta manera se les suele llamar cubos. Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.

Bases de datos multidimensionales

Las bases de datos multidimensionales constituyen la forma de almacenamiento de los Datawerehouse porque facilitan una forma flexible de acceso a los datos almacenados, los cuales se van a localizar en diferentes dimensiones, y se visualizan como un cubo multidimensional, en donde las variables asociadas existen a lo largo de varios ejes o dimensiones, y la intersección de las mismas representa la medida, indicador o el hecho que se está evaluando.

Las bases de datos multidimensionales implican tres variantes posibles de modelamiento, que permiten realizar consultas de soporte de decisión:

  • Esquema en estrella.
  • Esquema copo de nieve.
  • Esquema constelación.

Dimensiones

Representan los ejes del cubo que bien puede ser de solo tres dimensiones o tener cualquier número de dimensiones y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. Las dimensiones que no aparecen en filas o columnas en una tabla se suelen llamar paginadas, y permiten determinar los datos que aparecerán en la tabla, eligiendo uno de sus miembros.

Las dimensiones pueden estar organizadas en jerarquías de modo que se pueden ver los datos a diferentes niveles.

Los datos dentro de cada una de estas tablas ofrecen información de cada uno de los elementos del negocio y describen cada una de sus características que a su vez representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.

Estructura

Cada tabla posee un identificador único y al menos un atributo que describe los criterios de análisis relevantes de la organización, estos son por lo general de tipo texto. Usualmente la cantidad de tablas de dimensiones aplicadas a un tema de interés en particular, varían entre tres y quince.

Así mismo, dentro de estas tablas pueden existir jerarquías de datos, además, de acuerdo a las dimensiones del negocio, estará dada la granularidad que adoptará el modelo. Los datos dentro de estas tablas, que proveen información del negocio o que describen alguna de sus características, son llamados datos de referencia. Entonces, se puede afirmar que una tabla de dimensión posee una clave primaria y uno o más datos de referencia.

El depósito de datos se organiza en torno a una base de datos multidimensional , que tal y como lo indica su nombre se almacenan los datos en diversas dimensiones, que conforman un cubo multidimensional , en donde el cruce de los valores de los atributos de cada dimensión a lo largo de las abscisas, determinan un hecho específico.

Dimensión tiempo

En un DW, la dimensión Tiempo es obligatoria, y la definición de granularidad y jerarquía de la misma depende de la dinámica del negocio que se esté analizando, toda la información dentro de la bodega, como ya se ha explicado, posee su propio sello de tiempo que determina la ocurrencia y ubicación con elementos en iguales condiciones,representando de esta manera diferentes versiones de una misma situación.

Si bien, el lenguaje SQL ofrece funciones del tipo DATE, en la dimensión Tiempo, se modelan y presentan atributos temporales que no pueden calcularse en SQL, lo cual le añade una ventaja más.

Jerarquías

Una jerarquía representa una relación lógica entre dos o más atributos dentro de una misma dimensión.Una relación representa la forma en que dos atributos interactúan dentro de una jerarquía.

Las jerarquías poseen las siguientes características:

  • Pueden existir varias en una misma dimensión.
  • Están compuestas por dos o más niveles.
  • Se tiene una relación "1-n" entre atributos consecutivos de un nivel superior y uno inferior.

La principal ventaja de manejar jerarquías, reside en poder analizar los datos desde su nivel más general al más detallado y viceversa.

Existen básicamente dos tipos de relaciones:

  • Explícitas: son las más comunes y se pueden modelar a partir de atributos directos y están en línea continua de una jerarquía, por ejemplo, la figura anterior posee este tipo de relación, en donde un país posee una o más provincias y una provincia pertenece solo a un país.
  • Implícitas: son las que ocurren en la vida real, pero su relación no es de vista directa, por ejemplo, un país tiene uno o más ríos, pero un río pertenece a uno o más países.

Las tablas de dimensiones conforman el DW con la tabla de hechos que se ubica por lo general en el centro del modelo de datos rodeada de las tablas de dimensiones conectadas a las mismas mediante sus claves primarias. Independientemente de cual sea el almacenamiento elegido para los datos multidimensionales, debe existir un servidor que permita acceder a ellos para visualizar las tablas, según vaya requiriéndolas la aplicación cliente. A este tipo de servidor se le llama servidor OLAP.

Enlaces relacionados

Fuentes