Diferencia entre revisiones de «Tabla de dimensión»
| Línea 1: | Línea 1: | ||
| − | + | <div align="justify"> | |
| − | {{ | + | {{Ficha Software |
| − | |||
|nombre=Tabla de dimensiones | |nombre=Tabla de dimensiones | ||
| − | + | |familia= | |
| − | |imagen= | + | |imagen=Tabla_de_dimensión.gif |
| − | + | |tamaño= | |
| − | | | + | |descripción=Tablas de doble entrada |
| − | + | |imagen2= | |
| − | | | + | |tamaño2= |
| − | + | |descripción2= | |
| − | }} | + | |creador= |
| + | |desarrollador= | ||
| + | |diseñador= | ||
| + | |modelo de desarrollo= | ||
| + | |fecha de creación= | ||
| + | |lanzamiento inicial= | ||
| + | |versiones= | ||
| + | |última versión estable= | ||
| + | |núcleo= | ||
| + | |tipo de núcleo= | ||
| + | |plataformas soportadas= | ||
| + | |género= | ||
| + | |sistemas operativos= | ||
| + | |idioma= | ||
| + | |licencia= | ||
| + | |premios= | ||
| + | |web= | ||
| + | }}'''Tabla de dimensiones.''' En el modelo de [[Almacén de Datos|almacen de datos]] multidimensional, representa cada una de las posibles clasificaciones que se pueden aplicar a filas o columnas. Estas son tablas de doble entrada. A los datos almacenados de esta manera se les suele llamar cubos. Las tablas de dimensiones definen como están los datos organizados lógicamente y proveen el medio para analizar el contexto del negocio. Representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. | ||
| + | |||
| + | == Bases de datos multidimensionales == | ||
| − | + | Las [[Base de datos multidimensional|bases de datos multidimensionales]] contituyen la forma de almacenamiento de los Datawerehouse facilitando una forma flexible de acceso a los datos almacenados, los cuales se van a localizar en diferentes dimensiones, visualizandose como un [[cubo multidimensional]], en donde las variables asociadas existen a lo largo de varios ejes o dimensiones, y la intersección de las mismas representa la medida, indicador o el hecho que se esta evaluando. | |
| − | |||
| − | |||
| − | |||
| − | |||
Las bases de datos multidimensionales implican tres variantes posibles de modelamiento, que permiten realizar consultas de soporte de decisión: | Las bases de datos multidimensionales implican tres variantes posibles de modelamiento, que permiten realizar consultas de soporte de decisión: | ||
| − | Esquema en estrella. | + | *Esquema en estrella. |
| − | Esquema copo de nieve. | + | *Esquema copo de nieve. |
| − | Esquema constelación. | + | *Esquema constelación. |
==Dimensiones== | ==Dimensiones== | ||
| − | Representan los ejes del cubo que bien puede ser de solo tres dimensiones o tener cualquier número de dimensiones y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la [[tabla de hechos]]. Las dimensiones que no aparecen en filas o columnas en una tabla se suelen llamar paginadas, y permiten determinar los datos que aparecerán en la tabla, eligiendo uno de sus miembros | + | Representan los ejes del cubo que bien puede ser de solo tres dimensiones o tener cualquier número de dimensiones y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la [[tabla de hechos]]. Las dimensiones que no aparecen en filas o columnas en una tabla se suelen llamar paginadas, y permiten determinar los datos que aparecerán en la tabla, eligiendo uno de sus miembros. |
| − | Las dimensiones pueden estar organizadas en jerarquías de modo que se pueden ver los datos a diferentes niveles | + | Las dimensiones pueden estar organizadas en jerarquías de modo que se pueden ver los datos a diferentes niveles. |
| − | Los datos dentro de cada una de estas tablas | + | Los datos dentro de cada una de estas tablas ofrecen información de cada uno de los elementos del negocio describiendo cada una de sus características que a su vez representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. |
==Estructura== | ==Estructura== | ||
Cada tabla posee un identificador único y al menos un atributo que describe los criterios de análisis relevantes de la organización, estos son por lo general de tipo texto. Usualmente la cantidad de tablas de dimensiones, aplicadas a un tema de interés en particular, varían entre tres y quince. | Cada tabla posee un identificador único y al menos un atributo que describe los criterios de análisis relevantes de la organización, estos son por lo general de tipo texto. Usualmente la cantidad de tablas de dimensiones, aplicadas a un tema de interés en particular, varían entre tres y quince. | ||
| − | Así mismo, dentro de estas tablas pueden existir jerarquías de datos, además, de acuerdo a las dimensiones del negocio, estará dada la [[granularidad]] que adoptará el modelo. Los datos dentro de estas tablas, que proveen información del negocio o que describen alguna de sus características, son llamados datos de referencia. Entonces, se puede afirmar que una tabla de dimensión posee una [[clave primaria]] y uno o más datos de referencia. | + | Así mismo, dentro de estas tablas pueden existir jerarquías de datos, además, de acuerdo a las dimensiones del negocio, estará dada la [[Granularidad|granularidad]] que adoptará el modelo. Los datos dentro de estas tablas, que proveen información del negocio o que describen alguna de sus características, son llamados datos de referencia. Entonces, se puede afirmar que una tabla de dimensión posee una [[Clave primaria|clave primaria]] y uno o más datos de referencia. |
El depósito de datos se organiza en torno a una base de datos multidimensional , que tal y como lo indica su nombre se almacenan los datos en diversas dimensiones, que conforman un cubo multidimensional , en donde el cruce de los valores de los atributos de cada dimensión a lo largo de las [[abscisas]], determinan un hecho específico. | El depósito de datos se organiza en torno a una base de datos multidimensional , que tal y como lo indica su nombre se almacenan los datos en diversas dimensiones, que conforman un cubo multidimensional , en donde el cruce de los valores de los atributos de cada dimensión a lo largo de las [[abscisas]], determinan un hecho específico. | ||
==Dimensión tiempo== | ==Dimensión tiempo== | ||
| − | En un DW, la dimensión Tiempo es obligatoria, y la definición de granularidad y jerarquía de la misma depende de la dinámica del negocio que se este analizando, toda la información dentro de la bodega, como ya se ha explicado, posee su propio sello de tiempo que determina la ocurrencia y ubicación con elementos en iguales condiciones,representando de esta manera diferentes versiones de una misma situación | + | En un [[Data Warehouse|DW]], la dimensión Tiempo es obligatoria, y la definición de granularidad y jerarquía de la misma depende de la dinámica del negocio que se este analizando, toda la información dentro de la bodega, como ya se ha explicado, posee su propio sello de tiempo que determina la ocurrencia y ubicación con elementos en iguales condiciones,representando de esta manera diferentes versiones de una misma situación. |
| − | |||
| − | |||
| − | Si bien, el lenguaje SQL ofrece funciones del tipo DATE, en la dimensión Tiempo, se modelan y presentan atributos temporales que no pueden calcularse en SQL, lo cual le añade una ventaja más. | + | Si bien, el [[Lenguaje SQL|lenguaje SQL]] ofrece funciones del tipo DATE, en la dimensión Tiempo, se modelan y presentan atributos temporales que no pueden calcularse en SQL, lo cual le añade una ventaja más. |
==Jerarquías== | ==Jerarquías== | ||
| Línea 50: | Línea 62: | ||
*Pueden existir varias en una misma dimensión. | *Pueden existir varias en una misma dimensión. | ||
*Están compuestas por dos o más niveles. | *Están compuestas por dos o más niveles. | ||
| − | *Se tiene una relación | + | *Se tiene una relación "1-n" entre atributos consecutivos de un nivel superior y uno inferior. |
La principal ventaja de manejar jerarquías, reside en poder analizar los datos desde su nivel más general al más detallado y viceversa. | La principal ventaja de manejar jerarquías, reside en poder analizar los datos desde su nivel más general al más detallado y viceversa. | ||
| Línea 60: | Línea 72: | ||
Las tablas de dimensiones conforman el DW con la tabla de hechos que se ubica por lo general en el centro del modelo de datos rodeada de las tablas de dimensiones conectadas a las mismas mediante sus claves primarias. Independientemente de cual sea el almacenamiento elegido para los datos multidimensionales, debe existir un servidor que permita acceder a ellos para visualizar las tablas, según vaya requiriéndolas la aplicación cliente. A este tipo de servidor se le llama [[servidor OLAP]]. | Las tablas de dimensiones conforman el DW con la tabla de hechos que se ubica por lo general en el centro del modelo de datos rodeada de las tablas de dimensiones conectadas a las mismas mediante sus claves primarias. Independientemente de cual sea el almacenamiento elegido para los datos multidimensionales, debe existir un servidor que permita acceder a ellos para visualizar las tablas, según vaya requiriéndolas la aplicación cliente. A este tipo de servidor se le llama [[servidor OLAP]]. | ||
| − | ==Enlaces | + | ==Enlaces relacionados== |
* [[Inteligencia de Negocios]] | * [[Inteligencia de Negocios]] | ||
| − | |||
| − | |||
| − | |||
==Fuentes== | ==Fuentes== | ||
* Kimball, Ralph. Surrogate Keys. Columna: Data Warehouse Architect. Revista DBMS Magazine. 11(5):1998 | * Kimball, Ralph. Surrogate Keys. Columna: Data Warehouse Architect. Revista DBMS Magazine. 11(5):1998 | ||
* Kimball, Ralph : The Data Warehouse toolkit: Practical techniques for building Dimensional Data Warehouses. John Wiley & Sons, Inc, [[1996]]. | * Kimball, Ralph : The Data Warehouse toolkit: Practical techniques for building Dimensional Data Warehouses. John Wiley & Sons, Inc, [[1996]]. | ||
| − | * http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/hefesto-metodologia-propia-para-la-construccion-un-data-wareh | + | * http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/hefesto-metodologia-propia-para-la-construccion-un-data-wareh |
[[Category: Informática]] | [[Category: Informática]] | ||
Revisión del 12:49 2 may 2012
| ||||
Sumario
Bases de datos multidimensionales
Las bases de datos multidimensionales contituyen la forma de almacenamiento de los Datawerehouse facilitando una forma flexible de acceso a los datos almacenados, los cuales se van a localizar en diferentes dimensiones, visualizandose como un cubo multidimensional, en donde las variables asociadas existen a lo largo de varios ejes o dimensiones, y la intersección de las mismas representa la medida, indicador o el hecho que se esta evaluando.
Las bases de datos multidimensionales implican tres variantes posibles de modelamiento, que permiten realizar consultas de soporte de decisión:
- Esquema en estrella.
- Esquema copo de nieve.
- Esquema constelación.
Dimensiones
Representan los ejes del cubo que bien puede ser de solo tres dimensiones o tener cualquier número de dimensiones y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos. Las dimensiones que no aparecen en filas o columnas en una tabla se suelen llamar paginadas, y permiten determinar los datos que aparecerán en la tabla, eligiendo uno de sus miembros.
Las dimensiones pueden estar organizadas en jerarquías de modo que se pueden ver los datos a diferentes niveles.
Los datos dentro de cada una de estas tablas ofrecen información de cada uno de los elementos del negocio describiendo cada una de sus características que a su vez representan los ejes del cubo, y los aspectos de interés, mediante los cuales el usuario podrá filtrar y manipular la información almacenada en la tabla de hechos.
Estructura
Cada tabla posee un identificador único y al menos un atributo que describe los criterios de análisis relevantes de la organización, estos son por lo general de tipo texto. Usualmente la cantidad de tablas de dimensiones, aplicadas a un tema de interés en particular, varían entre tres y quince.
Así mismo, dentro de estas tablas pueden existir jerarquías de datos, además, de acuerdo a las dimensiones del negocio, estará dada la granularidad que adoptará el modelo. Los datos dentro de estas tablas, que proveen información del negocio o que describen alguna de sus características, son llamados datos de referencia. Entonces, se puede afirmar que una tabla de dimensión posee una clave primaria y uno o más datos de referencia.
El depósito de datos se organiza en torno a una base de datos multidimensional , que tal y como lo indica su nombre se almacenan los datos en diversas dimensiones, que conforman un cubo multidimensional , en donde el cruce de los valores de los atributos de cada dimensión a lo largo de las abscisas, determinan un hecho específico.
Dimensión tiempo
En un DW, la dimensión Tiempo es obligatoria, y la definición de granularidad y jerarquía de la misma depende de la dinámica del negocio que se este analizando, toda la información dentro de la bodega, como ya se ha explicado, posee su propio sello de tiempo que determina la ocurrencia y ubicación con elementos en iguales condiciones,representando de esta manera diferentes versiones de una misma situación.
Si bien, el lenguaje SQL ofrece funciones del tipo DATE, en la dimensión Tiempo, se modelan y presentan atributos temporales que no pueden calcularse en SQL, lo cual le añade una ventaja más.
Jerarquías
Una jerarquía representa una relación lógica entre dos o más atributos dentro de una misma dimensión.Una relación representa la forma en que dos atributos interactúan dentro de una jerarquía.
Las jerarquías poseen las siguientes características:
- Pueden existir varias en una misma dimensión.
- Están compuestas por dos o más niveles.
- Se tiene una relación "1-n" entre atributos consecutivos de un nivel superior y uno inferior.
La principal ventaja de manejar jerarquías, reside en poder analizar los datos desde su nivel más general al más detallado y viceversa.
Existen básicamente dos tipos de relaciones:
- Explícitas: son las más comunes y se pueden modelar a partir de atributos directos y están en línea continua de una jerarquía, por ejemplo, la figura anterior posee este tipo de relación, en donde un país posee una o más provincias y una provincia pertenece solo a un país.
- Implícitas: son las que ocurren en la vida real, pero su relación no es de vista directa, por ejemplo, un país tiene uno o más ríos, pero un río pertenece a uno o más países.
Las tablas de dimensiones conforman el DW con la tabla de hechos que se ubica por lo general en el centro del modelo de datos rodeada de las tablas de dimensiones conectadas a las mismas mediante sus claves primarias. Independientemente de cual sea el almacenamiento elegido para los datos multidimensionales, debe existir un servidor que permita acceder a ellos para visualizar las tablas, según vaya requiriéndolas la aplicación cliente. A este tipo de servidor se le llama servidor OLAP.
Enlaces relacionados
Fuentes
- Kimball, Ralph. Surrogate Keys. Columna: Data Warehouse Architect. Revista DBMS Magazine. 11(5):1998
- Kimball, Ralph : The Data Warehouse toolkit: Practical techniques for building Dimensional Data Warehouses. John Wiley & Sons, Inc, 1996.
- http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/hefesto-metodologia-propia-para-la-construccion-un-data-wareh