Metodología Hefesto

Metodología Hefesto
Información sobre la plantilla
Hefesto fusion html m1f994ad5.jpg
Logotipo de la metodología.
IdiomaEspañol


HEFESTOes una metodología propia, cuya propuesta está fundamentada en una muy amplia investigación, comparación de metodologías existentes, experiencias propias en procesos de confección de almacenes de datos. Cabe destacar que HEFESTO está en continua evolución, y se han tenido en cuenta, como gran valor agregado, todos los feedbacks que han aportado quienes han utilizado esta metodología en diversos países y con diversos fines.

¿Principales características?

La construcción e implementación de un Data Warehouse puede adaptarse muy bien a cualquier ciclo de vida de desarrollo de software, con la salvedad de que para algunas fases en particular, las acciones que se han de realizar serán muy diferentes. Lo que se debe tener muy en cuenta, es no entrar en la utilización de metodologías que requieran fases extensas de reunión de requerimientos y análisis, fases de desarrollo monolítico que conlleve demasiado tiempo y fases de despliegue muy largas. Lo que se busca, es entregar una primera implementación que satisfaga una parte de las necesidades, para demostrar las ventajas del Data Warehouse y motivar a los usuarios. La metodología HEFESTO, puede ser embebida en cualquier ciclo de vida que cumpla con la condición antes declarada, sus principales características son:

  • Los objetivos y resultados esperados en cada fase se distinguen fácilmente y son sencillos de comprender.
  • Se basa en los requerimientos de los usuarios, por lo cual su estructura es capaz de adaptarse con facilidad y rapidez ante los cambios en el negocio.
  • Reduce la resistencia al cambio, ya que involucra a los usuarios finales en cada etapa para que tome decisiones respecto al comportamiento y funciones del Data Warehouse.
  • Utiliza modelos conceptuales y lógicos, los cuales son sencillos de interpretar y analizar.
  • Es independiente del tipo de ciclo de vida que se emplee para contener la metodología.
  • Es independiente de las herramientas que se utilicen para su implementación.
  • Es independiente de las estructuras físicas que contengan el Data Warehouse y de su respectiva distribución.
  • Cuando se culmina con una fase, los resultados obtenidos se convierten en el punto de partida para llevar a cabo el paso siguiente.
  • Se aplica tanto para Data Warehouse como para Data Mart.

Pasos de la metodología Hefesto

La metodología Hefesto propone cuatro pasos fundamentales para su aplicación, cada uno con una serie de puntos que se deben realizar y que se resume en el siguiente gráfico:


Pasos hefesto.jpg


Análisis de Requerimientos

Identificar preguntas

El primer paso comienza con el acopio de las necesidades de información, el cual puede llevarse a cabo a través de muy variadas y diferentes técnicas, cada una de las cuales poseen características inherentes y específicas, como por ejemplo entrevistas, cuestionarios, observaciones, etc.

El análisis de los requerimientos de los diferentes usuarios, es el punto de partida de esta metodología, ya que ellos son los que deben, en cierto modo, guiar la investigación hacia un desarrollo que refleje claramente lo que se espera del depósito de datos, en relación a sus funciones y cualidades.


El objetivo principal de esta fase, es la de obtener e identificar las necesidades de información clave de alto nivel, que es esencial para llevar a cabo las metas y estrategias de la empresa, y que facilitará una eficaz y eficiente toma de decisiones.

Identificar indicadores y perspectivas de análisis

Una vez que se han establecido las preguntas claves, se debe proceder a su descomposición para descubrir los indicadores que se utilizarán y las perspectivas de análisis que intervendrán.

Para ello, se debe tener en cuenta que los indicadores, para que sean realmente efectivos son, en general, valores numéricos y representan lo que se desea analizar concretamente, por ejemplo: saldos, promedios, cantidades, sumatorias, fórmulas, etc. En cambio, las perspectivas se refieren a los objetos mediante los cuales se quiere examinar los indicadores, con el fin de responder a las preguntas planteadas, por ejemplo: clientes, proveedores, sucursales, países, productos, rubros, etc. Cabe destacar, que el Tiempo es muy comúnmente una perspectiva.

Modelo Conceptual

En esta etapa, se construirá un modelo conceptua a partir de los indicadores y perspectivas obtenidas en el paso anterior.

A través de este modelo, se podrá observar con claridad cuales son los alcances del proyecto, para luego poder trabajar sobre ellos, además al poseer un alto nivel de definición de los datos, permite que pueda ser presentado ante los usuarios y explicado con facilidad.

Análisis de los OLTP

Establecer correspondencias con los requerimientos

El objetivo de este análisis, es el de examinar los OLTP disponibles que contengan la información requerida, como así también sus características, para poder identificar las correspondencias entre el modelo conceptual y las fuentes de datos.

En el caso de los indicadores, deben explicitarse como se calcularán, y más aún si son fórmulas u operaciones complejas.

La idea es, que todos los elementos del modelo conceptual estén correspondidos en los OLTP.

Seleccionar los campos que integrarán cada perspectiva. Nivel de granularidad

Una vez que se han establecido las relaciones con los OLTP, se examinarán y seleccionarán los campos que contendrá cada perspectiva, ya que será a través de estos por los que se manipularán y filtrarán los indicadores.

Para ello, basándose en las correspondencias establecidas en el paso anterior, se debe presentar al usuario los datos de análisis disponibles para cada perspectiva. Es muy importante conocer en detalle que significa cada campo y/o valor de los datos encontrados en los OLTP, por lo cual, es conveniente investigar su sentido, ya sea a través de diccionarios de datos, reuniones con los encargados del sistema, análisis de los datos propiamente dichos, etc.

Elaboración del Modelo lógico DW

Diseñar tablas de dimensiones

Este paso, se aplicará por igual a todos los tipos de esquemas lógicos.

Lo primero que se hará será crear las dimensiones del mismo, para ello se tomará cada perspectiva con sus atributos relacionados y se les realizará el siguiente proceso:

  • Se elegirá un nombre que identifique la dimensión.
  • Se añadirá un campo que represente su clave principal.
  • Se redefinirán los nombres de los atributos si es que no son lo bastante explicativos.

Diseñar tablas de hechos

En este paso, se definirán las tablas de hechos, que son las que contendrán los indicadores de estudio.

Para los esquemas en estrella y copo de nieve, se realizará lo siguiente:

  • Al igual que las dimensiones, se le deberá asignar un nombre a la tabla de hechos que en este caso represente la información analizada, área de investigación, negocio enfocado, etc.
  • Se definirá su clave primaria, que se compone de la combinación de las claves primarias de cada dimensión que se utilizará para generar las consultas.
  • Se renombrarán los hechos o indicadores si es que no llegasen a ser lo suficientemente explícitos.

Realizar uniones

Para los tres tipos de esquemas, se realizarán las uniones correspondientes entre sus tablas de dimensiones y sus tablas de hechos.

Determinar jerarquías

Para los esquemas en estrella y constelación, se deberán especificar las jerarquías que existirán dentro de cada tabla de dimensión, teniendo siempre presente cual es el objetivo de las mismas. Para representar las jerarquías en el modelo lógico, se deberán colocar los atributos pertenecientes a las jerarquías en sus respectivas tablas, en orden descendente y acompañado con un número ordinal encerrado entre corchetes.

Procesos ETL

Una vez construido el modelo lógico, se deberá proceder a probarlo con datos, a través de procesos ETL.

Para realizar la compleja actividad de extraer datos de diferentes fuentes, para luego integrarlos, filtrarlos y depurarlos, existen varios software que facilitan estas tareas, por lo cual este paso se centrará solo en la generación de las sentencias SQL que contendrán los datos que serán de interés.

Antes de realizar la carga de datos, es conveniente efectuar una limpieza de los mismos, para evitar valores faltantes y anómalos.

En la cláusula ORDER BY de las sentencias SQL, que se efectuarán para cargar cada tabla, deben figurar los atributos, medidas y claves en orden de aparición de sus respectivas tablas. Al realizar esta acción, se logrará aportar mayor eficiencia cuando se realizan búsquedas de datos.

Conclusiones

Con el uso de la metodología Hefesto se logra un entendimiento mucho más comprensible a la hora de la construcción de un Data Warehouse independiente de la herramienta que se utilice para el mismo lograndoce hacer de forma sencilla, ordenada e intuitiva.

Fuente

Enlace relacionado