Diferencia entre revisiones de «Pentaho Data Integration»

(Etiqueta: nuestro-nuestra)
(Fuente)
(Etiqueta: nuestro-nuestra)
 
(No se muestran 5 ediciones intermedias de 3 usuarios)
Línea 4: Línea 4:
 
|imagen=LogotipoPDI.jpg
 
|imagen=LogotipoPDI.jpg
 
|tamaño=
 
|tamaño=
|descripción=
+
|descripción=Logotipo de la Herramienta.
 
|imagen2=
 
|imagen2=
 
|tamaño2=
 
|tamaño2=
Línea 20: Línea 20:
 
|licencia=GNU Lesser General Public License (Version 2.1)
 
|licencia=GNU Lesser General Public License (Version 2.1)
 
|premios=
 
|premios=
|web=http://www.pentaho.com
+
|web=[http://www.pentaho.com/ Sitio oficial]
}}
+
}}'''Kettle'''. Es una herramienta de Pentaho Data Integration que permite implementar los procesos de extracción,transformación y carga de datos. El uso de kettle permite evitar grandes cargas de trabajo manual frecuentemente difícil de mantener y de desplegar.
 
 
'''Kettle''' es una herramienta de Pentaho
 
Data Integration que permite implementar los procesos de extracción,
 
transformación y carga de datos. El uso de kettle permite evitar grandes cargas
 
de trabajo manual frecuentemente difícil de mantener y de desplegar.
 
  
 
==Introducción al software==
 
==Introducción al software==
Línea 34: Línea 29:
  
 
==Requisitos mínimos para su funcionamiento==
 
==Requisitos mínimos para su funcionamiento==
[[Procesador]]: Celeron, 2.0GHz
+
*[[Procesador]]: Celeron, 2.0GHz
[[Memoria RAM]]: 128Mb o superior.
+
*[[Memoria RAM]]: 128Mb o superior.
Espacio libre en disco duro: 200Mb
+
*Espacio libre en disco duro: 200Mb
Otros requerimientos: [[Máquina virtual de Java]]([[JRE]]) versión 1.5 o
+
*Otros requerimientos: [[Máquina virtual de Java]] ([[JRE]]) versión 1.5 o
 
superior.
 
superior.
  
 
==Algunas funciones y consideraciones importantes==
 
==Algunas funciones y consideraciones importantes==
 
 
Pentaho Data Integration(PDI) es un motor de transformación, y desde el principio se observa que ha sido diseñado para cubrir las necesidades en la integración de datos. La [[plataforma Open Source]] Pentaho Business Intelligence cubre amplias necesidades de análisis de los datos y de los informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en este lenguaje. Eso hace que sea una solución muy flexible para cubrir una amplia gama de necesidades empresariales.
 
Pentaho Data Integration(PDI) es un motor de transformación, y desde el principio se observa que ha sido diseñado para cubrir las necesidades en la integración de datos. La [[plataforma Open Source]] Pentaho Business Intelligence cubre amplias necesidades de análisis de los datos y de los informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en este lenguaje. Eso hace que sea una solución muy flexible para cubrir una amplia gama de necesidades empresariales.
 
   
 
   
Línea 51: Línea 45:
  
 
==Consejo para el trabajo con el software==
 
==Consejo para el trabajo con el software==
El primer paso a la hora
+
El primer paso a la hora de la utilización de la herramienta debe ser la creación de la conexión a las diferentes bases de datos que se utilizarán ya sea para la migración de datos, creación de data warehouse, etc. Posteriormente la construcción de cada una de
de la utilización de la herramienta debe ser la creación de la conexión a las
+
las transformaciones con sus diferentes particularidades y después los trabajos para ejecutar cada una de estas transformaciones u otras acciones que sean necesarias.
diferentes bases de datos que se utilizarán ya sea para la migración de datos,
 
creación de data warehouse, etc. Posteriormente la construcción de cada una de
 
las transformaciones con sus diferentes particularidades y después los trabajos
 
para ejecutar cada una de estas transformaciones u otras acciones que sean
 
necesarias.
 
  
 
==Conclusiones==
 
==Conclusiones==
Kettle es una potente [[herramienta]] capaz de
+
Kettle es una potente [[herramienta]] capaz de manipular y transformar información en todos aquellos proyectos dónde sea
manipular y transformar información en todos aquellos proyectos dónde sea
+
necesario trabajar con datos. Su solución para cubrir las necesidades de extracción, manipulación, validación y carga de datos desde múltiples fuentes de origen y en diferentes entornos puede resolver muchos problemas.
necesario trabajar con datos. Su solución para cubrir las necesidades de
 
extracción, manipulación, validación y carga de datos desde múltiples fuentes
 
de origen y en diferentes entornos puede resolver muchos problemas.
 
 
 
==Fuente==
 
* http://revista.jovenclub.cu Revista Tino.
 
* http://www.pentaho.com
 
 
 
 
==Véase también==
 
==Véase también==
 
*[[Fotosizer]]
 
*[[Fotosizer]]
 
*[[PhotoScape]]
 
*[[PhotoScape]]
 
*[[EclipseCrossword]]
 
*[[EclipseCrossword]]
 +
==Fuente==
 +
* [http://revista.jovenclub.cu/ Pentaho Data Integration] publicado en:[[http://revista.jovenclub.cu/ Revista Tino]
 +
* [http://www.pentaho.com/ Pentaho] publicado en:[http://www.pentaho.com/ Sitio oficial]
 +
 +
 
[[Category:Software_libre]]
 
[[Category:Software_libre]]

última versión al 09:26 16 jun 2016

Pentaho Data Integration (Kettle)
Información sobre la plantilla
LogotipoPDI.jpg
Logotipo de la Herramienta.
Sistemas Operativos compatiblesWindows, Macintosh, Unix y Linux.
IdiomaEspañol
LicenciaGNU Lesser General Public License (Version 2.1)
Sitio web
Sitio oficial

Kettle. Es una herramienta de Pentaho Data Integration que permite implementar los procesos de extracción,transformación y carga de datos. El uso de kettle permite evitar grandes cargas de trabajo manual frecuentemente difícil de mantener y de desplegar.

Introducción al software

Muchas necesidades surgen cuando una organización necesita migrar las aplicaciones o las bases de datos. Puede que sea tan simple como una mejora a una nueva versión del sistema, o puede que implique cambiar a una nueva base de datos o aplicación. Después de una fusión o de una adquisición, a menudo se retiran las aplicaciones redundantes, pero los datos tienen que ser preservados en el sistema de supervivencia. Después de una migración, el viejo sistema y el nuevo sistema tendrán que coexistir.

La necesidad de crear sistemas encaminados a garantizar el funcionamiento de la economía cubana en las nuevas circunstancias y en el marco de las transformaciones organizativas que se están desarrollando en la actualidad, constituye un reto. La informatización como parte del avance tecnológico que precisa nuestro país, demanda una elevada capacidad tecnológica y operativa, lo que trae consigo a gran escala la utilización de modernos medios de procesamiento de la información, entre los que se encuentra el Pentaho Data Integration (Kettle).

Requisitos mínimos para su funcionamiento

superior.

Algunas funciones y consideraciones importantes

Pentaho Data Integration(PDI) es un motor de transformación, y desde el principio se observa que ha sido diseñado para cubrir las necesidades en la integración de datos. La plataforma Open Source Pentaho Business Intelligence cubre amplias necesidades de análisis de los datos y de los informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en este lenguaje. Eso hace que sea una solución muy flexible para cubrir una amplia gama de necesidades empresariales.

Kettle es una herramienta de PDI que permite implementar los procesos extracción, transformación y carga de datos (ETL), la misma es de código abierto compuesta por cuatro componentes fundamentales: SPOON para el diseño gráfico de las transformaciones, PAN para la ejecución de los trabajos y las transformaciones, CHEF para el diseño de la carga de datos y KITCHEN para la ejecución de los trabajos Batch diseñados con CHEF.

Con esta herramienta se construyen las transformaciones (mínimo nivel de diseño) utilizando los pasos (steps). En un nivel superior se encuentran los trabajos (Jobs), que permiten ejecutar las transformaciones y otros componentes, y orquestar los procesos. PDI no es un generador de código, es un motor de transformación, donde los datos y sus transformaciones están separados. Las transformaciones y trabajos son almacenadas en formato XML, donde se especifican las acciones a realizar en los datos. Para construir las transformaciones, se utilizan los pasos o componentes, que se enlazan entre si mediante saltos (steps), que determinan el flujo de datos entre los diferentes componentes. Para los trabajos, existe otro grupo de pasos, en los que se pueden realizar diferentes acciones (o ejecutar transformaciones). Los pasos o saltos en este caso determinan el orden de ejecución o la ejecución condicional.

Este software incluye herramientas para realizar consultas, generación de informes y reportes, análisis interactivo, tableros de mando, extracción, transformación y carga de datos (ETL) / integración de datos, minería de datos (data mining), y un servidor para la plataforma de BI (Business Intelligence) que lo ha convertido en la suite de software libre más popular.

Consejo para el trabajo con el software

El primer paso a la hora de la utilización de la herramienta debe ser la creación de la conexión a las diferentes bases de datos que se utilizarán ya sea para la migración de datos, creación de data warehouse, etc. Posteriormente la construcción de cada una de las transformaciones con sus diferentes particularidades y después los trabajos para ejecutar cada una de estas transformaciones u otras acciones que sean necesarias.

Conclusiones

Kettle es una potente herramienta capaz de manipular y transformar información en todos aquellos proyectos dónde sea necesario trabajar con datos. Su solución para cubrir las necesidades de extracción, manipulación, validación y carga de datos desde múltiples fuentes de origen y en diferentes entornos puede resolver muchos problemas.

Véase también

Fuente