Pandas

Pandas
Información sobre la plantilla
Pandas python.png
Concepto:Pandas es una biblioteca de Python de código abierto que proporciona una herramienta de análisis y manipulación de datos.

Pandas. Pandas es una biblioteca de Python de código abierto que proporciona una herramienta de análisis y manipulación de datos de alto rendimiento utilizando sus poderosas estructuras de datos.

Historia

Wes McKinney es el desarrollador de "Pandas", una de las principales herramientas utilizadas por los analistas de datos que trabajan en el popular lenguaje de programación Python.

Antes de Pandas, Python se usaba principalmente para la preparación y el [[procesamiento de datos]]. Contribuyó muy poco al análisis de datos. Pandas resolvió este problema. Con Pandas, podemos lograr cinco pasos típicos en el procesamiento y análisis de datos, independientemente del origen de los datos: cargar, preparar, manipular, modelar y analizar.

Python con Pandas se utiliza en una amplia gama de campos, incluidos los dominios académicos y comerciales, que incluyen finanzas, economía, estadísticas, análisis, etc.

“Los científicos lidiando innecesariamente con la monotonía de las tareas simples de manipulación de datos me hacen sentir terrible”. Wes McKinney.

Características principales

. Objeto DataFrame rápido y eficiente con indexación predeterminada y personalizada.

. Herramientas para cargar datos en objetos de datos en memoria desde diferentes formatos de archivo.

. Alineación de datos y manejo integrado de datos faltantes.

. Remodelación y giro de conjuntos de fechas.

. Etiquetado, corte, indexación y subconjunto de grandes conjuntos de datos.

. Las columnas de una estructura de datos se pueden eliminar o insertar.

. Agrupa por datos para agregación y transformaciones.

. Alto rendimiento de fusión y unión de datos.

. Funcionalidad de la serie de tiempo.

Dataframes

DataFrame es la estructura fundamental de Pandas, estos son estructuras de datos etiquetados bidimensionales con columnas de tipos potencialmente diferentes. Los Pandas DataFrame consta de tres componentes principales: los datos, el índice y las columnas.

Adicionalmente con la estructura Pandas DataFrame puedes especificar los nombres de índice y columna. El índice indica la diferencia en las filas, mientras que los nombres de las columnas indican la diferencia en las columnas. Estos componentes son muy útiles cuando se requiera manipular los datos.

Es similar a una hoja de cálculo o una tabla de SQL.

Fuente