Diferencia entre revisiones de «Algoritmos de clasificación no supervisada»

(Clasificación de los algoritmos de agrupamiento)
Línea 1: Línea 1:
 +
{{normalizar}}
 
{{Materia
 
{{Materia
 
|nombre=Clasificación no supervisada
 
|nombre=Clasificación no supervisada

Revisión del 10:30 16 jun 2011

Clasificación no supervisada
Información sobre la plantilla
Clasificación no supervisada.jpg
Campo al que perteneceReconocimiento de patrones

Resumen

Los algoritmos de clasificación no supervisada, a diferencia de los de clasificación supervisada, no disponen de un conjunto de entrenamiento, y valiéndose de algoritmos de agrupamiento intentan construirlo.

Objetivo

Si no se dispone del conjunto de entrenamiento, es decir, no existe conocimiento acerca de las etiquetas de los patrones, entonces para clasificar objetos se necesita un proceso previo de análisis de los datos que se conoce como clasificación no supervisada, aprendizaje no supervisado o técnicas de agrupamiento (clustering), que proporcionan un conocimiento sobre la estructura de los datos. El objetivo del agrupamiento es clasificar un conjunto de objetos en grupos, de forma tal que los objetos dentro de un grupo posean un alto grado de semejanza, mientras que los pertenecientes a grupos diferentes sean poco semejantes entre sí. Debido a la gran cantidad de algoritmos de agrupamiento que existe en la actualidad, es necesario que éstos satisfagan ciertas propiedades deseables.

Importancia

El aprendizaje no supervisado es muy importante cuando se dispone de muestras sin etiquetas de clase, cuando el costo de etiquetarlas por un experto es alto o cuando los patrones pueden variar con el tiempo, por lo que es necesario primero procesar los datos para luego clasificar. La principal ventaja que presenta la clasificación no supervisada es que se puede obtener un conjunto de entrenamiento empleando muestras no etiquetadas valiéndose de algoritmos de agrupamiento. El agrupamiento es una herramienta muy utilizada en distintos contextos como la Recuperación de Información y la Minería de Textos, el procesamiento de secuencias descriptoras de genes y proteínas, el seguimiento y detección de sucesos en un flujo continuo de noticias, la segmentación de imágenes, la compresión de datos, el procesamiento de bases de datos espaciales, la clasificación de zonas geográficas, la comprensión de imágenes de satélites, la visualización de datos, la prospección geológica, la organización de documentos en bibliotecas, y en muchas otras aplicaciones como la estructuración de grandes volúmenes de datos.

Clasificación de los algoritmos de agrupamiento

Debido a la gran diversidad de algoritmos de agrupamiento existentes se han creado varias clasificaciones de los mismos teniendo en cuenta distintos aspectos. Atendiendo a la forma en que procesan los objetos, los algoritmos se clasifican en:

Atendiendo a la forma en que organizan los grupos que van obteniendo, los algoritmos de agrupamiento se clasifican en:

Atendiendo a la pertenencia de los objetos a los grupos, los algoritmos de agrupamiento se clasifican en:

Teniendo en cuenta el mecanismo en que se basan para agrupar, se clasifican en:

Fuentes

Facultad de Matemática y Computación de la Universidad de Oriente.