Algoritmos de clasificación no supervisada

Clasificación no supervisada
Información sobre la plantilla
Error al crear miniatura: Falta archivo
Campo al que perteneceReconocimiento de patrones

Algoritmos de clasificación no supervisada. Los algoritmos de clasificación no supervisada, a diferencia de los de clasificación supervisada, no disponen de un reconocimiento de patrones conjunto de entrenamiento, y valiéndose de algoritmos de agrupamiento intentan construirlo.

Objetivo

Si no se dispone del conjunto de entrenamiento, es decir, no existe conocimiento acerca de las etiquetas de los patrones, entonces para clasificar objetos se necesita un proceso previo de análisis de los datos que se conoce como clasificación no supervisada, aprendizaje no supervisado o técnicas de agrupamiento (clustering), que proporcionan un conocimiento sobre la estructura de los datos.

El objetivo del agrupamiento es clasificar un conjunto de objetos en grupos, de forma tal que los objetos dentro de un grupo posean un alto grado de semejanza, mientras que los pertenecientes a grupos diferentes sean poco semejantes entre sí. Debido a la gran cantidad de algoritmos de agrupamiento que existe en la actualidad, es necesario que éstos satisfagan ciertas propiedades deseables.

Importancia

El aprendizaje no supervisado es muy importante cuando se dispone de muestras sin etiquetas de clase, cuando el costo de etiquetarlas por un experto es alto o cuando los patrones pueden variar con el tiempo, por lo que es necesario primero procesar los datos para luego clasificar. La principal ventaja que presenta la clasificación no supervisada es que se puede obtener un conjunto de entrenamiento empleando muestras no etiquetadas valiéndose de algoritmos de agrupamiento.

El agrupamiento es una herramienta muy utilizada en distintos contextos como la Recuperación de Información y la Minería de Textos, el procesamiento de secuencias descriptoras de genes y proteínas, el seguimiento y detección de sucesos en un flujo continuo de noticias, la segmentación de imágenes, la compresión de datos, el procesamiento de bases de datos espaciales, la clasificación de zonas geográficas, la comprensión de imágenes de satélites, la visualización de datos, la prospección geológica, la organización de documentos en bibliotecas, y en muchas otras aplicaciones como la estructuración de grandes volúmenes de datos.

Clasificación de los algoritmos de agrupamiento

Debido a la gran diversidad de algoritmos de agrupamiento existentes se han creado varias clasificaciones de los mismos teniendo en cuenta distintos aspectos. Atendiendo a la forma en que procesan los objetos, los algoritmos se clasifican en:

  • Estáticos
  • Incrementales
  • Dinámicos

Atendiendo a la forma en que organizan los grupos que van obteniendo, los algoritmos de agrupamiento se clasifican en:

Atendiendo a la pertenencia de los objetos a los grupos, los algoritmos de agrupamiento se clasifican en:

  • Disjuntos
  • Solapados

Teniendo en cuenta el mecanismo en que se basan para agrupar, se clasifican en:

  • De pasada simple
  • Basados en grafos
  • De optimización
  • Basados en árboles

Ver además

Fuente

  • Facultad de Matemática y Computación de la Universidad de Oriente.