Algoritmos de clasificación supervisada

Clasificación supervisada
Información sobre la plantilla
ClasifSupervisada.JPG
Campo al que perteneceReconocimiento de patrones


Algoritmos de clasificación supervisada. Los algoritmos de clasificación supervisada se utilizan en problemas en los cuales se conoce a priori el número de clases y los [[Reconocimiento de patrones|patrones] representantes de cada clase. Básicamente consiste en que, para clasificar automáticamente una nueva muestra, se tiene en cuenta la información que se pueda extraer de un conjunto de objetos disponibles divididos en clases y la decisión de una regla de clasificación o clasificador.

Concepto

Los algoritmos dedicados al problema de la clasificación supervisada operan usualmente sobre la información suministrada por un conjunto de muestras, patrones, ejemplos o prototipos de entrenamiento que son asumidos como representantes de las clases, y los mismos poseen una etiqueta de clase correcta. A este conjunto de prototipos correctamente etiquetados se le llama conjunto de entrenamiento (TS, training set), y es el conocimiento empleado para la clasificación de nuevas muestras.

Objetivo de la clasificación supervisada

Estos algoritmos tienen como objetivo determinar cuál es la clase, de las que ya se tiene conocimiento, a la que debe pertenecer una nueva muestra, teniendo en cuenta la información que se puede extraer del conjunto de entrenamiento.

Enfoque basado en criterios de vecindad

Entre los algoritmos de clasificación supervisada se encuentran aquellos que utilizan criterios de vecindad. En general, cualquier problema de clasificación supervisada abordado con un enfoque basado en criterios de vecindad se podrá caracterizar del siguiente modo:

Sea E el espacio de representación de un determinado problema en el cual se tienen M clases, de manera que formen una partición de E. Se dispone además de N prototipos x1, x2, ..., xN (o muestras etiquetadas) pertenecientes al espacio E, que se toman como conjunto de entrenamiento, el cual se representa por

TS={X,Ω}={(x1,ω1), (x2,ω2), (xN,ωN)}

El problema consistirá en que, dada una nueva muestra xεE, estadísticamente independiente del conjunto {X,Ω} que puede estar contenida en cualquiera de las M clases, determinar a qué clase del espacio pertenece. Este procedimiento es conocido como Regla de Clasificación o Clasificador y se representa como:

δ: EΩ, δ(x)=ωi para algún i=1, ..., M

Es decir, el clasificador determina a qué clase del espacio de representación pertenece la nueva muestra x, teniendo en cuenta la distancia determinada por una métrica entre x y los prototipos del conjunto de entrenamiento.

Ejemplo de clasificadores basados en criterios de vecindad

Entre los clasificadores supervisados basados en criterios de vecindad se encuentra la Regla del vecino más cercano (regla NN) y la Regla de los k vecino más cercanos (regla k-NN).

Fuente