Detección de regiones estáticas

Detección de regiones estáticas
Información sobre la plantilla
Deteccion Regiones Estaticas.jpg
Concepto:Técnicas de procesamiento de imágenes digitales.

Detección de regiones estáticas. Es la detección de objetos que no tengan movimiento alguno dentro de la escena que se analiza.

Importancia

La detección de regiones estáticas es muy importante por dos razones: debe mejorar la calidad de los datos inicialmente detectados en la segmentación frente-fondo y una vez seleccionado el objeto perteneciente al frente de la imagen, nos va a permitir realizar una serie de aplicaciones como por ejemplo la clasificación entre persona/objeto y una discriminación entre robo o abandonado.

Clasificación de métodos basados en segmentación fondo-frente

Una característica a destacar de esta clasificación es que no se va a tener en cuenta el seguimiento de objetos (tracking) de los distintos métodos implementados. Para empezar, se ha decidido dividir las aproximaciones existentes en dos categorías, dependiendo si usan uno o más modelos de modelos de fondo. A su vez, dependiendo del uso que dichas aproximaciones hagan con las máscaras de foreground (frente) obtenidas, dichas aproximaciones pueden clasificarse en:

Análisis imagen a imagen

Esta categoría describe los métodos que emplean modelos de segmentación frente-fondo bastante comunes, seguidos de otro tipo de análisis. En función de dicho tipo de análisis, pueden aparecer diferentes categorías, que son las siguientes:

  • Basados en el uso de técnicas sencillas de segmentación frente-fondo, n post-procesado de la máscara de foreground seguido a su vez de alguna otra etapa de análisis (por ejemplo, tracking). Esto se conoce como aproximaciones clásicas.
  • Basados en la acumulación de máscaras de foreground. Dicha acumulación se realiza frame (imagen) a frame y con ella se puede modelar una máscara final de foreground, de donde se extraen las regiones estáticas.
  • Basados en algunas propiedades del modelo de fondo (background) utilizado, como por ejemplo considerando las transiciones entre los diferentes estados de n modelo de mezcla de Gaussianas u observando el valor de algunos parámetros como por ejemplo, el peso de las Gaussianas.

Análisis de máscaras de foreground muestreadas

Estas aproximaciones intentan detectar regiones estáticas analizando la secuencia de vídeo a diferentes velocidades, aprovechándose de las ventajas espacio-temporales que ello conlleva.

A su vez, existen aproximaciones que combinan más de un modelo de fondo para cada píxel. Este tipo de aproximaciones han sido menos utilizadas por los investigadores para tratar de detectar regiones estáticas. Sin embargo, en función de la tasa binaria de procesamiento del vídeo o del número de modelos de fondo utilizados para detectar regiones estáticas, podemos hacer esta clasificación:

  • Aproximaciones basadas en el análisis imagen a imagen. En esta categoría tenemos métodos que combinan las propiedades de los diferentes modelos de fondo que utilizan.
  • Aproximaciones basadas en el sub-muestreo. Estas aproximaciones detectan regiones estacionarias analizando la secuencia de vídeo a través de los diferentes modelos de fondo debido a que cada modelo de fondo se muestrea con una tasa binaria diferente.

Métodos de detección de regiones estáticas

Para realizar una detección fiable de regiones estacionarias, es necesario saber las características del vídeo a analizar tales como imágenes por segundo (framerate) o distorsión espacial introducida por la cámara. Para esto, existen un gran números de técnicas que permiten la detección de estas regiones.

Método basado en una aproximación clásica

Este algoritmo ha sido proporcionado por el grupo de investigación VPU-Lab y se basa en analizar los datos proporcionados por la etapa de seguimiento de blobs (objetos) (tracking) que son extraídos de la imagen actual. Para ello se intenta buscar blobs semejantes de la imagen anterior y aquellos blobs cuya velocidad sea menor que un umbral (cercano a 0) durante 50 imágenes consecutivas, se considerarán regiones estáticas.

Método basado en la acumulación de máscaras de foreground

Este método se basa en buscar y detectar regiones estáticas mediante la acumulación de máscaras de foreground obtenidas en instantes consecutivos. Para ello, el algoritmo produce una imagen intermedia S(x,y), donde el valor de cada píxel (entre 0 y 255) determina si dicho píxel es estacionario o no es estacionario. Un valor de 0 indica que el píxel pertenece al background de la imagen y un valor de 255 indicará que nos encontramos ante un píxel de una posible región estática. Al comenzar el análisis del vídeo, todos los píxeles de la imagen intermedia S se inicializan a 0. A continuación, se utiliza I(x,y) para representar el píxel en la posición (x,y) de la imagen actual y B(x,y) el píxel correspondiente en la imagen de fondo. Para cada nueva imagen, cada píxel de la imagen S se actualizará basándose en una comparación entre el píxel de I y de B.

Dos contadores intermedios se utilizan para realizar dicha actualización. Un contador positivo, C(x,y) y un contador negativo D(x,y). C indica, píxel a píxel, durante cuántas imágenes consecutivas el píxel (x,y) pertenece al foreground. Este contador se resetea a 0 en el momento que dicho píxel pertenezca de nuevo al background de la imagen. El contador negativo D indica durante cuantas imágenes seguidas el píxel I(x,y) pertenece al background en vez de al foreground.

Destacar que dicha imagen intermedia S solo toma valores entre 0 y 255, y que las oclusiones no afectan en absoluto a este método. Los píxeles que pertenecen a un objeto estacionario harán que el valor de S aumente imagen a imagen hasta llegar al máximo valor posible de 255. El tiempo que tarda en llegar depende del valor asignado al parámetro t.

Cabe destacar que la imagen obtenida, S, es una imagen en tonalidad de grises, por lo tanto, el último paso de dicho algoritmo consiste en realizar una umbralización de S respecto a un valor predeterminado. Estrictamente, el valor 255 correspondería con el tiempo t definido para detectar una región estática pero tras varias pruebas, se ha decidido que ese umbral tome el valor de 240. Así, finalmente, obtenemos una imagen binaria donde los píxeles a ‘1’ determinan posibles regiones estáticas.

Método basado en las propiedades del modelo de mezcla de Gaussianas

Este método se basa en el estudio de las propiedades del modelo de segmentación fondo-frente utilizado. Para este método, en vez de utilizar el segmentador gamma, se va a utilizar el modelo de mezcla de Gaussianas (MoG) para separar el frente del fondo de una imagen.

El modelo MoG se basa en usar K Gaussianas por píxel, que se modelan a través de una media (ì), una desviación típica (ó) y un factor de peso (ù). La media indica el valor más probable de dicho píxel para cada píxel, la desviación típica lo que se puede alejar dicho valor medio por cada uno de los lados y el peso indica que Gaussiana es la de mayor importancia. La suma de los pesos de una Gaussiana para cada píxel es igual a 1. Este método se basa en observar los cambios de estados desde que una región aparece en la escena hasta cuando entra a formar parte del fondo (Gaussiana que modela el fondo de la imagen).

Cuando una nueva región entra en la escena, la Gaussiana de los píxeles pertenecientes a la región que poseen el menor peso se elimina y se cambia por otra Gaussiana centrada en el valor de dicho píxel. Si dicho región no es una región estacionaria, la nueva Gaussiana creada permanecerá en el estado de Gaussiana de Foreground (FG). En cambio, si la región resulta ser estacionaria y permanece durante un largo período de tiempo, la Gaussiana que pertenecía al estado de Foreground avanzará hasta el estado de Gaussiana de fondo (BG) y si permanece durante más tiempo, dicha Gaussiana pasará al estado de fondo dominante (BDG).

Esto implica que observando el cambio de estado de la Gaussiana de cada píxel perteneciente a la nueva región, específicamente cuando una Gaussiana pasa del estado de FG al estado de BG y por último, al estado de BGD, nos encontraremos ante un píxel que puede formar parte de un objeto estacionario.

Método basado en diferentes modelos de fondo actualizados a diferentes velocidades

En esté método se propone el uso de varios modelos de segmentación de fondo siendo la principal diferencia con respecto a los anteriores. En este método se utilizarán dos modelos diferentes y la novedad reside en que se actualizan a diferentes velocidades. Para detectar regiones estáticas, lo normal es modelar la imagen de fondo con un solo modelo matemático, pero este método decide utilizar dos modelos matemáticos, un modelo a largo plazo (B1), que se actualizará con unos parámetros diferentes, de manera más lenta, y otro modelo a corto plazo (B2), que se actualizará a mayor velocidad.

Para cada imagen, se estima el modelo a largo plazo y el modelo a corto plazo comparando la imagen actual I con ambos modelos de fondo, B1 y B2. Al realizar esa comparación, se obtienen dos máscaras binarias F1 y F2, donde F(x,y) = 1 indica que el píxel perteneciente a la posición (x,y) no se corresponde con el fondo de la imagen.

El modelo de fondo a corto plazo se adapta más rápido a los cambios existentes en la escena. En contra, el modelo a largo plazo tarda bastante más en adaptarse a dichos cambios.

Fuentes

  • Artículo: Sistemas de análisis y video inteligente. Disponible en: "www.desecom.com". Consultado: 12 de diciembre del 2011.
  • Artículo: Vídeo inteligente Axis. Disponible en: "www.axis.com". Consultado: 2 de mayo del 2012.
  • Artículo: Ventajas del Vídeo Inteligente AXIS. Disponible en: "www.axis.com". Consultado: 3 de mayo del 2012.
  • Sonsoles Herrero, Martín. Análisis comparativo de técnicas de segmentación de secuencia de video basado en el modelado del fondo. Tesis. Consultado: 6 de mayo del 2012.