You are on page 1of 6

PROCESAMIENTO DE IMGENES: DETECCIN DEL GIRO DE CABEZA

Colegio de Ciencias e Ingeniera, USFQ.


Comunicaciones I
Mario A. Zambrano A. Yoder A. Macas G. Jaime A. Vaca S. Pablo Garca G.
Resumen
La presente investigacin se desarrolla un algoritmo para la deteccin y determinacin del giro de
la cabeza para reconocer instrucciones bsicas como lo son las rdenes "Si" y "No". Para lograrlo, se
utilizaron los anlisis matriciales de las imgenes, definiciones estadsticas y anlisis de seales para
capturar una imagen, analizarla, y responder de acuerdo de los objetivos propuestos. En un principio se
describirn los mtodos de procesamiento de imgenes, se analizarn los algoritmos usados (lgebra lineal)
y se expondrn los cdigos desarrollados en MATLAB. Posteriormente se realizar una exposicin del
cdigo realizado y utilizando diversas libreras y herramientas que se encuentran en MATLAB se proceder
a elaborar una interfaz grfica amigable que incluya un uso prctico del cdigo propuesto.
Palabras clave: Giro cabeza, procesamiento de imgenes, MATLAB, deteccin de movimiento,
Correlacin.

Palabras Clave: Reconocimiento, Movimiento, MatLab.

Introduccin
Hoy en da la comunicacin entre los
usuarios y sus computadores por medio de
medios inalmbricos se ha vuelto una
necesidad. De ah la importancia de
desarrollar herramientas para hacer de este
proceso algo ms eficiente y rpido. La
deteccin de movimientos es un proceso en
el que se identifican todas las regiones de
una imagen que cambios de posicin
independientemente de la persona o
iluminacin.

Se han creado herramientas para desarrollar
esta idea, de las cuales se ha escogido a
MATLAB. El proyecto se desarrolla
bsicamente en MATLAB, adems hemos
usado la interfaz de GUI para implementar
el cdigo y hacerlo til para el usuario.

El objetivo del proyecto es estimar el
sentido de giro de la cabeza de una persona
colocada frente a la cmara web. A partir de
esta informacin se debern interpretar las
instrucciones Si y No. Adicionalmente,
hemos agregado un banco de preguntas, que
podrn ser respondidas de manera corta con
un Si o un No, el cual mostrar un
mensaje de correcto en el caso de que la
respuesta sea la correcta.

Fundamentos tericos
Imagen Digital
Una imagen digital es una representacin
bidimensional de una imagen utilizando
bits [2]
Este tipo de imagen est formada por un
grupo de pixeles cada uno con un valor de
intensidad o brillo asociado. Una imagen
digital se representa mediante una matriz
bidimensional, de forma que cada elemento
de la matriz se corresponde con cada pxel
en la imagen [2]
Espacios de color
Escala de grises
La escala de grises es empleada en
imgenes digitales en las que el valor de
cada uno de los pixeles posee un valor
equivalente a su color original en una
graduacin, o variante, del gris [4]
Modelo HSV
Las siglas H, S y V corresponden a Tono
(hue), Saturacin (saturation) y valor
(value) respectivamente. Tambin se
denomina HSB, siendo B el brillo
(brightness) [2]

Modelo B/W
El modelo B/W es ampliamente usado
debido a que cada uno de los pixeles de la
imagen posee una valor nico de 1 o 0,
dependiendo si ser blanco o negro. Est
configuracin es importante ya que
permitir analizar una matriz que posee
nicamente 0 o 1.


Mtodo de correlacin para la deteccin
de movimiento

El emplear la correlacin es uno de los
muchos caminos para detectar si existe
movimiento frente a una cmara y ser el
usado en el presente trabajo.
Esta tcnica consiste en comparar un
grupo de pixeles de una imagen, dispuestos
en forma de matriz (Matriz Objetivo) con
una zona de la otra imagen (Matriz de
bsqueda).

Como se explica en Kraus [5], la matriz
objetivo se va comparando con las sub-
matrices de la matriz de bsqueda por
medio de indicadores de correlacin. Se
calcula el coeficiente de correlacin para
todas las posiciones posibles del rea
objetivo en el rea de bsqueda. El valor
mximo de coeficiente indica la posicin
requerida.

Una vez encontrada la posicin ms
probable, las coordenadas de los pixeles
centrales de ambas sub-matrices
corresponden a puntos homlogos y por
interseccin en el espacio se calculan las
coordenadas del punto de inters. [5]

La correlacin es semejante a la
convolucin, en la cual el valor de un pixel
de salida se calcula como la suma
ponderada de los pixeles vecinos. Estn se
diferencia en que la correlacin, llamada
kernel de correlacin, no rota durante el
clculo. La correlacin est dada por la
ecuacin [1]
( ) ( )( )
( )

( )( )


[5]
Esta se usa para encontrar el parecido entre
los pixeles de una imagen. Si los pixeles
son iguales o parecidos, se dice que se
encuentran altamente correlacionados entre
s. Este mtodo tambin es usado en el
reconocimiento de patrones y en la
compresin de imgenes.

En la figura se muestra como se calcula la
correlacin para el pixel (2,4) de la imagen
A usando como mscara de correlacin a H


Figura 1: Correlacin de A con H

El algoritmo de correlacin opera de la
siguiente manera:
Sobreponer el elemento central de la
mscara, de tal forma que quede
sobre el elemento de inters.
Multiplicar cada valor de la mscara
rotada por el pixel de A que se
encuentra bajo la mscara.
Sumar los productos individuales.

Matematicamente la correlacin se realiza
de la siguiente manera:
Dados los valores muestrales de dos
variables aleatorias (elementos de las
matrices de imgenes) e
que pueden ser
consideradas como vectores en un espacio
de n dimensiones.
La idea es medir el grado de semejanza del
patrn con la ventana de correspondencia
calculando el factor de corrlacin cruzado.
El coeficiente de correlacin se define en la
ecuacion 2: [6]


Si est normalizado, en la ecuacin 2 los
trminos se definen como:

covarianza de las teselas de la


imagen L (izquierda) y R (derecha)

desviacin tpica o estndar de la


tesela de imagen L (patrn)

desviaci;on tpica de la tesela de


la imagen R (ventana de
correspondencia)
Al realizar la correlacin de vectores
tomados de las secciones con mayor
varianza, se puede realizar una comparacin
de la imagen base con las imgenes
subsiguientes.[6] Esto se lo realiza
obteniendo la funcin de correlacin de
cada par de imgenes recolectadas con la
cmara , lo cul devuelve un vector. Se
compara el mximo del vector de
correlacin de la imagen base [Figura 2]
con el promedio de los mximos de los
vectores de correlacin de las imgenes
subsiguientes.
Para reconocer el tipo de movimiento que
realiza el sujeto de prueba, se establece
rangos de variacin de la comparacin
realizada anteriormente y de esta manera el
programa determina la respuesta.Para el SI
[Figuras 3,4,5], y para el NO [Figuras 6,7 y
8]

Figura 2: Imagen Base
Para el movimiento del SI se obtinene:

Figura 3: Movimiento hacia abajo

Figura4: Movimiento hacia arriba

Figura 5: Imagen de movimiento (si)
Para el movimiento del NO se observa:

Figura 6: Movimiento Izquierda

Figura 7: Movimiento Derecha


Figura 8: Imagen de movimiento (no)
Descripcin general del cdigo creado

Cuando la persona se sienta frente a la
cmara en posicin erguida y quieta, se
toma una fotografa como imagen base. En
el caso de que la mueva su cabeza en
sentido vertical u horizontal, el programa
devolver la instruccin si o no
respectivamente, de lo contrario mostrar
movimiento no reconocido.
El cdigo bsicamente toma la nueva
imagen ingresada y realiza la correlacin de
la matriz de esta imagen, con cada una de
las matrices de las imgenes de la base de
datos. Y lo que hace es discriminar todos
los valores resultantes de este clculo y se
queda con el mayor valor. Si este valor es
mayor que la media, establecida en 30,
entonces el programa dar la respuesta
afirmativa, si; en el caso contrario,
cuando el valor es menor que 30 el
programa dar la respuesta negativa, no.

Finalmente, se emplear una base de datos
de preguntas que podrn ser respondidas
con las instrucciones dadas por el
movimiento de cabeza, el cual mostrar si
nuestra respuesta es correcta o incorrecta.


Resultados

Nuestros resultados con respecto al cdigo
de identificacin del giro de cabeza fueron
satisfactorios, ya que en la mayora de las
pruebas se logr el objetivo planteado. Sin
embargo desarrollaron ciertos problemas en
el desarrollo, uno de ellos, y el ms
importante, es el cambio de los parmetros
de varianza establecidos, dependiendo de la
iluminacin del sitio en donde se est
realizando la prueba. Una posible
explicacin es que, al trabajar con
correlaciones, el cdigo realizado mide la
diferencia entre la imagen base y las
subsiguientes, lo cual toma en cuenta el
contraste que se provoca al trabajar con
imgenes en blanco y negro, por lo que a un
mayor contraste, mayor fidelidad en el
resultado obtenido. Por otro lado, debemos
mencionar que el cdigo creado es simple y
no usa filtros ni mayor codificacin para
optimizar el proceso.


Al realizar las pruebas se observ lo
siguiente:


Las imgenes de un varan de acuerdo a:
La posicin de la cmara (frontal,
perfil).
La distancia entre la cmara y el
individuo.
Factores externos como la
iluminacin o el movimiento a
espaldas de la persona

Bibliografa
[1] Gamez, Carmen. Procesamiento de Imagenes. N.p.,
n.d. Web. 13 Apr. 2013. <http://e-
archivo.uc3m.es/bitstream/10016/5831/1/PFC_CarmenVi
rginia_Gamez_Jimenez.pdf>.
[2] Imagen Digital. N.p., n.d. Web. 10 Apr. 2013.
<http://es.wikipedia.org/wiki/Imagendigital>.

[3] Webcam. N.p., n.d. Web. 29 Mar. 2013.
<http://www.youtube.com/watch?v=Y7UdXizc-n0>.
[4] Grises. N.p., n.d. Web. 14 Apr. 2013.
<http://es.wikipedia.org/wiki/Escala_de_gris>.
[5] Kraus, Karl. Photogrammetry: Fundamental and
standard process. 2nd ed. Vol. 1. Vienna, Austria:
Viena University of Technology, 2000. Print.
[6] Pastor, Eduardo M. N.p., n.d. Web. 14 Apr. 2013.
<http://oa.upm.es/13870/3/PFC_EDUARDO_MARTIN_PA
STOR.pdf>.

You might also like