You are on page 1of 41

0

TABLA DE CONTENIDO

INTRODUCCIN

1. ANTECEDENTES

2. PLANTEAMIENTO DEL PROBLEMA

3. OBJETIVOS

4. JUSTIFICACIN

5. MARCO TERICO

6. INNOVACIN Y DESARROLLO TECNOLGICO

28

7. IMPACTO Y ALCANCE DEL PROYECTO

29

8. METODOLOGA

30

9. RECURSOS TECNOLGICOS DISPONIBLES PARA LA


ELABORACIN DEL PROYECTO

31

10. PLAN DE CONTENIDO

32

11. CRONOGRAMA

33

12. ESTRATEGIA DE DIVULGACIN

34

13. PRESUPUESTO

35

REFERENCIAS BIBLIOGRFICAS

36

INTRODUCCIN

La visin artificial es un campo de constante cambio y rpidas innovaciones. De todos los


sentidos del cuerpo humano, el de la visin es el considerado de mayor complejidad e
importancia. Y esto se aplica a otras especies del reino animal. Es natural, por lo tanto, que
dentro de las lneas actuales de instrumentacin para los sistemas de control de procesos,
para la robtica y para la seguridad industrial, la visin artificial sea tomada en cuenta para
mejoramiento de muchas aplicaciones.
El dispositivo principal de un sistema de visin artificial es la cmara digital que mediante
la captacin de la luz proveniente de los objetos ubicados en el campo de visin, brinda a
un computador, a travs de una tarjeta de adquisicin de seal, los datos necesarios para la
reconstruccin de la imagen. La interpretacin de esta imagen queda a cargo de un sistema
que podramos llamar inteligente siempre y cuando simule, aunque sea en una pequea
parte, lo que hace el cerebro humano con los impulsos provenientes del ojo. Lo que se
busca con el sistema de interpretacin es utilizar la imagen para la tarea especificada, por
ejemplo: ubicar un robot en el espacio de trabajo, detectar la presencia de una persona en
un cuarto, controlar manipuladores mecnicos, medir una distancia determinada, identificar
personas, entre otras.
Cada cmara realiza un modelamiento del mundo real y se lo entrega al computador como
imagen bidimensional. Este modelamiento viene determinado por las caractersticas propias
de todo el sistema de adquisicin de imgenes. Es decir, lo que hace el sistema es una
transformacin de distintos puntos en el entorno a puntos en la imagen. Cada cmara
digital tiene unas cualidades propias y nicas, por lo que antes de realizar cualquier
aplicacin de reconstruccin en visin artificial es necesario conocer los parmetros que
realizan la transformacin mencionada. Este proceso se conoce como calibracin o
modelacin.
A lo largo de la historia de la visin artificial se han dedicado varios esfuerzos a las
maneras ms adecuadas de modelar las cmaras digitales mediante la aplicacin de los
conocimientos de ptica y de procesamiento de imgenes. Se han desarrollado mtodos
lineales y mtodos no lineales, estos ltimos alcanzando a describir parmetros de hasta
tercer grado lo que le da mayor precisin al modelo al considerar efectos de distorsin en
las imgenes.
Este trabajo presenta una propuesta de investigacin que implementa un mtodo robusto
para la calibracin de cualquier cmara digital. Este mtodo debe cumplir con ciertos
requerimientos de sencillez, inteligencia, interaccin, innovacin y precisin que permitan
compararlo con las metodologas ya existentes y sacar conclusiones de esta comparacin.

Considerando lo anterior, el proyecto de investigacin pretende recopilar los mtodos


existentes de calibracin de cmaras digitales e implementar uno nuevo con tcnicas de
inteligencia artificial que compita con ellos. El logro de los objetivos aqu propuestos
significar una ayuda importante en todas las aplicaciones de visin artificial que necesitan
previamente calibrar su dispositivo de adquisicin de imgenes.

1. ANTECEDENTES

Los mtodos de calibracin de cmaras digitales han venido desarrollndose fuertemente en


los ltimos aos a la par del crecimiento de los lenguajes de programacin que permiten
implementar tcnicas de modelamiento ms precisa y rpidas. No obstante, la mayora de
estos mtodos sacrifican ya sea precisin o costos de procesamiento; es decir, entre mejor
se quieran modelar los parmetros de la cmara, se necesitar mayor capacidad de
computacin en los programas de identificacin, lo que se manifiesta en mayor memoria,
mayor velocidad, mayor tiempo y esfuerzo de programacin y por lo tanto, mayor costo.
A nivel internacional, se ha investigado sobre distintas tcnicas para la calibracin de
cmaras digitales, especialmente impulsados por la industria militar que en el caso de la
visin artificial encuentra muchas utilidades. En muchas universidades de varios pases del
mundo se destaca el crecimiento de una amplia base matemtica que sustente el proceso de
la obtencin de parmetros a la par de la utilizacin de ingeniera de software ms
avanzada. Un aspecto de importante crecimiento en las tcnicas de modelamiento de todo
tipo de sistemas es la identificacin inteligente por medio de algoritmos genticos o de
redes neuronales lo que ha mostrado resultados muy interesantes. A nivel nacional no se ha
encontrado ningn antecedente de la investigacin sobre este tema.
El presente trabajo propone la investigacin sobre un sistema que modele automticamente
cmaras digitales utilizando algoritmos de inteligencia artificial, lo que, segn los
antecedentes, sera una innovacin en el campo de la calibracin de cmaras. Adems se
desea realizar un anlisis comparativo con los procedimientos ya existentes, con lo cual el
conocimiento del estado actual de la tecnloga en calibracin de cmaras se hace
indispensable en la realizacin de la investigacin propuesta.
Actualmente las aplicaciones que involucran sistemas de adquisicin y procesamiento de
imgenes vienen tomando mayor fuerza debido en parte a la disminucin en costos tanto de
las cmaras como de las tarjetas de digitalizacin.

2. PLANTEAMIENTO DEL PROBLEMA

El problema principal que se intenta resolver con la calibracin de cmaras digitales es el


conocimiento del modelo matemtico que permite establecer las relaciones entre la
ubicacin de los pxeles en la imagen y los correspondientes puntos del mundo real.
En la actualidad existen diferentes mtodo de aproximacin lineal y no lineal al modelo de
una cmara digital. Sin embargo estos mtodos presentan ciertas desventajas especialmente
por el alto costo del procesamiento computarizado, por la imprecisin que manejan y por el
retraso con respecto a las cada vez mayores necesidades de la visin industrial y a las
nuevas tcnicas de algoritmos de inteligencia artificial.
En este trabajo se plantea realizar un mtodo basado en la identificacin de sistemas por
tcnicas de visin artificial, que haga la modelizacin y la calibracin automtica de
cualquier cmara digital de tal manera que supere algunas deficiencias de los mtodos
existentes en la actualidad.
La pregunta principal a realizar es si en realidad es posible superar las tcnicas actuales con
la propuesta que se hace en este trabajo. Responder esta pregunta ser uno de los objetivos
a alcanzar en la presente investigacin.
La solucin del problema planteado significar un avance en la automatizacin de la
calibracin de cmaras con lo que las aplicaciones de visin metrolgica podrn ser
implementadas ms rpidamente y como extensin se podr prestar, eventualmente, el
servicio a toda aquella persona natural o jurdica que requiera conocer el modelo de la
cmara que posee.

3. OBJETIVOS

3.1. OBJETIVO GENERAL


Realizar una investigacin que conduzca a la implementacin de un mtodo robusto en la
calibracin de cmaras digitales de tal manera que pueda ser comparado con los mtodos
aplicados actualmente y mejorado con respecto a ellos.
3.2. OBJETIVOS ESPECFICOS
Evaluar el estado actual de la calibracin de cmaras digitales y hacer un anlisis de los
distintos mtodos disponibles.
Desarrollar una metodologa, con base en las tcnicas existentes para calibrar cualquier
cmara digital con un buen porcentaje de precisin y eficiencia.
Realizar un estudio comparativo entre el mtodo implementado y los procedimientos ya
conocidos y cuantificar su utilidad.
Optimizar el mtodo obtenido y el programa que lo implementa para dejarlo a la altura de
los desarrollos actuales ms evolucionados.
Validar el sistema implementado con la calibracin de diferentes cmaras digitales que
vayan a ser utilizadas en aplicaciones de visin artificial.
Desarrollar una herramienta que sirva de punto de partida a la automatizacin del
procedimiento de calibracin de cmaras digitales.
3.3. OBJETIVOS ESTRATGICOS
Disear el mtodo de calibracin de cmaras digitales ms apropiado para obtener el
modelo independientemente de cualquier tipo de cmara digital.
Implementar un sistema automtico de calibracin de cmaras digitales.
Comprobar los resultados mediante el anlisis comparativo con algunos mtodos de
calibracin existentes.

4. JUSTIFICACIN

4.1. JUSTIFICACIN TERICA


El estudio comparativo de los mtodos de modelamiento y calibracin de cmaras permitir
reafirmar el conocimiento que se tiene sobre las aproximaciones matemticas artificiales
utilizadas para describir las relaciones mundo-imagen.
Los mtodos de calibracin clsicos presentan inconvenientes que impiden su utilizacin en
aplicaciones de Tiempo Real y los modelos matemticos ms exactos frecuentemente no
consideran rdenes superiores al tercero. Un mtodo basado en redes neuronales puede
ayudar a paliar estas limitantes.

4.2. JUSTIFICACIN METODOLGICA


Cualquier cambio en el sistema lente-cmara-tarjeta de adquisicin implica una
modificacin del modelo, por lo que se hace necesaria la implementacin de herramientas
de calibracin automtica para dinamizar los procedimientos donde se requiera la
reconstruccin parcial o total de escenas mediante visin artificial. El resultado de la
investigacin debe utilizar los modelos matemticos y algoritmos adecuados en un lenguaje
de programacin que permitir modelar y calibrar cualquier cmara digital de forma
eficiente y rpida.

4.3. JUSTIFICACIN PRCTICA


El sistema implementado servir para la calibracin de cualquier cmara digital de la cual
se necesita conocer su modelo para ser utilizado en una aplicacin especfica con el fin de
ampliar la optimizacin de recursos en el desarrollo de visin artificial.

5. MARCO TERICO
5.1. INTRODUCCIN
La idea de encontrar un modelo de una cmara digital viene del hecho de que cada sistema
de adquisicin de seal realiza una transformacin de las coordenadas de todos los puntos
de una imagen en el mundo real en coordenadas en el plano de la imagen digitalizada en el
computador que la recibe. El modelo presentado a continuacin es el modelo clsico
llamado modelo pin-hole. El modelo de una cmara se puede caracterizar en dos partes[1]:
1. Proyeccin que transforme un punto del espacio 3D en una imagen 2D.
2. Transformacin de la referencia mtrica de la cmara a la referencia de la imagen.
El dibujo de la Figura 1. muestra el modelo geomtrico de una cmara.
Marco de referencia del
plano de la imagen o de
la retina

Marco de referencia del


objeto en el mundo real

z
y
y

X
Marco de referencia de
la cmara
Distancia focal

O
(x*, y*, f)

Coordenadas segn el
marco de referencia
del mundo en R3

bu
v

F
Centro de la cmara o
foco

Coordenadas de la
proyeccin del punto B en
el plano imagen (punto b)
con la cmara como marco
de referencia

x
y
z

x*
y*
z*

Figura 1. Modelo pinhole de una cmara

x
y
z

Coordenadas del punto


B segn el marco de
referencia de la cmara
luego de realizar la
translacin y la
rotacin.

5.2. PROYECCIN PERSPECTIVA ([1],[3])


Se llamar a O, en el plano de referencia de la imagen, al punto principal y a una recta
perpendicular al plano de la imagen que pasa por O, el eje ptico. El punto F est colocado
sobre el eje ptico a una distancia f del plano de referencia de la imagen. El punto F es el
centro de la proyeccin y f la distancia focal. En el dibujo de la figura 1 el punto F se
coloca detrs del plano de la imagen para efectos de anular un signo matemtico negativo
que se presenta en las transformaciones.
Por trigonometra [2], las coordenadas de la proyeccin del punto B en el plano de la
imagen estn dadas por:
x = fx/z
y= fy/z
z = f
Escribiendo esta transformacin en forma matricial:
1

0
P= 0

1
0
0
1
0 1/ f

0
0

(x,y,z,1)

x ' fx / z
y ' fx / z
z' f

P es conocida como la matriz de transformacin de perspectiva [3]. Las coordenadas


cartesianas de b (proyeccin del punto B en la imagen) son: sx/s, sy/s y sz/s. Esto es en
las llamadas coordenadas homogneas [2], [3]
sx '

sy '

sz ' = 0

s
0

0
1

0
0

0
1
0 1/ f

0 x

0 y
0 z

0 1

5.3. TRANSFORMACIN CMARA IMAGEN ([1],[2],[3])


Los puntos de la imagen son la medida en pxeles del marco de referencia bidimensional uv, asociados en la figura 1. Con el fin de poder escribir la matriz de transformacin del
sistema de coordenadas de la cmara al sistema de coordenadas de la imagen, se introducen
los parmetros uo , vo y wo que son las coordenadas de F, en el sistema de coordenadas de
la imagen (medido en pxeles) , ku es el factor de escala vertical y kv es el factor de escala
horizontal. Si son iguales, los pxeles de la imagen son cuadrados.

Coordenadas de F: 0 , 0 y 0

v =
w

ku

0
0

0
kv
0

0
0

1 0 0

0 1 0
0 0 1

sx' u 0

sy ' v0
sz ' w

ku: factor de escala vertical


kv: factor de escala horizontal
Aqu se incluye cambio de escala, rotacin y translacin.
Esta transformacin representa una aplicacin lineal:
ku

K= 0
0

0
kv
0

x'
su

sv K y '
z'
s

0 u0

0 v0
0 1

5.4. PARMETROS INTRNSECOS


Al multiplicar las matrices K y P se pueden escribir las ecuaciones del modelo geomtrico
de la cmara, es decir la relacin entre las coordenadas de la cmara (x,y,z) del punto B y
las coordenadas de la imagen (u,v) del punto b[1].

u = -ku f
v= kvfy/z
En efecto, el producto de KP es:

x
+ u0
z

+ v0

10

ku

u0 / f

kv u 0 / f

1/ f

Al multiplicar los coeficientes de la matriz por f se obtiene:


u
0 0

0
IC =

0
v

u0
v0

0
0

La transformacin queda as:


x

su

y
sv
z
v

Los parmetros a ser estimados por la calibracin son

u = -kuf
v = kvf
uo
vo
Las coordenadas en el plano de la cmara son:
xc =x/z
yc = y/z
zc = 1
La relacin entre las coordenadas de la imagen y las coordenadas de la cmara son:
u=
v=
De forma matricial:

u xc+ u0
vyc+ v0

con

u<0

11

u
xc

v C yc
1
1

C= 0
0

con

u0

v
0

v0

Se puede descomponer la matriz Ic en una transformacin afn a la de cmara imagen en


una transformacin proyectiva:
u

Ic 0
0

0
v
0

u0

v0

1 0 0 0

0 1 0 0
1 0 0 1 0

5.5. PARMETROS EXTRNSECOS


Transformacin mundo real/ cmara
La transformacin mundo / cmara se compone de una rotacin y una translacin
x

y
z

r11

r21
r
31

r12
r22
r32

r13

r23
r33

y +
z

La transformacin rgida (rotacin y


transformacin homognea:
r11

r21
=
r
31
0

tx

ty
t
z

Rotacin y Translacin

translacin) puede ser escrita en la forma de una

r12
r22
r32
0

r13

tx

r23 t y R t

=
r33 t z 0 1

0 1

Aqu se observa una transformacin rgida (tres rotaciones y tres translaciones): esos son
los parmetros extrnsecos. La matriz inversa est dada por la siguiente expresin:

Transformacin mundo / imagen


M= Ic A=

R 1

=
0

R 1 t

12

0
0

0
v

u0
v0

r
0 11
r
0 21
r
0 31
0

r12
r22

r13
r23

r32
0

r33
0

t x
u r1 0 r3
ty =

u r2 0 r3
tz

r3

donde los componentes estn dadas por las filas tipo r1= r11

r1

r2
A=
r
3
0

r12

u t x 0t z

v t y v0 t z

tz

r13

tx

ty
tz

La matriz de proyeccin perspectiva puede ser escrita de la forma:


m11
su

sv = m21
s
m

31

m12
m22
m32

m13
m23
m33

m14

m24
m34

Y
Z

X,Y,Z son las coordenadas del punto B del mundo real en el marco de referencia de la mira.
Esta matriz puede ser escrita de forma ms simple:
m1

M= m 2
m
3
r3 = m3
0 = m1. m3
0 = m2 m3
u = -||m1 m3||
v = ||m2 m3||

r 1 1 / u (m 1 0 m 3 )

r2 1 / v ( m2 0 m3 )
t x 1 / u ( m14 0 m34 )
t y 1 / v ( m24 0 m34 )
t z m34

m14

m24
m34

mi =

mi1

mi 2

mi 3

13

5.6. EXTRACCIN DE PARMETROS


Los pasos para encontrar los parmetros intrnsecos son:
1. Estimar los coeficientes de la matriz proyeccin M.
2. Extraer los parmetros de la cmara a partir de sus coeficientes, con la utilizacin de las
ecuaciones anteriores.
El modelo presentado anteriormente corresponde a un modelo lineal que no tiene presente
la distorsin de la lente y an as es complicado hallar los parmetros de la cmara. Los
modelos que tienen en cuenta la distorsin de la lente adicionan algunos coeficientes de
distorsin [18],[20]. La mayora de los mtodos actuales manejan el modelo pinhole clsico
y sus variaciones principales apuntan hacia la manera en que toman en cuenta la distorsin
con el objeto de mejorar la exactitud de la calibracin. En esta investigacin se busca
resumir el proceso de calibracin mediante un algoritmo que coja el sistema de entradas
(coordenadas mundo real) y salidas (coordenadas imagen) y lo identifique a travs de un
programa que utilice los conceptos de modelamiento de redes neuronales. En conclusin lo
que se necesita es conocer las coordenadas del mundo real y las coordenadas obtenidas por
la cmara en la imagen, para hallar el modelo propio del dispositivo de adquisicin de
imgenes. Para esto se puede usar en el mundo real un patrn como el de la Figura 2 [4][5]:

Figura 2. Dos conjuntos de puntos coplanares formando parte de una esquina proveen
los puntos requeridos para las entradas de un sistema de calibracin de cmaras digitales.

5.7. MTODOS DE CALIBRACIN EXISTENTES


Los mtodos de calibracin tienen como objetivo encontrar la menor diferencia entre las
caractersticas principales de la imagen adquirida de un patrn de calibracin y las
caractersticas correspondientes de la imagen del mismo a travs del modelo de la cmara.
Los mtodos de calibracin existentes pueden clasificarse primariamente en mtodos
lineales [5]-[12], en mtodos de minimizacin no lineales [5],[6],[13],[14],[15] y en

14

mtodos de mltiples etapas [16]-[20]. De stos ltimos se destacan principalmente los


mtodos de dos etapas [18],[20]. Para resolver problemas relacionados con el
desconocimiento a priori de estimaciones iniciales, una estrategia muy comn en visin
artificial es atacar el problema de la calibracin utilizando dos pasos. En el primer paso se
generan las soluciones aproximadas usando una tcnica lineal, mientras que en el segundo
paso se mejoran las soluciones lineales mediante procedimientos iterativos no lineales tales
como los mtodos de Tsai[21], Tarel [22] y Robert [23]. Un mtodo no lineal no iterativo
como Toscani [24] puede ser adecuado cuando los requerimientos de tiempo son
importantes [2].
Los mtodos lineales tienen la ventaja de que son computacionalmente eficientes pero
sufren de una falta de exactitud y robustez. Los mtodos no lineales, en cambio, ofrecen
mayor exactitud y soluciones robustas pero son computacionalmente intensos y requieren
una buena estimacin inicial de los parmetros. La calidad de la estimacin lineal es
crtica para las tcnicas no lineales existentes.
A continuacin se presenta una revisin de los mtodos clsicos existentes.
5.7.1. Mtodos clsicos de calibracin
Mtodo de Tsai [18]
Este mtodo es el ms clsico de todos y tomado como referencia obligatoria, a la hora de
hablar de calibracin de cmaras digitales. Ha demostrado, desde su introduccin hace casi
dos dcadas, una muy buena exactitud y eficiencia, punto de partida para aplicaciones y
mejoras a lo largo de los ltimos aos. El modelo de cmara que utiliza el algoritmo de Tsai
es el pin-hole con distorsin radial . El mtodo de Tsai se vale de un patrn de calibracin
plano, y considera dos tipos de calibraciones: calibracin coplanar y calibracin no
coplanar.
El modelo tiene 11 parmetros: cinco parmetros internos (intrnsecos):
f - distancia focal efectiva del modelo pin-hole
kappa1 coeficiente de distorsin radial de primer orden,
Cx, Cy coordenadas del centro de la lente,
sx - factor de escala.
Y seis parmetros extrnsecos:
Rx, Ry, Rz componentes de rotacin,
Tx, Ty, Tz componentes de translacin.
Adicionalmente, el modelo de Tsai se vale de seis constantes intrnsecas fijas de la cmara
que deben ser proporcionadas por el fabricante. Para los datos coplanares el algoritmo de
Tsai requiere que la componente z de las coordenadas 3D sea igual a cero. Esto
generalmente es visto como un problema por la mayora de los investigadores [2], [25],

15

[26]. La calibracin coplanar bsica requiere al menos cinco datos y la calibracin no


coplanar requiere al menos siete. La calibracin completamente optimizada requiere al
menos 11 datos. El mtodo de Tsai utiliza la distancia focal de la cmara como parmetro
explcito de calibracin, pero para eso se vale de las constantes intrnsecas de la cmara
que, frecuentemente, el fabricante no proporciona [2].
Mejoras al mtodo de Tsai
Hay dos razones donde se presentan las principales dificultades del mtodo de Tsai,
primero el conocimiento previo de las constantes fijas y segundo la gran cantidad de puntos
del patrn de calibracin que necesita. Tcnicas como las de Luo [25] aportan soluciones
al problema del nmero de puntos necesario al utilizar un patrn de calibracin distinto al
de la figura 2. Por ejemplo, hay mtodos de calibracin que basados en los puntos de
borde de una figura cbica. Wei and Song [26] mostraron un mtodo que necesita tres
puntos de un cubo, para realizar una alineacin entre la imagen formada y el objeto tomado
como patrn de calibracin. .As mismo, Caprile y Torre [64] demostraron que los
parmetros intrnsecos relacionados a la distancia focal pueden ser recuperados desde una
imagen simple de un cubo. Adems, desde las dos imgenes de un cubo, los parmetros
extrnsecos desde una cmara a otra pueden ser obtenidos ajustando los correspondientes
puntos extremos en las dos imgenes. Ms recientemente, Eguillou introdujo una nueva
tcnica como extendida al trabajo de Caprile y Torre. Esta tcnica produce reconstruccin
3D desde una imagen simple aproximando el modelo con una caja limitada. El mtodo E.
Guillou [65] requiere seleccin manual de lineas en la imagen lo cual puede afectar la
precisin de los parmetros de la cmara. Aunque en este caso, no es un problema crucial,
sus objetos (las cajas limitadas) pueden ser ajustados para compensar cualquier error de
calibracin.
Luo introduce un mtodo de calibracin hbrido que combina la calibracin utilizando los
puntos borde y la "calibracin de fuerza bruta" (BFC). La calibracin BFC es una
calibracin de modelo manejado. En ella se asume que la cmara est fija y el modelo es
transformado en las coordenadas de la cmara. Hay seis grados de libertad para la
transformacin del modelo. La calibracin BFC es una solucin iterativa que provee
progresivamente alta eficiencia con cada sucesivo refinamiento, aunque como ya se dijo
estas soluciones iterativas consumen mucho tiempo por tener una bsqueda a travs de un
gran espacio de posibles transformaciones del modelo. Lo que hace Lou es aplicar la
calibracin por puntos de borde primero para obtener una estimacin inicial de la
transformacin y luego aplicar la calibracin BFC para refinar la solucin. De cierta
manera, es un mtodo de dos pasos, aunque puede ser visto como un mejoramiento de la
exactitud de la calibracin por bordes o una aceleracin del tiempo utilizado en la
calibracin BFC. Lou encontr en sus datos experimentales mejoras significativas a la
calibracin de Tsai. La figura 3 muestra el intento de alineacin de un borde de un objeto en
el mundo real con el borde de la imagen del objeto en el marco de la imagen.

16

P3

P2
P1

Cmara

Figura 3. Alineacin entre la imagen del objeto en el mundo real y la imagen adquirida por
la cmara para el mtodo de Luo, Wei y Robert. [25]
Shen y Menq [27] proponen un mtodo basado en las propiedades y el significado fsico de
los parmetros intrnsecos que utiliza tres pasos sin realizar procedimientos no lineales de
optimizacin. Dada la imagen del centro, la matriz rotacional, las matrices de translacin
en los ejes x y y y el factor de escala se pueden obtener analticamente en el primer
estado. Los efectos del factor de escala en la ortonormalidad de la matriz de rotacin
pueden ser revelados desde la formulacin analtica. La distancia focal efectiva, la
translacin z y el coeficiente de distorsin son obtenidos en la segunda etapa. El
desplazamiento del centro de la imagen se estima numricamente en el tercer paso. La
convergencia de la calibracin del centro de la imagen toma slo los pasos dos a tres. A
diferencia de los mtodos de mltiples etapas ya mencionados, el mtodo propuesto por
ellos no requiere un procedimiento de estimacin inicial ni un proceso de minimizacin no
lineal adicionales. La calibracin de los parmetros de la cmara tienen formulaciones
analticas y el coeficiente de distorsin puede ser resuelto en lo que los matemticos llaman
de forma cerrada. La dificultad con este mtodo puede estar en que su algoritmo de
implementacin de tres pasos se desarrollo dentro de un bucle que va obteniendo el valor
del centro de coordenadas y lo evala con una medida de tolerancia y se repite hasta que la
estimacin hecha sea menor a tal nivel de tolerancia, por lo que gasta algn tiempo en esto
y adems el algoritmo corre el riesgo de finalmente no converger, an ms tratndose de
mtodos lineales.

17

Mtodo de Toscani para la distorsin


Toscani [24] propone corregir la distorsin mediante el denominado mtodo de las rectas
de Brown, que consiste en aproximar hileras de puntos por rectas. Una vez corregida la
distorsin, ajusta las caractersticas corregidas (de la imagen adquirida) mediante un
modelo pin-hole en el que se supone una correspondencia punto a punto entre los centros
de los crculos y los centros de sus imgenes. Hay que aclarar que utiliza elipses o crculos
en el objeto patrn de calibracin. Este ajuste resulta en un sistema lineal de ecuaciones
sobredeterminado para obtener los parmetros. Las ecuaciones se resuelven con un sistema
de mnimos cuadrados con vnculos invariantes bajo cambios de sistema de coordenadas. A
diferencia de los mtodos de Tarel y Robert, Toscani es un mtodo no iterativo, lo cual lo
hace adecuado cuando los requerimientos de tiempo son importantes.
Mtodo de Tarel
Tarel [23] plantea un modelo pinhole con distorsiones pticas superpuestas, y un patrn de
calibracin cuyos elementos son crculos. El desarrollo de Tarel, se puede resumir en los
siguientes pasos:
1) El modelo pin-hole lleva crculos del patrn de calibracin en elipses de la imagen.
2) En el caso general los baricentros de los crculos no se transforman (a travs del pinhole) en los baricentros de las elipses (imgenes de los crculos). Las relaciones exactas,
que involucran al radio de los crculos, se deducen. Asimismo, se encuentran expresiones
para los transformados de los momentos de segundo orden de los crculos.
3) En el paso de composicin con la distorsin, por simplicidad, se hace la suposicin de
que el baricentro de la elipse distorsionada es la distorsin del baricentro de la elipse
original. Si bien esta suposicin no es cierta por la forma de la distorsin, es
aproximadamente vlida cuando el rea de las elipses es mucho menor que el rea de la
imagen (de forma que se pueda suponer una distorsin uniforme a lo largo de la superficie
de la elipse).
El paso final del mtodo de Tarel consiste en utilizar un mtodo de mnimos cuadrados no
lineal, para minimizar las distancias entre los baricentros de la elipse y los
baricentros de la imagen adquirida.

5.7.2. Mtodos de calibracin con tcnicas de inteligencia artificial


El xito de ciertas tcnicas de inteligencia artificial en aplicaciones de ingeniera tales como
el control de procesos y el modelamiento de plantas, se ha consolidado en los ltimos aos

18

con su utilizacin en los problemas de visin artificial. Despus de todo, si hacemos una
comparacin entre el ojo y cerebro humanos y un sistema cmara-computador, debemos
esperar que ante las restricciones presentadas por el elemento sensor (la cmara) el
computador sea capaz de hacer aproximaciones y extrapolaciones que le permitan realizar
sus tareas con la informacin captada, tal como hace el cerebro humano en muchsimos
casos. Estas tcnicas de interpretacin y procesamiento de datos digitales provenientes de
los elementos sensores de la visin artificial se han destacado principalmente en la
compresin de imgenes, deteccin de bordes, reconocimiento de caracteres, control de
calidad y deteccin de peligros mediante cmaras y diagnstico mdico visual, entre otros.
En cuanto a la calibracin de cmaras digitales, hay bibliografa interesante que apunta
hacia la solucin de este importante paso de la mayora de aplicaciones en visin artificial.
Sobresalen en este campo los mtodos que utilizan redes neuronales y los que aplican
algoritmos genticos. En cuanto a mtodos que aplican los conceptos de lgica fuzzy o
inteligencia colectiva, no se han observado an aplicaciones en calibracin de cmaras pero
se pueden esperar pronto por la extrapolacin del conocimiento.
Calibracin de cmaras con Algoritmos Genticos [30]
Como ya se toc al principio de la seccin, las tcnicas existentes de calibracin de cmaras
pueden ser ampliamente clasificadas en aproximaciones lineales y aproximaciones no
lineales. La dificultad con los mtodos lineales es su escasa precisin y robustez. La
solucin ideal podra estar en los mtodos no lineales pero stos son costosos
computacionalmente y requieren buenas estimaciones iniciales. Por ejemplo, la clsica
aproximacin fotogramtrica no lineal ([13], [27], [29]) no converge correctamente si las
estimaciones iniciales no estn muy cerca. Por lo tanto, la calidad de una estimacin lineal
es crtica para las aproximaciones no lineales existentes. En la mayora de las situaciones
fotogramtricas, el equipo auxiliar puede proveer estimaciones aproximadas de los
parmetros de la cmara. Por ejemplo, la escala y la distancia son conocidas hasta en un
10% y el ngulo es conocido dentro de 15 grados.
Para los problemas de visin artificial, no obstante, las soluciones aproximadas no son
usualmente conocidas a priori. Como ya vimos, para rodear este problema, una estrategia
comn en la visin artificial es atacar el problema de la calibracin de cmaras usando dos
pasos.
El primer paso que utiliza aproximaciones lineales es clave para el xito de los mtodos de
los dos pasos. La solucin aproximada provista por la tcnica lineal debe ser lo
suficientemente buena para que la subsecuente tcnica no lineal converja correctamente.
Siendo susceptible al ruido en las coordenadas de la imagen, las tcnicas lineales existentes
son, no obstante, notables por su falta de robustez y exactitud. Haralick y otros. [29]
muestran que cuando el nivel de ruido excede un nivel umbral o el nmero de puntos est
por debajo de un nivel umbral, estos mtodos se vuelven extremadamente inestables y los
errores se disparan. El uso de ms puntos puede ayudar a aliviar este problema. No
obstante, la fabricacin de ms puntos de control a menudo es ms dificultoso, costoso y

19

consume mayor tiempo. Para aplicaciones con un nmero limitado de puntos de control,
cerca al mnimo nmero requerido, es cuestionable que los mtodos lineales puedan
proveer consistente y robustamente estimaciones iniciales suficientemente buenas para que
el subsecuente procedimiento no lineal converja correctamente a la solucin ptima.
Otro problema es que casi todas las tcnicas no lineales empleadas en el segundo paso usan
variantes de tcnicas de optimizacin convencional tales como gradiente descendente,
gradiente conjugado o el mtodo de Newton. Todas ellas, por tanto, heredan los bien
conocidos problemas que acosan estos mtodos, nominalmente, como peor convergencia y
susceptibilidad para ser atrapados en un extremo local. Si el punto de inicio del algoritmo
no es bien escogido, la solucin puede divergir o quedar atrapada en un mnimo local. Esto
es especialmente cierto si la curva de la funcin objetivo contiene valles aislados. La
funcin objetivo para la calibracin de cmaras involucra 11 parmetros y conduce a una
superficie de error compleja con el mnimo global deseado escondido entre numerosos
extremos locales finitos. Consecuentemente, el riesgo de optimizacin local ms que
optimizacin local puede ser severo para mtodos convencionales.
Para aliviar los problemas con las tcnicas de calibracin existentes, Ji y Zhang [30]
exploraron un paradigma alternativo basado en Algoritmos Genticos (GAs) para los
mtodos de optimizacin convencionales no lineales. Los Algoritmos Genticos (GAs)
fueron diseados para buscar eficientemente en espacios grandes, no lineales y pobremente
entendidos y han sido ampliamente aplicados para resolver bsquedas dificultosas y
problemas de optimizacin que incluyen calibracin de cmaras, calibracin
espectromtrica y calibracin de modelos e instrumentos. Los Algoritmos Genticos tienen
caractersticas atractivas para los problemas de calibracin de cmaras porque ellos no
requieren modelos especficos o linealidades como en las aproximaciones clsicas y pueden
explorar todas las partes del espacio de los parmetros (probablemente incierto).
Comparado con los mtodos de optimizacin no lineales convencionales, los Algoritmos
Genticos ofrecen las siguientes ventajas claves:
1. Autonoma: los algoritmos genticos no requieren estimaciones iniciales. El conjunto
de parmetros iniciales es generado aleatoriamente en el dominio de parmetros ya
predefinido.
2. Robustez: conceptualmente, los Algoritmos Genticos trabajan con unas poblaciones
ricas y simultneamente suben muchos picos en paralelo durante el proceso de bsqueda.
Esto reduce significativamente la probabilidad de quedar atrapado en un mnimo local.
3. Inmunidad al ruido: los algoritmos genticos buscan un conjunto de parmetros
adecuados y se mueven hacia el ptimo global por la reduccin gradual la posibilidad de
reproducirse de los conjuntos de parmetros no adecuados (o con mal fitness). Esto adems
tiene un potencial de alta exactitud en situaciones de ruido.
Los resultados de este estudio son estimulantes y prometedores. El algoritmo gentico
propuesto puede converger rpidamente a la solucin correcta sin estimaciones iniciales y

20

con el mnimo nmero de puntos. Los autores creen que este estudio es significativo para
la visin artificial y la fotogrametra porque:
La tcnica propuesta no requiere buenas estimaciones iniciales de los parmetros de la
cmara.
La tcnica propuesta es robusta y exacta an con el nmero mnimo de puntos de control en
las situaciones de ruido.
Los Algoritmos Genticos son estocsticos, algoritmos de bsqueda paralelos basados en el
mecanismo natural de seleccin natural y el proceso de evolucin. Los algoritmos
genticos fueron diseados para buscar eficientemente en espacios no lineales y grandes
donde el conocimiento experto es inexacto o difcil de codificar, y donde las tcnicas
tradicionales de optimizacin fallan. Los algoritmos genticos ejecutan una bsqueda
multidireccional manteniendo una poblacin de soluciones potenciales y fomenta la
formacin de conocimiento e intercambia estas soluciones. Una poblacin es modificada
por la aplicacin probabilstica de los operadores genticos desde una generacin hasta la
siguiente. Las tres operaciones bsicas en los Algoritmos Genticos son 1) Evaluacin, 2)
seleccin; y 3) recombinacin, como se muestra en la figura 4. La evaluacin de cada
cadena, la cual codifica una solucin candidata, est basada en una funcin aptitud. Esto
corresponde a la determinacin ambiental de supervivencia en la seleccin natural. La
seleccin est hecha con base en la aptitud relativa y en ella se desecha probabilsticamente
las soluciones que tienen una aptitud relativamente baja. Las dos soluciones candidatas (pi
y pj) con alta aptitud son entonces escogidas para reproducirse.
La seleccin sirve para enfocar la bsqueda dentro de reas de alta aptitud. Por supuesto, si
la seleccin fuera el nico operador gentico, la poblacin no podra tener nunca otros
individuos aparte de los introducidos en la poblacin inicial. La nueva poblacin es
generada por la perturbacin de la solucin actual va recombinacin. La recombinacin, la
cual consiste de mutacin y cruzamiento, imita la reproduccin sexual. El cruzamiento es
un operador estocstico ya estructurado que permite el intercambio de informacin entre
soluciones candidatas. La forma ms simple de ejecutar un cruzamiento es escoger
randmicamente algn punto de cruce y todo aquello que est antes del punto de copia en
un primer padre y luego, todo lo que est despus del punto de cruce del segundo padre tal
como muestra la figura 4.

21

Seleccin
f(p1)=15%

p1

Poblacin

f(p2)=30%
pi

f(p3)=55%

pi

Fitness(f)

p2

Puntos cruce
Padres

ci

Hijos

pj

cj

Recombinacin

Evaluacin

Figura 4. Las tres operaciones genticas bsicas


Matemticamente el cruzamiento est dado por

cnew = pi + pj
donde,
pi y pj son los padres de la ltima iteracin o generacin

cnew
y

es el nuevo individuo en la presente generacin


son las proporciones de buenos alelos las cuales pueden probabilsticamente
heredadas desde

pi

pj.

Los alelos para las tcnicas computacionales son como una forma alternativa de un gen que
puede existir en una simple posicin de gen.
Despus de un cruzamiento, sigue la mutacin. Esto es para prevenir cadas de todas las
soluciones en poblaciones dentro de un ptimo local de la solucin del problema. El
operador mutacin introduce una nueva estructura gentica en la poblacin por el cambio
randmico de sus bloques constructores, ayudando a que el algoritmo escape de las
trampas de mnimos locales. Es claro, que el cruce y la mutacin constituyen la parte ms
importante de los algoritmos genticos. La eficiencia es influenciada principalmente por
estos dos operadores. En [30]-[32] se puede encontrar ms informacin sobre algoritmos
genticos, mutaciones y cruzamientos.

22

La operacin bsica de los Algoritmos Genticos puede ser resumida as:


1. Se genera randmicamente una poblacin de n arreglos de genes o cromosomas.
2. Se evala la adaptabilidad o fitness de cada cromosoma x en la poblacin
3. Se seleccionan dos cromosomas padres de la poblacin de acuerdo a su
adaptabilidad.
4. Con una probabilidad de cruzamiento se cruzan los padres para formar un nuevo
descendiente.
5. Con una probabilidad de mutacin se mutan los nuevos descendientes.
6. Se colocan los nuevos descendientes en una nueva poblacin
7. Se usa la nueva poblacin generada para correr nuevamente el algoritmo (desde el
paso) hasta que la condicin final se satisface.
Ji y Zhang implementaron un algoritmo muy avanzado que incluye hasta un nuevo tipo de
operador de mutacin y que busca el conjunto de parmetros que ofrezca mejor relacin
entre los puntos de la imagen y sus correspondientes puntos en las coordenadas del objeto.
Los cromosomas o arreglos de genes son un posible conjunto de parmetros que soluciona
la calibracin de la cmara. Esos cromosomas representan individuos de la poblacin que
evolucionar hasta hallar el mejor individuo es decir la solucin del problema.
Ji y Zhang sometieron su algoritmo a datos sintticos y de imgenes reales para evaluar su
eficiencia en trminos de su exactitud y de su robustez bajo
1. varias cantidades de ruido en la imagen,
2. diferentes nmero de puntos de calibracin,
3. diferentes rangos de lmites de parmetros.
Adems, hicieron una comparacin con el algoritmo de calibracin de Tsai [18].
Entre los resultados principales obtuvieron:
.

Suficiente exactitud puede ser alcanzada con el mnimo nmero de puntos de


control. Esto representa un avance prctico ya que muchos puntos de control
redundantes terminan usualmente haciendo los procedimientos costosos y lentos.

Demostraron considerable exactitud y robustez del algoritmo en presencia de


diferentes niveles de ruido.

El Algoritmo Gentico puede evitar los mnimos locales sin necesidad de hacer
buenas estimaciones iniciales.

Al comparar con el algoritmo de Tsai demostraron que aunque la tcnica Tsai es


muy exacta, sta cualidad disminuye dramticamente dentro de un intervalo corto
de niveles de ruido, es decir es muy limitado bajo condiciones de ruido. En
contraste, la aproximacin con AG mostr que los errores de la cmara permanecen
constantes para varios niveles de ruido y que el aumento de los puntos de

23

calibracin no mejora la exactitud del algoritmo. An ms, el mtodo tiene una alta
capacidad de inmunizacin contra las perturbaciones de la imagen.
En conclusin, se obtuvo una mejora importante al mtodo de Tsai tanto en exactitud y
robustez como en rapidez, porque el algoritmo gentico al no necesitar buenas estimaciones
iniciales y al ser protegido contra el estancamiento en mnimos locales, converge
rpidamente a la solucin final.
Calibracin de cmaras digitales con redes neuronales
Se debe tener en cuenta que las tcnicas basadas en modelos explcitos de sistemas de
visin fsica tienen un par de desventajas prcticas: 1. Las caractersticas pticas de las
cmaras son diferentes entre uno y otro mtodo que es probado para ser efectivo en un
sistema pero puede ser ineficiente para otros. Por ejemplo, ya se report que el mtodo de
Tsai puede ser peor que cualquier mtodo lineal simple si la distorsin de la lente es
relativamente baja [34]. 2. Prcticamente ningn modelo es capaz de describir un sistema
de visin perfectamente. Para obtener resultados exactos se requieren elaborados modelos y
elaborados con ecuaciones matemticas ms complicadas.
Estimulados por el reto de resolver estos problemas algunos investigadores han propuestas
tcnicas que involucren redes neuronales para la calibracin de cmaras digitales. Wen [35]
propone utilizar una red neuronal para describir la parte que permanece fuera del modelo
convencional de la proyeccin explcita. Las redes neuronales pueden ser vistas como otra
forma efectiva para la calibracin de cmaras en sistemas de visin artificial.
Segn Yongtae Do [36], las redes neuronales tienen varias caractersticas significativas para
la calibracin de cmaras. Primero, una red est hecha por una interconexin de neuronas
no lineales. Adems, la red neuronal tiene el potencial de aprender procesamiento de
imgenes no lineal. Segundo, la filosofa bsica detrs del aprendizaje supervisado de las
redes neuronales y de la calibracin de cmaras es similar. Tercero, usar una red neuronal
puede ser considerado como una solucin libre de modelo para el problema, lo cual est en
concordancia con las tcnicas de calibracin implcita.
Es bien conocido que una red neuronal multietapas puede aproximar cualquier funcin
continua a un deseado grado de exactitud [37]. Si consideramos la proyeccin y la
proyeccin hacia atrs como el mapeo entre el mundo y la imagen, la funcin identificada
por el mapeo puede ser aproximada sin complicados modelamientos matemticos.
Las redes neuronales tambin han sido usadas para resolver problemas de visin artificial
[40] tales como aplicaciones en estereosttica, estreo movilidad lateral y longitudinal,
computacin de flujo ptico y restauracin de imagen. La calibracin de cmaras con redes
neuronales es adems tratada en la literatura internacional ([41], [42], [43]).

24

Ahmed, Hemayed y Farag [45] presentan una propuesta de neurocalibracin basados en las
siguientes motivaciones:
Al igual que en las investigaciones con algoritmos genticos una motivacin para
adentrarse en el campo es que los mtodos no lineales tradicionales de calibracin
de cmaras requieren comenzar con una buena estimacin inicial de la solucin del
problema [19],[20],[44], mientras que con redes neuronales esa condicin se vuelve
menos exigente.
As mismo, usar un marco de trabajo basado en redes neuronales .permite hacer
aplicaciones de calibracin de cmaras sobre lentes activos automatizados [46].
Las tcnicas de redes neuronales apuntan en la actualidad a dos estilos de utilizacin:
1. Unas intentan aprender el mapeo desde el mundo 3D hasta la imagen 2D sin especificar
el modelo de la cmara [42].
2. Otras aplican las redes neuronales como un estado adicional para mejorar la eficiencia de
otras tcnicas ya existentes que se implementaran previamente [41], [43].
Los investigadores egipcios Ahmed, Hemayed y Farag, han trabajado intentando superar
estos dos estilos porque conocer los parmetros del modelo de la cmara entrega
informacin muy importante a las tareas de la visin artificial posteriores a la calibracin de
cmaras. Ellos presentaron una tcnica que va ms all de los mtodos existentes porque
implementaron una red neuronal que especifica los parmetros intrnsecos y extrnsecos
de la cmara. Para eso, ellos presentan un modelo de la cmara que considera la proyeccin
perspectiva basado en el clsico modelo pinhole.
De esta manera recordamos que si un punto D tiene coordenadas (X,Y,Z) en el mundo real y
se proyecta en un punto p cuyas coordenadas son (u,v), la operacin puede ser descrita en
coordenadas homogneas por la ecuacin:
su

sv = M
s

donde

m1

M= m 2
m
3

Y
Z

m14

m24
m34

Recordando que M es la matriz de proyeccin perspectiva y que puede ser descompuesta


en: M= Ic A

25

u 0 u0 1 0 0 0

donde I c 0 v v0 0 1 0 0
0 0 1 0 0 1 0

= 0 1

La dificultad proveniente de la no presencia de la distorsin en el modelo pinhole es ms


bien aprovechada como una ventaja por los autores egipcios, quienes proponen estimar los
coeficientes de distorsin para luego corregir la distorsin de los lentes en la imagen ya
capturada antes de que la calibracin tenga lugar [48]. Los beneficios son principalmente
dos. La exactitud de la calibracin no slo se incrementa sino que tambin permite
mantener una relacin simple entre (u,v) y (X,Y,Z) a travs de M haciendo las siguientes
tareas de la visin artificial ms fciles.
Dado, entonces un suficiente nmero de puntos cuyas coordenadas Di(Xi,Yi,Zi) en el mundo
real sean conocidas con precisin, as como sus correspondientes posiciones di(ui,vi) en el
marco de la imagen, se estiman los 11 parmetros de la cmara. Despus de hacer un
tratamiento matemtico que incluye la eliminacin del factor de escala S, el cual es
diferente para cada punto, el criterio de error E a ser minimizado es:
m D m14

E 1 i
u i
i 1 m 3 Di m34

m D m 24

2 i
vi
m 3 Di m34

La red neuronal propuesta no slo busca el mapeo de los puntos 3D a los pxeles 2D lo cual
minimiza el error E sino que tambin extrae la matriz de proyeccin y los parmetros de la
cmara. La red es una red neuronal feedforward de dos capas. La capa de entrada tiene
tres neuronas ms una fijada en 1. Estos son los tres correspondientes coordenadas X,Y,Z
del punto 3D. El nmero de unidades de salida es tres y la capa oculta consiste de cuatro
neuronas. La capa oculta y la capa de salida tienen funcin de activacin unitaria. La
matriz de pesos de la capa oculta se denota como V, y se asume que corresponde a los
parmetros extrnsecos de la matriz A. La matriz de pesos de la capa de salida es denotada
W y corresponde a los parmetros intrnsecos de la matriz Ic. Para cualquier patrn de
entrada i, N i 1, el vector de entrada est formado por Zi=(Xi,Yi,Zi,1)T y las salidas son
oik, con k = 1,2,3. con una nueva interpretacin del criterio de error E, la medida del error
podra tomarse como
o i1

u i
i 1 oi 3

oi 2

vi
oi 3

Esta ltima ecuacin no est en una forma manejable como para ser usada por una red
neuronal de gradiente descendente y error-manejado debido a la presencia de las dos
razones en trminos de las salidas de la red. Para resolver este problema, los investigadores
se inclinan a entrenar la red de tal manera que el valor deseado de oi3 sea 1 para eliminar las

26

fracciones.

Desafortunadamente, esto no es muy bueno porque significara que

m 3 Di m34 es igual a 1 para todo i. Claramente, no hay valores de m3 y de m34 que

mantengan tal igualdad para todo dato Di, resultando en la no convergencia de la red. Una
mejor solucin es entrenar la red dejando que el producto o i3 se aproxime a 1, de tal
manera que E se escribe
N

E ioi1 u i i oi 2 vi i oi 3 1
2

i 1

Cada patrn de entrada tendr su propio i. La pregunta ahora es qu valor debe tomar.
Inicialmente se coloca en 1 para todo i y luego se permite actualizarlo de acuerdo a las
reglas del gradiente descendente para minimizar el error E en la ltima ecuacin. Basado
en esto, el vector deseado para cada patrn (ui,vi,1)T es nombrado como di . Haciendo que
Oi = i oi, la dinmica de la red sigue las siguiente ecuaciones. Dado el patrn de entrada
Zi, la neurona j de la capa oculta produce la salida:
4

Y j V jl Z il
l 1

Mientras que la neurona k de la capa de salida produce:


4

O ik i Wkj Y j
j 1

La medida de error para el i-simo punto de entrada se expresara de forma ms sencilla:


E

1 N
d ik O ik 2

2 i 1

En la anterior ecuacin dik denota la k-sima componente del vector deseado di. Los pesos
de la red Wkj y Vij son inicializados en valores randmicos de -1 a 1. Ya que la cuarta
neurona de la capa de salida es fijada en 1, los correspondientes pesos para la capa de salida
seran Vl4, con l = 1,2,3 y V44 = 1. La red es entrenada con el algoritmo de backpropagation actualizando los pesos Wkj , Vij y i de acuerdo a las siguientes reglas de
gradiente descendente:
Wkj 1 (d ik Oik ) i Y j
3

Vij 1 i (d ik Oik )Wkj Z il


k 1

27

k 1

j 1

i 2 (d ik Oik ) Wkj Y j

donde 1 y 2 son dos constantes de aprendizaje positivas. Para el caso del aprendizaje de
la red, la entrada y los patrones deseados de la red son normalizados. Por lo tanto los dos
conjuntos, las coordenadas 2D de los pxeles y las coordenadas 3D de los puntos del mundo
real, son normalizados por s1 y s2, respectivamente. Despus del entrenamiento, la tan
anhelada matriz de proyeccin M puede igualarse a:
M = S1 W V S2
Donde S1 = diag(s1, s1,1) y S2 = diag( s 21 , s 21 , s 21 ,1)
Con estos dos ltimos mtodos de calibracin de cmaras que utilizan tcnicas de visin
artificial se demuestra que el marco conceptual para la realizacin de este proyecto se
encuentra suficientemente bien sustentado adems de que resalta la importancia de la
implementacin de un mtodo que aplique tales conceptos al tratarse de tecnologa de alto
impacto innovador especialmente en Iberoamrica.

28

6. INNOVACIN Y DESARROLLO TECNOLGICO

Desarrollar una aplicacin que involucre procesamiento de imgenes y algoritmos en redes


neuronales que permita identificar los parmetros de una cmara digital hasta tercer grado o
mayor y describir el modelo del sistema, significar un interesante avance en los mtodos
de calibracin de dispositivos fotogrficos digitales.
Con un buen mtodo de calibracin de cmaras digitales se aumenta la eficiencia en la
implementacin de aplicaciones de visin artificial como por ejemplo la visin
estereoscpica. El desarrollo tecnolgico se consigue en dos aspectos: primero, apropiacin
de los algoritmos de redes neuronales de identificacin de sistemas y segundo, lograr un
aporte en los procesos mtricos que llevan a utilizar la visin artificial, porque todos ellos
requieren pasar por la etapa de calibracin de la cmara a utilizada.
La investigacin pretende lograr una aplicacin prctica de un mtodo que supere algunas
deficiencias de los mtodos clsicos de calibracin de cmaras digitales.

29

7. IMPACTO Y ALCANCE DEL PROYECTO

El impacto de la investigacin se mide de acuerdo con los objetivos que se alcancen y


especialmente al anlisis comparativo del mtodo implementado con los mtodos ya
existentes. En la misma proporcin en que el mtodo implementado logre una buena
precisin de los modelos de las cmaras, facilite el trabajo de quien calibre y ahorre tiempo
de procesamiento a la vez que elimina costos de las aplicaciones crecer el impacto del
sistema dentro de las investigaciones en visin artificial que se llevan a cabo en este
momento a nivel internacional.
El trabajo tendr el efecto tecnolgico de acelerar el proceso de implementacin de
aplicaciones que utilicen cmaras digitales, y esto incluye sistemas de seguridad industrial,
de reconocimiento de patrones, robtica, medicin estereoscpica, identificacin de
personas. Tambin se busca reducir la intervencin humana en el proceso de calibracin y
con ello contribuir a disminuir errores sistemticos en el modelo de la cmara optimizando
los recursos de tiempo y dinero.

30

8. METODOLOGA

En la investigacin se realizar inicialmente una exploracin del estado del arte en la


calibracin de cmaras digitales, como punto de partida para saber que se debe hacer o
mejorar. Es una etapa de exploracin y solidificacin de conceptos y teoras.
Se recolectar informacin en revistas internacionales, haciendo especial uso de la Internet
y de los sitios virtuales del INRIA(l'Institut National de Recherche en Informatique et en
Automatique) y del MIT(Massachussets Institute Technique). Adems de esa valiosa fuente
se tendrn en cuenta los aportes de la Biblioteca Mario Carvajal, Biblioteca Departamental
y la biblioteca particular de los miembros de la ctedra de Percepcin y Sistemas
Inteligentes (PSI) de la escuela de Ingeniera Elctrica y Electrnica de la Universidad del
Valle.
A medida que se vaya recolectando esta informacin, se ir haciendo la lectura y
aprehensin del conocimiento que ms ayude a la solucin del problema y a los objetivos
planteados.
La segunda etapa del proyecto consiste en implementar diferentes algoritmos conocidos de
identificacin de cmaras en programas de computacin como MATLAB, SCILAB o
Visual C++. Cuando se tenga una buena experiencia de implementacin de este tipo de
algoritmos se propondr un nuevo mtodo que involucre identificacin de sistemas por
redes neuronales.
Cuando este nuevo mtodo est definido y desarrollado en un lenguaje de programacin, se
seguir con las pruebas de eficiencia comparativamente con los mtodos ya usados. Para
este anlisis se har uso de las herramientas estadsticas necesarias.
Mientras se va realizando esta comparacin es posible, llevar a cabo la optimizacin del
sistema de acuerdo con las mejoras que se deban hacer, e ir concluyendo acerca de los
beneficios y limitaciones del mtodo.
Cuando se alcancen los resultados esperados, se proceder a realizar una aplicacin para
automatizar el proceso de calibracin de las cmaras, de tal manera que facilite el trabajo al
usuario del sistema. Todo este diseo se caracterizar por tener la posibilidad de ampliarse
para futuras aplicaciones y ser utilizado de manera sencilla.

31

9. RECURSOS TECNOLGICOS DISPONIBLES PARA LA ELABORACIN DEL


PROYECTO

Se cuenta con el equipo de trabajo de laboratorio de electrnica, osciloscopios,


multmetros, analizadores y computadores. El computador a utilizar tiene los programas
necesarios para el desarrollo de los algoritmos de calibracin: MATLAB, DELPHI,
Microsoft Visual C++, SCILAB y sistema operativo Windows y Linux, cmaras digitales y
tarjetas de adquisicin de imgenes.
La ctedra de Percepcin y Sistemas Inteligente tiene a su disposicin importantes recursos
intelectuales al ser propulsora de investigaciones muy interesantes en Visin Artificial,
Redes Neuronales, Instrumentacin Inteligente y Robtica.
Adems como estudiante de La Universidad del Valle, el investigador a cargo tiene acceso a
la Biblioteca Mario Carvajal, y a informacin en diferentes publicaciones ubicadas en
documentos HTML de la Internet en todo el mundo.
Los directores del proyecto cuentan con contactos en diversos laboratorios internacionales.

32

10. PROPUESTA DE CONTENIDO

INTRODUCCIN GENERAL
1. ESTADO DEL ARTE
INTRODUCCIN
1.1. Modelacin de cmaras
1.2. Calibracin
1.3. Patrones de calibracin
1.4. Tcnicas de modelacin neuronales.
CONCLUSIONES
2. DESCRIPCIN DE LOS MODELOS DE CALIBRACIN A IMPLEMENTAR
INTRODUCCIN
2.1. Descripcin de las cmaras digitales
2.2. Mtodos de modelamiento
2.3. Mtodos lineales
2.4. Mtodos no lineales
2.5. Mtodo Implementado con redes neuronales
CONCLUSIONES
3. DESCRIPCIN DE LA HERRAMIENTA COMPUTACIONAL DESARROLLADA
4. RESULTADOS
INTRODUCCIN
4.1. Especificacin de las cmaras
4.2. Tratamiento de las imgenes
4.3. Patrones de calibracin
4.4. Resultados y Anlisis comparativo de precisin
CONCLUSIONES
5. CONCLUSIONES GENERALES
6. PERSPECTIVAS DE TRABAJO
7. REFERENCIAS BIBLIOGRFICAS
ANEXOS:
Manual del usuario
Teoremas matemticos
Cdigo fuente

33

11. CRONOGRAMA
LISTA DE ACTIVIDADES
1. RECOPILACIN BIBLIOGRFICA
2. IMPLEMENTACIN Y PRUEBA DE ALGORITMOS CLSICOS
3. DEFINICIN DE LA PROPUESTA DEL MTODO DE CALIBRACIN
4. IMPLEMENTACIN Y PRUEBA DEL MTODO
5. MEDICIN COMPARATIVA DE EFICIENCIA DEL NUEVO MTODO
6. OPTIMIZACIN DEL SISTEMA Y PRUEBAS FINALES
7. ELABORACIN DE MANUALES
8. ELABORACIN INFORME FINAL
Tabla esquemtica del Cronograma
Actividad

S E M A N A S
MES 1
1

1
2
3
4
5
6
7
8

MES 2
4

MES 3
8

10

11

MES 4
12

13

14

15

MES 5
16

17

18

19

MES 6
20

21

22

23

MES 7
24

25

26

27

MES 8
28

29

30

31

32

34

12. ESTRATEGIA DE DIVULGACIN

En Colombia ser muy importante realizar una divulgacin de los resultados obtenidos
especialmente en universidades y en los congresos de electrnica que se tengan previstos
para los prximos aos; en especial en el Simposio de Tratamiento de Seales, Imgenes y
Visin artificial organizado por la Sociedad Colombiana de Tratamiento de Seales. La
exposicin de esta investigacin podra realizarse en el marco de un seminario de pregrado
o postgrado de la escuela de Ingeniera Elctrica y Electrnica de la Universidad del Valle.
Los avances de la tesis se irn presentando en sesiones programadas al grupo de Percepcin
y Sistemas Inteligentes.
Tambin se prev, escribir un artculo para ser publicado en la revista Energa y
Computacin y se espera proponer otro a un congreso a nivel internacional.
As mismo, como parte del proceso de divulgacin es necesario habilitar un espacio en el
Internet para publicar los aspectos bsicos de la investigacin de tal manera que est
disponible en cualquier parte del mundo, especialmente en Latinoamrica.

35

13. PRESUPUESTO

APORTANTES
RUBROS
Personal

Directores
Estudiante
Equipo
PC Pentium IV
Osciloscopio
Digital 100MHz
Acceso a
Internet
Otros
Materiales
Cmara digital
Tarjeta de
adquisicin
Software
MATLAB 6.0
(Toolboxes y
Blocksets
usados en el
proyecto)
Microsoft
Windows
Paquete
completo
Bibliografa
Viajes (Congreso)
Publicaciones
TOTAL

TOTAL
ESTUDIANTE UNIVERSIDAD
DEL VALLE
8.400.000
7.560.000
1.800.000
1.800.000
3.000.000

15.960.000
3.600.000
3.000.000

300.000

700.000

1.000.000

200.000

200.000
400.000
700.000

400.000
400.000
700.000

9.100.000

300.000
200.000
700.000
50.000
11.310.000

9.100.000

300.000
500.000
24.600

700.000
700.000
50.000
36.110.000

*P.S.I. Ctedra de Percepcin y Sistemas Inteligentes de la escuela de Ingeniera Elctrica


y Electrnica de la Universidad del Valle

36

REFERENCIAS BIBLIOGRFICAS

[1] Horaud R.,Monga O.


edicin.1995

Vison par ordinateur Outils Fondamentaux.

Hermes. 2a.

[2] Azar A., Mus P. Calibracin monocular de cmaras. Instituto de Ingeniera Elctrica,
Facultad de Ingeniera. Universidad de la Repblica. Uruguay. 1999
[3] C. Gonzlez, P.E. Woods, Digital Image Processing Third Edition. Addison-Wesley,
1993
[4] A Flexible New Technique for Camera Calibration Zhengyou Zhang
http://research.microsoft.com/zhang
[5] E. R. Davies Machine Vision: Theory, Algorithms, Practicalities.. Academic Press.
Hartcourt Brace et Company Publishers. 1992
[6] S. W. Shih, Y. P. Hung, and W. S. Lin, Accurate linear technique for camera calibration
considering lens distortion by solving an eigenvalue problem, Opt. Eng., vol. 32, no. 1, pp.
138149, 1993. S. A.
[7] Y. I. Abdel-Aziz and H. M. Karara, Direct linear transformation into object space
coordinates in close-range photogrammetry, in Proc. Symp. on Close-Range
Photogrammetry, Urbana, IL, Jan. 1971, pp. 118.
[8] D. C. Brown, Close-range camera calibration, Photogramm. Eng. Remote Sens., vol.
37, pp. 855866, 1971.
[9] K. W. Wong, Mathematical formulation and digital analysis in closerange
photogrammetry, Photogramm. Eng. Remote Sens., vol. 41, no. 11, pp. 13551373, 1975.
[10] W. Faig, Calibration of close-range photogrammetry systems: Mathematical
formulation, Photogramm. Eng. Remote Sens., vol. 41, pp. 14791486, 1975.
[11] D. B. Gennery, Stereo-camera calibration, in Proc. Image Understanding Workshop,
Menlo Park, CA, 1979, pp. 101108.
[12] A. Okamoto, Orientation and construction of modelsPart i: The orientation problem
in close-range photogrammetry, Photogramm. Eng. Remote Sens., vol. 5, pp. 14371454,
1981.
[13] American Society of Photogrammetry, Manual of Photogrammetry, 4th ed., 1980.

37

[14] I. Sobel, On calibrating computer controlled cameras for perceiving 3d


scenes, Artif. Intell., vol. 5, pp. 14371454, 1974.
[15] L. Paquette, R. Stampfler,W. A. Devis, and T. M. Caelli, A new camera calibration
method for robotic vision, in Proceedings SPIE: Closed Range Photogrammetry Meets
Machine Vision, Zurich, Switzerland, 1990, pp. 656663.
[16] H. Bacakoglu and M. S. Kamel, A three-step camera calibration method, IEEE
Trans. Instrum. Meas., vol. 46, pp. 11651172, 1997.
[17] C. Chatterjee, V. P. Roychowdhury, and E. K. P. Chong, A nonlinear GaussSeidel
algorithm for noncoplanar and coplanar camera calibration with convergence analysis,
Computer Vision and Image Understanding, vol. 67, no. 1, pp. 5880, 1997.
[18] R. Y. Tsai, A versatile camera calibration technique for high-accuracy 3D machine
vision metrology using off-the-shelf TV camera and lenses, IEEE Trans. Robot. Automat.,
vol. RA-3, pp. 323344, Aug. 1987.
[19] Olivier Faugeras, Three-dimensional computer vision: a geometric viewpoint," MIT
Press, 1993.
[20] J.Weng, P. Cohen, and M. Herniou, Camera calibration with distortion models and
accuracy evaluation, IEEE Trans. Pattern Anal. Machine Intell., vol. 10, pp. 965980,
1992.
[21] RY.Tsai, "An efficient and accurate camera calibration technique for 3d machine
vision, " Conference on Computer Vision and Pattern Recognition, pp. 364-374, Miami
Beach, USA, June 1986.
[22] L.Robert, "Camera Calibration without Feature Extraction," Rapport de recherche N
2204, INRIA, 1994.
[23] J.P.Tarel, "Calibration de camra fonde sur les ellipses," Rapport de recherche N
2200, INRIA, 1994.
[24] G.Toscani, "Systmes de calibration et perception du mouvement en Vision
Artificielle," PhD thesis, Universit Paris-Sud, 1987.
[25] Alison Luo and Alex Pang. A Variable Precision Hybrid Camera Calibration Method
Computer Science Department University of California, Santa Cruz, CA, USA
www.cse.ucsc.edu/~alison/Publications/camera.pdf 2001
[26] G.-Q. Wei, Z. He, and S. D. Ma, Camera calibration by vanishing point and cross
ratio, in International Conference on Acoustics, Speech and Signal Processing, vol. 3.4,
pp. 16303, 1989.

38

[27] Tzung-Sz Shen and Chia-Hsiang Menq Automatic Camera Calibration for a MultipleSensor Integrated Coordinate Measurement System. IEEE Transactions On Robotics And
Automation, Vol. 17, No. 4, Agosto 2001
[28] Slama, C. C. Manual of photogrammetry American society of Photogrammetry.
Falls Church, VA. 1980
[29] P. R. Wolf, Elements of Photogrammetry. New York: McGraw-Hill, 1974.
[29] R. M. Haralick, H. Joo, C. Lee, X. Zhang, V. Vaidya, and M. Kim, Pose estimation
from corresponding point data, IEEE Trans. Syst., Man, Cybern., vol. 19, pp. 14261446,
June 1989.
[30] Q. Ji, Y. Zhang. Camera Calibration with Genetic Algorithms. IEEE Transactions On
Systems, Man, And CyberneticsPart A: Systems And Humans, Vol. 31, No. 2, March
2001
[31] W. M. Spears, Crossover or mutation, in Proc. Foundations Genetic Algorithms
Workshop, 1992, pp. 221237.
[32] M. Mitchell, An Introduction to Genetic Algorithms. Cambridge, MA: MIT Press,
1996.
[33] Z. Michalewicz, Genetic Algorithms+Data Structure=Evolution Programs. New York:
Springer-Verlag, 1992.
[34] S.-W.Shih, Y.-P.Hung, and W.-S.Lin, When should consider lens distortion in camera
calibration, Pattern Recognition, Vol.28, No.3, pp.447-461, 1995.
[35] J.Wen and G.Schweitzer, "Hybrid calibration of CCD cameras using artificial neural
nets," Int. Joint Conf. Neural Networks, pp.337-342, 1991.
[36] Y. Do, Application of Neural Networks for Stereo-Camera Calibration School of
Computer and Communication Engineering, Taegu University, Kyungsan-City,
Kyungpook, 712-714, Korea
[37] K.-I.Funahashi, "On the approximate realization of continuous mapping by neural
networks," Neural Networks, Vol.2, pp.183-192, 1989.
[38] Y.Do, S.-H.Yoo, and D.-S.Lee, Direct calibration methodology for stereo cameras,
SPIE Conf. Vol. 3521: Machine vision systems for inspection and metrology VII pp.54-65,
1998.

39

[39] A.Cichocki and R.Unbehauen, Simplified neural networks for solving linear least
squares and total least squares problems in real time, IEEE Trans. Neural Networks, Vol.5,
No.6, pp.910-923, 1994.
[40] Y. Zhou and R. Chellappa, Artificial neural networks for computer vision", SpringerVerlag, 1992.
[41] J. Wen and G. Schweitzer, Hybrid calibration of CCD cameras using artificial neural
nets," Proc. Int Joint Conf. Neural Networks (New York), Vol. 1, Nov. 1991.
[42] M. Lynch and C. Dagli, Backpropagation neural net-work for stereoscopic vision
calibration," Proc. SPIE. Int. Soc. Opt. Eng., Vol. 1615, Nov. 1991.
[43] D. Choi, S. Oh, H. Chang and K. Kim, Nonlinear camera calibration using neural
networks," Neural, parallel and scientific computations, Vol. 2, No. 1, March 1994.
[44] Mengxiang Li and Jean-Marc Lavest, Some aspects of zoom lens camera calibration"
IEEE Trans. Patt. Anal. and Machine Intell., Vol. 18, Nov. 1996.
[45] Moumen T. Ahmed, ElSayed E. Hemayed and Aly A. Farag. Neurocalibration: A
Neural Network That Can Tell Camera Calibration Parameters IEEE Trans. Patt. Anal.
And Machine Intell. 1999
[46] R. G. Willson, Modeling and calibration of auto- mated zoom lenses", PhD
dissertation, Dept. Elect. Comp. Eng., Carnegie Mellon Univ., 1994.
[47] Y. Zhou and R. Chellappa, Artificial neural networks for computer vision", SpringerVerlag, 1992.
[48] T. Pajdla, T.Werner, V. Hlavac, Correcting radial lens distortion without knowledge of
3D structure Technical Report, Machine Perception Center, Czech Technical University,
Dec. 1997.
[49] M. Ahmed, A. Farag. A neural optimizacin framework for zoom lens camera
calibration CVIP Lab, ECE Dept. University of Louisville. 1999.
[50] H. Ballard, C.M. Brown, Computer Vision Prentice Hall Inc., 1992
[51] Sing-Tzo Bou, Pattern recognition and Image prepocessing, Dekker. 1985
[52] CROWLEY, J.L., Bobet, P. and Scmid, C. Auto-calibration by direct observation of
objects. Image Vision Comput. V. 11, No. 2, pg. 67-81. 1993

40

[53] Cumani, A. and Guiducci, A. Geometric Camera Calibration the virtual camera
approach Machine Vision and Applications, vol 8, No. 6. pg. 375-384. 1995
[54] O. Duda, P. E. Hart, Pattern recognition and Scene Analysis John Willey. 1973
[55] R.C. Gonzlez y C.S.G. Lee, Robtica, Mc Graw Hill. 1990
[56] Haralick, R. M. Determining camera parameters from the perspective projection of a
rectangle. Pattern Recognition. V. 22. pg. 225-230. 1989
[57] Berthold Klaus P. Horn, Robot Vision MIT Press, 1986
[58] Lenz R.K.,RY. Tsai. Techniques for calibration of the scale factor and image center
for high accuracy 3D machine vision metrology IEEE Transaction on PAMI. Vol. 10. No.
5. September. 1988.
[59] Maravall, Reconocimiento de formas y visin artificial, Rama. 1993.
[60] ROBERT, L. Camera calibration without feature extraction Computer Vision Image
Understanding. Vol. 63,No. 2, pg. 314-325.
[61] Slama, C. C. Manual of photogrammetry American society of Photogrammetry.
Falls Church, VA. 1980
[62] T. Tou, R. C. Gonzlez, Pattern Recognition Principles, Addison-Wesley.1981
[63] Zhang, Z. Motion and structure of four points from one motion of a stereo rig with
unknown extrinsic parameters IEEE. Transaction on Pattern Anal. Mach. Intell. Vol 17,
No. 12, pg. 1222-1227. 1995.
[64] B. Caprile and V. Torre, Using vanishing points for camera calibration International
Journal of Computer vision, vol. 4, pp. 12740, 1990.
.
[65] E. Guillou, D. Meneveaux, E. Maisel, and K. Bouatouch, Using vanishing points for
camera calibration and coarse 3D reconstruction from a single image Visual Computer,
vol. 16, no. 7, pp. 396 410, 2000.