Professional Documents
Culture Documents
1
]
1
1
]
1
!
sen
sen
!
cos
cos
6
6
1imilares situaciones son posibles sobre el eje : y el eje ;. #ara e%presar satisfactoriamente las
rotaciones tridimensionales se requiere una notacin ms general utilizando matrices 9%9! la
matriz para una rotacin sobre el eje >7
1
1
1
]
1
2 @ @
@ cos
@ cos
+ -
sen
sen
"
*e esta manera! para la rotacin sobre el eje : y la rotacin sobre el eje ; quedara as7
1
1
1
]
1
cos @
cos @
@ @ 2
+ -
sen
sen !
1
1
1
]
1
cos @
@ 2 @
@ cos
+ -
sen
sen
#ara hacer una rotacin arbitraria en 9*! se aplican sucesivamente las rotaciones en cada eje.
Esto se e%presa como7
+ - + - + - " ! #
. Esta es una rotacin compuesta en la cual se
aplican sucesivamente y en orden! las rotaciones >! ; y finalmente :. *e manera general se
puede e%presar el resultado como una rotacin 87
-:6!;6+
;
;
6
:
6
:
6
@
igura 9.2 Efecto de una rotacin sobre el origen
1
1
1
]
1
1
1
1
]
1
1
1
1
]
1
"
!
# # #
# # #
# # #
"
!
99 9/ 92
/9 // /2
29 2/ 22
6
6
6
1e debe notar que la matriz 8 no es completamente general7 es ortogonal y tiene la propiedad que
hace 8
A2
B8
"
. En contraste con la rotacin! la translacin a travs de una distancia -"
2
!"
/
!"
9
+ est
dada por7
3
2
1
$ " "
$
$ ! !
+
+
+
6
6
6
Estas tres ecuaciones no son e%presables en trminos de una matriz 9%9. *e todas formas! as
como una rotacin general puede ser e%presada como una rotacin sobre varios ejes
coordenados! una translacin general y las rotaciones pueden ser e%presadas como secuencias de
rotaciones bsicas y translaciones relativas a ejes coordenados individuales. #or eso es ms ,til
tener una notacin que unifique el tratamiento matemtico de tal manera que un desplazamiento
generalizado pueda ser e%presado como un producto de matrices. "al notacin es conocida como
coordenadas homog%neas. 'as matrices deben ser aumentadas a 3%3. Una rotacin general se
puede e%presar como7
1
1
1
1
]
1
1
1
1
1
]
1
1
1
1
1
]
1
2 2 @ @ @
@
@
@
2
6
6
6
99 9/ 92
/9 // /2
29 2/ 22
"
!
# # #
# # #
# # #
"
!
$ientras tanto la matriz de translaciones se convierte en7
1
1
1
1
]
1
1
1
1
1
]
1
1
1
1
1
]
1
2 2 @ @ @
2 @ @
@ 2 @
@ @ 2
2
6
6
6
9
/
2
"
!
$
$
$
"
!
'a transformacin del desplazamiento generalizado -translacin ms rotacin+ toma la forma7
1
1
1
1
]
1
1
1
1
1
]
1
1
1
1
1
]
1
2 2 @ @ @ 2
6
6
6
9 99 9/ 92
/ /9 // /2
2 29 2/ 22
"
!
$ # # #
$ # # #
$ # # #
"
!
"ambin e%presada por7
1
1
1
1
]
1
1
]
1
1
1
1
1
]
1
2
2
2
6
6
6
"
!
"
!
T
0
T R
*onde R es una matriz 9C9 de rotacin! T es un vector 9C2 de translacin! y 0 es un vector
nulo de dimensin 2C9.
El modelo pinhole para la transformacin cmara imagen .20.90
#ara detallar la transformacin interna de la escena en la cmara para obtener la imagen! se
referencian los tres planos que intervienen en el proceso como muestra la figura 3.
En el particular caso de la proyeccin perspectiva! se sigue el procedimiento geomtrico
necesario para despejar x
*
! y
*
y z
*
a partir de la figura 5 sin tener que poner e%plcitamente los
ngulos de rotacin! gracias a la semejanza de tringulos7
!"
#
$
%
&'
('
)
O
*
&'
y'
(+
,'
igura 3. $odelo pinhole de una cmara
f
-'
"'
!'
$arco de referencia del
objeto en el mundo real
$arco de referencia del plano
de la imagen o de la retina
$arco de referencia de la
cmara
(&
'
) y
'
) f)
. %
#
)entro de la cmara o foco
*istancia focal
-
"
!
"
-
)oordenadas del punto <
seg,n el marco de
referencia de la cmara
luego de realizar la
translacin y la rotacin.
)oordenadas seg,n el
marco de referencia del
mundo en 8
9
)oordenadas de la proyeccin
del punto < en el plano imagen
-punto b+ con la cmara como
marco de referencia
igura 5. 1emejanza de los tringulos formados por el eje de la cmara y una lnea que une el punto < proyectado
sobre el plano de la imagen en la coordenada :=
1i se e%tiende la semejanza de tringulos a los todos los ejes se obtiene que las coordenadas
seg,n el marco de referencia de la cmara del punto < proyectado en el plano de la imagen
-punto b+ son7
f (
( y f y
( & f &
C
6+ D ? - C
6+ 6D - C
1i se define s B (* + f! se deja a z como una variable libre ya que no es importante en el plano
bidimensional y se pueden adoptar las coordenadas homogneas7
1
1
1
1
]
1
1
1
1
1
]
1
1
1
1
1
]
1
s
s(
sy
s&
(
y
&
f
C
C
C
2
?
?
?
@ D 2 @ @
@ 2 @ @
@ @ 2 @
@ @ @ 2
*onde definimos / la matriz de proyeccin perspectiva como7
/ 0
1
1
1
1
]
1
@ D 2 @ @
@ 2 @ @
@ @ 2 @
@ @ @ 2
f
1e ha encontrado una matriz de transformacin 3%3 que opera en coordenadas de 3 dimensiones.
Esto no corresponde directamente a las coordenadas reales! pero la coordenadas tridimensionales
pueden ser calculadas desde all! dividiendo las primeras tres entre la cuarta coordenada
homognea. )uando se derivan coordenadas homogneas de las reales coordenadas
tridimensionales! se puede emplear cualquier factor multiplicativo constante h! aunque
normalmente se usa igual a uno.
'a ventaja de las coordenadas homogneas es la conveniencia de tener una sencilla matriz
multiplicativa para cualquier transformacin! a pesar del hecho de que la transformacin
perspectiva es intrnsecamente no lineal! lo que quiere decir que una transformacin noAlineal
muy compleja puede ser reducida a una transformacin lineal directa. Esto facilita los clculos
eje de la cmara
%C
%= -punto < proyectado en el eje : de las
coordenadas de la cmara+
f z=
de la calibracin de cmaras. "ambin se debe notar que casi todas las transformaciones pueden
ser invertidas si se invierte la correspondiente matriz de transformacin en coordenadas
homogneas. 'a e%cepcin es la transformacin perspectiva! por la cual el valor fijo de z=
conduce a un valor desconocido de zC y con %C! yC dependiendo del valor de zC! el cual es muy
importante en la visin binocular o estereoscpica donde se analiza profundidad de la escena.
Eo obstante! en general los objetos vistos por la cmara tienen posiciones que deben ser
conocidas en las coordenadas del mundo real! pero sin ser conocidas a priori en las coordenadas
de la cmara! ya que la cmara! generalmente se monta en una posicin arbitraria. 1i la cmara
est sobre! por ejemplo! un brazo de robot! la informacin debe ser muy precisa. #or eso es que
es importante la calibracin de cmaras antes de que las imgenes puedan ser usadas en
aplicaciones robticas. Una vez halladas las coordenadas del punto b en el plano de la imagen en
el marco de referencia de la cmara! se pasa a definir las coordenadas de ese mismo punto b pero
en coordenadas definidas por el marco de referencia del propio marco o plano de la imagen que
es lo que se ve en la pantalla del computador.
Transformac!n coor"#na"as$ c%mara&coor"#na"as$ ma'#n
'os puntos de la imagen son la medida en p%eles del marco de referencia bidimensional u-v)
asociados en la figura 3. )on el fin de poder escribir la matriz de transformacin del sistema de
coordenadas de la cmara al sistema de coordenadas de la imagen! se introducen los parmetros
u
o
) v
o
y F
o
que son las coordenadas de ! en el sistema de coordenadas de la imagen -medido en
p%eles+ ! ,
u
es el factor de escala vertical y ,
v
es el factor de escala horizontal. Estos factores de
escala representan el ajuste de escala desde la medicin del objeto en 8
9
en milmetros hasta la
imagen en 8
/
cuyas ubicaciones estn dadas por p%eles. #or lo tanto! estos factores de
escalamiento tienen dimensiones p%elesDmm. 1i son iguales! los p%eles de la imagen son
cuadrados. .20
'as coordenadas de en el marco de referencia de la imagen medido en p%eles son7 @
! @
y
@
y
@
,
_
-
v
u
B
,
_
@ @ @
@ @
@ @
v
u
,
,
,
_
,
_
,
_
@
@
@
C
C
C
2 @ @
@ 2 @
@ @ 2
-
v
u
(
y
&
,
u
:
factor de escala vertical
,
v
: factor de escala horizontal
)oncretamente los puntos formados en el plano de la imagen tienen una coordenada F nula y as
se puede ignorar el factor multiplicativo de la tercera fila.
,
_
h
hv
hu
B
,
_
@ @ @
@ @
@ @
v
u
,
,
,
_
,
_
,
_
2 C
C
C
2 @ @
@ 2 @
@ @ 2
@
@
v
u
(
y
&
donde obviamente h B2
Esta transformacin representa una aplicacin lineal! si representamos ( como7
(B
,
_
2 @ @ @
@ @
@ @
@
@
v ,
u ,
v
u
tenemos
,
_
,
_
2
C
C
C
(
y
&
h
hv
hu
(
/armetros intr1nsecos
&l multiplicar las matrices ( y P se pueden escribir las ecuaciones del modelo geomtrico de la
cmara! es decir la relacin entre las coordenadas seg,n el marco de referencia de la cmara
-%=! y=! z=+ del punto < y las coordenadas seg,n el marco de referencia de la imagen -u)v) del
punto b.20 .
u . -,
u
. f .
?
?
(
&
G u
/
v . ,
v
. f .
?
?
(
y
G v
/
En efecto! el producto de (P es7
,
_
@ D 2 @ @
@ D @
@ D @
@
@
f
f u ,v
f u ,
u
&l multiplicar los coeficientes de la matriz por la distancia focal f) con el fin de enmascarar este
parmetro y no tener la necesidad de calcularlo e%plcitamente se obtiene7
I
) B
,
_
@ 2 @ @
@ @
@ @
@
@
v
u
v
u
,
_
,
_
s
(
y
&
v
sv
su
Ic
'os parmetros a ser estimados por la calibracin son
0
u
B A,
u
f
0
v
. ,
v
f
u
o
v
o
)omo se ve no es posible calcular e%plcitamente la distancia focal. 'as coordenadas en el plano
de la cmara son7
&
c
. &1 + (1
y
c
. y1 + (1
(
c
. 2
'a relacin entre las coordenadas de la imagen y las coordenadas de la cmara son7
u B
u
%
c
G u
@
con
u
H @
v B
v
y
c
G v
/
*e forma matricial7
,
_
,
_
2 2
c
c
y
&
v
u
C
con C B
,
_
2 @ @
@
@
@
@
v
u
v
u
,
_
,
_
@ 2 @ @
@ @ 2 @
@ @ @ 2
2 @ @
@
@
@
@
v
u
v
u
c
I
Transformac!n coor"#na"as$m)n"o$r#a*&coor"#na"as$c%mara
/armetros e-tr1nsecos
)omo ya se haba e%plicado la transformacin mundo D cmara! es la que permite e%presar el
cambio de coordenadas del mundo real a las coordenadas seg,n el marco de referencia de la
cmara. 8emontndonos a las figuras / y 3 recordamos que dicha transformacin se compone
de una rotacin y una translacin7
,
_
?
?
?
(
y
&
B
,
_
99 9/ 92
/9 // /2
29 2/ 22
r r r
r r r
r r r
,
_
(
y
&
G
,
_
(
y
&
t
t
t
8otacin y "ranslacin
'a transformacin rgida -rotacin y translacin+ puede ser escrita en la forma de una
transformacin homognea7
B
,
_
2 @ @ @
99
9/
92
/9 // /2
29 2/ 22
(
y
&
t r r r
t r r r
t r r r
B
,
_
2 0
t R
&qu se observa una transformacin rgida -tres rotaciones y tres translaciones+7 esos son los
parmetros e%trnsecos. 'a matriz inversa est dada por la siguiente e%presin7
2
,
_
2
2 2
0
t R R
Transformac!n m)n"o & ma'#n
"eniendo ya las e%presiones matemticas para transformaciones mundoDcamara y cmaraDimagen
es posible unirlas para hallar una sola e%presin que represente la transformacin mundoDimagen!
es lo que en la figura / se ha llamado matriz de transformacin M definida por
MB I
c
AB
,
_
@ 2 @ @
@ @
@ @
@
@
v
u
v
u
,
_
2 @ @ @
99 9/ 92
/9 // /2
29 2/ 22
(
y
&
t r r r
t r r r
t r r r
B
,
_
+ +
+ +
(
( y v u
( & u u
t
t v t
t t
9
@ 9 @ /
@ 9 @ 2
r
r r
r r
donde los componentes estn dadas por las filas tipo r
i
B
( )
9 / 2 i i i
r r r
.
1e reescribe la matriz de transformacin rgida mundoDcmara como7
AB
,
_
2 @
9
/
2
(
&
t
t
t
y
r
r
r
'a matriz de transformacin mundoDimagen puede ser escrita de la forma7
,
_
s
sv
su
B
,
_
93 99 9/ 92
/3 /9 // /2
23 29 2/ 22
m m m m
m m m m
m m m m
,
_
2
"
!
:!;!> son las coordenadas del punto < del mundo real en el marco de referencia de la mira. Esta
matriz puede ser escrita de forma ms simple7
MB
,
_
93 9
/3 /
23 2
m
m
m
m
m
m
m
i B
( )
9 / 2 i i i
m m m
r
9
B m
9
I
@
B m
2.J
m
9
K
@
B m
/ J
m
9
L
u
B AMMm
2
m
9
MM
L
v
B MMm
/
m
9
MM
+ - D 2
9 @ 2
2
m m
u
r
93
93 @ /3
93 @ 23
9 @ / /
+ - D 2
+ - D 2
+ - D 2
m t
m m t
m m t
m m
(
v y
u &
v
r
E-traccin de parmetros
'os pasos para encontrar los parmetros intrnsecos son7
2. Estimar los coeficientes de la matriz proyeccin $.
/. E%traer los parmetros de la cmara a partir de sus coeficientes! con la utilizacin de las
ecuaciones anteriores.
El modelo presentado anteriormente corresponde a un modelo lineal que no tiene presente la
distorsin de la lente y a,n as es complicado hallar los parmetros de la cmara. 'os modelos
que tienen en cuenta la distorsin de la lente adicionan algunos coeficientes de distorsin .2N0!
./@0. 'a mayora de los mtodos actuales manejan el modelo pinhole clsico y sus variaciones
principales apuntan hacia la manera en que toman en cuenta la distorsin con el objeto de mejorar
la e%actitud de la calibracin. En esta investigacin se busca resumir el proceso de calibracin
mediante un algoritmo que coja el sistema de entradas -coordenadas mundo real+ y salidas
-coordenadas imagen+ y lo identifique a travs de un programa que utilice los conceptos de
modelamiento de redes neuronales. En conclusin lo que se necesita es conocer las coordenadas
del mundo real y las coordenadas obtenidas por la cmara en la imagen! para hallar el modelo
propio del dispositivo de adquisicin de imgenes. #ara esto se puede usar en el mundo real un
patrn como el de la igura / .20.307
+')ra ,. *os conjuntos de puntos coplanares formando parte de una esquina proveen
los puntos requeridos para las entradas de un sistema de calibracin de cmaras digitales.
2n modelo con distorsin
1e ha mencionado con anterioridad que el modelo pinhole de la cmara es un modelo ideal que
no tiene en cuenta varias aberraciones pticas propias de los lentes. Entre ellas la ms destacada
es la llamada distorsin radial en la que de todas formas hay una relacin punto a punto entre la
escena y la imagen! pero en el que el correspondiente de cada punto se desva de su proyeccin
en una magnitud proporcional a su distancia al eje ptico.
'a figura muestra un ejemplo de distorsin! note que all la variable u ser remplazada por la
variable % y la variable v por la variable y! con respecto a las figuras / y 3
En este caso se sigue que -%d! yd+ son las coordenadas de un punto determinado en el marco de
referencia del plano de la imagen tal como se ven en la pantalla del computador! mientras que
-%i! yi+ son las coordenadas del mismo punto pero aquellas que se obtienen al asumir el modelo
pinhole ideal sin distorsin. Entre ms alejado est el punto del centro de la imagen mayor ser su
alejamiento del punto ideal! es decir el desplazamiento que ocasiona la distorsin -que es visto
como un error+ es ms grande! entre ms alejado est el punto del centro de la imagen. #or eso se
llama distorsin radial! depende del radio de un crculo cuyo centro es el centro de la imagen
Esto se puede ver ms detalladamente en la siguiente figura7
%
y
-O%! Oy+
-%d! yd+
-%i! yi+
:d
:p
:c
;d ;p
;c
$p
$d
'as coordenadas del punto $p en la imagen son -:p!;p+ y las del mismo punto pero teniendo en
cuenta restarle la distorsin son $d-:d!;d+.
1e puede e%presar el desplazamiento del punto $p al punto $d como la suma de una distancia
positiva. Eso es porque se toma al punto $d como el punto que da la imagen
-distorsionado+ y al punto $p como el ideal. "omando esto como referencia ms adelante
se ver que si se hace as la constante de distorsin debe dar negativa en caso de que el
punto $d est ms cerca del centro ptico que el punto $p.
:d B :p G O:
;d B ;d G O;
"omando que idealmente7
:p B % .
(
&
G :c
BIBLIO-RA+IA
.20 Poraud 8.!$onga 4. Qison par ordinateur 4utils ondamentau%. Permes. /a. edicin.2RR5
./0 &zar &.! $us #. )alibracin monocular de cmaras. Snstituto de Sngeniera Elctrica!
acultad de Sngeniera. Universidad de la 8ep,blica. Uruguay. 2RRR
.90 ). Tonzlez! #.E. Uoods! V*igital Smage #rocessingW "hird Edition. &ddisonAUesley! 2RR9
.308obot Qision
.50 Encarta .4UTE8&1 R90