You are on page 1of 8

Polibits

ISSN: 1870-9044
polibits@nlp.cic.ipn.mx
Instituto Politécnico Nacional
México

Rojas Hernández, Rogelio; Silva Ortigoza, Ramón; Molina Vilchis, María Aurora
La Visión Artificial en la Robótica
Polibits, núm. 35, 2007, pp. 22-28
Instituto Politécnico Nacional
Distrito Federal, México

Disponible en: http://www.redalyc.org/articulo.oa?id=402640448005

Cómo citar el artículo


Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
La Visión Artificial en la Robótica

La Visión Artificial en la
Robótica
Ing. Rogelio Rojas Hernández y divulgador de la ciencia, Isaac Estos robots imaginarios están
UPIITA
Dr. Ramón Silva Ortigoza ♣
Asimov, quien introdujo por pri- aún lejanos de lo que realmente
M. en C. María Aurora Molina Vilchis. ♦ mera vez el término robótica con existe, pero nos dan la idea de lo
Profesores del CIDETEC el sentido de disciplina científica que es un robot; aunque ésta no es
encargada de construir y progra- estrictamente correcta, es una idea

E
l vertiginoso avance de las mar robots [1]; pero en definitiva al fin, que es lo importante. Afinar
computadoras ha permiti- no fue la comunidad científica y esta imagen mental y convertirla en
do que la visión artificial académica la que difundió de forma un concepto general y universal es
se incorpore a una gran masiva este concepto. bastante complicado; lo cierto es que
cantidad de disciplinas, apoyan- aún no nos hemos puesto de acuerdo
do e incluso sustituyendo a los Hollywood, como industria ci- del todo.
sistemas que antaño se utilizaban. nematográfica, ha hecho una gran
E s t e trabajo tiene como finalidad labor en cuanto a la divulgación En este artículo se presenta
presentar un panorama general de la idea de un robot. La amplia un panorama de los elementos,
de las bases, trabajos, proyectos y filmografía realizada recurriendo desarrollo y aplicaciones de la
avances sobre la visión artificial en a este tema proporciona una ima- visión artificial, específicamente
aplicaciones de robótica. gen mental de lo que son estos en el campo de la robótica. El do-
artefactos. Así pues, cualquiera cumento consta de seis secciones;
sabe quienes son C3PO o R2D2 en la Sección 2 se define lo que se
Introducción (curiosamente mexicanizado como puede calificar como un robot. En
Arturito) e identifica claramente la Sección 3 se introduce al lector
que son robots (ver la Figura 1). a las posibilidades de interacción
Con la cantidad de información con las que puede contar un robot.
disponible actualmente, no es de En la Sección 4 se detallan los con-
extrañar el enorme número de ceptos fundamentales de la visión
referencias sobre robots a la que artificial. En la Sección 5 se tratan
una persona puede acceder (basta los trabajos más relevantes sobre
teclear robot en el popular buscador la aplicación de la visión artificial
Google y se obtendrán mas de 78 en robótica y, finalmente, en la
millones de enlaces). Sin embargo, Sección 6 se presentan las con-
pocas veces alguien puede explicar clusiones.
lo que verdaderamente son estos
artefactos en el mundo real. Definiendo u n robot

La palabra robot viene del vo-


cablo checo robota, que significa Existen suficientes definiciones
“servidumbre”, “trabajo forzado” como para llenar una biblioteca
Figura 1: C3PO y R2D2, robots
o “esclavi­tud”; el término fue utili- emblemáticos de nuestra cultura. entera, pero tomando una de las
zado por primera vez por Karel Ca- más aceptadas se considera que
pek en su novela R.U.R. (Rossum’s los robots son dispositivos mecá-
Universal Robots). Fue un científico nicos capaces de realizar tareas

22 polibits 2007
La Visión Artificial en la Robótica

Figura 2: Distintas Formas de Robot

que podrían desempeñar los seres general. La batidora, un electro- Lo más curioso de esta discu-
humanos. Bajo esta definición, las doméstico común, realiza una sión es que no podemos definir a
máquinas que intervienen en una función que puede llevarse a cabo conciencia lo que es un robot, pero
cadena de ensamblaje de automó- por un ser humano, y siguiendo si los hemos clasificado en cuatro
viles son robots, aun cuando no son estrictamente la definición, la bati- formas, básicamente diferenciados
muy inteligentes en apariencia; hoy dora es un robot aún cuando no sea por sus capacidades [3].
en día a estas máquinas las llama- más que una herramienta eléctrica.
mos robots industriales. De hecho, se pueden encontrar a la 1. Androides: son robots que
venta robots de cocina cuya única imitan la forma y comportamien-
Desde inicios de la década de capacidad es triturar alimento. to humano; suelen ser solo de
los 90 y dependiendo del país, han experimenta­ción, pero existen a la
aparecido con rapidez nuevos robots También existen ejemplos de venta modelos cuya función es ser
más inteligentes. A estos se les ha máquinas que se transforman en juguete o una mascota. La princi-
dotado de capacidades perceptivas robots; un automóvil es una máqui- pal limitante de este modelo es la
(vista, oído y tacto principalmente), na, así está definido hoy en día [2]. implementación del equilibrio a la
aunque reducidas en comparación Sin embargo, al combinarlo con un hora del desplazamiento, pues es
con las capacidades de los seres sistema informático, electrónico bípedo (ver la Figura 2(a)).
vivos. Estas nuevas máquinas, que y mecánico que lo controle y le
en apariencia son más inteligentes permita llegar a un destino sin la 2. Móviles: se desplazan me-
y que se suelen adaptar a entornos intervención de un ser humano, diante una plataforma rodante (rue-
cotidianos, se denominan por lo se convierte en un robot. Eviden- das u orugas); estos robots aseguran
general robots de servicio o robots temente, en las sociedades mas el transporte de piezas de un punto
inteligentes. Pero al analizarlos desarrolladas tecnológicamente, a otro (ver la Figura 2(b)).
cuidadosamente, muchos robots una batidora no se considera un
de servicio no son tan inteligentes robot, si se le compara con los ro- 3. Zoomórficos: logran la loco-
como parecen, e inclusive existen bots de última generación que se moción imitando a los animales.
robots industriales desarrollados conocen. En realidad, se trata de un Estos robots son utilizados en am-
años atrás, que realizan tareas problema de contraste social; en el bientes específicos, tales como el
mucho más complicadas. año 1985 nadie ponía en duda que estudio de volcanes o la exploración
una batidora fuera un robot de co- espacial (ver la Figura 2(c)).
C o m o sociedad, cina y ahora resulta increíble decir
¿que es u n robot? que tanto una batidora como un 4. Poliarticulados: suelen imi-
humanoide son robots. Quizás en tar un brazo humano, con algunas
Habitualmente se debate sobre el año 2030 el conductor robotizado variantes y/o limitantes. Su utili-
que máquina es un robot y cual no de un auto sea tan poco llamativo dad es principalmente industrial,
lo es, porque realmente es compli­ para el público como una batidora para desplazar elementos que
cado llegar a un acuerdo cuando en el presente. requieren fuerza y cuidado en su
el tema es tratado por el público manejo (ver la Figura 2(d)).

XVII 1 35 polibits 23
La Visión Artificial en la Robótica

lados, que solo requieren de algún y su propósito es “entender” las


Los sentidos de u n robot sentido en especial, incluso más características de una imagen y en
desarrollado que su contraparte consecuencia generar una acción.
humana. No se debe confundir la visión
En un ser humano, un sentido artificial con el procesamiento
es una fuente de información sobre digital de imágenes (PDI); el P D I
el mundo que lo rodea, para que en La visión artificial es un conjunto de técnicas que se
base a dicha información el cerebro aplican con el objetivo de mejorar
tome una decisión. Los sentidos la calidad ó facilitar la búsqueda de
proveen datos sobre temperatura, Si solo se va a incorporar un información en una imagen digital.
luz, sonido, fuerza, olor, sabor, etc.; sentido al robot, la selección se E l PDI es lo que suelen aplicar los
vista, tacto, oído, gusto y olfato son inclinará naturalmente hacia el laboratorios fotográficos al corregir
los sentidos que tradicionalmente que más infor­mación proporcione “ojos rojos”, montar escenarios,
se asocian a una persona, aunque sobre el ambiente; en general, la restaurar, etc. La visión artificial
popularmente se acepta la existencia información que suele requerirse está profundamente apoyada en el

Figura 3: Toma de decisión mediante visión artificial

de otros sentidos como la empatía, son dimensiones físicas (tamaño, PDI, pero de ninguna forma son
la telepatía y otras clases de per- volumen, posición, velocidad, ace- lo mismo. E l proceso de obtener
cepción extrasensorial. leración, dirección, etc.), por lo que información a través de la visión
el sentido seleccionado suele ser artificial para la toma de una de-
Extrapolando la misma idea la vista. cisión puede esquematizarse como
a los robots, ya se dispone de la muestra la Figura 3.
tecnología para dotarlos de ta- Una imagen puede suministrar
les sentidos, mediante el uso de mayor cantidad de información Ambiente
computadoras que sustituyen al sobre las dimensiones de un lugar,
cerebro, y micrófonos, cámaras, un objeto o una persona, que la que E l ambiente es simplemente el
sensores, etc. que sustituyen a los podría obtenerse a través de un lugar donde el robot desarrollará
ojos, la piel, los oídos, la lengua olor, un sonido, un sabor o una tex- sus actividades. Puede ser una nave
y la nariz. En general, resulta tura. En adelante se utilizarán los indus­trial, un laboratorio, una
demasiado costoso e impráctico términos imagen e imagen digital mesa de pruebas, etc.
para los proyectos que se requieren de forma indistinta, puesto que las
y/o desarrollan dotar a un robot tecnologías utilizadas para dotar Cámara
con los mismos sentidos con los de vista a los robots solo pueden
que cuenta un ser humano; estas utilizar imágenes digitales. En visión artificial la cámara es
condiciones se presentan debido a el elemento que reemplaza al ojo
lo corto que suelen ser los tiempos La tecnología que se encarga humano. La cámara tiene como
y presupuestos, y a que los robots de dotar del sentido de la vista a propósito convertir la luz presente
normalmente se desempeñan en un robot se denomina visión arti- en el lugar de trabajo, en una señal
ambientes específicos y/o contro- ficial o visión por computadora, eléctrica que una computadora

24 polibits 2007
La Visión Artificial en la Robótica

pueda utilizar. Las cámaras ya no píxeles, uno para cada color, forman Computadora
resultan extrañas, debido a la gran un conjunto de células fotoeléctricas
cantidad de modelos disponibles capaces de captar cualquier color En un sistema de visión artificial
en el mercado, pero cabe mencio- en la imagen. Para conseguir esta la computadora es la encargada de
nar que en el ambiente científico separación de colores la mayoría recibir y procesar la información
e industrial no cualquier tipo de de las cámaras del tipo CCD uti- que proviene de la cámara. E l tér-
cámara resulta útil para los fines lizan un filtro de Bayer [6], que mino computadora aplica para el
que se persiguen. Los dispositivos proporciona una trama para cada típico CPU con su monitor, teclado,
que se han diseñado específicamen- conjunto de cuatro píxeles, de for- ratón, etc., y para computadoras
te para las tareas en los ambientes ma que un píxel registra luz roja, pequeñas especializadas basadas
antes mencionados son denomina- otro luz azul y dos más se reservan en dispositivos FPGA, DSP y
dos cámaras de visión artificial. Las para la luz verde (por imitación al microcontroladores. En la compu-
cámaras de visión artificial son mas ojo humano, que es más sensible a tadora se llevará a cabo la etapa de
sofisticadas que las convencionales, la luz verde). PDI y de visión artificial.
ofreciendo un completo control de
los tiempos y señales de la cámara Tecnología C M O S PDI
[4], [5]. Existen infinidad de marcas
y modelos de este tipo de dispo- Un Active Píxel Sensor (APS) E l análisis humano de imágenes
sitivos, cada uno especializado es un sensor que detecta la luz u objetos presenta dificultades, pues
en alguna necesidad, pero todas basado en tecnología CMOS y por el proceso de inspección visual con-
basadas en dos tecnologías para ello es más conocido como sensor sume una gran cantidad de tiempo
transformar la luz en una señal CMOS. Gracias a esta tecnología de y está sujeto a interpretaciones in-
eléctrica: CCD y CMOS. construccción es posible integrar coherentes e incompletas. E l PDI,
más funciones en un chip sensor, que comprende la manipulación
Tecnología C C D tales como control de luminosidad, por computadora de imágenes
corrección de contraste, conversión reales, resuelve estos problemas al
Un CCD (Charge-Coupled analógico-digital, etc. E l APS, al poder automatizar el proceso de
Device, Dispositivo de Cargas igual que el sensor CCD, se basa en extracción de información útil de
Eléctricas Interconectadas) es un el efecto fotoeléctrico, ya que está los datos contenidos en la imagen,
circuito inte­grado que contiene un formado por numerosos fotodiodos, y también permite perfeccionar la
número determinado de condensa- uno para cada píxel, que producen imagen, corregir distorsiones, etc.
dores enlazados o acoplados. Bajo una corriente eléctrica que varía E l PDI se efectúa dividiendo la
el control de un circuito interno, en función de la intensidad de luz imagen en un arreglo rectangular
cada condensador puede transferir recibida. En el CMOS, a diferencia de elementos; cada elemento de
su carga eléctrica a uno o a varios del CCD, se incluye un conver- la imagen así dividida se conoce
de los condensadores que estén a sor digital en el propio chip y se como píxel.
su lado en el circuito impreso. El incorpora un amplificador de la
CCD es uno de los elemen­tos prin- señal eléctrica en cada fotodiodo E l siguiente paso consiste en
cipales de las cámaras fotográficas mientras que en un CCD se tiene asignar un valor a la luminosidad
y de video digitales; en éstas, el que enviar la señal eléctrica pro- promedio de cada píxel; así, los va-
CCD trabaja conjuntamente con ducida al exterior y amplificarla. lores de cada píxel, junto con las co-
células fotoeléctricas diminutas que A l igual que ocurre con el CCD, ordenadas que indican su posición,
registran la imagen, formando así los fotodiodos captan únicamente definen completamente a la imagen.
el sensor. Desde allí, la imagen es intensidad lumínica, para lo que se Todos estos números se almacenan
procesada por la cámara y registra- suele emplear nuevamente el filtro en la memoria de una computadora.
da en la tarjeta de memoria. La ca- de Bayer [6] para la distinción de A c o n t i n u a c i ó n se alteran los
pacidad de resolución o detalle de los colores. Mediante este filtro, valores de luminosidad mediante
la imagen depende del número de unos fotodiodos recogen solo la operaciones o transformaciones ma-
células fotoeléctricas, dicho número luz roja, otros la luz verde y unos temáticas, para resaltar los detalles
se expresa en píxeles; dichos píxeles mas la luz azul. de la imagen que sean convenientes.
registran tres colores diferentes: A l final se obtiene la representación
rojo, verde y azul (RGB, del inglés de estos píxeles en un monitor, una
Red, Green, Blue), por lo cual tres fotografía impresa, etc.

XVII 1 35 polibits 25
La Visión Artificial en la Robótica

La utilidad del procesamiento • La evaluación de los resul- trones [8], aprendizaje estadístico
de imágenes es muy amplia y tados; por ejemplo, obtener las [9], geo­metría de proyección [9],
abarca muchos campos. Como apli- dimensiones de un objeto pro- procesado de imágenes [10], teoría
caciones típicas tenemos: detección veniente de una máquina CNC de gráficos [11] y otras técnicas.
de presencia de objetos, inspección y comprobar que cumpla con las
visual automática, obtención de ca- especificaciones de diseño.
racterísticas geométricas y color de Logros y avances de la visión
objetos, restauración de imágenes • Registro de diferentes imáge- artificial en el campo de la
y mejoramiento en la calidad de nes de una misma escena u objeto; robótica
las mismas. También se aplica en por ejemplo, hacer concordar un
imágenes para diagnóstico médico, mismo objeto en diversas tomas.
o en tomas aéreas empleadas para Los logros alcanzados por la
realizar exámenes del terreno, con el • Seguimiento de un objeto visión artificial son notables; entre
fin de analizar los recursos naturales, en una secuencia de imágenes. Se todos ellos destacan por su comple-
las fallas geológicas, etc. [7]. suele utilizar para medir posición, jidad los del robot ASIMO, pero
velocidad y aceleración. existen también desarrollos de
Visión Artificial autos robot y sistemas de control
• Mapeo de una escena para de calidad, entre muchos otros.
Cuando el PDI termina de opti- generar un modelo tridimensional;
mizar la información de la imagen, tal modelo puede ser usado por un ASIMO
la visión artificial entra en acción. robot para navegar por la escena.
Los objetivos típicos de la visión ASIMO (Advanced Step in In-
artificial incluyen: • Estimación de las posturas tri- novative Mobility), es un robot
dimensionales de humanos. humanoide creado por la em-
• Reconocimiento de ciertos presa Honda, capaz de moverse,
objetos en imágenes, por ejemplo, Estos objetivos se consiguen por interactuar con seres humanos y
rostros humanos. medio de reconocimiento de pa- ayudarles; es una de las mayores

Figura 4: La visión artificial de ASIMO

26 polibits 2007
La Visión Artificial en la Robótica

proezas tecnológicas hasta ahora diantes de ingeniería en sistemas


vistas. Aunque todavía se está lejos modernos de manufactura e infor-
de poder atribuir roles concretos mación gerencial.
a los robots humanoides, estos
podrían utilizarse, por ejemplo, Todo proceso de manufactura
para incrementar la autonomía cuenta con un control de calidad,
de las personas con capacidades y en el laboratorio CIM de la U P I I -
diferentes y personas mayores. TA - I P N , dicho control se lleva a
Evidentemente, todavía tienen que cabo mediante visión artificial. E l
transcurrir muchos años hasta que proceso es bastante sencillo, ya que
se pueda cumplir este objetivo, pero solo se fabrican dos piezas simples:
algunas empresas en Japón ya uti- Figura 5:Auto robot Stanley. un cilindro de aluminio y un cubo
lizan los servicios de ASIMO para de acrílico (ver las Figuras 6(a) y
sierto de Mojave, EU, guiado sólo
funciones promocionales, como la 6(b)); dichas piezas forman un en-
por radares, dispositivos láser, y
recepción de visitantes. samble en forma de T invertida. La
cámaras montadas en la carroce-
visión artificial debe determinar si
ría. La visión artificial de Stanley,
La visión artificial que ASIMO ambas piezas cumplen con las di-
le permite evadir los objetos que
incorpora puede determinar la dis- mensiones que el diseño especifica;
se encuentran en su camino y es-
tancia y dirección de movimiento si es así, se ensamblan mediante un
timar la calidad del terreno para
de múltiples objetos o personas robot poliarticular, de lo contrario
determinar la velocidad de avance
(ver la Figura 4(a)), es capaz de son desechadas (ver Figura 6(c)).
adecuada [13].
reconocer gestos como señalar
objetos (ver la Figura 4(b)) y salu- Todo el software que lleva a
Sistema de control de
dar (ver la Figura 4(c)), y además cabo el control de calidad fue desa-
c a l i d a d pa r a e l
puede reconocer a una persona por rrollado por alumnos de ingeniería
l ab o r a t o r i o C I M d e l a
sus rasgos faciales (ver la Figura mecatrónica de la UPIITA-IPN, al
U P I I TA - I P N
4(d)) [12]. realizarse un proceso de rediseño,
actualización y mantenimiento ma-
U n laboratorio de manufac-
Stanley yor en el laboratorio CIM [14].
tura integrada por computadora
(CIM), consiste de una celda flexi-
Stanley es un auto robot capaz
ble de manu­factura , y el software
de conducirse solo. Se trata de un Conclusiones
de integración de administración
VW Passat cuya dirección, acele-
para simular un ambiente real.
rador y frenos están controlados
E l propósito de este laboratorio
completamente por una compu- La visión artificial es un cam-
es complementar el proceso de
tadora (ver la Figura 5). Creado po sumamente fértil para el
enseñanza en las aulas a los estu-
por un equipo de la Universidad desarrollo de nuevos proyectos y

Figura 6: Visión artificial en el laboratorio CIM de la UPIITA

de Stanford, ganó un premio de  Se considera flexible debido a que puede aplicaciones, tanto en la industria,
dos millones de dólares al lograr fabricar prácticamente cualquier elemento la academia y la vida diaria. Adi-
mecánico, a través de su maquinaria
atravesar 212 kilómetros del de- cionando la robótica, es posible
CNC.

XVII 1 35 polibits 27
La Visión Artificial en la Robótica

producir resultados extraordi- [9] D. M. Gómez Allende, Reco-


narios. Prácticamente no existen Referencias nocimiento de formas y visión
límites para lo que pueden lograr artificial, RA-MA, 1994.
estas disciplinas unidas, desde [10] G. J. Awcock, Applied image
artefactos que poseen tecnología [1] http://es.wikipedia.org/wiki/ processing, McGraw Hill, New
de punta, con intenciones de incor- IsaacAsimov York, EU, 1996.
porar la robótica a la vida diaria [2] Real Academia Española, [11] O. Ore, Teoría y aplicaciones
de la humanidad, hasta pequeñas Diccionario de la Lengua de los gráficos, Norma, Cali,
aplicaciones escolares con fines Española, Espasa Calpe, 22va Colombia, 1963.
puramente didácticos. Para fina- ed, 2002. [12] http://world.honda.com/ASI-
lizar, es conveniente mencionar [3] J. Craig, Robótica, Prentice MO/technology/intelligence.
que existe una condición muy Hall, 3ra ed, 2005. html
alentadora en el desarrollo de estas [4] www.infaimon.com/catalogo/ [13] http://cs.stanford.edu/group/
disciplinas: lo único que puede industria/index.html roadrunner//old/index.html
limitarlas es la falta de ingenio, [5] www.ni.com [14] A. Vázquez, J. Cruz, R. Rojas,
algo que afortunadamente a los [6] http://es.wikipedia.org/wiki/ Reacondicionamiento e imple-
mexicanos nos sobra. MosaicodeBayer mentación de un sistema de
[7] J. González, Visión por com- control de calidad para el módulo
putador, Paraninfo, Madrid, de visión artificial del CIM, IPN-
Agradecimientos España, 2000. UPIITA, México, 2006.
[8] J. L. Díaz de León Santiago,
Reconocimiento de patrones:
♣ RSO agradece el soporte econó- avances y perspectivas, IPN-
mico recibido por la Secretaría de CIC, México, 2002.
Investigación y Posgrado del IPN
(SIP-IPN), a través del proyecto
20071024 y del programa EDI, así
como del Sistema Nacional de In-
vestigadores (SNI-México).

♦ MAMV agradece el apoyo recibido


del programa EDD del IPN.

28 polibits 2007

You might also like