You are on page 1of 13

Visin artificial

La visin artificial o visin por computador es una disciplina cientfica que incluye
mtodos para adquirir, procesar, analizar y comprender las imgenes del mundo real con
el fin de producir informacin numrica o simblica para que puedan ser tratados por un
computador. Tal y como los humanos usamos nuestros ojos y cerebros para comprender el
mundo que nos rodea, la visin por computador trata de producir el mismo efecto para que
las computadoras puedan percibir y comprender una imagen o secuencia de imgenes y
actuar segn convenga en una determinada situacin. Esta comprensin se consigue
gracias a distintos campos como la geometra, la estadstica, la fsica y otras disciplinas.
La adquisicin de los datos se consigue por varios medios como secuencias de imgenes,
vistas desde varias cmaras de video o datos multidimensionales desde un escner
mdico.

Esquema de las relaciones entre la visin por computadora y otras reas afines.

Hay muchas tecnologas que utilizan la visin por computador, entre las cules se
encuentran el reconocimiento de objetos, la deteccin de eventos, la reconstruccin de
una escena (mapping) y la restauracin de imgenes.

ndice
[ocultar]

1Interferencias tcnicas y optimizaciones

o 1.1Ruidos tcnicos

1.1.1Salt and pepper

1.1.2Ruido uniforme

1.1.3Ruido Gaussiano

o 1.2Interferencias debidas al contexto

1.2.1Punto de vista

1.2.2Oclusin

1.2.3Escala
1.2.4Deformacin

1.2.5Fondo desordenado

1.2.6Variaciones dentro de una misma clase

2Aprendizaje automtico

3Deteccin de objetos

4Anlisis de video

5Visin 3D

o 5.1La reconstruccin en 3D a partir de imagen 2D

o 5.2La reconstruccin en 3D a partir de mltiples imgenes


2D

5.2.1Tcnicas de obtencin de imgenes 3D

6Enlaces externos

Interferencias tcnicas y optimizaciones[editar]


A la hora de aplicar los conceptos tericos de la visin por computador encontraremos
siempre interferencias y problemas relacionados con el mundo que nos rodea. Esto es por
el mero hecho de que nuestro mundo no es perfecto y los aparatos de medicin y captura
tampoco lo son. Estos introducen siempre (a mayor o menos cantidad) una distorsin o
ruido que contamina la muestra o imagen con la que deseamos trabajar.
Teniendo en cuenta estos problemas denominamos los siguientes tipos de ruidos (entre
otros) como ruidos tcnicos:
Ruidos tcnicos[editar]
Salt and pepper[editar]
Ruido impulsivo que hace tender a los pxeles a un mximo (blanco) y a un mnimo
(negro). El efecto de este ruido es tener diversos puntos blancos y negros esparcidos
aleatoriamente por la imagen. De ah el nombre Salt and Pepper (sal y pimienta), debido a
que parece que la imagen haya sido rociada por estos compuestos. Este ruido puede
aparecer a causa de los canales de transmisin de las imgenes. Para solventar este ruido
podremos utilizar (pese a perder definicin) un filtro de promedio espacial.
Ruido uniforme[editar]
Ruido que afecta a la imagen tendiendo a blanco y a negro de manera uniforme. El efecto
a simple vista de este ruido es percibir interferencias en la imagen, como si esta estuviese
codificada. Observamos una pantalla por encima de la imagen llena de pixeles de valores
aleatorios y uniformemente expandidos. Este ruido puede aparecer en el procesado de
cuantificacin de una imagen. Para solventar este ruido podremos utilizar (pese a perder
definicin) un filtro de promedio espacial.
Ruido Gaussiano[editar]
Ruido derivado de los equipos de captura que sigue la frmula (falta frmula). El efecto en
la imagen ser parecido al uniforme solo que los valores del ruido no son tan abruptos,
tendern ms a grises que a negros y blancos. Para solventar el problema podramos
utilizar un filtro de promedio espacial con coeficientes Gaussianos.
En todos los casos, para solventar cualquier tipo de ruido deberemos aplicar algn tipo
de filtro compatible con nuestro ruido.
Existen otro tipo de interferencias debidas al contexto e interpretacin de la imagen.
Pasamos a enumerar algunas:
Interferencias debidas al contexto[editar]
Punto de vista[editar]
Como est la imagen orientada respecto al observador. Un animal no se ve igual de frente
que de espaldas, aunque ste sigue siendo un animal. Iluminacin: La cantidad de luz que
recibe el objeto. Un objeto deber ser distinguible independientemente de si tiene alguna
cara oscura debido a la iluminacin.
Oclusin[editar]
Un objeto puede estar en segundo plano, es decir, que otro objeto tape parcialmente
nuestro objetivo a la hora de extraerlo o analizarlo. Deberemos ser capaces de saber
interpretar que un objeto diferente est entre nuestro objeto a extraer y el observador.
Escala[editar]
Factor que determina el tamao de la imagen respecto al real. Un edificio no parecer
tener el mismo tamao dependiendo de la imagen capturada (ya sea por distancia,
ngulo). Deberemos ser capaces de interpretar que un objeto puede ser el mismo pese
a que el tamao en las fotografas pueda ser diferente.
Deformacin[editar]
Un objeto puede estar deformado debido a mltiples factores (vase el ejemplo de la
carretera en pleno verano) o simplemente debido a errores de captura, o posicionamiento
y ngulo de la captura. Deberemos interpretar que el objeto pertenece a una categora
pese a sus deformaciones.
Fondo desordenado[editar]
Un objeto puede estar en un contexto desordenado y catico. Como por ejemplo un
mosaico. Deberemos saber distinguir el objeto entre el caos que le envuelve.
Variaciones dentro de una misma clase[editar]
Un tipo de objeto puede ser muy dispar a otro de su misma categora. Si tomamos el
ejemplo de una silla observamos que hay multitud de sillas diferentes pero a todas les
unen los mismos rasgos caractersticos: 4 patas, una placa donde sentarse, un reposo
para la espalda
Dependiendo de cmo solucionemos estos problemas (qu tipo de algoritmos y procesos
aplicamos) nuestro programa/aplicacin ser ms o menos eficiente y ms o menos fiable.

Aprendizaje automtico[editar]
Artculo principal: Aprendizaje automtico

Las tcnicas de aprendizaje automtico tienen como objetivo conseguir diferenciar


automticamente patrones usando algoritmos matemticos. Estas tcnicas son
comnmente usadas para clasificar imgenes, para tomar decisiones dentro del mundo
empresarial (por ejemplo, para decidir qu clientes de un banco pueden recibir un
prstamo o cunto ha de pagar cada cliente por un seguro dependiendo de sus
antecedentes), as como dentro de muchos otros mbitos de la ciencia y la tecnologa.
Principalmente se pueden distinguir dos tipos de tcnicas: supervisadas y no
supervisadas.
En el aprendizaje supervisado se entrena al ordenador proporcionando patrones
previamente etiquetados, de forma que algoritmo usado debe encontrar las fronteras que
separan los posibles diferentes tipos de patrones. Adaboost y algunas redes neuronales
forman parte de este grupo.
En el aprendizaje no supervisado se entrena al ordenador con patrones que no han sido
previamente clasificados y es el propio ordenador el que debe agrupar los distintos
patrones en diferentes clases. K-means y algunas redes neuronales forman parte de este
grupo.
Ambas tcnicas son muy utilizadas en la visin artificial, sobre todo en clasificacin y
segmentacin de imgenes.1

Deteccin de objetos[editar]
Artculo principal: Reconocimiento de objetos

Deteccin de caras con el software OpenCV

La deteccin de objetos es la parte de la visin artificial que estudia cmo detectar la


presencia de objetos en una imagen sobre la base de su apariencia visual, bien sea
atendiendo al tipo de objeto (una persona, un coche) o a la instancia del objeto (mi coche,
el coche del vecino). Generalmente se pueden distinguir dos partes en el proceso de
deteccin: la extraccin de caractersticas del contenido de una imagen y la bsqueda de
objetos basada en dichas caractersticas.
La extraccin de caractersticas consiste en la obtencin de modelos matemticos
compactos que "resuman" el contenido de la imagen con el fin de simplificar el proceso de
aprendizaje de los objetos a reconocer. Dichas caractersticas son comnmente llamadas
descriptores.
Existen diversos tipos de descriptores, que tendrn mejor o peor rendimiento en funcin al
tipo de objeto a reconocer y a las condiciones del proceso de reconocimiento (la luz
controlada o no, distancia al objeto a reconocer conocida o no). Se pueden usar desde
bsicos histogramas de color o intensidad de luz, descriptores LBP (Local Binary Pattern,
usado sobre todo para texturas) o ms avanzados como el HOG (Histogram of Oriented
Gradientes) o SIFT.
Para el proceso de clasificacin se pueden usar diferentes tcnicas de aprendizaje
mquina. Existen diferentes mtodos, como la regresin logstica, o ms avanzados
basados en tcnicas de aprendizaje automtico como el SVM o AdaBoost (Adaptative
Boost).
Los mayores retos tanto de la extraccin de caractersticas como la clasificacin es
encontrar descriptores y clasificadores que sean invariantes a los cambios que pueda
tener un objeto, como su posicin o iluminacin. 2 3

Anlisis de video[editar]
El trmino anlisis de vdeo describe un amplio nmero de nuevas tecnologas y
evoluciones en el campo de la vigilancia con vdeo y la seguridad. Estos cambios estn
produciendo sistemas de seguridad ms efectivos y eficientes. El anlisis de vdeo es
fundamental en el sector de vdeo vigilancia y seguridad. En un sistema de CCTV(circuito
cerrado de televisin) tradicional es habitual visualizar el contenido de hasta 16 cmaras
simultneamente. Esta tarea resulta complicada para un vigilante de seguridad pues hay
estudios que aseguran que despus de 22 minutos de supervisin ste pierde hasta el 95
por ciento de la actividad de la escena. Con el anlisis de vdeo se alerta al vigilante
cuando hay movimiento o seala en qu cmara hay mayor probabilidad de actividad
sospechosa o peligrosa.
Una de las capacidades bsicas del anlisis de vdeo es la deteccin de movimiento:
tecnologa que identifica y alerta cuando ocurre el movimiento. Sofisticadas adaptaciones
de la deteccin de movimiento incluyen sensores que detectan el movimiento en
direcciones no autorizadas. Vase Detector de movimiento.
Algunas aplicaciones del anlisis de vdeo son la deteccin de objetos abandonados en
lugares llenos de gente, controlar obras de arte en los museos y detectar vehculos no
autorizados que ingresen a determinadas reas. La deteccin de matrculas de vehculos y
congestin de trnsito son caractersticas que se estn desenvolupando.
A pesar de la constante evolucin del anlisis de vdeo, algunas de sus aplicaciones no
son muy rigurosas. Tecnologas como el reconocimiento facial y la deteccin de
movimientos sospechosos todava no son fiables y a menudo producen falsas alarmas.
Vase Sistema de reconocimiento facial.

Visin 3D[editar]
La visin 3D artificial se encarga de proporcionar la capacidad de emular la visin humana
a un ordenador. Con dicha capacidad el ordenador podr generar un modelo tridimensional
de un objeto o escena, generalmente a partir de una imagen en 2D . Existen tcnicas o
sistemas que permiten captar la profundidad de los objetos o en una escena, como por
ejemplo: sistemas estereoscpicos, mediante mltiples cmaras, sistemas basados en el
tiempo de vuelo o los sistemas basados en el escner de luz estructurada.
Las aplicaciones son numerosas, en el campo de la automocin por ejemplo, Google self-
Driving car utiliza la deteccin de objetos, junto con radares y sensores para conducir por
la via pblica de una forma autnoma.
La reconstruccin en 3D a partir de imagen 2D[editar]
A partir de una imagen 2D obtener una reconstruccin en 3D plantea una serie de
problemas ya que existen muchos objetos con formas similares o estos mismos objetos
pueden aparecer en la imagen de forma diferente. Hay que limitar el proceso de
reconstruccin asumiendo la similitud de las formas entre los objetos. Para comparar la
imagen de consulta se deben crear una serie de modelos 3D para cada clase. Se usan
estos modelos para generar una base de datos de objetos de la clase con sus respectivos
mapas de profundidad, a esto lo llamararemos un aprendizaje supervisado porque se
conocern todos los objetos a tratar. Esto nos dar ejemplos de mapas 3D factibles
asociados a formas que se utilizarn para estimar la imagen.
Un ejemplo de los bloques que debe contener un sistema de reconocimiento 3D a partir de
una imagen 2D:
Adquisicin de la imagen: En esta etapa se captura una proyeccin en dos dimensiones
de la luz reflejada por los objetos de la escena.
Segmentacin: deteccin de bordes y regiones: Permite separar los diferentes objetos de
la escena.
Extraccin de caractersticas: Se obtiene una representacin numrica en forma de
vector por cada imagen.
Reconocimiento y localizacin: Mediante tcnicas, como pueda ser la triangulacin, se
localiza al objeto en el espacio 3D.
Artculo principal: Reconocimiento de patrones
Interpretacin o estimacin: A partir de la informacin obtenida se estima la escena.
La reconstruccin en 3D a partir de mltiples imgenes 2D [editar]
El objetivo de la reconstruccin 3D con mltiples imgenes es averiguar la geomtrica de
una escena capturada por una coleccin de imgenes. Por lo general, la posicin de la
cmara y los parmetros internos se supone que se conocen o se pueden estimar a partir
del conjunto de imgenes. La automtica correspondencia de los objetos de la imagen
suele ser ambigua e incompleta, se recomienda tener un conocimiento previo sobre los
objetos.

Modo multicmara

Tcnicas de obtencin de imgenes 3D[editar]

Cmara estereoscpica FedStereo hecha en Ucrania.

Multicmara: El objetivo de esta tcnica es captar el objeto o la escena con varias


cmaras calibradas para obtener diferentes puntos de vista y as generar datos de
profundidad.
Cmaras esteroscpicas: Permiten emular la visin humana creando dos imgenes
como si fueran los ojos. Vase Cmaras stereoscpicas.
Escner de luz estructurada: Mediante una proyeccin de un patrn de luz, el dispositivo
es capaz de capturar la forma y las caractersticas del objeto. Vase Escner de luz
estructurada.

Kinect Sensor en la exposicin E3 de 2010 (frente de la cmara).

Time of Flight (TOF) : Mediante un sensor que emite una seal de infrarrojo, esta seal
incide sobre la escena o objeto y vuelve rebotada sobre la cmara. La cmara genera una
imagen en escala de grises que nos da la informacin de profundidad. Vase Televisin
3D: TOF.
TOF Cmara

Enlaces externos[editar]

Wikimedia Commons alberga contenido multimedia


sobre Visin artificial.

Vdeos sobre visin artificial

1. Volver
arriba https://www.cs.princeton.edu/courses/archive/spring
07/cos424/lectures/li-guest-lecture.pdf

2. Volver arriba https://www.coursera.org/learn/deteccion-


objetos

3. Volver
arriba http://cvn.ecp.fr/personnel/iasonas/course/Lecture_1
.pdf
Reinhard Klette (2014). Concise Computer Vision. Springer. ISBN 978-1-4471-6320-6.
Linda G. Shapiro and George C. Stockman (2001). Computer Vision. Prentice Hall. ISBN 0-13-
030796-3.

Bernd Jhne and Horst Hauecker (2000). Computer Vision and Applications, A Guide for
Students and Practitioners. Academic Press. ISBN 0-13-085198-1.
Tim Morris (2004). Computer Vision and Image Processing. Palgrave Macmillan. ISBN 0-333-
99451-5.

Hoiem, Derek. Representations and techniques for 3D object recognition and scene
interpretation.
Image Segmentation by Probabilistic Bottom-Up Aggregation and Cue Integration.
Categora:
Visin por computadora

Men de navegacin
No has iniciado sesin

Discusin

Contribuciones

Crear una cuenta

Acceder
Artculo
Discusin
Leer
Editar
Ver historial
Buscar
Ir

Portada
Portal de la comunidad
Actualidad
Cambios recientes
Pginas nuevas
Pgina aleatoria
Ayuda
Donaciones
Notificar un error
Imprimir/exportar
Crear un libro
Descargar como PDF
Versin para imprimir
En otros proyectos
Wikimedia Commons
Herramientas
Lo que enlaza aqu
Cambios en enlazadas
Subir archivo
Pginas especiales
Enlace permanente
Informacin de la pgina
Elemento de Wikidata
Citar esta pgina
Otros proyectos
Commons
En otros idiomas

English
Franais


Portugus



19 ms
Editar enlaces
Se edit esta pgina por ltima vez el 19 may 2017 a las 20:51.
El texto est disponible bajo la Licencia Creative Commons Atribucin

Compartir Igual 3.0; pueden aplicarse clusulas adicionales. Al usar este


sitio, usted acepta nuestros trminos de uso y nuestra poltica de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una
organizacin sin nimo de lucro.
Servomotor

Un servomotor industrial.

Un servomotor (tambin llamado servo) es un dispositivo similar a un motor de corriente


continua que tiene la capacidad de ubicarse en cualquier posicin dentro de su rango de
operacin, y mantenerse estable en dicha posicin. 1
Un servomotor es un motor elctrico que puede ser controlado tanto en velocidad como en
posicin.
Es posible modificar un servomotor para obtener un motor de corriente continua que, si
bien ya no tiene la capacidad de control del servo, conserva la fuerza, velocidad y baja
inercia que caracteriza a estos dispositivos.

ndice
[ocultar]

1Caractersticas

2Control

3Vase tambin

4Referencias
Caractersticas[editar]
Est conformado por un motor, una caja reductora y un circuito de control. Tambin
potencia proporcional para cargas mecnicas. Un servo, por consiguiente, tiene un
consumo de energa reducido.
La corriente que requiere depende del tamao del servo. Normalmente el fabricante indica
cul es la corriente que consume. La corriente depende principalmente del par, y puede
exceder un amperio si el servo est enclavado.
En otras palabras, un servomotor es un motor especial al que se ha aadido un sistema de
control (tarjeta electrnica), un potencimetro y un conjunto de engranajes. Con
anterioridad los servomotores no permitan que el motor girara 360 grados, solo
aproximadamente 180; sin embargo, hoy en da existen servomotores en los que puede
ser controlada su posicin y velocidad en los 360 grados. Los servomotores son
comnmente usados en modelismo como aviones, barcos, helicpteros y trenes para
controlar de manera eficaz los sistemas motores y los de direccin.

Control[editar]
Los servomotores hacen uso de la modulacin por ancho de pulsos (PWM) para controlar
la direccin o posicin de los motores de corriente continua. La mayora trabaja en la
frecuencia de los 50 hertz, as las seales PWM tendrn un periodo de
veinte milisegundos. La electrnica dentro del servomotor responder al ancho de la seal
modulada. Si los circuitos dentro del servomotor reciben una seal de entre 1 a 1,4
milisegundos, ste se mover en sentido horario; entre 1,6 a 2 milisegundos mover el
servomotor en sentido antihorario; 1,5 milisegundos representa un estado neutro para los
servomotores estndares. A continuacin se exponen ejemplos de cada caso:
Seal de ancho de pulso modulado:

_ __ ____ ____ _
| | | | | | | | | |
| | | | | | | | | |
_________| |____| |___| |________| |_| |__________

Motor en sentido horario (ejemplo 0,7 ms):

_ _ _ _ _ _
| | | | | | | | | | | |
| | | | | | | | | | | |
_________| |____| |___| |________| |__| |__| |___________

Motor neutral (1,5ms):

___ ___ ___ ___ ___ ___


| | | | | | | | | | | |
| | | | | | | | | | | |
_________| |____| |___| |___| |__| |__| |_____

Motor en sentido antihorario (ejemplo 1,8ms):


______ ______ ______ ______ ______
| | | | | | | | | |
| | | | | | | | | |
_________| |____| |___| |___| |__| |
____

Este clase de motor no es muy usado en las industrias ni en los trabajos mecnicos por su
precio y el coste del control. Esta tendencia va a menos a medida que dichos aspectos van
reduciendo su coste.

Vase tambin[editar]
Servomotor de modelismo

Referencias[editar]
1. Volver arriba Irving L. Kosow (1 de mayo de
1993). Mquinas elctricas y transformadores. Pearson
Educacin. pp. 429-. ISBN 9789688802939. Consultado el 26 de
enero de 2011.
Categoras:
Robtica
Motores elctricos

Men de navegacin
No has iniciado sesin

Discusin

Contribuciones

Crear una cuenta

Acceder
Artculo
Discusin
Leer
Editar
Ver historial
Buscar
Ir

Portada
Portal de la comunidad
Actualidad
Cambios recientes
Pginas nuevas
Pgina aleatoria
Ayuda
Donaciones
Notificar un error
Imprimir/exportar
Crear un libro
Descargar como PDF
Versin para imprimir
En otros proyectos
Wikimedia Commons
Herramientas
Lo que enlaza aqu
Cambios en enlazadas
Subir archivo
Pginas especiales
Enlace permanente
Informacin de la pgina
Elemento de Wikidata
Citar esta pgina
En otros idiomas
Deutsch
English
Franais


Portugus



14 ms
Editar enlaces
Se edit esta pgina por ltima vez el 1 ene 2017 a las 22:55.
El texto est disponible bajo la Licencia Creative Commons Atribucin

Compartir Igual 3.0; pueden aplicarse clusulas adicionales. Al usar este


sitio, usted acepta nuestros trminos de uso y nuestra poltica de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una
organizacin sin nimo de lucro.

Estimados amigos que leen este blog, en esta oportunidad les contar un poco
sobre el segundo proyecto para este 2012, que an esta en fase de
planificacin (por cuestiones del software) y se trata de crear aplicaciones para
nios usando los conceptos de la Realidad Aumentada y la Visin Artificial
permitiendo el trabajo con formas y colores; en los proyectos Probado
virtual y Pintura Virtual para la Realidad Aumentada se avanz con los
conceptos pedaggicos sobre el trabajo ldico, el desarrollo de las
capacidades kinestsicas y las competencias a desarrollar en los nios y
nias por reas. El software que se desarrollo para estos proyectos estaba
limitado a la deteccin de movimiento y el reconocimiento de colores. Se
trabaj con processing y libreras adaptadas de opencv para este lenguaje;
lamentablemente muy pocas funciones de opencv (libreras de visin artificial)
fueron migradas por lo que la alternativa era trabajar en el lenguaje C++,
usando las libreras nativas.
En enero inicie un trabajo con opencv para el lenguaje C++, Qt Creator, asi
Microsoft Visual C++ Express . Luego de mucho investigar he logrado
reconocer formas y colores optimizando algoritmos e ideando muevas formas
para trabajar el reconocimiento de formas, optimizar tiempos y lograr trabajar
en tiempo real; aproveche parte de mi trabajo sobre colores derivados de los
proyectos anteriores. Como muchos otros proyectos de este tipo tengo an
problemas con la luz que es muy variable en los ambientes reales, pero an as
se ha logrado avanzar reduciendo el ruido de estas variaciones. La primera
prueba del software fue hoy, se verific el funcionamiento y la robustez del
desarrollo con los nios en condiciones reales sin tomar criterios pedaggicos.

De los resultados se puede concluir que aplicacin es estable con correcciones


menores, y toca validar su uso para apoyar la:

Competencias: Reconoce, nombra y describe figuras geomtricas,


asocindolas con objetos de su entorno, y su

Capacidad: Identificar elementos esenciales de figuras geomtricas planas:


rectngulo, cuadrado, triangulo.

As tambin dentro del proyecto tengo planificado crear juegos que refuercen
estas y otras competencias, espero que el tiempo pueda ser suficiente, ya que
en la mayora de casos las cuestiones tcnicas referidas al software toman ms
tiempo del previsto.

Comparto con Ustedes las primeras pruebas, sean benignos puesto que esta
es la primera prueba y debo confesar que me divert mucho.

You might also like