You are on page 1of 26

Visión Artificial

HUMBERTO LOAIZA CORREA, Ing., M.Sc., Ph.D. Profesor Titular Área Informática Industrial humberto.loaiza@correounivalle.edu.co

Introducción
 La VISIÓN es el sentido más poderoso, sofisticado y complicado del Ser Humano  Suministra una cantidad muy alta de información sobre el ambiente circundante  Permite la interacción inteligentemente con el ambiente sin contacto físico directo.  Permite aprender posiciones e identificaciones de objetos y las relaciones existentes entre ellos.

se intenta dar a las máquinas el sentido de la visión  El conocimiento de sistemas biológicos de visión es fragmentado y confinado a las etapas de procesamiento directamente involucradas con las señales sensoriales.Introducción  Por el poderío de la V.A. .  Los sistemas de visión actuales están en continua evolución.

 orientarse para permitir la toma de decisión adecuada Varias Interpretaciones de un objeto? .Introducción  Problemática: Un objeto no tiene una única descripción  Ejemplo: Cómo es un oso panda?  Se puede obtener descripciones con muchos niveles de detalle y desde muchos puntos de vista.  Es imposible describir un objeto completamente.  Solución: la descripción utilizada debe:  hacerse en función de la tarea.

 ¿Cuáles son sus herramientas?. Todo el hardware y software para el procesamiento y análisis de imágenes y la transmisión de los resultados. .Introducción  Qué problemas intenta resolver?  Calcular propiedades del mundo 3-D a partir de una o varias imágenes digitales.   Todo el hardware de adquisición y de almacenamiento de imágenes.

 Robot Visión: generalmente restringida a la utilización de visión en navegación.Introducción  Otras Denominaciones: En inglés se usan términos que no son equivalentes directos a Visión Artificial. . localización y detección de obstáculos para robots.  Computer Vision: denominación más frecuente en la traducción .  Machine Vision: usado principalmente en contextos industriales.

. explícitas y con significado de objetos físicos a partir de imágenes.  [Ballard&Brown82] La Visión Artificial es la construcción de descripciones.  Incluye el procesamiento de imágenes.Introducción  Definición: Existen diferentes definiciones que están fuertemente marcadas por la línea de énfasis de los diferentes investigadores/autores.  No se considera totalmente acertado en la la actualidad por no explicitar la aplicación.

 Concibe el procesamiento de imágenes como la transformación en un computador de una imagen en otra.  La descripción debe estar relacionada con la escena observada. la clasificación. el procesado.  Debe contener toda la información que se necesita para realizar una tarea determinada. y en su conjunto la toma de decisiones posterior al reconocimiento. el reconocimiento.Introducción  Definiciones   [Horn86] Un sistema de visión artificial es un sistema que analiza imágenes y produce una descripción de éstas. [Low91] La Visión Artificial trata de la adquisición. útil a la ejecución de una tarea. .

ya éste es un proceso cognitivo y no de percepción.  Incluye el reconocimiento de objetos .  [Trucco&Verri98] Considera la Visión Artificial como la búsqueda de propiedades del mundo 3-D a partir de una o más imágenes digitales.  Excluye el reconocimiento de objetos basado en modelos. a partir de una o varias imágenes bidimensionales de él. posiblemente dinámico.Introducción  Definiciónes  [Nalwa93] La Visión Artificial describe la deducción automática de las estructuras y propiedades de un mundo tridimensional.

una rama de la Inteligencia Artificial cuyo objetivo es emular la inteligencia humana.tal vez estemos en una época en la que el reconocimiento de objetos sea parte de la VA.  [R. E. Woods 2002] La Visión Artificial tiene como meta final utilizar computadores para emular la visión humana.. Gonzalez.. Definiciones  [Hoffman98] .  El mundo de la VA es fundamentalmente un mundo 3-D. pero no sería extraño que en el futuro asistiéramos a una separación de esta materia de la VA como ya la hubo del procesamiento de imágenes y el análisis de imágenes. incluyendo aprendizaje y la posibilidad de hacer inferencias y tomar acciones basadas en entradas visuales.A.  Considera la V. .

• Interpretación descendente: deduce una descripción compatible con las primitivas extraídas de las imágenes a partir del conjunto de objetos conocidos por el sistema. • Interpretación ascendente: reconstruye una representación lo más abstracta posible a partir de la información sensorial.Introducción  Definiciones  [Horaud.  Interpretación: poner en correspondencia la representación extraída de las imágenes con las descripciones de los objetos con el fin de describir los datos sensoriales en términos de los objetos. . Monga 95] La visión artificial es un proceso de tratamiento de información que genera una interpretación no ambigua de los objetos de interés presentes en una escena tridimensional a partir de una o varias imágenes del entorno de operación.

Introducción  Definiciones  [Loaiza07] Un sistema de visión artificial es una máquina que tiene como función emular el sistema visual humano en una aplicación real. hasta la asignación representaciones y/o significados a los objetos de las escenas. pasando por el procesamiento y análisis de las imágenes.  Emular: Imitar las acciones de otro procurando igualarlas e incluso excederlas  Incluye todas las etapas desde la selección de los sensores de visión. dentro del contexto de la aplicación. .

artefactos humanos y procesos de manufactura con el fin de detectar defectos y mejorar la calidad. la eficiencia de operación y la seguridad de productos y procesos. de software.  Ejemplos simples:  Medir el ángulo de unas tijeras  Verificar que los cubiertos estén bien empacados  Identificar una carta de poker y definir la siguiente jugada  Encontrar que piezas de dominó que se encuentran presentes .Introducción  Definición Práctica  Área que integra aspectos de sistemas electrónicos. mecánicos y ópticos para examinar objetos y materiales naturales.

) Sensores (Cámaras espectro visible. óptica difractiva.. Sistemas de Transmisión de imágenes … . fibra óptica. análoga. lasers..Introducción  Tecnologías involucradas            Diseño y manejo mecánico Iluminación Óptica (incluyendo imágenes convencionales. ultravioleta. infrarrojo. vídeo) Arquitectura de Sistemas Digitales Software Interfaces Humano-computador Sistemas de Control y manufactura. .…) Electrónica (digital.

Introducción  Campos involucrados con la Visión Artificial Sistema de Visión Artificial Procesamiento de imágenes Reconstrucción 3D Reconocimiento de patrones Escena Iluminación Sensor Análisis de escenas Aplicación .

Además de clasificación y reconocimiento de objetos. • Entrada y la salida son imágenes.) .  Procesamiento de Nivel Medio • Tareas tales como segmentación.Introducción  Procesamiento de Imágenes  Puede considerarse tres niveles de procesos.  Procesamiento de Nivel Bajo • Operaciones primitivas como pre-procesamiento para eliminación de ruido y enriquecimiento del contraste. contornos. descripción de objetos. etc. identidad de objetos individuales. para reducirlos a una forma adecuada para procesamiento. • Entradas generalmente son imágenes y sus salidas son atributos extraídos de las imágenes (bordes.

realizar la función cognitiva normalmente asociada con la visión. y muy en el extremo. como en el análisis de imágenes.Introducción  Procesamiento de Imágenes …  Procesamiento de Nivel Alto • Involucra la “toma de sentido” de un conjunto de objetos reconocidos. .

(Modelos ocultos de Markov)  Apariencia: Se apoya en las relaciones de las imágenes de los objetos. (Clasificadores Bayesianos)  Estructural-Sintáctico: Se apoya en las relaciones geométricas entre objetos. Utiliza características cuantitativas.Introducción  Reconocimiento de patrones  Tiene como objetivo la clasificación de “objetos” en un cierto número de categorías o clases a partir de un conjunto de mediciones realizadas sobre los mismos objetos. (Máquinas de Aprendizaje) . Utiliza características cuantitativas.  Patrón: objeto a reconocer.  Enfoques  Estadístico: Se apoya en la teoría de decisión. el cual hace parte de una clase.

Introducción  Reconocimiento de patrones  Fases Extracción de Características Post Procesamiento Sensado Segmentación Clasificación  Diseño Dominio Aplicación Recolección datos Selección Características Agrupamiento Selección Modelo Entrenamiento Clasificador Evaluación Clasificador .

.Introducción  Análisis de Escenas  Realiza la transformación de descripciones simples obtenidas de imágenes en otras mucho más elaboradas y útiles a una tarea en particular.  Ejemplo: A partir de un conjunto de segmentos de recta de una imagen indicar el tipo de poliedro.

el movimiento. el análisis de las sombras.Introducción  Campos de Acción  Análisis Multiresolución  El tratamiento de imágenes con varias resoluciones espaciales permite el refinamiento del análisis y disminuir los efectos del ruido de digitalización.  . Reconstrucción de Profundidad  Se aprovecha las características estereoscópicas. el color y la textura para recuperar las dimensiones espaciales de la escena observada.

.Introducción  Campos de Acción …  Fusión de Información  La fusión de información provenientes de algoritmos y sensores diferentes permite sacar provecho de los puntos fuertes de cada fuente de datos y disminuye considerablemente las probabilidades de error luego de la interpolación de la imagen.

.Introducción  Campos de Acción …  Redes Neuronales / Sistemas Bio-inspirados + V.      Reconocimiento de formas Extracción de características y memorización asociativa Desarrollo de simuladores adaptados al tratamiento y a la representación de redes neuronales multicapa Puesta a punto de modelos simulados o inspirados en sistemas de visión biológica Aplicación de métodos de aprendizaje supervisado y no-supervisado a mecanismos de alto nivel de la visión.A.

A. en la industria.A.A.Introducción  Campos de Acción …  Aplicación de sistemas a base de conocimiento en la V. . • Costos de desarrollo de software y carencia de personal especializado frenan la penetración V.A.  Aumentar la potencia y la simplicidad de sistemas de V.  Ayudar a la concepción industrial de aplicaciones en V. reducen el procesamiento y los errores de interpretación. • El conocimiento de estrategias de interpretación de imágenes asi como el conocimiento a priori sobre la escena observada.

 . de las sombras. las oclusiones.A. • Análisis de contornos. del movimiento. de la profundidad..  La visión humana parece proceder a partir de la interacción de varios módulos* con cierto grado de independencia para permitir la interpretación de lo observado. de la simetría. de texturas.. .Introducción  Campos de Acción …  Aplicaciones de sistemas multi-agentes a la V. debería poder aumentar su potencia y versatilidad.. de regiones. Su implementación en sistemas de V.A.