You are on page 1of 30

Contenido

Contenido....................................................................................................... 1 CAPITULO I......................................................................................................2 INTRODUCCION............................................................................................2 2.1. MTODOS DE CAPTACIN DE LAS IMGENES.....................................6 2.2. PROCESO DE CAPTACIN DE IMGENES............................................7 2.3. CAMARAS...........................................................................................8 2.4. OPTICAS...........................................................................................11 2.5. ILUMINACIN...................................................................................13 2.6. GRABBERS (tarjetas PC):..................................................................16 2.7. SOFTWARE:......................................................................................16 CAPITULO III..................................................................................................18 APLICACIONES...........................................................................................18 SISTEMA DE RECONOCIMIENTO Y CLASIFICACIN DE PATRONES BASADO EN PROCESAMIENTO DIGITAL DE IMGENES Y REDES NEURONALES.......18 RESUMEN .....................................................................................................18

CAPITULO I INTRODUCCION
Uno de los sentidos ms importantes de los seres humanos es la visin. sta es empleada para obtener la informacin visual del entorno fsico. Segn Aristteles, Visin es saber que hay y donde mediante la vista. De hecho, se calcula que ms de 70% de las tareas del cerebro son empleadas en el anlisis de la informacin visual. El refrn popular de Una imagen vale ms que mil palabras tiene mucho que ver con los aspectos cognitivos de la especie humana. Casi todas las disciplinas cientficas emplean utillajes grficos para transmitir conocimiento. Por ejemplo, en Ingeniera Electrnica se emplean esquemas de circuitos, a modo grfico, para describirlos. Se podra hacerlo mediante texto, pero para la especie humana resulta mucho ms eficiente procesar imgenes que procesar texto. Lo mismo se podra decir de la arquitectura de edificios o ms recientemente se est empleando mtodos grficos en el desarrollo del software, como es la herramienta visual UML. La visin humana es el sentido ms desarrollado y el que menos se conoce debido a su gran complejidad. Es una actividad inconsciente y difcil de saber cmo se produce. De hecho, hoy en da, se carece de una teora que explique cmo los humanos perciben el exterior a travs de la vista. En el ao 1826 el qumico francs Niepce (1765-1833) llev a cabo la primera fotografa, colocando una superficie fotosensible dentro de una cmara oscura para fijar la imagen. Posteriormente, en 1838 el qumico francs Daguerre (1787-1851) hizo el primer proceso fotogrfico prctico. Daguerre utiliz una placa fotogrfica que era revelada con vapor de mercurio y fijada con trisulfato de sodio. Desde que se invent la fotografa se ha intentado extraer caractersticas fsicas de las imgenes. La Fotogrametra dio sus primeros pasos desde imgenes capturadas en globos. La Astronoma avanz enormemente con el anlisis de imgenes recibidas por los telescopios. El anlisis de radiografas transform la Medicina. Se podran citar muchos ms ejemplos que durante dcadas han transformado la percepcin de la Ciencia con el procesamiento de las imgenes, alguna veces por separado y otras de forma multidisiciplinar.

Sin embargo, el momento histrico que hace que estas tcnicas confluyan y den un cuerpo de conocimiento propio, surge en la dcada de los 80. La revolucin de la Electrnica, con las cmaras de vdeo CCD y los microprocesadores, junto con la evolucin de las Ciencias de la Computacin hace que sea factible la Visin Artificial. Por tanto, la Visin Artificial o tambin llamada Visin por Computador, pretende capturar la informacin visual del entorno fsico para extraer caractersticas relevantes visuales, utilizando procedimientos automticos. Segn Marr, Visin es un proceso que produce a partir de imgenes del mundo exterior una descripcin til para el observador y no tiene informacin irrelevante. Para algunos autores, como Gonzlez y Woods, los primeros atisbos de este proceder se remontan a la dcada de los aos 20 del siglo XX, cuando se transmitan imgenes transocenicas, a travs de cable submarino. Las fotografas periodsticas entre Europa y Amrica tardaban una semana en llegar a travs de los barcos. Al emplear las primeras tcnicas de procesamiento de las imgenes se pas slo a tres horas. Las imgenes se codificaban a cinco niveles de grises y se transmitan por telfono. No obstante, ste podra ser el principio de las tcnicas de procesamiento de las

imgenes, pero no el de la Visin Artificial, tal cual se ha definido. El concepto de Visin Artificial es ms amplio y recupera para s, todos los conocimientos de anlisis de las imgenes desempeado por otras disciplinas desde los albores de la fotografa. Parece claro que para tratar sobre la Visin, lo primero a estudiar ser la naturaleza de la luz, para luego pasar a entender cmo funciona la visin humana y acabar con las partes de la Visin Artificial.

Se puede definir la Visin Artificial como un campo de la Inteligencia Artificial que, mediante la utilizacin de las tcnicas adecuadas, permite la obtencin, procesamiento y anlisis de cualquier tipo de informacin especial obtenida a travs de imgenes digitales. Los objetivos tpicos de la visin artificial incluyen: La deteccin, segmentacin, localizacin y reconocimiento de ciertos objetos en imgenes (por ejemplo, caras humanas). La evaluacin de los resultados (por ejemplo, segmentacin, registro). Registro de diferentes imgenes de una misma escena u objeto, es decir, hacer concordar un mismo objeto en diversas imgenes. Seguimiento de un objeto en una secuencia de imgenes. Mapeo de una escena para generar un modelo tridimensional de la escena; este modelo podra ser usado por un robot para navegar por la escena. Estimacin de las posturas tridimensionales de humanos. Bsqueda de imgenes digitales por su contenido.

Estos objetivos se consiguen por medio de reconocimiento de patrones, aprendizaje estadstico, geometra de proyeccin, procesamiento de imgenes, teora de grficas y otros campos. La visin artificial cognitiva est muy relacionada con la psicologa cognitiva y la computacin La visin artificial la componen un conjunto de procesos destinados a realizar el anlisis de imgenes. Estos procesos son: captacin de imgenes, memorizacin de la informacin, procesado e interpretacin de los resultados. Con la visin artificial se pueden: Automatizar tareas repetitivas de inspeccin realizadas por operadores. Realizar controles de calidad de productos que no era posible verificar por mtodos tradicionales.

Realizar inspecciones de objetos sin contacto fsico. Realizar la inspeccin del 100% de la produccin (calidad total) a gran velocidad. Reducir el tiempo de ciclo en procesos automatizados. Realizar inspecciones en procesos donde existe diversidad de piezas con cambios frecuentes de produccin.

Las principales aplicaciones de la visin artificial en la industria actual son: Identificacin e inspeccin de objetos. Determinacin de la posicin de los objetos en el espacio. Establecimiento de relaciones espaciales entre varios objetos (guiado de robots) Determinacin de las coordenadas importantes de un objeto. Realizacin de mediciones angulares. Mediciones tridimensionales.

CAPITULO II CONCEPTOS RELACIONADOS A LA VISION ARTIFICIAL

2.1. MTODOS DE CAPTACIN DE LAS IMGENES. Digital. La funcin obtenida tras el resultado de la medida o muestreos realizados a intervalos de tiempo espaciados regularmente, siendo el valor de dicha funcin un nmero positivo y entero. Los valores que esta funcin toma en cada punto dependen del brillo que presenta en esos puntos la imagen original. Pxel. Una imagen digital se considera como una cuadrcula. Cada elemento de esa cuadrcula se llama Pxel (Picture element). La resolucin estndar de una imagen digital se puede considerar de 512x484 Pixel. Nivel de grises. Cuando una imagen es digitalizada, la intensidad del brillo en la escena original correspondiente a cada punto es cuantificada, dando lugar a un nmero denominado nivel de gris. Imagen binaria. Es aquella que slo tiene dos niveles de gris: negro y blanco. Cada pxel se convierte en negro o blanco en funcin del llamado nivel binario o UMBRAL. Escena. Es un rea de memoria donde se guardan todos los parmetros referentes a la inspeccin de un objeto en particular: Cmara utilizada, imgenes patrn memorizadas, tolerancias, datos a visualizar, entradas y salidas de control, etc. Window (ventana de medida). Es el rea especfica de la imagen recogida que se quiere inspeccionar.

2.2. PROCESO DE CAPTACIN DE IMGENES Mdulo de digitalizacin. Convierte la seal analgica proporcionada por la cmara a una seal digital (para su posterior procesamiento). Memoria de imagen. Almacena la seal procedente del mdulo de digitalizacin. Mdulo de visualizacin. Convierte la seal digital residente en memoria, en seal de vdeo analgica para poder ser visualizada en el monitor de TV. Procesador de imagen. Procesa e interpreta las imgenes captadas por la cmara. Mdulo de entradas/salidas. Gestiona la entrada de sincronismo de captacin de imagen y las salidas de control que actan sobre dispositivos externos en funcin del resultado de la inspeccin. Comunicaciones. Va I/O, ethernet, RS232 (la ms estndar).

2.3. CAMARAS Su funcin es capturar la imagen proyectada en el sensor, va las pticas, para poder transferirla a un sistema electrnico. Las cmaras utilizadas en visin artificial requieren de una serie de caractersticas que permitan el control del disparo de la cmara para capturar piezas que pasan por delante de ella en la posicin requerida. Son ms sofisticadas que las cmaras convencionales, ya que tienen que poder realizar un control completo de: tiempos, seales, velocidad de obturacin, sensibilidad, etc. Se clasifican en funcin de: La tecnologa del elemento sensor. Cmaras de tubo. Se basan en la utilizacin de un material fotosensible que capta la imagen, siendo leda por un haz de electrones. Cmaras de estado slido CCD (Charge Coupled Device). Se basan en materiales semiconductores fotosensibles para cuya lectura no es necesario un barrido electrnico (ms pequeas que las de tubo) La disposicin fsica. Cmaras lineales. Se basan en un sensor CCD lineal Cmaras matriciales. Se basan en un sensor CCD matricial, lo que permite el anlisis de imgenes bidimensionales. Hay una cmara especfica para cada aplicacin, color, monocromo, alta definicin, alta sensibilidad, alta velocidad, infrarrojas, etc. Pasamos a comentar en forma breve el funcionamiento de las ms utilizadas. 2.3.1. Cmaras Lineales: Construyen la imagen lnea a lnea realizando un barrido del objeto junto con un desplazamiento longitudinal del mismo. Las cmaras lineales utilizan sensores que tienen entre los 512 y 8192 pixels, con una longitud lo ms corta posible y gran calidad de imagen.

El hecho de construir imgenes de alta calidad a partir de lneas individuales, requiere de una alta precisin. La alineacin y el sincronismo del sistema son crticos si se quiere obtener una imagen precisa del objeto a analizar. Su utilizacin est muy extendida para la inspeccin de objetos de longitud indeterminada, tipo telas, papel, vidrio, planchas de metal, etc. Caractersticas tcnicas: Nmero de elementos del sensor. A mayor nmero de elementos (pixels) mayor tamao de la ptica. Velocidad. Nmero de pixels capaces de ser ledos por unidad de tiempo. En las cmaras lineales es un valor mucho mas alto que en las matriciales. En las cmaras de ltima generacin se alcanzan velocidades superiores a los 200 Mhz. Cmaras lineales a color. Tienen tres sensores lineales, uno para cada color (rojo verde y azul). Pueden ser de dos tipos: Trisensor. Los sensores CCd estn posicionados unos junto a pero solo pueden utilizarse en aplicaciones con otros separados por un pequeo espacio. Tienen una buena sensibilidad superficies planas. Prisma. Los sensores estn posicionados en las tres caras de un prisma. Pueden utilizarse para cualquier tipo de aplicacin pero necesitan de una mayor iluminacin. 2.3.2. Cmaras matriciales: El sensor cubre un rea que est formada por una matriz de pixels. Los sensores de las cmaras modernas son todos de tecnologa CCD formados por miles de diodos fotosensibles posicionados de forma muy precisa en la matriz.

El tamao de los CCD est definido en pulgadas, sin embargo su tamao real no tiene nada que ver con su valor en pulgadas, sino que estn basados en la relacin de los primeros con el tamao de los tubos Vidicon. Formatos habituales son 1/3,1/2 y 2/3.

Caractersticas de los sensores. Factor de relleno. Porcentaje del rea de pxel que es sensible a la luz, el ideal es el 100%, porcentaje imposible de obtener por la separacin entre los registros. Tipo de transferencia. Segn la forma de transferencia de la informacin. Transferencia Inter-lnea (ITL). Son los mas comunes, utilizan registros de desplazamiento situados entre las lneas de pxel para almacenar y transferir los datos de la imagen lo que permite una alta velocidad de obturacin. Transferencia de cuadro. Disponen de un rea dedicada al almacenamiento de la luz, la cual est separada del rea activa, esto permite un mayor factor de relleno aunque se pierde velocidad de obturacin. Cuadro entero. Son los de arquitectura ms simple, emplean un registro paralelo para exposicin de los fotones, integracin de la carga y transporte de la misma, alcanzando con este sistema factores de relleno del 100%.

2.3.3. Cmaras color: Aunque el proceso de obtencin de las imgenes es ms complejo, proporcionan una mayor informacin que las monocromo.

Cmaro color 1CCD. Incorporan un sensor con filtro en forma de mosaico, con los colores primarios RGB (filtro bayer), observar en la figura como hay el doble de pixels de color verde para as asemejar la percepcin del sensor al ojo humano. Debido al carcter del filtro, bien en el interior de la cmara, o bien en un ordenador, se realizan los clculos necesarios para obtener en tiempo real una seal analgica o digital en RGB.

Cmara color 3CCD. Incorporan un prisma y tres sensores, la luz procedente del objeto pasa a travs de la ptica y se divide en tres direcciones al llegar al prisma. En cada una de los tres extremos del prisma se encuentra un filtro de color (rojo, verde y azul) y un sensor que captura la luz de cada color que viene del exterior. Internamente la cmara combina los colores y genera una seal RGB similar a la que ve el ojo humano. Aunque la calidad de las imgenes de este tipo de cmaras respecto de las de 1CCD es muy superior, tienen dos inconvenientes a tener en cuenta: la necesidad de una mejor iluminacin para compensar el efecto producido por el prisma y el efecto de aberracin cromtica que se crea por la propia estructura del sistema que se subsana colocando las pticas adecuadas para este tipo de cmaras.

2.4. OPTICAS Fundamentos tericos. Las pticas se utilizan para transmitir la luz al sensor de la Cmara de una forma controlada para poder obtener una imagen enfocada de uno o varios objetos. Para saber exactamente que ptica debe utilizarse hay que tener en cuenta una serie parmetros. Tamao del sensor, Distancia del objeto a la cmara y el campo de visin que deseamos abarcar. Se puede calcular la ptica mediante la siguiente frmula:

En los sistemas de visin artificial es necesario utilizar pticas de calidad para tener la mejor imagen posible y permitir las medidas con la mayor precisin Para definir el tipo de ptica se deben seguir una serie de consideraciones: El tipo de iluminacin utilizado Las especificaciones del sensor de la cmara El tamao y geometra del objeto La distancia y el espacio disponible

Elementos que componen las lentes: Anillo de enfoque. Cuanto ms cerca enfocamos, ms sobresale el objetivo. Diafragma. Se gira para seleccionar la entrada de luz a la cmara. Su escala suele ser: 16,11,...,1.8. A mayor nmero seleccionado, menor abertura del diafragma y mayor profundidad de campo.

Velocidad de obturacin. Selecciona el tiempo que estar abierto el diafragma. Su escala suele ser: 1/1, , ... 1/250, 1/ 1000. Para obtener imgenes ntidas de objetos que se desplazan a gran velocidad hay que seleccionar velocidades de obturacin altas (>1/250).

Longitud focal. Valor en milmetros que nos informa de la distancia entre el plano focal (CCD) y el centro del objetivo. Profundidad de campo. Espacio en el cual se ve el objeto totalmente ntido. Depende de la longitud focal de la lente empleada. Precisin de la medida. Depende exclusivamente del campo de medida y de la resolucin de la cmara. Ejemplo: si el campo de visin es de 10x10 mm. Y utilizamos una cmara de 752x752 pixels, la precisin de la medida en cada eje sera de 0,013 mm/pxel, o lo que es lo mismo, un pxel equivale a 13 milsimas de milmetro.

Clasificacin de las lentes:

2.5. ILUMINACIN La iluminacin es la parte ms crtica dentro de un sistema de visin. Las cmaras capturan la luz reflejada de los objetos. El propsito de la iluminacin utilizada en las aplicaciones de visin es controlar la forma en que la cmara va a ver el objeto. La luz se refleja de forma distinta si se ilumina una bola de acero, que si se ilumina una hoja de papel blanco y el sistema de iluminacin por tanto debe ajustarse al objeto a iluminar. Hay un cierto nmero de consideraciones a tener en cuenta para determinar la mejor iluminacin para una aplicacin: Es en color o en monocromo? Es de alta velocidad o no? Cul es el campo de visin a iluminar?

El objeto presenta superficies con reflejos? Qu fondo presenta la aplicacin: color, geometra, ...? Cul es la caracterstica a resaltar? Qu duracin debe tener el sistema de iluminacin? Qu requisitos mecnicos, ambientales, deben considerarse? La respuesta a estas preguntas dar el tipo de iluminacin a utilizar, para lo que se tendr en cuenta: Intensidad de luz necesaria Longitud de onda adecuada Superficie a iluminar Reflectividad del objeto Color del objeto Espacio disponible Tipo de cmara utilizada

La iluminacin podr ser mediante fibra ptica, fluorescente, led, difusa, lser. Iluminacin mediante fibra ptica. Proporcionan una gran intensidad de luz uniforme, con ausencia de sombras. Es ideal para iluminar objetos de reducidas dimensiones y se pueden sujetar al objetivo de la cmara o a la ptica de un microscopio. A los anillos de luz se les puede acoplar filtros de colores, polarizadores/analizadores, y difusores para eliminar reflejos y aumentar el efecto difusor.

Iluminacin mediante fluorescentes. (anulares, lineales, lineales de apertura, de panel). Este tipo de iluminacin proporciona una luz brillante, sin sombras. Las lmparas han sido diseadas para suministrar el mximo de intensidad durante al

menos 7000 horas. Lo que proporciona una mayor productividad. Existen lamparas blancas en distintas temperaturas de color, Y tambin ultravioletas (UV). Esta iluminacin se aplica en entornos que requieren mucha luz, y ningn tipo de sombra, (anlisis biolgicos, inspeccin y la microscopa, Ensamblaje, Inspeccin de circuitos, Industria, Laboratorios, Visin Industrial, Fotografa, Control de Calidad, Robtica, etc...)

Iluminacin mediante diodos led. Proporcionan una luz difusa muy til para la aplicacin Iluminacin mediante fibra ptica circular semirrgida iluminacin fluorescente de panel circular iluminacin mediante diodos led, anular directa en ciertos objetos. Pueden ser de iluminacin directa y en anillo Iluminacin mediante lser. Los patrones lser se utilizan mayoritariamente en aplicaciones de medida de profundidad, y de irregulares. Mediante pticas especialmente diseadas, se puede convertir un puntero lser, en diferentes formas y tamaos.

2.6. GRABBERS (tarjetas PC): En las aplicaciones de visin industrial y de anlisis de imagen es necesario tomar las imgenes con la mejor calidad posible y enviarlas a la memoria del ordenador con el fin de procesarlas, analizarlas y /o visualizarlas. Las cmaras que se utilizan en estos entornos presentan una serie de requisitos que en la mayora de ocasiones no son estndar. Las especificaciones y precios de las placas de captura de imagen (Frame Grabbers) varan enormemente y por tanto se deben tener en cuenta los requisitos tcnicos de cada frame grabber para su eleccin. Las tarjetas se dividen en tres categoras distintas en funcin de sus caractersticas: Frame Grabbers estndar de bajo coste Frame Grabbers avanzados de altas prestaciones y con caractersticas multicanal Frame Grabbers "inteligentes" con procesadores abordo.

2.7. SOFTWARE: En el pasado ms reciente no era posible hacer los procesos en tiempo real debido a que los ordenadores no eran lo suficientemente rpidos para realizar los clculos con las imgenes. Con la llegada del bus PCI y con la rpida evolucin de los procesadores de los PC se ha conseguido visualizar las imgenes en tiempo real y realizar la mayora de procesos en tiempos suficientemente cortos, como para que puedan resolver aplicaciones de visin en entornos cientficos e industriales, con los resultados esperados en su justo tiempo. Esta evolucin del hardware a comportado el desarrollo de libreras de visin que puedan funcionar en entornos estndar de todo tipo de sistemas operativos como de procesadores.

La base del software de un sistema de visin es la interpretacin y anlisis de los pxels. El resultado final puede ser, desde la medida de una partcula, a la determinacin o lectura de una serie de caracteres (OCR), pasando por cualquier otro proceso que podamos imaginar sobre las imgenes. Los pasos a seguir en un sistema de visin sern: Captura de la Imagen Definicin de la regin de inters donde se realizarn las medidas Inicializacin de las tolerancias para determinar si la pieza a determinar es o no correcta Ejecutar las medidas Generar una salida apropiada

CAPITULO III APLICACIONES

SISTEMA DE RECONOCIMIENTO Y CLASIFICACIN DE PATRONES BASADO EN PROCESAMIENTO DIGITAL DE IMGENES Y REDES NEURONALES RESUMEN A travs del presente trabajo, se presenta el diseo y desarrollo de un sistema de reconocimiento y clasificacin de patrones basados en procesamiento digital de imgenes y redes neuronales. El sistema cuenta con una faja transportadora para la simulacin de una lnea de produccin. Esto permite ingresar diferentes tipos de piezas u objetos en forma automatizada a un recinto cerrado denominado zona de captura. En este recinto se realizar la adquisicin de la imagen cuando el objeto se encuentre posicionado debajo de la cmara (utilizando para ello un sensor proximidad) . Una vez reconocido el objeto (a travs de color y parmetros geomtricos que son ingresados a una red neuronal para la toma de decisin) el computador enviar una seal de mando al sistema de control del clasificador para posicionar sus recipientes adecuadamente y recibir la pieza reconocida. El sistema est conformado por la faja transportadora, un sistema clasificador con 3 recipientes, un soporte para la cmara digital y el sensor de proximidad, adems del recinto que permite aislar la zona de captura de la luminancia variable del medio ambiente. OBJETIVOS Disear y construir un sistema de clasificacin automtico de objetos, basado en tcnicas de procesamiento digital de imgenes y redes neuronales. El sistema tendr la capacidad de extraer las caractersticas visibles del objeto para diferenciarlo y clasificarlo de acuerdo a su forma, color y tamao. Disear y construir una estructura metal-metlica que soporte una faja transportadora, un soporte para una cmara digital, un clasificador con 3 recipientes, adems del recinto que permite aislar la zona de captura de la luminancia variable del medio ambiente. Dicha estructura permitir simular una lnea de produccin industrial. Disear e implementar un sistema de control, el cual permita monitorear el movimiento de la faja transportadora, la adquisicin de la imagen y la clasificacin del objeto.

Implementar algoritmos basados en procesamiento digital de imgenes, los cuales permitan extraer caractersticas visibles como: color, tamao y forma. Implementar el algoritmo de una red neuronal multicapa como reconocedor de patrones. Esta red neuronal podr entrenarse para clasificar diferentes tipos de objetos.

Implementar un aplicativo de interfaz de usuario basado en el entorno Visual Studio C++, en el cual se codificarn todos los algoritmos implementados de procesamiento digital de seales, redes neuronales y control del proceso.

INTRODUCCIN El desarrollo de la tecnologa y el aumento de la competencia en el sector industrial, han llevado a las empresas a reestructurarse y perfeccionarse optimizando sus procesos por medio de la automatizacin basada en el computador. La inteligencia artificial es parte de la informtica avanzada que intenta aproximar algunas de las capacidades del cerebro humano, entre ellas la visin. La visin artificial por computadora es una disciplina en constante crecimiento con versatibilidad de aplicaciones, como inspeccin automtica, mediciones, reconocimiento de objetos, robtica, etc. El futuro es an ms prometedor, ya que la industria seguir creciendo a medida que se desarrollen investigaciones para mejorar su performance; hasta llegar al punto en que todo se realice mediante mquinas capaces de tomar decisiones y realizar actividades autnomas para la fabricacin o clasificacin de un determinado producto, donde solamente se requerir la labor humana para el control y mantenimiento de estas mquinas. La manipulacin de objetos en lneas de produccin es una tarea donde un gran conjunto de diferentes tipos de objetos aparecen en posicin y orientacin arbitraria. En este caso el reconocimiento y la clasificacin satisfactoria del sistema dependen de las tcnicas de reconocimiento de objetos confiables que se empleen para cumplir con ciertos requerimientos importantes para el proceso. En este trabajo se implementa un sistema de clasificacin automtica de colores, tamaos y formas, el cual permitir seleccionar y posicionar, de acuerdo a los parmetros ingresados por el operador, el lugar respectivo de cada objeto en estudio. El problema se aborda mediante un esquema de visin artificial, el cual se presente en la figura 1.

La adquisicin de la imagen es el conjunto de operaciones que se realizan para transformar la iluminacin de una escena en una seal digital, esto por medio de una cmara digital. La imgenes adquiridas no siempre se presentan en un formato adecuado para su anlisis, por lo que el siguiente paso es el pre-procesamiento de la imagen, en el cual se utilizan tcnicas que permitan mejorar la imagen adquirida, como son el nivel de gris, contraste, eliminacin de ruido, realce de bordes. (Vase la figura 2)

Una vez que la imagen se encuentre en condiciones de ser procesada, se tiene que hallar el objeto dentro de la imagen de forma independiente, lo cual se realiza a travs de la segmentacin. (Vase la figura 3)

Una vez segmentada la imagen, se procede a extraer las caractersticas para el reconocimiento, para que pueda clasificarse el objeto por color, tamao o forma.

Asimismo lo procesos industriales no son constantes, razn por la cual el sistema debe ser capaz de adaptarse a nuevos contextos, siendo necesario implementar una red neuronal que permita flexibilidad de las operaciones. DESCRIPCIN DEL PROYECTO El proyecto se divide en 4 etapas principales: diseo mecnico, diseo e implementacin del sistema de control, procesamiento digital de la imagen) y diseo de la red neuronal.

Diseo mecnico: En esta parte se describir el diseo e implementacin del soporte mecnico necesario para la simulacin de una lnea de produccin industrial. Esto comprende el soporte sobre la que se ubicar la faja transportadora, un clasificador de objetos, el soporte para la cmara digital y sensor de presencia, adems del aislamiento de la zona de captura de la imagen de los efectos del medio ambiente. (Vase la figura 5 y 6).

Diseo e implementacin del sistema de control: La etapa de control es goberando por un microcontrolador PIC 16F877 y tiene como objetivo principal monitorear en su totalidad el proceso de clasificacin desde una estacin remota.

El proceso de clasificacin se inicia cuando el operador desde el computador manda la seal de inicializacin al sistema. En ese momento el microcontrolador PIC 16F877 busca llevar a los elementos de campo conectados a l directamente, a las condiciones iniciales. Primero posiciona el clasificador de objetos mandando la secuencia necesaria al motor de pasos (el cual se encarga del movimiento del clasificador). El microcontrolador deja de mandar la secuencia cuando el sensor ptico (ubicado de forma adecuada) es activado, el cual indica que el clasificador se encuentra en la posicin deseada. En ese instante el microcontrolador PIC 16F877 genera la seal PWM (modulacin por ancho de pulso), el cual previa interfaz de potencia inducir movimiento al motor de corriente continua (encargado de la velocidad de la faja transportadora).Una vez puesto en marcha el sistema, el microcontrolador esta pendiente de cualquier interrupcin, generado por el sensor de presencia, o ingreso de comandos desde el computador o perifricos conectados directamente el microcontrolador. En el caso que se produzca una interrupcin por el sensor de presencia, el microcontrolador PIC enva la seal al computador para que adquiera la imagen. EL computador en respuesta enva al microcontrolador la seal de parada del proceso y a travs de la cmara digital captura la imagen, luego la procesa y finalmente enva la seal de reinicio del proceso (arranque del motor de corriente continua). En un tiempo

muy corto (alrededor de milisegundos) se enva el identificador del clasificador al cual debe ser depositado el objeto. En este momento el microcontrolador PIC manda la secuencia necesaria al motor de pasos (previa interfaz de potencia) hasta llegar a la posicin deseada, posterior a esto el microcontrolador enva la seal al computador indicando que el objeto fue clasificado. Procesamiento digital de la imagen: La imagen obtenida a partir de la cmara digital tiene el formato RGB de 256 colores, cuenta con la resolucin de 240*320 pxeles. Esta imagen es grabada en formato BMP en el disco duro de la computadora. A partir de este archivo se extraen las componentes R G B de cada pxel, que son grabados en una matriz 240 * 320 * 3 para poder ser procesadas por los algoritmos de encargados de extraer caractersticas de la imagen.

Obtenidas las componentes RGB de la imagen, se formaron 3 imgenes, una de ellas slo con componentes R, la otra con G y finalmente con B. A estas 3 imgenes se aplic la mscara de SOBEL obteniendo 3 matrices las cuales son binarizadas utilizando un valor de umbral (este valor puede variar dependiendo de la luminosidad ambiental). Binarizadas las tres matrices se procede a realizar una sumatoria lgica pxel a pxel de las tres matrices obteniendo una matriz resultante que define los bordes del objeto a detectar sin prdida de informacin.

Una vez binarizada la imagen, se obtienen las coordenadas de los pxel que forman en contorno de la figura para poder extraer caractersticas que permitan clasificarlas por color, tamao y forma.

Clculo del permetro.- Como resultado de la deteccin de mximos y mnimos (Fig. 12) se obtienen las coordenadas correspondientes a los pixeles que conforman el contorno del objeto. Luego, conociendo las dimensiones en cms. de cada pixel, se procede a determinar la diferencia euclidiana entre coordenadas del contorno, para luego ir acumulando estos valores en una variable, que al final del proceso tendr el valor del permetro requerido. La diferencia o distancia euclidiana) entre coordenadas del contorno es expresada como:

Clculo del rea y color.- Conociendo las coordenadas del contorno de la imagen se enumeran el nmero de pxeles contenidos en la figura, las cuales multiplicadas por el rea del pxel obtenemos el rea del objeto. Asimismo para identificar el color del objeto, a cada pixel se realiza una conversin de formato RGB a HIS (H=hue proporciona informacin del color del objeto). Diseo de la red neuronal: En esta parte, el objetivo principal es construir una red neuronal que permita clasificar los objetos en forma automtica y verstil dentro de 3 clases (nmero de clasificadores). El modelo desarrollado en el proyecto es el perceptrn multicapa con el algoritmo de propagacin del error. El esquema general de la red neuronal diseada de muestra en la Fig. 13, donde puede verificarse una capa de entrada con 4 neuronas, 2 capas ocultas con 40 neuronas cada uno y una capa de salida con 3 neuronas.

Interfaz Visual: La interfaz visual ha sido desarrollada ntegramente utilizando el lenguaje de programacin MS Visual C ++ con el cual se ha logrado mayor rapidez en el tiempo de procesamiento de los algoritmos de procesamiento digital de imgenes. Para el acceso a las funciones de la cmara digital utilizada para la adquisicin de las imgenes, se ha utilizado un control Active X videoCapX el cual incorpora funciones utilizadas dentro del programa. La interfaz visual que se ha desarrollado cuenta con las siguientes funcionalidades: Mdulo de calibracin de la cmara: Este mdulo permite determinar las dimensiones de un pxel de la imagen en base a la distancia que existe entre la superficie del objeto y la cmara. Mdulo de calibracin de colores: Este mdulo permite definir los umbrales de color (valores numricos que varan entre 0 y 255). Mdulo de configuracin de criterios de seleccin: Se ha implementado los siguientes criterios de seleccin: Forma, Color, Tamao. Este mdulo permite definir cual ser el criterio de seleccin. Red neuronal como sistema de clasificacin de patrones: Este mdulo consta de dos partes: Generacin de Archivos de Entrenamiento y Entrenamiento de la Red Neuronal. Comunicacin serial: Se ha implementado el mdulo de comunicacin serial RS 232C para PC en donde se ejecuta el aplicativo desarrollado en Visual C+ + y el mdulo de control basado en PIC 16F877. Identificacin de formas de objetos basados en los momentos de Hu: Este mdulo esta basado en el clculo de los momentos invariantes a traslaciones, rotaciones y homotecias.

CONCLUSIONES

El sistema diseado es capaz de clasificar objetos por sus colores utilizando el formato HIS. El sistema actualmente esta predeterminado para trabajar con 6 colores, siendo necesario cada vez que se inicie el proceso de clasificacin calibrar los umbrales de color para la diferentes tonalidades de color que pueden existir.

Para la segmentacin de la imagen se utiliz el operador de Sobel, el cual fue aplicado a cada componente de color (R,G,B) de la imagen capturada por la cmara digital, para luego ser binarizada y sumada lgicamente. Este mtodo permiti segmentar eficientemente objetos cuyos colores son parecidos al color de la faja transportadora, como lo son: azul y verde.

El sistema diseado es capaz de calcular el permetro del objeto con un error de 0.5 cm., mientras que el rea es calculado con un error de 0.5 cm2. Para

esto es necesario calibrar la cmara antes de iniciar el proceso de clasificacin, de esta manera se obtiene el tamao del pxel en cm. Para el proceso de clasificacin por formas se dise e implement una red neuronal basada en el modelo del perceptrn multicapa con el algoritmo de retropropagacin del error y funcin de activacin tangente hiperblica. La eficiencia de este modelo es mayor al 90% y el tiempo de entrenamiento de la red es menor a los 10 minutos. Los algoritmos de control, comunicacin, extraccin, descripcin y clasificacin de objetos fueron elaborados en el entorno Visual Studio C++. Se eligi esta alternativa por el tiempo de procesamiento que toma en desarrollar, para este entorno, los algoritmos codificados. La interfaz desarrollada es de fcil uso y comprensin.

You might also like