You are on page 1of 19

INTRODUCCION

Los sistemas de Visin Artificial permiten, mediante sensores de imagen, el desarrollo de procesos con una mayor precisin y detalle, as como la optimizacin de las metodologas actuales de trabajo. La visin artificial (VA) es un campo de la inteligencia artificial que posibilita el anlisis automtico de imgenes obtenidas por medios digitales. El proceso completo consiste en capturar la imagen, digitalizarla e interpretarla. Para conseguir que este diagnstico se pueda realizar de manera autnoma, los sistemas de visin artificial modelan matemticamente los procesos de percepcin visual en los seres vivos, generando algoritmos que permiten simular estas capacidades visuales. La visin artificial es como el sentido de la vista para el ordenador, y por tanto nos brinda la oportunidad de automatizar y mejorar muchos procesos en infinidad de mbitos.

Introduccin a la visin artificial

1. Mquinas de visin Sistemas De Visin Los sistemas de mquinas de visin capturan imgenes y luego las procesan, analizan e interpretan para dar una retroalimentacin a tiempo. Las ms de las veces los resultados se usan para rechazar productos con forma incorrecta o daados. Pero las mquinas tambin pueden hallar las orillas de galletas orientadas inadecuadamente, controlando as los robots usados en las operaciones de ensamblado de galletas de emparedado y empaque. Las aplicaciones de la tecnologa de mquinas de visin comprenden el manejo y empaque as como la inspeccin y clasificacin. Este mtodo tambin confirma la presencia o ausencia de materiales. Por ejemplo, puede ver la cola de caballo de cada bolsa de pan para asegurarse de que tienen la banda flexible o clip no ms atascamientos debido a bandas que se cayeron- un gran beneficio para las operaciones de carga automtica de canastas/charolas. Las aplicaciones donde la variacin de tamao es una variable crtica, como el estibado de tortillas o el empacado de galletas, mejoran cuando cada artculo presentado est correctamente configurado y orientado. Un sistema de visin consiste de una cmara, iluminacin, computadora y programa de cmputo (software). Mientras que algunas de las aplicaciones de visin se emplean para monitorear las condiciones durante el proceso, algunas incluyen tambin mecanismos de rechazo para remover o recanalizar productos que no cumplen con las caractersticas deseadas. Los sistemas de visin examinan las caractersticas externas, tales como forma y apariencia. Para las caractersticas internas, los procesadores pueden recurrir a la tecnologa de rayos-X cuando necesitan ir ms all de la deteccin de metales. Debido a que la iluminacin es muy importante para la adecuada operacin de los sistemas de mquinas de visin, la mayora emplea iluminacin suplementaria en vez de confiar slo en las condiciones de la planta. Las mallas permiten tambin un control ms estrecho de la luz reflejada que los sensores de la cmara leern. La luz estructurada, como una lnea lser o patrn de franja oscura-brillante, permite la determinacin del grosor y ayuda a encontrar las orillas del producto. Los sistemas de dos dimensiones usan una imagen plana para monitorear la forma y apariencia visual. Los sistemas tridimensionales emplean una fuente de luz estructurada, como una lnea lser o patrn de franja oscura-brillante. La luz reflejada se observa desde uno o ms ngulos para determinar la altura de cada punto del objeto. Incluso en condiciones de alta humedad y calor de la lnea tpica de las galletas saladas), se pueden detectar diferencias de 0.05 mm. Los estilos del la cmara varan y van desde los que parecen sistemas de video domsticos hasta los slidos sistemas digitales en los que la luz reflejada crea un patrn de cargas elctricas en un microficha. Algunos sistemas "ven" en distintos tonos de gris. Los sistemas de visin a color son capaces de registrar puntos de datos de tinte, saturacin e intensidad de la luz que los alcanza, en tanto que otro mide el contenido actual de la luz reflejada por

los tres colores primarios: rojo, amarillo y azul. Todos procesan sus imgenes para realzar la resolucin de la imagen, resaltar caractersticas importantes e ignorar pequeas discrepancias sin importancia. El programa (software) determina lo que el sistema har con los datos recolectados. La mayora de los sistemas de visin emplea estilos de "enseanza," lo que permite al operador programar puntos fijos usando ejemplos de productos aceptables que muestra a la cmara. Cuando se mide el color, los productos pueden pasarse delante de un color de fondo con valor conocido, ya sea un color idntico o aceptable en contraste con l. El programa separa las lecturas generadas por los fondos y los transportadores. Los controladores lgicos programables que operan los sistemas de mquinas de visin pueden comunicar esta informacin a otras computadoras de la red con modems alimentando a las localidades remotas. 2. Adquisicin de imgenes a) La cmara de tubo de videcon En la mayora de cmaras de vdeo , antes de mediados a finales de 1980, un tubo de la cmara de vdeo o el tubo de absorcin estuvo en lugar de un dispositivo de carga acoplada (CCD) que serva para convertir una imagen ptica en una seal elctrica. Varios de estos tipos estaban en uso desde 1930 hasta la dcada de 1980. El xito comercial de la mayora de estos tubos eran varios tipos de tubos de rayos catdicos o "CRT". Cualquier tubo de vaco que funciona mediante un haz enfocado de electrones (" rayos catdicos ") es conocido como un tubo de rayos catdicos. Sin embargo, en el popular xito "CRT" por lo general se refiere a la "tubo de imagen" en un televisor o monitor de ordenador . El trmino apropiado para este tipo de tubo de presentacin es cinescopio , slo uno de los muchos tipos de tubos de rayos catdicos. Otros incluyen los tubos usados en osciloscopios , radar pantallas, y los tubos de recogida de la cmara que se describen en este artculo. (La palabra "cinescopio" tambin se ha convertido en el nombre popular para una grabacin de pelcula hecha enfocando una cmara de cine en la cara de un tubo de rayos catdicos cinescopio, una prctica comn antes de la llegada de la grabacin en cinta de vdeo. ) Tubos para cmaras de video normalmente tenan una cierta tolerancia mxima luminosidad. Si se supera ese lmite, como al apuntar la cmara a las superficies brillantes por el sol que refleja, como los parachoques cromados, o fuentes de luz puntuales extremadamente brillante, la superficie tubo detectar instantneamente "burn out", y se rindi insensible de parte o la totalidad de la pantalla. Una ligera quemadura podra desaparecer en cuestin de semanas, pero para una quemadura severa es la nica solucin fue reemplazar el tubo de vdeo.

Vidicon

Esquema de tubo vidicn. El vidicn es un tubo de la cmara de almacenamiento de tipo en el que un patrn de densidad de carga se forma por la radiacin escena fotografiada en un fotoconductor superficie que luego es escaneado por un haz de baja velocidad de electrones . La tensin fluctuante junto a un video del amplificador se puede utilizar para reproducir la escena a ser visualizada. La carga elctrica producida por una imagen permanecer en la placa frontal hasta que se escanea o hasta que la carga se disipa. piroelctricos fotoctodos se puede utilizar para producir un vidicn sensible a travs de una amplia porcin del infrarrojo del espectro.

Entonces, diremos que la diferencia principal es el material fotoconductivo usado. En el Vidicon estndar el material usado es Trisulfito de Antimonio (Sb2S3) , que es la material ms antiguo. La configuracin de las capas depende del fabricante, pero lo ms habitual es encontrarse con dos o tres capas. La ventaja de este tipo de dispositivos es su alta resolucin, y la posibilidad de variar los voltajes aplicado, variando sus caractersticas. Su gamma (Desviacin de color) es de 0.6, lo que lo hace idneo para fines mdicos. Sus mayores desventajas son la presencia de intensidad en ausencia de seal ("offset"), y su baja sensibilidad. Antes del diseo y construccin de la galileo sonda a Jpiter a finales de 1970 a principios de los 1980, la NASA utiliza cmaras de videcon en la mayoria de sus sondas espaciales no tripuladas profundas equipados con la capacidad de deteccin remota.

b) Dispositivos acoplados por carga(CCD) Un sistema bsico de captura de imagen contiene un lente y un detector. En la fotografa analgica la pelcula captura la imagen a travs de las sales de plata y detecta mucho ms informacin visual que un sistema digital. En la fotografa digital los dispositivos de captura de imgenes constituyen el ojo electrnico por el que vamos a digitalizar las imgenes. El detector es un sensor de imagen de estado slido denominado Charge Coupled Device (dispositivo de carga acoplada- CCD ). Un CCD est constituido por una matriz de miles de fotoceldas microscpicas o sensores que generan pxeles, percibiendo la intensidad de la luz de pequeas porciones de la imagen de pelcula. Su funcin consiste en convertir una imagen en un conjunto o mapas de bits. Cada sensor CCD convierte la luz en voltaje proporcional a la luminosidad. Su funcin se inicia con el barrido lnea a lnea de la imagen con la luz procedente de una lmpara que recoge con su intensidad variable las diferencias de tonalidad de cada uno de los puntos o pxeles que componen cada lnea de la imagen. Una red de fotodiodos transforman a los fotones(luz) que chocan con ellos en electrones. Estos electrones son almacenados en pequeos capacitores que representan informacin impresa como una serie de variables de voltaje proporcionales a la brillantez de la imagen. El voltaje pasa a un convertidor anlogo digital ADC (encargado de traducir las fluctuaciones del CCD), en donde es convertido en cdigo binario discreto. Las series numricas obtenidas de esta conversin son enviadas a un microprocesador de seales digitales (DSP), el cual ajusta el contraste y detalle, y comprime la imagen antes de que sea almacenada en la memoria de la cmara y, usualmente, ms tarde transferida a una computadora donde la imagen puede ser vista y manipulada.

3. Iluminacin y formacin de imgenes: Tcnicas de iluminacin Iluminacin La iluminacin juega un papel primordial dentro del proceso de visin. Los sistemas de iluminacin ayudan a simplificar considerablemente el anlisis e interpretacin de las escenas. Muchas veces, los algoritmos de procesamiento pueden ser reducidos drsticamente con una seleccin adecuada del sistema de formacin de las imgenes. Por el contrario, la falta de estudio sobre la adquisicin de las imgenes provocar el aumento de la complejidad de los algoritmos y las dificultades de generalizacin del equipo de Visin Artificial. Las imgenes recibidas por las cmaras no pueden estar, generalmente, en un ambiente de iluminacin no estructurada, esto es, donde las condiciones de iluminacin no hayan sido estudiadas. En estos casos, la propia sombra de otro objeto que interfiera har peligrar el xito del montaje. Los sistemas de Visin Artificial trabajan, normalmente, con iluminaciones estructuradas. El espacio captado por las cmaras est aislado del resto. No hay contaminacin lumnica, no hay sombras inesperadas, no existen objetos que intersecciones a los escenarios que se desean capturar. La iluminacin se disea para que sea capaz de resaltar los objetos de inters. La iluminacin depende bsicamente de la naturaleza de las superficies donde se va a reflejar y del tipo de fuente luminosa.

La primera reduccin consiste en tratar los objetos como si fuesen opacos. La radiacin transmitida no es considerada. En Computacin Grfica se estudia la interaccin entre la luz y las superficies y cunta radiacin reflejada le llega al sensor. En una primera aproximacin se estudia la interaccin entre la fuente luminosa y los cuerpos. Sin embargo, estas iteraciones no son suficientes para crear imgenes sintticas crebles. As, en el movimiento de los objetos sobre un escenario no se produciran cambios de iluminacin o sombras. Estas consecuencias se derivan de no tener en cuenta las radiaciones reflejadas de los cuerpos existentes en la escena. Una de las tcnicas de renderizacin ms empleadas se llama Ray Tracing. Consiste en lanzar rayos de luminosidad y ver cmo interactan con las superficies de los objetos que hay en el escenario, tomando en cuenta la interaccin entre todos ellos. El problema en Visin Artificial es el inverso de la Computacin Grfica. No se trata de generar una imagen sinttica, sino de ubicar correctamente la iluminacin, los sensores y los cuerpos a examinar para resaltar las caractersticas visuales de los objetos.

Tcnicas de iluminacin Existen muchas tcnicas de iluminacin y resulta difcil de generalizar sobre los distintos tipos de iluminacin, ya que suele depender de cada caso concreto. Sin embargo, se pueden clasificar en cuatro grandes grupos: direccionales, difusas, a contraluz y estructuradas. Iluminacin direccional Consiste en dar una iluminacin orientada al objeto empleando un haz altamente direccional o colimado. Se utiliza en la localizacin y reconocimiento de piezas, inspeccin de superficies, seguimiento de puntos para soldadura o pegamento, etc. La forma del haz luminoso

depende de la aplicacin y del objeto a analizar. Cabe destacar los siguientes casos: a) Punto luminoso b) Lnea de luz c) Plano de luz y d) Corona circular luminosa.

Iluminacin difusa. En ella se intenta que los haces luminosos incidan sobre el objeto desde todas las direcciones y no slo desde la fuente luminosa. Proporciona el mnimo contraste del objeto y elimina las sombras. Se utiliza cuando los objetos a analizar presentan superficies suaves. Para crear una iluminacin difusa se utilizan difusores de color blanco mate.

Iluminacin a contraluz. Consiste en colocar la fuente luminosa por detrs del objeto, de manera que la informacin capturada por el sensor proviene del flujo luminoso transmitido por el cuerpo. Si el objeto es opaco, ste aparecer como una sombra y las imgenes se constituyen bsicamente en slo dos niveles de grises. Se emplea preferentemente para la localizacin de piezas y anlisis dimensional. El principal inconveniente es la prdida de los detalles de los cuerpos. Una preocupacin a tener en cuenta es el posible deslumbramiento de la cmara, producido por la cantidad de radiacin que alcanza al sensor, lo que origina un recorte en la dimensin de los objetos. En caso de cuerpos translucidos dejar informacin sobre las propiedades internas de la materia. ste es el fundamento de la tomografa o de la radiografa. La imagen capturada depender de la absorcin de la materia. En este ejemplo se observa que la fuente de iluminacin no tiene por qu pertenecer al espectro visible.

Iluminacin estructurada. Este tipo de iluminacin se sirve de la proyeccin de puntos, franjas o rejillas sobre la superficie de trabajo. En funcin de cmo se deforme este patrn de luz sobre la superficie se puede detectar las singularidades de la pieza objeto de anlisis. Este mtodo posee dos ventajas con respecto a las anteriores. 1. Establece un patrn de luz conocido sobre la superficie de trabajo y las diferencias con este patrn indican la presencia de un objeto, simplificndose as el problema de deteccin de un objeto. 2. Analizando la forma en que el patrn de luz es distorsionado, es posible obtener informacin de las caractersticas tridimensionales del objeto.

4. Anlisis y procesamiento Anlisis de Imagen La disciplina del Anlisis de Imagen constituye un amplio campo de estudio e investigacin en diversas disciplinas con mltiples aplicaciones. En este sentido, cartgrafos, fotogrmetras, matemticos, fsicos, informticos y dems, continan investigando en cuestiones que van desde la aplicacin de simples filtros lineales hasta la automatizacin del reconocimiento semntico de objetos. Los tres primeros temas de la asignatura pretenden ser un recorrido de carcter tericoprctico desde los fundamentos y tcnicas ms contrastadas en el procesamiento digital de imgenes hasta los ltimos avances del Anlisis de la Imagen en el contexto de la Geomtica. Este primer tema tiene como objetivo proporcionar una introduccin a los conceptos y fundamentos bsicos del Anlisis de la imagen.

Fundamentos bsicos de la imagen digital Imagen Digital La siguiente figura es un diagrama esquemtico de la obtencin de una imagen digital a partir del escaneado o digitalizacin de una fotografa. De esta manera la fotografa puede describirse como una funcin continua F(x,y), denominada imagen, donde las coordenadas x, y son variables espaciales y la funcin valor (amplitud) es la densidad. Esta funcin es adems el producto de dos funciones separadas: Una funcin es la de iluminacin I, mientras que la otra funcin describe las propiedades del objeto que est siendo iluminado, conocida como reflexin R. En realidad para poder obtener la imagen digital la funcin continua debe estar discretizada, tanto en las variables espaciales como en la amplitud. La funcin discreta resultante f(x,y) se denomina imagen digital. El proceso de discretizar las variables espaciales x, y se conoce como muestreo y la discretizacin de la amplitud g como cuantificacin. El elemento discreto x, y es el pxel (de las palabras inglesas picture x element) y g es un nivel de gris, denominado informalmente brillo. As pues una imagen digital puede expresarse por f (xi, yj, i=0,,N-1;j=0,.,M-1) siendo i, j la direccin del pxel, N el nmero de filas y M el nmero de columnas. La funcin imagen se escribe normalmente como f(x,y). Hay que tener en cuenta que las variables espaciales son valores discretos, usualmente valores enteros. La cuantizacin de la imagen asignar a cada localizacin discreta (x,y) un valor entero 2b, con b siendo valores de: 2, 4, 8, 12, 16 o 32 bits por pxel. De esta forma la resolucin radiomtrica describir el nmero de bits por pxeles en una imagen.

Media y desviacin estndar El nivel de gris medio ga, de una imagen y su desviacin estndar o tpica se determinan fcilmente mediante las expresiones

La media ga indica el brillo o luminosidad de una imagen mientras que la desviacin estndar es la medida del contraste, o lo que es igual la variacin de la informacin en la imagen. Un valor pequeo indica una imagen plana con poco contraste, es decir, una imagen con un contenido de informacin reducido, mientras que un valor alto ser indicativo de una imagen con grandes variaciones de contraste.

Resolucin geomtrica Obviamente, cuanto ms pequeas sean las variables discretas x, y (tamao del pxel), mejor ser la resolucin geomtrica de la imagen, mayor ser el nmero de pxeles de la imagen y por lo tanto mejor ser su aproximacin a la funcin continua de la imagen original. Segn el teorema de muestreo se establece que el tamao ms pequeo del pxel puede ser algo menor que la mitad de la frecuencia ms alta de la funcin continua. Si se satisface esta condicin, la funcin continua se puede recomponer a partir de la funcin discreta, lo que equivale a decir que no hay prdida de informacin durante el proceso de discretizacin. Por tanto, la resolucin geomtrica de la imagen (tamao del pxel) estar directamente relacionada con el concepto de nmero de pxeles de una imagen. De forma que a mayor resolucin geomtrica mayor nmero de pxeles de una imagen. La siguiente tabla resume las necesidades de almacenamiento de las imgenes digitales para varios tamaos de pxeles, as como el nmero de pxeles que representa una fotografa area(230x230mm). Los ejemplos se basan en que la cuantificacin de las imgenes se ha efectuado a 256 niveles diferentes de gris, es decir un pxel requiere un byte (8 bits).

El tamao de memoria que ocupa una imagen digital en binario viene dado por: N bits = M x N x p con G = 2p Unidades mltiplo: 1 byte= 8 bits, Kilobyte, Megabyte, Gigabyte Si la imagen fuese en color deberamos triplicar el tamao de la Tabla 1-1 por tres (3 luces RGB para cada pxel) Hay que advertir que las necesidades de almacenamiento disminuyen substancialmente con las tcnicas de compresin existente hoy en da. Los niveles de gris de imgenes de escenas naturales no son completamente aleatorios. De hecho existe una dependencia muy considerable de los pxeles vecinos. Por ejemplo, el algoritmo de compresin JPEG puede reducir la capacidad de almacenamiento a 1/3 sin prdida apreciable de la calidad de la imagen. Resolucin radiomtrica La resolucin radiomtrica describir el nmero de bits por pxeles en una imagen. La cuantizacin de una imagen ha de responder a la pregunta de cuntos niveles de gris son necesarios para representar el brillo?. La solucin est muy condicionada por consideraciones

prcticas. Una variable que ocupa un byte (8 bits) alcanza 256 valores diferentes (28). Es ms que suficiente para representar los niveles de gris en fotografas en blanco y negro. Normalmente el ser humano no puede discriminar ms all de 50 tonos de gris. Sin embargo, no es conveniente usar seis bits para representar los niveles de gris. Teniendo en cuenta todas las consideraciones prcticas, un byte es mucho ms adecuado para almacenar el valor de gris de un pxel. Muestreo y Cuantizacin El proceso de conversin de una representacin continua en una discreta se conoce como digitalizacin o barrido. La funcin discreta es una imagen digital. Se obtiene por el muestreo de las variables espaciales y la cuantizacin de los niveles de gris (amplitud). El mtodo habitual para digitalizar una imagen es barrer la misma fila por fila, y muestrear cada una de las filas. El nmero de filas que se barran (m) y el nmero de pxeles que se muestreen por fila (n) determinarn la resolucin de la imagen digital (mxn), que viene a ser el grado de discernibilidad de detalles en la imagen. Obviamente, cuanto mayor es la resolucin de una imagen digital ms se aproxima esta al original El siguiente punto a tener en cuenta es la cuantizacin de cada una de las muestras. Si el muestreo representaba una digitalizacin en el espacio, la cuantizacin viene a ser una digitalizacin en la amplitud, entendiendo por amplitud el nivel de intensidad luminosa en cada punto. Al cuantificar cada pxel, por el simple hecho de limitar el nmero de bits, se reduce el nmero de valores existentes desde infinito hasta, en principio 2p posibles valores. Este es el proceso de conversin de una variable continua a otra discreta, donde entra cada dos valores consecutivos ya no hay otros infinitos entre medias. La calidad de la cuantizacin viene dada, fundamental mente, por el nmero de bits que se asignan a cada una de las muestras. Dado que los ordenadores digitales suelen trabajar, no con bits aislados sino con agrupaciones de ellos (bytes, kilobyte, megabyte, etc.), suele ser prctico utilizar un valor menor o igual de ellos, evitando que un pxel desborde, por ejemplo, de un byte en otro. Una vez definido el nmero de bits por pxel (llammosle p), la imagen final queda representada por un mapa tridimensional, de orden mxnxp, que a cada punto del espacio (mi,ni) le hace corresponder un nivel de intensidad luminosa definido por pi. Para ser utilizable para el anlisis de imagen por medio de un ordenador, una funcin imagen f(x,y) debe ser digitalizada tanto espacialmente como en su amplitud. La digitalizacin de las coordenadas espaciales (x,y) se denomina muestreo de la imagen y la digitalizacin de la amplitud se conoce bajo el nombre de cuantizacin del nivel de gris. Se supone que una imagen continua f(x,y) se describe de forma aproximada por una serie de muestras igualmente espaciadas organizadas en forma de una matriz NxM como se indica en la siguiente ecuacin, donde cada elemento de la matriz es una cantidad discreta:

A cada elemento de la matriz se le puede denominar elemento de la imagen, pxel. La resolucin (el grado de detalle discernible) en una imagen de pende estrechamente de estos dos parmetros: muestreo y cuantificacin. Aunque no suele ser habitual, existe la posibilidad de mejorar la apariencia de la imagen a travs del empleo de un muestreo no uniforme o adaptativo, de forma que la resolucin espacial del muestreo vare en funcin de las caractersticas de la imagen. Por ejemplo realizando un muestreo fino en las proximidades de transiciones o detalles y un muestreo tosco en regiones suaves. Esto dara como resultado una malla de pxeles irregula y adaptativa. Convolucin Existen operaciones que tan slo se basan en la aplicacin de una funcin, ms o menos sencilla, sobre el valor de luminancia de cada uno de los pxeles de la imagen (o zona de la misma) a manipular. A continuacin se introducir el uso de la operacin de convolucin como herramienta bsica para las operaciones de filtrado y extraccin de caractersticas de la imagen. As, la operacin de convolucin se define matemticamente, para un caso bidimensional continuo como: mientras que en el caso discreto (imgenes digitales) las integrales se transforman en sumatorios de la manera siguiente:

La convolucin se aplica realizando el producto ponderado de la matriz de convolucin con el entorno de un pxel, para cada pxel de la imagen (exceptuando, quizs aquellos que estn sobre el borde de la imagen). Grficamente el procedimiento se muestra en la siguiente figura, cuando se aplica al caso de la convolucin con una mscara de 3x3 elementos:

Posibles aplicaciones de la convolucin en el suavizado, gradientes y derivadas para la mejora o realce de una imagen y por supuesto su aplicacin para la extraccin de caractersticas.

Histograma El histograma de una imagen es, bsicamente, una herramienta visual para el conocimiento de la misma. Con un simple vistazo puede proporcionarnos una idea muy aproximada de la distribucin de niveles de gris de la misma, el contraste que presenta, y algn mtodo ptimo para su mejora o compresin. Se define el histograma de una imagen como la curva que a lo largo de uno de sus ejes representa cada uno de los posibles niveles de gris, y en el otro la frecuencia relativa de aparicin del mismo en la imagen. Que la frecuencia de aparicin de cada nivel de gris se muestre en forma relativa (en porcentaje) se debe, fundamentalmente, al hecho de que el valor absoluto vara fuertemente en funcin del tamao de la imagen, y a que tambin lo hacen los valores absolutos mximos en funcin de ese valor. As, por ejemplo, para una imagen de 32x32 pxeles el mximo valor absoluto sera de 1024, mientras que en una de 256 x 256, el mismo ascendera hasta 65536. Un vistazo al histograma ofrece una idea rpida de cunto distribuidos se encuentran los niveles de gris en la imagen, aspecto asociado al concepto de contraste.

Clculo del histograma. Calcular el histograma de una imagen es algo tan sencillo como contar el nmero de apariciones de cada uno de los posibles niveles de gris presentes en la misma. Para ello, simplemente hay que contar la aparicin de cada nivel de gris y almacenar la cuenta en un vector.

Modificaciones del histograma. Supngase que g1(x,y) es una imagen en la que se quieren modificar sus niveles de gris por medio de una transformacin T para obtener una imagen nueva g2(x,y). Se tiene

Ampliacin del contraste. En esta operacin, se modifican los niveles de gris para que tengan el rango ms amplio de valores posibles. Una ampliacin lineal, por

ejemplo, viene definida porLos parmetros de transformacin t1, t2 pueden escogerse de tal modo que los niveles de gris en g2 estn comprendidos en los intervalos <g2min, g2max>. Sean g1min y g1max los niveles de gris mnimo y mximo de la imagen g1 (determinados a partir de su histograma). Los coeficientes de transformacin sern entonces:

No es necesario que la funcin de ampliacin sea lineal. Algunas veces, una ampliacin logartmica es ms conveniente para el observador. Sirva como ejemplo que el sistema de visin del ser humano percibe las diferencias de brillo segn una escala logartmica. Ecualizacin del histograma. La ecualizacin del histograma define una transformacin de niveles de gris g1 a niveles de gris g2 de tal manera que la distribucin de g2 es uniforme. La siguiente figura ilustra el procedimiento.

Supngase por un momento que la distribucin de los niveles de gris es continua. La figura anterior muestra el histograma de g1 en su posicin normal. El histograma de g2, h(g2) en la parte izquierda de la figura est girado 90. Se busca una funcin de transformacin tal que h(g2)=(FC)/n, donde F,C son el nmero de filas y columnas, y n el nmero de niveles de gris. Para lograrlo se divide el rea comprendida por debajo de la curva del histograma en n/(FC) partes iguales. La ecuacin siguiente expresa la condicin para la ecualizacin del histograma:

siendo r la variable muda de integracin. La integral es una funcin de distribucin acumulada. De lo que se deduce que la funcin de transformacin necesaria para obtener un histograma constante es la funcin de distribucin acumulada. En las imgenes digitales, los niveles de gris son discretos. La forma discreta de la funcin de distribucin acumulativa se obtiene simplemente sumando todos los niveles de gris. La figura siguiente muestra el efecto de la ecualizacin del histograma. La imagen original de la figura (a) tiene un contraste pobre, expresado claramente por el histograma (c). El histograma ecualizado (d) produce una representacin mejorada de la imagen, como se aprecia en (b).

Aunque el mtodo de la ecualizacin el histograma es muy til, no conduce por s mismo a las aplicaciones interactivas de mejora de la imagen. La razn de ello es que este mtodo slo es capaz de generar un nico resultado: una aproximacin a un histograma plano.

Umbralizacin del histograma. Una solucin sencilla para segmentar una imagen consiste en definir rangos de valores de brillo que supuestamente correspondan a zonas importantes o significativas en la escena. Ha de acompaarse con la eleccin adecuada de unos valores de umbral acordes con los niveles de gris del histograma, seguido por la divisin de la imagen en regiones. La utilidad de la umbralizacin del histograma se demuestra ms adelante en la siguiente figura, la Figura (a) muestra una marca fiducial de esquina en una fotografa area. Para la realizacin de la orientacin interna es muy conveneiente la deteccin automtica de las marcas fiduciales. En un principio, se trata de detectar aquellos pxeles que contengan las marcas fiduciales. El histograma de la Figura (b) muestra tres grupos: los pxeles negros del fondo; los pxeles blancos de la marca fiducial y su entorno y los grises que conforman la escena circundante. La umbralizacin del histograma alrededor del valor 128 incluye las marcas fiduciales as como los pxeles de la escena (campo helado). Los pxeles del fondo de las marcas fiduciales, sin embargo, pueden umbralizarse fcilmente. La imagen segmentada en (c) se obtiene en dos pasos. En primer lugar se separan los pxeles negros del fondo del resto de la imagen y a continuacin se hace una segmentacin, pero ahora slo dentro de la regin oscura del fondo. El resultado mostrado en la Figura (c) contiene tres zonas. Tonos grises correspondientes al contenido de la escena, negro al fondo de la marca fiducial y blanco a la propia marca.

Especificacin del histograma. Aunque la aplicacin de una transformacin de entre las mostradas conlleva importantes modificaciones, beneficiosas en principio para la visualizacin de la imagen, el mtodo mostrado adolece de una cierta falta de versatilidad. Hay casos en que puede ser deseable especificar de forma interactiva la forma del histograma resultante, por ejemplo con el fin de resaltar determinados niveles de gris de la imagen. Esto es, precisamente, lo que se persigue con la operacin de especificacin del histograma. Jerarqua en el Anlisis de Imagen Antes de pasar a analizar los diferentes niveles en el Anlisis de Imagen conviene tener presente que el primer paso es la Adquisicin de la imagen digital, habitualmente realizado mediante cmaras digitales. Obtenida la imagen digital, el siguiente proceso sera el Pre-procesamiento de la imagen con el objetivo bsico de mejorar la imagen de forma que se aumente las posibilidades de

xito en los procesos posteriores. Tareas como mejorar el contraste, eliminar ruido o aislar regiones son algunos ejemplos. En una fase posterior estara la Segmentacin que consistira en extraer de una imagen sus partes ms representativas. La ltima etapa conllevara el Reconocimiento o la Interpretacin. El Reconocimiento es el proceso que asigna una etiqueta a un objeto basndose en la informacin proporcionada por sus descriptores. El Reconocimiento implica asignar significado a un conjunto de objetos reconocidos. Esta ltima tarea es la ms sofisticada y la que de hecho se encuentra en continua investigacin en lo que se ha dado en denominar como anlisis semntico de la imagen. Podemos dividir los diferentes procesos y tareas del Anlisis de Imagen en cuatro categoras resumidas en la Tabla 1-2. La clasificacin sigue el paradigma de la Visin Computacional. La Visin Computacional es la disciplina que se centra en la descripcin de la escena u objeto a partir de imgenes.

Nivel de sistema La manipulacin de las imgenes digitales es una tarea bsica en cualquier disciplina. El tamao de las imgenes digitales que suelen usarse en disciplinas como la Fotogrametra y Teledeteccin plantea un reto a la hora de resolver adecuadamente las tareas de manipulacin como son el almacenamiento, la recuperacin y la visualizacin de imgenes. Por ejemplo, una fotografa area digitalizada con una resolucin de 10 m requiere una capacidad de almacenamiento de 450 Mb (sin comprimir). Nivel bajo El nivel de sistema proporciona la funcionalidad necesaria para que un ordenador pueda gestionar las imgenes. La funcionalidad bsica necesaria para las operaciones del procesado de imgenes se proporciona en el siguiente nivel, denominado aqu nivel bajo, en clara analoga con la visin primara de nivel bajo. Las tareas de procesamiento de imgenes permiten mejorar la apariencia de las mismas, por ejemplo, las codificaciones del histograma tales como la reduccin de contraste, mejora de la imagen etc. Nivel medio Tal y como se indica en la Tabla 1-2 las tareas tpicas de nivel medio son las encargadas de la extraccin de caractersticas bsicas de los objetos, tales como lneas, curvas o primitivas simples. Tareas como la agrupacin y la segmentacin pertenecen a este nivel y sirven como base de entrada para el siguiente nivel de reconocimiento de objetos.

Nivel alto Para que una persona pueda responder adecuadamente a su entorno debe analizar, interpretar y comprender los estmulos visuales. Idealmente, esta misma hazaa puede ser llevada a cabo por un robot un vehculo autnomo. Para recoger algo de un recipiente moverse en medio de una aglomeracin, el robot debe reconocer el entorno por medio de los datos que le llegan del sensor y del contenido almacenado en la memoria. El resultado de la comprensin de la imagen es una interpretacin total de la escena. Por tanto la comprensin interpretacin de la imagen depende de la aplicacin.

5. Aplicaciones La mayora de las aplicaciones de la VA se pueden agrupar en ocho grupos principales:

La inspeccin, que se refiere al control de calidad, es decir, al chequeo cualitativo de ciertas caractersticas de los objetos que recorren una cadena de produccin, comprobando si su estado verifica los estndares requeridos para que puedan salir al mercado. Por ejemplo, el descarte de etiquetas dobladas en una cadena de envasado. La medicin o calibracin, asegurando que las mediciones cumplan con las especificaciones iniciales. Por ejemplo, controlar el espesor de un cable. La clasificacin, de tal manera que pueda ser clasificado sobre un conjunto predefinido de categoras. Por ejemplo, la clasificacin de ctricos (limones, naranjas, mandarinas etc.) por color y tamao, o la clasificacin de clulas por rea y forma. El reconocimiento de patrones, que supone la identificacin de un objeto mediante la comparacin de sus caractersticas visuales con las de un patrn almacenado. Por ejemplo, el reconocimiento automtico de vasos sanguneos. La lectura de cdigos, para localizacin de smbolos y secuencias complejas que puedan identificar unvocamente a un objeto. Un ejemplo tpico es el caso de los OCR (Optical Character Recognition) para la lectura de textos sobre imgenes escaneadas. El anlisis de ubicacin, que supone la inspeccin de un rea donde, entre otras funciones, se pueden buscar objetos y medir distancias. El guiado automtico, que implica proporcionar adaptativamente informacin posicional de retroalimentacin para dirigir una actividad. El ejemplo tpico es el uso de un sistema de visin para guiar un brazo robtico mientras suelda o manipula partes, o la navegacin en vehculos autnomos.

La presencia/ausencia, que supone un chequeo cualitativo y cuantitativo de que ciertas operaciones de fabricacin han sido llevadas a cabo correctamente. Por ejemplo, asegurar que no falte ninguna tecla en un teclado. 6. Conclusiones El procesamiento de imgenes est dado por un conjunto de operaciones llevadas a cabo sobre las imgenes a fin de realizar mediciones cuantitativas para poder describirlas. Una caracterstica es un atributo usado para hacer decisiones respecto a objetos en la imagen. Algunos atributos son naturales y se definen mediante la apariencia visual de la imagen, los artificiales, son el resultado de operaciones realizadas a la imagen. Una imagen f(x,y) est dada por sus coordenadas espaciales y su brillo, y es representada matemticamente en una matriz. Una buena iluminacin es especialmente importante para la toma de imgenes de los productos en una lnea rpida de produccin, aunque algunas aplicaciones pueden utilizar la luz ambiente.

7. Bibliografa www.etitudela.com/celula/downloads/visionartificial.pdf .jcee.upc.edu EE ... A MO - ision artificial.pdf .invaringenieria.com vision-artificial www.muyinteresante.es tag visin-artificial http://sistemamultimedia.wordpress.com/iii-unidad/

You might also like