You are on page 1of 6

Grupo de Reconocimiento de Imágenes y Visión Articial (RIVA

)
Joaquím Arlandis, Javier Cano, José García Hernández, Rafael Llobet, Gloria Mainar, Roberto Paredes, Jerónimo Pla, Alberto Pérez, Juan Carlos Pérez Cortés, Ismael Salvador, Alejandro Toselli, Mauricio Villegas
Instituto Tecnológico de Informática Universidad Politécnica de Valencia {arlandis,jcano,jgarcia,rllobet,gmainar,rparedes,jcperez,aperez,jpla,issalig,ahector,mvillegas}@iti.upv.es

Resumen
El grupo de Reconocimiento de Imágenes y Visión Articial (RIVA) del Instituto Tecnológico de Informática se corresponde con una línea de trabajo dentro del grupo de investigación de Reconocimiento de Patrones y Tecnologías del Lenguaje Humano (PRHLT). Centra su actividad en el área de análisis de imágenes y visión por computador.

signicativamente, pueden zonas estar en las que

ya se

que

los o

documentos las a el texto

manuscritos

impresos,

encuentra

reconocer pueden estar localizadas o por el contrario pueden aparecer situadas arbitrariamente sobre cualquier punto, etc. Desde hace tiempo, el grupo de Visión ha participado en proyectos relacionados con el reconocimiento óptico de caracteres manuscritos e impresos [1, 2, 3, 4, 11], dando como resultado un motor de reconocimiento propio, así como diversas herramientas diseñadas adhoc"para resolver las tareas propuestas en cada colaboración realizada con empresas especializadas en introducción de datos y proceso de documentos.

1.

Áreas de investigación

Una importante línea de I+D en el Instituto Tecnológico de Informática está centrada en al área de Visión por Computador. El Grupo de Reconocimiento de Imágenes y Visión Articial está avalado por numerosas publicaciones y proyectos, y se enmarca en una línea de trabajo amplia centrada en las áreas de Reconocimiento de Formas y Tecnologías de la percepción. Tiene experiencia en tareas de inspección de materiales continuos, en análisis de escenas complejas, reconocimiento de caracteres, color y otras áreas anes como identicación biométrica (huellas dactilares, reconocimiento facial, etc.). A continuación se describen las principales áreas de investigación del grupo.

1.2.

Imagen médica

Uno de los campos en los que el procesado digital de imágenes está aportando inestimables ventajas es el caso del análisis de imágenes médicas. Dado que la responsabilidad y complejidad asociada a las tareas en este ámbito es muy alta, las aplicaciones que actualmente se diseñan siguen una línea de asistencia al diagnóstico, constituyéndose en herramientas de ayuda para el especialista, más que en sistemas automatizados [12]. Por ejemplo, el grupo ha colaborado con varios centros hospitalarios para el diseño de herramientas de ayuda al diagnóstico de

1.1.

Análisis de documentos

Existen multitud de aplicaciones en las que se requiere digitalizar documentos. En función de su origen el problema a resolver diere

Actas del Simposio de Reconocimiento de Formas y Análisis de Imágenes (AERFAI), pp.153-158 ISBN: 84-9732-445-5 © 2005 Los autores, Thomson

3. análisis escenas cación Figura 2: Análisis de escenas. de textura. Inspección industrial 2. se suman los problemas derivados de los cambios de iluminación. normalmente orientados a tareas sencillas. perspectiva y entorno variables. color. Otra aplicación en la que también se trabaja actualmente tiene como objetivo el desarrollo de un sistema de ayuda al diagnóstico de patologías del pie. y al mismo tiempo relacionadas con el reconocimiento de objetos o personas. Proyectos En esta área. 8] y se encuentra en fase de experimentación para el diagnóstico de cáncer de mama sobre radiografías digitalizadas [9. parámetros metrología. Segmentación del rostro 1. del proceso comerciales de inspección (o the shelf"). especiforma. destacar que el Por lo tanto. pueden verse como el resultado de la compaginación de dos técnicas: la primera de ellas consistiría en la localización de los objetos de interés dentro de una imagen (análisis de escenas) [13. abolladuras. Visión por Computador Figura 1: Análisis de escenas. Esto quiere decir que. desperfectos. 1. la aplicación se convierte en un posible proyecto de I+D. Segmentación de matrículas área que abarca multitud de aplicaciones y consecuentemente las soluciones ideadas para resolver este problema siguen aproximaciones muy diversas. y la segunda se correspondería con la identicación de los objetos seleccionados (reconocimiento).154 cáncer de próstata sobre imágenes ultrasonográcas [14. Cuando alguna impide característica el uso de especial productos El grupo de Visión Articial tiene experiencia en la detección de matrículas y caras sobre imágenes no restringidas. como elementos extraños. es decir. de hay es que un de control de dimensional.4. Entre ellos: procesos A continuación se comentan algunos de los proyectos realizados en colaboración con empresas del sector. a partir de información extraída de señales de presión plantares [7]. etc. imágenes en las que las condiciones de captura no están controladas. En nuestro caso. en los que se aplican los co- . 5]. existen numerosos procesos de control de calidad sin contacto cuyas restricciones o características no permiten el uso de las herramientas convencionales disponibles en el mercado. grietas. 10]. control de defectos de todo tipo. por ejemplo. detalles. al problema de localizar un determinado objeto en una imagen. construcción e implantación de un sistema de inspección dedicado a la detección automática de defectos de estampado textil. Análisis de escenas Algunas de las aplicaciones existentes en el campo de la visión por computador. el grupo de Visón Articial ha participado en el diseño.

155 2. Reconocimiento de formularios manuscritos (Análisis de documentos) El sistema desarrollado en el ITI emplea algoritmos de OCR. determinación de la caja mínima de inclusión y reescalado. En líneas generales. Una frase se comprende mejor cuando la hemos leído por completo. Además. El uso de modelos particularizados. Esto implica una cooperación de los niveles morfológico. léxico y sintáctico que se lleva a cabo mediante técnicas análogas a las de reconocimiento de habla continua. Reconocimiento de texto manuscrito • Preproceso: los campos y las celdas son aisladas mediante la segmentación. 2. Aunque el texto se compone básicamente de caracteres individuales. aprendidos automáticamente a partir de muestras. Los caracteres se extraen automáticamente de los campos manuscritos de los formularios. Una forma de conseguir precisión consiste en retrasar el reconocimiento hasta el nivel más alto. Varios integrantes del grupo de Visión Articial han colaborado. no se requiere segmentación previa. ya que se obtiene automáticamente en la decodicación. los seres humanos son capaces de segmentar y reconocer la escritura aparentemente sin esfuerzo. Sin embargo.1. Esto implica diversas etapas de procesado digital de la imagen: eliminación de ruido. . permite que el sistema pueda trabajar con cualquier lengua y cualquier tipo de alfabeto. para la extracción de información alfanumérica de los campos de • Clasicación: Cada carácter aislado es clasicado de forma individual por el motor de reconocimiento.2. muchas aproximaciones al reconocimiento óptico de caracteres no consiguen buenos resultados ya que la segmentación de texto continuo en caracteres es una tarea compleja [17]. basados en métodos de clasicación estadística. detección de blancos. el preproceso aplicado para la digitalización de un formulario manuscrito podría dividirse en las siguientes 3 etapas: Figura 3: Análisis de documentos.Simposio de Reconocimiento de Formas y Análisis de Imágenes (AERFAI) nocimientos adquiridos en el campo de investigación (reconocimiento de patrones y visión articial) del grupo de visión. para el desarrollo de sistemas experimentales. un formulario. Dichos sistemas son capaces de reconocer cantitades numéricas escritas en cheques bancarios y formularios con encuestas tambíen escritas a mano y sin restricciones lingüísticas. El Reconocimiento de texto manuscrito (Análisis de documentos) reconocimiento de texto manuscrito continuo es todavía un desafío. con empresas privadas del sector. Esta metodología hace uso de algoritmos robustos y validados.

se proporciona la cadena corregida y un valor de conanza. Para discriminar entre tumores malignos benignos por es necesario realizar Sin biopsias embargo. guiadas ultra-sonografía. etc. Esta herramienta puede ayudar al experto en la decisión de realizar o no biopsia. Reconocimiento de placas de matrículas (Análisis de escenas) existe el problema de que no siempre la zona de punción es signicativa. defunción. con las cuales colaboran en el diseño y desarrollo de un sistema de reconocimiento automático de matrículas que será implantado a la entrada de un parking. Como resultado. matrimonio. En la etapa de segmentación se buscan texturas similares a una matrícula. se aplica un proceso de clasicación pixels proceso múltiple de sobre a la un conjunto de una pertenecientes matrícula. Finalmente. perspectiva y entorno variables. se selecciona la imagen del Se dispone de un motor de reconocimiento de matrículas de vehículos diseñado para .156 Visión por Computador trabajar con imágenes no restringidas: iluminación. el motor de reconocimiento proporciona el identicador de matrícula y un nivel de conanza. como la elaboración del censo español del 2001 o la digitalización de boletines ociales (partes de nacimiento. 2. Por ello. Para ello. Ayuda a la detección del cáncer de próstata (Imagen médica) El Instituto Tecnológico de Informática ha participado en varios proyectos de colaboración con empresas de la Comunidad Valenciana involucradas en tareas de procesado automático de miles de documentos.3. Reconocimiento de formularios manuscritos del clasicador. proporciona Este clasicación cadena de caracteres que se debe ajustar a un modelo lingüístico conocido: el formato de las matrículas. y El objetivo es la obtención de un sistema automático de ayuda al diagnóstico ecográco del cáncer de próstata mediante técnicas de análisis de imagen y reconocimiento de formas.4. sería de ayuda una estimación de las zonas con cáncer. Aplicando un analizador sintáctico es posible recticar fallos parciales Figura 4: Análisis de documentos. Integrantes del grupo de Visión Articial tienen experiencia con empresas privadas del sector. 2. • Parsing: Cada secuencia de caracteres reconocidos en un campo es sometida a un proceso de análisis sintáctico que corrige. Posteriormente se aplica un postproceso sobre los puntos candidatos a pertenecer a zonas de matrícula y se devuelve el área rectangular en la que se encuentra la matrícula [5]. si es necesario. la cadena original para que se ajuste a un modelo lingüístico preestablecido [15]. Finalmente.). Posteriormente y de forma complementaria se detectan los límites de la matrícula dentro de la hipótesis de segmentación.

así como un aporte tinta perfectamente homogéneo. Se tiene experiencia en este campo gracias a la colaboración de miembros del Grupo de Visión Articial con médicos de un Hospital de Valencia. International Conference on Pattern Recognition. El proceso de estampado textil es complejo. Proceedings of the 15th... Control de calidad textil (Inspección industrial) Figura 6: Inspección Industrial.C. Figura 5: Inspección Industrial. Pérez-Cortés J. Respecto a las técnicas empleadas. Referencias La presencia de un hilo en determinados casos se confunde con la textura. se consigue eliminar las deformaciones elásticas que experimenta el tejido al ser arrastrado a gran velocidad por el tren de estampado.6 metros. Llobet R. Cada pixel de la imagen de referencia se representa por un vector de características de gran dimensionalidad.5. Ésta se etiqueta marcando la zona biopsiada y la próstata completa. siendo necesaria la [1] Arlandis J. Detalle de un defecto Uno de los primeros proyectos en los que participó el ITI con empresa privada tuvo como objetivo el diseño. utilización de 4 cámaras lineales para alcanzar una resolución de imagen que permita detectar defectos del ancho de un hilo.Simposio de Reconocimiento de Formas y Análisis de Imágenes (AERFAI) instante anterior a la punción. Detección de defectos de estampado 2. que modela la clase no cáncer y la clase cáncer. 2000. La clasicación de las texturas se puede obtener mediante: 157 • • Un factor de conanza a partir de una búsqueda rápida de vecinos [6]. [16]. que contiene características de color de toda la vecindad del pixel. Las zonas candidatas a contener cáncer son coloreadas a n de orientar la zona de punción. La probabilidad de un modelo oculto de Markov. gracias al registrado local elástico. entre otras cosas se requiere un sincronismo muy preciso de de los rodillos. desarrollo y construcción de un sistema completo de inspección industrial para la detección de ciertos fallos de estampado. . se consiguió una herramienta que permitía a los operarios de la estampadora textil registrar los primeros metros de estampado y comprobar automáticamente si en el resto de la partida de estampado aparecía algún defecto. Debido a las exigentes condiciones anteriores se producen errores de estampado a menudo. para su posterior utilización como muestra de entrenamiento o de "test". Cuando un hilo se adhiere a un rodillo de impresión obstruye el tinte resultando una zona de color más claro. La anchura del tejido puede alcanzar los 3. Finalmente. Handwritten Character Recognition Using Continuos Distance Transformation.

C. International Conference on Pattern Recognition.C... Paredes R. Paredes R. [12] Paredes R... 2005. 2002. Local Representations for Multi-Object Recognition.C.. Combination of Tangent Vectors and Local Representations for Handwritten Digit Recognition. 25th DAGM Symposium. Vidal E... 2003. 2003.. Pérez-Cortés J.. [7] García-Hernández J.. Science (2905).. 2nd Iberian Conference on Pattern Recognition and Image Analysis.C. Valiente [8] Llobet R. Stochastic Error Correcting Parsing for OCR Post-processing. [11] Keysers D.. Ney H.. 2002. Proceedings of the 2nd International Spontaneous Handwriting Recognition and Classication. Visión por Computador The Continuos Distance Transformation: A Generalization of the Distance Transformation for Continuos-valued Images. 2000..C.... Lecture Notes in Computer J. Pattern ReFast Handwritten Recognition Using Continuous Distance Transformation... Salvador [14] Pérez-Cortés J.. Bildverarbeitung für die MediWein B. Pérez-Cortés J. 2003. Amengual J. 2004.. [9] Llobet R. Juan A. Arlandis J...C. Proceedings of the 1st Iberian Conference on Pattern Recognition and Image Analy- [17] Toselli A. [13] Deselaers T. Classication of Medical Images using Local Representations. Toselli A.C.C. on Biosignal Processing and Classication. [10] Llobet R. Vidal E. Enviado al First International Workshop [16] Perez-Cortes J. Comparison Of Two Fast NearestNeighbour Search Methods in HighDimensional Large-Sized Databases. Arlandis J. Vidal E. Foot pathologies classication pressure distribution over the foot plant. B. Image Analysis..M.. Vallada E. Ney H. Llobet.158 [2] Arlandis J. zin. 2005.. 2003... Computer-aided Prostate Cancer Detection in Ultrasonographic Images. Pérez-Cortés J. H. Arlandis J. cognition and Applications.. C. Conference on Advances in Biomedical Signal and Information Processing. Proceedings of the 17th International Conference on Pattern Recognition.. Pattern Recognition... H. sis. 2000. J. Juan A. [4] Cano J... Pattern Recognition and J. Paredes R.. Garrido Textural Analysis Of Prostate Cancer In Transrectal Ultrasound Images. Keysers D.. 1999... Progress in Pattern Recognition Speech and Image Analysis... Breast Cancer Detection in Digitized Mammograms Using Non-Parametric Methods. [3] Arlandis Comparison of feature extraction methods for breast cancer detection.. Soler C. Llobet R. D. Cano J.. Juan A. Paredes R. Workshop on Statistical Pattern Recognition. 2002.. C. International Workshop on Statistical Pattern Recognition.. An Elastic Registration Method for Quality Control of Textile Printing. International Workshop on Statistical Pattern Recognition. Lehmann T.. 2002. Pérez-Cortés J. Vidal E.. Ney H. Pérez-Cortés J. of Biosignal.. [6] Cano I...C.C.. Toselli A. Keysers D.. Paredes R. Proc. 2004... . R. Vehicle License Plate Segmentation In Natural Images. Proceedings of the 1st Iberian Conference on Pattern Recognition and Image Analysis (IbPRIA). Pérez-Cortés J.. 2005. Training Set Expansion in Handwritten Character Recognition. [15] Perez-Cortes J. [5] Cano J. Pérez-Cortés J. Pérez-Cortés J....