You are on page 1of 48

Dr. César A. Beltrán Castañón cesar@spc.org.

pe

http://www.spc.org.pe

RECONOCIMIENTO DE PATRONES EN IMÁGENES DIGITAL
Dr. César A. Beltrán Castañón cesar@spc.org.pe

Grupo de Pesquisa em Visão Cibernética Instituto de Física de São Carlos Universidade de São Paulo

Laboratório de Biologia Molecular de Coccídias Instituto de Ciências Biomédicas Universidade de São Paulo

Contenido
• • • • • • Introducción Adquisición y pre-procesamiento de imágenes Representación de formas Clasificación y minería de datos Resultados Perspectivas futuras

Introducción
• Coccidiosis en aves: siete especies de Eimeria infectan la gallina doméstica:

E. maxima

E. brunetti

E. tenella

E. necatrix

E. praecox

E. acervulina

E. mitis

Introducción • Marcadores de DNA • • • • DNA fingerprinting .minisatélites RAPD Secuencias ribosómicas ITS1 Marcadores SCARs – PCR multiplex RAPD • Desventajas: • Requiere de personal especializado en técnicas moleculares • Requiere transporte de muestras de la granja hasta el laboratorio de referencia – riesgos sanitarios! PCR multiplex .

Classificación/ Reconocimiento Objeto Es un avión!!! ..... Alas -.Introducción • Reconocimiento de Patrones?? ¿Cómo aplicar ese proceso para el reconocimiento de la Eimeria? Extracción de Características -# rectas -# de ángulos -# de alas -Tamaño/dimensión -Dist.

Contenido • • • • • • Introducción Adquisición y pre-procesamiento de imágenes Representación de formas Clasificación y minería de datos Resultados Perspectivas futuras .

Adquisición y pre-procesamiento de imágenes • Secuencia de pasos. Micrografias adquiridas por microscopía Fezes de gallina Purificación de oocistos Aislamiento de oocistos individuales Transformación en tonos de gris ecualización Segmentación o Binarización Muestras de oocistos de cada especie Aquisición de imágenes digitales Detección de contorno .

Adquisición y pre-procesamiento de imágenes • Diagrama de flujo del proceso de reconocimiento de oocistos Pre-procesamiento de imágenes (conjunto de entrenamiento) Pre-procesamiento de imágenes (elemento de verificación/prueba) Vector de características Reconocimento de patrones X1 Extracción de características Vector de características X2 X3 g1 g2 Clasificación g3 Xn Base de datos de imágenes .

Adquisición y pre-procesamiento de imágenes • Segmentación y detección del contorno Algoritmo de seguimiento de contorno Contorno paramétrico x(t) e y(t) .

Contenido • • • • • • Introducción Aquisición y pre-procesamiento de imágenes Representación de formas Clasificación y minería de datos Resultados Perspectivas futuras .

un lugar de las formas Originalmente publicado en 1917 .Representación de formas En los brazos de Platón: El mundo Morpheus material es uma sombra del mundo real. Aristóteles: La mente.

Representación de formas • Transformación y aplicación de filtros • Reducción de la dimensionalidad • Remoción de información redundante • Maximizar la capacidad de representación • Caracterizar distintos aspectos Vector de características Medidas Geométricas Representación de la curvatura Caracterización de la estructura interna .

Representación de formas • Medidas geométricas Área : Conteo del número de pixels Diámetros : Cálculo por componentes principales y y y D d x x x (a) (b) (c) .

Representación de formas • Medidas geométricas Simetría : y x (a) (b) (c) (d) (e) (f) .

Representación de formas • Representación de la curvatura Sigma=10 Sigma=50 .

Representación de formas • Caracterización de la estrutura interna Matrices de co-ocurrencia .

Caracterización de imágenes • Espacio de características Diámetro mayor Diámetro menor Simetría vertical Simetría horizontal Área Entropía de la estructura interna Excentricidad(ancho/largo) Media de la curvatura Desviación estándar curvatura Entropía de la curvatura Segundo momento angular Contraste Momento diferencia inversa Entropia matriz co-ocurrencia .

Contenido • • • • • • Introducción Adquisición y pre-procesamiento de imágenes Representación de formas Clasificación y minería de datos Resultados Perspectivas futuras .

Clasificación y minería • Método paramétrico por densidad normal x1 Vector de características g1 x2 g2 x3 Clasificación gc xn .

Clasificación y minería • Método paramétrico por densidad normal Función discriminante basada em la distribución normal Resultados son intepretados como por similaridad .

Clasificación y minería • Generalización del clasificador Base de datos de imágenes Imágenes Extracción de características Generalización del clasificador Base de características 1 Selección de características Selección de características Datos Datos Características selecionadas Taxa do conjunto de treinamento Definición del tamaño mínimo del conjunto de entrenamiento Definición del tamaño mínimo del conjunto de entrenamiento Función criterio Función criterio Características seleccionadas Función criterio (Clasificador) Função critério Tasa mínima del conjunto de entrenamiento Evaluación del desempeño del clasificador Datos 1 Sistema de diagnóstico en tiempo-real .

Contenido • • • • • • Introducción Adquisición y pre-procesamiento de imágenes Representación de formas Clasificación y minería de datos Resultados Perspectivas futuras .

praecox E. acervulina E. brunetti E. tenella E.891 . necatrix 418 757 747 608 404 TOTAL 3. mitis E.Resultados • Identificación de especies de Eimeria de gallina Conjunto de datos ID Características Característica Média de la curvatura F1 Especie E. maxima No de ejemplos 636 321 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 F13 F14 Desviación estándard de la curvatura Entropía de la curvatura Diámetro mayor (largo) Diámetro menor (ancho) Simetría en función del diámetro mayor Simetría en función del diámetro menor Área Entropía de la estructura interna Segundo momento angular Contraste Momento de la diferencia inversa Entropía de la matriz de co-ocurrencia Excentricidad o shape index E.

Resultados • Identificación de especies de Eimeria de gallina ¿Cuál es el conjunto mínimo de elementos de entrenamiento? 30% = 672 ejemplos 96 imágenes/especie .

00 85.14 85.92 84.15 .47 82.29 85.13 80.Resultados • Identificación de especies de Eimeria de gallina Selección de características con SFS y el clasificador por similaridad Nivel 2 3 4 5 6 7 8 9 10 11 12 13 14 X X X X X X X X X X X X X X F1 F2 F3 F4 X X X X X X X X X X X X X F5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X F6 F7 F8 F9 F10 F11 F12 F13 F14 Acierto 76.39 85.09 85.15 81.45 79.08 85.37 85.

88 80.97 80.02 81.65 74.Resultados • Identificación de espécies de Eimeria de gallina Selección de características con SFS y el clasificador por probabilidad iível 2 3 4 5 6 7 8 9 10 11 12 13 14 X X X X X X X X X X X X X X X X X X X X X X X X F1 F2 F3 F4 F5 X X X X X X X X X X X X X X X X X X X X F6 F7 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X F8 F9 F10 F11 F12 F13 F14 Acierto 69.15 81.28 81.69 79.46 80.61 81.10 .05 81.20 81.80 77.

62 E.26 5.07 0. mit 1. necatrix 608 404 0.02 0.00 4.13 11.49 2.08 E.94 94. praecox Nro. mitis E.76 0. ace 81.00 0. nec 14.33 4.97 0.Resultados • Identificación de especies de Eimeria de gallina Discriminación de especies Especies E.00 0.49% . tenella E.69 E.84 E.00 0. de oocistos 636 321 418 757 747 Especies de oocistos E.73 0.00 0.04 75.00 2.51 74.00 E. maxima E.66 0.00 E.73 0. bru 0.00 0.48 0.61 5.07 0.00 3.16 0.20 80.00 0.51 Clasificador: por similaridad Estrategia de validación: Leave-one-out Acierto medio: 85.47 0.74 6. max 0.70 4.62 0.96 3.00 99. acervulina E.77 E. pra 0.59 12.30 8. ten 1.00 0.00 0.00 92. brunetti E.48 3.50 0.

44 0.10 6.00 3.00 0. Maxima E.99 0.00 2.00 0.20 0.10% .96 0.13 8.00 98.19 70.89 E.25 65.00 5.00 1.66 7.13 E. acervulina E.63 Clasificador: por probabilidad Estrategia de validación: Leave-one-out Acierto medio: 80.00 91.85 0. max 0.00 0. mitis E.41 5.06 0.18 0.00 0.43 0.00 5.16 1.00 E.11 2. bru 0.20 0. necatrix 608 404 0. ten 2.56 89.16 5.00 0.32 20.69 5.96 0. mit 2. ace 84.89 61.Resultados • Identificación de especies de Eimeria de gallina Discriminación de especies Especies E. praecox Nro.97 E. pra 0. de oocistos 636 321 418 757 747 Especies de oocistos E.59 E. brunetti E.33 E.15 14.24 0. nec 10.23 18.00 6. tenella E.09 E.16 0.70 0.

Resultados • Identificación de especies de Eimeria de gallina Análisis comparativo del desempeño de los clasificadores .

maxima E.Resultados • Identificación de especies de Eimeria de gallina Análisis del desempeño de los clasificadores por curvas ROC E. necatrix . praecox E. acervulina E. mitis E. tenella E. brunetti E.

Resultados • Flujograma del sistema integrado (COCCIMORPH) Usuario Cliente Visualización y envio de imágenes Análisis de Oocistos et ern Int k Lin PreProcesamiento de imágenes Extracción de caractetísticas Clasificación de patrones Aplicación Aplicación y servidor Web Sub-sistema de Análisis Sub-sistema de importación Base de Datos Image_ID 3578 3579 Nombre Imágen1 Imágen2 Metadatos dato1 dato2 Base de Datos Repositório de imágenes Importación Microscopio .

icb.usp.br/coccimorph/ .Resultados • Interfaz web http://puma.

Resultados • Base de imágenes .

maxima 100 97 E. necatrix E.1 100 E.Filograma inferido por Neighbor-joining con datos morfométricos Filograma inferido por máxima verosemejanza a partir de genomas mitocondriais de Eimeria spp. necatrix 0. acervulina E. flavescens E. tenella 100 E. 100 66 92 64 E. maxima E. brunetti E. tenella E. praecox 97 E. praecox 100 E. mitis E. mitis E. brunetti E.02 . acervulina E. coecicola 0.

Producción científica .

Contenido • • • • • • Introducción Adquisición y pre-procesamiento de imágenes Representación de formas Clasificación y minería de datos Resultados Perspectivas futuras .

. • Aprendizaje online. Adaptación del sistema para parásitos cuya morfología se encuadre em el mismo dominio de imágenes.Perspectivas Futuras • Segmentación automática. Adaptación del sistema para parásitos con morfología muy diferente de Eimeria spp. • Aplicación del sistema a otros parásitos.

Otras Aplicaciones Predicción e Identificación de genes aplicando dominio de frecuencia .

Visualización de Proteinas .

Predicción de estructura de proteinas Parallel Righthanded β-helix Leucine-rich repeats Hemagglutinin Eubacterial 70S .

Secuencia  Estructura  Función Secuencia Primaria MNGTEGPNFY PLNYILLNLA KPMSNFRFGE HFIIPLIVIF SDFGPIFMTI VPFSNKTGVV VADLFMVFGG NHAIMGVAFT FCYGQLVFTV PAFFAKTSAV RSPFEAPQYY FTTTLYTSLH WVMALACAAP KEAAAQQQES YNPVIYIMMN LAEPWQFSML GYFVFGPTGC PLVGWSRYIP ATTQKAEKEV KQFRNCMVTT AAYMFLLIML NLEGFFATLG EGMQCSCGID TRMVIIMVIA LCCGKNPLGD GFPINFLTLY GEIALWSLVV YYTPHEETNN FLICWLPYAG DEASTTVSKT PROTEINAS (Extraido de: Judith KleinSeetharaman) VTVQHKKLRT LAIERYVVVC ESFVIYMFVV VAFYIFTHQG ETSQVAPA Folding Estructura 3D Funcion compleja dentro de una red de proteinas Normal .

Secuencia  Estructura  Función Secuencia primaria MNGTEGPNFY PLNYILLNLA KPMSNFRFGE HFIIPLIVIF SDFGPIFMTI VPFSNKTGVV VADLFMVFGG NHAIMGVAFT FCYGQLVFTV PAFFAKTSAV RSPFEAPQYY FTTTLYTSLH WVMALACAAP KEAAAQQQES YNPVIYIMMN LAEPWQFSML GYFVFGPTGC PLVGWSRYIP ATTQKAEKEV KQFRNCMVTT AAYMFLLIML NLEGFFATLG EGMQCSCGID TRMVIIMVIA LCCGKNPLGD GFPINFLTLY GEIALWSLVV YYTPHEETNN FLICWLPYAG DEASTTVSKT VTVQHKKLRT LAIERYVVVC ESFVIYMFVV VAFYIFTHQG ETSQVAPA PROTEINAS Folding Estructura 3D Función compleja dentro de red de proteinas Enfermedad .

Alineamiento y predicción: β-Helix (Extraido de: Carbonell 2006) .

Reconstrucción de Patrones de Expresión Genética (Travençolo 2008) .

Gestión de Cuencas .

ICB-USP Orientación Prof. Arthur Gruber – ICB-USP Prof.ICB-USP Jane Silveira Fraga . Dr. Pereira – IME-USP . Carlos Alberto de B. Dr. Luciano da Fontoura Costa – IFSC-USP Prof.Equipo de investigación Propagación y purificación de parásitos Sandra Fernandez . Dr.

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior CNPq – Conselho Nacional de Desenvolvimento Científico e Tecnológico .Soporte financiero CAPES .