You are on page 1of 18

Informe de

Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

1 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

Informe de Pasantía de Investigación

Tema: “Reconocimiento de Patrones aplicado al
procesamiento de imágenes médicas”

Aplicación: “Asistencia al control de diálisis
peritoneal”

Pasante: Sr. Diego Bladimir Haro Fernández
Tutores: Ing. Diego Sebastián Comas
Dr. Gustavo Javier Meschino















Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

2 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

2. Índice general
1. PORTADA
2. CONTENIDO
2.1. Índice general
2.2. Introducción
2.3. Información General
2.3.1. Empresa y/o institución
2.3.2. Duración de las prácticas pre-profesionales.
2.3.3. Áreas
2.3.4. Responsable empresa
2.3.5. Actividades Realizadas
2.4. Objetivos
2.5. Actividades desarrolladas
2.5.1. Parte teórica
2.5.1.1 Fundamentos de procesamiento digital de imágenes
2.5.1.2 Reconocimiento de patrones en imágenes
K-means
Fuzzy C-Means
K-vecinos más próximos
2.5.1.3Detección de bordes en imágenes - filtro de SOBEL
2.5.1. Parte práctica
2.5.1.1. Materiales
2.5.1.2. Método
Extracción de características
Reconocimiento de patrones
Resultados
2.6. Conclusiones
2.7. Recomendaciones
2.8. Resumen
2.9. Referencias
3. PORTADA




Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

3 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

2.2. Introducción
Los pacientes que padecen de insuficiencia renal están obligados a realizarse diálisis. Los
tipos más comunes de diálisis son: la hemodiálisis y la diálisis peritoneal (DP), cada una de estas
con sus procedimientos médicos asociados tiene ventajas y desventajas. En este trabajo nos
enfocaremos en diálisis peritoneal.
La implementación de la diálisis peritoneal requiere el acceso al peritoneo del paciente (ver
Figura 1). Este acceso rompe las barreras normales de la piel. Debido a esto y a que los pacientes
que sufren de insuficiencia renal y se encuentran en tratamiento de diálisis generalmente tienen
un sistema inmune levemente suprimido, las infecciones son relativamente comunes.
Para determinar si el paciente ha sufrido algún tipo de infección debe examinarse bajo
microscopio el efluente (el líquido extraído luego de la diálisis). Un efluente nublado o de tono
oscuro indica una probable infección peritoneal. Sin embargo, debido al volumen de pacientes que
reciben los grandes hospitales donde se realizan este tipo de procedimientos, el análisis de las
muestras del efluente requiere de grandes costos operativos, principalmente debido al tiempo que
dedican los especialistas para determinar si existe infección o no.
En este trabajo se propone el análisis de una posible automatización de este
procedimiento, mediante la captura fotográfica del líquido peritoneal y el uso de técnicas de
Procesamiento Digital de Imágenes (PDI) y técnicas de reconocimiento de patrones que permitan
determinar, a partir de la imágenes de las muestras y de manera automática, si existe o no
infección.

Figura 1: Esquema el equipo ambulatorio para la diálisis peritoneal.
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

4 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

2.3. Información general
3.1 Institución:
“Universidad Nacional Mar del Plata- Argentina”
3.2 Duración:
Las prácticas pre profesionales se realizaron de febrero a marzo del 2013, con un total de 160
horas.
3.3 Área y Responsable
Áreas:
Departamento de investigación de procesamiento digital de imágenes.
Departamento de investigación de bioingeniería.
Responsables:
Ing. Diego Sebastián Comas, Investigador.
Dr. Gustavo Javier Meschino, Investigador.
3.4 Actividades Realizadas:

- Adquirir los conocimientos básicos de procesamiento digital de imágenes y
algoritmos de reconocimiento de patrones.
- Extracción de características de la imágenes (muestras de diálisis peritoneal)
- Aplicar los algoritmos de reconocimiento de patrones para clasificar cada una
de las imágenes.


Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

5 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

2.4. Objetivos
Una imagen es una representación pictórica de un objeto o fenómeno que contiene
información descriptiva de éste. El procesamiento de imágenes es la manipulación de los
datos contenidos en la imagen para convertirlos en información útil. Dicho procesamiento
puede realizarse en forma: óptica, analógica o digital. La manipulación de esta información
en forma digital constituye lo que se denomina PDI (Gonzalez and Woods, 2002).

2.5. Actividades desarrolladas
2.5.1 Parte teórica
2.5.1.1 Fundamentos de procesamiento digital de imágenes
Una imagen es una representación pictórica de un objeto o fenómeno que contiene
información descriptiva de éste. El procesamiento de imágenes es la manipulación de los datos
contenidos en la imagen para convertirlos en información útil. Dicho procesamiento puede
realizarse en forma: óptica, analógica o digital. La manipulación de esta información en forma
digital constituye lo que se denomina PDI (Gonzalez and Woods, 2002).
Una imagen digital queda definida por una función
2 3
:
f
f D c ÷ , donde el conjunto
de llegada define los valores de las componentes de color para cada píxel de la imagen. Si la
imagen está en niveles de gris, la misma puede definirse como una función
2
: 0, 255
f
f D c ÷
en donde el conjunto de llegada ahora indica el nivel de intensidad de cada píxel, correspondiendo
0 a la mínima intensidad (negro) y 255 a la máxima intensidad (blanco) (Ballard and Brown, 1992).
Algunos conceptos relacionados a la representación de imágenes digitales que son
relevantes en este trabajo se definen en el resto de esta sección.
La profundidad de color (PC) es la cantidad máxima de colores distintos que se puede
representar para un determinado modelo de representación.
La representación de color en imágenes digitales utiliza diferentes sistemas de
representación. El nivel de color puede representarse por medio de su descomposición en colores
fundamentales, cada uno de estos es conocido como un componente. Existen transformaciones
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

6 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

para convertir una imagen de un espacio color a otro. Los espacios de color más usados se
presentan a continuación.
El espacio de color RGB (Red-Green-Blue) usa la composición del color en términos de la
intensidad de los colores primarios de la luz: rojo, verde y azul. RGB es un modelo de color basado
en la síntesis aditiva. Todos los colores posibles que pueden ser creados por la mezcla de estas tres
luces de color son aludidos como el espectro de color de estas luces en concreto. Cuando ningún
color luz está presente se percibe el negro. En este sistema cada píxel de la imagen tiene asociado
un vector de tres componentes con los valores de intensidad de cada color (ver Figura 2).

Figura 2: Esquema de la representación de una imagen en el sistema RGB.
Cada matriz representa la intensidad de una componente de color.
El sistema CMY (Cyan-Magenta-Yellow) trabaja mediante la absorción de la luz (colores
secundarios). Los colores que se ven son la parte de luz que no es absorbida. En CMY, magenta más
amarillo producen rojo, magenta más cian producen azul, cian más amarillo generan verde y la
combinación de cian, magenta y amarillo forman negro. El negro generado por la mezcla de colores
primarios sustractivos no es tan denso como el color negro puro (uno que absorbe todo el espectro
visible). Es por esto que al CMY original se ha añadido un canal clave (key), que normalmente es el
canal negro (black), para formar el espacio CMYK o CMYB. El color en RGB está hecho por la
reflexión o emisión de luz, mientras que el CMY, mediante la absorción de ésta. La Figura 3
muestra una representación de la superposición de color de las componentes del sistema de
representación CMYK.
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

7 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador


Figura 3: Superposición de componentes de color en el sistema CMYK.

El espacio de color HSV (Hue, Saturation, Value), es un espacio de color cilíndrico, pero
normalmente asociado a un cono o cono hexagonal, debido a que es un subconjunto visible del
espacio original con valores válidos de RGB (Figura 4). Tiene 3 componentes, las cuales se
describen a continuación:
- Matiz (Hue): Se refiere a la frecuencia dominante del color dentro del espectro visible.
Es la percepción de un tipo de color, normalmente la que uno distingue en un arcoíris,
es decir, es la sensación humana de acuerdo a la cual un área parece similar a otra o
cuando existe un tipo de longitud de onda dominante. Incrementa su valor mientras
nos movemos de forma antihoraria en el cono, con el rojo en el ángulo 0.
- Saturación (Saturation): Se refiere a la cantidad del color o a la "pureza" de éste. Va
de un color "claro" a un color más vivo (azul cielo – azul oscuro). También se puede
considerar como la mezcla de un color con blanco o gris.
- Valor (Value): Es la intensidad de luz de un color. Dicho de otra manera, es la cantidad
de blanco o de negro que posee un color.

Figura 4: Representación del espacio de color HSV.


Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

8 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

2.5.1.2. Reconocimiento de patrones en imágenes
El uso de técnicas de reconocimiento de patrones en imágenes comprende dos etapas. En
la primera se realiza un procesamiento de las imágenes mediante el cual se extraen diferentes
características (features): características de información de color, de texturas, información de
posición, etc. En la segunda etapa toda esta información reunida en las características es ingresada
a un algoritmo de reconocimiento de patrones (Comas et al., 2010), que permitirá clasificar la
información.
El fin más general de la aplicación de estos algoritmos es la segmentación de las imágenes
(ver Figura 5), lo cual permite clasificar cada píxel de la imagen. Sin embargo, las características
pueden se obtenidas de manera global en las imágenes (un vector de características por imagen).
Con este enfoque, los algoritmos de reconocimiento de patrones clasifican diferentes imágenes y
no píxeles. Este será el enfoque utilizado en este trabajo.
La selección de las características o descriptores es una tarea sumamente importante del
proceso, que debe realizarse de acuerdo a la problemática planteada y de ella dependerá en gran
medida el desempeño del proceso de clasificación.

Figura 5: Aplicación típica de reconocimiento de patrones en imágenes.
El reconocimiento de patrones se define como el proceso en el cual se agrupa a un
conjunto de datos en una determinada cantidad de grupos (clusters) mediante un mecanismo de
decisión (Jain et al., 1999). De acuerdo a la información que se utilice para el ajuste o definición del
algoritmo puede distinguirse entre (Comas et al., 2010):
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

9 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

- Algoritmos supervisados: en ellos los parámetros internos del algoritmo son ajustados
de acuerdo a un conjunto de datos previamente clasificados (un conjunto de datos
etiquetados en diferentes clases). La descripción obtenida de este proceso de ajuste
es, entonces, utilizada para clasificar un nuevo conjunto de patrones. Este tipo de
algoritmo se conoce como clasificación supervisada o análisis discriminante.
- Algoritmos no supervisados: en este tipo de algoritmo, el problema consiste en
agrupar un conjunto de datos no clasificados en grupos significados, sin utilizar
información previa sobre el agrupamiento esperado. La información de las clases es
únicamente obtenida a partir de los propios patrones a agrupar. Este tipo de técnicas
se conocen como técnicas de clasificación no supervisada, agrupamiento o clustering.
A continuación se realizará una breve explicación de las 3 técnicas de reconocimiento de
patrones utilizadas en este trabajo: K-means, Fuzzy C-Means (FCM) y K vecinos más próximos
(KNN).
K-means
En este algoritmo no supervisado, se define el número de clusters ( k ) a generar. Por cada
cluster, se tendrá un centro en el espacio de patrones. Los datos son asignados a uno de los k
clusters según su distancia al centro sea la menor. Este algoritmo se basa en la minimización de la
suma de los cuadrados de las distancias de todos los puntos de un cluster al centro del mismo es
decir, en la minimización de la función criterio de errores cuadráticos. La Figura 6 muestra un
ejemplo de un agrupamiento con K-means para un conjunto de datos en el espacio
2
. El
procedimiento se describe como sigue (Jain et al., 1999):
1. Se toman k centros de cluster iniciales { }
1
,...,
k
Z Z donde j representa la
iteración. El criterio para asignar los centros iniciales es arbitrario.
2. En la j -ésima iteración se distribuyen el conjunto de patrones { }
1
,...,
n
X x x =
entre los k centros, asignando cada punto al cluster cuyo centro esté más cercano.
Para esta asignación pueden utilizarse diferentes definiciones de distancia
(distancia euclidiana, suma del valor absoluto de las diferencias, etc.).
3. Se calculan los nuevos centros de cluster siguiendo el criterio de error cuadrático.
Es decir se busca minimizar el índice E dado por:

,
2
( 1)
j i
j i
x S
E x Z j
e
= ÷ +
¿
,
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

10 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

donde
j
E es el índice de error cuadrático,
, j i
x S e es el conjunto de patrones
asignados al cluster i en la iteración j y
i
Z es el centro del cluster i .
Los nuevos centros que minimizan el índice de error dado están dados por:
, ,
1
( 1)
j i
i
x S
j i
Z j x
S
e
+ =
¿
.
4. Si ( ) ( ) 1
i i
Z j Z j + = para todos los clusters, el algoritmo se detiene. En otro caso se
vuelve al paso 2.


Figura 6: Ejemplo de K-means aplicado a datos en
2
, con 3 K = .
Fuzzy C- Means:
El Fuzzy C-Means (FCM) (Ruspini, 1969), es un algoritmo de no supervisado, donde cada
dato tiene un grado de pertenencia a cada uno de los grupos, como en la lógica difusa , en lugar de
pertenecer completamente a un sólo grupo (como en el caso ya visto de K-means). De esta
manera los puntos más alejados de un centro de cluster pertenecen al cluster con un menor grado
que los puntos más cercanos a dicho centro.
Cualquier punto
i
x X e tiene un conjunto de coeficientes que dan el grado de estar en
la k -ésimo clúster ( )
k i
w x . En FCM, el centroide de un cluster es la media de todos los puntos,
ponderados por su grado de pertenencia al cluster, es decir:
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

11 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

( )
( )
i
i
k i i
x X
x
k
X
k i
w x
w x
x
Z
e
e
=
¿
¿

donde y
k
Z es el centro del cluster k .
El algoritmo puede describirse como sigue:
1. Asignar al azar los coeficientes de pertenencia de los datos a cada cluster.
2. Calcular los centroides iniciales para cada grupo utilizando la fórmula:
( )
( )
( )
1
i
i
i
x
X
k
k i
X
x
i
k
w x
w
x
j Z
x
e
e
= +
¿
¿

donde j representa la iteración.
3. Calcular para todos los datos el grado de pertenencia al cluster usando la
fórmula:
( )
( )
( )
( )
2
1
1
,
,
k
l
k i
K
i
l i
x
x
x
w
d Z
d Z
÷
| |
|
|
=

\ .
¿
,
donde
2
: d
+
÷ es una función distancia.
4. Recalcular los centroides con la fórmula descripta en el paso 2.
5. Repetir los pasos 3 y 4 hasta que el cambio en los coeficientes entre 2
iteraciones consecutivas sea menor que un valor c definido como parámetro.
K- vecinos más próximos:
El método K vecinos más próximos (K-nearest neighbors) (Rajini, 2011; Zhu et al., 2007) es
un método de clasificación supervisada que se basa en la estimación de la probabilidad de que un
patrón pertenezca a alguna de las clases definidas dentro del conjunto de entrenamiento (conjunto
de datos prototipo). El método puede describirse como sigue:
1. Se define un conjunto de datos previamente etiquetados llamado conjunto
prototipo, notado
p
X .
2. Para cada dato de entrada se obtienen los K vecinos más próximos dentro del
conjunto prototipo en término de su distancia euclidiana.
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

12 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

3. La clase de un dato
i
x X e es asignada a la que más ocurra entre los K
vecinos más próximos obtenidos del conjunto prototipo.
2.5.1.3. Detección de bordes en imágenes – Filtro de SOBEL
En PDI, el filtro de SOBEL (Gonzalez and Woods, 2002) es utilizado para la detección de
bordes. Técnicamente es un operador diferencial discreto que calcula una aproximación al
gradiente de la función de intensidad de una imagen. Para cada punto de la imagen a procesar, el
resultado del operador Sobel es tanto el vector gradiente correspondiente como la norma de éste
vector.
El operador Sobel calcula el gradiente de la intensidad de una imagen en cada punto
(píxel). Así, para cada punto, este operador da la magnitud del mayor cambio posible, la dirección
de éste y el sentido desde oscuro a claro. El resultado muestra qué tan abruptamente o
suavemente cambia una imagen en cada punto analizado y, en consecuencia, que tan probable es
que éste represente un borde en la imagen y, también, la orientación a la que tiende ese borde. En
la práctica, el cálculo de la magnitud -probabilidad de un borde- es más fiable y sencillo de
interpretar que el cálculo de la dirección y sentido.
Matemáticamente, el gradiente de una función de dos variables (en este caso, la función
de intensidad de la imagen) para cada punto es un vector bidimensional cuyos componentes están
dados por las primeras derivadas de las direcciones verticales y horizontales. Para cada punto de la
imagen, el vector gradiente apunta en dirección del incremento máximo posible de la intensidad, y
la magnitud del vector gradiente corresponde a la cantidad de cambio de la intensidad en esa
dirección.
Lo dicho en los párrafos anteriores implica que el resultado de aplicar el operador Sobel
sobre una región con intensidad de imagen constante es un vector cero, y el resultado de aplicarlo
en un punto sobre un borde es un vector que cruza el borde (perpendicular) cuyo sentido es de los
puntos más oscuros a los más claros.
El operador utiliza dos máscaras (una detecta los bordes horizontales y la otra los
verticales), que estás definidas como sigue:
1 0 1 1 2 1
2 0 2 , 0 0 0
1 0 1 1 2 1
x y
h h
÷ ÷ ÷ ÷ ( (
( (
= ÷ =
( (
( ( ÷
¸ ¸ ¸ ¸
.
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

13 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

Ambas máscaras se aplican utilizando el operador de convolución sobre la imagen, y en
cada punto los resultados de ambos gradientes se combinan por medio de la fórmula:
( ) ( )
2
2
* *
x y
G X h X h = +
En la Figura 7 se muestra un ejemplo del resultado obtenido sobre una imagen al aplicar el
filtro de Sobel.

a)

b)
Figura 7: Ejemplo de filtro de Sobel. a) Imagen original. b) Bordes detectados.
2.5.2. Parte Práctica
2.5.2.1. Materiales
Las imágenes fueron tomadas con una cámara digital de 14 megapíxeles. Todas las
imágenes fueron tomadas con la misma cámara fotográfica e intentando reproducir las mismas
condiciones de luminosidad y posición de la cápsula de Petri. Se incluyó un rombo de color oscuro
para normalizar la posición de las imágenes.
La base de datos tiene 414 fotografías que se han tomado desde 04/04/2012 hasta el
13/12/2012, promedio hay 3 imágenes por paciente. Todas las muestras tienen una clasificación
previa establecida por los expertos. Esta clasificación será utilizada para computar el error de
clasificación. La gran mayoría de fotografías poseen una resolución de 4320x3240 pixeles pero
también existen un pequeño número de fotografías con baja resolución. En la Figura 8 se muestra
un ejemplo de una de las imágenes.
El software utilizado fue Matlab 7.6.0.324 (R2008a) y las librerías de procesamiento de
imágenes y de reconocimiento de patrones. Además se utilizaron funciones específicas de una
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

14 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

librería desarrollada en el Grupo de Procesamiento Digital de Imágenes de la UNMDP (Comas et
al., 2010).

Figura 8: Ejemplo de una de las imágenes de la secuencia.
2.5.2.2. Método
El método se divide en dos etapas. La primera es la extracción de características. En la
segunda se aplican los algoritmos de reconocimiento de patrones para clasificar cada una de las
imágenes.
Extracción de características:
Se procedió a tomar en una imagen inicial (utilizada para el ajuste) 4 regiones
representativas de la muestra y una quinta región en la que se incluye la transición entre el fondo
y el borde, zona del rombo. Con la ayuda de una serie de algoritmos de Matlab se extiende la
misma selección inicial para todo el resto de las imágenes de la base de datos. La Figura 9 muestra
un ejemplo de una selección inicial de regiones.

Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

15 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

Figura 9: Ejemplo de una posible selección de regiones para el cálculo de las características.

Se utilizaron el sistema de color RGB y el HSV aprovechando funciones propias de Matlab
para dichas transformaciones. Se programó en Matlab un algoritmo de extracción de
características, combinando diferentes técnicas, y obteniendo 10 características para cada región
de la imagen, las cuales se describen como sigue:
1. R (Región_n_Media_R): promedio de todos los pixeles de la región n en el espacio R.
2. G (Región_n_Media_G): promedio de todos los pixeles de la región n en el espacio G.
3. B (Región_n_Media_B): promedio de todos los pixeles de la región n en el espacio B.
4. H (Región_n_Media_H): promedio de todos los pixeles de la región n en el espacio H.
5. S (Región_n_Media_S): promedio de todos los pixeles de la región n en el espacio S.
6. V (Región_n_Media_V): promedio de todos los pixeles de la región n en el espacio V.
7. GRIS (Region_n_Media_Gris): promedio los espacios RGB para obtener la imagen en la
escala de grises, luego promediamos todos los pixeles de la región n en escala de grises.
8. Rombo (Rombo_Máximo_Sobel): aplicamos el filtro Sobel a la región del rombo y tomamos
el valor máximo.
9. Rombo (Rombo_Media_Sobel): aplicamos el filtro Sobel a la región del rombo y tomamos
el promedio de este.
10. Rombo (Rombo_dispersión_Sobel): aplicamos el filtro Sobel a la región del rombo, luego
calculamos la dispersión.
Donde { } 1, 2, 3, 4 ne define una de las regiones tomadas. Para una dada imagen, se
incorporaron las tres características obtenidas de la región del rombo a las obtenidas para la
región, generando un total de 10 características por cada región. En la Tabla 1 se muestra un
ejemplo de cómo están organizadas las características obtenidas para una de las imágenes.
Tabla 1: Distribución las características para una imagen de la base de datos.
Cada fila corresponde a una región de la imagen.
ROMBO
1 2 3 4 5 6 7 8 9 10
R 1 G 1 B 1 H 1 S 1 V 1 Gris 1 Max Media Var
R 2 G 2 B 2 H 2 S 2 V 2 Gris 2 Max Media Var
R 3 G 3 B 3 H 3 S 3 V 3 Gris 3 Max Media Var
R 4 G 4 B 4 H 4 S 4 V 4 Gris 4 Max Media Var
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

16 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

El procedimiento se repitió tomando diferentes regiones y diferentes secciones del rombo
con esto se obtuvieron nuevos conjuntos de datos para poder comparar los resultados de la
clasificación. Todas las características obtenidas guardadas en una hoja de cálculo para cada una de
las imágenes de la secuencia.
Reconocimiento de patrones:
Una vez obtenida la matriz de características de la imagen, el conjunto de características se
procesó con técnicas de reconocimiento de patrones, clasificando cada región de las imágenes en
clase#0 (muestra normal) o clase#1 (muestra patológica). En todos los casos se evaluó el error de
clasificación, considerando la opinión de los expertos. Se utilizaron 3 técnicas de reconocimiento
de patrones:
- K-means.
- Knn (K-nearest neighbors).
- Fcm (Fuzzy C-Means).
Del conjunto de 10 características iniciales que se tienen para cada región, se realizaron
diferentes selecciones heurísticas, y se computó el error de clasificación.
Resultados
En la Tabla 2, se muestran los errores obtenidos para diferentes selecciones de
características con cada uno de los algoritmos de clasificación utilizados y el error obtenido, con 6
diferentes selección de regiones (pruebas 1 a 6). Luego se muestra un promedio de los errores
para cada técnica. Esto nos va a servir para determinar que clasificación será la más adecuada.
Tabla 2: Resultados obtenidos.
Características
seleccionadas
Algoritmo
de
clustering
Prueba 1 Prueba 2 Prueba 3 Prueba 4 Prueba 5 Prueba 6
Promedio
errores
Mínimo
error
promedio
4,5,6
K-means 0,2184 0,2184 0,2130 0,2103 0,2238 0,2193 0,2172
0,2172 Knn 0,4513 0,4513 0,4486 0,3240 0,3565 0,3466 0,3964
Fcm 0,2301 0,2301 0,2365 0,2238 0,2381 0,2374 0,2327
1,2,4
K-means 0,2256 0,2112 0,2229 0,2103 0,2238 0,2193 0,2189

0,2189 Knn 0,2482 0,3989 0,3700 0,4486 0,4341 0,4504 0,3917
Fcm 0,2358 0,2256 0,2482 0,2247 0,2383 0,2374 0,2350
1,4,5
K-means 0,2356 0,3401 0,2142 0,2130 0,2356 0,2274 0,2443

0,2221 Knn 0,2253 0,2141 0,4486 0,4269 0,3718 0,4278 0,3524
Fcm 0,1432 0,2372 0,2365 0,2283 0,2428 0,2446 0,2221
1,4,6
K-means 0,2238 0,2157 0,2229 0,2094 0,2356 0,2193 0,2211

Knn 0,2329 0,3529 0,3493 0,3791 0,3890 0,3475 0,3418
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

17 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

Fcm 0,2220 0,3935 0,2482 0,2256 0,2428 0,2347 0,2611
0,2211
1,4,8
K-means 0,2202 0,2731 0,2229 0,2130 0,2330 0,2283 0,2318

0,2318 Knn 0,2229 0,2282 0,3899 0,3213 0,3222 0,3890 0,3123
Fcm 0,3637 0,2241 0,2482 0,2301 0,2437 0,2446 0,2591

2.6. Conclusiones
Las medidas de error obtenidas se consideran demasiado altas, ya que el menor error
obtenido fue 21,72%, pero considerando que esta es una etapa preliminar de la solución del
problema, estos resultados son los esperados. Se espera que con una adecuada selección de
características y acondicionamiento de los datos, el error de clasificación mejore, lo que
corresponde a la etapa inmediata futura de esta investigación.
El trabajo que he realizado ha sido sólo una pequeña parte de un proyecto de mayor
envergadura, pues aunque los resultados obtenidos de las pruebas no hayan sido muy
satisfactorios, se tiene previsto continuar con el diseño de más experimentos.
Durante el tiempo que he trabajado en el proyecto he notado la importancia del trabajo en
equipo, y con mayor razón si el equipo es multidisciplinar, ya que todos y cada uno de los
integrantes tienen sus puntos de vista, los cuales son expuestos y, mediante la argumentación y el
diálogo se llega a un consenso que es problable que sea la solucion al problema.
Para la realización de este proyecto ha sido necesario adquirir las nociones de varios temas
como: procesamiento digital de imágenes, reconocimiento de patrones, detección de bordes, así
como también varias herramientas de software en especial de Matlab. Esto ha sido de relevancia
para ampliar mi visión del campo profesional.
2.7. Recomendaciones
2.8. Resumen
2.9. Referencias
1. Ballard D.H. and Brown C.M., Computer vision, New Jersey (1992).
2. Comas D.S. Meschino G.J. and Ballarin V.L., "Framework de segmentación y análisis de
imágenes mediante reconocimiento de texturas," Proc. Argentinian Symposium of
Technology (AST), Buenos Aires, Argentina, 1529-41 (2010).
3. Gonzalez R.C. and Woods R.E., Digital image processing, Upper Saddle River, N. J. (2002).
Informe de
Pasantía
Tema: Reconocimiento de Patrones aplicado al procesamiento de imágenes médicas
Asistencia al control de diálisis peritoneal

18 Sr. Diego Bladimir Haro Fernández
ESPOCH - Escuela Politécnica de Chimborazo, Ecuador

4. Jain A.K. Murty M.N. and Flynn P.J., "Data Clustering: A Review," ACM Computing Surveys,
31, 264-323 (1999).
5. Rajini N.H., "Classification of MRI brain images using k-nearest neighbor and artificial neural
network," Proc. 2011 International Conference on Recent Trends in Information Technology,
Chennai, India, 563- 8 (2011).
6. Ruspini E.H., "A new approach to clustering," Information and Control, 15, 22-32 (1969).
7. Zhu M. Chen W. Hirdes J.P. and Stolee P., "The K-nearest neighbor algorithm predicted
rehabilitation potential better than current Clinical Assessment Protocol," Journal of Clinical
Epidemiology, 60, 1015-21 (2007).