You are on page 1of 3

Redes Neuronales Artificiales como Clasificadores de Pacientes con Dispepsia Funcional basndose en exmenes de Electrogastrografa

Luis Daniel Barrera Gamboa Departamento de Ingeniera Elctrica. Universidad de La Frontera. Casilla 54-D. Temuco. l.barrera01@ufromail.cl

Abstract: La Dispepsia Funcional es un sndrome difcil de diagnosticar y cuyas causas orgnicas son desconocidas. A partir del examen de Electrogastrografa, este trabajo busca las mejores caractersticas que permitan diferenciar a pacientes disppticos de individuos sanos y a su ve. El objetivo es construir un clasificador basndose en una adecuada pre- extraccin de parmetros para as poder determinar que mejor caracterstica influye si la persona se encuentra sana o enferma si. En una etapa inicial fue tomada una seleccin de 6 caractersticas de la seal del electrogastrograma que permiten caracterizar a los pacientes y que pueden proveer informacin clnica para comprender el sndrome. Posteriormente, fueron implementados un clasificador uno mediante el proceso de redes neuronales. Este artculo presenta los resultados obtenidos del clasificador, mostrando que la seal de electrogastrograma posee informacin que permite discriminar estos pacientes.

Keywords: Electrogastrografa; Redes Neuronales Artificiales; Validacin Cruzada.


1. INTRODUCCIN

La dispepsia funcional (DF) es un sndrome inespecfico y complejo de diagnosticar porque an no se ha establecido su relacin con alteraciones orgnicas especficas. Tiene su origen en una percepcin anmala del paciente o en una alteracin de la funcin del tracto digestivo superior. Este sndrome afecta aproximadamente al 25% de la poblacin general y posee una incidencia anual estable, prxima al 1%. En algunos trabajos recientes se ha logrado clasificar pacientes sanos y pacientes con DF, mediante la aplicacin de diversas tcnicas de procesamiento de la seal electrogastrogrfica (EGG) de dichos pacientes [1], [2], [3]. Sin embargo estos procedimientos no permiten determinar qu caractersticas de la seal influencian la clasificacin. Este artculo presenta los resultados de un trabajo que tuvo por objetivo de hallar la mejor caracterstica entregada de un previo pre procesamiento de seales electrogrficas de manera tal que se pueda descartar caractersticas que no influyen el proceso de determinar si la persona se encuentra realmente sana o enferma. 2. FUNDAMENTOS

capturada por electrodos colocados en el abdomen puede reflejar la actividad elctrica gstrica. La electrogastrografa genera por lo tanto, grabaciones no invasivas de esta actividad [4]. Muchos estudios se han desarrollado con el fin de encontrar asociaciones entre EGG anormal y enfermedades gstricas [5][6][7]. Sin embargo, la falta de estndares respecto de la posicin de los electrodos, el contenido de la comida, los tiempos de examen y principalmente el tipo de procesamiento que se realiza a la seal, hacen que la relevancia del EGG como mtodo de diagnstico sea an controversial [2]. A continuacin se presentan los mtodos usados en este trabajo para realizar el procesamiento de la seal de EGG.

2.2 Redes Neuronales Artificiales Las redes neuronales artificiales (RNA) se han utilizado con xito para clasificar datos no-lineales, irregulares y con ruido, en problemas de procesamiento de seales [9]. Sin embargo, sus principales desventajas son que su arquitectura es difcil de definir, a priori, y que por lo general convergen hacia soluciones que pueden locales. El nmero de neuronas de entradas y de salidas de la red est determinado por el problema, sin embargo, el nmero de capas ocultas de la red y el nmero de neuronas de dichas capas, as como la funcin que describe el comportamiento de salida de las neuronas (funcin de activacin) deben ser definidas en el proceso de diseo, generalmente por un mtodo de corte y prueba. En este trabajo se propone utilizar una RNA de tipo Perceptrn Multi Capa (Multi Layer Perceptron, MLP). Se ha establecido que una nica

2.1 Electrogastrografa

La gran cantidad de funciones fisiolgicas del estmago requieren de un mecanismo de control elctrico que permita coordinar sus movimientos. A fines de los aos 60 se introdujo el concepto de electrogastrognesis, mostrando que la seal

capa de neuronas con funciones de activacin sigmoidales puede representar cualquier relacin funcional entre las entradas y salidas si el nmero de neuronas es el suficiente [10], por lo tanto se consider una sola capa oculta para este problema y funciones logsticas tanto en la capa oculta como la de salida, ya que la salida es dicotmica. El proceso de entrenamiento de la RNA tiene por objetivo ajustar los pesos de la red en funcin de los ejemplos que se le presentan en el conjunto de entrenamiento. Existen diferentes tipos de algoritmos de actualizacin de los pesos que varan en funcin de su clculo y de los requerimientos de almacenamiento [11]. En este trabajo se compar el algoritmo estndar de actualizacin de los pesos basado en el gradiente descendiente y el algoritmo (Resilient backpropagation). La diferencia entre ambos es que en este ltimo, se mantiene constante el gradiente, ya que al usar funciones sigmoidales, a medida que se est en los extremos, el gradiente se vuelve cada vez mas pequeo y la convergencia se hace muy lenta. Resilient slo considera el signo del gradiente para ajustar los pesos. Al no depender del valor del gradiente, la convergencia es ms rpida. Como la propiedad ms importante de las redes neuronales es su capacidad de generalizar, existe una tcnica llamada de detencin temprana (early stopping) que consiste en la utilizacin de un conjunto de validacin durante el entrenamiento. De esta forma, durante el entrenamiento se evala la capacidad de generalizacin de la red, deteniendo el entrenamiento si esta capacidad se deteriora a medida que se ajustan los pesos, lo que permite modificar la arquitectura y reiniciar el entrenamiento. Un tercer conjunto, llamado conjunto de Test permite evaluar finalmente el desempeo del clasificador resultante. 2.3 Evaluacin de los clasificadores Los criterios de bondad de los clasificadores se obtienen de las tablas de contingencia que permiten determinar la sensibilidad (relacin entre el nmero de casos clasificados como positivos sobre los casos realmente positivos), la especificidad (idntica a la anterior pero para casos negativos) y la exactitud del clasificador (relacin entre el nmero total de casos bien clasificados, sobre el total de casos). 3. MATERIALES Y MTODOS Se dispone de las seales de EGG de 56 individuos obtenidas mediante el sistema Polygram 5.0. El primer segmento correspondiente al preprandial y tiene una duracin aproximada de una hora, la etapa prandial tiene una duracin aproximada de quince minutos y la ltima etapa, postprandial, dura aproximadamente una hora. De los 56 sujetos, 42 presentan dispepsia funcional segn el protocolo de ROMA y 14 son controles sanos.

3.2 Seleccin de parmetros Se codific a los pacientes enfermos con 1 y a los sanos con 0. Esto permiti determinar el orden de relevancia de cada predictor. Se determin cun significativo es cada uno de ellos mediante test de Wald, comparando los valores p. Este mtodo determin que los parmetros PDpran y %Npran son los ms significativos (p<0.1).

4. SIMULACIN Y RESULTADOS Los seis parmetros (caractersticas) ms significativos fueron utilizados para construir los clasificadores. 4.1 Clasificador RNA sin Validacin Cruzada En este caso, el modelo de red donde se considera un porcentaje de entrenamiento validacin y test, 4.2 Clasificacin mediante Redes Neuronales Se evidencia el hecho de que el problema de clasificacin no es lineal, por lo que se requiere de un clasificador que pueda dar cuenta de la complejidad de los lmites de decisin de este problema. Es por eso que se construy una red neuronal artificial de tipo Multi Layer Perceptron, con algoritmo de aprendizaje backpropagation para implementar el clasificador. La capa de entrada posee dos neuronas correspondientes a los parmetros de seleccin. La capa de salida posee una neurona cuyo valor 0 indica sano y 1 dispptico. El nmero de neuronas en la capa oculta vari de uno a 5 y fue seleccionado durante el entrenamiento mediante el mtodo de detencin temprana (early stopping). De esta forma la mejor red posee 3 neuronas en su nica capa oculta. Los conjuntos de entrenamiento, validacin y test fueron de 25, 25 y 6 casos respectivamente. Como existen pocos ejemplos de casos sanos, el nmero de ejemplos en cada conjunto fue determinado experimentalmente. Una de las funciones de entrenamiento fueron probadas, la funcin tradicional de retropropagacin del error con gradiente descendiente se utilizo para determinar las caractersticas que buscamos. 4.3 Resultados Los resultados que arrojo la red en cuanto a encontrar las caractersticas mas apropiadas fueron las siguientes, primero se realizaron 5 partidas consecutivas. La RNA se utiliz considerando la mejor capa oculta como la de salida, debido a que la salida es dicotmica. Se compar, a su vez, el algoritmo estndar de actualizacin de los pesos basado en el gradiente descendiente. Se mantiene constante el gradiente, ya que al usar funciones sigmoidales, a medida que se est en los extremos, el gradiente se vuelve cada vez ms pequeo y la convergencia se

hace muy lenta. Se realiza una combinatoria en los parmetros haciendo la variar tantas veces posibles hasta poder lograr el menor error posible. De esta manera se guardo el mnimo error de validacin en la capa oculta, asociada a los pesos y la combinacin que es de la misma. Como resultado se obtuvo que de las 6 caractersticas, la caracterstica 2 y 4 fueran las mejores en el algoritmo de bsqueda exhaustiva, en donde se produjeron 1552 iteracin hasta poder hallar el mnimo que en este cazo fue 0, por tanto las caractersticas que son de mayor importancia a la red son las ya mencionadas.

[10] Hornick K, Stinchcombe M, White H. (1989). Multi Layer Feedforward Networks are Universal Approximators. Neural Networks. 2, pp. 359-366 [11] Demuth H. & Beale M., (1998). Neural Network Toolbox. For Use with MATLAB. UsersGuide. Version 3. The MathWorks.

RECONOCIMIENTOS Se agradece al distinguido Profesor Fernando Huenupan por su gran ayuda a poder realizar el algoritmo tambin a la profesora Millaray Curilem por entregar este desafo y permitir la realizacin de este trabajo.

REFERENCIAS

[1] Chacon, M., Jara, S., Defilippi, C., Madrid, A. M., & Defilippi. C. (2005). A simple feature reduction method for the detection of long biological signals. Lecture Notes in Computer Science. 3773, 431-439 [2] Chang, Y. (2005). Electrogastrography: Basic knowledge, recording, processing and its clinical applications. Review. Journal of Gastroenterology and Hepatology 20: 502516. [3] Leung, M.W.Y., Wong, B.P.Y, Chao, N.S.Y., Chung, K.-W., Kwok W.-K., & Liu, K.K.W. (2006). Electrogastrography in the management of pediatric functional dyspepsia and motility disorder. Journal of Pediatric Surgery, 41 (12), 2069-2072. [4] Koch, K. L. & Stern, R. M. (2004). Handbook of Electrogastrography. Koch, K. L. (Editor), Oxford University Press. [5] Chen CL, Hu CT, Lin HH, Yi CH. (2006). Clinical utility of electrogastrography and the water load test in patients with upper gastrointestinal symptoms. Journal of Smooth Muscle Research 42 (5), 149-157 [6] Kara S, Dirgenali F, Okkesim S. (2006). Detection of gastric dysrhythmia using WT and ANN in diabetic gastroparesis patients. Computers in Biology and Medicine. 36(3), 276-290. [7] Zheng X, Li J, Chen Q, Wang X. (2006). Incidence of gastric myoelectrical dysrhythmia in patients with functional dispepsia. Chinese Journal of Gastroenterology, 2006; 11 (2), 107-108. [8] Hosmer, D. W., Lemeshow, S. (2000). Applied Logistic Regression. 2nd ed. John Wiley & Sons. New York. 375p [9] Bishop C. (1995). Neural Networks for Pattern Recognition. Oxford: Claredon Press.