You are on page 1of 7

Scientia Et Technica

ISSN: 0122-1701
scientia@utp.edu.co
Universidad Tecnológica de Pereira
Colombia

Solarte Martínez, Guillermo Roberto; Soto Mejía, José A.
Arboles de decisiones en el diagnóstico de enfermedades cardiovasculares
Scientia Et Technica, vol. XVI, núm. 49, diciembre-, 2011, pp. 104-109
Universidad Tecnológica de Pereira
Pereira, Colombia

Disponible en: http://www.redalyc.org/articulo.oa?id=84922625018

Cómo citar el artículo
Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

alergias a antibióticos y otras posible diagnosticar la necesidad de administrar fármacos en alergias. Facultad de ingeniería Industrial Fecha de Recepción: 25 de Agosto de 2011 Fecha de Aceptación: 12 de Noviembre de 2011 . usando las variables presión arterial. cardiovascular. -Determinar relaciones entre productos que generalmente se venden juntos. Posteriormente se demuestra árboles de decisión y del algoritmo ID3 (Induction Decision empíricamente que es posible diagnosticar la necesidad de tree) para determinar si se debe o no aplicar fármacos a administrar fármacos en pacientes con síntomas de enfermedad paciente con enfermedades cardiovasculares.  Visualización. importancia que permite la integración de un conjunto de áreas [1] (estadística. enfermedades -Clasificación y estratificación de Clientes. Ingeniero de Sistemas Ph. Profesor Titular. Gestión. cardiovascular disease. que sirven para representar y categorizar una En la segunda sección de este artículo se realiza una descripción de las técnicas de minería de datos. Scientia et Technica Año XVI. Colombia gsolarte294@gmail. muy similares a los sistemas de predicción basados en reglas. Bases de Datos diagnóstico.d . ISSN 0122-1701 104 Arboles de decisiones en el diagnóstico de enfermedades cardiovasculares Decision trees in the diagnosis of cardiovascular diseases.  Detección de conglomerados. mediante la utilizando una aplicación en java realizada por los autores. índice de En esta investigación se demuestra empíricamente que es colesterol. II. además ayuda a identificar Los arboles de decisión es2 una de las técnica de aprendizaje información oculta significativa que se encuentra en inductivo supervisado no paramétrico. cardiovasculares. usando las variables presión arterial. Abstract— In this paper is presented a description of a -Buscar secuencias en el orden en que los clientes agregan decision trees and the ID3 algorithm to determine whether or productos a una canasta de compra. I. cuyo objetivo específico predicción y se emplea en el campo de inteligencia artificial. azúcar en la sangre. No 49. TÉCNICAS DE MINERÍA DE DATOS Los modelos de Minería de Datos se pueden aplicar en: Palabras clave— Arboles de decisión. Universidad Tecnológica de Pereira. Soto Mejía2 Universidad Tecnológica de Pereira.co Resumen— En este artículo se presenta una descripción de los decisión y el algoritmo ID3. Diciembre de 2011. level of sugar and other allergies by means of decision encuentran: trees and the ID3 algorithm implemented in Java language. matemáticas. Sistema Integrado de -Predicción de ventas. Clinic History. es que dicha información encontrada sirva de base para la donde a partir de una base de datos se construyen diagramas de toma de decisiones de acuerdo al caso de estudio. construcción lógica. necessity of administering drugs to patients with cardiovascular diseases based on arterial pressure. Key Word — Decision trees. Databases.  Árboles de decisión. José A. se utiliza para la grandes volúmenes de datos [2].  Razonamiento basado en memoria.com jomejia@utp. arboles de 1 2 M. It is also empirically shown that is possible to diagnose the -Diagnóstico médico. inteligencia artificial.  Técnicas de inferencia estadística. INTRODUCCIÓN  Redes neuronales. diagnosis. mediante la utilización de árboles de decisión pacientes con síntomas de enfermedad cardiovascular. Integrated Management Systems. cholesterol Dentro de las principales técnicas de Minería de Datos[3] se index. Árboles de decisión biología y medicina).edu. alergias a antibióticos y otras alergias. utilización de árboles de decisión con el algoritmo ID3 (Induction Decision tree) implementado en el lenguaje Java.  Análisis de vínculos. not to apply drugs to patients with cardiovascular diseases. A.sc. La Minería de Datos1 es una tecnología nueva de gran  Algoritmos genéticos. Pereira. índice de colesterol. azúcar en la evaluados con el algoritmo ID3 (Induction Decision tree) sangre. Guillermo Roberto Solarte Martínez1.

regrese el nodo raíz tipo hoja con etiqueta negativa 3 Tesis de maestría. Atributos es una lista con otros atributos que Media Bajo Alto SI SI SI 11 pueden ser ensayados o candidatos a ser elegidos para ser 12 Alta Bajo Bajo SI SI NO la raíz de este árbol. que mide que tan bien clasifica ese atributo a los datos de entrenamiento. donde las hojas .edu/pages/linguistics/courses/v610003/shan. serie de condiciones que ocurren en forma repetitiva para la Clasificador.Si todos los ejemplos son negativos.nyu.105 Scientia et Technica Año XVI. Detección Temprana De Fallas . Reinel Arias Montoya. regrese el nodo raíz tipo hoja. se selecciona y se utiliza como nodo un conjunto de pacientes con enfermedad cardiovascular. luego para cada uno de los acuerdo a un concepto médico. No 49. se les administra un fármaco otros atributos se procede a generar un nuevo según sea el valor de la presión. . Universidad Tecnológica de Pereira. Este atributo debe ubicarse en la ganancia de información es una diferencia de entropías. debido a .Si Ejemplos vi está vacio representan clases y el nodo raíz representa todos los .Etiquetar el nodo raíz con el nombre de A (nodo tipo rama) Una de las propiedades de esta técnica es que permite una .Bajo esta nueva rama.0 Pseudocódigo del Algoritmo ide3 3 conjunto X.Si todos los ejemplos son positivos.Regresar el nodo raíz Hunt. Este método (ID3) se ID3( Ejemplos vi Atributo Clasificador . Vamos a aclarar el concepto de entropía ejemplos de entrenamiento.Bajo esta nueva rama. Los datos de entrenamiento son divididos y colesterol y otras alergias (ver tabla 1). utilizando los datos de 1 Alta Alto Alto NO NO SI entrenamiento correspondientes. Los sistemas que implementan arboles de decisión De lo contrario tales como ID3 son muy utilizados en lo que se refiere a la . Este procedimiento se realiza recursivamente en os fármacos cada nodo descendiente.AtributoClasificador.Atributos) 6 Baja Bajo Alto SI SI SI Ejemplos son los datos de entrenamiento.htm Atributo .Si Atributos esta vacio. Para decidir qué atributo es el más apropiado a usar en cada nodo del árbol se utiliza una propiedad estadísticas llamada A.Para cada posible valor vi de A organización eficiente de un conjunto de datos. el azúcar en sangre. adicionar el subárbol: extracción de reglas de dominio. clases. UTP.A ← el atributo de Atributos que mejor clasifique los ejemplos. regrese el nodo raíz Tabla 1. en La Red De Internet Banda Ancha Aplicando Minería De Datos /Oct/2010 4 con etiqueta igual al valor más común (la moda) del http://www. La el atributo más apropiado. 4 Media Alto Alto NO SI NO 5 Media Bajo Alto SI SI NO ID3 (Ejemplos. Diciembre de 2011. A más apropiado.Crear un nodo raíz para el árbol. Así que elije el nodo del Una de las dificultades que se presenta al realizar el árbol que tenga mayor ganancia de información y luego proceso de construcción de un árbol de decisión es escoger expande sus ramas utilizando la misma metodología.Adicionar una nueva rama al nodo raíz para la prueba que los árboles son construidos a partir de la evaluación A = vi del primer nodo (raíz) y de acuerdo a su evaluación o valor . 2 Alta Alto Alto SI NO SI A continuación se describe el pseudocódigo del algoritmo 3 Baja Alto Bajo NO NO SI ID3. Propiedades de los Arboles de decisión. 7 Alta Bajo Alto SI N0 SI AtributoClasificador es el atributo cuyo valor va a ser 8 Alta Bajo Bajo NO SI SI predecido por el árbol y que toma valores positivos o 9 Alta Alto Bajo SI SI NO 10 Baja Bajo Alto SI SI SI negativos. en varios subconjuntos disyuntos de acuerdo a un atributo seleccionado. De lo contrario. es decir. luego realizar divisiones recursivas del Código 1. se organizan las ramas de acuerdo al valor que toma cada Pacient e Presión Azúcar en la sangre Índice de colesterol Alergias a antibiótic Otras alergias Administr ar atributo. El algoritmo ID3 ganancia de información. consiste escoger la característica más discriminante Fin del conjunto X. de prueba en la raíz del árbol. Administración de fármacos Fuente: autores tipo hoja con etiqueta positiva .Hacer Ejemplos vi ← El subconjunto de Ejemplos donde A = tomado se va descendiendo en las ramas hasta llegar al vi final del camino (hojas del árbol). asignados al nodo descendiente adecuado. índice de descendiente. El raíz del árbol para lo cual se debe realizar una prueba concepto de entropía se basa en la teoría de la información Esta estadística a cada uno de los atributos que permite teoría fue desarrollada inicialmente por Claude Shannon 4 a determinar que tan acertado se están clasificando los mediados del siglo XX. adicionar un nodo hoja con etiqueta patrones de entrenamiento los cuales se han de dividir en igual al valor más común (la moda) del Atributo Clasificador. Atributos-{A} ) construye a partir del método de Hunt. 13 Baja Alto Alto SI SI SI Inicio 14 Baja Alto Bajo NO NO SI . Una vez se obtiene el atributo usando el conjunto de datos utilizado en esta investigación. . La heurística de . solución de un problema.

Otras Alergias G (S. La tabla 2.01495 A son los atributos y Sv es un subconjunto de S Tabla3.S   HS v  (2)  V Valores( A) S Atributos Ganancia de Información Presión Arterial G (S. presión arterial media y baja. “A” es una lista de los posibles valores de cada autores. la entropía de Presión arterial (alta. PA)= 0. A   HS   HS. Alergias a antibióticos G (S.86 o se cada uno de los otros atributos mostrados en la tabla 1.0195 Donde S es un grupo de muestras clasificadas en C clases. A positivos o negativos sobre una variable dicotómica para calcular la entropía de S relativa a su clasificación booleana En la anterior expresión el primer término H(S) corresponde a se debe definir: la entropía de S. Como podemos observar el segundo término de la fórmula de Pn. PP   0.PA   0. La fórmula de ganancia de información se define como: Ensamblaje Del Árbol .se calcula de la siguiente manera: procede a calcular la entropía de cada uno de los valores de A. ponderado por la fracción S v P  X son los datos de los pacientes. No 49. puede observar que de los 14 resultados. es decir.918 4 4 2 2 positiva debido que log(1) 2  0 . de contingencia para la presión arterial 10 4 se obtiene a partir de los datos de la tabla 1. es la probabilidad de que las respuestas sean positivas esperado de la entropía después de que S ha sido particionado de acuerdo al atributo A. AZ) 0. Los resultados de ganancia de información de los todos Sv los atributos se muestran en la tabla 3 HA.918  0. La Para facilitar los cálculos anteriores se usan tablas de probabilidad de cada resultado es: contingencia. AA) =0. Una vez se obtengan los tres valores se procede al cálculo de la B. subconjunto Sv. Fuente: Valores. Ganancia de Información para todos los atributos.918  0  0. 10 tienen Tablas de contingencia resultados positivos y 4 tienen resultados negativos.Scientia et Technica Año XVI. Se S n  1  . 106 (3) En el grupo de datos S (vea tabla 1) que contiene valores GS. HS . media y baja). OA) = 0. Si la entropía toma un valor de cero es cuando todos los miembros pertenecen a una misma clase ya sea negativa o C HSPAalta     Pi log 2 ( Pi )   log 2  log 2  0. Concepto de ganancia de información ganancia de información con ese atributo utilizando la formula (3) C Com De la misma manera se realizan las tablas de contingencia para HS    P log 10 10 4 4 i 2 ( Pi )   log 2  log 2  0. i 1 6 6 6 6 Por tal motivo la entropía se encuentra siempre en un intervalo de cero a uno. esta medida reduce la entropía cálculos de entropía y de ganancia de información para cada una de ellos.5 es decir existe una máxima Luego se realiza de igual manera el cálculo de la entropía para la aleatoriedad. es la probabilidad de que las respuestas sean negativas ganancia no es más que la sumatoria de entropías de cada según el conjunto S. según el conjunto S.0207 subconjuntos de entrenamiento.86  6 5 3 impureza en un conjunto de datos. y a partir i 1 14 14 14 14 dijo de ellas se realizan los anteriormente la entropía es una medida de desorden e GS. Universidad Tecnológica de Pereira. Diciembre de 2011.71 y que Pn   0.28 14 14 Alto Medio Bajo Total La entropía de X se define con base a las probabilidades Si 4 2 5 10 anteriores. IC) = 0. el segundo término corresponde al valor Pp. esta proporción es de 0. alcanzando a un máximo cuando utilizando la tabla 2 de contingencia.272787 14 14 14 los datos se utiliza una medida llamada ganancia de información.S Pp i. así: No 2 1 0 4 HS   PPlog 2 PP  Pnlog 2 Pn (1) Total 6 3 5 14 Tabla 2 Respuestas de presión arterial Fuente: autores Según la ecuación (1). atributo.2727 Azúcar en Sangre G (S. la entropía del conjunto de los 14 datos respecto a la variable “Administrar fármacos” se Para calcular la entropía del conjunto de datos. Para la clasificación de 0.0 obtenida al realizar la división de los datos en los Índice de Colesterol G (S.

0 Calcula Entropía . ya que la if (aux!=0) variable “administrar fármacos” es positiva en todos los { pp = pp / aux. logbase2pn=Math. 2 Alta Alto Alto SI NO SI 7 Alta Bajo Alto SI N0 SI Atributos Ganancia de Información S Alta Bajo Bajo NO SI SI 9 Alta Alto Bajo SI SI NO Presión Arterial Pgan (S.Selección del mejor atributo “Presión arterial” Aquí S1 hasta Sc son los c subconjuntos resultantes de particionar A continuación se debe aplicar la misma técnica en cada S de acuerdo al atributo A que tiene c valores distintos. A partir de cada 3 Baja Alto Bajo NO NO SI 6 Baja Bajo Alto SI SI SI tabla de contingencia se procede a realizar los cálculos de 10 Baja Bajo Alto SI SI SI entropía. Tabla 6.01439 Alergias a antibióticos Pgan (S. El siguiente es el código en java para el cálculo de la entropía.4620 12 Alta Bajo Bajo SI SI NO Azúcar en Sangre Pgan (S. La uno de los nuevos nodos creados.18481 Tabla 4. RESULTADOS DE LA EVALUACIÓN En esta sección se presentan los resultados obtenidos al correr la Tabla 5.log(2).log(pp) / Math. Diciembre de 2011. A) (5) Idv ( S . llamada baja con un valor de “si”. incorporando un nuevo término llamado información de la división.logbase2pn. Sin embargo las otras logbase2pp=Math. Arterial = baja” la recursión tiende a terminar.log(pn) / Math. anteriores podemos deducir que para el atributo “Presión aux=pp+pn. el atributo que se debe presenta dificultades debido a que genera la misma cantidad de seleccionar como nodo raíz es la “Presión arterial” ya que reglas como elementos tiene el conjunto de entrenamiento. Una vez que se tiene la matriz de ocurrencias se procede a formas las tablas de contingencias. el cual es sensitivo a qué tan amplia Presión y uniformemente el atributo separa los datos. AA) =0.entropia=0. Tabla de Ganancia de Información Fuente: autores 4 Media Alto Alto NO SI NO 5 Media Bajo Alto SI SI NO 11 Media Bajo Alto SI SI SI III.107 Scientia et Technica Año XVI. No 49. Pgan S. El método de ganancia de información en casos extremos Como se observa. IC) = 0. proporción de ganancia penaliza los atributos que tienen demasiados valores.01495 Paciente Presión Azúcar en Índice de Alergias a Otras Administrar la sangre colesterol antibióticos alergias fármacos Tabla 7. por lo tanto este atributo queda apuntado a una hoja pn=pn/aux. de la tabla 3. Universidad Tecnológica de Pereira. casos. pero en cada nodo creado medida de proporción de ganancia se define en términos de la solo se usa un subconjunto de los datos como se observa en medida de ganancia en la ec. procedimiento recursivo con los demás atributos hasta } formar el árbol. dos ramas restantes quedaran en evaluación recursiva. Igualmente se realiza el mismo return entropia. (5). double pn){ Si observamos el comportamiento de los datos en la tablas double logbase2pp.log(2). dividiendo el espacio de búsqueda y reduciendo el número } de datos de entrenamiento.Datos de entrenamiento presión arterial alta Otras Alergias Pgan (S. A continuación se muestra el fragmento de código 13 Baja Alto Alto SI SI SI para el cálculo de entropías para cada una de las tablas de 14 Baja Alto Bajo NO NO SI contingencia previamente creadas. PA)= 0. AZ) 0. entropia=((-1)*(pp*logbase2pp))-(pn*logbase2pn).0 Índice de Colesterol Pgan (S. de acuerdo con la medida de ganancia de información Para evitar esta dificultad se utiliza la medida de la “proporción (0. Entrenamiento presión arterial media aplicación en Java implementada por los autores de esta Paci Presión Azúcar en Índice de Alergias a Otras Administrar investigación para el mismo conjunto de datos mostrados en la ente la sangre colesterol antibióticos alergias fármacos tabla 1. las siguientes tablas 4 a 6. Arterial C IdivS. La creando así tres ramas. A    Alta Baja Si S lo g 2 i (4) Media i 1 S S Figura 1. A   G ( S .2727) es el más adecuado para ser nodo inicial (raíz) de ganancia de información” propuesta por Quinlan[4]. Código 2. A) Paci Presión Azúca Índice de Alergias a Otras Administrar ente Arterial r en la colesterol antibióticos alergias fármacos sangre Los resultados obtenidos para la proporción de ganancia de 1 Alta Alto Alto NO NO SI información de todos los atributos se muestran en la tabla 7. Datos de entrenamiento presión arterial baja public double calcular_entropia(double pp. OA) =0.

0176 [2] = 0.863120568566631 Alergias a antibióticos Pgan = 0. Resumen resultados de la Proporción de Ganancia de G(S.print("\n Idiv => "+sum). No 49. La aplicación implementada genera el siguiente grado de reglas Tabla de Contingencia Índice de Colesterol de clasificación para la toma de decisiones [5].0176 Calculo de Ganancia de Información y proporción de ganancia H(S) = 0.2578314624597723 6 3 5 G(S.8949517866414867 Calculo de Entropía Pgan = 0.) = 0.3155 [0] = 0. H(S) = 0. 9 5  Ganancia de información.ac=0. Diciembre de 2011. AZ) 0.01495606992897247 } Idiv = 0.01495606992897247 4 2 0 2 1 5 Idiv = 0. System.0 De Ganancia de Información Pgan = 0. PA)= 0.9182958340544896 Presión Arterial G (S.4315602842833155 Tabla 9.01495 Idiv = 0.9181 System.) "+ total).590333036177886 Pgan = 0. [0] = 0. int i. total=0.035567522798417635 [0] = 0.72 System.my=0. i++) Tabla de Contingencia Alergia A Antibióticos { if (j==0){ pp = e[j][i]. // visualiza los nombres de for (i = 0. v4[0]=0.4620909142319209 Tabla 8.7642045065086203  generación de las reglas de clasificación.) = 0. 108 El fragmento de código de ganancia de información y Calculo de Entropía proporción de ganancia.total=0.print("\n pgan=G(S. double u[]) throws Calculo de Ganancia de Información y proporción de ganancia ArithmeticException H(S) = 0. Pgan = 0. i <a. y [0] = 0.ps=0.31555371109416347 mat=getNombresColumnas().863120568566631 Pgan = 0.017633454303964922 Tabla de Contingencia Otras Alergias Los resultados generados por la aplicación en Java resultado de esta investigación son: 7 3 2 2  Entropía. se presenta a continuación. 7 3 2 2 9 5 . 7 3 if(pp!=0) 2 2 {pp = pp / aux.7219280948873623 [2] = 0. [2] = 0.0.0 Información Idiv = 0.)/Idiv "+ ac).out.0 Calculo de Entropía Índice de Colesterol Pgan = 0. Universidad Tecnológica de Pereira. Calculo de entropía  Proporción de ganancia.sum=0.01495 G(S. [0] = 0.w=0.) = 0.272787532388745 Alergias a antibióticos G (S.int a. IC) =0. Azúcar en Sangre G (S.0 Generación de la reglas.print("\n H(S) "+ en).j=0.207031 H(S) = 0.19677767872596202 Otras Alergias G (S. Idiv = 0.20703137867809185 new double [a].out. Tabla de Contingencia de Azúcar en la Sangre Atributos Proporción de ganancia 7 7 de Información 5 5 Presión Arterial Pgan = 0. [2] = 0.6560891898885391 double en=0. ac=total/sum.out.863120568566631 Otras Alergias Pgan = 0.out.9182958340544896 public void gana(int e[][].) = 0. AA) =0. 9 5 sum=sum+en.}} } Calculo de Entropía total = q .2578314624597723 sum=0. OA) = 0. G(S.Scientia et Technica Año XVI.pp=0.9182958340544896 Atributos Ganancia de información [1] = 0. en =pp*u[i].print("\n G(S.9709505944546686 Calculo de Ganancia de Información y proporción de ganancia Tabla de Contingencia de Presión Arterial H(S) = 0.8481644986376585 Código3.19199255746094904 { double pp=0. double v4[]= G(S) = 0.4620 2 2 Azúcar en Sangre Pgan = 0. Resumen de resultados de Ganancia de Información. en=0. Calculo de Ganancia de Información y proporción de ganancia System.sum.272877 [2] = 0.0 Calculo de Ganancia de Información y proporción de ganancia Índice de Colesterol G (S.

-Se demostró empíricamente que es posible diagnosticar la administración o no. pero tiene azúcar baja en la sangre  Si tiene presión media y su índice de colesterol es bajo  Si tiene presión arterial baja NO se puede administrar fármacos a un paciente:  Si tiene presión media e índice de colesterol alto. resumen de ganancia de información y tabla 9. P 81-106.5: Programs generadas. -La técnica de árbol de decisión conjuntamente con el algoritmo ID3 entrega un conjunto de reglas entendibles que le permiten al médico ó al tomador de decisión hacerlo de manera rápida. No 49. Induction of Decision Trees. Universidad Tecnológica de Pereira.  Si tiene presión alta y si es alérgico a antibiótico y a otras alergias.121/122. Daniel T. pero no tiene otras alergias  Si tiene presión alta y si es alérgico a antibiótico y a otras alergias. IV. Jhon Wiley & Sons. R. Machine un paciente debemos tomar en cuenta las siguientes reglas Learning. Presión arterial creando así tres ramas Alta. Media. Wiley & Sons. J. y además tiene azúcar alta en la sangre. [3] Larose. CONCLUSIONES Se observa que los resultados mostrados en la tabla 8. usando las variables presión arterial. Inc. Paolo. New Jersey. Discovering Knowledge in Data Figura 2. México. Morgan Kaufmann Se puede administrar fármacos a un paciente SI: Publishers. Chichester. (2005). (4 Mar 2009). 364p [2] Campell. así que con ambos enfoques el nodo raíz es la . [5] Cohen Karen Daniel. De la figura 2 se deduce que para administrar fármacos a [4] QUINLAN. Mary. C4. Diciembre de 2011. Sistemas de información para  Si tiene presión alta y si no es alérgico a antibiótico la toma de decisiones. Jhon implementado. 1986 QUINLAN.1993. de fármacos en pacientes con síntomas de enfermedad cardiovascular. Inc Publication. Applied Data Mining Stadistical Methods for Bussines and Industry. (2003).16.. REFERENCIAS [1] Giudici. 179-191/192. 222p.109 Scientia et Technica Año XVI. 1990. 243p. R. Editorial McGraw Hill Interamericana. base IV Guía de Autoenseñanza. pp110/111. (1996). España. (4 Mar  Si tiene presión alta y si es alérgico a antibiótico 2009. J. Hoboken. azúcar en la sangre. resumen de proporción de ganancia de información que los valores generados son muy similares utilizando las dos técnicas mencionadas. índice de colesterol. Generación de reglas de decisión con el algoritmo ide3 an Introduction to Data Mining. alergias a antibióticos y otras alergias mediante la utilización de árboles de decisión. McGraw-Hill. Baja. En ambos métodos la variable que tiene mayor ganancia y proporción de ganancia es presión arterial.169. for machine learning.