You are on page 1of 6

Redes Bayesianas aplicadas DPOC

Mauro Henrique Lima de Boni1 , Adson Ferreira da Rocha2 ,Iwens Gervsio Sene Junior3 Coordenao de Informtica Instituto Federal de Educao, Cincia e Tecnologia do Tocantins (IFTO) Campus Palmas Faculdade de Engenharia Eltrica Universidade de Braslia (UNB) Campus Gama Instituto de Informtica Universidade Federal de Gois (UFG)
mauro@ifto.edu.br, adsonr@unb.br, iwens@inf.ufg.br

Resumo. O objetivo deste trabalho apresentar as redes bayesianas aplicadas Sndrome Pulmonar Obstrutiva Crnica - DPOC, bem como discutir sobre sua implementao. construda uma rede que busca modelar o conhecimento mdico baseado em evidncias como fatores de risco e sintomas. A contribuio maior deste artigo discutir aspectos da implementao da rede a partir do conhecimento do especialista. Ao final ser possvel concluir se uma pessoa est ou no com a doena

Abstract. The aim of this paper is to present the Bayesian networks applied to Chronic Obstructive Pulmonary Syndrome - COPD and discuss its implementation. It built a network that aims to model medical knowledge based on evidence as risk factors and symptoms. The largest contribution of this paper is an automated fashion and with the specialist knowledge to conclude whether a person is or is not suffering from COPD.

1. Introduo
Os softwares so ferramentas que contribuem em diversas reas, pois sua concepo envolve a modelagem de atividades e conhecimentos. Esses modelos podem ser usados como mecanismos capazes de participar da disseminao das informaes que o bem mais importante da sociedade do conhecimento. Do ponto de vista de softwares que modelam o conhecimento mdico eles podem fazer com que o paciente torne-se um indivduo capaz de ter participao ativa no processo, pois de posse de informaes e acesso ao conhecimento possvel melhorar a preveno de doenas, evitando assim que ele venha a sofrer com elas. A DPOC, ou Doena Pulmonar Obstrutiva Crnica, uma doena caracterizada por desenvolvimento progressivo de limitao ao fluxo areo que no totalmente reversvel [Jardim et al. 2009]. A limitao do fluxo areo est associada inalao de gases e partculas nocivas. Poucos conhecem a doena e a forma mais eficaz de combate-la est na conscientizao das pessoas sobre os fatores de risco, informando-as sobre a mudana de hbitos e tornando-as pessoas menos suscetveis doena. A Rede Bayesiana, um mecanismo usado para modelar o conhecimento mdico por meio de um grafo direcionado, onde cada nodo deste grafo tem uma relao de causa e efeito

(sintomas e doenas), o que para um profissional da rea de sade fcil de ser entendido, uma vez que o seu conhecimento que deve ser modelado . Elas so usadas quando o conhecimento incerto deve ser modelado. Este trabalho tem como objetivo apresentar as redes bayesianas, bem como discutir sobre sua implementao. construda uma rede simples que busca modelar o conhecimento mdico para, baseado em evidncias como fatores de risco e sintomas, concluir se uma pessoa pode estar ou no sofrendo da Sndrome Pulmonar Obstrutiva Crnica - DPOC.. Sua estrutura a seguinte: A seo 2 faz uma introduo sobre Rede Bayesiana. A seo 3 apresentar a DPOC, seus fatores de risco e seus sintomas. Na seo 4 apresentada a modelagem da rede para aplicao proposta, mostrando aspectos importantes sobre sua implementao . No final, na seo 5, ha indicaes sobre estudos futuros.

2. Redes Bayesianas
Uma rede Bayesiana, para um conjunto de variveis X = {X1 , . . . , Xn } consiste em : uma estrutura grfica em rede G em um conjunto de distribuies de probabilidades locais associadas a cada varivel P r. Essa estrutura grfica tem forma de um grafo direcionado acclico. Os ns contidos em G tem uma correspondncia de um-para-um com as variveis Assim, a partir dessa definio temos a seguinte equao: , B = (P r, G). (1)

A estrutura grfica G tem a forma de um grafo direcionado acclico, com ns V (G) = {V1 , . . . , Vn }, n 1 e arcos A(G) V (G) V (G). Cada n Vi em G representa uma varivel randmica que tem um conjunto finito de valores. Os arcos no dgrafo modelam as influncias probabilsticas entre as variveis. Podemos dizer, grosso modo, que um arco Vi Vj entre dois ns Vi e Vj indica que h influncia entre as variveis Vi e Vj ; a ausncia de um arco significa que uma varivel no influencia a outra diretamente. Podemos fazer uma definio mais formal: a varivel Vi dependente de seus pais, mas independente de qualquer n no-descendente de seus pais. O grafo gerado pode ser assim formalizado: G = (V (G), A(G)) (2)

Associado a estrutura grfica de uma Rede Bayesiana est uma distribuio de probabilidade conjunta P r que representado de forma fatorada. Para cada varivel Vi no grafo est determinado um conjunto de distribuies condicionais; cada uma destas distribuies descreve o efeito de uma combinao especfica dos valores dos pais (Vi ) de Vi , na distribuio probabilstica de Vi . Esses conjuntos de distribuies, definem uma nica distribuio, definido pela seguinte equao :
n i=1

P r(V1 , . . . , Vn ) =

P r(Vi |(Vi ))

(3)

O uso de uma Rede Bayesiana implica na aplicao de dois conceitos:

1. Evidncia - Evidncias so novas informaes disponveis que surgem em um dado evento. Essa nova informao faz com que uma mudana nos estados de uma varivel ocorra e isso inicia o processo de propagao das probabilidades. Quando um nodo qualquer X est um estado especfico ex, onde ex pertence a E e E um conjunto finito que representa os estados de X, escrevemos que X = ex. Essa situao chamada de instanciao ou tambm hard evidence, como encontrado em [Korb and Nicholson 2004]. 2. Inferncia - Dada uma ou mais evidncias, as probabilidades da rede deve ser calculadas. Esse processo chamado de Inferncia. o calculo das probabilidades de um valor de uma varivel, far com que seja criado um fluxo de informao que percorrer toda a rede. Esse fluxo no limitado pela direo dos arcos. Essa a tarefa mais comum que se deseja fazer com uma Rede Bayesiana. Tambm podemos chamar a inferncia por propagao de probabilidades.

3. DPOC
A DPOC (Doena Pulmonar Obstrutiva Crnica) agrupa duas enfermidades diferentes: bronquite crnica e enfisema. Os mdicos utilizam esta sigla porque a maioria dos pacientes apresenta combinao das duas doenas. Em ambas, acontece uma inflamao crnica. Na bronquite, a inflamao se d nos brnquios e causa grande produo de muco. No enfisema, os alvolos (parte final do pulmo onde ocorre a passagem de oxignio para o sangue) se inflamam, causando destruio do tecido e formao de pequenas bolhas. O diagnstico realizado a partir do quadro clnico, das alteraes na radiografia de trax e durante as provas de funo pulmonar (espirometria, exame do sopro), habitualmente aps a 5 dcada de vida. Os dois fatores de risco mais comuns so o tabagismo (responsvel por 80% a 90% de todas as mortes relacionadas com a DPOC) e a deficincia de alfa1-antitripsina. Foi observado que a incidncia de DPOC se eleva de 19,7% em homens que nunca tinham fumado para 87,7% em fumantes de mais de dois maos de cigarro/dia. Dito de outra forma, o perigo de desenvolver DPOC em um grupo de fumantes de dois maos de cigarros/dia aproximadamente 4,5 vezes maior que para os no-fumantes. A exposio repetida ao cigarro resulta em inflamao crnica, alm de tosse produtiva. O fumo devido s substncias irritantes que contm, provoca hiperplasia e metaplasia do epitlio, ruptura dos septos alveolares, proliferao fibrtica e espessamento das paredes arteriolares. Tais alteraes so proporcionais ao nmero de cigarros dirios e ao tempo de tabagismo. Como segunda causa bem reconhecida de enfisema, a deficincia de alfa1-antitripsina, algumas vezes denominada enfisema gentico, uma condio caracterizada por uma quantidade deficiente da protena alfa1-antitripsina, a qual pode acarretar o incio precoce do enfisema e que uma condio gentica autossmica codominante. Sob circunstncias normais de uma quantidade adequada de alfa1-antitripsina, a elastase dos neutrfilos neutralizada de modo a no digerir a elastina pulmonar (protena estrutural). No entanto, em face de uma deficincia severa de alfa1-antitripsina, a elastase dos neutrfilos pode no ser controlada e provocar a ruptura da elastina e acarretar a dissoluo das paredes alveolares. A poluio do ar pode desempenhar um papel, do mesmo modo que fatores hereditrios, os quais so claramente importantes na deficincia de alfa1-antitripsina.

4. Modelando a DPOC atravs da rede bayesiana


4.1. Requisitos Requisitos Funcionais:So aqueles que modelam como a rede dever comportar-se aps ter recebido um conjunto de evidncias e quais so as variveis que devero ser transformadas em nodos e quais as relaes (causa e efeito ) eles mantm. Assim, os nodos que representam os fatores de risco influenciam a doena, ou seja, o fator de risco representa uma causa e a doena o efeito. Os sintomas so o efeito da doena, portanto, uma ligao partindo da doena ir chegar a todos os nodos que representam os sintomas. Requisitos no funcionais: a rede modelada deveria ser acessvel por diversas linguagens de programao e que se pudesse interagir com ela usando uma interface web. Esse requisito no funcional, fez com que o software escolhido fosse o Netica [Norsys 2010]. A rede modelada salva em um arquivo texto formatado. As vrias API disponveis (em C, Java, Delphi) interagem com esse arquivo seja informando evidncias, seja obtendo o resultado de inferncias. Requisito de domnio: diz respeito linguagem usada para representar as informaes. Muito embora o problema seja da rea de sade, o uso de uma linguagem menos tcnica recomendado pois quem ir usar a rede no um profissional da rea de sade e sim uma pessoa que a priori no se sabe qual o seu grau de escolaridade. Desta forma, o termo dispneia deve trocado pela expresso senta falta de ar. 4.2. Modelagem Os passos mostrados a seguir so uma compilao dos passos elencados por [Lucas et al. 2004, Korb and Nicholson 2004, Charniak 1991]. Os autores prope uma forma sistematizada para a construo de uma rede, sendo esse processo executado em forma espiral onde a cada iterao, um nvel maior de refinamento ser obtido. 1. Nodos e valores Em primeiro lugar, necessrio identificar quais so as variveis de interesse. Isso envolve responder a seguinte questo: quais so os nodos relevantes e quais os valores que eles tm? Em [Lucas et al. 2004], o autor acrescenta ainda que essa seleo geralmente baseia-se em entrevistas com especialistas, descries do domnio e em uma extensiva anlise do propsito da rede a ser construda. Diz anda que, muitas vezes o conhecimento sobre os processos patolgicos e fisiolgicos envolvidos, no caso de aplicaes para rea mdica, usado para guiar a identificao de variveis. Os valores assumidos so mutuamente exclusivos, o que significa que a varivel ter um e somente um desses valores de cada vez. Em [Jardim et al. 2009] descrito o esteretipo do portador de DPOC, como se segue : pessoa com idade superior a 40 anos, fumou mais de um mao de cigarro/dia por vinte anos. Apresenta os seguintes sintomas respiratrios crnicos : tosse, dispneia e sibilncia. A partir dessas informaes, a DPOC foi modelada em uma rede composta por trs tipos de nodos: Fatores de Risco So informaes relacionadas ao hbito de fumar, a exposio poluio, a idade, etc.

Figura 1. Primeiro modelo de rede proposta

Doena Representa a doena, no caso DPOC. Poderia, conforme o caso, serem vrios nodos. Sintomas Variveis que representam o estado geral de sade do paciente, onde ele pode relatar o que ele est sentindo ou o que est acontecendo com ele Baseado nas informaes que foram mostradas na seo 3 e em [Jardim et al. 2009], os seguintes nodos foram criados: Fatores de Risco Fumante, idade, exposio poluio, fumante a quanto tempo. Doenas DPOC. Sintomas Sente falta de ar, tosse com catarro. 2. Estrutura - A estrutura ou topologia de uma rede representa relacionamentos qualitativos entre as variveis. Em particular, dois nodos de um grafo s podem estar conectados diretamente somente se um afeta o outro, com arcos indicando a direo do efeito. Quando estamos falando sobre a estrutura da rede til empregarmos a seguinte notao: um nodo pai de um outro nodo, se existir um arco a partir do anterior at o posterior. 3. Probabilidades Condicionais - Elas quantificam as relaes entre os nodos conectados. Isto feito pela especificao de uma distribuio de probabilidade condicional para cada nodo, observando todas as possveis combinaes dos valores dos seus nodos pais. Cada combinao dessas recebe o nome de instanciao do conjunto de pais. Para cada instanciao distinta, necessrio especificar a probabilidade que o nodo filho ter. Assim, se um nodo possuir vrios pais, ou se esses pais puderem ter um nmero elevado de valores, a tabela de probabilidade condicional, do ingls conditional probability table - CPT ser muito grande. Os nodos fumante, idade e exposio poluio so nodos que tm dois estados em cada um. So nodos binrios e que no possuem pais. Suas tabelas so construdas de maneira simples, pois no h dependncia de outros dados. Basta apenas informar qual a chance de uma pessoa ser fumante ou no, por exemplo. As demais variveis devem ser analisadas de uma forma um pouco diferente pois como so variveis que possuem pais, os valores de seus estados so obtidos por meio da aplicao de probabilidades condicionais para cada caso condicional dos

ns pais. O nodo DPOC tem uma CPT composta de 24 linhas, pois os nodos fumante a quanto tempo, idade, exposio a poluio, tem respetivamente 2, 2 e 6 estados.

5. Concluses e trabalhos futuros


A Rede Bayesiana sem dvida uma ferramenta interessante, pois permite a modelagem de conhecimento atravs da relao de causa-e-efeito. Isso para a modelagem de conhecimento mdico um grande facilitador. O modelo aqui apresentado baseia-se em um estudo inicial sobre o assunto, mas pode ser expandido com novas variveis para que seja possvel, por exemplo, encontrar que a doena especfica est acometendo o usurio, ou verificar se ele sofre de asma ou DPOC. Por meio de uma interface WEB, a rede poder ser acessada. A API do Netica, permite que sejam criados softwares para interagir com o usurio, sendo que possvel escolher entre vrias linguagens de programao, dentre as quais Java que permite que sejam criadas aplicaes para a internet.Alm da interface WEB, a rede poderia ficar disponvel a uma aplicao que rodasse em um setup box de tv digital. Em Junio2005 [?] Para isso um webservice poderia ser criado para receber as informaes referentes s evidncias que seriam formatadas e enviadas para a rede, que por sua vez, usaria o mesmo mecanismo para enviar a resposta at ao usurio.

Referncias
Junior, G. (2005). Voz sobre ip segurana de transmisses.