You are on page 1of 6

Lgica Nebulosa Aplicada Classificao BI-RADS de Ndulos de Mama no Ambiente de Diagnstico Auxiliado por Computador

Gisele Helena Barboni Miranda1,2, Paulo Mazzoncini de Azevedo Marques2, Joaquim Cezar Felipe1
1

Faculdade de Filosofia, Cincias e Letras de Ribeiro Preto (FFCLRP) 2 Faculdade de Medicina de Ribeiro Preto (FMRP) Universidade de So Paulo (USP), Brasil

Resumo - Este trabalho apresenta um mtodo para avaliao e classificao de ndulos de mama que utiliza a lgica nebulosa no processo de inferncia da categoria Bi-RADS relativa avaliao. Um dos principais obstculos que se contrapem ao processo de representao e processamento automtico de imagens mdicas nos ambientes de estudo e diagnstico auxiliado por computador o chamado "hiato semntico", que se caracteriza pela divergncia dos resultados obtidos pelos algoritmos de reconhecimento de padres e apoio deciso com os resultados esperados pelo radiologista. Esta divergncia se deve principalmente s dificuldades encontradas pelos sistemas computacionais em representar e simular o raciocnio e o estilo adotado pelo radiologista no processo de anlise da imagem. A proposta deste trabalho consiste na aplicao dos conceitos da Lgica Nebulosa definio dos atributos descritores da terminologia empregada pelos radiologistas para a caracterizao de achados, de forma que a adaptao de definies e regras lingsticas aos modelos numricos, proporcionada pela Lgica Nebulosa, possa propiciar uma aproximao entre o sistema computacional e o usurio especialista, gerando resultados mais efetivos e fomentando, assim, a reduo do hiato semntico. Palavras-chave: Lgica Nebulosa, Diagnstico Auxiliado por Computador, Bi-Rads. Abstract This works presents a method for evaluation and classification of breast nodules that utilizes the fuzzy logic to infer the Bi-RADS assessment related to the evaluation. One of the main obstacles that opposes to the process of representation and automatic processing of medical images in study environments and computer aided diagnosis is the "semantic gap", that is characterized for the divergence of the results obtained through pattern recognition and decision support algorithms with the results expected by the radiologist. This divergence is due, mainly to the difficulties found by the computational systems in representing and simulating the reasoning and the style adopted by the radiologist in the process of image analysis. The proposal of this work consists in the application of the concepts of Fuzzy Logic in the definition of the describing attributes of the terminology used by the radiologists to characterize findings. This way the adaptation of definitions and linguistic rules to the numerical models, achieved through the Fuzzy Logic, can support an approach between the computational system and the specialist user, leading to more effective results and fomenting, thus, the reduction of the semantic gap. Key-words: Fuzzy Logic, Computer-aided Diagnosis, Bi-Rads.

Introduo O objetivo geral dos sistemas de informao na medicina tm sido disponibilizar a informao necessria ao mdico de maneira rpida e precisa a fim de melhorar a qualidade e a eficincia dos processos no cuidado sade. Paralelamente, os registros clnicos do paciente e as anotaes relativas aos laudos tm seguido o caminho da digitalizao e da informatizao. Bases de dados contendo informaes sobre o paciente, sua evoluo clnica, assim como exames realizados tm se tornado comuns em grandes hospitais. A possibilidade de se tratar computacionalmente imagens e dados permite o desenvolvimento de ferramentas para o diagnstico auxiliado por

computador (Computer-Aided Diagnosys CAD) [1] [2], as quais tm se mostrado coadjuvantes capazes de promover um aumento da qualidade do trabalho dos radiologistas [3]. Os sistemas CAD tm como objetivo auxiliar e aumentar a preciso do diagnstico do radiologista, por meio do uso dos resultados gerados pelo computador como referncia, como, por exemplo, a indicao de reas suspeitas da imagem assim como anormalidades mascaradas. Este auxlio do computador importante, j que o diagnstico do radiologista baseado em avaliaes subjetivas, sujeitas as variaes pessoais (tais como perda de informaes devido a fadiga visual e distrao), qualidade da imagem e sobreposio de estruturas, entre outros fatores

[4]. Desta forma, os sistemas CAD tm mostrado que podem melhorar o desempenho dos diagnsticos radiolgicos. A classificao BI-RADS (Breast Imaging Reporting and Data System) um produto desenvolvido em colaborao por membros e comits do ACR (American College of Radiology) e tem por objetivo padronizar a terminologia utilizada em exames de mamografias, as categorias de avaliao dos achados e a ao resultante para cada uma delas [5]. A utilizao do BI-RADS altamente recomendada para guiar radiologistas e mdicos no processo de tomada de deciso. Os principais atributos para classificao de ndulos de mama utilizados neste trabalho e padronizados pela classificao BI-RADS so: forma, contorno e densidade. A forma pode ser classificada como: redonda, oval, lobular ou irregular. O contorno assume os valores circunscrito, microlobulado, obscurecido, indistinto e espiculado. A densidade do ndulo quando comparada ao tecido subjacente pode ser alta, isodensa, baixa ou de aspecto gorduroso. A Lgica Nebulosa utiliza conceitos intuitivos e mtodos de raciocnio aproximado para representar um modelo matemtico clssico [6]. Atualmente, pode ser considerada uma tcnica de Inteligncia Artificial que busca simular o raciocnio humano em sistemas de apoio tomada de deciso. Os conjuntos nebulosos tratam a separao entre classes caracterizadas por faixas de valores numricos por medidas de pertinncia sobrepostas substituindo transies bruscas. Esta abordagem aplica-se a situaes, nas quais, a fronteira entre conjuntos no bem delineada a maioria dos casos de avaliao realizada por um ser humano aproximando conhecimento objetivo (representado por dados numricos) e conhecimento subjetivo (representado por termos lingsticos). O presente trabalho est focado no estudo e no desenvolvimento de mtodos que apliquem os conceitos da Lgica Nebulosa representao de imagens mdicas por caractersticas visuais intrnsecas s mesmas, visando a reduo do hiato semntico que ocorre nos ambientes de anlise, recuperao por similaridade e gerao de diagnstico de radiografias de mama. Com isto, Os graus de pertinncia zero e um indicam, respectivamente a no pertinncia e a total pertinncia do elemento ao conjunto em questo. pretendemos investigar a eficcia desses mtodos no sentido de tornar as aplicaes de auxlio ao diagnstico, mais precisas e efetivas, possibilitando que os resultados dos sistemas automatizados sejam mais prximos dos resultados gerados e esperados pelos mdicos usurios. Metodologia

A seguir sero discutidas as tcnicas utilizadas neste trabalho para a determinao do modelo proposto. Lgica Nebulosa. A Lgica Nebulosa foi apresentada inicialmente por Lofti Zadeh, professor da Universidade de Berkeley, na dcada de 60. A utilizao dos conceitos da Lgica Nebulosa aplicada aos diversos domnios do conhecimento vem crescendo ao longo dos anos. Sistemas baseados em controladores nebulosos tm possibilitado a automao de diversos processos [7], incluindo o controle de sofisticados procedimentos industriais. Na rea mdica, essa abordagem bastante adequada ao processo de determinao do diagnstico, sujeito subjetividade do mdico. A teoria de conjuntos nebulosos distinguese da teoria clssica de conjuntos por tratar do aspecto vago da informao. Esta teoria menos restritiva e mais adequada ao tratamento de informaes fornecidas por seres humanos [8]. Ela estende a lgica clssica binria {0,1} para o domnio contnuo, o intervalo [0,1], permitindo uma transio gradual entre a no pertinncia e a pertinncia de um elemento a um conjunto [9]. Seja A um conjunto nebuloso do universo de discurso U e x um elemento a ser caracterizado, a proposio x pertence a A, no necessariamente ser verdadeira ou falsa, como na lgica binria. O elemento x possuir um grau de pertinncia ao conjunto A, que define o quo relacionado est x ao conjunto A (Figura 1).

Figura 1. Determinao do grau de pertinncia Inferncia Nebulosa. A entrada de um sistema nebuloso assume valores precisos, ainda no nebulosos, que passaro por uma etapa inicial chamada nebulizao, na qual, sero mapeados em valores lingsticos pelas funes de pertinncia caractersticas de cada subconjunto nebuloso de entrada. A criao de uma base de regras composta por uma coleo de proposies nebulosas caracteriza a estratgia de controle e juntamente com os dados de entrada ser processada pelo modelo de inferncia escolhido para fornecer a sada nebulosa do sistema. A etapa denominada denebulizao utilizada quando a sada do sistema necessita de uma

representao discreta. Esta ltima etapa transforma a sada nebulosa em ao de controle no nebulosa [8] (Figura 2).

Figura2. Mquina de Inferncia Nebulosa Uma base de regras nebulosas possui proposies cujos antecedentes, conseqentes ou ambos representam conjuntos nebulosos. Geralmente, as regras encontram-se no formato se <premissa> ento <concluso>, descrevendo uma relao entre elementos de conjuntos diferentes. Essa abordagem facilita o processo de interpolao, ou seja, uma regra pode ser definida pelo produto cartesiano entre conjuntos nebulosos [10]. Especialistas da rea de interesse, geralmente, auxiliam as etapas de criao da base de regras e dos conjuntos nebulosos. O modelo de inferncia nebulosa adotado foi o modelo de Mamdani, proposto na dcada de 70, e utilizado como padro para utilizao da lgica nebulosa por muito tempo. As regras semnticas definidas neste modelo utilizam operadores de unio e interseco (Max-Min) e tanto os antecedentes como os conseqentes das regras possuem relaes nebulosas. Para cada regra da base, definido o produto cartesiano fuzzy (interseco fuzzy) dos componentes da parte antecedente da regra, gerando um coeficiente de disparo para cada uma. Quando este coeficiente maior que zero, pode-se dizer que a regra foi ativada pela entrada atual e contribuir para o clculo da sada fornecida pelo sistema [11]. Entre as regras ativadas, a operao unio fuzzy, ser aplicada sobre as regras com o mesmo subconjunto de sada, gerando o seguinte universo de discurso para cada subconjunto como descrito em (1):

recomendados nesta categoria e sempre que possvel a mamografia deve ser comparada a exames anteriores. Na categoria 1, no h presena de massas ou calcificaes suspeitas, uma mamografia negativa. A categoria 2 apresenta achados benignos, sem indicaes de malignidade. Um achado na categoria 3 apresenta alto grau de benignidade, porm menor do que o grau da categoria 2. Uma pequena probabilidade de malignidade (menor que 2%) est associada a esta categoria [5]. Durante a etapa de acompanhamento, no so esperadas mudanas na avaliao de uma leso classificada como categoria 3. As categorias 4 e 5 so consideradas malignas. Na categoria 4, h leses com alta probabilidade de malignidade, porm elas no apresentam caractersticas morfolgicas de cncer de mama. Ao contrrio, a categoria 5 apresenta leses com alta probabilidade de serem cncer. Por fim, a categoria 6 somente utilizada quando h comprovaes histolgicas de cncer de mama. Participao de Especialistas do Domnio. A fim de conhecer os parmetros perceptuais utilizados por mdicos radiologistas na avaliao de ndulos de mama com a aplicao prtica do lxico BIRADS, foram realizadas reunies com radiologistas do Hospital das Clnicas da Faculdade de Medicina de Ribeiro Preto (HCFMRP) da Universidade de So Paulo (USP). As reunies auxiliaram a escolha da metodologia a ser utilizada no projeto, otimizando a modelagem do sistema e a criao dos subconjuntos nebulosos. Base de Imagens. Foi utilizada neste trabalho a base de imagens de mamografia digital DDSM (Digital Database for Screening Mammography) [12] construda por pesquisadores do Hospital Geral de Massachusets e da Universidade do Sul da Flrida, com leses recortadas por pesquisadores da Universidade de Chicago. Para este trabalho foram utilizadas 250 imagens compostas por regies de interesse contendo leses benignas ou malignas, diagnosticadas por radiologistas e exames antomo-patolgicos. Modelagem do Sistema. A modelagem do sistema nebuloso proposto foi dividida em duas etapas. Na primeira etapa foram utilizados os atributos visuais para classificao de ndulos de mama padronizados pelo lxico BI-RADS, apresentados na Introduo deste artigo. Para avaliar a contribuio dos atributos na determinao da classificao de um achado, a malignidade do tumor foi tratada de maneira escalar. Foram criadas escalas representativas do conceito malignidade, variando no intervalo [0,1], que indicassem a relao entre este conceito e

(C ) max k 1...n [min( Dk , C i )]

(1)

onde D(k) representa o coeficiente de ativao de cada regra que possui a sada Ci. O conjunto (C) pode ser utilizado no processo de tomada de deciso em uma avaliao qualitativa. Categorias de Avaliao BI-RADS. O BI-RADS possui sete categorias de avaliao, numeradas de 0 a 6, para a caracterizao de achados mamogrficos. A categoria 0 indica que necessria uma avaliao adicional da imagem, o que ocorre em situaes de acompanhamento. Exames como o ultra-som, podero ser

uma determinada caracterstica do atributo em anlise. Essas escalas foram apresentadas a cinco radiologistas, na forma de um questionrio, contendo campos para a avaliao da forma, do contorno e da densidade do ndulo. Foram selecionadas 35 imagens, da base j descrita, a serem analisadas por cada radiologista. Durante a avaliao, para cada atributo foi adotada uma caracterstica e apontado um valor na escala que indicasse a influncia da caracterstica na malignidade da leso. Para o atributo formato, foi utilizada uma escala para relacionar as caractersticas redonda, oval, lobular e irregular aos seus respectivos graus de malignidade, j que usualmente apenas uma delas adotada durante a avaliao do radiologista. Como exemplo, poderamos obter a seguinte avaliao: formato lobular com grau de malignidade 0,6. Similar ao atributo formato, o atributo densidade possui tambm apenas uma escala que relaciona as caractersticas alta, isodensa, baixa e de aspecto gorduroso escala de malignidade. Quanto ao atributo contorno, a fim de se manter a fidelidade ao padro BI-RADS, foi permitida a escolha de mais de uma caracterstica para um mesmo achado. Uma escala foi adotada para cada caracterstica: circunscrito, microlobulado, obscuro, indistinto e espiculado. Tambm relativo ao contorno, foram determinadas quatro variveis lingsticas, que atuam como pesos na avaliao final do contorno: totalmente, muito, parcialmente e pouco. No questionrio permitiu-se a escolha de uma das variveis acima descritas para cada caracterstica escolhida associada a um grau de malignidade, por exemplo, contorno parcialmente circunscrito com grau de malignidade 0,2 e parcialmente obscurecido com grau de malignidade 0,5. importante notar que a varivel totalmente exclui a escolha de mais de uma caracterstica e a quantidade de caractersticas selecionadas depender da avaliao do radiologista. Por fim, a categoria BI-RADS foi determinada pelo radiologista para cada exemplo analisado. Aps a avaliao das leses pelos radiologistas, um banco de dados foi criado para armazenar os dados obtidos e facilitar a extrao dos parmetros dessas avaliaes. As informaes armazenadas representam o conhecimento dos especialistas do domnio, importantes em um sistema nebuloso, e sero a base para a criao dos conjuntos nebulosos e da base de regras. O prximo passo consistiu na determinao de trs coeficientes: formato, contorno e densidade, que representaro a entrada nebulosa do sistema proposto. Os coeficientes de formato e de densidade assumem os valores atribudos como grau de malignidade na entrada do sistema pelo radiologista. Para o clculo do coeficiente de

contorno, realizou-se uma mdia ponderada das avaliaes obtidas, caso mais de uma caracterstica fosse escolhida. O peso utilizado foi a mdia aritmtica da caracterstica obtida das avaliaes. O fluxo pode ser acompanhado na Figura 3.

Figura 3. Determinao de Coeficientes a partir das Avaliaes A segunda etapa consistiu na modelagem do sistema de inferncia nebuloso e na escolha de seus parmetros estruturais, tais como o nmero de variveis de entrada e sada e o tipo de funo de pertinncia utilizada. A entrada do sistema composta pelos trs coeficientes determinados na etapa anterior: coeficiente de formato, coeficiente de contorno e coeficiente de densidade. Optou-se pela representao dos coeficientes por meio de conjuntos nebulosos, utilizando funes Sino para representar as funes de pertinncia. Este tipo de funo apresenta uma transio suave das fronteiras entre os subconjuntos, adequando-se ao problema em anlise. Elas diferem das funes de pertinncia gaussianas por possurem um intervalo de valores com grau de pertinncia mxima. O prximo passo consistiu na criao da base de proposies nebulosas. Foram consideradas 36 possibilidades para a base de regras, combinando-se os subconjuntos do coeficiente de formato, os subconjuntos do coeficiente de contorno e os subconjuntos do coeficiente de densidade. Esta etapa tambm foi auxiliada pelas avaliaes realizadas nas entrevistas com os radiologistas. Para cada avaliao, foi determinado o subconjunto de maior pertinncia para cada uma das variveis de entrada, representadas pelos coeficientes. As relaes obtidas foram armazenas no banco de dados. Foram selecionadas as relaes que representassem as mesmas combinaes de entrada do sistema e a classe majoritria do conjunto selecionado foi utilizada para determinar a parte conseqente da regra. Foi utilizado o Fuzzy Toolbox do Matlab para implementao do sistema nebuloso e simulao do procedimento de inferncia.

Resultados A varivel de entrada coeficiente de formato foi dividida em trs subconjuntos nebulosos, assumindo os seguintes valores lingsticos: baixo, mdio e alto, variando no intervalo [0,1] (Figura 4).

A varivel de sada representada pela categoria BI-RADS associada ao exemplo e foi dividida em quatro subconjuntos nebulosos, representativos das seguintes categorias BIRADS: 2, 3, 4 e 5 (Figura 4). A categoria 0, no foi adotada aqui, pois utilizada quando h necessidade de exames adicionais alm da mamografia.

Figura 4. Funes de Pertinncia para o Coeficiente de Formato A varivel de entrada coeficiente de contorno foi dividida em quatro subconjuntos nebulosos, assumindo os seguintes valores lingsticos: muito baixo, baixo, mdio e alto, variando no intervalo [0,1] (Figura 5). Figura 4. Funes de Pertinncia representativas das Categorias BI-RADS Avaliao do Sistema. Testes foram realizados comparando-se as avaliaes dos radiologistas com a sada do sistema nebuloso. Na Tabela 1 so apresentados alguns resultados. Tabela 1. Exemplos de resultados obtidos
Parmetros de Entrada
formato contorno densidade

E1

irregular

muito espiculado

alta

E2

lobular

Figura 5. Funes de Pertinncia para o Coeficiente de Contorno A varivel de entrada coeficiente de densidade foi dividida em trs subconjuntos nebulosos, assumindo os seguintes valores lingsticos: baixo, mdio e alto, tambm variando no intervalo [0,1] (Figura 6).
E3 irregular

parcialmen te obscuro

alta

totalmente espiculado

alta

Avaliao BI-RADS R1 4 R2 4 R3 5 Sistema 4 (pert. 67%) 5 (pert. 20%) R1 3 R2 4 R3 3 Sistema 3 (pert. 61%) 4 (pert. 12%) R1 5 R2 5 R3 5 Sistema 5 (pert 100%)

Figura 5. Funes de Pertinncia para o Coeficiente de Densidade

Para o exemplo 1 (E1), temos a seguinte avaliao: formato irregular, contorno muito espiculado e densidade alta. A categoria 4 foi atribuda ao exemplo pelos radiologistas R1 e R2 e a categoria 5, pelo radiologista R3. O sistema gerou a seguinte sada: categoria 4 com pertinncia de 67% e categoria 5 com pertinncia de 20%. Para o exemplo 2 (E2), consideramos a seguinte avaliao: formato lobular, contorno parcialmente obscuro e densidade alta. Similar ao exemplo anterior, a categoria 3 foi atribuda ao exemplo 2 pelos radiologistas R1 e R3 e a categoria 4, pelo radiologista R2. A sada gerada

pelo sistema foi: categoria 3 com pertinncia de 61% e categoria 4 com pertinncia de 12%. Por fim, para o exemplo 3 (E3), foi utilizado como entrada do sistema a seguinte avaliao: formato irregular, contorno totalmente espiculado e densidade alta. A categoria 5 foi atribuda ao exemplo pelos 3 radiologistas e resultou em pertinncia mxima como sada do sistema. Os exemplos 1 e 2 caracterizam regies de fronteira entre conjuntos, representadas pelos diferentes graus de pertinncia atribudos a cada conjunto. O exemplo 3 um elemento com pertinncia total categoria 5. Nota-se que o qualificador totalmente junto a um contorno espiculado, geram um coeficiente de formato alto, elevando o grau de pertinncia do exemplo categoria 5. Por meio destes exemplos, pode-se verificar que o sistema gerou resultados coerentes em relao s avaliaes fornecidas pelos radiologistas. Discusso e Concluses Este trabalho apresenta um mtodo para caracterizao nebulosa dos principais descritores da terminologia lingstica utilizada na avaliao de ndulos de mama, assim como a categoria BIRADS associada. A partir da ocorrncia de vrias divergncias observadas nas avaliaes dos achados mamogrficos, durante as entrevistas realizadas com radiologistas, evidenciou-se a presena de subjetividade. A utilizao da lgica nebulosa permitiu a representao dessa subjetividade. Ao tratar os atributos forma, contorno e densidade como conjuntos nebulosos, foi possvel determinar um grau de pertinncia de um ndulo a cada uma das categorias de avaliao BI-RADS. Alm disso, o mtodo proposto possibilitar a criao de um sistema CAD mais amigvel, no qual os parmetros de entrada sero bastante prximos forma natural como o radiologista avalia e qualifica os achados da imagem, caracterizando-se, portanto, como um sistema computacional no-intrusivo. Os resultados discutidos permitem concluir que a metodologia proposta poder ser utilizada em sistemas de auxilio a diagnstico, pois fornecem uma segunda opinio consistente, contendo caractersticas quantitativas de anlise. Agradecimentos Os autores agradecem FAPESP pelo apoio financeiro e aos radiologistas Dr. Clvis Simo Trad, Dra. Anglica Godinho, Dr. Valdair Francisco Muglia, Dr. Jorge Elias Junior, e Dr. Andr Luis Caliento Paiva pela avaliao das leses selecionadas.

Referncias Bibliogrficas [1] Doi, K., "Current status and future potential of computer-aided diagnosis in medical imaging". British Journal of Radiology, n. 78, pp. 3-19. 2005. [2] Yin, T.-K. e N.-T. Chiu. "A computer-aided diagnosis for locating abnormalities in bone scintigraphy by a fuzzy system with a three-step minimization approach." IEEE Trans. Med. Imaging 23(5): 639-654. 2004. [3] Doi, K., "Diagnostic Imaging over the last 50 years: research and development in medical imaging science and technology". Phys Med Biol, vol. 51, n. 13, pp. 5-27. 2006. [4] Marques, P. M. A. Computer-aided diagnosis in radiology. Radiol Bras, vol.34, no.5, p.285-293. ISSN 0100-3984.Sept./Oct. 2001. [5] Obenauer, S., Hermann, K.P., Grabbe, E. Applications and literature review of the BI-RADS classification. European Radiology, vol.15, no.5, p.1027-1036. 2005 [6] Oliveira-Jr, Hime A. "Lgica Difusa: Aspectos Prticos e Aplicaes". Rio de Janeiro. Editora Intercincia. 1999. [7] Amendola, M.; Souza, A. Manual do uso da teoria dos conjuntos Fuzzy no Matlab 6.5. Campinas: CPG/FEAGRI/UNICAMP, 2004. 30p. [8] Sandri, S.; Correa, C. Lgica Nebulosa. V Escola de Redes Neurais, Promoo: Conselho Nacional de Redes Neurais pp. c073-c090, 19 de julho, 1999 ITA, So Jos dos Campos - SP [9] Zadeh, L. A. "Fuzzy logic and approximate reasoning (In memory of Grigore Moisil)". Synthese, 30, pp. 407-428. 1975. [10] Dubois, D., Prade, H. What are fuzzy rules and how to use them Fuzzy Sets and Systems, vol. 84, pp. 169-185. ISSN: 0165-0114. 1996. [11] Almeida P. E. M.; Evsukoff A. G. Minerao de Textos. In: Rezende, S. O. (org). Sistemas Inteligentes: fundamentos e aplicaes. 1.ed. Barueri, SP: Manole, 2003. cap.7, p.169-200. [12] IARL. (2008) Digital Database for Screening Mammography. http://marathon.csee.usf.edu/Mammography/. (Acessado em 13/07/2008) Contato Gisele Helena Barboni Miranda Departamento de Fsica e Matemtica Faculdade de Filosofia, Cincias e Letras Ribeiro Preto USP Fone: (16) 3602 3774 E-mail: giselehbm@aluno.ffclrp.usp.br