You are on page 1of 133

Pedro Rafael Diniz Marinho

Deteco de Cluster atravs de um Modelo Hbrido Gentico-Fuzzy

Joo Pessoa - PB, Brasil 17 de dezembro de 2010

Pedro Rafael Diniz Marinho

Deteco de Cluster atravs de um Modelo Hbrido Gentico-Fuzzy

Monograa apresentada para obteno do Grau de Bacharel em Estatstica pela Universidade Federal da Paraba - UFPB.

Orientador:

Joab de Oliveira Lima

Universidade Federal da Paraba Centro de Cincias Exatas e da Natureza Departamento de Estatstica

Joo Pessoa - PB, Brasil 17 de dezembro de 2010

Monograa de Projeto Final de Graduao sob o ttulo Deteco de Cluster atravs

de um Modelo Hbrido Gentico-Fuzzy , defendida por Pedro Rafael Diniz Marinho e


aprovada em 17 de dezembro de 2010, em Joo Pessoa, Estado da Paraba, pela banca examinadora constituda pelos professores:

Prof. Dr. Joab de Oliveira Lima Orientador

Prof. Me. Jozemar Pereira dos Santos Universidade Federal da Paraba

Prof. Me. Marcelo Rodrigo Portela Ferreira Universidade Federal da Paraba

Resumo

O inter-relacionamento de dados epidemiolgicos, geralmente, tratado por mtodos que levem em conta as suas caractersticas espaciais. Nesse sentido, vrios mtodos de decteo de cluster, tal como o algoritmo Scan, tm sido sugeridos na literatura. Normalmente, essa metodologia utiliza como centros espaciais os centrides dos elementos espaciais envolvidos e, alm disso, se utiliza apenas de conceitos univariados. No entanto, o mesmo procedimento no consegue trabalhar bem quando os centros dos objetos em estudo so caractersticas qualitatitivas da populao, como por exemplo, as causas externas de bitos que acomentem uma certa regio ou um municpio. Esse ltimo fato motivou a criao de um modelo hbrido de agrupamento de dados que utiliza um mistura das losoas dos Algoritmos Genticos com a Lgica Nebulosa Fuzzy, chamado de Modelo Hbrido Gentico-Fuzzy (MHGF). Essa proposta foi aplicada a um banco de dados, fornecido pela Secretaria de Sade do Estado da Paraba, que relacionou os 30 principais municpios paraibanos com as 8 principais causas externas de bitos descritas no Captulo XX da CID-10 para os anos de 2006 a 2010. Os resultados se mostraram bastante satisfatrios com relao aos agrupamentos formados dos municpios dentro das causas. Inclusive, em muitas situaes, foi observado que muitos municpios participantes de um mesmo grupo (causa) mantinham, sobretudo, as suas caractersticas de associao espacial. Esse estudo aplicado sugere, portanto, uma boa qualidade e ecincia do modelo proposto e o aponta como uma metodologia alternativa de agrupamentos de dados.

Abstract

The interrelationship of epidemiological data, is generally treated by methods that take into account their spatial characteristics. Accordingly, various methods of cluster detection, as the Scan algorithm, have been suggested in the literature. Typically, this methodology uses space centers as the centroids of the spatial elements involved and also makes use only of univariate concepts. However, the same procedure can not work well when the centers of the objects under study are the population characteristics of qualitative approaches, for example, external causes of deaths imposed on a certain region or a municipality. This latter fact prompted the creation of a hybrid model of grouping data using a mixture of the philosophies of Genetic Algorithms with Fuzzy Logic, called Genetic-Fuzzy Hybrid Model (GFHM). This proposal was applied to a database, provided by Health Department of the State of Paraba, which listed the top 30 municipalities of Paraba with 8 main causes of deaths described in Chapter XX of ICD-10 for the years 2006 to 2010 . The results were quite satisfactory with regard to groups formed within the municipalities within of causes. In fact, in many situations, it was noted that many municipalities participating in a same group (external causes) maintained, especially the characteristics of spatial association. This applied study therefore suggests a good quality and eciency of the proposed model and shows as an alternative method of data clusters.

Dedicatria

Dedico este trabalho a minha me Wilta Maria Diniz Amrico Marinho e ao meu pai Jos Walter Marinho da Silva por serem pais presentes na minha vida dando total apoio aos meus sonhos. Estas duas pessoas em

nenhum momento mediram esforos para realizao dos meus desejos, me guiaram pelo caminho correto me ensinando dessa forma a fazer boas escolhas mostrando que a honestidade e o respeito so essenciais vida e que sempre devo lutar para o que quero. Aos meus pais devo a pessoa que me tornei e tenho muito orgulho de cham-los de pai e me.

Agradecimentos

Agradeo aos meus pais, Wilta Maria Diniz Amrico Marinho e Jos Walter Marinho da Silva por terem me dado incentivos e condies para concluir meus estudos, incentivos estes de grande importncia para que eu pudesse chegar a concluso do curso de bacharelado em estatstica. Agradeo aos meus demais familiares por terem mostrado interesses em minha caminhada na graduao e nos estudos mais elementares, me dando incentivos e foras para concluir o curso. Ao meu orientador Joab de Oliveira Lima pela grande dedicao esta monograa que com tanta presteza colaborou neste trabalho, em que as inmeras reunies realizadas para construo deste trabalho foram de grande importncia para enriquecer meus conhecimentos em estatstica e como pessoa. Aos professores da iniciao cientca Ronei Marcos de Moraes e Neir Antunes Paes pelos conhecimentos transmitidos durante toda minha graduao, experincias estas que acrescentaram bastante nos meus conhecimentos. Agradeo aos demais professores da graduao em estatstica pelos ensinamentos transmitidos, em especial aos professores Ulisses Umbelino dos Anjos, Eufrsio de Andrade Lima Neto, Hemlio Fernandes Campos Colho, Andra Vanessa Rocha, Antonio Marcos de Moraes, Marcelo Rodrigo Portela Ferreira, Renata Patrcia Lima Jernymo. Ao meu amigo de infncia Rafhael Lopes Pires Fernandes pela grande amizade. Agradeo ele pelo bom convvio e vrias discusses na rea de Cincia da Computao, discusses estas saudveis e de extrema importncia para aprofundar meus conhecimentos de programao. A minha amiga Surama Marjouri Campos da Fonsca Maia por me dar bastante incentivos e acreditar no meu potencial, incentivos estes que ajudaram a me dedicar cada vez mais aos meus estudos. Aos meus grandes amigos de graduao Josemir Ramos de Almeida, Marclio Regis da Silva pelos bons momentos durante o bacharelado em estatstica, pelos estudos em

conjunto e pelas madrugadas em claro estudando para a graduao e realizando trabalhos de consultoria. Agradeo aos demais amigos do curso pelo bom convvio, trocas de informaes e boas conversas, Jeerson, Natlia Rodrigues Guedes Gondim, Rodrigo Cabral da Silva, Sadraque Enias de Figueiredo Lucena, Telmo Cristiano da Silva.

Sumrio

Lista de Figuras Lista de Tabelas 1 Introduo


1.1 1.2 1.3 1.4 1.5 Evoluo da violncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uma viso geral do problema abordado . . . . . . . . . . . . . . . . . p. 17 p. 17 p. 18 p. 20 p. 21 p. 21 p. 21 p. 21 p. 22

Justicativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Objetivo do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.1 1.5.2 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Objetivos especcos

1.6

Estrutura da monograa . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Reviso da Literatura e Referencial Terico 3 Anlise Multivariada de Dados


3.1 3.2 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Medidas de similaridade 3.2.1 3.2.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 23

p. 26 p. 26 p. 28 p. 28 p. 28 p. 29 p. 29

Covarincia e Correlao Medidas de distncias Distncia Euclidiana

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Distncia de Mahalanobis

3.3 3.4

Anlise de Correspondncia Anlise de Agrupamentos

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 29 p. 33

4 Introduo Teoria
4.1

Fuzzy

p. 35 p. 35 p. 35 p. 36 p. 37 p. 37 p. 38 p. 39

Teoria Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 4.1.2 4.1.3 Histrico e conceitos iniciais . . . . . . . . . . . . . . . . . . . . Comparao entre Lgica Fuzzy, Lgica Booleana e Probabilidade Componente da Teoria dos Conjuntos Fuzzy . . . . . . . . . . . 4.1.3.1 4.1.3.2 Variveis lingusticas . . . . . . . . . . . . . . . . . . . Funes de Pertinncias . . . . . . . . . . . . . . . . .

4.2

Mtodo Fuzzy C-Means

. . . . . . . . . . . . . . . . . . . . . . . . . .

5 Introduo aos Algoritmos Genticos


5.1 Algoritmo Evolutivo 5.1.1 5.1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 45 p. 45 p. 45 p. 46

Programao Evolutiva . . . . . . . . . . . . . . . . . . . . . . . Algoritmos Genticos . . . . . . . . . . . . . . . . . . . . . . . .

6 Proposta de um Modelo Fuzzy C-Means Gentico para Agrupamento de Dados


6.1 6.2 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Delineamento do Processo Amostral . . . . . . . . . . . . . . . . . . . . 6.2.1 6.2.2 6.3 Base de dados utilizada Linguagem R . . . . . . . . . . . . . . . . . . . . . .

p. 56 p. 56 p. 57 p. 57 p. 58 p. 58

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

Descrio do Problema a ser Otimizado . . . . . . . . . . . . . . . . . . 6.3.1 Transformando Tabelas de Contingncias em Medidas de Distncias Bidimensionais . . . . . . . . . . . . . . . . . . . . . . . . .

p. 59 p. 62 p. 63

6.4 6.5

Funo Objetivo

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Implementao do Modelo Hbrido Gentico Fuzzy

6.5.1

Passos do Modelo Hbrido Gentico Fuzzy - MHGF . . . . . . .

p. 63

7 Aplicaes e Discusses
7.1 7.2 7.3 Delineamento do Processo de Amostral de Simulao Relao entre Municpios e Causas Externas de bitos Resultados e Discusses 7.3.1 7.4 . . . . . . . . . . . . . . . . . . .

p. 70 p. 70 p. 71 p. 72 p. 73 p. 76

. . . . . . . . . . . . . . . . . . . . . . . . . .

Anlise de Sensibilidade dos Agrupamentos Formados . . . . . .

Anlise Longitudinal das Inter-Relaes entre Municpios e Causas . . .

8 Concluses e Sugestes de Trabalhos Futuros Anexo A -- Cdidos de Programao


A.1 A.2 A.3 A.4 Cdigo em R do exemplo de otimizao da funo

p. 79

p. 80

f ()

do Captulo 5 . do Captulo 5

p. 80 p. 82 p. 86 p. 90 p. 90 p. 91 p. 92 p. 93 p. 94 p. 95 p. 95 p. 96 p. 97 p. 98 p. 99 p. 100

Cdigo em SAS do exemplo de otimizao da funo

f ()

Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means . . . . Tabelas de Contingncias A.4.1 A.4.2 A.4.3 A.4.4 A.4.5 . . . . . . . . . . . . . . . . . . . . . . . . .

Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

A.5

Distncias entre Municpios e Causas Externas de bitos. . . . . . . . . A.5.1 A.5.2 A.5.3 A.5.4 A.5.5 Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

A.6

Tabelas de Pertinncias Segundo o Mtodo Gentico Fuzzy (MHGF)

A.7 A.8 A.9

Pertinncias para o Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . Pertinncias para o Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . Pertinncias para o Ano de 2008 . . . . . . . . . . . . . . . . . . . . . .

p. 100 p. 101 p. 102 p. 103 p. 104

A.10 Pertinncias para o Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . A.11 Pertinncias para o Ano de 2010 . . . . . . . . . . . . . . . . . . . . . .

A.12 Tabelas de Agrupamentos pelo Mtodo Hbrido Gentico Fuzzy (MHGF) p. 105 A.13 Ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.13.1 Ponto de Corte igual 0,10 A.13.2 Ponto de Corte igual 0,20 A.13.3 Ponto de Corte igual 0,30 A.13.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 105 p. 105 p. 106 p. 107 p. 108 p. 109 p. 109 p. 110 p. 111 p. 112 p. 113 p. 113 p. 114 p. 115 p. 116 p. 117 p. 117 p. 118 p. 119 p. 120

A.14 Ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.14.1 Ponto de Corte igual 0,10 A.14.2 Ponto de Corte igual 0,20 A.14.3 Ponto de Corte igual 0,30 A.14.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

A.15 Ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.15.1 Ponto de Corte igual 0,10 A.15.2 Ponto de Corte igual 0,20 A.15.3 Ponto de Corte igual 0,30 A.15.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

A.16 Ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.16.1 Ponto de Corte igual 0,10 A.16.2 Ponto de Corte igual 0,20 A.16.3 Ponto de Corte igual 0,30 A.16.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

A.17 Ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.17.1 Ponto de Corte igual 0,10 A.17.2 Ponto de Corte igual 0,20 A.17.3 Ponto de Corte igual 0,30 A.17.4 Ponto de Corte igual 0,50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p. 121 p. 121 p. 122 p. 123 p. 124 p. 125 p. 125 p. 126 p. 127 p. 128 p. 129

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano

A.18.1 Para o ano de 2006 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.2 Para o ano de 2007 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.3 Para o ano de 2008 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.4 Para o ano de 2009 . . . . . . . . . . . . . . . . . . . . . . . . . A.18.5 Para o ano de 2010 . . . . . . . . . . . . . . . . . . . . . . . . .

Referncias

p. 130

Lista de Figuras

1 2 3 4 5 6 7 8 9 10

Grco da funo de pertinncia para a varivel lingustica meia-idade. Troca de Material Gentico para o Algoritmo Gentico Binrio. Resumo dos Algoritmos Genticos. . . . .

p. 38 p. 48 p. 48 p. 50 p. 51 p. 61 p. 61 p. 73 p. 74 p. 75

. . . . . . . . . . . . . . . . . . . .

Diagrama do uxo do algoritmo gentico. . . . . . . . . . . . . . . . . . Funo objetivo

f ().

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Distncias Euclidiana.

Distncias de Mahalanobis.

Grco Perceptual para o Ano de 2006. . . . . . . . . . . . . . . . . . . Grcos para os 4 pontos de cortes considerados, 2006. Grcos para os 4 pontos de cortes considerados, 2007. . . . . . . . . . . . . . . . . . .

Lista de Tabelas

1 2 3 4

Codicao dos 30 municpios considerados paraibanos. . . . . . . . . . Estrutura dos dados para Anlise de Correspondncia. Tabela de Correspondncia. . . . . . . . . .

p. 19 p. 31 p. 32

. . . . . . . . . . . . . . . . . . . . . . . .

Tabela com as Solues Candidatas Iniciais e com as Propores Calculadas com Base na Funo Objetivo. . . . . . . . . . . . . . . . . . . . p. 52

Tabela de contigncia a critrio ilustrativo com o quantitativo de bitos ocorridos em 2010. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 60 p. 71 p. 72

6 7 8

Tempo de convergncia em horas do algoritmo MHGF. Tabela de Contingncia para o ano de 2006.

. . . . . . . . . . . . . . .

Pertinncias Obtidas pelo Modelo Hbrido Gentico Fuzzy (MHGF) para o ano de 2006. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 76

Evoluo das inter-relaes entre municpios e causas externas para o ponto de corte 0,20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 77 p. 90 p. 91 p. 92 p. 93 p. 94

10 11 12 13 14 15 16 17 18 19

Tabela de Contingncia para o Ano de 2006. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2007. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2008. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2009. . . . . . . . . . . . . . . . Tabela de Contingncia para o Ano de 2010. . . . . . . . . . . . . . . .

Distncias Calculadas entre Municpios e Causas Externas de bito, 2006. p. 95 Distncias Calculadas entre Municpios e Causas Externas de bito, 2007. p. 96 Distncias Calculadas entre Municpios e Causas Externas de bito, 2008. p. 97 Distncias Calculadas entre Municpios e Causas Externas de bito, 2009. p. 98 Distncias Calculadas entre Municpios e Causas Externas de bito, 2010. p. 99

20

Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2006. . . . . . . . . . . . . . . . . . . . . . . . . p. 100

21

Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2007. . . . . . . . . . . . . . . . . . . . . . . . . p. 101

22

Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2008. . . . . . . . . . . . . . . . . . . . . . . . . p. 102

23

Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2009. . . . . . . . . . . . . . . . . . . . . . . . . p. 103

24

Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2010. . . . . . . . . . . . . . . . . . . . . . . . . p. 104 p. 105 p. 106 p. 107 p. 108 p. 109 p. 110 p. 111 p. 112 p. 113 p. 114 p. 115 p. 116 p. 117 p. 118 p. 119 p. 120 p. 121 p. 122

25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42

Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. .

43 44

Agrupamento dos Municpios para com as Causas Externas de bito. . Agrupamento dos Municpios para com as Causas Externas de bito. .

p. 123 p. 124

17

Introduo

 Todo grande progresso da cincia resultou de uma nova audcia da imaginao."

John Dewey

1.1 Evoluo da violncia


A violncia, em seus mais variados contornos, um fenmeno histrico na constituio da sociedade brasileira. Desde a escravido, primeiro com os ndios depois com

mo de obra africana, a colonizao mercantilista, o coronelismo, as oligarquias antes e depois da independncia, tudo isso somado a um Estado caracterizado pelo autoritarismo burocrtico, contribuiu fortemente para o aumento da violncia que atravessa a histria do Brasil. Diversos fatores colaboram para aumentar a violncia, tais como a urbanizao acelerada, que traz um grande uxo de pessoas para as reas urbanas e assim contribui para um crescimento desordenado das cidades. Colaboram tambm para o aumento da violncia as fortes aspiraes de consumo, em parte frustradas pelas diculdades de insero no mercado de trabalho. As causas da violncia so associadas, em parte, a problemas sociais como misria, fome e desemprego. Mas nem todos os tipos de violncia derivam das condies econmicas. Alm disso, um Estado ineciente e sem programas de polticas pblicas de segurana, contribui para aumentar a sensao de injustia e impunidade, que , talvez, a principal causa da violncia. Os acidentes de transportes tambm expressam uma forma de violncia pois pem em risco as pessoas, o meio ambiente, em que dessa forma representa uma forte ameaa sociedade. Tais acidentes representam custos elevados para o Estado que s podem

ser diminudos com a aplicao de medidas pblicas ecientes. Conforme a frota cresce e envelhece e o trnsito se torna mais perigoso, a rede pblica de sade precisa investir mais

1.2 Uma viso geral do problema abordado

18

em equipamentos e prossionais para o atendimento das vtimas. Tais investimentos no se devem unicamente este tipo de violncia mas a todas as formas de violncia presentes em nosso pas. A Paraba no se encontra fora do contexto nacional. Devido ao crescimento dos

municpios paraibanos e a acelerada urbanizao de alguns deles, possvel perceber um aumento da violncia nessas regies. Segundo a Secretaria de Sade do Estado da

Paraba houve um aumento signicativo nas mais variadas causas de violncia que se deu principalmente na Grande Joo Pessoa nos ltimos 5 anos. Tais problemas podem ser

contornados com a aplicao de medidas pblicas que visam a reduo dessas violncias e que consequentemente reetem a diminuio da mortalidade por causas no naturais.

1.2 Uma viso geral do problema abordado


Estudos sobre dados de estatsticas vitais de bitos de uma regio de extremo interesse para o planejamento de polticas pblicas de sade. Estudos dessa natureza possibilitam s Secretarias de gesto dessas regies a tomem decises com base em mtodos quantitativos que daro um embasamento maior ao gestor visando a solues de um problema. Utilizando os dados do Sistema de Informao de Mortalidade - (SIM) da Secretaria de Sade do Estado da Paraba, foi possvel entender os relacionamentos de alguns municpios da Paraba com as causas externas de bitos. Pode-se entender por causas externas as causas de bitos por motivos no naturais como homicdios, acidentes de transportes, afogamento, dentre outras. As causas externas esto na Classicao Internacional das Doenas na verso 10 (CID-10) no Captulo XX. Atravs da base de dados gerada pela Secretaria Estadual foram obtidas as informaes de bitos de 2006 a 07 de julho de 2010. Foram consideradas 8 causas especcas de bitos, em que a principal causa de bito aquela que apresentou o maior nmero de bitos entre 01/01/2006 a 07/09/2010 . Dessa forma, foi possvel, atravs das 8 causas de bitos mais relevantes no Estado da Paraba, selecionar 30 municpios mais signicativos, segundo as causas consideradas. As causas estudadas neste trabalho esto listadas abaixo, bem como os municpios considerados.

1.2 Uma viso geral do problema abordado

19

Causas externas de bito


1. V03 - Pedestre traumatizado em coliso com automvel. 2. V09 - Pedestre traumatizado em acidentes de transporte no especicado; 3. V49 - Ocupante de automvel traumatizado em outro acidente de transporte e em acidentes de transportes no especicados; 4. V89 - Acidente com um veculo a motor ou no-motorizado, tipo(s) de veculos(s) no especicado(s); 5. V99 - Acidente de transporte no especicado; 6. W19 - Queda sem especicao; 7. X70 - Leso provocada intencionalmente por enforcamento, estrangulamento e sufocao; 8. X95 - Agresso por disparo de arma de fogo ou arma no especicada;

Municpios
Tabela 1: Codicao dos 30 municpios considerados paraibanos. Municpios Joo Pessoa Campina Grande Santa Rita Bayeux Patos Cabedelo Sap Sousa Queimadas Mamanguape Guarabira So Bento Esperana Caapor cajazeiras Cdigos JP CG SR BA PA CA SA SO QE MA GA SB ES CP CJ Municpios Catol do Rocha Lagoa Seca Pedras de Fogo Alhandra Alagoa Grande Solnea Remgio Monteiro Conde Cuit Soledade Alagoa Nova Areia Aroeira Boqueiro Cdigos CR LS PE AH AG SL RE MO CO CU SD AN AR AO BO

Apesar dos dados serem provenientes e de responsabilidade da Secretaria de Sade Estadual, importante perceber que essas informaes so bastante diversicadas, po-

1.3 Justicativa
dendo responder sobre as polticas de seguranas dessas regies. A causa plo, reete o grau de criminalidade de um dado municpio. J a causa

20

X95, W 19

por exem(causa de

bito de queda sem especicao) refere-se a uma varivel pouco informativa, no sentido de que um municpio associado esta causa no reete muito as condies scio econmicas dessa localidade. Contudo, esta varivel foi considerada no estudo por ser de interesses de algumas pessoas para o monitoramento da qualidade dos dados, que no ser tratado neste trabalho. Para construo desses relacionamentos foram consideradas as variveis sociais sexo, escolaridade, faixa etria, raa/cor. Todas essas variveis, sabidamente, inuenciam os

inter-relacionamentos entre municpios e causas.

1.3 Justicativa
Tradicionalmente os mtodos de agrupamentos que envolvem elementos espaciais se baseiam em medidas e ponderaes espaciais, como o caso do mtodo de Varredura

Scan para deteco de conglomerados no espao.

Por outro lado, quando o objetivo

so os mtodos de agrupamentos de dados (no espaciais), as principais obras da literatura estatstica apontam, quase sempre, para os procedimentos de agrupamentos rgidos, ou seja, que obrigam que cada item (objeto ou pessoa) pertena a um, e somente um, grupo. Mesmo essas ltimas tcnicas apresentam algumas limitaes, como por exemplo, a manipulao de dados de atributos. Portanto, percebe-se que no existe um mtodo

de agrupamento, digamos, uniformemente melhor, mais eciente e mais verstil que se aplique a todas as situaes prticas. Mas foram as limitaes dos mtodos citados que motivaram a construo de um mtodo de agrupamento capaz de combinar as caractersticas de algoritmos de agrupamento espaciais com a possibilidade de utilizao de um plantel de variveis categricas multidimensionais. O mtodo no faz uso da distribuio geogrca dos elementos espaciais, mas, ainda assim, consegue fornecer respostas muita prximas da tcnica de Varredura Scan, com o atrativo de se basear em conjuntos de dados multivariados com atributos. O mtodo no faz uso da distribuio geogrca dos elementos espaciais, mas, ainda assim, consegue fornecer respostas muita prximas da tcnica de varredura Scan, com o atrativo de se basear em conjuntos de dados multivariados com atributos.

1.4 Motivao

21

1.4 Motivao
Os mtodos de classicao de dados, sejam eles mtodos hierrquicos ou no-hierrquicos, possuem uma losoa de classicao rgida, conhecida na literatura como classicao crisp. Na contramo dessa idia esto os mtodos de aprendizado supervisionado, como o caso dos mtodos nebulosos Fuzzy que relaxam essa losoa de rigidez, permitindo assim, que um indivduo possa pertencer de um cluster ao mesmo tempo. Tendo em vista que uma das metas do trabalho agrupar os municpios paraibanos com as causas de bitos estudadas, parece ser mais realista permitir que um mesmo municpio esteja relacionado com mais de uma causa ao mesmo tempo, de acordo com alguma medida de proximidade. A necessidade de se construir modelos de agrupamentos mais exveis, no sentido de necessitar no utilizar parmetros espaciais foi o grande fator motivador desse trabalho. Um estudo poderia est interessado em agrupar municpios, por exemplo, utilizando dimenses, ou seja, agrupar tais localidades (dentro das causas externas) para certas faixas de PIB (dimenso 1) ou de IDH (dimenso 2), problema este que pode ser difcil tratar com as metodologias clssias de agrupamento de dados.

1.5 Objetivo do trabalho


1.5.1 Objetivo Geral
O objetivo principal desse trabalho desenvolver um modelo de agrupamento hbrido que utilize as tcnicas da Lgica Nebulosa Fuzzy e de Algoritmo Gentico para agrupar os municpios paraibanos dentro das principais causas externas de bitos para os anos de 2006 a 2010.

1.5.2 Objetivos especcos

Avaliar a evoluo das inter-relaes entre municpios e causas externas no perodo de 2006 a 2010;

Estudar as caractersticas analticas do processo de simulao/otimizao;

1.6 Estrutura da monograa

22

1.6 Estrutura da monograa


A monograa apresenta dividida em oito curtos captulos. Tal diviso foi feita visando um melhor entendimento das informaes transmitidas por este trabalho, visando um melhor entendimento dos contedos aqui apresentados. Este primeiro captulo apresenta uma viso supercial do problema que ir ser abordado, apresentando os objetivos a serem alcanados bem como as justicativas da importncia desse problema. O Captulo 2 apresenta uma reviso da literatura em que sero listados os principais trabalhos referentes ao tema abordado, trabalhos estes nas reas de teoria Fuzzy e Algoritmos Genticos. Tambm ser citado nesse captulo alguns autores que trabalharam sobre um mtodo misto utilizando algoritmo Fuzzy Gentico. No Captulo 3 sero abordados alguns conceitos de Anlise Multivarida. Este captulo no tem a pretenso de se aprofundar nesses conceitos, no entanto, serve como um embasamento para o entendimento dos demais captulos. O Captulo 4 apresenta uma introduo Ser feita uma

lgica nebulosa tambm conhecida como lgica Fuzzy ou lgica difusa.

comparao da lgica Fuzzy com a lgica booleana o que ajudara no entendimento das diferenas entre as lgicas. Aps a introduo dos conhecimentos sobre lgica Fuzzy e Ser apresentado o

entender as diferenas entre a lgica clssica para a lgica difusa.

mtodo de agrupamento Fuzzy C-Means. No Captulo 5 sero introduzidos os conceitos de algoritmos evolutivos em especial os algoritmos genticos, em que sero apresentados alguns exemplos que facilitaram o entendimento da teoria evolucionria. No Captulo

6 ser apresentado uma proposta de um modelo Fuzzy C-Means Gentico para agrupamento de dados. Neste Captulo tambm ser apresentado a descrio do problema a ser otimizado, a funo objetivo a ser otimizada, bem como o passo a passo do algoritmo

Fuzzy C-Means Gentico. J no O Captulo 7 apresentar os resultados alcanados com o


mtodo proposto entre os anos de 2006 a 2010. Por m, no Captulo 8 sero apresentados as concluses e perspectivas de trabalho futuros.

23

Reviso da Literatura e Referencial Terico

Os primeiros trabalhos sobre teoria Fuzzy ocorreram nos na segunda metade dos anos 60, em que em 1965 Lotfali Askar Zadeh matemtico do Azerbaijo nascido em 1921 props a lgica difusa, mais conhecida como lgica Fuzzy. O primeiro trabalho sobre a lgica Fuzzy, Fuzzy Sets, foi publicado no volume 8 da revista Information and control nas pginas 338 a 353 no ano de 1965 (43). Trata-se de um artigo que formaliza a

teoria nebulosa em que h toda uma formalizao matemtica dos conceitos da teoria

Fuzzy, em que so denidas a lgebra do conjunto Fuzzy.

Ainda em 1965 Lotfali A.

Zadeh publicou um outro artigo entitulado Fuzzy sets and systems no Jornal Fox de 10 pginas (29-39) (44). At os dias de hoje Zadeh continua publicando trabalhos sobre

teoria Fuzzy, trabalhos estes tericos e aplicados. Atualmente Zadeh est com 89 anos e atua no Departamento de Computao da Universidade da Califrnia, Berkley. Usando os conceitos introduzidos por Zaheh h vrios artigos aplicados utilizando lgica difusa, como o artigo Publicado por Garcia e Filho com o ttulo Desempenho energtico de um sistema de refrigerao aplicando o controle adaptativo Fuzzy em que consideram um sistema de ar condicionado que minimizasse o custo de energia (13). Outros trabalhos que utilizam lgica Fuzzy so: HARRIS C. J., MOORE C. G., BROWN M., Intelligent control: Aspects of Fuzzy Logic and Neural Nets, World Scientic, 1993 (4); KOSKO, BART, Neural networks and Fuzzy systems: a dynamical systems approach to machine intelligence, Prentice-Hall International, 1992 (27), COX E., The Fuzzy Systems Handbook: a Practitioner's Guide to Building, Using and Maintaining Fuzzy Systems, Professional, 1994 (6); PEDRYCZ W., GOMIDE F., Fuzzy Systems Engineering: Toward Human-Centric Computing, Wiley/IEEE Press, 2007 (35). O mtodo de otimizao conhecido como Algoritmo Gentico" foi criado por John Henry Holland. Existem na literatura vrias aplicaes da teoria de algoritmos genticos, dentre esses trabalhos pode-se citar: GOLDBERG D. E. Genetic Algorithms in Search,

2 Reviso da Literatura e Referencial Terico

24

Optimization, and Machine Learning. EUA: Addison-Wesley, 1989, pgina 80 (16), em que discute formas de representao do espao de busca, GOLDBERG D. E. Genetic Algorithms in Search, Optimization, and Machine Learning, EUA: Addison-Wesley, 1989, p. 121, que discute e compara diversas formas de seleo de indivduos (14), GOLDBERG D. E. Genetic Algorithms in Search, Optimization, and Machine Learning. EUA: AddisonWesley, 1989, p. 147 que discute operaes que podem ser aplicadas nos indivduos para a reproduo, dentre outros (15). H vrios artigos sobre algoritmos evolutivos e em especial sobre os algoritmos genticos em lngua portuguesa, dentre esses artigos podemos citar: Algoritmos Genticos: Aplicao Robtica, dissertao defendida por Pires em 1998 na Faculdade de Engenharia da Universidade do Porto (36), GOLDBARG C. Algoritmos evolucionrios na determinao da congurao de custo mnimo de sistemas de co-gerao de energia com base no gs natural, Pesqui. Oper. 25(2): pp. 231-259, 2005 (17); LEITE. Aplicao

de algoritmos genticos na determinao da operao tima de sistemas hidrotrmicos de potncia, Sba Controle & Automao 17(1): pp. 81-88, 2006 (28). Ainda assim na literatura h poucos artigos que combinam algoritmos genticos com a teoria Fuzzy, dentre eles podemos citar KLAWONN F., KELLER A. Fuzzy Clustering with Evolutionary Algorithm, internacional of Intelligent Systems, volume 13,1998 (25). Este artigo apresenta o mtodo uma abordagem da teoria Fuzzy C-Means para identicao de clusters. Uma proposta bem parecida com o tcnica utilizada nessa monograa. Contundo, o artigo prope um mtodo em que os centrides no so denidos a priori. No nosso caso os centrides sero pre-estabelecidos antes mesmo da execuo do mtodo de agrupamento. O autor tambm prope uma abordagem para a construo de agrupamentos usando algoritmos genticos, contudo segundo os autores essa abordabem no promissora devido a caracterstica do espao paramtrico em que a funo objetivo varia ser bastante complicado. Pode-se citar tambm LIU H. C., JEAG B. C.,YU Y. K. Fuzzy C-Means Algorithm Based on Standard Mahalanobis Distances, International Symposium on Information Processing, China, 2009, pp. 422-427, em que os autores trazem algumas modicaes do Os autores propuseram uma metodologia de agrupa-

algoritmos Fuzzy C-Means (29).

mento Fuzzy utilizando a distncia de Mahalanobis, ao invs das distncias euclidianas. Um outro trabalho relevante o trabalho publicado por NUOVO A. G., CATANIA V., PALESI M. The Hybrid Genetic Fuzzy C-Means: a Reasoned Implementation, International Conference on Fuzzy Systems, Cavtat, Croatia, 2006, pp 33-38 (32). Neste artigo

2 Reviso da Literatura e Referencial Terico

25

apresentada uma abordagem hbrida que integram Fuzzy C-Means (FCM) e algoritmos Algoritmos Genticos (AGs) para projetar um classicador timo para o problema de classicao especca. Essa integrao permite a gerao automtica de um sistema de classicao, com um subconjunto de funcionalidades otimizadas, a partir de um banco de dados de exemplos. Segundo os autores o classicador gerado supera o algoritmo FCM clssico.

26

Anlise Multivariada de Dados

 A cincia se compe de erros que, por sua vez, so os passos at a verdade 

Jules Verne

3.1 Introduo
A estatstica multivariada lida com problemas em que se observa vrias medidas sobre um mesmo item (pessoa ou objeto). Na verdade, as principais principais idias da

Anlise Multivariada surgiram a partir da generalizao de tcnicas univariadas. Segundo Furtado(2008) a necessidade de compreenso das relaes entre as diversas variveis, de maneira conjunta faz com que as anlises multivariadas sejam complexas ou at mesmo difceis. E, talvez, por isso, sejam, ainda, to pouco utilizadas como ferramenta estatstica. Em geral, os objetivos para os quais a anlise multivariada se presta so:

Compreenso analtica conjunta das inter-relaes existentes entre as diversas variveisresposta;

Reduo da massa de dados conservando o mximo de informao original possvel; Agrupamento de tens similares baseados em dados amostrais ou experimentais; Investigao de inter-dependncias entre as variveis objetos de estudo, buscando, para isso, identicar relaes estruturais;

Predio com base no relacionamento das variveis consideradas.

A anlise multivariada de dados vem sendo amplamente utilizada por vrias reas do conhecimento. Em estudos da rea mdica, por exemplo, tcnicas multivariadas podem ser implementadas para criar uma funo que separe pessoas doentes e no doentes considerando algumas caracterstica. Em estudos de pesquisa de mercado, muitas empresas

3.1 Introduo

27

tentam traar o perl scio-econmico de seus clientes em busca de identicar grupos diferenciados de consumo. Os dados multivariados provm de estudos em que so selecionadas

p 1 variveis ou

caractersticas para serem mensuradas. Entretanto, alguns pesquisadores denem anlise multivariada como sendo exames de relaes entre mais de duas variveis. A representao das informaes multivariadas dada por amostral ou experimental de uma Dessa forma as medidas das

xmn

que indica o valor da

m-sima

unidade

n-sima

varivel mensurada.

variveis em

unidades amostrais ou experimentais

podem ser representadas pela matriz

X
~

logo abaixo.

x11

x12

x1j

x1n

x 21 x22 x2j x2n . . . . . .. . . . . . . . . . . . X= xi1 xi2 x1j x1n ~ . . . . . .. . . . . . . . . . . . xm1 xm2 xmj xmn

Outros autores preferem denir a anlise multivariada como uma tcnica adequada estudar problemas nos quais todas as mltiplas variveis so assumidas como tendo uma distribuio normal multivariada, como apresentada pela equao 3.1.

f (x) =
onde

1 (2) ||
~
p 2 1 2

[ 1 (X )t 2 ~ ~ ~

(X )] ~ ~ ,

(3.1)

medida de similaridade ponderada pela covari~ ~ ~ ~ ~ ncia entre os elementos e ser discutida rapidamente na Seo 3.2. Os valores e so ~ ~ o vetor de mdia e matriz de covarincia populacional respectivamente. Os estimadores do vetor de mdia e matriz de covarincia populacional sero representados da forma que segue (11).

(X )t 1 (X ) representa uma

X1 X2 X= . . ~ . Xp

3.2 Medidas de similaridade


S11 S12 . . . S1p S21 S22 . . . S2p S= . . . .. . . . . . . . Sp1 Sp2 . . . Spp

28

3.2 Medidas de similaridade


A maioria dos esforos dispendidos na produo de uma estrutura grupal simples, a partir de um conjunto de dados complexo, requer medidas de proximidade ou similaridade. O que se sabe que existe sempre um elevado grau de subjetividade no que tange escolha de uma medida de similaridade. Consideraes importantes como a natureza das variveis (discreta, contnua, binria), as escalas de medida (nominal, ordinal, intervalo) e o conhecimento especco do assunto em questo devem ser considerados. Quando tens (unidades, casos ou indivduos) so agrupados, sua proximidade indicada por algum tipo de distncia. Por outro lado, as variveis so agrupadas baseadas no seu coeciente de correlao ou outras medidas estatsticas de associao. Nas Sees 3.2.1 e 3.2.2 sero discutidos os conceitos das principais medidas de similaridades(22).

3.2.1 Covarincia e Correlao


a matriz de covarincia ~ medida de associao pode ser obtida pela expresso abaixo: A partir da matriz de dados

X(m n)

C,

sendo esta uma

cjk =

1 m1

(xjk xj )(xjk xj )
i=1

(3.2)

Atravs da matriz de covarincia pode-se calcular a matriz de correlao elemento da matriz dado por

R,

em que cada

rjk =

cjk , em que sj sk

sj sk

so os desvios padres das variveis

(22).

3.2.2 Medidas de distncias


Nos mtodos de agrupamentos, a similaridade entre amostras so expressas, em geral, por uma funo de distncia entre dois pontos representativos da amostra no espao n-dimensional. A forma mais usual para o clculo das distncia entre dois pontos

conhecida como distncia Euclidiana, denida como segue para dois pontos

no

3.3 Anlise de Correspondncia


espao n-dimensional.

29

ab

=
j=1

(daj dbj )2

(3.3)

Existem outras medidas de distncia comumente utilizadas em diversos mtodos de agrupamentos,entre elas esto as distncias de Mahalanobis e de Manhattan.

Distncia Euclidiana
A distncia Euclidiana ou distncia mtrica a distncia entre dois pontos que pode ser demonstrada pela aplicao repetida do teorema de Pitgoras. Ao aplicar o teorema de Pitgoras como distncia, o espao euclidiano torna-se um espao mtrico. A distncia Euclidiana, em sua forma mais geral, denida como:

(p1 q1

)2

+ (p2 q2

)2

+ + (pn qn

)2

=
i=1

(pi qi )2

Distncia de Mahalanobis
A distncia de Mahalanobis uma medida alternativa que agrega a informao das covarincias entre as variveis ao seu clculo. O clculo dessa distncia bastante simples e pode ser obtido pela expresso abaixo.

d(X 1 , X 2 ) =
~ ~ em que

(X 1 X 2 )t S 1 (X 1 X 2 ),
~ ~ ~ ~

a inversa da matriz se varincia e covarincia amostral.

3.3 Anlise de Correspondncia


A Anlise de Correspondncia (AC) uma metodologia multivariada baseada numa abordagem composicional e que normalmente utilizada para mapear as percepes observadas entre as categorias de uma tabela de contingncia. A expresso Mapa Perceptual designa uma tcnica de marketing importada do campo da psicologia e que parte do princpio de que os consumidores constroem uma imagem do produto com base em caractersticas especcas, nos seus benefcios ou no seu preo. Dessa

3.3 Anlise de Correspondncia

30

forma, possvel posicionar os produtos em um mapa ou grco em que cruzam-se duas variveis. Em outras palavras, um mapa perceptual reete uma espcie de representao visual de percepes que um respondente tem sobre objetos em duas ou mais dimenses. Cada objeto tem uma posio especial no mapa perceptual que est associado a uma similaridade ou preferncia relativa a outros objetos no que se refere s dimenses do mapa perceptual. A maioria das aplicaes da AC envolve um conjunto de objetos e

atributos em que os resultados so congurados em um mapa perceptual comum. As primeiras consideraes matemticas a respeito da Anlise de Correspondncia foram feitas por Hirshfeld em 1935. Alguns autores denem Anlise de Correspondncia como um mtodo de anlise fatorial para variveis categricas. A AC foi primeiramente utilizada, por Fisher (1940) para a anlise de tabelas de contingncia posteriormente foi redescoberta na Frana por Benzecri em 1969. Atualmente a tcnica Anlise de Correspondncia tem sido extremamente empregada em diversas reas do conhecimento, com uma nfase maior para as reas de Psicologia, Psiquiatria, Neurocincias e Datamining. em que tem sido extremamente usado naquele pas como um mtodo estatstico no processo de Data Mining. A partir de 1975, a tcnica de Anlise de Correspondncia vem sendo utilizada em diversas reas do conhecimento, em publicaes em diversos idiomas (20). Uma aplicao comum da metodologia de Anlise de Correspondncia tem sido na reduo dimensionalidade dos dados, obtidas atravs do mapeamento perceptual das relaes de inter-dependncia de informaes amostrais que, na maioria das vezes, representam dados no-mtricos. Tal mtodo tambm conhecido como escalonamento ou escore timo, mdia recproca ou anlise de homogeneidade. A proximidade entre os objetos no grco indica o nvel de associao entre tais objetos no mbito amostral. O mtodo AC difere de outras tcnicas de escalonamento multidimensional em sua habilidade de acomodar tanto dados no-mtricos quanto relaes no lineares. As trs principais caractersticas que diferem a Anlise de Correspondncia dos outros mtodos de escalonamento multidimensional so:

uma tcnica composicional, e no decomposicional, porque o mapa perceptual baseado na associao entre objetos e um conjunto de caractersticas descritivas ou atributos especicados pelo pesquisador.

Sua aplicao mais direta na retratao da correspondncia de categorias de variveis, particularmente quelas medidas em escalas nominais. Tal correspondncia

3.3 Anlise de Correspondncia


, desse modo, a base para o desenvolvimento de mapas perceptuais.

31

Os principais benefcios da AC residem em sua habilidade para representar linhas e colunas em um espao conjunto.

Na AC, uma decomposio dos dados obtida para se estudar a estrutura dos mesmos sem que um modelo seja hipotetizado ou que uma distribuio de probabilidade tenha sido assumida, o que uma grande vantagem. Outro aspecto, discutido por Von der

Heizden et all (1989), que a anlise de correspondncia, geralmente, introduzida sem qualquer tratamento estatstico prvio, para dados categricos, o que prova sua utilidade e exibilidade. Em consequncia disso, os testes estatsticos infernciais clssicos, em sua maioria, no so aplicveis, estando a soluo sugerida apenas pela distribuio grca de seus resultados (1). tambm, um meio de criar conguraes representando as linhas da tabela por pontos no espao, tal que a distncia Euclidiana entre os pontos na congurao seja igual a distncia qui-quadrado calculadas entre as linhas da tabela. O nico pressuposto a ser respeitado que os dados sejam uma matriz retangular de entradas no negativas. O tipo mais comum de matriz de entrada uma tabela Para o caso de

contingncia com categorias especcas denindo as linhas e colunas.

Anlise de Correspondncia Simples temos uma tabela de dupla entrada sendo essa a forma mais simples de AC. A Tabela 2 abaixo apresenta a estrutura do banco de dados em uma Anlise de Correspondncia Simples. Tabela 2: Estrutura dos dados para Anlise de Correspondncia. B A 1 2 . . . i . . . I Total Coluna 1 2 ... j ... J Total Linha

n11 n21
. . .

n12 n22
. . .


. . .

n1j n2j
. . .


. . .

n1J n2J
. . .

n1+ n2+
. . .

ni1
. . .

ni2
. . .

. . .

nij
. . .

. . .

niJ
. . .

ni+
. . .

nI1 n+1

nI2 n+2

nIj n+j

nIJ n+J

nI+
N

onde temos que:

nij
a

a frequncia observada pela interseco da i-sima categoria da varivel A com categoria da varivel B;

j -sima

3.3 Anlise de Correspondncia


ni+ n+j n
a frequncia total observada na a frequncia total observada na

32

i-sima j -sima

categoria de A; categoria de B;

o total geral de frequncias observadas.

Seja

a matriz de frequncias absolutas, ou seja, temos que A matriz de frequncias relativas ser

N = [nij ]IxJ P

gerada

a partir da Tabela 2.

P =

1 N e chamada de n
pode ser

matriz de correspondncia, em que cada linha ou coluna da matriz retangular


considerada um vetor de propores. Tabela 3: Tabela de Correspondncia. B A 1 2 . . . i . . . I Total Coluna 1 2 ... j ... J Total Linha

p11 p21
. . .

p12 p22
. . .


. . .

p1j p2j
. . .


. . .

p1J p2J
. . .

p1+ p2+
. . .

pi1
. . .

pi2
. . .

. . .

pij
. . .

. . .

piJ
. . .

pi+
. . .

pI1 p+1
ni+ e n

pI2 p+2 p+j =


n+j . n

pIj p+j

pIJ p+J

pI+
1

em que

pij =

nij , n

pi+ =

Da Tabela 3 os vetores de frequncias relativas marginais so denominado massas e so calculado em relao ao total geral

n.

Dessa forma, temos que a massa da i-sima linha

ni+ e a massa da n

j -sima coluna denido por


e

nj+ . Com as massas calculadas para linhas n

e colunas podemos denir os vetores de massas em que

c para linha e coluna respectivamente,

r = [p1+ , p2+ , , pi+ , , pI+ ]


niJ ni1 ai = [ ni+ , ni2 , , ni+ ]t ni

c = [p+1 , p+2 , , p+j , , p+J ].

O vetor

denido como perl de linha. Em funo da matriz

de correspondncia Cada vetor perl

P,

i-simo

perl linha ser

piJ pi1 ai = [ pi+ , pi2 , , pi+ ]t , i = 1, 2, , I . pi

ai

representa uma realizao da distribuio multinomial condicionada

i-sima

categoria da varivel A.
1j 2j Ij 1j 2j Ij = [ n+j , n+j , , n+j ] = [ p+j , p+j , , p+j ] ,

De forma anloga tambm denido um vetor bj

j = 1, 2, , J ,

chamado de perl coluna. Com os valores

ai

so denidas as distncias

entre pers linha utilizando a mtrica Euclidiana ponderada, tambm conhecida como distncia qui-quadrado, denida abaixo:

dc (ai , ai t ) = (ai , ai t )Dc 1 (ai , ai ) =


j=1

ij ( ni+

nit j 2 ) nit +

n+j n

(3.4)

3.4 Anlise de Agrupamentos


ou seja, por

33

dc (ai , ai t )

trata-se da distncia qui-quadrado entre os vetores

ai

ai t

ponderada O vetor

Dc

sendo esta uma matriz diagonal de elementos

cj =

n+j n

j = 1, 2, , J .

formado pelas massas de coluna (propores marginais de colunas)

c = [c1 , c2 , , cJ ]t Dr

tambm chamado de perl linha mdio ou centride dos pers linha. De forma anloga, as distncias qui-quadrado entre pers colunas so obtidas na mtrica diagonal das propores marginais de linha que uma matriz

ri =

ni+ i n

= 1, 2, , I ,

que compe o vetor

denominado centrides dos pers coluna ou vetor massa de linhas (18).

3.4 Anlise de Agrupamentos


A Anlise de Agrupamento tambm conhecida como cluster Analysis constitui um conjunto de tcnicas estatsticas voltadas para o agrupamento de observaes (ou de variveis), de modo que as observaes contidas em um mesmo grupo sejam similares entre si (em algum sentido) e as observaes pertencentes a grupos distintos sejam dissimilares entre si. A Anlise de Agrupamento, nesse sentido, representa uma tcnica de aprendizagem no supervisionada, ou seja, o prprio procedimento que gera os grupos aprende e decide sozinho (da o termo no supervisionado) para quais conglomerados recebero as diversas observaes. Por esse motivo, essa metodologia vem sendo aplicada nos mais variados campos da cincia, como nas reas de minerao de dados, de aprendizagem de mquina, de reconhecimento de padres, de anlise de imagens, na bioinformtica, dentre outras. Na literatura, algoritmos so utilizados para formar os agrupamentos, cada um deles se vale dos mais variados critrios para construir os grupos (11). Ainda assim, os mtodos de agrupamento, em sua essncia, buscam agrupar uma massa de dados em classes de elementos similares seguindo regras especcas para tais classicaes (3). Alm disso,

por ser uma tcnica de aprendizagem no supervisionada a Anlise de Agrupamentos no considera um nmero de grupos xo e realizada com base na similaridade ou dissimilaridade entre as observaes. No geral, os mtodos de agrupamento de dados utilizam como medidas de similaridades as mais variadas mtricas de distncias entre pontos, como distncias Euclidianas, Mahalanobis, Manhattan, dentre outras (21). Dentre os principais mtodos de agrupamento de dados, se pode citar a classe dos mtodos hierrquicos e no-hierrquicos. Os mtodos de agrupamentos hierrquicos cria uma hierarquia de agrupamentos que podem ser representadas em uma estrutura de rvore, chamada de Dendograma. As razes contm um nico agrupamento com todas as

3.4 Anlise de Agrupamentos

34

observaes e as folhas correspondem s observaes individuais. Os agrupamentos hierrquicos so realizados por sucessivas fuses ou sucessivas divises. Dentro desse sistema de hierarquias, os procedimentos de agrupamentos aglomerativos iniciam-se com tantos grupos quanto forem os objetos, ou seja, cada objeto forma um grupo. Dessa forma, os objetos mais similares so agrupados e fundidos sequencialmente at formar um grupo nico contendo todos os objetos. J os mtodos hierrquicos divisivos trabalham no sentido inverso, ou seja, o processo inicia com um nico grupo contendo todos os objetos e, sucessivamente, esse grupo vai sendo subdividido em grupos cada vez menores at que haja tantos grupos quantos forem o nmero de objetos existentes na amostra. Por outro lado os mtodos no hierrquicos tm o objetivo de particionar os dos em

objetos considera-

grupos distintos. Tais mtodos necessitam de uma pr-xao de critrios que

produzam medidas sobre a qualidade das parties que sero originadas. Dessa forma, os mtodos no hierrquicos produzem parties num nmero xo de classes, ou seja, h que se escolher o nmero de agrupamentos priori. Um dos mtodos no hierrquicos mais utilizados o mtodo das k-mdias (22). Os mtodos clssicos de agrupamento de dados so bastante rgidos na construo dos agrupamentos, ou seja, se so identicados a um, e somente um, dos

n tens, cada um desses tens dever pertencer


Para situaes prticas em que

grupos preestabelecidos.

a noo de rigidez precisa ser relaxada, isto , que se permita a um determinado item pertencer a um ou mais grupos ao mesmo tempo, os mtodos que utilizam a lgica nebulosa

Fuzzy so de especial interesse. Na prtica, a idia da lgica nebulosa Fuzzy consiste na


possibilidade de permitir que, um anfbio, por exemplo, seja classicado com um animal aqutico e terrestre ao mesmo tempo, apresentando as caractersticas semelhantes ambos os grupos. em que dessa forma no perdemos a noo de interseco que poderia ofuscar de alguma forma a realidade. Para problemas em que a noo dessas interseco so necessrias, os mtodos Fuzzy de agrupamentos de dados so interessantes para soluo desses problemas. Na prtica, a separao dos agrupamentos uma noo Fuzzy (nebulosa),

por exemplo, se um anfbio um animal que tem caractersticas de animais aquticos e terrestres, portanto, vai apresentar caractersticas semelhantes ambos os grupos. O conceito de conjunto Fuzzy proporciona a vantagem de expressar esse tipo de situao em que um indivduo compartilha similaridade com vrios grupos atravs da possibilidade de um algoritmo associar cada indivduo parcialmente a todos os grupos (29)(12).Essa metodologia ser discutida com mais detalhes na seo que segue.

35

Introduo Teoria Fuzzy

4.1 Teoria Fuzzy


4.1.1 Histrico e conceitos iniciais
Na dcada de 60, um professor de engenharia eltrica e cincias da computao, chamado Lot Zadeh (1965) desenvolveu uma variao da tradicional teoria dos conjuntos e lgica booleana para tornar a anlise e controle de sistemas complexos de controle mais tratveis. Ele observou que as regras que as pessoas usavam para fazer inferncias no eram consistentes, ou seja, no podiam ser explicadas pelas pessoas que as usavam. Por exemplo, podemos olhar uma pessoa e dizer ela parece ter por volta de 40 anos de idade mas no se est preparado para explicar como sabemos disso. A idia de Zadeh o levou a desenvolver o que conhecido como lgica Fuzzy. A pesar de ter sido criticada inicialmente, a lgica Fuzzy acabou sendo bem aceita por engenheiros e cientistas da computao, tornando-se comuns as suas aplicaes. Desde a publicao do conceito de lgica Fuzzy em 1965, houveram muitas aplicaes do conceito de lgica nebulosa como em 1980, no controle Fuzzy de operao de um forno de cimento. Em seguida vieram vrias outras aplicaes como o controle Fuzzy de plantas nucleares, renarias, processos biolgicos e qumicos, trocador de calor, mquina diesel, tratamento de gua e sistemas de operao automtica de trens. Do comeo da cincia moderna at o m do sculo XX as incertezas eram, em geral, indesejveis em qualquer estudo ou experimento, sendo, portanto, sempre evitada. Com o passar dos anos, essa atitude foi gradativamente mudando com o desenvolvimento da estatstica e dos mecanismos estatsticos. Para lidar com grandes complexidades mecnicos, no nvel molecular, diversos mecanismos estatsticos eram utilizados com sucesso em vrias reas da cincia e, essencialmente, empregavam o clculo de mdias e teoria de probabilidade. Contudo, a teoria probabilstica no era capaz de agregar altos nveis de certezas" em todas suas manifestaes (8). Em particular a teoria probabilstica inca-

4.1 Teoria Fuzzy

36

paz de tratar a incerteza resultante dos termos da linguagem natural vagos. [Mukaidono, 2001] deu um exemplo disso com a palavra meia-idade. comum classicar uma pessoa de meia idade ou no, apesar de no se saber exatamente quando se comea ou termina o perodo considerado meia-idade. Considere, a ttulo de exemplo, que o perodo de meia idade compreende o intervalo fechado

I = [35, 55]

anos. Usando a lgica tradicional, uma

pessoa de 34 anos de idade s pode pertencer ao intervalo

I,

ou seja, ao grupo de pessoa

de meia-idade depois do dia de seu aniversrio de 35 anos. De mesmo modo uma pessoa de 56 anos no pertence mais esse grupo. Contudo, tamanha preciso no desejada em relao a este conceito, dados que os limites do intervalo

no podem ser denidos

precisamente. Na verdade a nica idia que se tem uma idia vaga a respeito dos limites do intervalo de meia-idade (40). Pelo exemplo de incerteza do conceito de meia idade foi possvel perceber que a lgica tradicional impe limites bruscos ao contrrio da lgica Fuzzy que no impe limites to rspidos, proporcionando graus de pertinncias de elementos a uma determinada categoria. Dessa forma, a lgica Fuzzy capaz de capturar informaes vagas, em geral descrita em linguagem natural e convert-las para um formato numrico e de fcil manipulao.

4.1.2 Comparao entre Lgica Fuzzy, Lgica Booleana e Probabilidade


O lsofo grego Aristteles, aluno de Plato e professor de Alexandre o Grande (384 - 322 a.C.), foi o fundador da cincia da lgica onde estabeleceu um conjunto de regras rgidas para que concluses pudessem ser tomadas utilizando de tais regras. O emprego da lgica de Aristteles leva a uma linha de raciocnio lgico baseado em premissas e concluses binrias, ou seja, uma concluso ou verdadeira ou falsa. A lgica nebulosa permite uma transio gradual de uma proposio dentre os conjuntos a que esta proposio pode pertencer atravs da associao de graus de pertinncias desta aos conjuntos analisados. Dessa forma a lgica Fuzzy permite a dualidade estabelecendo que algo pode coexistir com seu oposto (44). A teoria probabilista e lgica nebulosa podem ser utilizadas para mensurar incertezas. O que diferencia a probabilidade da lgica Fuzzy dizendo que a teoria probabilista lida com a expectativa de eventos futuros, baseados em fatores conhecidos. O senso de incerteza se refere predio de ocorrncia de um evento. O senso de incerteza representado pela lgica Fuzzy se resulta da impreciso do signicado de um conceito expresso em lgica natural, em que dessa forma estamos comparando um indivduo e um dado conceito

4.1 Teoria Fuzzy


impreciso. (8)

37

4.1.3 Componente da Teoria dos Conjuntos Fuzzy


4.1.3.1 Variveis lingusticas

Uma grande vantagem do uso da lgica Fuzzy a possibilidade de transformar a linguagem natural em conjuntos numricos, permitindo dessa forma a manipulao computacional. Zedeh deniu variveis lingusticas como variveis nas quais os valores so palavras ou sentenas em linguagem natural ou articial. As variveis lingusticas assumem valores denominados lingusticos, como por exemplo baixo, mdio, alto referente a varivel altura.

I1 (x) =

1
35x 15

para para para

x 20 20 < x < 35 x 35
ou

0 0

I2 (x) =

para para para para

x 20

x 60

x20 15 60x 15

20 < x < 35 45 < x < 60 35 x 45 x 45 45 < x < 60 x 60

0
x45 15

para para para

I3 (x) =

As funes apresentadas acima podem ser observada na Figura 1. Podemos observar que a funo em questo apresenta uma forma triangular, no entanto a funo de pertinncia poderia assumir outras estruturas como Linear, Trapezoidal, Formato S, Formato Z, Gaussiana, Irregular dentre outras, sendo essas formas padres denidas na literatura que as funo de pertinncias podem assumir, podendo tambm ser denida pelo usurio.

4.1 Teoria Fuzzy

38

Figura 1: Grco da funo de pertinncia para a varivel lingustica meia-idade.

4.1.3.2

Funes de Pertinncias

Um subconjunto Fuzzy A denido em termos de relevncia um conjunto universal

U, x

por uma funo denominada de funo de pertinncia, associando a cada elemento

um nmero,

A (x)

no intervalo

[0, 1].

Essa funo, portanto, caracteriza o grau de

pertinncia de

x em A.

Dessa forma um elemento pertence a um conjunto em uma escala A funo de pertinncia apresentada abaixo e em seguida

que varia no intervalo

[0, 1].

ser denido o conceito de conjunto Fuzzy (43).

A : U [0, 1]

Denio 4.1.1.
U [0, 1], (x) [0, 1]
de

Um subconjunto Fuzzy

de

U x

caracterizado por uma funo

:
com

chamada funo de pertinncia do conjunto Fuzzy F. Dessa forma, o valor indica o grau com que o elemento de

est no conjunto Fuzzy

F,

(x) = 0 e (x) = 1 indicando, x


ao conjunto Fuzzy

respectivamente, a no pertinncia e pertinncia completa

F.

Do ponto de vista formal, a denio de um subconjunto Fuzzy foi obtida simplesmente aplicando-se o contra-domnio da funo caractersticas, que o conjunto para o intervalo

{0, 1},

[0, 1].

Nesse sentido, podemos dizer que um conjunto clssico um caso

particular de conjunto Fuzzy. Por exemplo, considere o conjunto Esse conjunto, tem funo caracterstica par.

dos nmeros pares. se

Cp (n) = 1

se

par e

Cp (n) = 0 F

m-

Portanto o conjunto dos nmeros pares um particular conjunto (44). A critrio de exemplo considere o subconjunto Fuzzy

F uzzy

j que

Cp (n) [0, 1]

dos nmeros

naturais pequenos, ou seja,

denido da forma que segue:

F = {n N : n

pequeno }

4.2 Mtodo Fuzzy C-Means

39

O nmero 0(zero) pertence pertence a esse conjunto? E o nmero 1000? Usando a teoria Fuzzy, poderamos dizer ambos pertencem

porm com diferentes graus de per-

tinncia de acordo com a propriedade que o caracteriza. Ou seja, a funo de pertinncia de

deve ser construda de forma coerente com o termo pequeno que caracteriza seus

elementos no conjunto universo dos nmeros naturais. Uma possvel funo de pertinncia para o subconjunto Fuzzy

(n) =
Se a funo de pertinncia ao subconjunto

1 n+1

(n) for o caso, se pode dizer que o nmero 0(zero) pertence (0) = 1, enquanto o nmero 1000 pertence (1000) = 0, 0011.
Neste caso, a

com um grau de pertinncia

ao subconjunto Fuzzy funo de pertinncia

com um grau de pertinncia

(n)

foi escolhida de maneira totalmente arbitrria, podendo ser

qualquer outra funo denida pelo usurio.

4.2 Mtodo Fuzzy C-Means


O algoritmo de agrupamento Fuzzy mais conhecido o Fuzzy C-Means (FCM) que uma modicao proposta por Jim Bezdek (1981) de uma metodologia de agrupamento

crisp. O algoritmo nebuloso Fuzzy c-means o mtodo de agrupamento mais utilizado por
ser simples de ser implementado, o mais rpida execuo e por no inigir restries ao conjunto de dados (39). O algoritmo melhor que o mtodo k-means que um algoritmo

hard pois o algoritmo Fuzzy C-means evita mnimos locais. O mtodo trata-se de uma
verso nebulosa do mtodo de agrupamento rgido k-means, sendo usado classicar um universo de amostras em categorias nebulosas de acordo com sua disposio no espao euclidiano. Bezdek introduziu a idia de um parmetro de fuzzicao (m ) no intervalo

[1, n],
temos

que determina o grau de fuzicao (fuziness ) nos agrupamentos, ou seja, para o efeito uma agrupamento crisp dos elementos aos clusters. Porm, quando

m = 1

m > 1,

o grau de fuzzicao entre pontos no espao de deciso aumenta (29)(3).

O algoritmo do mtodo Fuzzy C-means se divide em dois procedimentos onde o primeiro consiste em calcular os centros de cada grupo e a atribuio de pontos estes centros utilizando uma forma de distncia euclidiana. Este processo se repete at que os centros dos agrupamentos tenha se estabilizados. Supondo que tem-se um conjuntos de indivduos vduo

X = {x1 , x2 , , xn }, onde cada indiC = {C1 , C2 , , Cn }.

xk

, k = 1, , n,

e deseja-se organiz-los em c grupos,

4.2 Mtodo Fuzzy C-Means

40

O algoritmo de agrupamento FCM um algoritmo no hierrquico cujo objetivo fornecer uma partio Fuzzy de um conjunto de indivduos homogneos em c agrupamentos. Para a construo dos c grupos o FCM dene e minimiza uma funo objetivo, funo esta que mede a adequao entre os indivduos e agrupamentos. A funo objetivo denida abaixo:

J(U, G) =
k=1 i=1

(uik ) (xk , gi ) =
k=1 i=1 p

(uik )

m l=1

(xkl gil )2

(4.1)

(xk , gi ) =
l=1
onde

(xkl gil )2

(4.2)

U M = G=

matriz de pertinncia

{uik }

do indivduo

ao cluster

Ci ;

vetor de prottipos de clusters ou centrides

(g1 , g2 , , gk ), gi = (gi1 , , gip );

m ]1, +[= um parmetro que controla a (fuzzines ) da pertinncia dos indivduos; (xk , gi ) =
o quadrado da distncia

L2

Minkowsky, ou Euclidiana, a qual mede a

dissimilaridade entre um indivduo

e um prottipo de cluster i.

Proposio 4.2.1.
que segue:

Sejam os prottipos

gi = (gi1 , , gip ) do cluster Ci (i = 1, , c), eles


e so atualizados de acordo com a expresso

minimizam o critrio de clustering

J(U, G)

(uik )m xkl gil =


k=1 n

, l = 1, 2, , p (uik )m

(4.3)

k=1
Prova: Uma vez que, no passo de representao, a pertinncia de cada indivduo

no

cluster

Ci ,

o parmetro

esto xos, pode-se reescrever o critrio

J(U, G)

como:

Jil (gil )
i=1 d=1
onde:

Jil (gil ) =
k=1

= (uik )m (xkl gil )2

4.2 Mtodo Fuzzy C-Means


, O critrio

41

J(U, G) aditivo e desta forma o problema torna-se achar o gil que minimize
dJil (gil ) dgil

Jil (gil ).

Logo, a soluo deste problema resolver a equao

= 0.

Dessa forma

temos que:

dJil (gil ) d =0 dgil dgil


O resultado acima leva a

(uik ) (xkl gil )


k=1

k=1

(uik )m (xkl gil ) = 0

(uik )m xkl gil =


k=1 n

(uik )m
k=1
O resultado at agora mostra que atualizando-se ponto extremo de

gil

pela Equao 4.3 obtm-se um

Jil (gil ).

Para concluir se este um ponto de mnimo usaremos o teste

da segunda derivada.

d2 Jil (gil ) d (uik )m > 0 (uik )m (xkl gil ) = 2 = 2 2 d(gil ) d(gil ) k=1 k=1
Como a segunda derivada de se

Jil (gil ) positiva, pode-se ento concluir que calculandoJil (gil ). uik
de cada indivduo

gil

conforme a Equao 4.3 minimiza

Proposio 4.2.2.
i(i = 1, , c),
c

Seja a pertinncia

k(k = 1, , n)

ao cluster

ela minimiza o critrio clustering

J(U, G)

sob as seguintes restries

uik 0

e
i=1

uik = 1

e atualizada de acordo com expresso a seguir:

c uik = h=1

l=1

1 m1 1 (xkl gil )2 l=1 , i = 1, , c; k = 1, , n. p (xkl ghl )2

(4.4)

Prova: Considere que no passo de alocao, os prottipos e o parmetro m esto xos. Uma vez que independentes e a minimizao de

gi

do cluster

Ci , (i = 1, , c),

U uk

uma matriz degenerada, suas colunas so

J(U, G)

pode ser obtida aplicando-se o mtodo dos . Seja a funo

multiplicadores de Lagrange a cada termo

(uk ):

4.2 Mtodo Fuzzy C-Means


c p

42

(uk ) =
i=1
minimizar

(uik )m
l=1

(xkl gil )2
sob a restrio

J(U, G)

implica em minimizar

(uk )

c i=1

uik = 1.

Seja o lagrangiano de

(uk ):
c p c

F (, uk ) =
i=1
O par

(uik )

m l=1

(xkl gil ) (
i=1

(uik )m 1) F , F ,
for zero.

(, uk )

estacionrio para a funo

se o gradiente de

Igualando o gradiente de

igual a zero, tem-se:

F (, uk ) = ( (uik )m 1) = 0 i=1 F (, uk ) = m(uik )m1 uik


A partir da Equao 4.6, obtm-se:

(4.5)

(xkl gil )2 = 0
l=1

(4.6)

uik =
p

1 m1

m
l=1

2 (xkl gil )

(4.7)

Usando o resultado da Equao 4.5 na Equao 4.6, obtm-se:

c c

1 m1

uhk =
h=1 h=1

1 m1

2 (xkl ghl ) 1

l=1

1 m1

c p

h=1

l=1

1 m1 1 =1 (xkl ghl )2

Deste resultado conclui-se:

4.2 Mtodo Fuzzy C-Means

43

1 m1

1
c
m1 1 2 (xkl ghl ) 1

h=1

Aplicando o resultado acima na Equao 4.7, tem-se:

uik =

1 1
p l=1 (xkl

h=1

ghl )2 1

1 m1

2 (xkl gil ) 1

l=1

=
c

1 m1

(xkl gil )2 l=1 p h=1 (xkl ghl )


l=1 c p 2 d=1 (xkl gil ) p 2 d=1 (xkl ghd )
1 m1

=
h=1
para

i = 1, , c; k = 1, , n. uik
pela Equao 4.4leva a um

O resultado acima permite concluir que calculando-se valor extremo de

J(U, G).

Usar-se- o teste da segunda derivada para vericar se esta

mesma expresso um mnimo da funo objetivo. Minimizar de

(uk )

leva minimizao

J(U, G).

J foi encontrado um valor extremo

(uk )

e consequentemente para

J(U, G)

sob a restrio mnimo.

c i=1

uik = 1.

Pelo teste da segunda derivada da funo

(uk ) se este valor

(uk ) = [m(uik )m1 (xkl gil )2 ] uik d=1 2 (uk ) = [m(m 1)(uik )m2 (xkl gil )2 ] 2 (uik ) d=1
Note que:

2 (uk ) = 0, z = w uzk uwk

4.2 Mtodo Fuzzy C-Means


Esse fato leva a matriz Hessiana de

44

(uk )

ser denida da seguinte forma:

A matriz

H((uk ))

uma matriz diagonal com todos elementos positivos. Este fato denida positiva e portanto isto implica que atualizar

permite concluir que

H((uk ))

uik

pela Equao 4.4 leva a um valor mnimo da funo objetivo

J(U, G)

(3).

45

Introduo aos Algoritmos Genticos

5.1 Algoritmo Evolutivo


Algoritmos evolutivos so procedimentos baseados em mecanismos da evoluo biolgica e servem para originar conceitos um pouco mais recentes, como o dos Algoritmos Genticos. A motivao para a construo de tais modelos computacionais surgiu de

teorias atravs das quais a Natureza, por meio de seus recursos, resolveu problemas de grande complexidade. Assim pode-se dizer que a natureza otimiza seus mecanismos para resolver um ou mais problemas. A partir de um problema de otimizao, mesmo que se desconhea o que se est otimizando, possvel encontrar uma soluo tima, ou no mnimo, uma boa soluo, atravs dos Algoritmos Evolutivos e suas variaes. Em resumo, tais algoritmos podem trabalhar em cima de problemas, sem que exista um conhecimento explicito, sobre as suas solues timas. Os Algoritmos Evolutivos buscam tratar as estruturas de objetos abstratos de uma populao, como, por exemplo, variveis de um problema de otimizao, atravs da manipulao de operadores inspirados na evoluo biolgica, chamados comumente de operadores genticos.

5.1.1 Programao Evolutiva


A programao evolutiva (PE) foi proposta por Fogel em 1962 com o objetivo de utilizar os conceitos da evoluo humana no desenvolvimento da Inteligncia Articial (IA). Na programao evolutiva cada indivduo de uma populao representado por uma mquina de estados nitos ou autmatos nitos . Durante a avaliao, os indivduos

mquina de estados nitos ou autmato nito uma modelagem de um comportamento composto por estados, transies e aes reetindo as mudanas desde a entrada num estado, no incio do

1 Uma

5.1 Algoritmo Evolutivo

46

so analisados por uma funo de payo (penalidade) de acordo com a sada da mquina. A reproduo desses indivduos feita apenas por operadores de mutao, sendo que todos indivduos da populao atual geram novos descendentes. Esse processo caracteriza o que se chama de reproduo assexuada . Na seleo de novos indivduos os descendentes (lhos) competem com os pais e somente os indivduos com maior tness sobrevivem(3). Dessa forma, a PE garante que todos os indivduos de uma tal populao iro produzir novos descendentes e, somente, os melhores indivduos entre os atuais e os descendentes iro sobreviver, em que o domnio dos melhores indivduos chamado de elitismo total. O elitismo mais utilizado garante a sobrevivncia apenas dos que

k -melhores

indivduos em

k < N,

sendo

o tamanho da populao (26).

5.1.2 Algoritmos Genticos


Um algoritmo gentico (AG) uma tcnica de busca utilizada na cincia da computao para achar solues aproximadas em problemas de otimizao e busca, fundamentado principalmente pelo americano John Henry Holland. Algoritmos genticos so uma classe particular de algoritmos evolutivos que usam tcnicas inspiradas pela biologia evolutiva como hereditariedade, mutao, seleo natural e recombinao (crossing over ). Holland estudou a evoluo natural considerando esta um processo robusto, simples e poderoso, que poderia ser adaptado para obteno de solues computacionais ecientes para problemas de otimizao. O conceito de robustez refere-se ao fato de os AG's independentemente das escolhas dos parmetros iniciais, em geral, reproduzem solues de qualidade (26). Algoritmos genticos so implementados como uma simulao de computador em que uma populao de representaes abstratas de soluo selecionada em busca de solues melhores. A evoluo geralmente se inicia a partir de um conjunto de solues criado A cada gerao, a adaptao de

aleatoriamente e realizada por meio de geraes.

cada soluo na populao avaliada, alguns indivduos so selecionados para a prxima gerao, e recombinados ou mutados para formar uma nova populao (37). A grande vantagem dos algoritmos genticos esta no fato de no precisarmos saber como funciona a funo objetivo que queremos otimizar, apenas t-la disponvel para ser aplicada aos indivduos e comparar os resultados suciente. A nova populao ento utilizada como entrada para a prxima iterao do algoritmo. A seguir mostram-se os principais conceitos de algoritmos genticos (26).

sistema, at o momento presente. 2 Tipo de reproduo que ocorre sem a troca de material gentico.

5.1 Algoritmo Evolutivo


1. Funo objetivo: Refere-se ao objeto de otimizao.

47
Pode ser um problema de

otimizao, um conjunto de regras e testes para identicar os indivduos mais aptos, ou mesmo uma caixa preta em que sabemos apenas o formato das entradas; 2. Cdigo gentico: uma representao do espao de busca do problema a ser resolvido. O cdigo gentico deve ser uma representao capaz de representar todo o conjunto dos valores no espao de busca e precisa ter tamanho nito; 3. Indivduo: meramente um portador do seu cdigo gentico; 4. Seleo: Trata-se de uma parte chave do algoritmo gentico. Em geral, usa-se o

mecanismo de seleo por roleta, em que os indivduos so ordenados de acordo com a funo-objetivo e lhes so atribudas probabilidades decrescentes de serem escolhidos. A escolha feita ento aleatoriamente de acordo com essas probabilidades. Dessa forma conseguimos escolher como pais os mais bem adaptados, sem deixar de lado a diversidade dos menos adaptados. Outras formas de seleo podem ser aplicadas dependendo do problema a ser tratado; 5. Reproduo: A reproduo se divide em trs etapas sendo elas o acasalamento, a recombinao e a mutao.

Acasalamento: a escolha de dois indivduos para se reproduzirem em que em geral geral dois descendentes para manter o tamanho populacional;

Recombinao:

Tambm conhecida por crossing-over a recombinao um

processo que imita o processo biolgico homnimo na reproduo sexuada em que os descendentes carregam em seu cdigo gentico parte do cdigo gentico do do pai e parte do cdigo da me. Dessa forma essa recombinao garante que os melhores indivduos sejam capazes de trocar entre si as informaes que os levam a ser mais aptos a sobreviver, e assim gerar descendentes ainda mais aptos. A critrio de exemplo considere a representao binria com 8 bits de dois nmeros em que a cadeia de bits (cromossomos ) de um nmero

A =

11001011
B

e do nmero

B = 11011111.

Uma regra de cross-over pode ser

sortear aleatoriamente a posio de 5 bit do nmero

e 3 bits do nmero

e concatenar esses elementos originando um novo indivduo (lho)

C =

11001111, dado que o evento cross-over


lhos:

ocorreu com uma certa probabilidade

relativamente alta. Com essa informao, possvel, por exemplo, gerar dois

5.1 Algoritmo Evolutivo


Figura 2: Troca de Material Gentico para o Algoritmo Gentico Binrio.

48

 

O Filho 1 com a parte gentica inicial do Pai A e a parte gentica nal do Pai B; O Filho 2 com a parte gentica inicial do Pai B e a parte gentica nal do Pai A.

Mutao: O processo de mutao realizado com a probabilidade mais baixa possvel no entanto essa probabilidade existe, e tem como objetivo permitir maior variabilidade gentica na populao, impedindo que a busca que estagnada em um mnimo local. O processo de mutao no h troca de material gentico como no exemplo anterior, ou seja, no h uma recombinao dos

cromossomos. A nica coisa que h uma mudana na sequncia da cadeia


do cromossomo dos indivduos. Uma regra de mutao poderia ser sortear

aleatoriamente um bit de um indivduo e trocar o seu valor. Dessa forma seja um indivduo

A = 11001001.

Se o segundo elemento da cadeia de bits for

selecionado de forma aleatria teremos um indivduo mutado

A = 10001001.

O processo dos Algoritmos Genticos passam pode ser resumido pela Figura abaixo: Figura 3: Resumo dos Algoritmos Genticos.

5.1 Algoritmo Evolutivo

49

Os exemplos de cross-over e mutao apresentados acima pertencem classe de algoritmos genticos de representao binria , em que os materiais genticos so representados por cromossomos que so uma sequncia de zeros e uns de conjuntos de bits estabelecido. Assim, a representao binria tem diculdades com mltiplas dimenses de variveis contnuas, especialmente quando uma grande preciso requerida. Para que a preciso desejada seja alcanada, um grande nmero de bits na cadeia dos cromosso-

mos ser necessrio. A grande quantidades de bits utilizados implicam em cromossomos


extremamente extensos, dicultando dessa forma, a operacionalizao do algoritmo gentico. Alm disso, ainda existe a diculdade de representar nmeros (indivduos) contnuos (com casas decimais) na escala binria, o que obriga o processo a discretizar (truncar) os nmeros reais. Percebe-se assim que algoritmos genticos com representao real so mais adequados para a maioria dos problemas, principalmente quando se trabalha em um espao paramtrico contnuo. H inmeros trabalhos na literatura que faz uso de algoritmos genticos com representao real. Pode-se citar, por exemplo (Joab., 2009) que discutiu o uso de funo de verossimilhana na estimao da proporo de tens conformes na presena de erros de classicao e de classicaes repetidas repetidas usando algoritmos genticos num processo de otimizao multiobjetivo (30). A seguir, sero mostrados os principais passos de um algoritmo gentico geral:

1. No tempo

t0 ,

um conjunto de solues iniciais gerado e esse funcionar como Durante toda a execuo

uma populao inicial para as futuras descendncias.

do processo evolutivo, o algoritmo gentico mantm atualizada essa de populaes pontenciais

P (gen) = {x1 gen , x2 gen , , xn gen };

2. Para essa populao inicial cada indivduo avaliado atravs de uma medida de aptido, ou tness, geralmente, representada pela prpria funo objetivo; 3. Dois indivduos (os pais) so escolhidos de acordo com os seus graus de adaptao, isto , indivduos mais adaptados (mais fortes) tm uma probabilidade maior de serem selecionados; 4. Os indivduos selecionados passaro por um processo de reproduo que envolve no s o crossing-over, como tambm a mutao, produzindo lhos. caracterizam-se como dois novos candidatos a perpetuarem a espcie. 5. Esses lhos so adicionados populao inicial e todo o processo repetido at que a populao no possa ser mais melhorada". Esses lhos

5.1 Algoritmo Evolutivo

50

Figura 4: Diagrama do uxo do algoritmo gentico.

Para otimizao de parmetros contnuos a representao real a mais adequada, e segue o mesmo uxo descrito no diagrama apresentado na Figura 4. Em todo esse

tpico foi discutido os conceitos mais relevantes da teoria sober os algoritmos genticos mas, para tornar essa idia mais clara e objetiva, considere o exemplo abaixo como parte da explicao da teoria de algoritmos genticos. O objetivo do problema encontrar o parmetro funo

que maximiza um funo a que segue:

f (),

com

variando no intervalo

[2, 5; 2, 5].

f ()

f () = 6 + 2 seno(14),
com

(5.1)

2, 5 2, 5.

O grco da funo

f ()

segue logo abaixo:

Como podemos perceber o grco da funo

f ()

apresenta vrios pontos de mnimo

mximo global o que um problema para muitos mtodos de otimizao, em que dessa forma muitos algoritmos no so capazes de localizar o timo global na presena de mltiplos timos locais. mtodo de busca local. Na Figura 5 pode-se observar um ponto vermelho, sendo este o ponto de mximo global da funo de 11,561141. O A exemplo o mtodo de busca Hill Climbing sendo este um

f ()

com

variando no intervalo

[2, 5; 2, 5]

e valor timo nesse ponto

que otimiza a funo

f ()

igual 2,360511947, sendo este valor

5.1 Algoritmo Evolutivo

51

Figura 5: Funo objetivo

f ().

pertencente ao espao paramtrico que maximiza a funo objetivo. Assim, o objetivo do algoritmo gentico encontrar esse valor para

para um certo nmero de geraes. Os

passos do algoritmo gentico para otimizar a funo

f ()

seguem abaixo:

1. Denir os parmetros de entrada do algoritmo gentico. Esses parmetros so:

A funo objetivo

F O; 1 t NIT,
em que

Nmero de iteraes (NIT ):

indica as geraes;

Probabilidade de recombinao (cross-over ) Probabilidade de mutao (P rM ): Sugesto

P rR:

Sugesto

P rR = 0, 90;

P rM = 0, 01; N SE = 5; EP S = 108 ;
chamadas de

Nmero de Solues de Elite (NSE ): Sugesto

Nvel de preciso () para o critrio de parada (EPS ): Sugesto

2. (Gerao

t = 0):

Gerar, aleatoriamente, digamos, 15 valores para

solues candidatas; 3. Calcular a funo objetivo (f ()

= 6 + 2 seno(14))

para cada uma das 15 solues

candidatas e ordenar esse vetor (com base na funo objetivo) em rodem decrescente; 4. Calcular a propores simples e as propores acumuladas a partir da soma das funes objetivo obtidas. Abaixo segue um exemplo ctcio da estrutura dessa. 5. Selecionar (usando a tcnica da Roleta Russa) duas solues candidatas (os dois indivduos) dentre as 15 solues apresentadas na Gerao

t = 0,

de modo que essa

5.1 Algoritmo Evolutivo

52

Tabela 4: Tabela com as Solues Candidatas Iniciais e com as Propores Calculadas com Base na Funo Objetivo.

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Total

Solues 2,319054079 -2,157887509 -1,637852107 1,535309915 -1,182515946 -2,477416303 -0,787606433 -0,297479171 -0,285729545 -0,228049562 0,886791589 -1,562166204 -1,557588427 -2,000869778 1,630069887 *

FO
10,66723 10,34924 8,16439 7,12349 7,04802 6,77317 6,62003 6,07555 6,06180 6,00266 5,88148 5,70587 5,55394 4,96244 4,03953 101,02883

Propores 0,10559 0,10244 0,08081 0,07051 0,06976 0,06704 0,06553 0,06014 0,06000 0,05942 0,05822 0,05648 0,05497 0,04912 0,03998 1,00000

Acumulada (PrA ) 0,10559 0,20803 0,28884 0,35935 0,42911 0,49615 0,56168 0,62182 0,68182 0,74124 0,79946 0,85594 0,91091 0,96003 1,00000 *

seleo seja proporcional adaptao de cada indivduo, ou seja, uma soluo mais apta (com funo objetivo maior) teria uma maior probabilidade de ser selecionada que uma soluo menos apta (com funo objetivo menor). Isso feito atravs do seguinte procedimento:

Para selecionar a primeira soluo candidata



Gerar um nmero aleatrio (N U M1 ) de uma Distribuio Uniforme Se

(0; 1);

N U M1 P rA (Proporo acumulada da j -sima soluo candidata), ento j ;

selecione a soluo candidata

Para selecionar a segunda soluo candidata



Gerar um outro nmero aleatrio (N U M2 ) de uma distribuio uniforme Se

(0; 1);

N U M2 P rA (Proporo acumulada da j -sima soluo candidata), ento j .


O processo de seleo feito utilizando uma

selecione a soluo candidata

tcnica de amostragem com reposio. O processo de seleo feito utilizando uma tcnica de amostragem com reposio. Em vista disso, uma mesma soluo candidata pode ser selecionada duas vezes numa mesma gerao; 6. Com as duas solues candidatas selecionadas, juntamente com as suas respectivas funes objetivo calculadas, vericar se haver (ou no) o processo de crossover

5.1 Algoritmo Evolutivo

53

ou recombinao (troca de material gentico dos dois candidatos). Isso poder ser realizado a partir do seguinte procedimento:

Gerar um nmero aleatrio (N U M3 ) de uma Distribuio de

Bernoulli(P rR),

ou seja, gerar um dgito binrio, de modo que a probabilidade de sair 1 de

P rR
Se

(Probabilidade de recombinao denida no 1

Passo);

N U M3 = 1,
Sejam didata data

ento realizar o processo de recombinao da seguinte forma: (funo objetivo na gerao

i , j , F O()it i ) e F O()jt

relativa soluo can-

(funo objetivo na gerao

t relativa soluo candi-

j )

os valores das solues candidatas selecionadas e suas respectivas

funes objetivo;

Calcule

it = F O()it 1 e jt = F O()jt 1 que funcionaro como uma

espcie de uma medida de variabilidade para cada soluo candidata e que sero inversamente proporcionais aos valores de suas funes objetivo;

Agora gere um outro nmero aleatrio (N U M4 ), atribudo ao indivduo

i ,

de uma Distribuio Normal com mdia

e desvio-padro

?it .

Faa

o mesmo para a outra soluo candidata, isto , gere um nmero aleatrio (N U M5 ), atribudo ao indivduo dia

j , de uma Distribuio Normal com m-

e desvio-padro

?jt .

O efeito dessa estratgia pode ser representado

gracamente como segue:

Faa

i = N U M5

j = N U M4 ,

ou seja, a soluo candidata?i recebe o

valor aleatrio gerado a partir da distribuio de probabilidade em torno de

j ,

enquanto que a soluo candidata?j recebe o valor aleatrio gerado a

partir da distribuio de probabilidade em torno de

i .

Essa uma maneira

de criar solues candidatas novas a partir das informaes genticas dos seus concorrentes. Se

N U M4 > 2, 5

ou

N U M4 < 2, 5,

ento faa

N U M4

5.1 Algoritmo Evolutivo

54

igual ao limite do domnio da funo (ou -2,5 ou 2,5). Proceda de forma anloga para

N U M5 .

7. Com as duas novas solues candidatas (depois de terem, ou no, realizadas o crosso-

ver ), vericar se haver (ou no) o processo de mutao (melhoramento do material


gentico interno de cada uma das solues candidatas). Isso poder ser realizado a partir do seguinte procedimento:

Gerar um nmero aleatrio (N U M6 ) de uma Distribuio de Bernoulli (P rM ), ou seja, gerar um dgito binrio, de modo que a probabilidade de sair 1 de

P rM
Se

(Probabilidade de Mutao denida no 1

passo);

N U M6 = 1,

ento realizar o processo de mutao da seguinte forma:

Gerar dois nmeros aleatrios (ERR1 e formes distintas no intervalo

ERR2 ) de duas Distribuies Uni-

[ 1 ; 1 ]. t t

Perceba que esse intervalo vai dimi-

nuindo medida que as geraes vo avanando, evitando assim, variaes altas nas geraes mais adiantadas;

Faa faa

i = i + ERR1 i

j = j + ERR2 .

Se

i > 2, 5

ou

j < 2, 5,

ento

igual ao limite do domnio da funo (ou -2,5 ou 2,5). Proceda de

forma anloga para

j .

8. Calcule a funo objetivo para cada uma das novas solues candidatas e utilize o seguinte critrio para inclu-las (ou no) na lista das 15 solues candidatas da gerao inicial:

Se pelo menos uma das solues candidatas apresentar uma adaptao melhor (maior valor da funo objetivo) que qualquer uma das 15 solues candidatas geradas no 2

passo, ento inclua tal soluo (ou as duas) na listagem das 15

solues candidatas (que caria nesse momento 16 solues) e delete a ltima (ou as duas ltimas);

Se pelo menos uma das solues candidatas apresentar uma adaptao melhor (maior valor da funo objetivo) que a melhor soluo candidata (aquela com o maior valor da funo objetivo, ou seja, a primeira candidata da lista ordenada) gerada no 2

passo, ento inclua tal soluo (ou as duas) na listagem das 15

solues candidatas (que caria nesse momento 16 solues) e delete a ltima (ou as duas ltimas). E, alm disso, verique se possvel inclu-la tambm (ou as duas) na lista de Solues de Elite (que receber, no mximo, as melhores solues).

N SE = 5

5.1 Algoritmo Evolutivo


o

55

9. Ordene as 15 novas solues candidatas e repita tudo novamente a partir do 4 passo at que tenha atingido o total de iteraes (N IT ) ou que a diferena, em mdulo, entre a soluo encontrada no 8 Elite seja menor que

passo e a melhor soluo da lista de Solues de

EP S .

Esses procedimentos sero repetidos at que o critrio de parada seja atingido. Nos anexos desse trabalho podem ser encontrado duas implementaes desse exemplo na linguagem R e no pacote estatstico SAS. O algoritmo implementado na linguagem R considerou uma populao de 8000 indivduos e foram feitas 300 interaes, ou seja, foram consideradas 300 geraes que para convergncia" o algoritmo levou 4,265293 segundos. O valor da funo

f ()

encontrado pelo algoritmo foi 11,5618064 com

timo igual

2,360763, valores estes bem prximos do real. Com base em tudo que foi visto, decidiu-se propor um mtodo hbrido de otimizao que combine as melhores propriedades da lgica nebulosa Fuzzy com as principais idias da losoa dos algoritmos genticos. Essa proposta ser discutida com mais detalhes a seguir.

56

Proposta de um Modelo Fuzzy C-Means Gentico para Agrupamento de Dados

6.1 Introduo
A proposta de um modelo hbrido para agrupamentos de dados une conceitos de algoritmos genticos com os da lgica de conjuntos nebulosos Fuzzy. Esse mix de ferramentas fornecer um mtodo de agrupamento mais exvel e eciente na hora de agrupar os dados, representando assim melhor a realidade dos diversos problemas prticos. Modelos

clssicos para agrupar dados, em geral, se utilizam de uma losoa crisp em que um indivduo pertence a um, e somente um agrupamento. Em geral, essa construo rgida de agrupamentos de dados no coerente com a realidade. Para contornar esse problema, comum a utilizao de conceitos da lgica difusa (ver Captulo 4), nos quais permitem que um indivduo possa pertencer a todos os grupos, segundo uma medida de pertinncia. O modelo proposto tambm faz uso dos Algoritmos Genticos como uma ferramenta fundamental na otimizao dos parmetros da metodologia Fuzzy, visto que esses algoritmos evolutivos no fazem uso de derivadas, inverses de matrizes ou qualquer outro clculo que pode tornar o procedimento complexo computacionalmente. Mas antes da discusso detalhada do mtodo proposto, convm explanar como foi realizado todo o processo de denio, captao, crtica e delineamento do banco de dados que ser utilizado nesse trabalho.

6.2 Delineamento do Processo Amostral

57

6.2 Delineamento do Processo Amostral


6.2.1 Base de dados utilizada
Esse trabalho fez uso da base de dados do Sistema de Informao sobre Mortalidade (SIM) da Secretaria de Sade do Estado da Paraba no perodo de 1 de janeiro de 2006 07 de julho de 2010, data esta da ltima gerao do banco de dados. A base de dados foi fornecida pela Gerencia Operacional de Resposta Rpida da Secretaria de Sade. A banco de dados inicial gerado pelo SIM apresentou todas as informaes de bitos de pessoas do Estado da Paraba no perodo considerado, de forma que cada linha desse arquivo representava um indivduo que veio bito em um dado ano, sendo a chave primria o nmero da declarao de bito (DO) do indivduo. A operacionalizao do Sistema composta pelo preenchimento e coleta do documento padro - a Declarao de bito (DO), sendo esse o documento de entrada do sistema nos estados e municpios. Os dados coletados so de grande importncia para a vigilncia Sendo

sanitria e anlise epidemiolgica, alm de estatsticas de sade e demograa.

assim, o SIM um sistema de vigilncia epidemiolgica nacional, cujo objetivo captar dados sobre os bitos do pas a m de fornecer informaes sobre mortalidade para todas as instncias do sistema de sade. O banco de dados, inicialmente gerado, apresentou mais de um milho de linhas, representando cerca de 700 MB em formato DBF. Os dados listavam os bitos ocorridos por todas as causas de bitos fornecidas pelo livro de Classicao Internacional de Doenas (CID-10). As informaes de interesse (tais como nome do paciente, nomes dos pais, CRN do mdico que constatou o bito, nome do hospital, bem como o endereo do indivduo que veio a bito, dentre outras informaes ) foram ltradas utilizando o software TabWin 3.61, fornecido pelo Ministrio da Sade. A partir do carregamento da base de dados original, os dados passaram a ser tratados utilizando a linguagem R, em que foram ltrados os bitos ocorridos por homicdios referente causas externas pertencente ao captulo XX da CID-10. Para a consulta das

descries das causas foi utilizado o software livre Classix 0.1. Este software permite a consulta das causas de bitos da CID-10 por captulo ou pela codicao das causas e est disponvel para o sistema Linux. A opo de se utilizar a linguagem R foi devido o TabWin esconder, de certa forma, algumas informaes,uma vez que os cruzamentos de variveis so feitos por alguns arquivos

6.3 Descrio do Problema a ser Otimizado


de denies.

58

6.2.2 Linguagem R
Para a realizao das simulaes foi utilizado o pacote estatstico R em sua verso 11.1 de 31 de maio de 2010. O pacote R uma linguagem e um ambiente de desenvolvimento integrado, para clculos estatsticos e grcos. A linguagem R foi criada inicialmente

por Ross Ihaka e Robert Gentleman na Universidade de Auckland, Nova Zelndia e foi desenvolvido por um esforo colaborativo de pessoas em vrios locais do mundo (38). O nome R provm em parte das iniciais dos criadores e tambm de um jogo gurado com a linguagem S (da Bell Laboratories, antiga AT&T). No entanto, a linguagem R no deriva da linguagem S como muitos acreditam (9). A linguagem resultante muito similar em sintaxe ao S, mas a implementao subjacente e semntica so derivados da linguagem Scheme. O cdigo fonte do R est disponvel sob a licena GNU GPL (GNU General Public License ) e as verses binrias pr-compiladas so fornecidas para Windows, Macintosh, e muitos sistemas operacionais Unix/Linux. Apesar do seu carter gratuito, o R uma ferramenta bastante poderosa com boas capacidades ao nvel de programao e um conjunto bastante vasto (e em crescimento) de packages que acrescentam bastante potencialidades j poderosa verso base do R.

6.3 Descrio do Problema a ser Otimizado


A necessidade de inter-relacionar alguns municpios do Estado da Paraba com as principais causas externas de bito, descritas na Seo 1.2 o grande objetivo de estudo e de aplicao desse trabalho. Diante desse cenrio, deseja-se encontrar a melhor funo de pertinncia da lgica nebulosa Fuzzy, de modo que essa venha representar, da melhor forma possvel os interrelacionamentos entre municpios e causas. Uma consequncia natural da busca da melhor matriz de pertinncia a otimizao do processo de construo de grupos homogneos de municpios dentro das diversas causas. Obviamente, eEssas medidas de pertinncia

passam, obrigatoriamente, pelas idias de similaridade vistas na Seo 3.2. Dessa forma, como o problema multidimensional, o que se quer encontrar as melhores pertinncias de todos os municpios para todas as causas. Como uma maneira de

6.3 Descrio do Problema a ser Otimizado

59

simplicar o espao de busca, decidiu-se trabalhar apenas com os 30 principais municpios paraibanos com registros nas e 10 8 principais causas de bitos. Dessa forma, as matrizes de pertinncias candidatas a solues timas tero 30 linhas por 8 colunas. Com isso,

ainda que considerando essas restries, as solues timas do subespao de busca estaro contidas no espao R30 8, de dimenso 240. A melhor maneira de transformar informaes de contagem em medidas de distncia (proximidade) aplicando a tcnica multivariada de Anlise de Correspondncia. esse procedimento que ser apresentado a seguir.

6.3.1 Transformando Tabelas de Contingncias em Medidas de Distncias Bidimensionais


Em busca de se vericar as interaes entre municpios paraibanos com as causas de bitos,foi empregada a metodologia de Anlise de Correspondncia (AC), descrita na Seo 3.3 do Captulo 3, para transformar contagens em distncias (similaridades). A Anlise de Correspondncia possibilitou a identicao das proximidades entre municpios e causas para os anos de 2006 a 2010. A partir da tabela de contigncia relacionou os municpios e as causas externas de bito (ver Tabela 5), por exemplo para o ano de 2010, fazendo uso da AC possvel encontrar as coordenadas do plano cartesiano dos indivduos (cada linha da tabela de contingncia) e de todas as colunas da tabela. Desse modo, tem-se as coordenadas dos municpios e

causas externas de bitos consideradas neste trabalho que podem ser representadas no

. Os dados foram reduzidos ao espao bidimensional devido este ser mais simples de

visualizar os relacionamentos as categorias das variveis envolvidas. Para a escolha do nmero de dimenses que seriam adotadas utilizou-se a regra dos autovalores maiores que 1. A partir desse critrio, decidiu-se por utilizar apenas 2 di-

menses. Essas dimenses explicaram, para todos os anos em estudo, no mnimo

90%

da

variabilidade total dos dados originais. A AC em sua teoria utiliza a distncia Euclidiana para calcular as dissimilaridades entre linhas e colunas da matriz de correspondncia. Contudo, preferiu-se empregar as distncia de Mahalanobis, uma vez que essa levam em considerao a matriz de varincia-covarincia dos pontos no

R2 .

6.3 Descrio do Problema a ser Otimizado

60

Tabela 5: Tabela de contigncia a critrio ilustrativo com o quantitativo de bitos ocorridos em 2010. Causas Externas de bito Municpios Alagora Grande Alagoa Nova Alhandra Areia Aroeira Bayeux Boqueiro Caapor Cabedelo Cajazeiras Campina Grande Catol do Rocha Conde Cuit Esperana . . . Sap Sousa Total V03 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 . . . 0 0 17 V09 0 0 2 0 0 0 0 0 1 0 0 0 0 0 0 . . . 0 0 9 V49 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 . . . 0 1 15 V89 0 0 3 1 1 2 1 1 1 2 30 0 2 5 2 . . . 1 4 103 V99 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . . . 1 0 1 W19 0 1 0 1 0 0 0 1 0 0 4 0 0 0 1 . . . 1 0 18 X70 1 1 0 0 0 1 0 0 1 1 7 0 1 0 0 . . . 0 0 24 X95 0 1 4 2 2 30 2 4 15 2 57 2 2 2 1 . . . 15 4 381 Total 1 3 9 4 3 35 3 6 18 7 98 2 6 7 4 . . . 18 9 568

A AC em sua teoria utiliza a distncia euclidiana para calcular as distncias entre linhas e colunas da matriz de correspondncia. Contudo, utilizou-se da distncia de

Mahalanobis para o clculo das distncias por considerar a variabilidade dos pontos no espao

, modicando um poucos a distribuio espacial dos pontos fornecidas pelo

mtodo AC. O grco bidimensional com os pontos de municpios e causas mostram a proximidade entre esses pontos, entretanto no capaz de mostrar os agrupamentos dos pontos, pois no existe nenhuma medida eciente para agrupar tais dados. Os pares de coordenadas de cada ponto foram padronizados da forma que segue:

Q(X 1 ; X 2 ) = Q
~ ~ em que

X 1 1 X 2 2 ; ~ ~ 1 2

(6.1)

e X 2 so vetores das coordenadas obtidas pela anlise de correspondncia ~ ~ dos pontos, sejam eles os municpios ou causas, isto , linha ou coluna da tabela de contingncia. Os valores e X 2 com ~ ~ mdias 1 e 2 respectivamente. Com as coordenadas padronizadas, utilizou-se a Equao e se referem aos desvios padres dos vetores 3.4 para o clculo das distncias entre os pontos. Com tais coordenas estimadas possvel perceber de forma supercial o relacionamento entre os dados em grcos perceptuais,

X1

X1

6.3 Descrio do Problema a ser Otimizado

61

em que neste caso bidimensional. A critrio de exemplo, segue dois grcos perceptuais com as coordenadas no padronizadas e com as coordenadas padronizadas, grcos estes obtidos pela Anlise de Correspondncia para o ano de 2010, em que

D1 e D2 refere-se as

dimenses das linhas e colunas da tabela de contingncia respectivamente, em que pontos so as causas e as estrelas os municpios.

Figura 6: Distncias Euclidiana.

Figura 7: Distncias de Mahalanobis.

Com a distribuio dos

municpios e

causas em um espao

, buscou-se formar Assim, se um mu-

agrupamentos com base na medida de proximidade

d(Mi , C[1, ,c] ). c20 c20

nicpio

M1

est mais prximo de um determinado grupo

do que do conjunto do que ao

c2 ,

por

exemplo, o municpio

M1

ter maior chance de pertencer ao grupo

c2 .

Ainda

assim, tal fato no impede que um indivduo

M1

no venha a estar associado a mais de

um agrupamento ao mesmo tempo, podendo o municpio

M1

pertencer aos agrupamentos

c2

c20

com mesma representatividade de pertinncia para ambos agrupamentos. Dessa

forma, percebe-se que os agrupamentos formados tm uma interpretao clara e bastante direta devido caracterstica inerente a cada centride, onde todos os centrides que so os centros de cada um dos agrupamentos formados possuem uma expresso lingustica associada ele, como por exemplo, a causa Homicdio por Arma de Fogo referente a causa X95 do Captulo XX da CID-10. Assim, o problema busca encontrar os melhores agrupamentos utilizando a losoa de algoritmos genticos em conjunto com a Lgica Nebulosa Fuzzy. Otimizando uma funo objetivo que estabelea os melhores agrupa-

mentos, possvel tirar resultados bastante interessantes de cada agrupamento formado, resultados estes que so fceis de serem observados porque, de forma bastante supercial, o problema apresenta uma contextualizao bastante simplria que agrupar regies em conglomerados que possuem uma expresso lingustica associada. Mas esse problema de otimizao tem uma caracterstica particular. Os centros (centrides) dos agrupamentos

6.4 Funo Objetivo


que sero formados so xos.

62
Por isso, uma adaptao do mtodo Fuzzy C-Means foi

utilizada para tornar os centros dos grupos xos.

6.4 Funo Objetivo


A forma com que os agrupamentos so formados dado atravs da minimizao da funo

J(U, D),

onde

uma matriz retangular de dimenso

mc

e D a matriz de

distncias tambm forma.

m c.

Essa funo apresentada na Equao 4.1, reescrita de outra

J(U, D) =
i=1 j=1
onde

(uij ) (xi , dj ) =
i=1 j=1

(uij )

m j=1

(xij dij )2 ,

uij

calculado da forma que segue com

m=2

que o parmetro de fuzzicao

mais apropriado proposto pela literatura.

1 m1 1 (xij gij )2 c j=1 , i = 1, , n; j = 1, , c. uij = p j=1 (xij gij )2


p j=1
Tal funo objetivo do Mtodo Hbrido Gentico Fuzzy a mesma funo objetivo do mtodo Fuzzy C-Means (FCM), no entanto os valores

gij

no so atualizados, ou

seja, os centrides no sofrem alteraes em cada interao do algoritmo como ocorre no mtodo FCM. No Mtodo Hbrido Gentico Fuzzy os

gij

so pr-estabelecidos e obtidos

pela anlise de correspondncia. Logo o que resta otimizar a matriz de matriz de pertinncias em que cada linha da matriz

Umc

que a

Umc

apresenta as pertinncias de um

determinado indivduo (municpio) pertencer a cada um dos importante observar que o espao paramtrico da funo

c agrupamentos formados. m c.

J(U, D)

bastante complicado, Dessa

pois os valores que a funo objetivo assumem so matrizes de dimenses

modo, tem-se que encontrar as melhores combinaes entre linhas e colunas da matriz de pertinncia

Umc

que melhor representem as pertinncias de cada indivduo pertencer a

um dado agrupamento

c.

importante observar que as distncias dos municpios para as causas (grupos) so xas, o que no ocorre no Fuzzy C-Means, em que as distncias dos indivduos mudam a cada interao devido os centrides sofrerem um processo estocstico. A funo objetivo

6.5 Implementao do Modelo Hbrido Gentico Fuzzy


para o Modelo Hbrido Gentico Fuzzy pode ser reescrita da forma que segue com

63

m = 2.

J(U, D) =
j=1 i=1
onde

(uij )2 (dij )2 , j

(6.2)

uij

representam as pertinncias de um indivduo

pertencer a um dado agrupamento

(dij )2

representam as distncias de um indivduo

a um agrupamento

i,

distncias

estas xas em todas as geraes. Dessa forma, cada matriz

fornecer, por meio do clculo de

J(U, D), U

uma medida

de qualidade dos agrupamentos formados, de modo que as matrizes aquelas que tornarem a funo objetivo com valor menor possvel.

desejadas sero

Na Seo 6.5, logo

abaixo, sero discutidos todos os detalhes da implementao do modelo de otimizao proposto.

6.5 Implementao do Modelo Hbrido Gentico Fuzzy


6.5.1 Passos do Modelo Hbrido Gentico Fuzzy - MHGF
Passo 1:
inicial Denir os parmetros iniciais do modelo. Tais parmetros so: Populao em que denido a quantidade de solues candidatas que pertencero

P0

gerao t, probabilidade de recombinao de geraes (P0 ),

Pr , probabilidade de mutao PM , nmero


,

ng , preciso de convergncia

np0

que o tamanho da populao inicial

ne

que o nmero de solues de elite e

nss

que o critrio de parada.

 

As probabilidades de crossover (Pr ) e mutao (PM ) pode variar a depender do problema. O parmetro

np0

refere-se ao nmero de solues de elites que iro iniciar a

populao inicial armazenadas no array

P0 .

Em geral escolhe-se um nmero

grande de solues iniciais de forma a garantir uma maior variabilidade nas geraes, possibilitando assim encontrar solues mais diversicadas.

Passo 2:

Gerar aleatoriamente

np 0

e abrig-las no array

P0 .

As solues candidatas devem ser geradas de forma aleatria de forma que cada linha da matriz candidata (Unc )some 1.

6.5 Implementao do Modelo Hbrido Gentico Fuzzy


Passo 3:
Calcule a funo objetivo para todos os indivduos da populao

64

P0 ,

obtendo-se um vetor de solues

FO . J(U, D)
e os va-

Para cada soluo candidata ser aplicado a funo objetivo lores sero guardados no vetor

FO . FO
de modo que os primeiros

Passo 4:

Ordene, de forma crescente, os valores de

indivduos sero aqueles mais adaptados, ou seja, com menor funo objetivo. A ordenao deve ser feita de modo que as posies iniciais antes da ordenao sejam guardadas.

Passo 5:

Guarde as melhores solues em um vetor de elite E de tamanho

ne ,

bem como as matrizes de pertinncias

Unc

que deram origem a essas solues

timas. Essa espcie de "cpia de segurana" das melhores solues candidatas uma estratgia de programao para no perder, ao longo da evoluo do algoritmo, esses indivduos.

Passo 6:

Selecione, aleatoriamente, 2 indivduos (2 solues candidatas) para avan-

arem para a fase da reproduo, de modo que tais indivduos selecionados tenham probabilidades de seleo proporcionais sua funo objetivo, ou seja, indivduos mais aptos (com valores menores para a funo objetivo) tenham mais chances de serem selecionados.

Passo 7:

Gere um nmero com distribuio

Bernoulli(Pr ),

sendo 1 o sucesso e 0

o fracasso. Caso o nmero gerado seja 1 haver recombinao (crossover) entre as solues candidatas. Em havendo o processo de recombinao, siga os sub-passos abaixo:

Para cada soluo candidata (Unc ) selecionados

U (1) nc e U (2) nc da populao


ou seja,

P0

faa e

R1 = (U (1) nc )2 (dnc )2 R2nc

R2nc = (U (2) nc )2 (dnc )2 , (Unc )2

R1nc

o produto entre os elementos da matriz

pela matriz

2 de distncias ao quadrado ((dnc ) ).

Para cada matriz

Rnc

calcula a soma de das

linhas. Linhas que possuem

uma soma baixa denominada linha boa pois contribuem para minimizao da funo objetivo nhas ruins.

J(U, D)

e linhas com maiores somas so denominadas li-

Selecione a melhor e pior linha das matrizes

R(1) nc

R(2) nc

respectivamente e guarde suas posies. Considera as ilustraes do processo de recombinao apresentados abaixo.

6.5 Implementao do Modelo Hbrido Gentico Fuzzy

65
selecionada pela matriz

Multiplique os elementos da matriz

U (1) nc

(dnc )2 .

Observe que no trata-se de produto matricial e que os elementos das matrizes esto elevados ao quadrado.

Realize o mesmo procedimento acima para a matriz

(Unc )2 ,

ou seja:

6.5 Implementao do Modelo Hbrido Gentico Fuzzy

66

Em seguida ordene as matrizes produtos

R(1) nc

R(2) nc

e posteriormente

selecione uma linha boa e uma linha ruim utilizando os mesmos critrios de seleo das solues candidatas.

Seleciona uma linha boa e uma linha ruim para cada uma das matrizes

R(1) nc e

R(2) nc .

Troque a linha boa da matriz

R(1) nc pela linha ruim da matriz R(2) nc R(2) nc .


Com dessa mudana entre

e a linha ruim de linhas de

R(1) nc
e

pela linha boa de

R(1) nc

R(2) nc

possvel que haja troca de informaes entre as

solues candidatas. A troca de uma linha boa por uma linha ruim pode vir

6.5 Implementao do Modelo Hbrido Gentico Fuzzy

67

a melhorar as solues candidatas, todavia isso no necessariamente ocorre. O que importante entender que a troca de material gentico deve ocorrer, sendo isso suciente para o algoritmo. Este procedimento pode ser resumido da seguinte forma.

Para

Bernoulli(PM ) = 1, U (2)

pegue as posies das matrizes

R(1) nc

R(2) nc

obtidas no passo anterior e troque a linha ruim da matriz boa da matriz matriz e a linha boa da matriz

U (1) nc

com a linha

U (1) nc

com a matriz linha ruim da

U (2) nc .
A matriz

Observe que a troca feita nas matrizes

Unc

e no na matriz

Rnc .

Rnc

serve apenas para julgar quais linhas das matrizes

Unc

so boas ou ruim para minimizao da funo objetivo

J(U, D). Bernoulli(PM ).

Passo 8:
datas.

Gere 2 nmeros aleatrios independentes com distribuio

Os nmeros gerados referem-se possibilidade de mutao entre as solues candi-

Selecione duas linhas e duas colunas da matriz que sofrer mutao para serem trocadas. Observe que a mutao se d por uma desordenao dos elementos genticos da prpria soluo candidata. O procedimento pode ser resumido da forma que segue.

6.5 Implementao do Modelo Hbrido Gentico Fuzzy

68

 Passo 19:
tiveram

Para aqueles que iro sofrer mutao, ou seja, para aqueles que o processo de mutao ser iniciado.

Bernoulli(PM ) = 1

 Passo 20:

Gere 2 nmeros aleatrios independentes com distribuio

U nif orme(1, n)
As linhas

de modo a selecionar duas das selecionadas sero trocadas.

n linhas das matrizes de pertinncias.

 Passo 21:

Gere mais dois nmeros aleatrios independentes com distribuio Os dois valores geradores referem-se as colunas das matrizes

U nif orme(1, c).

de pertinncias que sero trocadas, nalizando assim o processo de mutao.

Passo 9:

Recalcule a funo objetivo

J(U, D)

para cada uma das matrizes de

pertinncias.

6.5 Implementao do Modelo Hbrido Gentico Fuzzy


Passo 10:
populao

69

Compare as funes objetivos, obtidas aps os operadores genticos de

recombinao e/ou mutao com os valores das funes objetivo dos indivduos da

P0 .

Caso os valores das funes objetivos encontrados so melhores que ao

menos uma das funes objetivo calculadas para as piores" solues candidatas de as solues de elite.

P0 ,

as novas matrizes substituiro

P0 .

Este mesmo processo tambm aplicado para

Passo 11:

Repita este processo a partir do Passo 2 at que nmero nmero de

geraes indicado no Passo 1 seja atingido ou at que o primeiro valor da soluo de elite seja menor que at que para um nmero razovel de geraes consecutivas, ou seja,

nss

seja maior que um valor pr-estabelecido.

Passo 12:

Ao nal de todas as geraes, quando o critrio de parada do for atingido,

as solues do grupo de elite sero as melhores solues encontradas.

No captulo que segue, uma aplicao da metodologia proposta ser efetuada e os principais resultados sero discutidos.

70

Aplicaes e Discusses

7.1 Delineamento do Processo de Amostral de Simulao


A base de dados considerada nesse trabalho refere-se populao de indivduos que vieram bito dos 30 principais municpios paraibanos registrados entre os anos de 2006 a 2010. Vale salientar que os dados considerados reetem o universo completo de casos, no sendo necessrio, portanto, se faz inferncias no que diz respeito ao tamanho da amostra ou outras caractersticas amostrais. Como j comentado nesse texto, o objeto principal desse trabalho agrupar os municpios dentro das causas estudadas para os anos de 2006 a 2010. Esses agrupamentos dependero da escolha tima da matriz de pertinncia que relaciona os municpios e as causas. E para a obteno dessa escolha tima, ser utilizado um Modelo Hbrido Gentico Fuzzy proposto nesse trabalho. Para a execuo do processo de simulao, considerou-se uma populao inicial de 1000 solues candidatas, descritas aqui como as matrizes de pertinncia considerado

Unc .

Alm disso, foi

ng = 50.000

evolues genticas, sendo preservadas, no grupo de solues de

elite, 20 solues. J para a aplicao dos operadores genticos, foram considerados uma probabilidade de recombinao de 85% e de mutao de 5%. Como critrio de parada, utilizou-se

nss = 100

com um

= 103 .

O problema de simulao abordado nesse documento bastante complexo, principalmente devido alta dimensionalidade do subespao de busca da funo objetivo que se encontra no espao vetorial

J(U ; D)

240

dimensional. Mesmo assim, os resultados obtidos

foram bastante consistentes para a grande maioria dos municpios, no deixando de haver tambm, algumas ocorra eventuais inconsistncias, o que no deixa de ser compreensvel, haja vista a complexidade do problema a ser otimizado. Por outro lado, em termos de desempenho, utilizou-se um computador com processador Intel(R) Core(TM) 2 Duo CPU, T5550, 1.83GHz e observou-se que, em mdia, o

7.2 Relao entre Municpios e Causas Externas de bitos

71

algoritmo consumiu cerca de 4,45 horas para gerar os resultados para cada ano, sendo que em torno de 76% desse tempo, o algoritmo consumiu realizando as tarefas de recombinao, como mostra a Tabela 5. Tabela 6: Tempo de convergncia em horas do algoritmo MHGF.

Tempo em Hora Anos 2006 2007 2008 2009 2010 Total 4,302651 4,658944 4,268316 4,254411 4,752415 Cross-over 3,011856 3,727155 2,987821 2,935544 4,277174 Mutao 1,290795 0,931789 1,280495 1,318867 0,475242

7.2 Relao entre Municpios e Causas Externas de bitos


Para obter as proximidades entre os municpios e as causas externas consideradas, foi empregada a tcnica de Anlise de Correspondncia Simples (AC). O mtodo AC permitiu transformar medidas de contagem de variveis categricas em relacionamentos (distncias) entre coordenadas contnuas dos municpios para as causas. Abaixo apresentada uma tabela que ilustra as contingncias observadas para municpios e causas externas para o ano de 2006. Pelos dados constantes na Tabela 6 no to direta a anlise conjunta de quais relaes entre municpio e causa so mais signicativas, pois no existe uma medida adequada de dissimilaridade. Mas aps a construo do grco perceptual (Figura 6), tudo ca mais claro e direto. Observe nesse grco, por exemplo, que os municpios de Jao Pessoa

(JP), Santa Rita (SR), Bayeux (BA) e Cabedelo (CA) esto todos inter-relacionados com a causa X95, uma vez que todos esses municpios esto prximos dessa causa. Logo, o grco perceptual da AC fornece avaliaes diretas de dissimilaridades entre os elementos estudados simplesmente analisando os seus padres de distncias. Dessa forma, as coordenadas produzidas pela Anlise de Correspondncia para os municpios e causas foram utilizadas para se calcular as distncias (expresso 6.1) entre esses dois conjuntos de elementos. A partir da, essa matriz de distncias fomentou a gerao dos resultados simulados, atravs da execuo do modelo de agrupamento proposto. As demais tabelas de contingncias podem ser encontradas no Anexo A.4.

7.3 Resultados e Discusses


Tabela 7: Tabela de Contingncia para o ano de 2006.

72

Causas Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03 0 0 1 0 0 4 0 1 3 0 0 0 1 0 0 0 38 0 0 0 0 1 0 0 6 0 1 0 0 0 V09 0 0 0 0 0 1 0 0 2 0 2 0 0 0 0 0 4 0 1 0 0 0 0 1 8 2 0 0 0 1 V49 0 0 3 0 0 1 0 0 0 3 0 0 0 0 0 0 4 0 0 0 1 1 0 0 0 1 1 1 0 8 V89 4 7 0 3 3 10 2 1 2 2 78 4 3 2 5 4 38 4 2 3 13 1 13 9 2 1 3 7 1 4 V99 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 2 0 0 3 0 0 0 W19 3 0 0 0 1 2 1 1 1 3 5 0 0 0 1 1 7 0 0 0 1 1 0 0 4 0 0 0 0 0 X70 1 0 0 1 1 0 1 0 0 3 8 1 1 2 2 0 11 1 1 2 6 2 3 0 3 2 0 0 0 0 X95 1 0 1 4 2 32 2 2 11 0 102 3 3 1 7 3 222 3 1 6 12 1 3 1 38 7 11 3 2 5

7.3 Resultados e Discusses


Com as distncias entre municpios e causas externas de bito foi possvel obter as pertinncias de cada municpio para com todas as causas de bito atravs do Modelo Hbrido Gentico Fuzzy (MHGF). Com essas matrizes de pertinncia, basta escolher um ponto de corte (Pc ) para que se tenha os grupos de municpios formados para cada uma das causas. Convm informar que esses Os agrupamentos so bastantes sensveis ao ponto de corte escolhido, em que diferenas por menor que sejam podem favorecer a entrada ou sada de um municpio dentro de um cluster.

7.3 Resultados e Discusses


Figura 8: Grco Perceptual para o Ano de 2006.

73

Nesse trabalho decidiu-se denir os pontos de corte 0,10, 0,20, 0,30 e 0,50, no sentido de facilitar o estudo de possveis impactos dessas escolhas sobre os agrupamentos formados. Por isso, resolveu-se apresentar os resultados comparando os agrupamentos formados para cada um dos pontos de corte considerados em cada ano. Anlise de Sensibilidade e ser discutida na Seo 7.3.1. A essas anlises chamou-se Por outro lado, pensando na

evoluo temporal das inter-relaes entre causas e os principais municpios paraibanos, para um ponto de corte especco, tais municpios foram avaliados. A esse conjunto de resultados, denominou-se Anlise Longitudinal que ser apresentada na Seo 7.3.2.

7.3.1 Anlise de Sensibilidade dos Agrupamentos Formados


A anlise de sensibilidade importante para esclarecer o quanto a escolha de um ponto de corte inuncia os agrupamentos formados. A anlise ser feita de forma grca, em que para cada ano foi construdo grcos perceptuais para cada ponto de corte sugerido. Mais adiante seguem os grcos para os anos de 2006 e 2007 segundo os 4 pontos de corte analisados. Observa-se pelos resultados apresentados que medida que o ponto de corte cresce o nmero de municpios alocados cada uma das 8 causas decresce, o que muito natural, uma vez que aumenta-se a exigncia para que um determinado municpio venha a pertencer a uma certa causa, o nmero de municpios propensos diminui. Os grcos para os demais anos esto apresentados nos anexos desse trabalho. Ainda com relao aos grcos ilustrados nas Figuras 7 e 8, alguns municpios ou causas no aparecem pois as escalas foram diminudas para que fosse possvel visualizar os agrupamentos formados

7.3 Resultados e Discusses

74

numa escala mais extendida. Tambm no foram circulados todos os agrupamentos para que a visualizao no fosse prejudicada. De qualquer forma os agrupamentos formados podem ser observados nas Tabelas de Agrupamentos apresentadas no Anexo A.12, em que o cdigo 1" indica que o municpio pertence causa considerada com base no ponto de corte escolhido. Claramente nota-se que a escolha do ponto de corte impacta, e muito, os agrupamentos formados. Com o ponto de corte

Pc = 0, 10

, por exemplo, o cluster formado pela causa

V 09

(Pedestre traumatizado em acidentes de transporte no especicado) engloba, tambm, todos os municpios pertencentes ao grupo formado pela causa zado em coliso com automvel). J para

V 03

(Pedestre traumati-

Pc = 0, 20

os agrupamentos gerados parecem

ser mais consistentes com um nmero de municpios participantes um pouco menor. Para

Pc = 0, 30, Pc = 0, 50 os agrupamentos formados se mostram mais rigorosos, aproximandose dos mtodos tradicionais que utilizam a losoa Hard" (um municpio alocado para uma, e somente uma, causa). Figura 9: Grcos para os 4 pontos de cortes considerados, 2006.

De um modo geral, o aumento da exigncia, em relao ao ponto de corte, faz com que todos os municpios que pertencem aos grupos considerados de causas externas apresentam, no mnimo, uma inter-relao bastante forte com as respectivas causas. Ainda

7.3 Resultados e Discusses

75

assim, eventualmente, alguns municpios que apresentam uma distncia razoavelmente pequena de uma dada causa no foi incorporado essa causa, o que era para acontecer. Mas esses resultados so compreensveis dada a tamanha complexidade do objeto a ser otimizado, que so as matrizes de pertinncia. Figura 10: Grcos para os 4 pontos de cortes considerados, 2007.

Para o ano de 2007 tambm se observa que medida que o ponto de corte vai aumentando os contornos denem os agrupamentos agrupamentos em torno das causas externas de bitos vo diminuindo apresentando clusters mais coerentes com os pontos de cortes

Pc = 0, 20

ou

Pc = 0, 30.

A Tabela de pertinncias para o no de 2007, bem como para os

demais anos esto no Anexo A.18.

7.4 Anlise Longitudinal das Inter-Relaes entre Municpios e Causas

76

Tabela 8: Pertinncias Obtidas pelo Modelo Hbrido Gentico Fuzzy (MHGF) para o ano de 2006.

PERTINNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,03075 0,04658 0,05378 0,03536 0,02061 0,08763 0,02750 0,04369 0,32223 0,08965 0,04673 0,02465 0,02128 0,04140 0,04228 0,02761 0,11684 0,02883 0,02863 0,04106 0,03203 0,10977 0,04101 0,04149 0,53184 0,06763 0,08659 0,02775 0,05081 0,05198

V09
0,02635 0,08117 0,05760 0,10576 0,01140 0,06264 0,03849 0,14816 0,18362 0,13236 0,04368 0,03437 0,02589 0,03373 0,07992 0,03705 0,10335 0,02099 0,05567 0,07134 0,02368 0,09367 0,07576 0,07610 0,17564 0,19531 0,04020 0,03345 0,14617 0,05716

V49
0,02021 0,03310 0,61335 0,02969 0,01527 0,01013 0,01527 0,00997 0,02528 0,10119 0,02302 0,01447 0,00881 0,01985 0,02255 0,01020 0,01172 0,01864 0,02261 0,02524 0,01402 0,04740 0,02744 0,02962 0,00987 0,01882 0,00904 0,01537 0,01545 0,60973

V89
0,55357 0,23504 0,04038 0,35887 0,55480 0,02384 0,60296 0,11362 0,06495 0,16368 0,29971 0,71602 0,15026 0,23480 0,24708 0,30467 0,02530 0,46794 0,16756 0,14215 0,14074 0,10280 0,27527 0,23819 0,03101 0,13083 0,15430 0,09941 0,15790 0,04095

V99
0,05922 0,21898 0,08655 0,06967 0,01804 0,01492 0,04116 0,07855 0,04611 0,13638 0,03607 0,03994 0,12619 0,10536 0,13588 0,05290 0,01673 0,03033 0,11140 0,11403 0,06289 0,22012 0,19233 0,23811 0,03862 0,09361 0,06876 0,18158 0,09584 0,08886

W19
0,05031 0,08080 0,04880 0,13547 0,02773 0,05345 0,06094 0,27135 0,04426 0,09120 0,09600 0,04197 0,08342 0,05189 0,11156 0,23571 0,05030 0,04520 0,17754 0,20136 0,04597 0,12355 0,07885 0,07712 0,04121 0,32485 0,29913 0,09242 0,31653 0,05077

X70
0,22818 0,25291 0,04882 0,16913 0,25502 0,02861 0,16120 0,03696 0,08140 0,18195 0,30469 0,08208 0,52909 0,41416 0,29931 0,29226 0,02928 0,27780 0,32501 0,26264 0,59336 0,14408 0,26268 0,25374 0,02938 0,06205 0,21862 0,49118 0,08399 0,05044

X95
0,03142 0,05142 0,05072 0,09605 0,09713 0,71878 0,05248 0,29771 0,23217 0,10359 0,15009 0,04650 0,05505 0,09881 0,06141 0,03960 0,64648 0,11028 0,11158 0,14218 0,08731 0,15862 0,04666 0,04564 0,14244 0,10690 0,12338 0,05884 0,13332 0,05012

7.4 Anlise Longitudinal das Inter-Relaes entre Municpios e Causas


As causas externas de bito vm evoluindo no necessariamente de forma crescente ao longo dos anos. A cada ano, novas estruturas de inter-relacionamento entre municpios e causas externas so formadas. Devido o comportamento dinmico das causas externas, faz-se necessrio avaliar tais inter-relacionamentos segundos os anos. A anlise se con-

ter em avaliar avaliar evoluo temporal das causas que mais acomentem os principais

7.4 Anlise Longitudinal das Inter-Relaes entre Municpios e Causas


municpios da Paraba.

77

Para a anlise no car muito tediosa e nem repetitiva, e ao

mesmo tempo, para torna-la representativa do universo estudado, decidiu-se escolher os municpios de Joo Pessoa, Campina Grande, Cabedelo e Bayeux. Eventuais municpios que merecerem algum destaque podero ser citados na anlise. O ponto de corte escolhido para formar os agrupamentos foi

Pc = 0, 20.

Toda a anlise que ser feita em cima

desses quatro municpios pode ser naturalmente reproduzidas para os demais municpios paraibanos considerados neste trabalho. Desse modo, foi observado que para o ponto de corte adotado, o municpio de Joo Pessoa sempre esteve associado causa

X95 referente a homicdios por arma de fogo, para

todos os anos. Ainda para o ano de 2006, o municpio que apresentou inter-relacionamento com os bitos por homicdios provocados por arma de fogo, alm de Joo Pessoa e Bayeux foi o municpio de Caapor. Todos os resultado aqui comentados podem ser encontrados na tabela abaixo para os 5 anos considerados para

Pc = 0, 20.

Tabela 9: Evoluo das inter-relaes entre municpios e causas externas para o ponto de corte 0,20.

Ano JOO PESSOA 2006 2007 2008 2009 2010 X95 X95 X95 X95 X95

Municpio CAMPINA GRANDE X70; V89 V89 W19; X95 V89 V89; X95 CABEDELO X95; V03 W19; X95 X95 V03 V03; V99; X95 BAYEUX X95 V03 X95 V09 X95

Ainda em 2006, observa-se que o municpio de Campina Grande (CG) apresenta associao com a causa

V 89 referente acidentes com veculos a motor ou no motorizados de V 03


referente pedestre trau-

tipo no especicado. O municpio de Cabedelo (CA), apesar de relativamente prxima da causa

X95,

foi includo no cluster formado pela causa

matizado em coliso com automvel, juntamente com o municpio de Santa Rita (SR). No ano de 2007 observou-se que mais municpios foram incorporados ao cluster formado pela causa de homicdio provocado por arma de fogo. Os municpios que esto contidos nesse agrupamento so os mesmos do ano de 2006 (Joo Pessoa, Bayeux, Santa Rita e Caapor) mais os municpios de Pedras de Fogo (PE), Patos (PA) e Catol do Rocha. Para esse ano o municpio de Campina Grande (CG) apresentou mais relao com acidentes acidentes de transporte. No ano de 2008, Joo Pessoa, Santa Rita, Cabedelo e o municpio de Patos (ver no anexo), continuam apresentando relaes signicativas com a causa de bito por homi-

7.4 Anlise Longitudinal das Inter-Relaes entre Municpios e Causas

78

cdios por arma de fogo e o municpio Bayeux no foi mais includo nesse agrupamento, mostrando possivelmente uma melhora nas polticas de seguranas pblicas desse municpio. O municpio de Campina Grande continua apresentando inter-relacionamento

mais forte com a causa

V 89.

J no ano de 2009 foi observado que apenas a cidade de

Joo Pessoa apresentou um relacionamento com a causa de bito

X95

e os municpios de

Santa Rita (SR), Caapor (CA) e Bayeux caram bastante prximos mas no chegaram a pertencer a este agrupamento. O municpio de Campina Grande para este ano no

apresentou inter-relacionamento com nenhuma causa de externa de bito. No ano de 2010, observou-se que muitos municpios que em 2009 no apresentaram inter-relacionamentos voltaram a reetir as mesmas relaes dos anos anteriores 2009. O municpio de Campina Grande voltou a apresentar um inter-relacionamento considervel com a causa externa de bito

V 89 causa esta voltada aos acidentes de transporte.

Observa-

se que em nenhum momento Joo Pessoa esteve longe da causa de bito de homicdio por arma de fogo (X95) mostrando sua forte ligao para esta prtica de homicdio. importante vericar que uma caracterstica muito peculiar do mtodo MHGF so as interseces enter os agrupamentos mostrando a exibilidade do modelo. Vale

lembrar que interpretaes espaciais podem ser tomadas partindo do pressuposto que os municpios dentro do mesmo agrupamento so vizinhos geogracamente, como o caso dos municpios de Joo Pessoa, Bayeux, Cabedelo e Santa Rita que possivelmente formam um conglomerado espacial em torno da causa de bito por homicdio provocados por arma de fogo.

79

Concluses e Sugestes de Trabalhos Futuros

Este trabalho apresentou um novo mtodo para agrupamento de dados utilizando a Lgica Nebulosa Fuzzy em paralelo com Algoritmos Genticos. O mtodo, em geral, apresentou resultados bastante satisfatrios, nos remetendo a agrupamentos que j eram esperados subjetivamente devido a vivncia com os dados e com proximidades espaciais. Tais resultados tambm esto de acordo com os levantamentos feito pela Secretaria de Sade da Paraba, mostrando assim, uma coerncia nos agrupamentos encontrados. Isso mostra que o modelo proposto pode ser tambm indicado quando se deseja identicar agrupamentos espaciais, em que no se faz necessrio utilizar shapes de mapas geogrcos, mesmo no sendo uma especialidade do metodologia sugerida. O modelo hbrido ainda pode ser recomendado para os casos em que se deseje identicar agrupamentos em torno de variveis especcas, tais como PIB ou IDH, o que os demais mtodos de agrupamentos no conseguem tratar. Em resumo, pode-se armar que a modelagem proposta nesse

trabalho servir como uma alternativa para estudos em que se necessite investigar padres multivariados de inter-relacionamentos. Mas ainda no foi feito tudo em relao ao Modelo Hbrido Gentico Fuzzy. Uma sugesto de trabalho futuro seria a otimizao do parmetro m de fuzzicao, que nesse trabalho, utilizou-se

m = 2.

Uma outra possibilidade seria a

otimizao do ponto de corte (Pc ), no sentido de gerar grupos o mais homogneo possvel ou at mesmo a implementao de outros modelos hbridos que envolvam, por exemplo, (a) Algoritmo Scan com Algoritmo Gentico; (b) Estimao de densidades Kernel com Algoritmos de Colnia de Formigas ou (c) Fuzzy C-Means com Redes Neurais.

80

ANEXO A - Cdidos de Programao -

A.1 Cdigo em R do exemplo de otimizao da funo f () do Captulo 5


rm(list = ls(all = TRUE)) tempo = Sys.time() require(Rlab) # Carrega o pacote para geracao de numeros pseudo-aleatorios Bernoulli f <- function(teta,...){ 6 + (teta^(2))*sin(14*teta) } # Contruindo a crusa da funcao f(teta) #curve(6 + (x^2)*sin(14*x), -2.5, 2.5, xlab = expression(paste(theta)), ylab = expression(f(paste(theta)))) geracao_inicial = teta = runif(8000,-2.5,2.5) i <- 1 # Contador das geracoes for(i in 1:300){ F0 = f(teta) F0_D = sort(F0, decreasing = TRUE, index.return #organizada de forma decrescente teta_D = teta[F0_D$ix] # Valores de teta organizados de forma #decrescente segundo a funcao objetivo no ponto teta. Prop = abs(F0_D$x)/sum(abs(F0_D$x)) # Proporcoes acumulado = cumsum(Prop) # Proporcao acumulada Roleta = runif(1, min = min(acumulado), max = 1) # Numero pseudo-aleatorio no intervalo [0,1] teta1 = min(acumulado[acumulado >= Roleta]) pteta1 = (1:length(acumulado))[acumulado == teta1] # Posicao do valor de teta #selecionado pela roleta para o teta1 Roleta = runif(1, min = min(acumulado), max = 1) teta2 = min(acumulado[acumulado >= Roleta]) pteta2 = (1:length(acumulado))[acumulado == teta2] # Posicao do valor de teta #selecionado pela roleta para o teta2 ##### CROSSOVER cross = rbern(1, 0.8) # Se o valor e 1 havera crossover. if(cross == 1){ F_teta1 = f(teta1)^(-1) # Funcao objetivo no valor de teta1 - 1 # Permite que o numero esteja no dominio repeat{ teta1 = rnorm(1,teta1, F_teta1) # NUM4 vai ser o novo teta2 if(teta1 >= -2.5 && teta1 <= 2.5) break } = TRUE) # Funcao objetivo

A.1 Cdigo em R do exemplo de otimizao da funo f () do Captulo 5


F_teta2 = f(teta2)^(-1) # Funcao objetivo no valor de teta2 - 1 # Permite que o numero esteja no dominio repeat{ teta2 = rnorm(1,teta2, F_teta2) # NUM5 vai ser o novo teta1 if(teta2 >= -2.5 && teta2 <= 2.5) break } #teta_D[c(pteta1,pteta2)] = c(teta2,teta1) #forma de troca de material genetico #teta_D = teta = sort(teta_D, decreasing = TRUE, index.return #dois novos valores otimos F_tetas = f(c(teta2,teta1)) # Funcoes objetivos F1 = F_tetas[1] # Funcao objetivo de teta1 caso exista um crossover F2 = F_tetas[2] # Funcao objetivo de teta2 caso exista um crossover } #} if(cross == 0){ F1 = F_teta1 = f(teta1) # Funcao objetivo de teta1 caso nao exista um crossover F2 = F_teta2 = f(teta2) # Funcao objetivo de teta2 caso nao exista um crossover } #} ##### MUTACAO mut = rbern(1, 0.1) # Se o valor e 1 havera mutacao. if(mut == 1){ M1 = runif(1,-1/i,1/i) # Obs: O intervalo vai diminuindo a cada interacao M2 = runif(1,-1/i,1/i) teta1 = teta1 + M1 teta2 = teta2 + M2 if(teta1 < -2.5 || teta1 > 2.5){ teta1 = sample(size = 1, x = c(-2.5,2.5)) } if(teta2 < -2.5 || teta2 > 2.5){ teta2 = sample(size = 1, x = c(-2.5,2.5)) } F_tetas = f(c(teta2,teta1)) # Funcoes objetivos F1 = F_tetas[1] # Funcao objetivo de teta1 caso exista uma mutacao F2 = F_tetas[2] # Funcao objetivo de teta2 caso exista uma mutacao } FO = f(c(teta1,teta2)) # Vetor com as duas funcoes objetivos PFO_MAX = which(FO == max(FO)) # Posicao da FO maxima if(length(PFO_MAX) > 1) PFO_MAX = 1 PFO_MIN = which(FO == min(FO)) # Posicao da FO minima if(length(PFO_MIN) > 1) PFO_MIN = 1 FO_MAX = FO[PFO_MAX] logico = FO_MAX > F0_D$x logico = length(logico[logico == TRUE]) # Caso maior ou igual a 1 existe ao #menos um valor que seja menor que FO_MAX TETA = c(teta1,teta2) #Guardando as funcoes objetivos mais adaptadas e colocando na populacao #para fazer parte do processo de roleta. if(logico > 0){ = F) #F_tetas = f(teta_D[c(pteta1,pteta2)]) ############### Funcao objetivo dos # Os tetas sao trocados como uma

81

A.2 Cdigo em SAS do exemplo de otimizao da funo f () do Captulo 5


#teta_D[c(pteta1,pteta2)] = c(teta2,teta1) #uma forma de troca de material genetico #teta_D = teta = sort(teta_D, decreasing = TRUE, index.return #dos dois novos valores otimos F0_D$x[length(F0_D$x)] = FO_MAX teta_D[length(F0_D$x)] = TETA[PFO_MAX] F0_D$x = sort(F0_D$x, decreasing = TRUE, index.return teta_D = teta = teta[F0_D$ix] } } Prop acumulado teta F0_D$x #f(2.360511947) = tempo = tempo 10.71240 Sys.time() - tempo = TRUE) = F) #F_tetas = f(teta_D[c(pteta1,pteta2)]) ############### Funcao objetivo # Os tetas sao trocados como

82

A.2 Cdigo em SAS do exemplo de otimizao da funo f () do Captulo 5


/* ================================================== = = = = = = = = ================================================== PARMETROS DE ENTRADA: NIT; PRR; PRM; * NMERO DE ITERAES; * PROBABILIDADE DE CROSSOVER(RECOMBINAO); AUTOR: CRIADO: JOAB DE OLIVEIRA 29/10/2010 ATUALIZADO: 02/11/2010 ALGORITMO ALGORITMO GENTICO

* PROBABILIDADE DE MUTAO; NSE; * NMERO DE SOLUES DE ELITE; EPS; * EPSLON (ERRO ADMISSVEL DE PARADA); TAM_POP; * TAMANHO DA POPULAO INICIAL; */ %MACRO GA_SIMPLES(NIT,PRR,PRM,NSE,EPS,TAM_POP);

DATA POP_INICIAL; DO I=1 TO &TAM_POP;

A.2 Cdigo em SAS do exemplo de otimizao da funo f () do Captulo 5


TETA=-2.5+5*RANUNI(0); FO=6+(TETA**2)*SIN(14*TETA); OUTPUT; END; DROP I; RUN; PROC IML SYMSIZE=300 WORKSIZE=400; USE POP_INICIAL; READ ALL INTO POP_INICIAL; NIT=&NIT; PRR=&PRR; PRM=&PRM; NSE=&NSE; EPS=&EPS; TAM_POP=&TAM_POP; LISTA_SOLUCOES=J(TAM_POP,4,.); SOMA_FO=POP_INICIAL[+,2]; DO I=1 TO TAM_POP; LISTA_SOLUCOES[I,1]=POP_INICIAL[I,1]; LISTA_SOLUCOES[I,2]=POP_INICIAL[I,2]; LISTA_SOLUCOES[I,3]=POP_INICIAL[I,2]/SOMA_FO; IF I=1 THEN LISTA_SOLUCOES[I,4]=LISTA_SOLUCOES[I,3]; ELSE LISTA_SOLUCOES[I,4]=LISTA_SOLUCOES[I-1,4]+LISTA_SOLUCOES[I,3]; END; /* ORDENA A COLUNA DE PROPORES DECRESCENTEMENTE */ CALL SORT (LISTA_SOLUCOES,{2},{2});

83

/* INICIA DE EVOLUO DO ALGORITMO GENTICO */ DO IT=1 TO NIT; *RESET PRINT; IF IT=1 THEN SOLUCOES_ELITE=LISTA_SOLUCOES[1:NSE,1:2]; NUM1=RANUNI(0); NUM2=RANUNI(0); DO I=1 TO TAM_POP; IF NUM1<=LISTA_SOLUCOES[I,4] THEN DO; SOL1=LISTA_SOLUCOES[I,1]; FO1=LISTA_SOLUCOES[I,2]; I=16; END; END; DO I=1 TO TAM_POP;

A.2 Cdigo em SAS do exemplo de otimizao da funo f () do Captulo 5


IF NUM2<=LISTA_SOLUCOES[I,4] THEN DO; SOL2=LISTA_SOLUCOES[I,1]; FO2=LISTA_SOLUCOES[I,2]; I=16; END; END; OCOR_CROSS=RANBIN(0,1,PRR); OCOR_MUT=RANBIN(0,1,PRM); IF OCOR_CROSS=1 THEN DO; SIG_SOL1=1/FO1; SIG_SOL2=1/FO2; NUM4=SOL1+SIG_SOL1*RANNOR(0); NUM5=SOL2+SIG_SOL2*RANNOR(0); IF NUM5>2.5 THEN SOL1_=2.5; ELSE DO; IF NUM5<-2.5 THEN SOL1_=-2.5; ELSE DO; SOL1_=NUM5; END; END; IF NUM4>2.5 THEN SOL2_=2.5; ELSE DO; IF NUM4<-2.5 THEN SOL2_=-2.5; ELSE DO; SOL2_=NUM4; END; END; END; ELSE DO; SOL1_=SOL1; FO1_=FO1; SOL2_=SOL2; FO2_=FO2; END; IF OCOR_MUT=1 THEN DO; ERR1=(-1/IT)+(2/IT)*RANUNI(0); ERR2=(-1/IT)+(2/IT)*RANUNI(0); SOL1_=SOL1_+ERR1; SOL2_=SOL2_+ERR2; IF SOL1_>2.5 THEN SOL1_=2.5;

84

A.2 Cdigo em SAS do exemplo de otimizao da funo f () do Captulo 5


ELSE DO; IF SOL1_<-2.5 THEN SOL1_=-2.5; END; IF SOL2_>2.5 THEN SOL2_=2.5; ELSE DO; IF SOL2_<-2.5 THEN SOL2_=-2.5; END; END; FO1_=6+(SOL1_**2)*SIN(14*SOL1_); FO2_=6+(SOL2_**2)*SIN(14*SOL2_); DO I=1 TO TAM_POP; IF FO1_>LISTA_SOLUCOES[I,2] THEN DO; NOVAS_SOLUCOES[TAM_POP,1]=SOL1_; NOVAS_SOLUCOES[TAM_POP,2]=FO1_; CALL SORT (NOVAS_SOLUCOES,{2},{2}); IF I<=5 THEN DO; IF FO1_>SOLUCOES_ELITE[I,2] THEN DO; SOLUCOES_ELITE[5,1]=SOL1_; SOLUCOES_ELITE[5,2]=FO1_; END; END; I=TAM_POP+1; END; END; DO I=1 TO TAM_POP; IF FO2_>NOVAS_SOLUCOES[I,2] THEN DO; NOVAS_SOLUCOES[TAM_POP,1]=SOL2_; NOVAS_SOLUCOES[TAM_POP,2]=FO2_; CALL SORT (NOVAS_SOLUCOES,{2},{2}); IF I<=5 THEN DO; IF FO2_>SOLUCOES_ELITE[I,2] THEN DO; SOLUCOES_ELITE[I,1]=SOL2_; SOLUCOES_ELITE[I,2]=FO2_; CALL SORT (SOLUCOES_ELITE,{2},{2}); END; END; I=TAM_POP+1; END; END;

85

A.3 Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means

86

NA MATRIZ NOVAS_SOLUCOES */ LISTA_SOLUCOES=NOVAS_SOLUCOES; LISTA_SOLUCOES[,3]=LISTA_SOLUCOES[,2]/LISTA_SOLUCOES[+,2]; CALL SORT (LISTA_SOLUCOES,{2},{2}); DO I=1 TO TAM_POP; IF I=1 THEN LISTA_SOLUCOES[I,4]=LISTA_SOLUCOES[I,3]; ELSE LISTA_SOLUCOES[I,4]=LISTA_SOLUCOES[I-1,4]+LISTA_SOLUCOES[I,3]; END; END; QUIT; %MEND GA_SIMPLES; /* EXECUTA A MACRO GA_SIMPLES*/ %GA_SIMPLES(50,0.85,0.10,5,0.000001,200);

A.3 Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means


######################################### # # MTODO HBRIDO GENTICO FUZZY # # #Criado por: Pedro Rafael Diniz Marinho #Ter 07 Dez 2010 23:26:15 BRT #rm(list = ls(all = TRUE)) # Apagar todos os objetos require(Rlab) # Carrega o pacote para geracao de numeros pseudo-aleatorios Bernoulli require(MASS) # Permite salvar a matriz de pertinencia otima usando o objeto write.matrix() # A funcao MP gera uma matriz de pertinencia com as dimensoes desejadas. # A matriz e gerada aleatoriamente por uma distribuicao de Poisson com parametro tambem aleatorio # com distribuicao uniforme no intervalo [1,100]. MP <- function(row, col){ U = matrix(1:row*col,row,col) i = 1 while(i<=row){ linha = c(prop.table(rpois(col,runif(1,1,100))^10)) U[i,] = linha i = i + 1 } return(U) } # A funcao NMP gera o numero de matrizes de pertinencias U com as dimensoes # desejadas. NMP <- function(n,row,col){ # ######################################### #

A.3 Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means


i = 1 U <- NULL while(i<=n){ U = cbind(U,MP(row,col)) i = i+1 } return(array(U,dim=c(row,col,n))) } # A funcao R calcula o produto entre as matrizes de #pertinencias e a matriz de distancias ao quadrado. # Devese entrar com a matriz de pertinencias, matrizes de distancias e o numero # POP -- Matrizes de pertinencias geradas pela funcao NMP; # d i = 1 R = array(, dim = c(dim(POP[,,1])[1], dim(POP[,,2])[2], length(POP)/(dim(POP[,,1])[1]*dim(POP[,,1])[2]))) while(i<=length(POP)/(dim(POP[,,1])[1]*dim(POP[,,1])[2])){ R[,,i] = ((POP[,,i]^(2))*(d^2)) i = i + 1 } return(R) } # A funcao J.1 e a funcao objetivo que queremos otimizar J(x). # Ou seja, e calculado as somas de cada uma das matrizes R. J.1 <- function(R){ i = 1 SR <- NULL while(i<=length(R)/(dim(R[,,1])[1]*dim(R[,,1])[2])){ SR = c(SR,sum(R[,,i])) i = i + 1 } return(SR) } ############# Metodo GA #d <- matrix(c(runif(15,0,10)),5,3) # Matriz de distancias. Esta matriz e fixa. i = 1 T = Sys.time() # Tempo inicial. POP = NMP(1000,29,8) # Populacao inicial com 15 matrizes de pertinencias 5 por 3. for(i in 1:50000){ Matrizes_R = R(POP,d) FO = J.1(Matrizes_R) # Funcoes objetivos calculadas para cada matriz R. FO_D = sort(FO, decreasing = FALSE, index.return Prop = abs(FO_D$x)/sum(abs(FO_D$x)) # Proporcoes acumulado = cumsum(Prop) # Proporcao acumulada ordenado #acumulado = sort(prop.table(rpois(length(FO_D$ix),runif(1,1,100))^10),decreasing = TRUE) = TRUE) # Ordenando de forma crescente -- Matrizes de distancias gerada pela Analise de Correspondencia. R <- function(POP,d){

87

Roleta = runif(2, min(acumulado), max(acumulado)) # Gera dois numeros aleatorios no intervalo [0,1] PR1 = PU1 = which(acumulado == min(acumulado[acumulado >= Roleta[1]])) # Posicao da primeira matriz U / R PR2 = PU2 = which(acumulado == min(acumulado[acumulado >= Roleta[2]])) # Posicao da segunda matriz U / R n = length(POP)/(dim(POP[,,1])[1]*dim(POP[,,1])[2]) # Numero de matrizes iniciais. PR1 = n - PR1 + 1 PR2 = n - PR2 + 1

A.3 Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means


R1 = Matrizes_R[,,PR1] # Matriz R1 R2 = Matrizes_R[,,PR2] # Matriz R2 U1 = as.matrix((POP[,,PU1])) # Matriz U1 U2 = as.matrix((POP[,,PU2])) # Matriz U2 #Crossover cross = rbern(1, 0.85) # Se o valor e 1 havera crossover. if(cross == 1){ SR1 = apply(R1,1,sum) # Soma das linhas da matriz R1 SR2 = apply(R2,1,sum) # Soma das linhas da matriz R2 linha_ord1 = sort(SR1, decreasing = FALSE, index.return #somas da matriz R1 linha_ord2 = sort(SR2, decreasing = FALSE, index.return #menores somas da matriz R2 acumulado1 = sort(prop.table(rpois(dim(R1)[1],runif(1,1,100))^10),decreasing = TRUE) acumulado2 = sort(prop.table(rpois(dim(R2)[1],runif(1,1,100))^10),decreasing = TRUE) Roleta1 = runif(1,0,max(acumulado1)) Roleta2 = runif(1,0,max(acumulado2)) Roleta = c(Roleta1,Roleta2) #Prop1 = abs(linha_ord1$x)/sum(abs(linha_ord1$x)) #acumulado1 = cumsum(Prop1) #Prop2 = abs(linha_ord2$x)/sum(abs(linha_ord2$x)) #acumulado2 = cumsum(Prop2) PL1 = min(which(acumulado1 == min(acumulado1[acumulado1 >= Roleta[1]]))) # Posicao da matriz #R1 que ira sofrer crossover PL2 = min(which(acumulado2 == min(acumulado2[acumulado2 >= Roleta[2]])))# Posicao da matriz #R2 que ira sofrer crossover L1U = U1[PL1,] # Elementos da linha da matriz U1 que sera jogado na matriz U2 L2U = U2[PL2,] # Elementos da linha da matriz U2 que sera jogado na matriz U1 U1[PL1,] = L2U U2[PL2,] = L1U } ################# # Mutacao mut = rbern(1, .05) # Se o valor e 1 havera mutacao. if(mut == 1){ PL1 = trunc(runif(1,1,dim(POP[,,1]))[1]) PL2 = trunc(runif(1,1,dim(POP[,,1]))[1]) # Troca duas linhas da matriz U1 L1 = U1[PL1,] L2 = U1[PL2,] U1[PL2,] = L1 U1[PL1,] = L2 # Seleciona uma linha da matriz U1 e gera uma nova linha linha_troca = round(runif(1,1,dim(U1)[1]),digits = 0) linha = c(prop.table(rpois(dim(U1)[2],runif(1,1,100))^round(runif(1,10,30),digits = 0) )) U1[linha_troca,] = linha } FU1 = sum((U1*(d^2))) # Funcao objetivo para o valor de U1 FU2 = sum((U2*(d^2))) # Funcao objetivo para o valor de U2 logico1 = FU1 > FO_D$x logico2 = FU2 > FO_D$x logico1 = length(logico1[logico1 == TRUE]) # A funcao objetivo em U1 eh maior #que ao menos uma funcao objetivo da minha geracao anterior? logico2 = length(logico2[logico2 == TRUE]) # A funcao objetivo em U1 eh maior # Filho 1 # Filho 2 = TRUE) # Ordenando as linhas com

88

= TRUE) # Ordenando as linhas com menores

A.3 Cdigo da Anlise de Correspondncia e Mtodo Fuzzy-C-Means


#que ao menos uma funcao objetivo da minha geracao anterior? substituir = FO_D$ix[c(length(acumulado)-1,length(acumulado))] if(logico1>=1){ POP[,,substituir[1]] = U2 } if(logico2>=1){ POP[,,substituir[2]] = U1 } Matrizes_R = R(POP,d) FO = J.1(Matrizes_R) # Funcoes objetivos calculadas para cada matriz R. FO_D = sort(FO, decreasing = FALSE, index.return } T1 = Sys.time() Tempo = T1 - T FO_D$x[1:3] FO_D$ix[1:3] POP[,,FO_D$ix[1]] d write.matrix(d,"Distancias_2010.csv") write.matrix(as.matrix(POP[,,FO_D$ix[1]]),"Pertinencias_2010.csv") = TRUE)

89

A.4 Tabelas de Contingncias

90

A.4 Tabelas de Contingncias


A.4.1 Ano de 2006
Tabela 10: Tabela de Contingncia para o Ano de 2006.

Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO

V03 0 0 1 0 0 4 0 1 3 0 0 0 1 0 0 0 38 0 0 0 0 1 0 0 6 0 1 0 0 0

V09 0 0 0 0 0 1 0 0 2 0 2 0 0 0 0 0 4 0 1 0 0 0 0 1 8 2 0 0 0 1

V49 0 0 3 0 0 1 0 0 0 3 0 0 0 0 0 0 4 0 0 0 1 1 0 0 0 1 1 1 0 8

V89 4 7 0 3 3 10 2 1 2 2 78 4 3 2 5 4 38 4 2 3 13 1 13 9 2 1 3 7 1 4

V99 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 2 0 0 3 0 0 0

W19 3 0 0 0 1 2 1 1 1 3 5 0 0 0 1 1 7 0 0 0 1 1 0 0 4 0 0 0 0 0

X70 1 0 0 1 1 0 1 0 0 3 8 1 1 2 2 0 11 1 1 2 6 2 3 0 3 2 0 0 0 0

X95 1 0 1 4 2 32 2 2 11 0 102 3 3 1 7 3 222 3 1 6 12 1 3 1 38 7 11 3 2 5

A.4 Tabelas de Contingncias

91

A.4.2 Ano de 2007


Tabela 11: Tabela de Contingncia para o Ano de 2007.

Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO

V03 0 0 0 0 0 6 0 0 2 0 0 0 0 0 0 1 21 0 1 0 0 0 0 0 2 0 0 0 0 1

V09 0 0 0 0 0 7 0 0 2 0 0 0 1 0 0 0 8 0 2 0 0 3 0 0 7 0 0 0 0 0

V49 1 0 0 0 0 1 0 0 1 1 3 0 0 0 0 2 6 0 3 0 3 0 0 0 1 2 1 1 0 0

V89 0 3 1 1 2 5 5 2 3 2 103 2 0 3 6 3 38 3 2 7 6 2 9 6 3 6 0 1 6 1

V99 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 1 0 14 0 0 0

W19 0 0 0 0 0 2 0 0 2 1 4 0 1 0 0 0 7 1 0 1 0 0 2 0 1 0 0 1 0 0

X70 1 0 0 1 2 3 0 0 2 3 15 2 0 1 1 1 12 2 0 1 5 0 3 0 5 1 1 0 0 0

X95 1 0 2 2 2 41 7 6 20 1 98 7 1 3 6 1 273 3 1 1 19 9 4 0 38 3 13 2 1 0

A.4 Tabelas de Contingncias

92

A.4.3 Ano de 2008


Tabela 12: Tabela de Contingncia para o Ano de 2008.

Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO

V03 1 0 0 0 0 7 0 2 6 2 1 0 1 0 0 1 28 0 1 0 2 2 0 0 6 0 0 0 0 0

V09 1 0 0 0 0 3 0 0 1 0 0 0 1 0 0 0 6 0 0 0 1 0 0 0 4 0 1 1 0 1

V49 1 0 0 0 0 4 0 0 0 1 4 0 0 0 0 0 4 0 1 0 2 1 0 0 1 0 2 0 0 0

V89 0 3 3 2 3 7 2 1 3 3 74 2 3 5 4 3 49 3 4 3 8 3 11 5 6 0 2 2 5 4

V99 1 0 0 0 0 2 0 0 0 2 0 0 0 0 0 0 2 0 0 0 0 0 0 0 2 0 4 0 0 0

W19 2 1 0 1 1 2 0 0 1 0 8 0 0 0 1 0 16 0 2 0 0 0 2 0 0 1 2 0 0 0

X70 4 4 0 0 0 5 0 0 0 1 11 1 0 0 1 2 13 4 0 1 4 0 3 1 1 2 3 0 1 4

X95 0 3 4 1 0 43 3 2 16 0 88 4 1 1 5 2 296 3 5 3 49 2 4 2 62 2 12 2 3 3

A.4 Tabelas de Contingncias

93

A.4.4 Ano de 2009


Tabela 13: Tabela de Contingncia para o Ano de 2009.

Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO

V03 0 0 0 0 0 3 0 0 0 2 0 0 0 0 0 0 13 0 1 0 0 1 0 0 4 0 0 1 0 0

V09 1 0 0 0 0 2 0 2 0 1 0 0 0 0 0 0 8 0 0 0 0 0 0 0 2 0 0 0 0 0

V49 0 0 0 0 0 0 0 1 1 2 1 1 0 0 0 0 8 0 0 0 1 0 0 0 0 2 4 2 0 1

V89 1 3 2 3 8 5 1 4 6 1 39 5 4 5 4 4 47 4 7 12 19 2 11 6 13 6 2 2 2 6

V99 5 0 0 0 0 1 0 0 0 0 0 0 0 0 0 2 0 0 1 0 0 0 0 0 0 0 1 3 0 0

W19 1 3 1 1 0 2 1 0 0 1 19 0 0 1 0 0 7 2 0 1 4 0 1 1 3 0 1 0 2 1

X70 4 1 3 1 1 1 1 0 0 2 10 0 0 2 4 2 13 2 2 0 5 2 3 0 1 2 2 0 0 2

X95 1 1 10 0 8 74 1 7 41 4 124 12 8 2 7 2 358 7 12 0 47 10 11 1 57 15 25 1 7 7

A.4 Tabelas de Contingncias

94

A.4.5 Ano de 2010


Tabela 14: Tabela de Contingncia para o Ano de 2010.

Municipio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO

V03 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 12 0 1 0 0 0 0 0 1 0 0 0 0 0

V09 0 0 2 0 0 0 0 0 1 0 0 0 0 0 0 1 5 0 0 0 0 0 0 0 0 0 0 0 0 0

V49 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 7 0 2 0 2 0 0 0 0 0 0 0 0 1

V89 0 0 3 1 1 2 1 1 1 2 30 0 2 5 2 1 21 1 3 2 7 0 3 1 2 2 1 1 3 4

V99 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0

W19 0 1 0 1 0 0 0 1 0 0 4 0 0 0 1 0 3 1 0 1 1 0 2 1 0 0 1 0 0 0

X70 1 1 0 0 0 1 0 0 1 1 7 0 1 0 0 0 4 0 0 0 3 2 0 1 1 0 0 0 0 0

X95 0 1 4 2 2 30 2 4 15 2 57 2 2 2 1 5 174 1 4 1 13 4 3 1 26 4 15 0 0 4

A.5 Distncias entre Municpios e Causas Externas de bitos.

95

A.5 Distncias entre Municpios e Causas Externas de bitos.


A.5.1 Ano de 2006
Tabela 15: Distncias Calculadas entre Municpios e Causas Externas de bito, 2006.

DISTNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


1,56922 2,20388 3,56480 1,16771 1,42047 0,55237 1,29037 0,56817 0,25452 2,23608 1,10066 1,41368 1,27742 1,65418 1,15252 1,31944 0,39560 1,41368 1,21389 1,05503 1,32784 1,56275 1,82967 2,01969 0,24230 0,68086 1,01621 1,55181 0,89715 2,69756

V09
1,32748 1,97920 3,41819 0,96040 1,19177 0,35711 1,06053 0,37321 0,24421 1,97980 0,89921 1,19777 1,04674 1,42067 0,93789 1,10245 0,26698 1,19777 0,98367 0,84862 1,08362 1,28325 1,60402 1,78175 0,21809 0,40237 0,74652 1,28435 0,72062 2,49998

V49
3,14922 3,58575 0,69537 3,27351 3,21846 3,13686 3,17215 3,14156 3,23211 1,45506 3,28010 3,30936 3,16277 3,25488 3,22821 3,26836 3,19386 3,30936 3,14984 3,24030 3,06907 2,25249 3,39763 3,34965 3,20656 2,69704 2,82085 2,83110 3,30654 0,51193

V89
0,17017 0,75182 3,83400 0,30750 0,03740 0,90251 0,16730 0,88695 1,22088 1,85022 0,37893 0,09201 0,18147 0,20492 0,30838 0,14998 1,06669 0,09201 0,24394 0,41152 0,19666 0,99110 0,37660 0,57106 1,22327 1,01586 0,59109 0,44182 0,59881 2,73445

V99
0,57096 0,65194 3,59144 1,02372 0,75417 1,51880 0,84457 1,50596 1,84091 1,48296 1,08986 0,82945 0,85128 0,57740 1,00722 0,88173 1,68871 0,82945 0,90394 1,10520 0,75658 0,85636 0,58736 0,43919 1,83606 1,44073 1,02730 0,48944 1,29591 2,46060

W19
0,65489 1,32449 3,40997 0,44043 0,55814 0,46886 0,43775 0,45955 0,77680 1,60795 0,42384 0,60097 0,42314 0,76219 0,39720 0,51548 0,63156 0,60097 0,37212 0,37668 0,41588 0,75869 0,95618 1,10705 0,76862 0,42151 0,06819 0,58901 0,44364 2,36050

X70
0,29480 0,96508 3,58834 0,31489 0,23043 0,75378 0,16517 0,74012 1,07791 1,64605 0,36154 0,30745 0,15796 0,40443 0,27970 0,26025 0,92394 0,30745 0,17044 0,35791 0,06763 0,77168 0,59998 0,74773 1,07521 0,77899 0,34062 0,32440 0,53875 2,49866

X95
1,06789 1,68524 3,67786 0,64634 0,90830 0,07591 0,78085 0,08046 0,28037 2,06520 0,57805 0,89398 0,76886 1,14371 0,63440 0,80088 0,12841 0,89398 0,70607 0,53432 0,83391 1,26656 1,31269 1,51068 0,28476 0,50779 0,60462 1,10258 0,37395 2,70220

A.5 Distncias entre Municpios e Causas Externas de bitos.

96

A.5.2 Ano de 2007


Tabela 16: Distncias Calculadas entre Municpios e Causas Externas de bito, 2007.

DISTNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,84024 2,33255 0,87918 1,00214 1,28522 0,22291 1,06078 0,69764 0,36042 1,33543 1,26367 0,77060 0,09227 1,26075 1,25229 1,20642 0,36691 1,22441 1,01048 1,86759 0,80622 0,18312 1,52016 2,33876 0,25878 1,47478 3,58036 0,87998 2,02106 0,79345

V09
1,02277 2,53370 1,08013 1,20253 1,48564 0,39379 1,26180 0,89850 0,56287 1,53370 1,46442 0,97094 0,19865 1,46153 1,45319 1,40088 0,56548 1,42617 1,07253 2,06928 1,00263 0,38818 1,72192 2,49137 0,42107 1,67153 3,54284 1,07583 2,22219 1,00110

V49
0,18092 1,57999 0,38035 0,41558 0,60534 0,67278 0,45547 0,38461 0,58271 0,62178 0,59244 0,36541 0,98008 0,59053 0,58557 0,47758 0,56304 0,57573 0,55349 1,13902 0,31704 0,73073 0,82076 1,44410 0,63935 0,72827 3,17181 0,31501 1,27928 0,47808

V89
0,72269 0,82212 0,63208 0,50925 0,22604 1,32258 0,45043 0,81376 1,15094 0,18237 0,24754 0,74097 1,57397 0,25047 0,25897 0,32719 1,14644 0,28770 1,30169 0,35868 0,71019 1,32816 0,03389 1,16733 1,30190 0,08638 3,67103 0,63821 0,51069 0,73043

V99
4,22977 4,78746 4,42610 4,42977 4,47002 4,33306 4,44695 4,41264 4,42172 4,43702 4,47278 4,41012 4,54305 4,47286 4,47388 4,35737 4,39622 4,48586 3,56599 4,64127 4,36521 4,44012 4,54768 3,73887 4,30094 4,43046 0,88717 4,35988 4,67445 4,52496

W19
0,26191 1,55755 0,12326 0,23819 0,51459 0,60592 0,29217 0,10524 0,42005 0,56984 0,49248 0,07625 0,83594 0,48951 0,48084 0,45821 0,42006 0,45131 0,94968 1,09250 0,12582 0,59506 0,74565 1,70792 0,59273 0,71144 3,60726 0,16671 1,24640 0,04022

X70
0,26051 1,29779 0,16973 0,06381 0,25329 0,84688 0,06754 0,34512 0,68066 0,29634 0,23399 0,27245 1,10798 0,23132 0,22388 0,16850 0,67414 0,20338 0,94273 0,83527 0,23504 0,85777 0,49046 1,42603 0,82553 0,43416 3,51243 0,16200 0,98673 0,29863

X95
0,38973 1,89492 0,44531 0,56567 0,84757 0,24957 0,62544 0,26734 0,11525 0,89375 0,82679 0,33666 0,52793 0,82394 0,81579 0,75987 0,09499 0,79004 0,77348 1,43146 0,36283 0,27287 1,08481 1,90349 0,23066 1,03081 3,45059 0,43543 1,58364 0,39341

A.5 Distncias entre Municpios e Causas Externas de bitos.

97

A.5.3 Ano de 2008


Tabela 17: Distncias Calculadas entre Municpios e Causas Externas de bito, 2008.

DISTNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


3,82821 2,00861 0,84286 2,21286 1,23110 0,31635 1,65644 0,54196 0,49130 0,42233 0,88663 0,70701 0,87314 1,75837 1,12990 2,20780 0,44663 1,22286 0,85917 2,28161 0,89253 0,56759 1,30686 2,02248 0,55853 0,71242 0,30969 3,21163 0,96810 1,16440

V09
3,63008 1,98450 0,85614 2,17695 1,23989 0,45669 1,62490 0,57392 0,62248 0,33990 0,92646 0,76593 0,92695 1,72924 1,10798 2,02336 0,56741 1,22135 0,78964 2,26153 0,92503 0,61940 1,30285 2,00868 0,65160 0,73772 0,26377 3,01646 1,01313 1,15360

V49
3,40307 1,89846 0,85202 2,07464 1,21034 0,63048 1,53554 0,62237 0,77196 0,30486 0,94997 0,82374 0,96731 1,64091 1,04547 1,77811 0,71105 1,17970 0,68483 2,17719 0,93969 0,68405 1,25530 1,93475 0,75811 0,75835 0,31880 2,80675 1,03806 1,10305

V89
3,93408 0,72616 0,45023 0,94339 0,11682 1,06574 0,39768 0,75037 0,96421 0,95017 0,45985 0,64174 0,51195 0,48830 0,18571 1,98221 0,95512 0,07396 0,56479 0,99510 0,43641 0,74327 0,03336 0,73485 0,82327 0,58443 1,01717 3,52315 0,42210 0,12629

V99
1,09690 5,16659 4,96544 5,13084 5,09677 5,03117 4,97289 4,91323 5,15375 4,62282 5,09722 5,07825 5,14980 5,02674 4,88544 3,06980 5,09200 5,03279 4,61317 5,32646 5,06826 4,98205 5,04904 5,26940 5,09778 4,96119 4,69730 1,60684 5,16215 4,95855

W19
3,97177 0,65191 0,52660 0,87297 0,16126 1,13979 0,33803 0,82773 1,03331 1,03083 0,52652 0,71186 0,57465 0,42142 0,26407 2,01278 1,02666 0,14475 0,64182 0,91816 0,50545 0,81833 0,06030 0,65664 0,89371 0,66050 1,09748 3,57297 0,48041 0,20694

X70
3,41327 0,99999 0,59248 1,14635 0,60382 1,08552 0,65065 0,76404 1,06610 0,76603 0,70434 0,79512 0,76956 0,75060 0,39668 1,47869 1,02753 0,53967 0,33260 1,27326 0,67014 0,80306 0,56107 1,05917 0,93191 0,67407 0,87438 2,99498 0,73668 0,46716

X95
4,07241 1,62207 0,46146 1,84301 0,81704 0,19094 1,29449 0,23235 0,07636 0,47757 0,44743 0,25899 0,41305 1,38803 0,78282 2,29551 0,05821 0,82749 0,67151 1,88287 0,46554 0,18691 0,91071 1,61825 0,07742 0,33544 0,41690 3,51475 0,51373 0,79123

A.5 Distncias entre Municpios e Causas Externas de bitos.

98

A.5.4 Ano de 2009


Tabela 18: Distncias Calculadas entre Municpios e Causas Externas de bito, 2009.

DISTNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


2,01340 1,45753 1,05622 1,39331 1,93260 0,28284 1,00253 0,25065 0,25983 1,73422 1,04707 0,88999 0,87329 1,87398 1,07292 1,19617 0,39077 1,46748 0,80094 1,19703 0,41653 0,63912 1,58434 1,59363 0,17716 1,21516 1,15332 0,77423 1,42377 1,36664

V09
1,67528 1,28666 1,18312 1,39320 1,90608 0,24063 1,14055 0,54142 0,57011 1,39407 1,09262 0,92199 0,89089 1,90569 1,08992 1,09250 0,62155 1,30157 0,81360 1,19702 0,62113 0,64478 1,53114 1,57968 0,49199 0,96676 0,81278 0,83642 1,42783 1,20246

V49
1,26967 0,98686 1,28179 1,30989 1,75586 0,52899 1,25745 0,89960 0,94044 1,00764 1,10215 0,94323 0,90055 1,82998 1,06361 0,90425 0,91697 1,00723 0,83501 1,13438 0,89409 0,70956 1,36779 1,46380 0,87524 0,58694 0,47409 0,91231 1,34690 0,91823

V89
2,15696 0,75608 0,41839 0,14633 0,68843 1,05872 0,46668 1,09996 1,13954 2,00399 0,21948 0,36622 0,38763 0,63241 0,18520 0,44752 0,94311 0,74034 0,46422 0,09256 0,89462 0,63491 0,41442 0,34938 1,16765 1,00181 1,64557 0,48479 0,17062 0,69676

V99
0,83038 2,12681 2,78926 2,71262 3,03139 1,98100 2,76861 2,32056 2,34813 0,74406 2,58489 2,43891 2,39448 3,19950 2,53025 2,25311 2,38634 2,15303 2,33611 2,57108 2,37480 2,22257 2,66988 2,81646 2,26816 1,70508 1,04274 2,42250 2,74847 2,11400

W19
1,67111 0,61681 0,71842 0,67967 1,16119 0,59112 0,71364 0,81033 0,86003 1,47673 0,48943 0,35765 0,31292 1,20146 0,43652 0,34495 0,71025 0,62278 0,27807 0,50030 0,66140 0,28692 0,78067 0,84683 0,84589 0,55055 1,06397 0,39305 0,71645 0,52386

X70
1,24141 0,29267 1,21806 0,92688 1,19081 1,04036 1,23055 1,34174 1,39163 1,12643 0,94848 0,88011 0,84137 1,37144 0,86400 0,47873 1,26572 0,31847 0,83301 0,84252 1,21972 0,85482 0,83295 0,99140 1,36065 0,16785 0,94210 0,95095 0,95886 0,27402

X95
2,18569 1,32028 0,66776 1,07882 1,62227 0,41686 0,61041 0,17678 0,20837 1,93298 0,71482 0,58665 0,58700 1,52142 0,76381 0,99982 0,01404 1,32329 0,53291 0,89377 0,04840 0,42542 1,30911 1,28265 0,25598 1,20556 1,38636 0,45874 1,10440 1,22749

A.5 Distncias entre Municpios e Causas Externas de bitos.

99

A.5.5 Ano de 2010


Tabela 19: Distncias Calculadas entre Municpios e Causas Externas de bito, 2010.

DISTNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


4,30862 2,58781 0,83567 1,43494 0,76051 0,33928 0,76051 0,99596 0,36739 0,87164 0,96446 0,27545 1,14529 1,65895 1,92492 0,24955 0,30987 1,87943 0,75387 1,92492 1,02652 1,61640 1,67043 2,18209 0,36481 0,76051 0,47485 2,34565 2,34565 1,08822

V09
4,74535 2,95386 0,58468 1,58750 0,80230 0,76811 0,80230 1,20843 0,79731 1,09652 1,15113 0,74754 1,35628 1,52976 1,96296 0,28703 0,66828 1,99652 0,69354 1,96296 1,26141 2,06222 1,75921 2,46788 0,79361 0,80230 0,88770 2,17535 2,17535 1,01635

V49
4,16172 2,29983 0,56164 0,92767 0,23775 0,44434 0,23775 0,52563 0,45616 0,41383 0,47184 0,57088 0,67462 1,16109 1,38850 0,44413 0,31153 1,36049 0,31279 1,38850 0,57843 1,53775 1,14123 1,78591 0,45233 0,23775 0,45771 1,85377 1,85377 0,58988

V89
4,19413 2,19633 0,78930 0,51533 0,53425 1,16827 0,53425 0,58841 1,17035 0,63947 0,53306 1,31368 0,58935 0,48866 0,67431 1,14719 1,05820 0,76874 0,59723 0,67431 0,64657 1,84070 0,51796 1,52059 1,16747 0,53425 1,12482 1,15040 1,15040 0,29586

V99
3,65904 2,11733 1,46301 1,50092 1,17192 0,52362 1,17192 1,08137 0,50437 0,98768 1,10474 0,46985 1,18291 2,07127 2,09443 0,95912 0,66859 1,93449 1,26392 2,09443 1,06070 0,99202 1,79662 1,90397 0,50858 1,17192 0,50081 2,75633 2,75633 1,52167

W19
3,30418 1,28760 1,78236 0,58125 1,36932 1,68736 1,36932 0,97266 1,67097 1,09580 1,01679 1,83867 0,82173 1,32429 0,69137 1,93105 1,65805 0,36838 1,51540 0,69137 0,93896 1,50569 0,56221 0,54997 1,67071 1,36932 1,57140 1,66805 1,66805 1,31893

X70
2,57646 0,78476 2,11305 1,20948 1,64110 1,48230 1,64110 1,18265 1,45408 1,23276 1,26109 1,57751 1,10805 2,12758 1,69875 1,92839 1,55081 1,39036 1,81196 1,69875 1,10951 0,49580 1,44307 0,76199 1,45667 1,64110 1,34785 2,64976 2,64976 1,82404

X95
3,99173 2,20993 0,83641 1,06529 0,53514 0,14671 0,53514 0,61632 0,15150 0,49311 0,59886 0,29671 0,76090 1,45345 1,59781 0,47045 0,09451 1,51523 0,61899 1,59781 0,63736 1,32064 1,32366 1,78234 0,14812 0,53514 0,15989 2,14517 2,14517 0,88917

A.6 Tabelas de Pertinncias Segundo o Mtodo Gentico Fuzzy (MHGF)

100

A.6 Tabelas de Pertinncias Segundo o Mtodo Gentico Fuzzy (MHGF) A.7 Pertinncias para o Ano de 2006
Tabela 20: Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2006.

PERTINNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,03075 0,04658 0,05378 0,03536 0,02061 0,08763 0,02750 0,04369 0,32223 0,08965 0,04673 0,02465 0,02128 0,04140 0,04228 0,02761 0,11684 0,02883 0,02863 0,04106 0,03203 0,10977 0,04101 0,04149 0,53184 0,06763 0,08659 0,02775 0,05081 0,05198

V09
0,02635 0,08117 0,05760 0,10576 0,01140 0,06264 0,03849 0,14816 0,18362 0,13236 0,04368 0,03437 0,02589 0,03373 0,07992 0,03705 0,10335 0,02099 0,05567 0,07134 0,02368 0,09367 0,07576 0,07610 0,17564 0,19531 0,04020 0,03345 0,14617 0,05716

V49
0,02021 0,03310 0,61335 0,02969 0,01527 0,01013 0,01527 0,00997 0,02528 0,10119 0,02302 0,01447 0,00881 0,01985 0,02255 0,01020 0,01172 0,01864 0,02261 0,02524 0,01402 0,04740 0,02744 0,02962 0,00987 0,01882 0,00904 0,01537 0,01545 0,60973

V89
0,55357 0,23504 0,04038 0,35887 0,55480 0,02384 0,60296 0,11362 0,06495 0,16368 0,29971 0,71602 0,15026 0,23480 0,24708 0,30467 0,02530 0,46794 0,16756 0,14215 0,14074 0,10280 0,27527 0,23819 0,03101 0,13083 0,15430 0,09941 0,15790 0,04095

V99
0,05922 0,21898 0,08655 0,06967 0,01804 0,01492 0,04116 0,07855 0,04611 0,13638 0,03607 0,03994 0,12619 0,10536 0,13588 0,05290 0,01673 0,03033 0,11140 0,11403 0,06289 0,22012 0,19233 0,23811 0,03862 0,09361 0,06876 0,18158 0,09584 0,08886

W19
0,05031 0,08080 0,04880 0,13547 0,02773 0,05345 0,06094 0,27135 0,04426 0,09120 0,09600 0,04197 0,08342 0,05189 0,11156 0,23571 0,05030 0,04520 0,17754 0,20136 0,04597 0,12355 0,07885 0,07712 0,04121 0,32485 0,29913 0,09242 0,31653 0,05077

X70
0,22818 0,25291 0,04882 0,16913 0,25502 0,02861 0,16120 0,03696 0,08140 0,18195 0,30469 0,08208 0,52909 0,41416 0,29931 0,29226 0,02928 0,27780 0,32501 0,26264 0,59336 0,14408 0,26268 0,25374 0,02938 0,06205 0,21862 0,49118 0,08399 0,05044

X95
0,03142 0,05142 0,05072 0,09605 0,09713 0,71878 0,05248 0,29771 0,23217 0,10359 0,15009 0,04650 0,05505 0,09881 0,06141 0,03960 0,64648 0,11028 0,11158 0,14218 0,08731 0,15862 0,04666 0,04564 0,14244 0,10690 0,12338 0,05884 0,13332 0,05012

A.8 Pertinncias para o Ano de 2007

101

A.8 Pertinncias para o Ano de 2007


Tabela 21: Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2007.

PERTINNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,04468 0,06203 0,03924 0,07969 0,04385 0,53959 0,07989 0,05476 0,09300 0,04262 0,04408 0,05354 0,65116 0,09109 0,09112 0,02547 0,06273 0,04420 0,08934 0,05231 0,09008 0,18463 0,01750 0,11253 0,14360 0,01778 0,04686 0,04965 0,05657 0,05246

V09
0,05211 0,08353 0,04744 0,01924 0,06533 0,09232 0,01954 0,05326 0,07347 0,06441 0,06547 0,09623 0,13046 0,03215 0,03215 0,02195 0,04072 0,06546 0,13363 0,07394 0,02707 0,10501 0,02402 0,05429 0,10280 0,01569 0,04519 0,05039 0,07806 0,04065

V49
0,39328 0,10823 0,30982 0,04739 0,09836 0,07304 0,04640 0,06067 0,04664 0,09637 0,09912 0,09958 0,05105 0,17096 0,17111 0,08069 0,08116 0,09920 0,15796 0,09954 0,07613 0,04397 0,16564 0,19202 0,05223 0,03602 0,05041 0,07729 0,10419 0,07430

V89
0,06251 0,43810 0,06189 0,05252 0,46112 0,04330 0,05991 0,03441 0,02922 0,49499 0,44713 0,04792 0,03479 0,23273 0,22764 0,09355 0,02022 0,42518 0,06921 0,49266 0,04946 0,02965 0,64558 0,19550 0,03131 0,80194 0,07052 0,04382 0,46622 0,11443

V99
0,00670 0,02605 0,00562 0,01288 0,01194 0,01225 0,01315 0,01233 0,01303 0,01192 0,01188 0,02137 0,01026 0,02309 0,02305 0,00703 0,00792 0,01165 0,03420 0,01836 0,01406 0,01401 0,01143 0,04562 0,01459 0,00592 0,65071 0,01268 0,02125 0,02351

W19
0,18555 0,09675 0,26589 0,18724 0,09576 0,06099 0,17773 0,48779 0,33922 0,08884 0,09816 0,34423 0,03804 0,18263 0,18346 0,06855 0,05480 0,10236 0,16081 0,08954 0,29267 0,32907 0,03456 0,18002 0,33192 0,03685 0,04432 0,41865 0,09340 0,52818

X70
0,10162 0,08020 0,13283 0,56676 0,13342 0,05075 0,57010 0,09926 0,07247 0,11304 0,14325 0,13026 0,03540 0,21904 0,22298 0,66238 0,03684 0,16030 0,12540 0,07795 0,38513 0,07002 0,08011 0,15336 0,07328 0,06036 0,04566 0,17887 0,08016 0,07288

X95
0,15355 0,10512 0,13728 0,03429 0,09023 0,12775 0,03329 0,19751 0,33293 0,08781 0,09091 0,20687 0,04885 0,04832 0,04849 0,04037 0,69560 0,09165 0,22945 0,09570 0,06540 0,22365 0,02116 0,06667 0,25027 0,02544 0,04633 0,16866 0,10016 0,09360

A.9 Pertinncias para o Ano de 2008

102

A.9 Pertinncias para o Ano de 2008


Tabela 22: Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2008.

PERTINNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,04873 0,04973 0,06059 0,05328 0,05302 0,17963 0,04055 0,25720 0,12326 0,08576 0,06355 0,06782 0,13113 0,09268 0,03773 0,09201 0,09592 0,02558 0,08173 0,04582 0,12430 0,14048 0,12029 0,05904 0,04298 0,07745 0,30018 0,09019 0,05715 0,07336

V09
0,07495 0,05731 0,06690 0,06109 0,01996 0,10673 0,04824 0,06493 0,07231 0,45517 0,05459 0,07046 0,06232 0,05704 0,04537 0,15248 0,10214 0,03269 0,05312 0,06525 0,08177 0,06954 0,05414 0,10081 0,03782 0,11693 0,16675 0,14902 0,06215 0,05400

V49
0,06419 0,11575 0,12375 0,11987 0,02045 0,11454 0,10666 0,07729 0,09272 0,22356 0,11757 0,12332 0,07578 0,03618 0,10367 0,11558 0,03543 0,08985 0,06123 0,04652 0,10882 0,07970 0,01276 0,07817 0,17323 0,09120 0,09921 0,10790 0,11767 0,03005

V89
0,05708 0,28584 0,27054 0,27742 0,36462 0,09310 0,30324 0,18543 0,08660 0,03724 0,13535 0,23950 0,12805 0,18038 0,34464 0,13531 0,05537 0,43341 0,22809 0,30902 0,16273 0,08559 0,29466 0,37670 0,12690 0,33747 0,03116 0,12205 0,28400 0,33412

V99
0,53676 0,02538 0,01850 0,02861 0,00485 0,01825 0,02011 0,01137 0,01627 0,02119 0,02862 0,01796 0,02161 0,01309 0,01633 0,11268 0,03428 0,01371 0,00909 0,02372 0,02035 0,01974 0,01686 0,02599 0,03542 0,01897 0,00701 0,18240 0,01876 0,03645

W19
0,05664 0,29837 0,25680 0,28563 0,30673 0,11952 0,32572 0,10167 0,11339 0,05161 0,30199 0,23322 0,09501 0,45391 0,29460 0,08982 0,09599 0,30779 0,21919 0,26182 0,17742 0,05800 0,41405 0,18418 0,14466 0,12355 0,03864 0,07682 0,27087 0,31998

X70
0,10612 0,10838 0,10048 0,11211 0,04623 0,03979 0,10638 0,11665 0,03151 0,04727 0,08618 0,07989 0,14982 0,11605 0,10759 0,17552 0,10629 0,06390 0,13124 0,13679 0,07488 0,13390 0,02988 0,09563 0,03642 0,08078 0,23427 0,14944 0,09047 0,08757

X95
0,05553 0,05923 0,10245 0,06199 0,18413 0,32844 0,04911 0,18547 0,46393 0,07820 0,21214 0,16784 0,33627 0,05068 0,05006 0,12660 0,47458 0,03307 0,21631 0,11105 0,24973 0,41304 0,05735 0,07947 0,40258 0,15364 0,12278 0,12217 0,09892 0,06447

A.10 Pertinncias para o Ano de 2009

103

A.10 Pertinncias para o Ano de 2009


Tabela 23: Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2009.

PERTINNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,08672 0,05101 0,11915 0,09463 0,11300 0,12444 0,15451 0,54662 0,59930 0,10002 0,10584 0,10059 0,07633 0,11339 0,10168 0,14200 0,02319 0,07209 0,07482 0,09090 0,14643 0,05991 0,10594 0,10533 0,59825 0,05070 0,14800 0,15767 0,03151 0,05422

V09
0,10949 0,10289 0,06792 0,04902 0,07775 0,25569 0,07149 0,06230 0,05993 0,17347 0,05860 0,18891 0,06705 0,06701 0,05553 0,08255 0,02969 0,09990 0,17936 0,05502 0,07013 0,09603 0,06170 0,06006 0,06806 0,13085 0,13498 0,10641 0,03397 0,13125

V49
0,14450 0,16818 0,06432 0,05080 0,07596 0,11182 0,10639 0,04442 0,03633 0,09481 0,05827 0,06439 0,19640 0,06891 0,05638 0,11170 0,08530 0,05631 0,08692 0,05059 0,08269 0,13842 0,06655 0,06314 0,04535 0,09711 0,23582 0,05775 0,03825 0,08493

V89
0,08367 0,07378 0,28585 0,41855 0,28872 0,10087 0,13200 0,03036 0,05634 0,07581 0,33987 0,23243 0,15967 0,29183 0,35570 0,12949 0,06966 0,09806 0,15772 0,46030 0,05152 0,07437 0,30342 0,32950 0,02868 0,04824 0,04619 0,33958 0,67067 0,07755

V99
0,31414 0,04028 0,05802 0,05249 0,06070 0,05469 0,04972 0,03343 0,01501 0,21036 0,05401 0,02838 0,03005 0,06550 0,05299 0,03512 0,00379 0,02454 0,02725 0,04262 0,02300 0,01880 0,06144 0,06000 0,03373 0,02796 0,07123 0,03923 0,03597 0,02825

W19
0,07777 0,11425 0,19033 0,17046 0,11402 0,14813 0,12661 0,04305 0,04018 0,14464 0,19690 0,13881 0,13929 0,18605 0,19915 0,18942 0,07189 0,23258 0,17955 0,09414 0,08936 0,21488 0,19284 0,18590 0,04138 0,10121 0,10153 0,14840 0,06052 0,12240

X70
0,10061 0,37827 0,08362 0,08011 0,21011 0,10138 0,16928 0,05509 0,02501 0,11237 0,08134 0,13633 0,08921 0,10193 0,08157 0,18398 0,00716 0,28141 0,06345 0,16956 0,10727 0,22448 0,11275 0,10021 0,05474 0,46851 0,19098 0,05587 0,07000 0,41890

X95
0,08311 0,07135 0,13080 0,08394 0,05975 0,10297 0,18999 0,18473 0,16791 0,08852 0,10518 0,11015 0,24199 0,10538 0,09700 0,12574 0,70932 0,13510 0,23093 0,03686 0,42959 0,17311 0,09536 0,09586 0,12981 0,07542 0,07127 0,09509 0,05912 0,08250

A.11 Pertinncias para o Ano de 2010

104

A.11 Pertinncias para o Ano de 2010


Tabela 24: Pertinncias dos inter-relacionamentos entre municpios e causas externas de bito para o ano de 2010.

PERTINNCIAS Municpio AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03


0,10268 0,07128 0,09338 0,08937 0,07769 0,17952 0,07769 0,05637 0,24586 0,07901 0,07470 0,29340 0,09651 0,08299 0,08914 0,22965 0,16732 0,04644 0,07702 0,09321 0,07707 0,04830 0,07865 0,08300 0,13902 0,07769 0,16065 0,14207 0,08651 0,07157

V09
0,08755 0,05960 0,20476 0,07530 0,15743 0,11725 0,15743 0,08399 0,03742 0,15056 0,04614 0,04752 0,07888 0,16689 0,07821 0,19718 0,11346 0,03701 0,09584 0,04562 0,14999 0,04457 0,05896 0,05728 0,12523 0,15743 0,11507 0,09484 0,07616 0,15723

V49
0,12438 0,07655 0,30694 0,13157 0,37201 0,14459 0,37201 0,30330 0,06504 0,31836 0,13186 0,06199 0,14985 0,12529 0,12467 0,15567 0,15208 0,09201 0,16959 0,06216 0,29735 0,12106 0,12608 0,10127 0,09794 0,37201 0,14827 0,08539 0,13107 0,29079

V89
0,08584 0,10271 0,14863 0,14418 0,15089 0,05705 0,15089 0,20664 0,02543 0,14956 0,22478 0,02701 0,12357 0,23095 0,14640 0,06178 0,05368 0,13360 0,12193 0,44100 0,15841 0,11312 0,14416 0,06253 0,05370 0,15089 0,06028 0,20558 0,22483 0,24495

V99
0,11825 0,11107 0,06132 0,09350 0,05638 0,13477 0,05638 0,11493 0,22399 0,06964 0,05847 0,24043 0,10090 0,05008 0,09177 0,11489 0,11344 0,07346 0,04864 0,04781 0,07229 0,18096 0,12199 0,09852 0,08622 0,05638 0,14238 0,09789 0,14997 0,05543

W19
0,16576 0,17805 0,05755 0,19613 0,05467 0,05610 0,05467 0,05464 0,01894 0,06815 0,06506 0,02043 0,16202 0,13261 0,20842 0,05649 0,05261 0,44066 0,09099 0,11913 0,08184 0,13736 0,32748 0,24491 0,03866 0,05467 0,05899 0,10783 0,11245 0,06358

X70
0,20854 0,29832 0,04005 0,16635 0,03736 0,05847 0,03736 0,06512 0,02296 0,05091 0,08517 0,02498 0,16746 0,06477 0,16391 0,05651 0,05356 0,06771 0,03613 0,13161 0,06070 0,27709 0,07650 0,27694 0,07117 0,03736 0,06230 0,13610 0,11131 0,04060

X95
0,10700 0,10241 0,08739 0,10360 0,09356 0,25225 0,09356 0,11502 0,36035 0,11381 0,31381 0,28423 0,12081 0,14641 0,09749 0,12784 0,29386 0,10910 0,35985 0,05945 0,10236 0,07753 0,06619 0,07554 0,38805 0,09356 0,25206 0,13030 0,10769 0,07586

A.12 Tabelas de Agrupamentos pelo Mtodo Hbrido Gentico Fuzzy (MHGF)

105

A.12 Tabelas de Agrupamentos pelo Mtodo Hbrido Gentico Fuzzy (MHGF) A.13 Ano de 2006
A.13.1 Ponto de Corte igual 0,10
Tabela 25: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CJ CG LS MA MO PE SA CO ES CU QE RE AN AG AR AO BO GA PA SD CP SB CA JP SR BA AH SO SL CR V89 X70 X95 V99 W19 V09 V03 V49


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.13 Ano de 2006

106

A.13.2 Ponto de Corte igual 0,20


Tabela 26: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AG AN RE CU ES GA LS QE AO CG MA MO SA PA SL CO AR BO CR CP CA BA SR AH CJ JP PE SB SD SO X70 V89 W19 X95 V99 V03 V49 V09


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.13 Ano de 2006

107

A.13.3 Ponto de Corte igual 0,30


Tabela 27: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AG AR AO BO CR GA LS CG CO CU MA PA SL SB SD JP BA CA SR AH SO AN CP CJ MO ES PE QE RE SA V89 X70 W19 X95 V03 V49 V09 V99


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.13 Ano de 2006

108

A.13.4 Ponto de Corte igual 0,50


Tabela 28: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AG AO BO CR CO PA JP BA AH SO SR CU ES GA AR PE QE RE SB SA SL SD LS MA MO CP CA CJ CG AN V89 X70 X95 V49 V03 V09 V99 W19


1 1 1 1 1 1 1 1 1 1 1

A.14 Ano de 2007

109

A.14 Ano de 2007


A.14.1 Ponto de Corte igual 0,10
Tabela 29: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AG AH AR BO CR LS RE CU ES MA PA SL CP CA PE SR SO AO CJ CG SD AN QE MO SB GA BA JP CO SA W19 X70 V89 X95 V49 V03 V09 V99


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.14 Ano de 2007

110

A.14.2 Ponto de Corte igual 0,20


Tabela 30: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CU ES AN AO CJ CG LS MO QE SB SD PA SL PE CA CR SR CP AH SO GA AR BO MA JP BA CO AG SA RE V89 W19 X70 X95 V03 V49 V99 V09


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.14 Ano de 2007

111

A.14.3 Ponto de Corte igual 0,30


Tabela 31: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CJ CG AN AO LS MO QE SB SD CP CA CR SR SO SL PE PA AR BO GA AG AH CO BA JP SA CU ES MA RE V89 W19 X70 V49 V03 X95 V99 V09


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.14 Ano de 2007

112

A.14.4 Ponto de Corte igual 0,50


Tabela 32: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AR BO GA CO BA QE SB SA SO JP CU ES AO AG AN AH CP CA CJ CG CR LS MA MO PA PE RE SR SL SD X70 V03 V89 V99 W19 X95 V09 V49


1 1 1 1 1 1 1 1 1 1

A.15 Ano de 2008

113

A.15 Ano de 2008


A.15.1 Ponto de Corte igual 0,10
Tabela 33: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CP MA MO AH CG CR AO PA SR SB AN AR BO ES CU LS QE RE SD SO CO GA SL AG BA CA JP PE SA CJ V89 W19 X95 X70 V49 V03 V09 V99


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.15 Ano de 2008

114

A.15.2 Ponto de Corte igual 0,20


Tabela 34: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS MA AN AH AR AO LS MO QE BO CR ES SD SO SB RE CG CU JP SR CO PA PE BA CA CP SA CJ AG GA SL V89 W19 X95 V03 V09 V49 V99 X70


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.15 Ano de 2008

115

A.15.3 Ponto de Corte igual 0,30


Tabela 35: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS SO AO BO LS RE ES MO SB CG CU QE BA CA CO PE SR JP SA CJ AG AN AH AR CP CR GA MA PA SL SD V89 W19 X95 V03 V09 V99 V49 X70


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.15 Ano de 2008

116

A.15.4 Ponto de Corte igual 0,50


Tabela 36: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V99 V03 V09 V49 V89 W19 X70 X95


1

A.16 Ano de 2009

117

A.16 Ano de 2009


A.16.1 Ponto de Corte igual 0,10
Tabela 37: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CR BA GA BO CU QE AO RE SA CJ CG AH ES SL AN LS PE SB SO AR CO MA CP CA PA SR AG MO SD JP W19 V03 X70 V89 X95 V09 V49 V99


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.16 Ano de 2009

118

A.16.2 Ponto de Corte igual 0,20


Tabela 38: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AO AH AR CG CR CU ES MO QE RE SL SD AN PE LS SB SO PA CO MA JP CP CA SR AG CJ BA SA BO GA V89 X70 X95 V03 V99 W19 V09 V49


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.16 Ano de 2009

119

A.16.3 Ponto de Corte igual 0,30


Tabela 39: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS QE RE SL SD AR CG ES MO CP CA SR AN SB SO JP PA AG CR CO CU GA LS MA AO BA BO CJ AH PE SA V89 V03 X70 X95 V99 V09 V49 W19


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.16 Ano de 2009

120

A.16.4 Ponto de Corte igual 0,50


Tabela 40: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CP CA SR SD JP AG AN AH AR AO BA BO CJ CG CR CO CU ES GA LS MA MO PA PE QE RE SB SA SL SO V03 V89 X95 V09 V49 V99 W19 X70


1 1 1 1 1

A.17 Ano de 2010

121

A.17 Ano de 2010


A.17.1 Ponto de Corte igual 0,10
Tabela 41: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS CU PA CJ MA CG CO CP AR SD PE QE SO SB AH AO BO ES BA GA JP AG RE SA AN LS SL MO SR CA CR V49 V89 X95 V09 V99 W19 X70 V03


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.17 Ano de 2010

122

A.17.2 Ponto de Corte igual 0,20


Tabela 42: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS SO AH AO BO CP CJ PA SB CG CA CR BA JP MA SR SA MO SL SD QE RE LS PE AG AN CU ES GA AR CO V49 X95 V89 W19 X70 V03 V99 V09


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

A.17 Ano de 2010

123

A.17.3 Ponto de Corte igual 0,30


Tabela 43: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AH AO BO CP CJ SB CA CG MA SR LS QE MO BA AR AG AN CR CO CU ES GA JP PA PE RE SA SL SD SO V49 X95 W19 V89 V03 V09 V99 X70


1 1 1 1 1 1 1 1 1 1 1 1 1

A.17 Ano de 2010

124

A.17.4 Ponto de Corte igual 0,50


Tabela 44: Agrupamento dos Municpios para com as Causas Externas de bito.

AGRUPAMENTOS AG AN AH AR AO BA BO CP CA CJ CG CR CO CU ES GA JP LS MA MO PA PE QE RE SR SB SA SL SD SO V03 V09 V49 V89 V99 W19 X70 X95

NO HOUVE NENHUM AGRUPAMENTO

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano

125

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano


A.18.1 Para o ano de 2006

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano

126

A.18.2 Para o ano de 2007

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano

127

A.18.3 Para o ano de 2008

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano

128

A.18.4 Para o ano de 2009

A.18 Grcos de Sensibilidade para Diferentes Pontos de Corte por Ano

129

A.18.5 Para o ano de 2010

130

Referncias

1 2

BENZCRI J.P. Correspondence Analysis Handbook. New York: Marcel, 1992. BEZDEK J. C., CORAY C., GUNDERSON C. , WATSON J. Detection and Characte-

rization of Cluster Substructure. SIAM Journal of Applied Mathematics, 40: pp. 339-372, 1981. 3 CAVALCANTI N. L. Clusterizao baseada em algoritmos Fuzzy, Universidade Federal

de Pernambuco, 2006. 4 BROWN M.,HARRIS C. J., MOORE C. G., Intelligent control: Aspects of Fuzzy

Logic and Neural Nets, World Scientic, 1993. 5 CINTULA, LIBOR B. P. Fuzzy class theory, Academy of Sciences of the Czech Repu-

blic 154, volume 154, pp. 3455, 2005. 6 COX E. The Fuzzy Systems Handbook: a Practitioner's Guide to Building, Using and

Maintaining Fuzzy Systems, Eds: Professional,1, 1994; 7 CORREA, S. S. Lgica Nebulosa, XVIII Escola de Redes Neurais , volume 18, pp.

7390, 1999. 8 CLAIR U. S., YUAN B. Fuzzy Set Theory: Foundations and Applications, Prentice

Hall PTR, Upper Saddle River, NJ, 1997. 9 10 CRAWLEY M. J. The R Book, Wiley, 1, 2007. DANTAS, GOLDBARG M. Algoritmos evolucionrios na determinao da congu-

rao de custo mnimo de sistemas de co-gerao de energia com base no gs natural, Pesquisa Operacional 25, volume 25, pp. 231259, 2005. 11 12 FERREIRA, F. D. Estatstica Multivariada, 1, Eds: UFLA, pp. 341-391 ,2008. FANCO C. R. Novos Mtodos de Classicao Nebulosa e de Validao de Categorias

e suas Aplicaes a Problemas de Reconhecimento de Padres, Universidade Federal do Rio de Janeiro, 2002. 13 GARCIA F. Desempenho energtico de um sistema de refrigerao aplicando o con-

trole adaptativo Fuzzy, Simpsio de Ps-Graduao em Engenharia Mecnica, MG, 2002. 14 GOLDBERG E. D. Genetic Algorithms in Search, Optimization, and Machine Lear-

ning, EUA: Addison-Wesley, 121, 1989. 15 GOLDBERG E. D. Genetic Algorithms in Search, Optimization, and Machine Lear-

ning, EUA: Addison-Wesley, 147, 1989.

Referncias
16

131

GOLDBERG E. D. Genetic Algorithms in Search, Optimization, and Machine Lear-

ning. EUA: Addison-Wesley, 80, 1989. 17 GOLDBARG. Algoritmos evolucionrios na determinao da congurao de custo

mnimo de sistemas de co-gerao de energia com base no gs natural, Pesqui. Oper. 25(2): 231-259, 2005. 18 GREENACRE M., HASTIE T. The geometric interpretation of correspondence analy-

sis, Journal of the American Statistical Association, volume 82, pp. 437-447,1987. 19 HAIR J. F. BLACK W. C., BARRY J., BABIN R. E., ANERSON R. L.. Anlise

Multivariada de Dados, Eds: bookman, 2009. 20 HAIR O. F., BLACK W. C., BARRY J. B., ROLPH A. E., TATHAM R. L. Anlise

Multivariada de Dados, 6, Eds: Bookman,2006. 21 HEIJDEN P. et al. A combined approach to contingency table analysis using corres-

pondence analysis and log-linear analysis. Applied statistics 38, 1989, pp. 249-292. 22 JOHNSON R. A., WICHERN D. W. Applied Multivariate Statistical Analysis, Ed.

6, Eds: Hardcover, 2007. 23 JOHNSON R. A., WICHERN D. Applied Multivariate statistical Analysis, 6 , Eds:

Hardcover, 2008. 24 KELLER, ANNETTE F. K. Fuzzy Clustering with Evolutionary Algorithms, Inter-

national Journal of Intelligent Systems 13, volume 13, pp. 975991, 1998. 25 KLAWONN F., KELLER A. Fuzzy Clustering with Evolutionary Algo-

rithm,nternacional of Intelligent Systems, volume 13,1998. 26 KOZA, J.R. Genetic Programming: On the Programming of Computers by Means of

Natural Selection. [S.l.]: MIT Press, 1992. 27 KOSKO B. Neural networks and Fuzzy systems: a dynamical systems approach to

machine intelligence, Prentice-Hall International, 1992. 28 LEITE, TEIXEIRA. Aplicao de algoritmos genticos na determinao da operao pp.

tima de sistemas hidrotrmicos de potncia, SBA Controle & Automao 17(1): 81-88, 2006. 29

LIU H. C., JEAG B. C.,YU Y. K. Fuzzy C-Means Algorithm Based on Standard

Mahalanobis Distances, International Symposium on Information Processing, China, 2009, pp. 422-427. 30 LIMA O. J. Classicaes Repetidas nos Aspectos Inferenciais em Experimento de

Bernoulli com Erros de Diagnstico, 2009. Tese (Doutorado em Estatstica) - Departamento de Estatstica, Universidade Federal de Minas Gerais, MG. 31 MICHALEWICZ Z., NAZHIYATH G., MICHALEWICZ M. A Note on Usefulness

of Geometrical Crossover for Numerical Optimization Problems, Proceedings of the 5th Annual Conference on Evolutionary Programming, San Diego, CA, 29 February - 3 March. MIT Press, Cambridge, MA, 1996, pp. 305-312.

Referncias
32

132

NUOVO A. G., CATANIA V., PALESI M. The Hybrid Genetic Fuzzy C-Means: a

Reasoned Implementation, International Conference on Fuzzy Systems, Cavtat, Croatia, 2006, pp. 33-38. 33 PALESI A., NUOVO V., MAURIZIO C. The Hybrid Genetic Fuzzy C-Means: a

Reasoned Implementation, International Conference on Fuzzy Systems 7, volume 7, pp. 3338, 2006. 34 PEDRYCZ W., GOMIDE F. Fuzzy Systems Engineering: Toward Human-Centric

Computing, Wiley/IEEE Press, 2007. 35 PEDZYCZ W., GOMIDE F. Fuzzy Systems Engineering: Toward Human-Centric

Computing, Wiley/IEEE Press, 2007. 36 PIRES, Algoritmos Genticos. Aplicao Robtica, Faculdade de Engenharia da

Universidade do Porto, 1998. 37 POLI R., LANGDON W. B., MCPHEE N. F. A Field Guide to Genetic Programming,

2008. 38 R: A Language and Environment for Statistical Computing, R Development Core

Team, R Foundation for Statistical Computing, Vienna, Austria, 2010, ISBN, 3-90005107-0, http://www.R-project.org. 39 40 ROSS T. J. Fuzzy logic with engineering applications 1995, NY McGraw-Hill. ROLLY I., MUKAIDONO M. Redundant Object and Dependency of Domain Attri-

butes in - Goverings of the Universe, FUZZ-IEEE, 2001, pp. 1444-1447. 41 SCHMIDT, MIKLOS F. Fuzzy Clustering as a Means of Selecting Representative

Conformers and Molecular Alignments, J. Chem. Inf. Comput. Sci 43, volume 43, pp. 810818, 2003. 42 YU Y. K., LIU H. C., JENG B. C., YIH J. M. Fuzzy C-Means Algorithm Based on

Standard Mahalanobis Distances, International Symposium on Information Processing 23, volume 23, pp. 422427, 2009. 43 44 ZADEH L. A. Fuzzy Sets, Rev. Information and control, volume 8, pp. 338-353, 1965. ZADEH L. A. Fuzzy sets and systems, Fox J, Ed. System Theory, Brooklyn, NY:

Polytechnic Press, 1965: pp. 2939.