UNIVERSIDADE ESTADUAL DE MARINGÁ

SISTEMAS INTELIGENTES: REDES NEURAIS E REDES BAYESIANAS
3º TRABALHO

Responsáveis: DANIEL MARQUES CALEGARI IGOR L. G. SHORT LUCAS ALMEIDA FAUSTINI

RA: 57517 RA: 57586 RA: 57604

Maringá

07/12/2012
1

INTRODUÇÃO REDES BAYESIANAS 2. COMPARATIVOS ENTRE REDES NEURAIS X REDES BAYESIANAS 16 10. CONCEITO REDES NEURAIS 7. INTRODUÇÃO REDES NEURAIS 6. CONCLUSÃO REDES BAYESIANAS 5.TRABALHO DE SISTEMAS INTELIGENTES INDICE 1. APLICAÇÕES E FERRAMENTAS 4. CONCEITO REDES BAYESIANAS 3. APLICAÇÕES E FERRAMENTAS 8. BIBLIOGRAFIA 17 2 . CONCLUSÃO REDES NEURAIS 3 4 6 8 9 10 12 15 9.

medicina. 3 . criando um modelo matemático que possa representar uma relação de causa e efeito. como por exemplo. para facilitar um sistema de incerteza em sistemas de inteligência artificial. Rede bayesiana vem sendo muito utilizada na atualidade. No inicio dos anos 1980. onde nós representam variáveis e arcos representam conexões entre eles. e assim tomar suas decisões. foi desenvolvido as redes bayesianas. para problemas com conhecimento probabilístico. Introdução Redes Bayesianas A incerteza sempre esteve presente na humanidade. Em geral redes bayesianas utiliza dados probabilísticos para tomar decisões baseado em incertezas. e vem sendo aplicada em diversas áreas.1. financeira e etc. Essas redes tem como função mostrar as dependências causais entre as variáveis da maneira mais clara. para estruturar essas incertezas futuras. e desde sempre o homem busca métodos. em função de sua forma gráfica. que tem esse nome por ter origem no teorema de Bayers.

redes bayesianas alem de um documento gráfico sobre causalidades. tem se uma rede bayesiana. 4 . retornando uma ação. Seleciona a ação com a maior expectativa. se existe uma relação entre um acidente com um produto domestico e este produto não atende bem às necessidades Y. onde os nós representam variáveis aleatórias e os arcos direcionados ilustram as relações de causa e efeito. Calcula novas probabilidades para o estado atual baseado na evidência disponível incluindo a percepção atual e a ação anterior. Em um algoritmo.2. e que as probabilidades condicionais P(Y|X) e P(Y|Xc) (não ter sofrido acidente com um produto domestico) mostram a causalidade entre X e Y. } Os cálculos de probabilidade podem ser probabilidade incondicional. e as probabilidades de acontecer. Conceito Uma rede bayesiana é um grafo acíclico direcionado. a rede bayesiana funcionaria assim. exemplo de algoritmo: Função RP-Agente(percepção) retorna ação { Estático: conjunto de sentenças probabilísticas a respeito do problema. uma incerteza de causa. Essas probabilidades. Portanto. Podemos dizer então que X exerce uma influência sobre Y. tabela de conjunção de probabilidades. condicional. Retorna ação. Calcula as probabilidades para as possíveis ações. dado a descrição das ações e as probabilidades atuais. como também uma eficiente analisadora de dados representando distribuição de probabilidades condicionais. somadas com P(X) compões o conjunto de parâmetros de quantificação da rede bayesiana. Exemplificando. a Figura 1 ilustra a situação.

B) /P(B). a probabilidade do evento a é x" Probabilidade Incondicional: A probabilidade de P(a) de um evento a é um número dentro de um internado [0. representa todo o domínio.Bi). 5 . a tabela n x m representada pela probabilidade de cada configuração (Ai.Probabilidade condicional: P(a|b) = P(a|b)P(b)/P(a).1] Tabela de conjunção de probabilidades: P(A|B) = P(A. com P(a|b) = x pode ser interpretada como "dado o evento b.

ao mesmo tempo. Uma aplicação no Brasil ocorre na prevenção de gestação de alto risco.com). da Norsys (www. O robô deve ponderar entre seguir um caminho conhecido até seu objetivo e a tentativa de se descobrir um novo caminho. Aplicações e Ferramentas Redes Bayesianas vem sendo usadas em diversas áreas. Ken Basye 1990. 6 .norsys. a modelagem da rede bayesiana é realizada em duas etapas distintas. Este projeto está desenvolvendo uma rede bayesiana que permita a interpolação automática de dados espaciais oriundos de diferentes observatórios e planetários espalhados pelo mundo. mais principalmente na área de diagnostico médico. Heckerman 1990. Um robô deve percorrer um “labirinto”. segue abaixo alguns projetos que utilizam a aplicação de redes bayesianas. Na primeira. NASA´s Ames Research Center. Brown University – Este projeto combina problemas de diagnostico e teoria de decisão. Stanford – Sistema para diagnósticos de problemas nas glândulas linfáticas. 1998 – O projeto pretende criar um sistema que possa automaticamente e inteligentemente interagir com outros sistemas. Microsoft Research. os valores de probabilidade condicional e a priori são inseridos na rede. antecipando os objetivos e necessidades dos usuários. Map Learning.3. NETICA. O sistema trata mais de 60 enfermidades sob as probabilidades de mais de 100 causas (sintomas e resultados de testes médicos). Lumiere.Sistema de exploração e aquisição de conhecimento espacial. 2000). AutoClass. que no pais mata a cada hora duas mulheres no Brasil por patologias relacionadas à gestação (Ministério da Saúde. Nesse projeto foi usada a ferramenta. Após. 1998 . explorar caminhos desconhecidos. procurando aprender os caminhos percorridos e. Pathfinder. as variáveis essenciais ao processo de tomada de decisão para identificar uma gestante com probabilidade de desenvolver parto prematuro ou dar a luz à recém nascido de baixo peso são utilizadas para criar a rede semântica.

Outras ferramentas usadas em Redes Bayesianas são: Hugin. classe social. GeNIe. dados clínicos e de exames complementares do pré-natal. formação. A estas variáveis se estabeleceram atributos e valores de probabilidades individuais através de análises de literatura e extensa pesquisa com profissionais especialistas em Gestação de Alto Risco. O fluxo funciona assim: Os Resultados desse projeto são o grau de assertividade do sistema criado e o grau de efetividade na redução da prematuridade e de recém nascidos de baixo peso.As variáveis analisadas são: idade. O algoritmo a partir dessas variáveis. faz uma seleção com base em dados recebidos de especialistas e analisa se a paciente tem alto risco. dentre outros. 7 . histórico pessoal e familiar.

Trabalhando bem com incerteza. através de sua matemática probabilística rigorosa e eficiente. Conclusão Através do trabalho.4. a utilização de redes bayesianas se torna cada vez maior para dar suporte para políticas de desenvolvimento ou de melhoria de problemas. trazendo soluções onde conclusões não podem ser obtidas apenas com o domínio do problema. com uma distinção correta de dados consegue uma boa resposta. softwares desenvolvidos para auxiliar na sua utilização. 8 . pode se concluir que redes Bayesianas constituem uma boa alternativa para construção de mostrar de forma natural a representação de informações condicionalmente independentes. Suas Vantagens são de poder ser executadas em tempo linear. Diante de mundo de incertezas.

dependendo do processamento. responsáveis por perceberem um determinado tipo de sinal. através de tentativas e processos sem erro. Cada neurônio artificial é capaz de um único processamento. que tentam imitar o funcionamento do cérebro humano. 9 . e finalmente eles possuem uma saída binária para apresentar a resposta SIM ou Não.5. Todo o funcionamento do corpo é relacionado ao funcionamento destas células. sendo composto por aproximadamente 10 bilhões neurônios. Como ela possui um sistema de opinião que modifica sua programação. São com base nessa biológica humana que foi criada as redes neurais artificial. redes neurais são capazes de aprendizado. Cada neurônio tem dois ou mais receptores de entrada. eles também possuem um corpo de processadores responsável por um sistema de feedback que modifica sua própria programação dependendo dos dados de entrada e saída. Introdução Redes Neurais O cérebro humano é considerado o mais fascinante e brilhante processador baseado em carbono existente.

A grande vantagem disso é que para executar tarefas uma rede neural não precisa guardar instruções de comando e executá-las de forma lógica. Como um neurônio pode receber opções variadas de entradas. 10 . como num computador tradicional. Conceito Redes Neurais As redes neurais tem um funcionamento de uma implementação de um algoritmo muito simples. ligar vários neurônio similares em rede. cada sinal é multiplicado por um número. Os modelos geralmente apresentam um conjunto de células de entrada. Pesos positivos correspondem a fatores de reforço do sinal de entrada e pesos negativos correspondem a fatores de inibição. o treinamento. que corresponde á influência da célular no processamento do sinal de saída. Por isso redes neurais caracterizam por ter um grande número de elementos de processamento bem simples. Ao invés disso a rede aprende o que precisa ser feito e executa a função. faz com que o sistema consiga processar mais informações e oferecer mais resultados. ou peso. Porém. sinais são apresentados à entrada. Camadas Intermediárias ou Escondidas. É feita a soma ponderada dos sinais que produz um nível de atividade. que indica sua influência na saída da unidade. que são baseados no processo iterativo de ajustes aplicado os seus pesos. Cada neurônio artificial é capaz de um único processamento. elas caracterizam se por uma seqüência de fatos. Camada de Saída. dotadas de capacidade de processamento. então ele pode perceber diferentes sinais. Se este nível de atividade exceder certo limite (threshold) a unidade produz uma determinada resposta de saída. As célular são ligadas por conexões. por isso cada entrada recebe somente um tipo de sinal ou informação. onde os pesos de suas conexões são ajustados de acordo com os padrões paresentados. Suas entradas possuem um relacionamento direto com as saídas desejadas. o aprendizado ocorre quando a rede neural chega a uma solução geral para uma classe de problemas. cada uma com um peso associado. As redes neurais possuem processos de aprendizagem. A maioria dos modelos de redes neurais possui alguma regra de treinamento. Em outras palavras elas aprendem através de exemplo. Basicamente um modelo neural consiste em uma rede de celular relativamente autônomas. que apresentam os sinais de saída da rede e um conjunto de célular intermediárias. Camada de Entrada. por onde são passadas informações para a rede. Usualmente as camadas são classificadas em três grupos. um conjunto de célular de saída.6.

um agente externo (professor) apresenta à rede neural alguns conjuntos de padrões de entrada e seus correspondentes padrões de saída. somente os padrões de entrada estão disponíveis para a rede neural.As vantagens de redes neurais são. capacidade de aprendizado através da observação de um conjunto de exemplos sendo estes com ou sem informação de respostas desejadas a cada estimulo. ou aprendizado auto-supervisionado. Este tipo de aprendizado só é possível quando existe redundância nos dados de entrada. para que se consiga encontrar padrões em tais dados. Na aprendizagem não supervisionada. No aprendizado supervisionado. A rede processa as entradas e. A resposta fornecida pela rede neural é comparada à resposta esperada. Neste tipo de aprendizagem. tenta progressivamente estabelecer representações internas para codificar características e classificá-las automaticamente. Para cada entrada. uma queda de desempenho gradual na eventualidade de mal funcionamento ou até mesmo inutilizarão de parte da rede. isto é. controle altamente paralelo e distribuído. é necessário ter um conhecimento prévio do comportamento que se deseja ou se espera da rede. não existe um agente externo para acompanhar o processo de aprendizado. Manutenção do desempenho na presença de ruído e capacidade de lidar com dados completos. robustez. Portanto. o professor indica explicitamente se a resposta calculada é boa ou ruim. Existem duas formas básicas de aprendizado de redes neurais: aprendizado supervisionado e aprendizado não supervisionado. 11 . O erro verificado é informado à rede para que sejam feitos ajustes a fim de melhorar suas futuras respostas. detectando suas regularidades.

detecção de fraudes. abaixo alguns projetos onde foram aplicados: Aplicações de softwares na analise de credito. 1995) Neste caso a aplicação começa com a coleta de dados.5]. Card Neus. Aplicação e Ferramentas Redes neurais são aplicadas em diversas áreas. para avaliação de propostas de novos clientes. Mastercard e Visa estão investindo em projetos para construção de sistemas semelhantes. Um sistema inteligente para tomada de decisão sobre autorização de compra com cartão de crédito utilizada pela American Express resultou em uma economia de 20% no temo médio gasto em cada transação e a qualidade das decisões tomadas por este sistema foram em média 50% melhores que decisões tomadas pelo pessoal de autorização de crédito. Redes neurais e sua aplicação em sistemas de recuperação de informação (Edberto Ferneda Professor doutor do curso de ciências da informação e Documentação da Faculdade de Filosofia Ciências e Letras de Ribeirão Preto – USP ) Este projeto apresenta as principais iniciativas de se aplicarem conceitos de redes neurais aos sistemas de recuperação de informação e avalia sua aplicabilidade em grandes bases documentais. com taxa de aprendizado n:0. Após um determinado ciclo de treinamento. começam aparecer efeitos do parâmetro de aprendizado. Neste caso. A metodologia utilizada foi feita com banco de casos que foi coletado das Planilhas de Investigação de Casos da Divisão de Vigilância Epidemiológica. 20. o treinamento foi realizado durante 1000 ciclos e utilizou o algoritmo de aprendizado backpropagation com termo momentum. todos os dados de uma transação são préprocessados. Março. e o critério segue exatamente o padrão da RNA com a alimentação de informações pesos em cada etapa da avaliação. Os resultados desta aplicação foi 38-20-8-2. foi de ciclos de 300 treinamentos. entre os adimplentes e os inadimplentes. um préprocessamento dos dados.0. e avaliação para autorização de compra ("Visa using neural networks to identify cardholder fraud".5. a rede foi inicializada com pesos aleatório no intervalo [-0. A segunda parte é a separação dos conjuntos de dados. utilizando RNA.025. da Prefeitura Municipal da cidade de Teresópolis (RJ 12 . como é o caso da web.7.025 e termo momentum u:0.

os neurônios de saída competem entre si. precisava-se de uma técnica capaz de agrupar as informações de forma a representar esses contextos. California Scientific Software. foi a Rede de KOHONEN que tem aprendizado não-supervisionado. o primeiro modelo. 1992. Cada neurônio se especializa numa área diferente do espaço de entradas e suas saídas podem ser usadas para representar a estrutura do espaço de entradas. uma camada escondida. Assim. A rede de KOHONEN [2] foi escolhida. como a relevância das variáveis para contexto (diagnóstico) pode ser desconhecida. meningite meningocócica associada à meningococcemia e meningite não específica. sendo assim. Foram detectados 8 tipos de classes diagnósticas. Os resultados obtidos deram que no aprendizado não supervisionado. As hipóteses intermediárias associadas aos resultados laboratoriais formarão a camada intermediária que servirão de input para a camada de saída. a de KOHONEN. Aplicaram-se dois tipos de RNA. tuberculósica. sendo que o vencedor deve estar ativo como resposta a uma entrada determinada. Dos 163 casos encontrados nas planilhas de investigação de casos. pois. Neste caso. Esta rede tem como característica captar similaridades e correlações nas entradas fornecidas. 16 neurônios na camada de saída. Estas variáveis foram discretizadas (zero: ausente e um: presente) de forma a atenderem as exigências do problema. isto é.Brasil) compreendendo os anos de 1992 a 1997. meningococcemia. O segundo modelo. a situação de diagnóstico pode ser descrita onde não se possui de antemão valores para todas as variáveis do problema e tampouco todas as variáveis são necessárias para se determinar o diagnóstico correto para todas as situações. a rede conta com 34 neurônios na camada de entrada. Destes 100 casos. referentes às 8 classes diagnósticas Para esta rede o simulador utilizado foi o Brain Maker Simulated Biological Intelligence V2. vírus. foi necessário elaborar um conjunto de saída esperado composto por 8 neurônios. camada de entrada é formada somente pelos dados clínicos. quando é utilizado um agente externo que indica à rede a resposta desejada em relação ao padrão de entrada fornecido. pneumococo. a Rede de GALLANT tem aprendizado supervisionado. uma camada de saída com 8 neurônios. separadas de acordo com as manifestações apresentadas: hemófilo. formando um total de 34 variáveis (neurônios) no conjunto de entrada. Sendo assim. que irão gerar uma lista de hipóteses intermediárias. meningocócica.51. apenas 100 foram representativos. dados laboratoriais e dados clínicos. os resultados foram satisfatório e de 13 . 65 foram reservados para treinamento e 35 para os testes finais. As entradas foram classificadas em: sinais físicos. A configuração da rede conta com 34 neurônios na camada de entrada.

escalonamentos e conversões de formato para torná-los mais apropriados à sua utilização na rede. NEUROFURG. Uma aplicação e desenvolvimento de rede neural geral é seguida pelo seguintes passos. pode-se usar também uma subdivisão do conjunto de treinamento.Normalmente. primeiramente é feita a coleta de dados relativos ao problema e sua separação em um conjunto de treinamento e um conjunto de testes. nem de generalizar e aprender com o ambiente diante de informação incompleta. 14 . a rede não foi capaz de representar esse domínio. que serão utilizados para verificar sua performance sob condições reais de utilização. os dados coletados são separados em duas categorias: dados de treinamento. pode ser necessário préprocessar estes dados. utilizado para verificar a eficiência da rede quanto a sua capacidade de generalização durante o treinamento. com margem de acerto nos diagnotiscos de 83%.criando um conjunto de validação. Além dessa divisão.Depois de determinados estes conjuntos.maneira uniforme. de acordo com o grau de participação que cada neurônio teve no nível posterior. Uma ferramenta utilizada é o backpropagation onde o aprendizado baseia-se na propagação retrógrada do erro para os níveis anteriores da rede. uma ferramenta da Universidade Federal do Rio Grande. Já na segunda tentativa com a simulação de rede GALLANT. Além disso. Outras ferramentas em redes neurais são DATA MINING. que serão utilizados para o treinamento da rede e dados de teste. através de normalizações. não foi obtido resultado satisfatório. eles são geralmente colocados em ordem aleatória para prevenção de tendências associadas à ordem de apresentação dos dados. e podendo ser empregado como critério de parada do treinamento.

É importante e relevante destacar que esta rede possui uma interessante habilidade de aprender em seu ambiente e uma aprendizagem continua que melhora significativamente seu desempenho. classificar com sucesso modelos que não foram anteriormente apresentados. se não a melhor característica das redes neurais é sua habilidade de generalizar. a partir do momento que esta apresentada à rede uma gama larga de modelos no treinamento. qualquer novo modelo com entradas similares a um dos modelos treinados será bem classificada. Pode se concluir também que as Redes Neurais Artificiais estão cada vez mais presentes no dia a dia para solucionar problemas diários. 15 . Conclusão Redes Neurais Uma das melhores.8. isto é.

representação global distribuída. são sistemas computacionais estruturados numa aproximação à computação baseada em ligações. pode tratar qualquer subconjunto das variáveis como entrada. difícil inserção de conhecimento a priori. em particular do exame de neurônios. A inspiração original para essa técnica advém do exame das estruturas do cérebro. redes neuronais artificiais. ou. Comparação entre Redes Bayesianas e Redes Neurais Redes neuronais (redes neurais no Brasil).daí o termo rede neuronal. na aprendizagem. processadores ou unidades) são interligados para formar uma rede de nós . é propicio para problemas de incerteza. Já redes Bayesianas é uma estrutura de dados para representar as dependências entre variáveis e fornecer uma especificação consta de qualquer distribuição de probabilidade conjunta total. implementável em hardware. variáveis discretas ou continuas. Conclui-se que cada uma das redes tem seus pró e seus contras. 16 .9. Em uma comparação de características entre elas. Nós simples (ou neurões. não implementável em hardware. neurônios. e sua técnica se baseia. Ela analisa dados probabilísticos e resolve uma ação baseado nesses dados. entras e saídas fixas. temos que redes bayesianas utilizam representações locais. as variáveis possuem dois níveis de ativação. e sua melhor aplicabilidade para cada tipo de problemas. já redes neurais tem. mais propriamente.

Inteligência Artificial: ferramentas e teorias.sbis.htm http://pt. Sandra A Sandri.com/doc/30239982/Redes-Neurais-Artificiais http://www.wikipedia.ufrj.br/ia/neurais/ http://www.org/wiki/Rede_neural http://www.org/wiki/Rede_bayesiana P. Ludermir.. 1997. 2002.scribd.din.wikipedia. Ed.pdf http://www. McGraw-Hill.ccuec. T. B ITTENCOURT.net/cardoso083/aplicaes-de-redes-neurais2010#btnNext http://pt. Alexandre. 17 . 2001. Redes Bayesianas e Produção de Conhecimento: uma abordagem de data-mining em dados de um concurso vestibular. 1998.php http://www. Florianópolis-SC. VIEIRA. MEYER.org.html http://www.10. Paul L.cos.br/~ines/courses/cos740/leila/cos740/aprBayesianas . Brasil.com. B. Mitchell. Renato C.tecmundo. Rio de Janeiro: LTC. P. Florianópolis: Editora da UFSC. Guilherme.Centro-Oeste.unicamp. de Carvalho. L.lx. 1999 UNESP/FE/DEE BARRETO. Braga. Machine Learning. NASSAR.br/cbis9/arquivos/461. F.it. Probabilidade: Aplicações à Estatística. T.uem.br/revista/infotec/artigos/claudia. Dra. Consultura Profa.slideshare. M.infowester. Rio de Janeiro. Referencias Bibliográficas http://www. Fundamentos de Redes Neurais Artificiais. Artigo "Projeto e Análise de uma Rede Neural para resolver problemas de Programação Dinâmica". Silvia M.pt/~afred/docencia/Percepcao_2006/acetatos/rb.pdf http://pt. In: 35º Reunião Regional da ABE/SOBRAPO.PDF http://www.br/programacao/2754-o-que-sao-redesneurais-. 2003 e V Escola Regional da Sociedade Brasileira de Computação (SBC) . A.com/redesneurais. 1975.