Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Save to My Library
Look up keyword
Like this
14Activity
0 of .
Results for:
No results containing your search query
P. 1
Lógica Fuzzy

Lógica Fuzzy

Ratings:

5.0

(2)
|Views: 782 |Likes:
Published by queenann

More info:

Published by: queenann on Aug 16, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

11/21/2012

pdf

text

original

 
1
Aprendizado Incremental
 Fuzzy
: uma AbordagemBaseada na Teoria de Exemplares Generalizados
Maria do Carmo NicolettiFlávia Oliveira Santos
Departamento de ComputaçãoUniversidade Federal de São Carlos - UFSCarCaixa Postal 676 13565-905 São Carlos SP - Brazil
{carmo,flavia}@dc.ufscar.br
Abstract:
This paper initially discusses the main ideas underneath one of the most representativelearning systems based on the generalization of exemplars, the NGE system. Next it presents the
Fuzzy NGE 
system which learns by generalizing exemplars described as attribute-fuzzy_value pairs and acrisp class.
Resumo:
Este artigo discute, inicialmente, as principais idéias que subsidiam um dos maisrepresentativos sistemas de aprendizado baseado na generalização de exemplares, o algoritmo NGE.E, então, apresenta o sistema
Fuzzy NGE 
que aprende generalizando exemplares descritos por paresatributo-valor_
 fuzzy
e uma classe
crisp
.
1 Introdução
Aprendizado pode ser caracterizado como umprocesso multidimensional que, via de regra, ocorreatravés da aquisição de conhecimento declarativo,do desenvolvimento de habilidades motoras ecognitivas através de instrução e prática, daorganização do conhecimento existente emrepresentações mais efetivas, da descoberta denovos fatos e/ou teorias através de observação eexperimentação ou, então, através da combinaçãoe/ou composição dessas dimensões [Michalski(1993)].Devido, principalmente, à sua naturezamultidimensional e interdisciplinar, à existência ounão de conhecimento prévio para o aprendizado denovos conhecimentos, à não obediência a umacronologia predefinida, a diferentes graus deespecialização das informações disponíveis, àsdiferentes possibilidades
  
bem como às diferentesgranularidades
  
de expressão do conhecimentoaprendido, à sua natureza muitas vezes incrementale acumulativa, e em outras vezes não monotônica,aprendizado se evidencia como um processoaltamente complexo e ainda não completamenteentendido [Nicoletti (1994)].Entre os vários paradigmas existentes paraaprendizado tratado como uma área de pesquisa emInteligência Artificial, o chamado aprendizadoindutivo simbólico é um dos que tem sido maislargamente pesquisado e tem contribuídoefetivamente para a implementação de sistemas deaprendizado de máquina. A partir de exemplos, váriostipos de tarefas podem ser aprendidas como, porexemplo, diagnóstico de doenças, previsãometeorológica, predição do comportamento de novoscompostos químicos, predição de propriedadesmecânicas de metais com base em algumas de suaspropriedades químicas, etc. Técnicas de aprendizado demáquina têm sido utilizadas em todas essas tarefas e emmuitas outras, principalmente naquelas passíveis deserem enquadradas como aprendizado de conceitos apartir de exemplos. A aplicação mais óbvia deaprendizado de máquina está na articulação de sistemasde aprendizado de máquina a mecanismos de aquisiçãode conhecimento, em sistemas baseados emconhecimento.Para a expressão de qualquer paradigma deaprendizado são necessárias linguagens que descrevamobjetos assim como linguagens que descrevam osconceitos aprendidos. Vários formalismos lógicos têmsido usados em sistemas de aprendizado indutivo para arepresentação de exemplos e conceitos. Em geral,distinguem-se dois tipos de descrição: descrição baseadaem atributos e descrição relacional. Em uma descriçãobaseada em atributos, objetos são descritos em termos deatributos e valores desses atributos. Em uma descriçãorelacional (também chamada de descrição estrutural) umobjeto é descrito em termos de seus componentes e derelações entre eles.Alguns dos algoritmos/sistemas de aprendizadoindutivo que têm sido utilizados com relativo sucesso em
 
2um número razoável de aplicações
  
 
tais como oID3 [Quinlan (1986)] e o AQ [Michalski (1993)]
  
usam linguagens baseadas em atributos, tambémconhecidas como linguagens proposicionais, para arepresentação de exemplos e conceitos. Narealidade, as linguagens de descrição de conceitosutilizadas por esses sistemas para a expressão desuas hipóteses induzidas, que tipicamente sãoárvores de decisão e regras de produçãorespectivamente, podem ser tratadas como variantesde linguagens baseadas em atributos.Com poucas exceções, os sistemas deaprendizado indutivo existentes são nãoincrementais, i.e., o conjunto de treinamento deveestar disponível ao sistema no começo do processode aprendizado; a expressão do conceito é induzidaconsiderando todos os exemplos de uma vez. Se poracaso novos exemplos de treinamento se tornamdisponíveis após o processo de aprendizado tercomeçado, a única maneira possível de incorporá-los à expressão do conceito é reiniciar todo oprocesso de aprendizado com o conjunto detreinamento atualizado.É importante notar, entretanto, que muitassituações de aprendizado podem ser caracterizadaspela maneira incremental através da qual exemplosde treinamento se tornam disponíveis. Numambiente incremental, um sistema ideal deaprendizado deve ser capaz de modificar
online
aexpressão do conceito à medida que novosexemplos de treinamento se tornam disponíveis.Um novo exemplo pode, potencialmente, provocarum rearranjo da expressão do conceito obtida atéentão. É fato, entretanto, que restrições com relaçãoà extensão com que tais rearranjos devam acontecerdeve ser objeto de estudo e avaliação.Incrementabilidade em um sistema de aprendizado,via de regra, está associada à maior versatilidade e àmaior adaptabilidade do sistema. É,conseqüentemente, uma característica desejável,desde que eficientemente incorporada.As versões incrementais do ID3, conhecidascomo ID4 [Schlimmer (1986)] e ID5 [Utgoff (1988)] têm alguns inconvenientes com relação aodesempenho. Aparentemente, a descrição deconceito que usa árvore de decisão como linguagemrepresentacional não é apropriada à abordagemincremental. Essas versões incrementais necessitamarmazenar todos os exemplos na memória, com oobjetivo de reusá-los quando um rearranjo daexpressão corrente do conceito for necessário. Narealidade, o ID4 e ID5 implementam uma pseudo-incrementabilidade.A busca por outras linguagensrepresentacionais que pudessem expressar conceitosinduzidos a partir de exemplos de maneirasatisfatória, que fossem adequadas ao modeloincremental de aprendizado e que permitissem aincorporação de tratamento
 fuzzy
, evidenciou a teoria deexemplares como uma alternativa viável a ser explorada,e o algoritmo NGE como uma possívelconcretização/generalização daquelas idéias.Este trabalho está organizado da seguinte maneira:na próxima seção são descritas as principais idéias quesubsidiam o modelo de aprendizado baseado nageneralização de exemplares, através da descrição doNGE (Nested Generalized Exemplar), um de seusprincipais representantes. A Seção 3 apresenta e discute oalgoritmo
Fuzzy NGE 
que realiza a generalização deexemplares descritos por atributos com valores
 fuzzy
.Nessa seção são também propostos e discutidos o uso damedida de possibilidade
 fuzzy
para direcionar a escolhado melhor exemplar a ser generalizado e o uso daoperação de união
 fuzzy
para gerar a generalização doexemplar. A Seção 4 descreve um exemplo simples deaplicação do
Fuzzy NGE 
dando ênfase às operações deescolha e generalização do exemplar. A Seção 5apresenta as conclusões desse trabalho e linhas depesquisa para a sua continuidade.
2 Aprendizado Indutivo Incremental viaGeneralização de Exemplares
o NGE
A teoria de exemplares generalizados NGE, proposta porSalzberg em [Salzberg (1991)], é uma forma deaprendizado indutivo incremental supervisionado a partirde exemplos, que se baseia no modelo de aprendizadohumano chamado
exemplar-based learning
[Medin(1978)] e é uma descendente da classificação de padrões
nearest neighbour 
  
 
NN [Cover (1967)].Recentemente tem-se notado um crescenteinvestimento em técnicas que têm como base o algoritmoNN, devido principalmente à natureza incremental destealgoritmo. A teoria NGE é uma teoria de aprendizadoindutivo que pode ser vista como uma hibridação daclassificação NN e da lógica de primeira ordem limitadaa cláusulas de Horn [Wettschereck (1995)].Na teoria NGE os conceitos induzidos assumem aforma de hiper-retângulos em um espaço n-dimensional.Esse espaço é definido pelos n atributos usados para adescrição dos exemplos. Num paralelo a processos degeneralização convencionais que substituem fórmulassimbólicas por fórmulas simbólicas mais gerais, oalgoritmo NGE modifica hiper-retângulos, através de seucrescimento e reestruturação (e em algumas situações,sua retração).A entrada para o sistema NGE é um conjunto deexemplos de treinamento apresentados incrementalmente,cada um descrito como um vetor atributos/ valores_numéricos e uma classe associada. Os n atributosusados para a descrição dos exemplos definem o espaçoEuclidiano no qual o conceito será representado. Atributospodem ter valores
crisp
que variam de 2 a infinito (valoresreais) e classes podem ser binárias, discretas ou contínuas.
 
3Na primeira fase (a de inicialização), o NGEaceita os n (número definido pelo usuário)primeiros exemplos que são fornecidos ao sistemacomo sendo o conjunto inicial de hiper-retângulos(chamados de triviais, já que são pontos), cada umdeles considerado um exemplar, a partir dos quaisgeneralizações podem ser feitas. Apenas quando on-ésimo+1 exemplo se torna disponível é que a fasede inicialização termina e a de treinamento começa.Nessa segunda fase, onde o aprendizadoefetivamente ocorre, à medida que novos exemplosvão sendo apresentados, o NGE generaliza os hiper-retângulos do conjunto inicial, dispostos no espaçoEuclidiano n-dimensional, expandido-os (e emalguns situações específicas, encolhendo-os), aolongo de uma ou mais dimensões. Como será visto aseguir, o número de hiper-retângulos no espaçopode aumentar, à medida que o aprendizadoprossegue.A escolha de qual hiper-retângulo generalizardepende de uma métrica de distância. Em umuniverso onde os atributos têm valores
crisp
, talmétrica é uma distância Euclidiana ponderada,ponto
  
a
  
ponto (hiper-retângulo trivial) ouponto
  
a
  
hiper-retângulo.Para cada novo exemplo de treinamento E, oNGE encontra entre todos os hiper-retângulos(exemplares) existentes até então no espaço n-dimensional, o hiper-retângulo mais próximo,H
próximo1
, e o segundo mais próximo, H
próximo2
, donovo exemplo E. Após encontrar os doisexemplares mais próximos, o sistema prosseguecom a comparação das classes (a do exemplo com ade cada um dos dois exemplares) que permiteescolher qual exemplar será generalizado. Se E eH
próximo1
têm a mesma classe, H
próximo1
égeneralizado, processo onde o hiper-retângulo éexpandido de maneira a incluir o novo exemplo. Se,no entanto, a classe de E difere da classe deH
próximo1
, o sistema compara a classe de E com aclasse de H
próximo2
. Se ambos têm a mesma classe, oNGE vai generalizar H
próximo2
. Entretanto, se Etambém não pertencer à mesma classe de H
próximo2
,esse novo exemplo torna-se um novo exemplar,assumindo a forma de um hiper-retângulo trivial noespaço n-dimensional.Um mecanismo de ajuste de pesos é adotadopelo NGE como uma forma de reforçar a relevânciade atributos e exemplares no processo declassificação. Tal reforço pode ser positivo ounegativo, dependendo da contribuição de cadaatributo e de cada exemplar quando da classificaçãode cada um dos exemplos de treinamento. O pesow
H
do exemplar H é inicializado com 1 e à medidaque o treinamento prossegue, w
H
=U/C vai sendoatualizado, onde U é o número de vezes que H foiusado e C é o número de vezes que H fez aclassificação correta. Como U
C, w
H
é inversamenteproporcional à confiança que se tem em H como um“descritor” do conceito, i.e., quanto maior w
H
, menosprovável é que o exemplar H desempenhe um papelrelevante na expressão final do conceito. Políticasemelhante é adotada com relação aos atributos f 
i
, quepodem ter o seu peso
w
i
incrementado ou decrementadode
f (taxa global de ajuste do peso do atributo, valor
default 
adotado em [Salzberg (1991)] é 0.2).Um outro aspecto importante que caracteriza oalgoritmo NGE é que tal algoritmo permite, durante oprocesso indutivo, a criação de hiper-retângulosaninhados; o hiper-retângulo mais interno é tratado comouma exceção ao mais externo. Essa forma derepresentação de exceções é, de certa forma, não muitousual uma vez que não reflete a idéia intuitiva do que sejaum conceito.
3 Aprendizado NGE em domínios
 fuzzy
O sistema
Fuzzy NGE 
é uma versão do sistema NGEoriginal, baseada no algoritmo proposto em [Nicoletti(1996)], que aceita exemplos de treinamento descritospor atributos que possuem valores
 fuzzy
e uma classe
crisp
associada, chamados nesse trabalho de exemplos
 fuzzy
. O seu processo de inicialização é o mesmo doNGE original, onde um número de pontos determinadopelo usuário são transformados em exemplares
 fuzzy
.Com o término da fase de inicialização, e com o espaçode hipóteses formado pelos n primeiros exemplos, osistema inicia sua fase de treinamento. Cada novoexemplo
 fuzzy
é, então, comparado com cada um dosexemplares
 fuzzy
existentes até então no espaço n-dimensional de atributos.Com o objetivo de escolher o exemplar a sergeneralizado, o sistema
Fuzzy NGE 
avalia a proximidadedo novo exemplo de treinamento com relação a todosexemplares existentes no espaço e elege os dois maispróximos. Para a avaliação da proximidade entre umexemplo e um exemplar é usada uma medida de distânciaponderada, baseada na noção
 fuzzy
de possibilidade [Klir(1995)] entre os conjuntos
 fuzzy
que descrevem oexemplo e o exemplar, para cada atributo existente.Para encontrar a proximidade ponderada de umexemplo E a um exemplar H o sistema executa trêsprocedimentos:
encontra a medida de proximidadeatributo-a-atributo entre E e H, através da medida depossibilidade entre os conjuntos
 fuzzy
associados a cadaatributo que descreve E e H;
calcula a média ponderadada proximidade atributo-a-atributo usando o pesoassociado a cada atributo;
pondera o valor obtido nopasso anterior pelo peso do exemplar H. A proximidadeponderada entre E e H obtida após a execução desses trêsprocedimentos é um número real.Ao contrário do mecanismo de ponderação do NGEoriginal, o
Fuzzy NGE 
assume que quanto maior o pesoassociado a um atributo, mais relevante é o papel desse

Activity (14)

You've already reviewed this. Edit your review.
1 hundred reads
1 thousand reads
Fausto Candido liked this
nacional007 liked this
Daniel Medeiros liked this
Patrick Vazquez liked this
frater Sergio liked this

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->