Professional Documents
Culture Documents
Algoritmos de computao natural normalmente so utilizados para resolver problemas NP ou NPhard No espere que os primeiros experimentos que voc rodar deem certo O sucesso depende fortemente dos parmetros Nem sempre o algoritmo vai funcionar
O problema pode ser muito difcil
Se a fitness apropriada
Aumentar o tamanho da populao, em algum momento, vai fazer com que a fitness melhore
Adicionar diferentes tipos de operadores de mutao Introduzir conceitos de espcies Utilizar fitness sharing
9/29/2009
Normalmente se comea variando o tamanho da populao, e depois os operadores genticos No caso de GP o tamanho mximo da rvore do indivduos normalmente variado antes dos operadores
Anlise do Algoritmo
Monitorar a fitness Monitorar a diversidade da populao Monitorar o nmero de operaes de cruzamento e mutao que geram indivduos melhores que os pais
Anlise da Populao
Elemento mais importante a ser analisado Avaliao bsica: plotar fitness versus gerao Verificar tambm
Distribuio do tamanho dos indivduos, se ele for varivel Distribuio dos valores de fitness durante cada gerao
Pode dar dicas a respeito da estrutura do espao de busca Se existe uma variao muito grande entre os valores, podem ter regies do espao que no esto sendo descobertas
Anlise da Populao
Para isso, voc deve guardar em um log o mximo de informaes possveis. Vizualizar os dados onde a fitness est sendo calculada tambm pode ser de grande ajuda
9/29/2009
Diversidade
Se mais de 90% dos indivduos da populao so iguais em um tempo muito curto, isso pode indicar um problema Ao mesmo tempo, muita diversidade tambm pode representar um problema Por isso, se possvel, medir a distncia de fentipo entre dois indivduos pode ser muito importante
Exemplo
4 3.5 3 2.5 2 1.5 1 0.5 0 -10 -5 0 5 10
Classificao
Conjuntode Conjunto de teste Treinamento
Modelo criado Algoritmo a partir dos Data Mining dados
9/29/2009
Clusterizao
Conjunto de Treinamento
A1,A2,A3 0, 0, 1 1, 1, 0 . 0, 1, 0 Algoritmo de Clusterizao Modelo criado a partir dos dados
Nesse caso, a quantidade de classes desconhecida. Cabe ao algoritmo determinar e agrupar os dados de acordo com suas caractersticas
Aprendizagem
Em tarefas de aprendizagem, os dados devem ser divididos em pelo menos dois conjuntos:
Conjunto de treinamento, onde a fitness calculada Conjunto de teste, onde o melhor indivduo retornado avaliado
Exemplo
Validao Cruzada
Garante Validao estatstica dos resultados Como funciona?
Passo 1: os dados so divididos em k subconjuntos de mesmo tamanho Passo 2: em cada instante um subconjunto usado para teste e os demais para treinamento
Validao Cruzada
Mtodo padro para avaliao: validao cruzada estratificada com fator 10 A realizao de vrios experimentos tem demonstrado que 10 a melhor escolha A estratificao reduz a varincia da estimativa Opo melhor: validao cruzada estratificada com fator 10 repetida (10 x)
Isto chamado validao cruzada de fator k Normalmente os subconjuntos so estratificados (divididas de forma que a distribuio das classes sejam mantidas) antes de realizar a validao cruzada Faz-se a mdia das estimativas de erro para obter o erro estimado geral
9/29/2009
Leitura Recomendada
Parameter Control in Evolutionary Algorithms, goston E. Eiben , Robert Hinterding , Agoston E. Eiben Robert Hinterding , Zbigniew Michalewicz, IEEE Transactions on Evolutionary Computation, 2000 A study of cross-validation and bootstrap for accuracy estimation and model selection, R. Kohavi, Proc. of the 14th International Joint Conference on Artificial Intelligence 2 (12): 11371143, 1995