You are on page 1of 7

DIVULGAO ALGORITMO GENTICO EM QUMICA Paulo Augusto da Costa Filho e Ronei Jesus Poppi Instituto de Qumica - Universidade Estadual

de Campinas - CP 6154 - 13083-970 - Campinas - SP Recebido em 30/4/98; aceito em 2/9/98

GENETIC ALGORITHM IN CHEMISTRY. Genetic algorithm is an optimization technique based on Darwin evolution theory. In last years its application in chemistry is increasing significantly due the special characteristics for optimization of complex systems. The basic principles and some further modifications implemented to improve its performance are presented, as well as a historical development. A numerical example of a function optimization is also shown to demonstrate how the algorithm works in an optimization process. Finally several chemistry applications realized until now is commented to serve as parameter to future applications in this field. Keywords: chemometrics; optimization; genetic algorithm.

INTRODUO Em qumica muitas vezes surgem situaes onde se deve considerar uma srie de fatores que exercem influncia sobre um determinado processo. Devemos ento decidir qual desses fatores, ou em quais nveis (quantidades), que iro produzira a melhor resposta baseada em algum parmetro pr-estabelecido. Neste caso, deseja-se realizar uma otimizao numrica do sistema, ou seja, pretende-se encontrar as condies que iro fornecer a melhor resposta desejada baseada nos parmetros quantificveis. Por exemplo, em uma determinada sntese, deseja-se determinar quais valores de temperatura, pH e quantidade de catalisador que iro fazer com que numa determinada reao obtenha-se o maior rendimento possvel. Outro exemplo seria encontrar quais as melhores condies operacionais de um equipamento para realizar-se uma anlise. Como em cromatografia gasosa, onde seria determinada qual a melhor temperatura da coluna e a melhor vazo do gs de arraste que proporcione a separao dos picos. A utilizao de mtodos para otimizao numrica em qumica j explorada h bastante tempo, podendo ser considerada uma das primeiras aplicaes da disciplina que hoje se conhece como quimiometria1. A quimiometria, na definio atualmente mais aceita, pode ser considerada como a disciplina que utiliza mtodos matemticos e estatsticos, assim como de lgica matemtica, a problemas de origem qumica. Os mtodos normalmente utilizados para a otimizao de sistemas qumicos podem ser divididos em dois grandes grupos. Tem-se os mtodos baseados em gradientes e os que no so. Nos mtodos baseados em gradiente2 explora-se o fato de que a partir de processos derivativos pode-se encontrar os mnimos e mximos. Os mtodos que no so baseados em derivadas encontram-se assim no outro grupo, e dentre os mais largamente conhecidos e empregados em qumica destaca-se o mtodo simplex3. Este se baseia no deslocamento do simplex, que uma figura geomtrica, sobre a superfcie de resposta para encontrar os mximos e mnimos. Mais recentemente tem surgido na literatura e causado grande impacto na comunidade cientfica o chamados mtodos de inteligncia artificial4. A inteligncia artificial faz parte dos processos que simulam via software ou hardware, o talento dos seres racionais para a representao e processamento de
e-mail: ronei@iqm.unicamp.br

informaes. Na rea de otimizao uma tcnica de inteligncia artificial que vem sendo muito estudada atualmente o algoritmo gentico. Este um processo de otimizao baseado nos processos biolgicos da evoluo das espcies, simulando matematicamente a teoria de Darwin. Este mtodo de otimizao tem recentemente recebido grande destaque na rea de qumica, e neste artigo pretende-se introduzir os seus conceitos bsicos, pois se percebe que ele ainda no est difundido dentro da comunidade qumica do pas. Pretende-se tambm apresentar vrias aplicaes realizadas at o momento, para que seja possvel ter uma viso do potencial da tcnica e estimular a sua utilizao. ALGORTMO GENTICO Histrico A teoria da evoluo das espcies originou-se das observaes realizadas por Charles R. Darwin, durante uma expedio cientifica ao redor do mundo. Nesta ocasio Darwin assumia a tarefa de naturalista do navio Eagle 5. Durante esta jornada que durou cinco anos, Darwin presenciou inmeras situaes que o levaram a pensar sobre a possvel seleo natural das espcies. No arquiplago dos Galpagos, ele verificou que cada ilha possua uma fauna caracterstica, principalmente com relao a pssaros, tartarugas e lagartos. Em 1858, Darwin apresentou a teoria da seleo natural, numa sesso da Academia Britnica de Cincias. No ano seguinte publicou um resumo do livro Natural Selection, onde introduzia a teoria da Evoluo das espcies. Segundo Darwin, no mecanismo de seleo natural, os indivduos mais adaptados tm maior probabilidade de sobrevivncia do que os menos adaptados. Como conseqncia disso, os mais adaptados teriam maior nmero de descendentes, o que provocaria, na gerao seguinte, um aumento no seu nmero, em relao aos no adaptados. Tais adaptaes levam a evoluo biolgica, a qual ocasiona mudanas nas propriedades das populaes dos organismos que transcendem o perodo de vida de um nico indivduo. As mudanas nas populaes que so consideradas evolutivas so aquelas herdveis via material gentico, de uma gerao para a outra. A evoluo biolgica pode ser pequena ou substancial, sendo estes efeitos responsveis pelas adaptaes dos organismos a diferentes ambientes5. Com base na teoria evolutiva das espcies, John H. Holland um pesquisador da Universidade de Michigan, props nos anos 60 a construo de um algoritmo matemtico para otimizao

QUMICA NOVA, 22(3) (1999)

405

em sistemas complexos, sendo denominado de Algoritmo Gentico 6. Este algoritmo pretendia simular matematicamente todo o mecanismo da evoluo biolgica, com todas as caractersticas e vantagens desse processo. A partir dos anos oitenta, o algoritmo gentico recebeu um grande impulso em diversas reas de aplicao cientifica, devido principalmente versatilidade e excelentes resultados apresentados. A popularizao dos computadores e o aparecimento de sistemas cada vez mais rpidos e potentes, tambm auxiliaram muito o seu desenvolvimento. O algoritmo gentico tem sido aplicado nas mais variadas reas, podendo-se destacar sua utilizao em processamento de imagem; modelagem e identificao de sistemas; filtros para cancelamento de rudos; robtica; e seleo de parmetros de redes neurais7. Mais recentemente, o algoritmo gentico comeou a ser utilizado em qumica, uma vez que nesta rea problemas complexos de otimizao tambm so normalmente encontrados. A primeira aplicao de algoritmo gentico em qumica foi realizada no incio dos anos noventa por Lucasius e Kateman8, num trabalho exploratrio para seleo de comprimentos de onda em espectros no ultravioleta para anlise de quatro nucleotdeos. As aplicaes deste algoritmo cresceram muito nos ltimos anos, principalmente devido s vantagens que este apresenta quando comparado a outros mtodos de otimizao. Como principais vantagens pode-se destacar6 : i - No requer informaes sobre o gradiente da superfcie de resposta; ii - Eventuais descontinuidades da superfcie de resposta no afetam a performance da otimizao; iii - A presena de mnimos locais no reduzem a eficincia do algoritmo; iv - A performance do algoritmo tem apresentado excelentes resultados para problemas de otimizao de grande escala. Algoritmo Gentico bsico O algoritmo gentico foi estruturado de forma que as informaes referentes a um determinado sistema pudessem ser codificadas de maneira anloga aos cromossomos biolgicos. Desta forma o algoritmo proposto assimila-se muito ao processo evolutivo natural. O algoritmo gentico bsico envolve cinco passos: codificao das variveis, criao da populao inicial, avaliao da resposta, cruzamento e mutao. Codificao das variveis O cromossomo biolgico composto de genes, que so responsveis por determinadas caractersticas do indivduo, como por exemplo, cor dos olhos, altura, cor da pele, etc. Atravs de uma analogia possvel construir um cromossomo artificial. Num processo qumico cada gene representar um determinado parmetro que ser otimizado como, por exemplo: temperatura, agitao, tempo, quantidade de catalisador (conforme figura 1). Neste tipo de sistema, a forma mais simples de representar as informaes relativas a cada parmetro que ser otimizado (como temperatura, catalisador, agitao e quantidade de catalisador), codificando-as em nmeros binrios. Assim cada cromossomo artificial ser representado por uma seqncia de zeros e uns (forma binria para cada parmetro). Esse tipo de codificao apresenta inmeras vantagens no decorrer do processo de otimizao como tornar as operaes genticas mais fceis de serem executadas; tornar possvel o trabalho com variveis que assumam valores contnuos; facilitar a variao da faixa de trabalho dos parmetros; alm de apresentar relativa simplicidade na variao da preciso dos valores de cada parmetro. A Figura 1 mostra a codificao dos valores relativos aos quatro parmetros que sero otimizados. Neste caso deve-se

Figura 1. Codificao dos parmetros Temperatura, Catalisador, Agitao e Tempo de valores decimais para valores binrios de 6 bits. Por exemplo, para a Temperatura que tem valor decimal igual a 35, aps a converso tem-se a seguinte sequncia de zeros e uns : 100011.

codificar para binrio o valor de temperatura igual a 35 graus, o valor do catalisador igual a 8 gramas, o valor de agitao igual a 43 rpm e o valor do tempo igual a 56 minutos. Tomando como 6 bits cada um dos parmetros a serem otimizados, tem-se assim o cromossomo formado por 24 unidades binrias, sendo que os seis primeiros formam o gene correspondente temperatura, e na seqncia de 6 bits os genes para catalisador, agitao e tempo. CRIAO DA POPULAO INICIAL Atravs de um gerador randmico, cria-se uma populao inicial de cromossomos, como mostrado na Figura 2 (neste caso uma populao de sete indivduos, ou cromossomos).

Figura 2. Representao de 7 cromossomos gerados de maneira aleatria que sero utilizados para o incio do processo de seleo, onde a sequncia de bits est relacionada com as variveis Temperatura, Catalisador, Agitao e Tempo conforme mostrado na figura 1.

Sendo a populao inicial aleatria, garantimos que no haver nenhum tipo de influncia tendenciosa do meio externo. Desta forma tenta-se garantir a idoneidade da pesquisa. Entretanto h casos onde existem informaes adicionais que podem ser introduzidas na gerao da populao inicial, minimizando o tempo de computao, ou seja, o tempo para encontrar o valor timo. Avaliao da resposta (Aptido) Deve-se encontrar o valor associado performance de cada cromossomo, relacionado ao sistema de interesse. A avaliao da resposta de cada cromossomo o resultado mais importante no procedimento do algoritmo gentico. A resposta (aptido) uma caracterstica intrnseca ao indivduo. Esta indicar, a nvel biolgico, qual a habilidade que um indivduo possui para sobreviver a predadores, pestes e a outros obstculos para a subseqente reproduo. Transportando para o

406

QUMICA NOVA, 22(3) (1999)

algoritmo matemtico, seria sua habilidade de produzir a melhor resposta. Esta resposta, na maioria das vezes, avaliada em termos de um erro calculado pela diferena entre o valor esperado e o valor previsto. O objetivo encontrar o menor erro possvel, e este ser o responsvel direto pela vida ou morte dos indivduos. Em alguns algoritmos, ser esta resposta que ir determinar qual a probabilidade com que um determinado cromossomo ir cruzar. Neste caso, determinados indivduos podero realizar mais de um cruzamento durante uma mesma gerao. Cruzamento Nesta etapa do algoritmo realizado o cruzamento entre material gentico de diferentes indivduos. A partir da atual populao, uma nova formada pelo cruzamento aleatrio entre os cromossomos. Portanto os filhos recebem informaes de seus progenitores, atravs do material gentico proveniente deste cruzamento. Durante a permuta de material gentico entre os indivduos, haver uma tendncia da transmisso das caractersticas dominantes para as geraes futuras. Aps algumas geraes podese observar que uma elevada taxa dos indivduos possuem a presena de variveis dominantes. O cruzamento responsvel pela convergncia para a situao de otimizao desejada. O processo de cruzamento d-se pela escolha aleatria dos indivduos e da posio onde ocorrer a ruptura seguida pela troca de material gentico. O nmero de rupturas geralmente varia entre 1 e 2. Isto se deve ao fato de que quanto maior for o nmero de rupturas menor ser a semelhana entre os pais e os filhos, portanto dificultando a convergncia. A Figura 3 mostra a etapa do cruzamento entre dois indivduos, para o gene (pedao do cromossomo) relacionado varivel catalisador, a qual est sendo otimizada.

adaptados, estas novas caractersticas sero transmitidas para os demais indivduos ao longo das prximas geraes. Este mecanismo ajuda a solucionar o problema do confinamento a mnimos locais na otimizao, pois promove alteraes que direcionam a pesquisa para outros locais da superfcie de resposta. A Figura 4 representa dois cromossomos, onde ocorreu mutao no material gentico. A mutao na representao binria realizada pela troca de um por zero e viceversa, conforme pode ser notado na Figura 4.

Figura 4. Operao de mutao nos cromossomos aps o cruzamento. Neste caso, em uma das posies, tem-se a troca de um bit cujo valor 0 pelo valor 1, gerando um novo indivduo.

PRINCIPAIS ETAPAS DO ALGORITMO GENTICO BSICO A Figura 5 mostra as principais etapas do algoritmo gentico bsico. Os passos 2 a 6 so continuamente repetidos at que um critrio de parada seja satisfeito. Como critrio de parada para o algoritmo gentico, normalmente adota-se um nmero mximo de geraes ou at que um erro mnimo desejado seja alcanado.

Figura 3. Etapa de cruzamento no gene referente varivel Catalisador. Neste caso ocorre : (a) o emparelhamento de dois cromossomos (um representado pela cor branca e outro pela cor negra) ; (b) rompimento e permuta do material gentico ; (c) gerao de dois novos cromossomos.

Mutao Durante o processo de reproduo pode ocorrer uma perturbao das informaes contidas dentro dos genes ocorrendo uma mutao. Esta promove alteraes no cdigo gentico de uma pequena parcela da populao, onde muitas vezes pode atuar de forma benigna. Se a alterao gerar indivduos mais

Figura 5. Fluxograma mostrando as principais etapas do algoritmo gentico bsico.

QUMICA NOVA, 22(3) (1999)

407

Basicamente existem quatro tipos principais de algoritmos genticos: Algoritmo gentico de Holland6, programa gentico de Koza 9, programa evolucionrio de Fogel10 e estratgica evolucionria de Rechenberg 11. Eles se diferem pelo mecanismo de cdigo gentico, procedimento de seleo, e reproduo. Entretanto, o mais popular o de Holland, que codifica as informaes na forma de cdigo binrio (0,1), e o algoritmo que est sendo tratado neste trabalho. Para uma boa performance do algoritmo faz-se necessrio otimizar parmetros como: probabilidade de mutao, probabilidade de cruzamento, tamanho da populao inicial e nmero de geraes. O tamanho da populao inicial escolhido normalmente entre 50-500 indivduos 6,7. Utiliza-se probabilidade de mutao de aproximadamente 1%, e probabilidade de cruzamento por volta de 90%6,7 . O nmero de geraes ir depender do tamanho da populao inicial, existindo um comprometimento entre o tamanho da populao inicial e o nmero de geraes. Para um tamanho de populao muito grande, muitas vezes torna-se impraticvel, em termos de tempo de processamento, realizar-se um grande nmero de geraes. Por outro lado, com uma populao maior pode-se realizar uma pesquisa mais completa em torno da superfcie de resposta. OPERAES E TCNICAS AVANADAS Aps o desenvolvimento do primeiro algoritmo gentico inmeras modificaes foram propostas com o intuito de aperfeioar a performance e robustez do programa. Os primeiros algoritmos eram compostos de basicamente quatro etapas: gerao da populao inicial, cruzamento, mutao e avaliao. Atualmente em programas mais sofisticados pode-se encontrar inmeros outros operadores genticos como: dominncia, distino de sexo e mecanismos para evitar incestos. Tambm para diminuir o tempo de processamento do programa, a computao paralela tem sido implementada nesse algoritmo. DOMINNCIA A dominncia estabelecida quando um determinado gene responsvel por uma caracterstica que faz com que um indivduo se destaque entre um determinado grupo. Desta forma, torna-se interessante a preservao desta informao, e a propagao para as geraes futuras. Isso pode fazer com que ocorra uma acelerao do processo de convergncia para o timo. O operador de dominncia possui a funo de localizar e preservar os genes responsveis pelo destaque em sua performance. Isso implementado no algoritmo matemtico fazendo com que aps um determinado nmero de geraes, inicie-se uma sub-rotina que emparelhe dois cromossomos e crie um novo indivduo que possua as caractersticas dominantes dos progenitores. Por exemplo, pode-se considerar que os bits zeros contero informaes dominantes e os bits uns recessivas. Neste tipo de operao, conforme pode observado no esquema apresentado na Figura 6, nos cruzamentos entre zeros e uns prevalecer sempre o bit zero. Portanto alm da populao proveniente do cruzamento haver tambm o acrscimo de mais estes novos indivduos na populao final desta gerao. DISTINO DE SEXOS O cruzamento a operao onde novos indivduos so gerados a partir de cromossomos pais. O cruzamento pode apresentar-se de trs formas distintas: homossexual, heterossexual e assexuado. O cruzamento por distino de sexo realizado atravs de um bit no cromossomo reservado para distinguir o sexo. Por exemplo, pode-se representar um indivduo do sexo masculino como tendo o bit 1, em uma determinada posio do cromossomo. A partir deste bit possvel controlar o cruzamento entre os indivduos. Nos cruzamentos homossexuais tem-se o cruzamento entre

Figura 6. Operao de cruzamento com dominncia. Esta operao gentica no envolve ruptura dos cromossomos, apenas a comparao dos bits em cada posio dos cromossomos pais. Nessa comparao sempre ir prevalecer o bit dominante, conforme ilustrado na figura.

cromossomos de mesmo sexo, enquanto nos heterossexuais realiza-se o cruzamento entre cromossomos de sexo distintos. Existem tambm os assexuados, onde ocorre a troca de material gentico dentro do prprio indivduo. O controle pela distino de sexo faz com que a diversificao seja mais ampla. Determinadas caractersticas desejveis muitas vezes somente podem ser encontradas num determinado sexo. Isso pode ser observado na natureza, j que apenas seres inferiores so hermafroditos. MECANISMOS PARA EVITAR INCESTOS No incesto tem-se o cruzamento entre indivduos que possuem cromossomos muito semelhantes (pais, irmos ou parentesco muito prximo), no levam a geraes futuras mais adaptadas. O cruzamento entre indivduos muito semelhantes leva a formao de um cromossomo muito parecido ao dos pais. Desta forma no h nenhuma melhora significativa para as novas geraes. Muitas vezes, implementa-se nos procedimentos uma sub-rotina que evite o incesto durante a etapa de cruzamento. Isso realizado evitando-se que cromossomos muito semelhantes se cruzem. COMPUTAO PARALELA Programas onde existe um grande nmero de operadores genticos tornam-se demorados, uma vez que muitas operaes devem ser realizadas. Com o objetivo de tornar a execuo do programa mais rpida, tem-se proposto o uso da computao paralela12 minimizando o tempo de processamento. A computao paralela caracterizada por ser realizada em um ambiente onde h mltiplos processadores, e uma rede interligando os processadores atravs da distribuio de partes do programa a serem executadas em diferentes maquinas simultaneamente. A construo de um programa em paralelo requer que o programador realize a decomposio do algoritmo, ou dos dados, em varias partes; distribua essas partes para os diferentes processadores que esto trabalhando simultaneamente; e coordene o trabalho e a comunicao entre esses processadores. No algoritmo gentico a computao paralela pode ser implementada na determinao da resposta de cada indivduo, em cada gerao. Esse clculo, que muitas vezes a etapa mais complexa dos clculos, pode ser distribudo para ser realizada em diferentes processadores. EXEMPLO DA OPERAO DE UM ALGORITMO GENTICO Para melhor exemplificar o funcionamento do algoritmo gentico, pode-se demonstrar sua aplicao na determinao do ponto mximo da seguinte funo:

408

QUMICA NOVA, 22(3) (1999)

X - X3 - Y5 ) x 5 1 3 17 exp(-X 2 - Y 2 )) - ( x exp( - (X +1) 2 - Y 2 + x( x sen(pi x X) 3 5 10 17 + x cos 2 x Y)) 10 Z = (3 x (1- X) 2 x exp(-X 2 - (Y +1) 2 )) - (10 x ( com o domnio de X e Y de -3 +3, conforme pode ser observado na superfcie de resposta da Figura 7. Este um exemplo de uma funo complexa, com mximos locais, alm do mximo global. Neste caso, pretende-se determinar quais os valores de X e Y que, dentro domnio especificado, iro produzir o maior valor de Z.

Figura 8. Resposta dos melhores indivduos de cada gerao.

Aplicao do algoritmo gentico em qumica Na qumica tem-se observado uma acentuada tendncia na aplicao de algoritmo gentico em inmeros problemas de otimizao de sistemas complexos essencialmente devido robustez e versatilidade do algoritmo. Tem-se utilizado o algoritmo gentico para otimizao de parmetros internos (pesos) de rede neural13 . Uma de suas aplicaes o treinamento da rede para anlise quantitativa de espectros de fluorescncia de raios-X 14 . O algoritmo gentico tambm tem sido utilizado no mapeamento de tomos, para determinar a distncia mnima entre eles 15. Outro campo que est sendo explorado a pesquisa de planejamentos experimentais, que consiste no planejamento de n experimentos, onde h variao de alguns fatores para otimizar o sistema. 16 Muitos sistemas qumicos apresentam um alto nvel de complexidade, onde muitos parmetros necessitam ser otimizados num nico processo. Para solucionar este tipo de problema utiliza-se uma poliotimizao. Um exemplo de algoritmo gentico em poliotimizao em qumica analtica a otimizao de distncias entre picos cromatogrficos, como funo das condies cromatogrficas (composio da fase mvel, temperatura do injetor, valor de pH, etc.) 17 . Pode-se encontrar outro exemplo desse tipo de aplicao na determinao de glicose em sangue humano por fotometria. Essa poliotimizao envolveu 12 parmetros qumicos e tecnolgicos, com o intuito de monitorar seis propriedades pticas. O resultado obtido foi comparado com os dos mtodos clssicos regresso dos mnimos quadrados parciais no linear18 . Encontra-se ainda exemplos da aplicao nos seguintes casos : 1) determinao da constante de estabilidade de sistemas de cloreto de cdmio em meio perclorado com chumbo e ter coroa diclorohexil-18-coroa-6, a partir de dados calorimtricos e polarogrficos 18; 2) seleo e deteco de amostras anmalas dentre um conjunto de amostras, para construo do modelo de calibrao. 19-20.; 3) otimizao da separao de bases fracas ou solues cidas por cromatografia lquida de fase reversa com variao de pH e modificao orgnica na fase movel 21 ; 4) otimizao da estimativa dos parmetros cinticos de uma reao22 .; 5) otimizao da intensidade linhas de emisses atmicas de traos de elementos em p de alumina como uma funo da condio de excitao23 ; 6) anlise conformacional de biopolimero 24. Provavelmente a aplicao mais difundida do algoritmo gentico est na seleo de comprimentos de onda em determinaes espectroscpicas, principalmente no infravermelho prximo, utilizando calibrao multivariada 25. Geralmente nestes casos utiliza-se o mtodo dos mnimos quadrados parciais 25 ou a regresso linear mltipla 26 para a construo de um modelo que possa correlacionar os espectros com as espcies de interesse. Este tem como objetivo determinar o nmero mnimo de

Figura 7. Superfcie correspondente a funo exemplificada acima.

Para a otimizao da funo, foram estabelecidos cromossomos com dois genes, sendo cada um destes sendo referente a uma varivel independente da funo (valores de X e Y). O prximo passo foi representar cada gene por um cdigo binrio com uma preciso de 0,00003 unidade. Para isto foram utilizados 17 bits, sendo 16 para representar cada valor numrico com a preciso requerida e 1 bit para representar o sinal do nmero (valores positivos ou negativos). Desta maneira, cada cromossomo representado por 34 unidades binrias, onde os 17 primeiros esto relacionados ao valor de X e os 17 ltimos (outro gene) ao valor de Y. Assim a cada cromossomo (que representa os valores de X e Y), podese associar uma resposta que representada pelo valor correspondente de Z da funo. O objetivo do algoritmo gentico ento encontrar qual cromossomo que ir produzir o maior valor de Z, dentro do domnio especificado. Pelo fato dos cromossomos possurem uma dimenso relativamente pequena, foram criados 8 cromossomos (ou seja, a populao tem 8 indivduos) e foram realizadas 30 geraes (reprodues). Aps a realizao dos cruzamentos correspondentes s 30 geraes propostas, pode-se avaliar as respostas dos melhores indivduos em cada gerao como mostrada na Figura 8. Analisando-se o grfico mostrado na Figura 8 podem ser observados trs patamares bastante distintos. O primeiro patamar, com valores de Z prximos a 1,0 encontra-se relacionado com um vale localizado entre 3 mximos e 2 mnimos, portanto trata-se de um local complexo para iniciar uma anlise segundo os modelos tradicionais de otimizao. O segundo patamar encontra-se relacionado determinao de um mximo local, que perdurou como uma situao de pseudotimo por 4 geraes. Somente aps 6 geraes iniciais determina-se a existncia do mximo global que se encontra caracterizado pelo terceiro patamar da Figura 8 (com valor de Z prximo a 8,0).

QUMICA NOVA, 22(3) (1999)

409

comprimentos de onda que possuam informao relevante para a anlise que est sendo realizada. Devido ao interesse despertado na seleo de variveis, resolvemos dedicar um tpico deste trabalho a este tipo de aplicao, conforme apresentado a seguir. Algoritmo gentico na seleo de variveis. Tem-se observado nos ltimos anos uma tendncia na implementao de tcnicas espectroscpicas em anlises qumicas rotineiras. Isto se deve essencialmente simplicidade, rapidez, baixo custo, versatilidade, bem como outros atributos de diferenciao proporcionados pela tcnica. A calibrao multivariada contribuiu de forma significativa para a consolidao desta tcnica, viabilizando a determinao simultnea de mais de uma espcie mesmo em situaes adversas, onde os mtodos convencionais de anlises seriam difceis ou impossveis de serem realizados (por exemplo, determinaes on-line em processos). Tornou tambm anlises qualitativas e quantitativas possveis, bem como a deteco de amostras anmalas. Em anlises espectrofotomtricas, muitas das aplicaes de calibrao multivariada deste mtodo envolvem um elevado nmero de variveis. Muitas vezes o uso de somente algumas das variveis que contm mais informaes, podem proporcionar maior segurana e facilidade na interpretao do modelo. Assim as variveis (absorbncia em diferentes comprimentos de onda) que possuem uma menor relao sinal/rudo ou/e no linearidade podem ser descartadas. Atualmente o nmero de algoritmos que se prope a selecionar variveis pouco expressivo. Dentre estes se destacam a regresso linear mltipla por passos (stepwise multiple linear regression)27 e os que empregam o uso do algoritmo gentico. A implementao do algoritmo gentico na seleo de variveis difere-se das demais aplicaes apresentadas no que tange codificao do problema e a funo de resposta, j que as outras etapas permanecem inalteradas. Na codificao do problema em seleo de variveis de espectros, considera-se que o cromossomo possui p genes, onde cada gene representa uma das variveis do espectro (absorbncia em cada comprimento de onda). Assim sendo, o cromossomo ter o mesmo nmero de variveis contidas no espectro, conforme representada na Figura 9.

Quando se utiliza o algoritmo gentico para a seleo de variveis, necessrio, dependendo do modelo de calibrao, utilizar algumas condies de contorno", como por exemplo, pr-estabelecer o nmero mximo de variveis selecionadas, como no caso da regresso linear mltipla. Na seleo de variveis utiliza-se tambm o auxlio do cdigo binrio (0,1) para codificar o problema. Cada gene pode assumir o valor um ou zero, sendo que quando a posio referente a uma determinada varivel for igual a um, isto implica na seleo desta varivel. Por outro lado, se a posio conter o valor zero, isto indica que a varivel no foi selecionada. CONCLUSO Observando as inmeras vantagens apresentadas pelo algoritmo gentico, chega-se a concluso que suas aplicaes tendem a crescer na rea da qumica, principalmente onde mtodos de otimizao mais tradicionais no apresentam resultados satisfatrios. As vantagens que devem ser ressaltadas so: versatilidade e robustez do modelo. Por ser um algoritmo verstil, torna-se fcil introduzir adaptaes ao programa de forma a atender s diferentes caractersticas de cada sistema que est sendo otimizado. Muitas vezes, para sistemas muito complexos, este tipo de otimizao pode consumir um grande tempo de processamento. Este problema pode ser reduzido com o emprego da computao paralela, onde de partes do programa que requerem mais tempo podem ser executados simultaneamente. Associando o algoritmo gentico a tcnicas quimiomtricas j estabelecidas de otimizao e anlise multivariada, pode ser possvel o desenvolvimento de modelos matemticos mais simples, facilitando sua anlise e entendimento. importante ressaltar que esta tcnica de otimizao como qualquer outra no garante que a melhor condio de uma otimizao tenha sido determinada. Contudo tem-se observado que o algoritmo gentico, em alguns casos apresenta resultados melhores que outras tcnicas de otimizao. REFERNCIAS 1. Sharaf, M. A.; Illman, D. L.; Kowalski, B. R.; Chemometrics , John Wiley & Sons, New York 1986. 2. Jang, J. S. R.; Sun, C. T.; Mizutani, E.; Neuro-Fuzzy and Soft Computing, Prentice Hall, Upper Saddle River 1997. 3. Bruns, R. E.; Scarminio, I. S.; Neto, B. B.; Planejamento e Otimizao de Experimentos, Editora da Universidade Estadual de Campinas 1995. 4. Cartwright, H. M.; Applications of Artificial Intelligence in Chemistry, Oxford Science Publications, New York 1995. 5. Ruse, M., Darwinism Defended. A Guide to the Evolution Controversies John Wiley & Sons, New York 1982. 6. Goldberg, D. E.; Genetic Algorithms in Search, Optimization, and Machine Learnig, Addison-Wesley, Reading 1989. 7. Lucasius, C. B. and Kateman, G.; Chemom. Intell. Lab. Syst. 1993, 19, 1. 8. Lucasius, C. B. and Kateman, G.; Trends Anal. Chem. 1991, 10, 254. 9. Koza, J. R.; Genetic Pogramming: On the Programming of Computers by Means of Natural Selection, Cambridge Universty Press 1992. 10. Fogel, L. J.; Owens, A. J. and Walsh, M. J.; Ar tificial Intelligence Through Simulated Evolution, Wiley 1996. 11. Rechenberg, I. Evolutionstragegie: Optimierung Technischer Systeme nach Prinzipien der Biologischen Evolution, Frommann-Holzboog 1973. 12. Snir, M.; Otto, S., Huss-Lederman, S.; Walker, D.; Dongarra, J.; MPI : The Complete Reference, The MIT Press-Cambridge, Massachusetts 1996.

Figura 9. Codificao de um espectro na forma de um cromossomo. Neste caso cada valor de comprimento de onda corresponde a um gene do cromossomo.

410

QUMICA NOVA, 22(3) (1999)

13. Zupan, J.; Gasteiger, J.; Neural Networks for Chemists, VCH, Weinheim 1993. 14. Bos, M. and Weber, H. T.; Anal. Chim. Acta 1991, 247, 97. 15. Fontain, E.; Anal. Chim. Acta 1992, 265, 227. 16. Broudiscou, A.; Leardi, R.; Phan-Tan-Luu, R. Chemom. Intell. Lab. Syst 1996, 35, 105. 17. Wienke, D.; Lucasius, C.; Ehrlich, M. and Kateman, G.; Anal. Chim. Acta 1993, 271, 253. 18. Hartnett, M. K.; Bos, M.; van-der-Linden, W. E.; and Diamond, D.; Anal. Chim. Acta 1995, 316, 347. 19. Leardi, R.; J. Chemom. 1994, 8, 65. 20. Walczak, B.; Chemom. Intell. Lab. Syst. 1995, 28, 259.

21. Lopes-Marques, R. M.; Schoenmakers, P. J.; Lucasius, C. B. and Buyden, L.; Chromatographia 1993, 36, 83. 22. Hibbert, D. B.; Chemom. Intell. Lab. Syst. 1993, 19, 319. 23. Wienke, D.; Lucasius, C.; Kateman, G.; Anal. Chim. Acta 1992, 265, 211. 24. Blommers, M. J. J.; Lucasius, C. B.; Kateman, G. and Kaptein, R.; Biopolymers 1992, 32, 45. 25. Bangalore, A. S.; Shaffer, R. E.; Small, G. W. and Arnold, M. A.; Anal. Chem. 1996, 68, 4200. 26. Jouan-Rimbaud, D.; Massart, DL.; Leardi, R. and DeNoord, O. E.; Anal. Chem. 1995, 67, 4295. 27. Martens, H. and Naes,T.; Multivariate Calibration, John Wiley & Sons, New York 1989.

QUMICA NOVA, 22(3) (1999)

411