You are on page 1of 11
[SSN 1414-3825 Cadames de Psicolegia da $BP - 2090, Vol 10° 1, 27-28 O “sistema nervoso conceitual” € suas implicagies para a avaliagdo neuropsicoldgica I: Os paradigmas classico e conexionista da cognigao! Vitor Geraldi Haase e Rui Rothe-Neves Universidade Federal de Minas Gerais Hebb (1955) chamou a atengto para a importincia dos modelos conceituais em neuropsicologia. A avaliagao neuropsicolégica consiste em um processo sistematizado de observagao comportamental, incluindo testes € ‘outros procedimentes de observagdo c anélise, nos quais os dados comportamentais so correlacfonados com ‘ummodelo tedrico da organizayao morfo-funcional do sistema nervoso central. A avaliago neuropsicolégica € um método indireto, em que a estrutura e fungdo do sistema nervoso so investigadas por métodos ‘comportamentais. Daf ecorre a importincia dos modelos conceituais. Este artigo revisa as caracteristicas dos modelos cognitivos cléssico (ou simbslico) e conexionista, a luz de fatos neurofisiolégicos, mostrando suas implicagdes para a formulago de modelos explicativos da cognisio e seus limites. Falavaschave: modclos conceituais; avaliago neuropsicolégica; sistema nervoso central; cognis20. The “conceptual nervous system” and its implications to neuropsychological assessment. {the classic and the connectionist paradigms of cognition Abstract Hebb (1955) drew attention tothe importance of conceptual models in neuropsychology. Neuropsychological assessment consists of a systematic process of behavioral observation, including tests and many other ‘Procedures, in which the observed behavioral facts are correlated with a theoretical model of the ‘morpho-funetional organization of the central nervous system. Neuropsychological assessment is an indirect method, in which structure and function ofthe nervous system are investigated by behavioral methods. This is why conceptual models are so important. The present paper reviews the characteristics of the classic (or symbolic) and the connectionist models of cognition, showing their implications to the formulation of explanation models of cognition and their limits. ley watts: conceptual models; neuropsychological assessment; central nervous sistem; cognition. 1. Trabalho apresentado no Curso O “sistema nervoso conceitual” e a avaliagdo neuropsicolégica: Um curso avangado, XXX Reunifo Anual de Psicologia da Sociedade Brasileira de Psicologia, Brasilia — DF, outubro de 2000. Enderego para conrespondéncia: Departamento de Psicologia. FAFICH — UFMG, AV. Antonio Carlos, 6627, CEP: 31270-901, Belo Horizonte - MG, e-mail: haase(@fafich.ufing.be a Este artigo & 0 primeiro de uma série de dois trabalhos que revisam alguns dos principais modelos de correlasio cérebro-comportamento disponiveis a partir de cestudos oriundos das ciéncias cognitivas. A experiéncia ‘cumulativa de gerapbes de profissionas e pesquisadores, indica que a correo andtomo-ctinica ¢ confiavel, mas, fave & nevessidade de estabelecer a presenga oua natureza 4de um comprometimento cerebral por meio do exame neuropsicol6gico, € nevessério ressaltar a natureza indireta, inferencial e probabilistica do método. As ‘correlagBes anditomo-clinicas foram estabelecidas através de observagdes clinicas sisteméticas em casos isolados ou. ‘grandes grupos de pacientes. Diversas inhas de evidéncia, indica, no entanto, que os modelos tradicionais de correlagio andtomo-clinica se defrontam com limitagSes ‘importantes, principalmente no que se refere ao estudo das patologias do oérebro em desenvolvimento (e.g., Haase, 2000). As observardes quanto ao cariter inferencial e indireto do método neuropsicolégico sugerem a ‘importincia do papel desempenhado pelos modelos teéricos em neuropsicologia. Arevalugio Hi pouco mais de 40 anos, iniciowse uma Verdadeira reviravolta no modo de pensar e estudar eérebro e comportamento, conhecida como revolugao ‘cognitiva (vide Gardner, 1985). Como um dos marcos de referencia deste processo, pode ser tomado 0 Simpésio Hixon, organizado em 1949 no Instituto Tecnoligico da Califémia (Jeffress, 1951). A este simpésio compareceram cientistas como McCulloch, von Neumann, Lorente de Né, Lashley, Kltiver, Kahler ¢ muitos outros. Dentre as motivagdes para ‘esta aproximagio entre estudiosos da neuropsicologia © neurociéncias com cientistas provenientes da Area das ciéncias exatas certamente contou muito a constatago de que as neurociéncias careciam de um embasamento teérico sélido, O mero delineamento da arquitetura neural, seguido de registros elétricos da atividade neural, néo bastavam para construir uma 6. ase oR, Rothe Neves teoria sobre as fungdes cerebrais. A resposta a esta indagagdo veio sob a forma da nog de queas fungdes do cérebro esto relacionadas a0 processamento de informagao. A partir desta cooperagao entre investigadores de diversas areas, nasceu 0 projeto de fundar um novo ramo de conhecimento, denominado “ciéncia cognitiva”, que englobasse, sob um mesmo guarda-chuva, a pericia de psic6logos, lingiistas, cientistas da computagao, antropblogos, filbsofos ¢ neurocientistas, com o intuito de estudar a cognicio humana, animal e artificial sob o ponto de vista da teoria da informagio. Do ponto de vista da fundago de uma nova ciéncia, que viesse a superar o tradicio- nal conflito das faculdades, este projeto nfo se concretizou, Do ponto de vista, porém, da constitui- 40 de uma nova drea de investigacdo ¢ intercmbio entre disciplinas, desenvolvimento de novasmetodo- logias, novas abordagens para antigos problemas, bem como é, principalmente, formulagio de novos problemas de investigagao, o programa das ciéncias cognitivas pode ser considerado um verdadciro sucesso. ‘Além do reconhecimento da necessidade de cooperagiio interdisciplinar, o projeto da constituicio de uma ciéncia cognitiva caracterizou-se, entre ‘outras, pela nogiio de representago (mental ou outra) ¢ ideia de que a atividade mental envolve processos ‘computacionais (algoritmizagao do mental). Ouseja, a crenga subjacente a este projeto é a de que a atividade inteligente (human ou outra) consiste na manipulagdo de representagdes mentais (simbolos) ¢ de que estas manipulagdes podem ser descritas como procedimentos computacionais. A metifora mais freqdentemente empregada tenta explicar as relagées centre mente e cérebro como sendo andlogas aquelas cexistentes entre o programa (software) e a maquina ‘computacional (hardware). ‘Segundo van Gelder ¢ Port (1995), podemos caracterizar os modelos computacionais da seguinte maneira: consideram-se as representagBes como es- truturas estaticas constituidas por simbolas discretos. As operagdes cognitivas consistem na transformagSo de uma destas estruturas estéticas em outra, também. estitica, Estas transformagées ocorrem de modo discreto, instanténeo e seqiiencial. O computador ‘mental pode ser decomposto em uma série de médu- los, cada um deles responsavel por um tipo de proces- samento simbélico. Cada médulo toma representa- es simbélicas como entrada ¢ computa outras representagdes simbélicas como saida. Na periferia do sistema existem transdutores de entrada e saida: sistemas que transformam a estimulago sensorial em representagdes de entrada e representagBes de saida em movimentos. Todo o sistema, cada um de seus médulos, opera ciclicamente: entrada, manipu- Jago intema de simbolos e saida. “Apesar de reconhecer o importante avango que a chamada revolugdo cognitiva significou, 6 importante mencionar que diversos desenvolvimentos recentes colocam em questo a pressuposigio fundamental de que a atividade mental pode ser igualada & computagao de representagbes. Da inteligéncia artificial clissica as (wimeiras redes neurais McCulloch e Pitts (1943/1968) introduziram a idéia de que as unidades neuronais e suas conexdes podem ser representadas por meio de fungdes 16gi- co-mateméticas. Hebb (1949) especulou acerca de um mecanismo de plasticidade neural, segundo o qual a atividade simultinea nos terminais pré ¢ és-sinaptico tem como conseqiéncia um reforga- mento da conexfo sindptica em questo. A partir destes conceitos fundamentais, foram propostas as primeiras redes neurais, os chamados “perceptrons”, por Rosenblatt (1958), entre outros. Os perceptrons ‘constituiam-se de apenas uma camada de neurdnios e sua performance em tarefas de reconhecimento de padrées deixava muito a desejar, além de fazerem uso necessariamente de um sinal explicito de instru- ‘Ho. Estes e outros fatores — inclusive a critica radical de autores prestigiados como Minsky ¢ Papert (1969/1988) — fizeram com que o estudo das redes neurais passasse para uma posigdo apenas marginal, em favor de simulagdes realizadas com o computa- dor serial tipo von Neumann, tido como maquina de ‘Turing universal (Simon, 1990), bem como estudos experimentais inspirados também neste modelo de processamento sequencial da informago (vide p.ex. Lindsay ¢ Norman, 1977; Fodor, 1985; Posner ¢ Raichle, 1994). Nao deixa de ser irénico, portanto, que a principal deficiéncia dos modelos desenvolvi- dos a partir da inteligéncia artificial cléssica, basea- dos na manipulagao de simbolos, digam respeito a sua insensibilidade a0 contexto em que o comporta- ‘mento ocorre, o que se traduz pelos fracassos em tarefas de reconhecimento de padrées e processa- mento de linguagem natural. Examinando retrospectivamente pode parecer ingenuidade tentar traduzir, em termos de computa- ‘ges executadas em série, as complexidades do processamento inteligente de informagio. O benefi- cio da retrospeesao no pode, entretanto, ofuscar os avangos que esta abordagem trouxe em termos de formulagio mais precisa da problemética tradicio- nalmente colocada, bem como novos problemas ¢ campos de aplicago. Com estas consideragBes em ‘mente serdo mencionados alguns desenvolvimentos mais recentes em informitica ¢ neurociéneia que colocaram em questo os pressupostos tradicionais das ciéncias cognitivas ¢ para os quaisurge encontrar respéstas. Representagées locais e representagies distribuidas A pattir do final dos anos setenta, diversos fatores concorreram para que ressuscitasse o interes- se pelas redes neurais. Além do desencanto com as insuficiéncias dos modelos seriais de processamento e desenvolvimento de maquinas mais poderosas, que permitem a simulago do processamento paralelo de informagao, também contribuiram para esse interes- a se renovado 0 desenvolvimento nas neurociéncias, Revisando seu trabalho até 1993, Zeki relata como, no final da década de 70, j6estava comegando a ficar bem claro que o sistema visual se organiza anéto- mo-funcionalmente através de dezenas de éreas cespecializadas e espacialmente segregadas, que pro- ccessam simultaneamente diferentes tipos de tragos perceptivos: cor, forma, velocidade, posigio etc. (Zeki, 1993). A organizagto do sistema nervoso corresponde apenas parcialmente a uma organizagio hierérquica. Nas iiltimas décadas, acumularam-se cevidéncias quanto & natureza paralela. distribuida do processamento informacional, tanto em sistemas sensoriais quanto motores, cortespondendo 20 que alguns autores denominam “heterarquia” (vide Kalaska e Crammond, 1992). Uma outra motivagdo diz respeito & necessidade de tomar as simulagdes computacionais mais realisticas. Finalmente, duas inovagdes técnicas contaram para o interesse res- surgido pelas redes neurais (vide Rumelhart, McClelland ¢ The PDP Research Group, 1986; McClelland, Rumelhart e The PDP Research Group, 1986). A primeira delas diz respeito a introduso de uma camada ooulta de unidades entre as camadas de entrada (input) e saida (output), por meio de que sao introduzidas no sistema algumas caracteristicas proprias dos comportamentos auto-organizados. A. segunda diz respeito a introdugdo de algoritmos para corregio de erros, que reduziram de maneira aprecia- vel a barreira temporal para a aprendizagem. As principais caracteristicas de uma rede conexionista ou processamento paralelo e distribui- do (PDP) foram assim resumidas por Eysenck ¢Kea- ne (1995; vide também Stillings e cols., 1995; ov Smith, 1996): “A rede consiste de unidades cle- mentares ounés, similares a neurdnios, que sto conectadas umas as outras, de modo que cada unidade tem diversas conexdes ‘com outras unidades.(...) As unidades se afetam mutuamente através de inibigao ou 1.6 HaateoR, Rothe deres excitagio. (...) Cada unidade geralmente integra as entradas vindas de todas as unidades com as quais tem conexto até um determinado limiar. Quando o limiar ultrapassado, é produzida uma saida para ‘uma outra unidade, (...) A rede neural ‘como um todo é caracterizada pelas pro- priedades das unidades constituintes, pelo ‘modo como estas unidades sio conectadas entre si e pelas regras ou algoritmos que sflo usados para alterar a forga das cone- xdes (pesos) entre as unidades. As redes podem ser constituidas de diferentes estru- turas ou camadas. Elas podem ter, p. ex., ‘uma camada de unidades de input, uma ca- ‘output. A representagSo de um conceito pode ser armazenada de modo distribuido, pormeio de um padrio de ativagao das uni- dades que compéem a rede. A mesma rede pode armazenar diferentes padrdes deste modo, sem que eles interfiram necessaria- ‘mente uns com os outros, desde que sejam suficientemente distintos entre si. (....) Um_ algoritmo ou regra bastante usado emredes neurais, para permitir que a aprendizagem ‘ocorra, é conhecido como retropropagagaio de erros ou BackProp” (Eysenck e Keane, 1995, p. 10). Essas redes podem modelar determinados comportamentos cognitivos sem recorrer aos tipos de regras explicitas que caracterizam os sistemas baseados na manipulago de simbolos. Blas o fazer através da associagSo entre varias entradas com certos tipos de output ¢ armazenamento desics padres na rede, Para modelar comportamentos mais, complexos sao necessdrias varias camadas. As redes mais populares so as de trés camadas, anteriormente mencionadas, nas quais os estimulos so codificados ‘como um padrio de ativagao da camada de entrada, A camada de saida, por sua vez, produz alguma resposta a partir de um determinado padrio de ‘Siena news conceal ativagdo, Quando a rede aprende a produzit uma resposta particular seguindo a apresentago de um determinado estimulo, esta exibindo um com- portamento similar ao que teria seestivesse seguindo ‘uma regra do tipo “se... entio”. No entanto nenhuma regra deste tipo € explicitamente formulada no modelo. Um dos aspectos cruciais das redes conexio- nistas 6a regra de aprendizagem ou algoritmo usada para construir os padrdes de ativagio. Um dos algo- ritmos mais usados, o de retropropagagio de erros, conhecido como BackProp, permite que a rede aprenda a associar um padrio particular de entrada com um padrlo particular de saida. No comeso do periodo de aprendizagem, a rede ¢ ajustada por meio de conexdes aleat6rias entre suas unidades, Durante 0s estigios iniciais do processo de aprendizagem, depois de diversas apresentages dos padres de entrara, a rede produz freqiientemente respostas nfo pretendidas pelo programador. O algoritmo de BackProp compara os padrées imperfeitos com aquele necessério para produzir a resposta correta, registrando os erros que ocorrem, Em seguida, 0 algoritmo inicia um proceso de retropropagacao dessa informagao pela rede, de modo que os pesos ‘sejam ajustados para aumentar a probabilidade de uma resposta correta ser obtida na préxima tentativa, © processo todo ¢ repetido exaustivamente, por centenas de tentativas, Os principais sucessos aleangados por redes conexionistas foram narrados por Allman (1989). ‘Um dos principais diz respeito a possibilidade de uti- Jizar sistemas computacionais para pronunciat textos escritos em linguagem natural, como € 0 caso da NETalk, de Sejnowski e Rosenberg (1987), faganha nio alcangada pela inteligéncia artificial cléssica. Do ponto de vista te6rico, o principal avango foi a intro- ugdo do conceito de “representaggio distribuida”, em contraste com formas locais de representaggo, 0 que motivou uma série de pesquisas na tentativa de ‘identificar estas formas de processamento informa- ional no eérebro, au Cédigo ou representagao local Segundo autores como Thorpe (1995) ou Foldiak ¢ Young (1995), uma representago local consiste no uso de uma unidade separada para codificar cada estimulo. A representagdo final envolve neurénios que respondem seletivamente a um tipo de estimulos — as assim chamadas “células vov6” (grandmother cells). Por meio de representagdes locais, a atividade em unidade individuais pode ser interpretada diretamente. ‘As unidades se comportam, efetivamente, como se possuissem rétulos. O cédigo local no requer necessariamente que apenas uma unidade esteja ativa (Thorpe, 1995). Mesmo representagSes que requeiram a ativagao simultinea de muitas unidades podem ser consideradas locais se a ativagdo de uma unidade pudet ser interpretada sem referéncia as outras unidades da rede, Deste modo, uma representagdo da vov6 triste, que envolve a ativago simultinea de unidades que codifiquem “triste” © “vovb", pode ainda assim ser considerada local, caso as unidades individuais possam ‘ser interpretadas isoladamente. A capacidade representacional dos cédigos locais € baixa. Eles somente podem representar tantos estados quantas so as unidades na assem- bigia, 0 que ¢ insuficiente, a nao ser para as tarefas mais banais. Fazer associages, entretanto, entre um item codificado localmente e um output é tarefa répida e ficil. Outra vantagem dos esquemas de cédi- g0 local ¢ sua capacidade de evitar ambigidade. Somente um esquema local pode responder de forma completamente no ambigua quando estimulos miiltiplos sio apresentados simultaneamente. A principal vantagem do cédigo local é esta capacidade de lidar com diversos conceitos ao mesmo tempo. Ascinco principais crticas dirigidas aos esquemas locais de codificagdo sto as seguintes (Thorpe, 1995): 4. no hé neurdnios suficientes no cérebro; b. 0 cédigo local é muito arriscado; €. nilo existem observagdes experimentais quan- to as células vov6; d. 05 neurénios individuais ndo so confidveis; €. as representagdes locais ndo se generalizam, ‘Thorpe (1995) ressalta ainda que o arcabougo conexionista ndo & necessariamente incompativel ‘com a coexisténcia de representagdes distribuidas locais (“simbélicas”). © ponto de vista que defende o uso de representagdes locais no cérebro é conhecido na neurofisiologia como a teoria da integragao hierdnquica ou grandmother cell ¢ tem sido defendido cexplicitamente por muito poucos autores, entre eles J. Konorski e H. Barlow (vide Martin, 1994). A também. chamada doutrina neuronal clissica teve uma das formulagdes mais brilhantes no artigo de Barlow (1972; vide também Barlow, 1995). Barlow sempre esteve preocupado em entender como © eérebro faz. para distinguir, no processo perceptivo, um sinal doruldo. Em sua opinigo, foram selecionadas evolutivamente algumas co-ocorréncias entre as invariantes do ambiente ‘ea atividade de determinados neurénios, que passaram a stuar como detectores de tragos. O oérebro parece atuar como uma espécie de analisador estatistco, de modo a fazer com que determinados eventos ou objetos se destaquem em relag@o a um pano de fundo ambiental ruidoso. A melhor maneira de sinalizar estas ocoméncias, cestatisticas de modo eficiente © econdmico é, segundo Barlow, através da atividade de neurdnios isolados ou atividade de um grupo muito pequeno de neurdnios. As evidéncias neurofisiolégicas sobre a implementagdo desse tipo de cédigo vém de estudos da atividade neuronal em diversas dreas do lobo parieto-temporal, relacionadas com a percepcdo de movimento. Newsome, Britten © Movshon (1989) realizaram registros de unidades isoladas nas dreas MT e MST de ‘macacos, obtendo uma étima correlagdo entreas fungdes neurométrica e psicométrica no que se refére a uma tarefa. de discriminagdo de coeréncia de movimento. ‘Newsome ¢ Salzman (1993) conseguiram, além disso, influenciar a decisio do animal através de microestimulagdes seletivas de neurdnios isolados. inirigante nestes estudos ¢ que as curvas psicométrica e 1.6. Haase eA, Rothe Keves neurométrica se correlacionam, mas a performance dos neurdnios tomadas isoladamente ¢ sempre um pouco superior & do animal. Aparentemente, os processos de {ntegrago ao nivel de uma assembléia neuronal podem, neste caso, estar prejudicando a performance do sistema. Citigo ou epresentagéo distribute Nos esquemas distribuidos de representagdo, a presena da vové no é explicita como o neurénio isolado. Ao invés disso, a representagio final & distribuida através de um grande niimero de células, nenhuma das quais respondendo especificamente & vové (Féldiak e Young, 1995; Thorpe, 1995). A codificagdo distribuida é extremamente itil quando ‘poucas unidades estilo disponiveis. Na representagio distribuida, as unidades individuais néo podem ser interpretadas sem conhecimento do estado das outras unidades da rede. Somente o padrao global de atividade em toda uma populacdo de células corresponde a estados interpretiveis. Os cédigos distribufdos, densos ou “hologriti- cos”, podem representar um mimero muito alto (aproximadamente 2") de estados diferentes pelo uso combinatorial das unidades. Na pratica, entretanto, essa capacidade acaba sendo supérflua, uma vez que © mimero de padres experimentados pelo sistema jamais vai se aproximar dessa capacidade. Desta for- ma, os cédigos densos em geral se caracterizam por uma alta redundancia estatistica. O prego a ser pago por esse contetido informacional potencialmente alto, mas subutilizado, que caracteriza cada padrio de atividade se traduz no fato de que ontmero de tais, padrées estocados pela meméria associativa acaba sendo desnecessariamente baixo. (Omapeamento entre uma representagio densa e uma saida pode ser bastante complexo, assumindo a forma de uma fungo nao linear e exigindo desta forma redes com miltiplas camadas e algoritmos de aprendizagem biologicamente diflceis de implementar. Mesmo algoritmos supervisionados eficientes sio proibitivamente lentos, exigindo muitas rodadas de ‘Sistema navoso cnet treinamento e grandes quantidades de dados, marcados com a resposta adequada ou algum tipo de reforgo. ‘As representagées distribuidas em camadas intermedirias asseguram uma espécie de generali- zago automética. Contudo essa mesma generaliza- ‘980 se manifesta com freqléncia como uma interfe- réncia ndo-desejivel entre os padrdes, na chamada “catastrofe por superposigo”. Uma outra limitago séria € que novas associagdes ndo podem serintrodu- zidas sem um novo treinamento da rede com todo 0 ‘conjunto de dados (barreira temporal 4 aprendiza- gem). A existincia de representagées distribuidas implica também um mecanismo para coordenar no curso do tempo a atividade das diversas unidades espacialmente segregadas, de modo que resulte em uma atividade coerente, Face aos obstéculos ofereci- dos pela barreira temporal a aprendizagem, esta necessidade de integragio temporal é, muitas vezes, deserita como constituindo o “problema da ligagdo” (binding problem: von der Malsburg e Singer, 1988). ‘Além do parcelamento andtomo-funcional do cértex visual em diversas 4reas espacialmente segre- ‘gadas e funcionalmente especializadas, jé menciona- do, hi evidéncias neurofisioldgicas mais diretas de que o sistema realmente pode implementar um ‘esquema distribuido de representago. Uma das prin-

You might also like