(The learning function of relations in the context of a computational theory

)
JOSÉ ANTONIO GONZÁLEZ Y ROSARIO POZO
Universidad de Salamanca

La función del aprendizaje de relaciones en el contexto de una teoría computacional

Perales, Catena y Maldonado presentan una síntesis teórica sobre el problema de qué es el aprendizaje de relaciones causales y por qué se produce. Su trabajo adopta una concepción del procesamiento de la información basada en dos niveles, uno computacional y otro algorítmico. Su aportación principal consiste en desarrollar el nivel computacional que tiene consecuencias importantes para especificar qué operaciones lleva a cabo el sistema cognitivo sobre las relaciones existentes en el ambiente. Pero, al mismo tiempo establece cuáles son las condiciones que producen ese aprendizaje y la estrategia que debe seguirse en su investigación. Se trata de una valiosa aportación, al dar a entender que es el problema central del aprendizaje de relaciones, a la vez que suscitan un interesante debate sobre diversas cuestiones. Uno de los objetivos de una perspectiva computacional es especificar por qué se produce el aprendizaje. Esta cuestión se refiere al valor funcional o adaptativo del aprendizaje. Aunque los autores asumen que es funcional y adaptativo distinguir entre meras correlaciones y relaciones causales consideramos que no proporcionan una verdadera explicación de esa funcionalidad. Un segundo aspecto asumido en el artículo es que la detección de las relaciones de causalidad es adaptativa, pero lo es en mayor medida que la detección de las relaciones predictivas. La explicación evolucionista de las adaptaciones de las especies implica la variabilidad de las especies, la selección natural de los individuos que poseen una mejor adaptación y la retención de esa selección (Dennet, 1995). En primer lugar, las funciones adaptativas, como la capacidad para aprender relaciones causales diferentes de la capacidad de aprender relaciones de covariación, se refiere a la distinción entre las causas últimas, la función adaptativa integrada en la historia evolutiva de un organismo, y las causas próximas, la función adaptativa que depende de las condiciones antecedentes. Las causas últimas pueden tener un doble origen. Por un lado, las variaciones genéticas que demuestran una ventaja selectiva contribuyen a la función adaptativa. Los patrones de conducta instintivos son un ejemplo de esta adaptación debido a la regularidad ambiental que los organismos han encontrado a lo largo de millones de generaciones. Por otro lado, una plasticidad fenotípica como el aprendizaje puede guiar la evolución si una característica adquirida proporciona una ventaja selectiva al individuo que la haya adquirido. Baldwin (1896) argumentó que el aprendizaje
Correspondencia con los autores: José Antonio González del Campo. Departamento de Psicología Básica, Psicobiología y Metodología de las CC del Comportamiento. Universidad de Salamanca. 37071 Salamanca. E-mail: campo@gugu.usal.es
© 2002 by Fundación Infancia y Aprendizaje, ISSN: 0214-3550 Cognitiva, 2002, 14 (1), 65-69

66
puede contribuir evolutivamente a una mejor adaptación de las especies. Esta posibilidad ha sido explorada en el ámbito de la computación evolucionista (Harvey, 1996). No obstante, la función adaptativa del aprendizaje implica un elevado coste para los organismos que disponen de esta característica. Este coste es el tiempo y energía que se debe dedicar al aprendizaje de las relaciones predictivas y causales y la posibilidad de cometer errores fatales para los individuos (Maley, 1996; Turney, Whitley y Anderson, 1996). Por tanto, la adaptación proporcionada por el aprendizaje para constituir una verdadera ventaja selectiva necesariamente debería evolucionar hacia un patrón de conducta instintivo. Esto requiere la existencia de dos procesos complementarios: un ajuste mediante el mecanismo de aprendizaje y en un segundo momento una asimilación genética que permita transmitir la característica asimilada a la descendencia. Es probable que algunos de los fenómenos de condicionamiento clásico y operante desempeñaran una función de mecanismo evolutivo en la selección natural. Los organismos que manifiestan esta clase de adaptación, con independencia de que se haya originado en las variaciones genéticas o en la asimilación genética, podemos considerarlos darwinianos (Dennet, 1995). De acuerdo con esta lógica podríamos considerar altamente adaptativo una rápida detección de la causalidad si se ha producido la asimilación genética completa. Sin embargo, este hecho requiere no sólo la existencia de una regularidad de las relaciones independizadas de los diversos contextos, sino también la existencia de una regularidad a lo largo de la historia evolutiva de las especies que se han visto sometidas a la presión de esas relaciones causales. La regularidad de las relaciones intercontextos, sin una regularidad intergeneracional, exige un mecanismo de aprendizaje y necesariamente posee la contrapartida del tiempo y la energía necesarios para que tenga lugar el aprendizaje. Por tanto, aunque la función del aprendizaje es posibilitar una adaptación de los organismos ante las situaciones estables ontogenéticamente en determinados marcos temporales, está directamente unido a los errores que se cometen antes de haberlo logrado completamente. No obstante, es posible que se haya producido algún valor intermedio de asimilación genética de determinadas relaciones predictivas y causales, especialmente aquellas en las que la contigüidad es elevada. En todo caso resulta muy difícil especificar con los procedimientos experimentales cúales son aquellos casos en los que se ha podido producir la asimilación genética, porque sigue siendo necesaria la plasticidad fenotípica propia de los mecanismos de aprendizaje. Esto permite elucubrar la posibilidad de que exista un mayor grado de asimilación en las condiciones de contigüidad que en las relaciones predictivas (Savastano y Miller, 1998); al mismo tiempo es posible que las relaciones predictivas impliquen un mayor grado de asimilación genética que las relaciones causales (Dickinson y Shanks, 1995). Por tanto, desde esta perspectiva existiría un mayor grado de adaptación cuanto mayor fuera la asimilación genética. En segundo lugar, cuando la regularidad de las relaciones sólo se producen en marcos temporales dentro la escala ontogenética el aprendizaje desempeña un papel adaptativo mayor que la asimilación. Skinner (1981) ha defendido una idea “seleccionista” del aprendizaje, destacando la similitud existente entre la perspectiva de la teoría de la evolución y el desarrollo de las relaciones respuestaconsecuencia. Algunos autores han ampliado esta concepción seleccionista al condicionamiento clásico, de modo que se recogen las dos grandes tradiciones procedimentales del estudio del aprendizaje (Donahoe, Palmer y Burgos, 1997; Palmer y Donahoe, 1992). Conviene destacar que parte de las ideas actuales sobre esta cuestión no se entenderían ni habrían tenido suficiente desarrollo sin

67
la aportación del actual conexionismo y el desarrollo de las redes neuronales (Donahoe, 1996). Desde esta perspectiva, el aprendizaje de una relación predictiva es menos adaptativo que el de una relación causal por las restricciones que impone a la actuación. De hecho proporciona información sobre la ocurrencia de un resultado, pero no permite alterar la relación existente entre los elementos predictor y predicho. Esto es lo que ocurre en una situación de condicionamiento clásico y en los procedimientos de juicios predictivos. Sin embargo, es probablemente una característica de los estudios de laboratorio donde la relación de contingencia programada se mantiene rígida a lo largo de todo el escenario experimental. En cambio, en situaciones naturales, al menos en aquellos casos en los que la relación predictiva induzca a una actuación de naturaleza instrumental, después de un suficiente número de ensayos, esta respuesta puede acabar alterando la relación predictiva para convertirla en una relación instrumental. De este modo, la conducta de un animal o un ser humano acaba introduciendo una nueva relación mucho más eficaz adaptativamente para el individuo, puesto que permite controlar el ambiente. Esta nueva relación es de naturaleza causal, esta clase de función adaptativa tiene más en común con la perspectiva skinneriana según la cual existe una selección de aquellas conductas que producen consecuencias que permiten una adaptación del organismo. Los organismos que manifiestan esta clase de adaptación podemos considerarlos skinnerianos (Dennet, 1995). No obstante, si la evolución de los organismos mediante la selección natural es un producto de un algoritmo genético (Dennet, 1995; Donahoe, 1996) y la selección de la conducta es resultado de un algoritmo de aprendizaje (Burgos, 1996; Donahoe, 1996), entonces un análisis de la función adaptativa del aprendizaje desde una perspectiva evolucionista, necesariamente ha de ser una explicación algorítmica y no computacional. Puesto que el algoritmo responde a la cuestión de cómo se produce el aprendizaje, debemos intentar una reflexión sobre el valor adaptativo desde la perspectiva computacional. Puesto que una perspectiva computacional establece un orden jerárquico en la construcción teórica, desde lo más abstracto (qué y por qué) al modo en que se producen las operaciones (cómo), debemos analizar una posibilidad de una adaptación basada en una concepción computacional. Una posibilidad la encontramos en la concepción que se deriva de los trabajos sobre los humanos en juicios de contingencia y los estudios sobre la capacidad de los animales para detectar las relaciones de causalidad. Dickinson (1989) estableció una distinción entre relaciones predictivas y relaciones causales en el estudio del condicionamiento. La distinción la fundamentó en el concepto de intención, al argüir que el condicionamiento instrumental consistía en que un organismo establecía una creencia entre su acción y el resultado y que dicho organismo debería desear dicho resultado. Los estudios humanos sobre los juicios de causalidad mediante un procedimiento instrumental en los cuales se observa una elevada convergencia entre las respuestas instrumentales y los juicios sobre la causalidad de su acción son un ejemplo de la función adaptativa desde una perspectiva computacional (Chatlosh, Neunaber y Wasserman, 1985; Shanks y Dickinson, 1991). Al mismo tiempo, los estudios llevados a cabo con animales, sobre la capacidad de los mismos para detectar las relaciones de causalidad (Hammond, 1980; Killeen, 1981), sugieren que también parecen poseer alguna forma de representación de la función causal de sus acciones. De forma complementaria, la demostración del efecto que la demora del resultado posee en situaciones de condicionamiento operante (Dickinson, Watt y Griffits, 1992) sugiere que las computaciones de la información recibida pueden ser importantes en el aprendizaje y

68
el comportamiento de la rata. Por otro lado, los trabajos llevados a cabo mediante el procedimiento de devaluación del reforzador (Adams y Dickinson, 1981) suscitan la idea de que este conocimiento puede desempeñar un papel importante en el aprendizaje, lo cual concuerda con una teoría computacional. Todo ello converge, grosso modo, con una tercera categoría de organismos denominados por Dennet (1995) “popperianos”. Diversos organismos, entre los cuales nos encontramos los humanos, compartimos con otras especies animales la capacidad de probar nuestras hipótesis en lugar de probarnos a nosotros mismos. Esta idea expresa un concepto de adaptación compatible con la visión computacional que explica el valor adaptativo de las relaciones predictivas y las relaciones de contingencia. Sin embargo, una vez aprendidas estas relaciones son más adaptativas si se transforman en algorítmicas como sugiere la idea de autonomía conductual (Adams y Dickinson, 1981). Este proceso de algoritmación de la evolución de la conducta desempeña un papel adaptativo semejante al logrado por la asimilación genética en el caso de la evolución de las especies. Por último, la teoría computacional propuesta tiene una serie de características específicas que la hace referirse a un nivel de procesamiento superior y con mayor grado de abstracción. En dicho nivel asumen, al menos de un modo implícito, que se trata de una característica del aprendizaje de relaciones causales en los humanos. La similitud establecida con el desarrollo científico expresa de forma clara esta idea, al establecer que la acción conjunta del conocimiento previo y las condiciones de inferencia es la condición crítica que posibilita esta clase de procesamiento. Este hecho posibilita una rápida adquisición por lo que es más adaptativo que las otras clases de relaciones, aunque sean causales. Incluso esta clase de relaciones pueden adquirirse mediante una transmisión cultural lo cual hace que sea más rápido el aprendizaje de una relación causal. Dennet (1995) estable una cuarta categoría de organismos a los que denomina “gregorianos”, porque pueden obtener información de las herramientas de la mente, como el lenguaje, los productos de la técnica y la ciencia. Esto hace que en condiciones novedosas sea más adaptativa que cualesquiera otras clases de adaptación. Esta función adaptativa es de naturaleza computacional en el sentido que probablemente lo tratan los autores de la teoría computacional, ya que no es necesario pasar por una larga experiencia: basta con añadir la imitación. Sin embargo, este último punto se refiere a la evolución cultural, pero una vez adquirido puede llegar a funcionar del mismo modo que la teoría de la evolución de Baldwin: se produce una asimilación cultural con lo cual se convierte nuevamente en un algoritmo una vez aprendida la relación causal (véase una concepción darwiniana de la cultura en Blackmore, 2000).

Referencias
ADAMS, C. D. y DICKINSON , A. (1981). Instrumental responding following reinforcer devaluation. Quarterly Journal of Experimental Psychology, 33B, 109-122. BALDWIN, J. M. (1896). A new factor of evolution. American Naturalist, 30, 441-451. BLACKMORE, S. (2000). La máquina de los memes. Barcelona: Paidós BURGOS, J. E. (1996). Evolving artificial neural networks in Pavlovian environments. En J. W. Donahoe y V. P. Dorsel (Eds.), Neural-network models of cognition (pp. 58-79). Amsterdam: Elsevier. CHATHLOSH, D. L., NEUNABER, D. J. y WASSERMAN, E. A. (1985). Response-outcome contingency: Behavioral and judgmental effects of appetitive and aversive outcomes with college students. Learning and Motivation, 16, 1-34. DENNET, D. C. (1995). Darwin’s dangerous idea. Nueva York: Simon and Schuster. DICKINSON , A. (1989). Expectancy theory in animal conditioning. En S. B. Klein y R. R. Mowrer (Eds.), Contemporary learning theories: Pavlovian conditioning and the status of traditional learning theories (pp. 279-308). Hillsdale, NJ: LEA.

69
DICKINSON, A. y SHANKS, D. R. (1995). Instrumental action and causal representation. En D. Sperber, D. Premack y A. J. Premack (Eds.), Causal cognition. A multidisciplinary debate (pp. 5-25). Oxford: Clarendon Press. DICKINSON , A., WATT, A. y GRIFFITHS, W. J. H. (1992). Free-operant acquisition with delayed reinforcement. Quarterly Journal of Experimental Psychology, 45B, 241-258. DONAHOE, J. W. (1996). The necessity of neural networks. En J. W. Donahoe y V. P. Dorsel (Eds.), Neural-network models of cognition (pp. 1-19). Amsterdam: Elsevier. DONAHOE, J. W., PALMER, D. C. y BURGOS, J. E. (1997). The unit of selection: What do reinforcers reinforce? Journal of the Experimental Analysis of Behavior, 67, 259-273. HAMMOND, L. J. (1980). The effect of contingency upon appetitive conditioning of free-operant behavior. Journal of the Experimental Analysis of Behavior, 34, 297-304 HARVEY, I. (1996). Is there another new factor in evolution? Evolution, learning and instinct: 100 years of Baldwin effect. A special edition of Evolutionary Computation, 4, 313-329. KILLEEN, P. R. (1981). Learning as causal inference. En M. L. Commons y J. A. Nevin (Eds.), Quantitative analyses of behavior. Vol. 1. Discriminative properties of reinforcement schedules (pp. 89-112). Cambridge, MA: Ballinger. MALEY, G. (1996). Landscapes, learning costs and genetic assimilation. Evolution, learning and instinct: 100 years of Baldwin effect. A special edition of Evolutionary Computation, 4, 213-234. PALMER, D. C. y DONAHOE, J. W. (1992). Essentialism and selectionism in cognitive science and behavior analysis. American Psychologist, 47, 1344-1358. SAVASTANO, H. I. y MILLER, R. R. (1998). Time as content in Pavlovian conditioning . Behavioural Processes, 44, 147-162. SHANKS, D. R., y DICKINSON , A. (1991). Instrumental judgment and performance in action-outcome contingency and contiguity. Memory and Cognition, 19, 353-360. SKINNER, B. F. (1981). Selection by consequences . Science, 213, 501-504. TURNEY, P., WHITLEY, D. y ANDERSON, R. W. (1996). Editorial. Evolution, learning and instinct: 100 years of Baldwin effect. A special edition of Evolutionary Computation, 4, 4-8.

Sign up to vote on this title
UsefulNot useful