You are on page 1of 9

expressão facial, pela situação em que ocorre a bém para o estímulo discriminativo (A é delta, a

conversa, e assim por diante. Muitos exemplos letra grega d), ou S', para o estímulo negativo
prévios de reforço incluíram o controle discri­ (rigorosamente falando, S° seria mais apropria­
minativo do responder. Ao discutir a aprendiza­ do, pois nada é removido em presença desse estí­
gem dos ratos em labirinto, enfatizamos o au­ mulo, mas S' é o emprego mais comum).
Operantes Discriminados: Controle mento de escolhas de viradas corretas, mas o rato
que não discriminasse o local apropriado para
No procedimento da Figura 8.1, a luz e o es­
curo altemavam-se irregularmente; quando a
de Estímulo virar à direita ou à esquerda poderia chocar-se
repetidamente contra as paredes, à medida que
lâmpada estava acesa, ela permanecia ligada por
períodos que variavam de 5 a 30 segundos. As
se locomovia pelo labirinto, e dificilmente iria pressões à barra eram reforçadas de acordo com
aprender o labirinto como um todo. um esquema de reforço de intervalo variável ou
De fato, é bem provável que não exista uma VI: em média, apenas uma pressão à barra a cada
classe operante sem estímulos discriminativos. 30 segundos era reforçada enquanto a luz estava
As bicadas de um pombo não podem ser emiti­ acesa. As características importantes desse esque­
das na ausência de um disco, e as pressões à bar­ ma são que (1) ele mantém uma taxa de respostas
indo-europeu deuk- (conduzir), a duke (duque), ra por um rato não podem ser emitidas na ausên­ moderada e relativamente constante e (2) os tem­
A. A Natureza dos Operantes Discriminados cia de uma barra. As características que perma­ pos variáveis entre os reforçadores sucessivos tor­
adduction (adução), educate (educar) e conduct
Atentar para as Propriedades dos Estímulos
Aprendizagem de Lugar versus Aprendizagem de
(conduta). A palavra discrimination, do latim dis­ necem relativamente constantes ao longo de um nam o tempo a partir do último reforçador um pre-
apart (separado) mais crimen, judgm ent (julga­ experimento, como a própria câmara e os demais ditor não fidedigno de quando a próxima resposta
Resposta
mento), está relacionada, por meio do indo-eu­
Gradientes de Controle de Estímulo
ropeu skeri- a cortar ou separar, a crime, descri­
dispositivos que ela contém, às vezes, são refe­ será reforçada. Com essa programação, as mudan­
Gradientes de Generalização ridos como estímulos contextuais. Em geral, es­ ças de estímulo e as apresentações do reforço va­
be (descrever) e criterion (critério). E a palavra
Gradientes de Pós-Discriminação
generalization (generalização), do latim genere tamos mais interessados nos estímulos que mu­ riam assistematicamente ao longo do tempo, de
Gradientes de Inibição
(produzir ou causar), está relacionada, por meio dam dentro das sessões experimentais, mas te­ modo que se o rato pressiona mais na luz, do que
Esvanecimento (Fading): Controle de Estímulo por
do indo-europeu gen- to give birth or beget (ge­
Aproximações Sucessivas mos que lembrar que o ambiente dentro do qual no escuro, podemos ficar confiantes de que o estí­
rar ou partejar), a ingenious (engenhoso), kind
A Terminologia do Reforço Diferencial um pombo ou um rato responde existe em um mulo discriminativo funcional é a luz, e não a re­
(tipo) e nat-ure (natureza).
contexto mais amplo, que inclui o biotério onde gularidade temporal daqueles outros eventos.
B. Cognição Animal
Mapas Cognitivos Estudamos o reforço com base nas dimen­ vive, as balanças em que é pesado e outras ca­ Ao longo das sessões, o pressionar aumen­
Conceitos Naturais e Classes de Estímulo sões das respostas, mas o reforço diferencial tam­ racterísticas do laboratório fora da câmara expe­ tou durante a luz e diminuiu em sua ausência.
Probabilísticas bém pode ocorrer com base nas dimensões do rimental (cf. Donahoe & Palmer, 1994). Este aumento freqüentemente acompanha tais
Definição de Classes de Estímulos estímulo em cuja presença as respostas ocorrem. Os estímulos discriminativos correspondem discriminações (contraste comportamental: ver
Por exemplo, as pressões à barra por um rato em aos estímulos coloquialmente denominados de Capítulo 10). A Figura 8.1 também mostra algu­
presença da luz são diferentes de suas pressões sinais ou pistas. Eles não eliciam respostas. Mais mas mudanças em um índice de discriminação,
As palavras latinas habere, to have (ter) e capere, no escuro, e o reforço pode ser programado para precisamente, eles estabelecem a ocasião em que o responder na presença da luz como porcenta­
to take ou size (tomar ou captar) reportam-se a raízes pressões à barra na presença, mas não na ausên­ as respostas têm conseqüências, e diz-se que eles gem do total de respostas. O índice aumentou ao
indo-européias, intimamente ligadas. Habere é um cia de luz. Do mesmo modo, as bicadas de um ocasionam as respostas (cf. provisão: Gibson, longo das sessões. Outras maneiras equivalen­
antecessor das palavras inglesas behavior (compor­ pombo no disco durante a luz verde são diferen­ 1979). Um exemplo do desenvolvimento de con­ tes de se descrever esse resultado seriam dizer
tamento), habit (hábito) e inhibit (inibir). Capere le­
vou a concept (conceito) e perception (percepção),
tes das bicadas em presença da luz vermelha. trole de estímulos, o controle do responder por que pressionar a barra em presença da luz é um
palavras relevantes para classes de estímulo; assim, Quando o responder é reforçado apenas na pre­ um estímulo discriminativo, pode ser visto na operante discriminado ou que a luz funciona
essas palavras e behavior são parentes distantes. sença de alguns estímulos, dizemos que o refor­ Figura 8.1 (Herrick, Myers, & Korotkin, 1959). como um estímulo discriminativo para as pres­
Não há elos óbvios entre differentiation (dife­ ço é correlacionado com aquele estímulo. Uma Os ratos pressionavam uma barra na presença e sões à barra, ou ainda que o pressionar a barra
renciação) e induction (indução), aplicadas a clas­ classe de resposta criada por este reforço dife­
ses de resposta, e discrimination (discriminação) e na ausência de luz, programadas alternadamen­ está sob controle do estímulo da luz.
generalization (generalização), aplicadas a classes
rencial em relação às propriedades do estímulo te. Quando a luz estava acesa, as pressões à bar­
de estímulo. A palavra differentiation (diferencia­ é chamada de operante discriminado. ra eram ocasionalmente reforçadas com alimen­
ção), do latim dis- (separado, distante) mais ferre Os operantes discriminados são um traço di­ to. Quando a luz estava apagada, as pressões à
(carregar), está relacionada, por meio do indo-euro- fuso do comportamento. Ao dirigir um carro, Seção A A Natureza dos Operantes
çeubher- (carregar ou sustentar), abirth (nascimen­ barra não eram reforçadas. A notação para o es­
avançamos por um cruzamento se o semáforo tímulo correlacionado ao reforço é SD, para o Discriminados
to), transfer (transferência), preference (preferência)
estiver verde, mas não se ele estiver vermelho.
e metaphor (metáfora), mas não &interfere (interfe­ estímulo discriminativo, ou S+, para o estímulo
rir). A palavra induction (indução), do latim in -(em) Ao falar com alguém, o que dizemos é afetado
positivo; a notação para o estímulo correlacio­ Podemos ilustrar algumas características dos
mais ducere (conduzir), está relacionada, através do pelo que a outra pessoa diz, por sua postura e
nado com o não reforço ou extinção é SA, tam­ operantes discriminados com um exemplo hipo-

146 A . C h a r l e s C a ta n ia
Suponhamos que continuemos o reforço di­ criminação e generalização quando nos referi­
ferencial com respeito à localização do estímu­ mos aos efeitos análogos do reforço diferencial
lo, reforçando as respostas apenas quando ilu­ com respeito a propriedades do estímulo?
minamos as posições de 9 a 12. O responder au­ Um fator metodológico pode ser crucial para
menta gradualmente quando essas posições es­ essa distinção. Quando estudamos o reforço di­
tão iluminadas e diminui quando outras posições ferencial com respeito a propriedades da respos­
são iluminadas. Os efeitos são parecidos com ta, registramos as respostas em diferentes clas­
aqueles da Figura 7.1 em C, D e E. Finalmente, ses, mas além de programar as contingências, não
a maior parte das respostas ocorre com as luzes há muito mais que possamos fazer a respeito
nas posições correlacionadas com o reforço, delas. Se vemos um rato prestes a introduzir seu
como em E, e mesmo que algumas respostas ain­ focinho na posição 7 da fenda, não podemos im­
da ocorram com as luzes em outras posições, pedir que o rato emita aquela resposta naquele
pode-se alcançar um ponto em que a distribui­ momento, mesmo que ele tenha respondido
FIGURA 8.1 Pressões à barra por um rato ção de respostas não muda muito com a conti­ muito mais vezes naquela posição do que em
na presença e na ausência de luz. A luz (SD) nuação do reforço diferencial. qualquer outra. Suponhamos, porém, que esti­
estava correlacionada ao reforço em inter­ Nesse exemplo, os estímulos que ocasiona­ véssemos trabalhando com propriedades do es­
valo variável e sua ausência (SA), à extin­ ram o responder vieram a conformar-se estreita­ tímulo. Poderíamos escolher entre várias ordens
ção. O índice de discriminação é a porcen­
mente com a classe de estímulos correlacionada e freqüências relativas possíveis para a apresen­
tagem do total de respostas emitidas na pre­
sença de luz (a taxa em SD dividida pela com o reforço. Esse processo é denominado dis­ tação das luzes. Por exemplo, em vez de apre­
soma das taxas em SD e SA multiplicada por criminação e o responder sob tal controle de es­ sentar luzes com a mesma freqüência em certas
100). Os dados são a mediana das taxas de tímulo é denominado de comportamento discri­ posições, poderíamos apresentá-las em certas
oito ratos. (Herrick, Myers, & Korotkin, minado. O reforço diferencial estabeleceu uma posições, mas não em outras, de modo que o rato
1959, Figura 2)
classe de respostas definida pelos estímulos em jamais tivesse uma oportunidade de pressionar a
cuja presença elas ocorrem. E quanto às respos­ barra em presença de alguns estímulos. Essa é a
tas na presença de estímulos fora dos limites cor­ razão pela qual dizemos que, em procedimentos
relacionados com o reforço (p. ex., posições 6,7 de discriminação, os estímulos estabelecem a
tético comparável ao da Figura 7.1, no capítulo Neste ponto começamos a reforçar as pres­ e 8, ou 13, 14 e 15)? De acordo com uma inter­ ocasião para respostas: quando uma classe de
anterior. Novamente temos um rato em uma câ­ sões à barra apenas se a fenda estiver iluminada pretação estrita, elas não deveriam ser contadas respostas é definida pela presença de um estí­
mara com uma fenda em uma parede, mas desta nas posições 9, 10, 11 ou 12; quando a luz apa­ como membros do operante discriminado; fala­ mulo, as respostas nesta classe não podem ocor­
vez o rato não pode introduzir seu focinho na rece em qualquer outra posição, não reforçamos mos delas em termos de generalização. Mas o rer quando o estímulo está ausente.
fenda. A fenda está coberta com plástico trans­ as pressões. O efeito inicial do reforço é bastan­ reforço diferencial gerou respostas tanto dentro Mesmo essa distinção metodológica tem ex­
lúcido, e uma série de 15 lâmpadas, por trás do te semelhante àquele em B, na Figura 7.1: o res­ quanto fora desses limites; assim, elas são parte ceções. Consideremos, por exemplo, o reforço
plástico, pode iluminar os segmentos sucessivos ponder aumenta ao longo de todas as posições. de uma distribuição contínua. diferencial de longos intervalos entre respostas
da fenda. Em outras palavras, as lâmpadas for­ Em outras palavras, o efeito do reforço não é A solução é a mesma que a do Capítulo 7. (o esquema DRL: Capítulo 7). Se as bicadas de
necem uma dimensão de estímulo cujos compo­ restrito apenas a estímulos em posições correla­ Devemos reconhecer duas classes de estímulos: um pombo forem reforçadas somente depois de,
nentes são análogos àqueles da dimensão de res­ cionadas ao reforço; ele se dispersa para outras uma é a classe correlacionada com uma contin­ pelo menos, 5 segundos sem bicar, o pombo pode
posta da Figura 7.1. Uma barra fica centralizada posições. A dispersão do efeito do reforço na gência de reforço; a outra é a classe em cuja pre­ começar a espaçar suas bicadas cerca de 5 se­
logo abaixo da fenda e acima de um comedouro. presença de um estímulo para outros estímulos sença o responder ocorre. Não estamos interes­ gundos uma da outra. Discutimos esse compor­
Agora acendemos as lâmpadas por trás da fen­ não-correlacionados com o reforço é denomina­ sados em qualquer das classes em si, mas sim na tamento com base na diferenciação de um ope­
da, uma por vez, em ordem irregular e registra­ da generalização. Neste exemplo, reforçar o res­ correspondência entre elas. Essa discussão acom­ rante complexo, que consiste de uma pausa mais
mos as pressões à barra que ocorrem em presen­ ponder em presença de luzes nas posições 9 a 12 panha de perto o que discutimos sobre a diferen­ uma bicada. Poderíamos, igualmente, tratar a du­
ça de cada lâmpada. Se não reforçarmos as pres­ afetou o responder em presença não apenas da­ ciação e a indução no Capítulo 7. Isso é apro­ ração da pausa como uma propriedade de estí­
sões à barra, o responder será infreqüente e sem quelas luzes, mas também de luzes em todas as priado, pois podemos considerar um estímulo em mulo e argumentar que o comportamento deve­
qualquer relação sistemática com a região da fen­ outras posições ao longo da fenda. Este exem­ cuja presença uma resposta ocorre como uma ria ser considerado como uma discriminação ba­
da que estiver iluminada. De fato, os dados po­ plo difere essencialmente do anterior na dimen­ outra propriedade daquela resposta, como sua seada no tempo transcorrido desde a última bi­
dem ser similares àqueles em A, na Figura 7.1, são correlacionada com o reforço: no Capítulo força, duração e topografia. Por que então, nos cada. De fato, neste caso, as terminologias são
com a diferença de que o eixo X agora represen­ 7, lidamos com uma dimensão de resposta, mas referimos aos efeitos do reforço diferencial com permutáveis. Quando falamos de diferenciação
ta a posição do estímulo, e não a posição da res­ agora estamos lidando com uma dimensão de respeito a propriedades da resposta em termos e indução ou de discriminação e generalização,
posta. estímulo. de diferenciação e indução, mas falamos de dis­ a operação subjacente em cada caso é o reforço

A p r e n d iz a g e m 147 148 A . C h a r l e s C a ta nia


Treino Teste de Atenção
diferencial. Tanto a diferenciação como a discri­ o atentar (para) pode ter conseqüências. Por
minação envolvem correspondências entre as di­ exemplo, se uma contingência de reforço é cor­
mensões sobre as quais o reforço diferencial é relacionada ao brilho de um estímulo visual, mas
80
aplicado e as dimensões do comportamento re­ não com seu tamanho, fará muita diferença se o
sultante. Apesar disso, vamos manter a distin­ organismo atenta para o brilho ou para o tama­
ção entre as terminologias de propriedades de nho (e se atentar para o brilho ocorre mais fre­
resposta e propriedades de estímulo, porque elas qüentemente devido às suas conseqüências, en­
têm uma fundamentação histórica extensa e am­ tão, é apropriado falar sobre o atentar como um 40

plamente aceita. operante).


Consideremos um pombo cujas bicadas ao
disco sejam ocasionalmente reforçadas com ali­
ATENTAR PARA AS PROPRIEDADES mento. Uma das duas combinações de estímulo O'—
AR OG
DOS ESTÍMULOS é apresentada no disco: um triângulo sobre um
fundo vermelho ou um círculo sobre um fundo 80
Ao discutirmos a correspondência entre os verde. Cada um é apresentado por 3 minutos. FIG U RA 8.2. Respostas de bicar de dois
pombos durante o reforço correlacionado ao
estímulos com os quais as contingências de re­ Depois de 3 minutos de triângulo-sobre-verme­ triângulo sobre vermelho e durante a extin­
forço estão correlacionadas e os estímulos a que lho, a próxima bicada na presença deste estímu­ ção correlacionada ao círculo sobre verde (à
o organismo responde, falamos com base na di­ lo é reforçada; após 3 minutos de círculo-sobre- 40 esquerda, treinamento), e durante testes de
mensão de estímulo selecionada pelo experimen­ verde, o estímulo é desligado sem reforço. Esta extinção, quando as cores (verm elho-R ,
tador. Mas os estímulos têm propriedades varia­ programação em presença de triângulo-sobre- verde=G) e as formas (A, O) foram apresen­
tadas separadamente (à direita, testes de
das e não há garantias de que o organismo vá vermelho é denominada esquema de reforço de
I atenção). O Pombo 105 estava respondendo
responder apenas àquelas propriedades que se­ intervalo fixo ou FI; a programação em presen­ A_ à forma, mas não à cor; o Pombo 107 estava
lecionamos. Na diferenciação, as pressões à barra ça de círculo-sobre-verde é de extinção. Exami­ AR OG respondendo à cor, mas não à forma. (Rey­
por um rato podem ter uma forma relativamente naremos o esquema de intervalo fixo no Capítu­ nolds, 1961a, Figura 1)
Estímulo
constante, embora apenas a força seja a base para lo 10. Por ora, é suficiente observar que este es­
o reforço diferencial. Por exemplo, o rato pode quema, geralmente, mantém um responder cuja
pressionar regularmente a barra com sua pata taxa aumenta à medida que o tempo passa du­ na presença do triângulo; o vermelho, cor corre­ alguma dimensão de estímulo (prestar atenção
esquerda, embora essa propriedade não seja crí­ rante o intervalo, ao contrário da taxa relativa­ lacionada com o reforço, ocasionou poucas res­ cuidadosamente significa ouvir tudo o que é dito,
tica na determinação de se a resposta de pressio­ mente constante mantida por um esquema de postas a mais do que o círculo ou a cor verde, e não apenas algumas partes do que é dito). Di­
nar será reforçada. Do mesmo modo, na discri­ intervalo variável. Se cada bicada em presença componentes previamente correlacionados com zemos que o Pombo 105 atentou à forma e não à
minação um rato pode responder com base na de triângulo-sobre-vermelho produzisse um re- a extinção. Para o Pombo 107, por outro lado, cor, porque o responder discriminado ocorreu ao
intensidade de um estímulo visual, embora o re­ forçador, então, as apresentações do reforçador quase todas as bicadas ocorreram durante o ver­ longo de mudanças na forma, mas não ao longo
forço diferencial seja baseado somente em sua por si só poderiam adquirir funções discrimina­ melho; embora o triângulo tivesse sido correlacio­ das mudanças na cor. Quando os estímulos são
forma; podemos dizer que o rato está atento à tivas, mas com reforço em FI não temos que nos nado com o reforço durante o treino, este estímulo discriminados ao longo de uma dimensão de es­
intensidade. (As propriedades de estímulo às preocupar com tais efeitos, uma vez que nenhu­ ocasionou ainda menos bicadas do que o círculo tímulo, mas não de outra, dizemos que o orga­
quais um organismo tende a responder discrimi­ ma bicada é reforçada até que o intervalo tenha ou o verde. O Pombo 105 estava prestando aten­ nismo está prestando atenção à primeira dimen­
nativamente são, às vezes, denominadas salien­ terminado. ção à forma, e não à cor, e o Pombo 107 estava são, mas não à segunda.
tes, mas a saliência não é uma propriedade de A Figura 8.2 (Reynolds, 1961a) mostra da­ atentando à cor, e não à forma. A forma e a cor Uma vez que um organismo tenha atentado
um estímulo; é uma propriedade do comportamen­ dos da aplicação desse procedimento com dois haviam sido correlacionadas com o reforço durante para algumas propriedades de estímulo em uma
to do organismo com relação àquele estímulo.) pombos. Os gráficos à esquerda mostram taxas o treino. Somente ao examinar separadamente os situação, ele também tenderá a atentar àquelas
O conceito de atenção é essencial em um tra­ de bicar durante cada combinação de estímulo efeitos dos componentes é que foi possível dizer propriedades em situações novas (p. ex., Lawren­
tamento dos operantes discriminados, porque os ao final de 18 horas de treino. Ambos os pom­ quais eram suas funções discriminativas. ce, 1949). Podemos também alterar a probabili­
organismos tendem a responder a algumas pro­ bos estavam emitindo mais de 40 bicadas por O responder dos pombos nessa situação não dade de que um organismo venha a atentar para
priedades de estímulos, e não a outras. Na medi­ minuto durante a presença do triângulo-sobre- era apenas um caso de generalização. O respon­ uma ou outra propriedade de estímulo simples­
da em que atentar para, ou prestar atenção a uma vermelho, mas bicavam em taxas relativamente der do Pombo 105 generalizou-se de triângulo- mente mudando a maneira como o reforço está
propriedade, ou a outra é algo que os organis­ baixas durante a do círculo-sobre-verde. Em um sobre-vermelho para triângulo sem vermelho, correlacionado com essas propriedades (John­
mos fazem, podemos tratá-lo como um tipo de teste sem reforço, cada componente da combi­ mas não para vermelho sem triângulo. Geralmen­ son & Cumming, 1968). Na fase de treino da
comportamento (ver Capítulo 20). Uma razão im­ nação era apresentado separadamente. Para o te falamos da atenção não como uma resposta a Figura 8.2, a forma e a cor estavam igualmente
portante para tratar a atenção desta maneira é que Pombo 105, quase todas as bicadas ocorreram um estímulo particular, mas como a atenção a bem-correlacionadas com o reforço. Por essa ra-

A p r e n d iz a g e m 149 150 A . C h a r l e s C a ta n ia
mais, as propriedades do ambiente às quais um então é variada, o responder pode depender de
zão, o experimento foi particularmente apropri­ partir da qual o rato se aproxima). Por exemplo,
organismo presta atenção podem variar com as quanto o estímulo mudou. Por exemplo, se du­
ado para demonstrar algumas das propriedades suponhamos que o braço direito de um labirinto
limitações impostas pelo experimentador (cf. rante uma fase de treino as bicadas de um pom­
da atenção. Mas, se nosso interesse principal em T aponte em direção à parede mais iluminada,
fosse a discriminação de forma pelo pombo, te­ a parede leste de um laboratório, onde ficam as Collier & Rovee-Collier, 1981; Lea, 1979). Por bo no disco forem reforçadas quando o disco
janelas. O rato poderia aprender a virar à direita, exemplo, quando um rato é exposto a sessões estiver iluminado por amarelo, o pombo geral­
ríamos que tomar a cor irrelevante e correlacio­
nar as mudanças no reforço somente com mu­ ou poderia aprender a correr em direção à janela. diárias em um aparato em que o alimento é colo­ mente bicará com taxas cada vez mais baixas à
danças na forma. Poderíamos testar essas alternativas, girando o la­ cado nas extremidades de cada um dos vários medida que a luz do disco mudar para o laranja,
birinto em T, de modo que o braço direito agora becos, e os becos não são reabastecidos durante depois para o vermelho e para o violeta, na fase
apontasse para o oeste, e o rato se aproximasse do a sessão, o rato aprende a não retomar aos becos de teste. Isso demonstra generalização: os efei­
Aprendizagem de Lugar versus ponto de escolha a partir do norte. Se o rato vira à em que já comeu (Olton & Samuelson, 1976). tos do reforço na presença do amarelo estendem-
Aprendizagem de Resposta direita, e, portanto, na direção oposta à da janela, As propriedades espaciais do ambiente são par­ se para as outras cores.
ele demonstra aprendizagem de resposta. Se vira ticularmente importantes, mas, em circunstânci­ A Figura 8.3 apresenta dados sobre a gene­
As questões precedentes estão relacionadas à esquerda, rumo à janela, exibe aprendizagem de as apropriadas, um rato pode aprender outras pro­ ralização de bicadas de pombos no disco, a tons
indiretamente a uma antiga controvérsia em Psi­ lugar, ele se desloca para o mesmo lugar, embora priedades do ambiente. de diferentes freqüências depois que as bicadas
cologia, sobre a aprendizagem de lugar versus a faça isso virando em uma direção diferente. A ques­ foram reforçadas apenas em presença de um tom
aprendizagem de resposta (p. ex., Restle, 1957). tão é se o rato aprende a virar à direita versus à de 1000 ciclos por segundo (Jenkins & Harri­
A resposta de deslocar-se de um lugar para ou­ esquerda ou a virar a leste versus a oeste. GRADIENTES DE CONTROLE DE son, 1960). Em um procedimento (sem treino de
tro tem ocupado freqüentemente uma posição O desempenho do rato depende, em grande ESTÍM ULO discriminação), o tom estava sempre presente, e
privilegiada em análises comportamentais (p. ex., parte, dos estímulos disponíveis tanto dentro as bicadas eram reforçadas segundo um esque­
Olton, 1979). Ir em busca de alimento não é o quanto fora do labirinto. O labirinto típico cos­ Os procedimentos de discriminação colocam ma de intervalo variável ou VI. Em um segundo
mesmo que produzir alimento permanecendo no tumava ser coberto por uma tela de arame ou uma pesada responsabilidade sobre o experimen­ procedimento (treino de presença versus ausên­
mesmo lugar. Uma diferença importante entre por alguma outra cobertura que permitisse ao tador. Em um procedimento de diferenciação, o cia), o tom estava presente em algumas vezes e
os dois casos é que o ambiente muda mais dras­ experimentador observar o que o rato estava fa­ organismo determina a ordem das respostas, mas ausente em outras, e as bicadas eram reforçadas
ticamente quando nos deslocamos para um novo zendo. Se o experimentador podia olhar para em um procedimento de discriminação o expe­ de acordo com o esquema de VI apenas durante
lugar do que quando introduzimos um novo es­ dentro do labirinto, o rato também podia olhar rimentador deve decidir-a ordem em que os estí­ o tom. Após o treino, o reforço foi interrompido,
tímulo no lugar onde estamos. Os humanos em para fora. Embora ratos sejam míopes, o rato mulos são apresentados. Um experimentador que e tons de outras freqüências foram apresentados
particular têm encontrado algumas maneiras de comum pode discriminar a direção geral de lu­ esteja interessado em algum contínuo de estímulo pela primeira vez, intercalados com a ausência
substituir a locomoção comum por outras res­ zes e outros aspectos genéricos de um ambiente. (isto é, alguma dimensão ao longo da qual os de tom e com a apresentação do tom original.
postas: para irmos a diferentes lugares pisamos Enquanto houver estímulos disponíveis do lado estímulos podem variar, como a intensidade ou Durante essa fase, cada estímulo era apresenta­
em aceleradores, giramos volantes, apertamos bo­ de fora do labirinto, eles podem tornar-se a base posição de uma luz) deve preocupar-se com do 8 vezes, em ordem mista.
tões de elevadores e subimos em escadas ou estei­ a partir da qual o rato vira em uma direção parti­ quantos estímulos apresentar, por quanto tempo Para os três pombos sem treino prévio de dis­
ras rolantes. Além disso, o movimento produz mu­ cular. Mas se esses estímulos são eliminados co­ e em que ordem e de que forma os estímulos de­ criminação (Figura 8.3, acima), nem a freqüên­
danças contínuas no ambiente, enquanto as seqüên­ locando-se uma cobertura opaca sobre o labirin­ veriam ser correlacionados com o reforço e com cia do tom, nem sua presença ou sua ausência
cias de outras respostas podem não produzir qual­ to, a orientação espacial do labirinto em relação o não-reforço, para mencionar algumas das pos­ tiveram qualquer efeito substancial sobre o bi­
quer mudança até que a seqüência esteja comple­ à sala toma-se irrelevante, e o rato não pode mos­ sibilidades mais importantes. A pesquisa sobre car. O gradiente de generalização foi relativa­
ta. Além dessas diferenças, então, será que impor­ trar outra coisa que não a aprendizagem de res­ gradientes de controle de estímulo busca os efei­ mente achatado ou, em outras palavras, o efeito
ta se um organismo se desloca até um novo lugar posta. A aprendizagem de lugar ou a aprendiza­ tos de algumas dessas variáveis. Esses procedi­ do reforço na presença do tom original esten­
ou se produz estímulos novos onde está? gem de resposta dependem, portanto, de como o mentos geralmente envolvem uma fase de trei­ deu-se uniformemente a todos os outros estímu­
Questões desse tipo estavam implícitas na experiementador prepara o problema para o rato. no, durante a qual é programada alguma corre­ los. Podemos dizer que esses pombos não esta­
controvérsia sobre a aprendizagem de lugar ver­ Ao escolher criteriosamente as condições, um ex­ lação entre os estímulos e as respostas reforça­ vam atentando para o tom, porque as mudanças
sus a aprendizagem de resposta. Podemos dife­ perimentador pode tomar qualquer um dos re­ das, seguida por uma fase de teste, durante a qual na freqüência do estímulo não fizeram qualquer
renciar as viradas de um rato à direita, no ponto sultados mais provável do que o outro. o reforço é suspenso, enquanto os estímulos no­ diferença para eles.
de escolha de um labirinto em T, ao reforçar vi­ Em ambientes naturais, o alimento em um vos e velhos são apresentados. Para os cinco pombos que receberam treino
radas à direita, mas não à esquerda. Podemos en­ dado local não é necessariamente reabastecido prévio de discriminação (Figura 8.3, abaixo), a
tão perguntar se o responder do rato está basea­ como no compartimento-alvo de um labirinto de freqüência original produziu taxas de respostas
do em dimensões da resposta (movimentos à di­ laboratório. Ao forragear, um animal pode tor­ Gradientes de Generalização mais altas do que qualquer outra freqüência du­
reita e não à esquerda) ou em dimensões de estí­ nar-se mais propenso a deslocar-se para um novo rante a fase de teste; em geral, quanto mais pró­
mulo (movimentos em direção a um local parti­ local do que a retornar a um local onde já consu­ Se uma resposta é reforçada durante um estí­ xima uma freqüência estivesse da freqüência
cular, sem levar em consideração a direção a miu o alimento que estava disponível. Uma vez mulo, e alguma propriedade daquele estímulo original, maior era a taxa de respostas nessa nova

A p r e n d iz a g e m 151 152 A. C harles C a t a n ia


30 FIGURA 8.4 Gradientes de controle de es­
SEM TREINO DE DISCRIMINAÇAO tímulo. O gradiente de generalização mos­
0 70
Tom Apenas SD • 71
tra bicadas após o reforço sob um com­
20 - V 72 primento de ondas de 550 milimicrons
(SD). O gradiente apresenta um pico no SD.
O O gradiente de pós-discriminação mostra
V
respostas de bicar depois do reforço em
10
SD presença de um comprimento de onda de
550 milimicrons (SD) e extinção sob um
_L l comprimento de onda de 570 milimicrons
-íh- (SA); o pico se deslocou: o máximo de res­
TREINO DE PRESENÇA-AUSENCIA postas desviou-se do SD em direção opos­
Tom SD - Ausência de Tom SA ta à do SA. O expectro vai do violeta ao
azul nos comprimentos de onda mais cur­
tos e ao vermelho nos comprimentos de
onda longos, assim o SD e o SA estavam na
região verde-amarelo do espectro. (Han­
Comprimento de Onda (mu) son, 1959, Figura 1)
FIGURA 8.3 Gradientes de generalização
para pombos individuais como função da
freqüência de um tom após o reforço de bi­
cadas no disco durante um tom de 1000 ci­
clos p o r segundo (acima, 3 pombos), ou tro, durante o qual as bicadas não eram reforça­ criminação (cf. Hearst, Besley, & Farthing,
depois do reforço em presença daquele tom das (extinção); como no primeiro grupo, a taxas 1970).
e extinção em sua ausência (abaixo, 5 pom­ de bicar durante este e outros comprimentos de Efeitos do treino discriminativo sobre a for­
bos). Sem o treino de discriminação os gra­ onda foram determinadas durante um período de ma dos gradientes levou a questões sobre as ori­
dientes foram relativamente achatados;
após o treino de presença-ausência, eles
não-reforço. Neste caso, o pico do gradiente foi gens dos gradientes de generalização com picos
foram relativamente agudos, com seu ápice deslocado do estímulo de reforço, em direção agudos. Uma das sugestões foi a de que os gra­
correspondendo ao estímulo em cuja pre­ oposta ao estímulo de extinção; esse deslocamen­ dientes poderiam ser mais agudos ou mais acha­
sença ocorria o reforço (SD). (Jenkins & to é chamado de deslocamento de pico. (Efeitos tados dependendo se os estímulos naquela re­
300 450 670 1000 1500 2250 3500 Harrison, 1960, Figuras 1 e 2) semelhantes também ocorrem quando a discri­ gião do gradiente eram mais fáceis ou mais difí­
Freqüência (Ciclos/Segundo)
minação é baseada em uma freqüência de refor­ ceis de discriminar. Mas, quando os graus de in­
ço mais alta durante um estímulo do que outro: clinação dos gradientes de generalização em
Guttman, 1959.) torno de estímulos em diferentes regiões do es­
freqüência. Não foi surpresa o fato de que taxas dimensão. A Figura 8.4 compara tal gradiente Uma explicação para a forma do gradiente pectro foram comparados com os limiares para
baixas ocorressem quando o tom estava ausen­ de pós-discriminação com um gradiente de ge­ de pós-discriminação (Spence, 1937) supunha a detecção de uma mudança no comprimento da
te; sua ausência estava correlacionada com a neralização (Hanson, 1959). Para um grupo de que o reforço na presença de um estímulo criava onda naquelas regiões, não foi possível encon­
extinção. Mas para esses pombos, a taxa de res­ pombos (generalização), as bicadas ao disco em um gradiente de responder aumentado, centrado trar qualquer relação simples entre a generaliza­
postas variou com a freqüência do tom, embora presença de um único comprimento de onda no naquele estímulo (gradiente excitatório), que a ção e a discriminabilidade (Guttman & Kalish,
o responder discriminado dependesse somente disco foram reforçadas segundo um esquema de extinção em presença do outro estímulo produ­ 1956).
da presença ou ausência do tom, e não de sua VI, depois do que a taxa de bicar em presença zia um gradiente de responder reduzido, centra­ Outra sugestão foi a de que os gradientes agu­
freqüência. Podemos dizer, então, que os pom­ deste e de uma variedade de diferentes compri­ do neste segundo estímulo (gradiente inibitório), dos dependem da aprendizagem de discrimina­
bos estavam prestando atenção ao tom. (A for­ mentos de onda foi determinada durante um pe­ e que, depois do treino de discriminação, o res­ ção que ocorre antes que o organismo seja ex­
ma dos gradientes de generalização também é ríodo sem reforço. O pico do gradiente (o ponto ponder produzido por outros estímulos poderia posto à situação experimental. Por exemplo, um
afetada por outras variáveis, como o nível de com freqüência mais alta) ficou no estímulo cor­ ser previsto, subtraindo-se o gradiente inibitório pombo supostamente aprende a discriminar en­
privação ou o esquema de reforço durante o trei­ relacionado com o reforço; em outras palavras, do excitatório. O gradiente teórico de Spence tre os grãos que come muito antes de ver o ama­
no: p. ex., Hearst, Koresko &, Poppen, 1964.) a taxa diminuiu à medida que aumentou a dis­ mostrava um deslocamento de pico: o ponto mais relo projetado em um disco; suas discriminações
tância entre o estímulo de teste e o estímulo de alto do gradiente era deslocado do estímulo de de cor devem ser mais marcantes na região do
treino.
reforço em direção oposta à do estímulo de ex­ amarelo no espectro, simplesmente porque o
Gradientes de Pós-Discriminação Para um segundo grupo (pós-discriminação),
tinção. Mas o novo gradiente, produzido pela amarelo predomina na cor de seu alimento. E di­
as bicadas ao disco foram reforçadas de acordo subtração, era mais baixo do que o gradiente ex­ fícil controlar as discriminações de cor adquiri­
Os gradientes de controle de estímulo tam­ com um esquema de VI durante o mesmo com­
citatório original em toda a sua extensão; assim, das nos ambientes naturais, mas poderíamos criar
bém podem ser obtidos após uma discriminação primento de onda que o do primeiro grupo, mas ele era consistente com a forma, mas não com ambientes em que as discriminações de cor não
entre dois ou mais estímulos ao longo de uma este comprimento de onda se alternava com ou- os valores absolutos do gradiente de pós-dis- fossem possíveis. Em um ambiente iluminado

A p r e n d iz a g e m 153 154 A . C harles C a t a n ia


de teste foram obtidos, na ausência de reforço, ao longo da dimensão relevante e da extinção
apenas por luz monocromática, em uma faixa ram um deslocamento de pico, embora os estí­
os gradientes de controle de estímulo ao longo correlacionada ao outro; e (4) o gradiente ini­
muito estreita de comprimentos de onda como o mulos consistissem, principalmente, de compri­
da dimensão de orientação da linha. bitório, depois do reforço na presença de um estí­
amarelo emitido por uma lâmpada de sódio a mentos de onda que eles jamais haviam visto
antes (Terrace, 1975). No grupo com a linha vertical correlaciona­ mulo, mas não na dimensão relevante, e extinção
vapor, os objetos não têm cor; para uma pessoa
da ao reforço e a ausência da linha correlaciona­ na presença de um estímulo naquela dimensão.
em um ambiente assim, tudo aparece em tons
de cinza. Um organismo criado em tal ambi­ da à extinção (círculos cheios), o bicar diminuiu Qualquer que seja o gradiente, podemos sem­
ente não tem oportunidade de aprender as dis­ Gradientes de Inibição com os maiores desvios da vertical; este é um pre formular questões sobre as dimensões de
criminações de cor. gradiente de reforço como o da Figura 8.3 (em estímulo a que de fato um organismo presta aten­
Um organismo apropriado para um experi­ Diante da proposição de Spence de lidar com baixo). Mas no grupo com a linha vertical corre­ ção. Por exemplo, suponhamos que o pombo olhe
mento sobre a criação em um ambiente mono­ a forma dos gradientes de pós-discriminação, lacionada à extinção e sua ausência correlacio­ apenas para o contorno superior de um disco que
cromático é o patinho, que é capaz de andar e surgiu o interesse em encontrar um modo de se nada ao reforço (círculos vazios), o bicar aumen­ tem uma linha projetada sobre ele. Se mudamos
bicar logo que sai da casca do ovo; portanto, os medir diretamente o gradiente de inibição. As tou com os maiores desvios da vertical. Neste a direção da linha da vertical, a parte superior da
procedimentos de reforço podem ser iniciados dificuldades eram tanto metodológicas como te­ grupo, mudar a orientação da linha afetava sua linha se desloca daquela região do disco, de modo
cedo. Gradientes de generalização ao longo de óricas. Para determinar se um estímulo redu­ distância do estímulo de extinção, mas não sua que o contorno parece mais como ele era quan­
comprimentos de ondas, obtidos com patinhos zia a taxa de respostas, teria de haver alguma distância do estímulo de reforço que era a au­ do não havia uma linha ali. Nesse caso, a linha é
que haviam sido criados em ambientes mono­ taxa para começar. Era necessário um procedi­ sência de uma linha. Esse é um gradiente inibi­ o estímulo nominal, mas o estímulo funcional é
cromáticos, às vezes, são achatados (Peterson, mento que separasse a dimensão ao longo da qual tório. o que aparece junto ao contorno superior do dis­
1962; cf. Figura 8.3, acima) e, outras vezes são o gradiente de extinção seria determinado da­ Os gradientes inibitórios geralmente são mais co. A única maneira de avaliar tal possibilidade
agudos (p. ex., Rudolph, Honig, & Gerry, 1969; quela correlacionada com o reforço. Tal proce­ achatados do que os gradientes excitatórios cor­ é pela experimentação (p. ex., removendo por­
cf. Figura 8.3, em baixo), sugerindo que o pati­ dimento é ilustrado na Figura 8.5 (Honig e col., respondentes, provavelmente porque os organis­ ções da linha e observando se isso produz os mes­
nho, às vezes, presta atenção à cor, mesmo sem 1963). Com um grupo de pombos, o estímulo mos tendem a atentar mais para as propriedades mos tipos de mudanças no comportamento do
ter experiência com as cores. Quando os pati­ correlacionado ao reforço era uma linha vertical dos estímulos correlacionadas ao reforço do que pombo que aquelas produzidas pela rotação da
nhos criados sob iluminação monocromática fo­ sobre o disco, e o estímulo de extinção era um para aquelas correlacionadas à extinção (cf. Dins- linha: cf. Touchette, 1969). O argumento pode
ram treinados a discriminar entre dois compri­ disco iluminado sem uma linha; com um segun­ moor, 1995). Uma condição como aquela do pri­ parecer trivial com relação às respostas do pom­
mentos de onda, no entanto, seus gradientes de do grupo, esses estímulos eram invertidos. Para meiro grupo, em que uma linha era a caracterís­ bo, mas pode ser extremamente importante em
pós-discriminação foram semelhantes aos de pa­ ambos os grupos, durante o treino foram usados tica apresentada somente durante o reforço, é de­ situações de aplicação, quando, por exemplo, um
tinhos criados em ambiente natural, e apresenta­ esquemas de intervalo variável (VI), e na fase nominada discriminação da característica posi­ professor tenta descobrir se uma criança está
tiva; uma condição como a do segundo grupo, atentando para as palavras, em um livro de his­
em que a linha era a característica presente so­ tória, ou se está fraudando a leitura e atentando
mente não durante a extinção, é denominada de essencialmente para as figuras.
discrim inação da característica negativa
(Jenkins & Sainsbury, 1970). Como é mais fácil
conseguir que os organismos atentem para os es­ ESVANECIMENTO (FADING):
tímulos correlacionados ao reforço do que à ex­ CONTROLE DE ESTÍM ULO PO R
tinção, treinar uma discriminação com a carac­ APROXIMAÇÕES SUCESSIVAS
FIGURA 8.5 Gradientes de controle de es­ terística positiva é mais fácil do que treinar uma
tímulo excitatórios e inibitórios depois do Do mesmo modo que as propriedades de res­
discriminação com a característica negativa. Al­
reforço de respostas de bicar, em pombos,
em intervalo variável na presença de um gumas implicações desses fenômenos serão con­ posta que definem uma classe operante podem
estímulo (SD) e extinção em presença de sideradas mais detalhadamente no Capítulo 11, em ser gradualmente modificadas por meio de pro­
outro (SA). Dados de pombos são mostra­ uma discussão sobre as respostas de observação. cedimentos de modelagem, as propriedades de
dos para dois estudos (símbolos cheios e Consideramos até agora os quatro principais estímulo que definem uma classe operante dis­
vazios). Para um grupo, a linha vertical criminada podem ser gradualmente alteradas por
tipos de gradientes de controle de estímulo: (1)
era correlacionada ao reforço, e sua au­
sência era correlacionada à extinção (cír­ o gradiente de generalização relativamente acha­ procedimentos análogos, denominados de esva-
culos cheios); para outro grupo; esses es­ tado, sem atenção à dimensão de estímulo rele­ necimento ou esmaecimento. O treino não tem
tímulos eram invertidos (círculos vazios). vante; (2) o gradiente de generalização com pico que começar com estímulos que são difíceis de
Dados obtidos na ausência de reforço agudo, com atenção à dimensão de estímulo rele­ discriminar. Ele pode começar com aqueles es­
mostram o responder na presença de dife­
vante; (3) o gradiente de pós-discriminação, que tímulos que são fáceis de discriminar e, então,
rentes orientações da linha e na ausência
da linha. (Honig, Boneau, Burstein, & normalmente apresenta um deslocamento de pico mudar gradualmente para os estímulos mais di­
© 0 0 0 © © © O Pennypacker, 1963, Figura 1) depois do reforço correlacionado a um estímulo fíceis. Por exemplo, para o bicar de um pombo
Graus

A p r e n d iz a g e m 155 156 A. C harles C a t a n ia


reforçado com alimento, normalmente, é mais curo, durando 5 segundos. Gradualmente, ao lon­ diferença está em se o reforço diferencial é im­ distinguir entre outras (p. ex., linhas retas ver­
difícil estabelecer uma discriminação entre as go de 3 sessões, sua duração foi, gradualmente, posto sobre as propriedades do responder ou so­ sus linhas curvas são importantes para distinguir
linhas verticais e horizontais do que entre o ver­ aumentada, e ele mudou de escuro para verde bre as propriedades do estímulo em cuja presen­ entre U e V, mas não entre V e N), e distinções
melho e o verde. Uma vez que uma discriminação fraco, para verde um pouco mais forte, até um ní­ ça o responder ocorre. A principal implicação diferentes são importantes para letras minúscu­
entre vermelho e verde esteja estabelecida, contu­ vel final que, para o olho humano, igualava-se ao dessa diferença diz respeito ao procedimento: em las e maiúsculas (p. ex., nenhum par de letras
do, a discriminação entre vertical e horizontal pode brilho do disco vermelho. Ao final dessas condi­ estudos de diferenciação, o experimentador deve maiúsculas tem as reversões para cima e para
ser aproximada sucessivamente ao superpor verti­ ções, os 3 minutos de vermelho correlacionado ao esperar pelas respostas do organismo, enquanto baixo ou para a esquerda e a direita que devem
cal sobre vermelho e horizontal sobre verde e, en­ reforço se alternavam com 3 minutos de verde cor­ em estudos de discriminação o experimentador ser dominadas para a leitura de b, p, d, e q). A
tão, gradualmente, remover ou esvanecer as cores relacionado com a extinção. Cada pombo tratado controla a ordem e a duração das apresentações maneira pela qual uma criança aprende a distin­
(Terrace, 1963b). (Um pouco de esvanecimento dessa maneira bicava o disco de extinção menos do estímulo. A terminologia da diferenciação e guir as letras do alfabeto depende da relação en­
grosseiro vem sendo programado neste capítulo, do que 10 vezes durante todo o treino; o bicar ocor­ da discriminação está resumida na Tabela 8.1. tre as propriedades dos estímulos como a sime­
pela substituição da expressão completa intervalo ria, quase sem exceção, no disco vermelho, e não O reforço diferencial pode ser baseado em tria, a curvatura e o fechamento. As proprieda­
variável, em favor de sua abreviatura, VI, depois no verde. Pombos expostos a este procedimento dimensões simples de estímulos, como a inten­ des essenciais para discriminar as letras diferen­
que ambas apareceram juntas mais de uma vez.) mais tarde, depois de um treino inicial ou para os sidade ou a localização. A questão experimental tes são chamadas de características críticas (p.
O estabelecimento de controle de estímulo quais o verde foi introduzido abruptamente, com é se o responder se conforma às conseqüências ex., Gibson, 1965).
por meio da alteração gradual de estímulo geral­ duração e intensidade plenas, bicaram no disco diferenciais, de modo que mais respostas ocor­ Não é suficiente, porém, enumerar caracte­
mente é bastante efetivo (p. ex., Sidman & Stod­ verde de extinção centenas e mesmo milhares de ram na presença dos estímulos correlacionados rísticas críticas. Para algumas letras, as formas
dard, 1967) mas, como no caso da modelagem, vezes durante períodos equivalentes de treino. ao reforço do que na presença daqueles correla­ maiúscula e minúscula diferem mais entre si do
não há regras simples para determinar quão ra­ A introdução gradual do verde foi suficiente cionados com a ausência de reforço. As impli­ que diferem de outras letras (p. ex., e, E e F, ou
pidamente os estímulos devem ser gradualmen­ porque, entre outras coisas, escurecer o disco cações são profundas. O que aprendemos a par­ h, n, e N). Dada a multiplicidade de formas, o
te introduzidos (fading in) ou removidos (fading vermelho logo no início do treino impedia o pom­ tir do treino de discriminações simples com ra­ que então define uma classe de estímulos que
out) em diferentes situações. Por exemplo, se bo de bicar por uns poucos segundos (qualquer tos e pombos têm sido empregado para desen­ ocasiona a resposta de dizer A, ou B, ou C? Essa
superpomos o vertical sobre o vermelho e o ho­ mudança de estímulo abmpta poderia ter tido tal volver métodos para treinar primatas a discrimi­ é uma pergunta sobre a estrutura de estímulo das
rizontal sobre o verde e, então, esvanecemos par­ efeito). Era pouco provável que o bicar recome­ nar entre os diferentes tipos de drogas que lhes letras do alfabeto. O problema pode ser ainda
cialmente as cores, podemos descobrir mais tar­ çasse antes do término dos 5 segundos do estí­ são administradas (p. ex., Schuster & Balster, mais complicado quando se consideram diferen­
de, após remover completamente as cores, que o mulo de extinção. Assim, uma diferença no res­ 1977), para ensinar pais jovens a discriminar tes contextos. Por exemplo, a letra O poderia ser
pombo aprendeu a discriminar entre o vertical e ponder aos dois estímulos foi estabelecida des­ doenças em suas crianças (p. ex., Delgado & uma letra ou um zero, e a letra I poderia ser uma
o horizontal. Por outro lado, o esvanecimento pode de o início, e as mudanças graduais na duração e Lutzger, 1988) e para instruir mulheres na reali­ letra ou um numeral romano. O conceito de um
ser mal sucedido; se o pombo atenta apenas para intensidade do estímulo de extinção foram esta­ zação do auto-exame da mama (p. ex., Pennypa­ X, Y ou Z é definido pela classe de estímulos a
as cores, mesmo quando elas se tomam muito fra­ belecidas a partir dessa diferença. Depois de uma cker & Iwata, 1990), só para mencionar algu­ que respondemos com o nome da letra corres­
cas, podemos descobrir que o responder discrimi­ história como essa, podemos mudar o estímulo mas das inúmeras aplicações bem-sucedidas. pondente, mas veremos que essas classes são ba­
nado desaparece toda vez que enfraquecemos as de extinção para reforço e pode ser que o pombo Como ilustrado por essas aplicações, o reforço seadas no comportamento, não em propriedades
cores abaixo de certos níveis de limiar. nunca responda durante aquele estímulo para diferencial pode ser programado para proprie­ físicas comuns (cf. Capítulo 14).
Do mesmo modo que a modelagem requer chegar a descobrir que fizemos isso. Em que sen­ dades complexas dos estímulos que não são fa­ Os operantes discriminados são classes de
que algum comportamento esteja disponível para tido este é um desempenho sem erro não é ób­ cilmente quantificáveis. Por exemplo, crianças comportamento definidas pelos estímulos que
ser modelado, o esvanecimento requer que al­ vio. Devemos ter cuidado com a linguagem de que estão aprendendo a ler devem ser capazes ocasionam o responder. Tais classes são freqüen­
gum comportamento sob controle discriminati­ erros; o termo erro implica um julgamento sobre o de nomear as letras do alfabeto. Mas as proprie­ temente identificadas em nosso vocabulário co­
vo esteja disponível para ser mudado no contro­ valor do responder e pode ser inapropriado a uma dades importantes para distinguir entre algumas tidiano, por exemplo, quando falamos de parar
le de uma nova dimensão de estímulo. Conside­ análise do comportamento. O procedimento de es­ letras são diferentes das que são importantes para em um semáforo vermelho ou de atender ao te-
remos, por exemplo, a aprendizagem de discri­ vanecimento não tem interesse apenas teórico; suas
minação sem erro (Terrace, 1963a). Logo depois possíveis aplicações à educação conferem a ele
TABELA 8.1 A Terminologia do Reforço Diferencial
que as bicadas de um pombo em um disco ver­ uma importância prática (p. ex., ver Capítulo 17).
melho foram modeladas com reforço alimentar, Reforço Diferencial Concentração dos Extensão dos Reforço Diferencial
(Operação) Efeitos do Reforço Efeitos do Reforço por Aproximações
o reforço durante o vermelho passou a ser pro­
(Processo) (Processo) (Operação)
gramado de acordo com um esquema de inter­ A TERMINOLOGIA DO REFORÇO
valo variável. Períodos de três minutos de ver­ DIFERENCIAL Em relação às Diferenciação Indução Modelagem
propriedades da resposta
melho se alternavam com um outro estímulo,
durante o qual as bicadas não eram reforçadas. Tanto a diferenciação quanto a discrimina­ Em relação às propriedades Discriminação Generalização Esvanecimento
De início, este outro estímulo era um disco es­ ção envolvem o reforço diferencial. A principal do estímulo
'ST" . Q

A p r e n d iz a g e m 157 158 A. C harles C a t a n ia


pio do mostrador de relógio, diria que o pombo te equivalentes à navegação celeste. Os organis­
lefone. A luz vermelha pode variar em brilho e to do organismo (p. ex., Shimp, Sabuslky, & representa ou imagina seu movimento constante mos que deixam seu território natal, devem ser
tamanho e o toque do telefone em altura e tim­ Childers, 1989) para mencionar apenas alguns. ou no caso da busca da presa, o predador com­ capazes de retomar a ele; quanto mais precisa­
bre, mas o responder é razoavelmente indepen­ Muitos exemplos de pesquisas sobre a cogni­ para o alvo potencial com uma imagem de bus­ mente puderem fazer isso, mais amplamente
dente de variações ao longo de tais dimensões, e ção animal são apresentados em outros trechos ca). Discutimos o papel da representação nas te­ podem forragear. Os organismos que armazenam
assim falamos em termos dessas classes de even­ neste livro, assim esta seção apresenta apenas orias biológicas, no contexto da seleção natural, alimento no invemo devem ser capazes de loca­
tos, e não de casos particulares. uma amostra altamente seletiva. no Capítulo 3. A questão será retomada no con­ lizar o alimento mais tarde; quanto mais variá­
Freqüentemente, tratamos os estímulos como Consideremos um pombo que observa o mos­ texto da memória e da recordação, como em re­ veis seus locais de armazenagem e quanto mais
se fossem restritos a objetos concretos ou a even­ trador de um relógio de pulso projetado no disco construir e então “reapresentar” (no sentido lite­ locais eles puderem rastrear, menor a probabili­
tos ambientais. Mas, embora possamos apren­ do centro de três discos para pombos (Neiworth ral de apresentar de novo) as características de dade de que percam o que armazenaram para seus
der a responder consistentemente a objetos ou & Rilling, 1987). O ponteiro longo começa na eventos que já ocorreram, e no contexto das teo­ competidores (p. ex., Balda, Kamil, & Grim,
eventos em nosso ambiente, também discrimi­ vertical e gira até os 90°; então ele desaparece. rias comportamentais e cognitivas, no Capítulo 1986). Os organismos que se evadem de preda­
namos entre as características, às vezes, chama­ Um pouco mais tarde ele reaparece mais longe, 20, onde argumentaremos que o imaginar pode dores devem ser capazes de localizar rotas de
das de abstratas ou de relacionais que são inde­ em 135° ou em 180°. O momento de seu reapa­ ser apropriadamente tratado como um tipo de fuga; os que se deixam perseguir para becos sem-
pendentes dos objetos ou dos eventos particula­ recimento é consistente ou inconsistente com comportamento. saída não sobrevivem.
res. O termo estímulo, geralmente, funciona des­ uma taxa constante de rotação, enquanto ele está Consideramos algumas questões relevantes
se modo mais geral, no sentido de alguma pro­ invisível. Depois de uma tentativa consistente
à orientação espacial, quando discutimos a apren­
priedade de eventos ambientais. Por exemplo, com uma taxa de rotação constante, as bicadas MAPAS COGNITIVOS dizagem de lugar versus a aprendizagem de res­
podemos dizer que uma cadeira foi colocada à no disco da esquerda são reforçadas; depois de
posta. Os dois tipos de comportamento foram
direita de uma mesa. Embora a cadeira e a mesa uma tentativa inconsistente, as bicadas no disco
Sempre que os ambientes locais têm proprie­ distinguidos, principalmente, com base em se ha­
sejam objetos concretos, estar-à-direita-de não da direita são reforçadas. Sob condições como
dades diferentes, é vantajoso para um organis­ via estímulos disponíveis para o rato fora do la­
é, e ainda assim podemos discriminar entre esta essas, os pombos aprenderam a discriminar as
mo ser capaz de encontrar sua rota de um lugar birinto. Se havia, o rato podia orientar-se no com­
relação e estar-à-esquerda-de. Portanto, em alguns tentativas consistentes com uma taxa de rotação
para o outro. Um ambiente com um suprimento plexo mais amplo de estímulo, a sala em que o
experimentos de discriminação, as relações entre constante daquelas em que a taxa constante era
de alimento rico e estável é preferível a um em labirinto estava localizado; e assim ele aprendia
estímulos têm sido as dimensões de interesse. violada, mesmo que o estímulo em rotação esti­
que existe o mesmo alimento, mas ele está me­ os lugares. Se não, ele dominava apenas as vira­
vesse ausente por algum tempo; a discriminação
nos acessível; um ambiente com áreas seguras das específicas dentro do labirinto e aprendia res­
também se transferiu para novas localizações do
reaparecimento do mostrador do relógio. Esse para procriar e para cuidar da prole é preferível postas. Complexidades adicionais foram intro­
Seção B Cognição Animal desempenho não estava baseado em durações das a um que seja mais perigoso, e assim por diante. duzidas em outros experimentos em labirintos
tentativas ou em localizações específicas do mos­ (O argumento vale para a maioria dos grupos ani­ (cf. Olton, 1979). Por exemplo, demonstrou-se
O campo da cognição animal interessa-se por trador do relógio. Ele demonstra, assim, o ras- mais. Seria ir longe demais considerar as variá­ que um rato, às vezes, escolhe a rota mais curta
aquilo que os animais sabem. O campo aborda treamento visual na ausência do estímulo visual; veis fílogenéticas que operaram na evolução das disponível no labirinto, quando uma outra rota
esse problema identificando os eventos e as re­ tal rastreamento é chamado de representação (ou plantas, mas é apropriado notar que muitas plan­ preferida anteriormente é bloqueada ou que, às
lações que podem ser discriminados por dife­ imaginação) visual (imagery, cf. Capítulo 20). tas dispersam suas sementes; os animais estão fre­ vezes, ele segue atalhos apropriados, que acaba­
rentes espécies. Os estudos da cognição animal Coloquialmente, podemos dizer que o pombo qüentemente envolvidos nesta dispersão, por ram de ser acrescentados ao labirinto, mesmo que
têm examinado uma variedade de desempenhos sabia onde o estímulo estava, mesmo enquanto exemplo, quando as abelhas polinizam as flores). nunca tenha percorrido aqueles atalhos antes. Os
discriminativos e apresentam especial quando ele estava invisível (uma habilidade útil, quan­ Uma vez que algum tipo de orientação tenha resultados justificam falar de mapas cognitivos
envolvem discriminações de propriedades rela­ do, por exemplo, um inseto comestível passa por emergido, a seleção natural tende a acentuá-la (Tolman, 1948); a descoberta de que os organis­
cionais complexas do ambiente. Certos exem­ trás de uma obstrução, e o pássaro espera que ao longo do tempo filogenético (cf. Capítulo 3). mos podem localizar uma área mesmo quando
plos incluem o julgamento de simetria visual (p. ele surja do outro lado). Assim, não é de se surpreender que muitas espé­ se aproximam dela por uma nova direção de­
ex., Delius & Nowak, 1982); discriminação de Os estudos sobre cognição animal estão in­ cies animais encontrem prontamente sua dire­ monstra que eles podem aprender as relações es­
numerosidade (p. ex., Davis & Pérusse, 1988); teressados no que os organismos sabem, e as ex­ ção no mundo. Algumas de suas habilidades de paciais além das, ou talvez em vez de, trilhas
busca visual (Blough, 1989); controle discrimi­ plicações, geralmente, estão vinculadas à estru­ “navegação” são aprendidas, e outras são não- específicas.
nativo por contingências de reforço ou por estí­ tura dos estímulos relevantes (cf. Capítulo 1, aprendidas. Gallistel (1990) elaborou um trata­ Os problemas para determinar as caracterís­
mulos correlacionados com tais contingências sobre linguagem estrutural e funcional). Por mento detalhado que trata do forrageio em for­ ticas ambientais às quais os organismos prestam
(p. ex., Washburn, Hopkins, & Rumbaugh, exemplo, se um organismo discrimina entre cer­ migas, à localização pelo eco (ecolocação) em atenção, emergem em uma escala maior na ha­
1991); a organização do comportamento dentro tos estímulos com base em alguma característi­ morcegos e à escolha de rotas pelos chimpan­ bitação e na migração animal à medida que se
de uma seqüência discriminada sequencialmen­ ca crítica, um cognitivista pode dizer que o or­ zés, e que vai da orientação baseada em dimen­ deslocam de um lugar para outro. As vespas re­
te (Terrace & Chen, 1991); e o responder sob ganismo representa os estímulos para si mesmo sões simples do estímulo, como os gradientes de tomam a seus ninhos, as abelhas retomam a suas
controle de estímulo do próprio comportamen­ com base naquela característica (p. ex., no exem- odor ou luz, a variedades que são funcionalmen­ colméias, os salmões retomam a seus rios de ori­

A p r e n d iz a g e m 159 160 A. C harles C a t a n ia


tronco grosso, muitos galhos, e assim por diante (dei­ son, 1978; ver Glossário) e as classes de equi­
gem, e os pássaros retomam a ninhos sazonais. nação de propriedades que inclui necessariamen­ xando de lado o problema de elementos em comum
Entre as características ambientais que são im­ te um ponto de referência e um estímulo à es­ valência (que serão abordadas no próximo capítu­
subjacentes a termos como repleto de folhas, verti­
portantes podem estar os marcos geográficos, querda daquele ponto de referência.) cal, tronco grosso, etc). Além do mais, para ser re­
lo). De fato, a classe de classes de estímulo é, ela
como a localização e o movimento do sol e das Já comentamos que é difícil definir os e s tí­ conhecível como uma não-árvore, uma figura não própria, uma classe de estímulo probabilística, no
estrelas, a luz polarizada, os gradientes quími­ mulos discriminativos por dimensões físicas. Por tinha que deixar de conter elementos como a cor sentido de que sua definição muda à medida que
verde, aparência de madeira, ramificações, traçados expandimos os limites de pesquisa relevante.
cos e os campos magnéticos (p. ex., Tinbergen, exemplo, as propriedades que definem a letra A
verticais, e assim por diante. Também não pudemos
1972; Walcott, Gould, & Kirshvink, 1979). Em variam dependendo se ela é maiúscula ou mi­ identificar elementos em comum nos outros dois ex­
alguns casos, os organismos navegam isolada­ núscula ou se aparece em letra de forma ou ma­ perimentos. Se não existem elementos em comum,
mente para regiões que nunca visitaram antes; nuscrita. A capacidade de discriminar entre tais DEFINIÇÃO DE CLASSES DE ESTÍMULOS
então qual a base para o responder? Nenhuma outra
em outros eles o fazem em companhia de outros estímulos existe em animais, assim como em teoria é tão facilmente caracterizável, embora uma al­
ternativa se imponha, ainda que em termos amplos. O problema de definir as classes de estímu­
membros de suas espécies. Ambos os casos de­ humanos (p. ex., discriminações entre várias for­
Os pombos respondem a agrupamentos de traços los é generalizado. Ele não será resolvido por
vem envolver substanciais componentes filoge- mas da letra A e do dígito 2 foram estabelecidas mais ou menos isomórficos como os agrupamentos meio do apelo a procedimentos de mensuração
néticos, com relação a importantes propriedades em pombos: Morgan e col., 1976). Mas a difi­ a que nós mesmos respondemos. O verde deveria física, porque a leitura de instrumentos de medi­
do ambiente ou com relação a contingências que culdade de definir os estímulos com base em pro­ estar nas folhas, caso a cor verde ou as folhas este­
da também é um comportamento discriminativo.
levam à migração em gmpo (ou ambos). Em re­ priedades físicas mensuráveis não se limita a jam presentes. Contudo, nenhum deles é necessário
ou suficiente. As partes verticais ou as ramificações Como veremos no próximo capítulo, as classes de
lação a migrações de longas distâncias, as con­ classes arbitrárias estabelecidas por humanos, tais
de galhos deveriam ser as partes da madeira, embo­ comportamento dependem das contingências co­
tingências filogenéticas podem ter envolvido a como letras e números. Elas existem também com
ra nenhum desses traços seja necessário ou suficien­ muns que as estabeleceram, e não de suas proprie­
seleção daqueles capazes de manter a orienta­ objetos e eventos do cotidiano. O que distingue os te. O que vemos como árvores engloba uma lista dades físicas. Mesmo o comportamento do cien­
ção no curso de jornadas cada vez mais longas, à cachorros dos outros animais? Com base em que complexa de conjunções e disjunções probabilísticas,
tista depende de discriminações aprendidas no la­
medida que os continentes foram lentamente se se­ generalizamos entre chihuahuas e huskies, cha­ cuja descoberta requereria muito mais esforço do que
pareceria justificado por qualquer benefício possível. boratório. Como já vimos, as distinções entre re­
parando ao longo do tempo geológico (Skinner, mando-os de cachorros, enquanto discriminamos
(Hermstein, Loveland, & Cable, 1976, pp. 298-299) forço, punição, eliciação e outros processos com-
1975). Um tratamento mais detalhado desse fenô­ entre huskies e lobos, embora eles pareçam mais
portamentais são baseadas em tais discriminações.
meno está além do escopo deste livro, mas ele ilus­ semelhantes entre si que huskies e chihuahuasl
Os conceitos naturais são exemplos de classes Elas são o ponto de partida para nossa taxonomia.
tra que uma análise das propriedades do estímulo Pombos foram ensinados a discriminar entre
que determinam o comportamento é relevante tanto de estímulo probabilísticas, classes em que cada O controle de estímulos é um fundamento (um ele­
certas figuras que continham uma forma huma­
para a fílogenia quanto para a ontogenia. na e figuras que não continham tal forma (p. ex., membro contém algum subconjunto de caracterís­ mento básico) no que diz respeito a nosso próprio
Herrnstein & Loveland, 1975). Essas discrimi­ ticas, mas nenhum é comum a todos os membros. comportamento científico, tanto quanto no que
nações foram denominadas conceitos naturais. O número de características no subconjunto pode concerne ao comportamento dos organismos que
CONCEITOS NATURAIS E CLASSES Em um estudo (Herrnstein, Loveland, & Cable, variar de um membro da classe para outro. As ve­ estudamos. Assim, qualquer filosofia da ciência
DE ESTÍM ULOS PROBABILÍSTICAS 1976), diapositivos eram projetados em uma tela zes, estas classes denominadas conjuntos impreci­ efetiva deve levá-lo em consideração.
próxima ao disco de um pombo, e suas bicadas sos ou indefinidos (fuzzy sets) não têm limites bem Começamos este capítulo explorando os pa­
Podemos falar de conceitos como generali­ eram reforçadas na presença de algumas figu­ definidos, embora membros da classe possam ter ralelos entre diferenciação e indução, de um lado,
zação, dentro de uma classe de estímulos, e dis­ ras, mas não na presença de outras. Alguns pom­ semelhanças de famílias (Rosch, 1973). e discriminação e generalização, de outro. Os
criminação, entre classes de estímulos (Keller & bos aprenderam discriminações entre algumas fi­ Algumas classes de estímulo probabilísticas quatro processos são resultado do reforço dife­
Schoenfeld, 1950). Assim, nosso conceito de guras com e sem árvores; outros aprenderam a são definidas por referência a um protótipo. Um rencial; eles diferem, principalmente, se o refor­
vermelho deve envolver a generalização entre discriminar entre figuras com e sem água; ou­ protótipo é um membro típico de uma classe pro- ço diferencial é programado para as proprieda­
todos os estímulos a que chamamos de verme­ tros ainda aprenderam discriminações entre fi­ babilística; é derivado de uma média ponderada des de estímulo ou de resposta. Tratamos os as­
lho, e a discriminação entre esses estímulos e guras com e sem uma pessoa. Após treino com de todas as características de todos os membros pectos funcionais de controle de estímulo no
todos os outros a que não chamamos de verme­ um conjunto de figuras (p. ex., figuras com e sem da classe. Por exemplo, os pássaros constituem contexto de experimentos sobre a atenção, sobre
lho. Então, os conceitos estão para as classes de árvores), os pombos discriminaram entre figu­ uma classe de estímulo probabilística; a maioria os gradientes de controle de estímulo e sobre os
estímulos como os operantes estão para as clas­ ras da mesma classe de estímulos que não ha­ deles voa, mas os avestruzes e os pingüins não. procedimentos de esvanecimento. Ao lidar com
ses de respostas. (O responder com base em al­ viam sido apresentadas até então. As novas fi­ Na produção de um pássaro prototípico, as pe­ as propriedades discrimináveis do ambiente no
guma propriedade singular de estímul os é deno­ guras, às vezes, eram discriminadas mais preci­ nas devem ter um peso maior do que os pés, com contexto da cognição animal, consideramos de que
minado abstração, e a linguagem de conceitos, samente do que as empregadas no treino. As membranas interdigitais, porque os pássaros têm modo as características relacionais complexas do
às vezes, restringe-se ao responder baseado em implicações delineadas foram que: mais penas do que pés com membranas. Assim, ambiente poderiam definir as classes de estímulo.
alguma combinação de propriedades. Mas essas um tordo é mais prototípico do que um pato, Os mapas cognitivos e os conceitos naturais for­
são distinções ambíguas. Por exemplo, estar-à- ...não podemos começar a esboçar uma lista de ele­ porque o tordo partilha mais características com neceram os exemplos relevantes. No próximo ca­
mentos comuns. Para reconhecerem uma árvore, os pítulo, iremos explorar melhor as classes de estí­
esquerda-de pode ser tratado como uma propri­ outros pássaros do que o pato.
pombos não requeriam que ela fosse verde, repleta
edade relacional singular ou como uma combi­ de folhas, vertical, composta de madeira, tivesse Outros tipos de classes de estímulo incluem mulo complexas e verificar como elas são rele­
as classes de estímulo polimorfas (Lea & Harri- vantes para julgamentos humanos importantes.

A p r e n d iz a g e m 161 162 A . C harles C a t a n ia

You might also like