Professional Documents
Culture Documents
Texto Prova Cohecimentos Mestrado Ufpa
Texto Prova Cohecimentos Mestrado Ufpa
conversa, e assim por diante. Muitos exemplos letra grega d), ou S', para o estímulo negativo
prévios de reforço incluíram o controle discri (rigorosamente falando, S° seria mais apropria
minativo do responder. Ao discutir a aprendiza do, pois nada é removido em presença desse estí
gem dos ratos em labirinto, enfatizamos o au mulo, mas S' é o emprego mais comum).
Operantes Discriminados: Controle mento de escolhas de viradas corretas, mas o rato
que não discriminasse o local apropriado para
No procedimento da Figura 8.1, a luz e o es
curo altemavam-se irregularmente; quando a
de Estímulo virar à direita ou à esquerda poderia chocar-se
repetidamente contra as paredes, à medida que
lâmpada estava acesa, ela permanecia ligada por
períodos que variavam de 5 a 30 segundos. As
se locomovia pelo labirinto, e dificilmente iria pressões à barra eram reforçadas de acordo com
aprender o labirinto como um todo. um esquema de reforço de intervalo variável ou
De fato, é bem provável que não exista uma VI: em média, apenas uma pressão à barra a cada
classe operante sem estímulos discriminativos. 30 segundos era reforçada enquanto a luz estava
As bicadas de um pombo não podem ser emiti acesa. As características importantes desse esque
das na ausência de um disco, e as pressões à bar ma são que (1) ele mantém uma taxa de respostas
indo-europeu deuk- (conduzir), a duke (duque), ra por um rato não podem ser emitidas na ausên moderada e relativamente constante e (2) os tem
A. A Natureza dos Operantes Discriminados cia de uma barra. As características que perma pos variáveis entre os reforçadores sucessivos tor
adduction (adução), educate (educar) e conduct
Atentar para as Propriedades dos Estímulos
Aprendizagem de Lugar versus Aprendizagem de
(conduta). A palavra discrimination, do latim dis necem relativamente constantes ao longo de um nam o tempo a partir do último reforçador um pre-
apart (separado) mais crimen, judgm ent (julga experimento, como a própria câmara e os demais ditor não fidedigno de quando a próxima resposta
Resposta
mento), está relacionada, por meio do indo-eu
Gradientes de Controle de Estímulo
ropeu skeri- a cortar ou separar, a crime, descri
dispositivos que ela contém, às vezes, são refe será reforçada. Com essa programação, as mudan
Gradientes de Generalização ridos como estímulos contextuais. Em geral, es ças de estímulo e as apresentações do reforço va
be (descrever) e criterion (critério). E a palavra
Gradientes de Pós-Discriminação
generalization (generalização), do latim genere tamos mais interessados nos estímulos que mu riam assistematicamente ao longo do tempo, de
Gradientes de Inibição
(produzir ou causar), está relacionada, por meio dam dentro das sessões experimentais, mas te modo que se o rato pressiona mais na luz, do que
Esvanecimento (Fading): Controle de Estímulo por
do indo-europeu gen- to give birth or beget (ge
Aproximações Sucessivas mos que lembrar que o ambiente dentro do qual no escuro, podemos ficar confiantes de que o estí
rar ou partejar), a ingenious (engenhoso), kind
A Terminologia do Reforço Diferencial um pombo ou um rato responde existe em um mulo discriminativo funcional é a luz, e não a re
(tipo) e nat-ure (natureza).
contexto mais amplo, que inclui o biotério onde gularidade temporal daqueles outros eventos.
B. Cognição Animal
Mapas Cognitivos Estudamos o reforço com base nas dimen vive, as balanças em que é pesado e outras ca Ao longo das sessões, o pressionar aumen
Conceitos Naturais e Classes de Estímulo sões das respostas, mas o reforço diferencial tam racterísticas do laboratório fora da câmara expe tou durante a luz e diminuiu em sua ausência.
Probabilísticas bém pode ocorrer com base nas dimensões do rimental (cf. Donahoe & Palmer, 1994). Este aumento freqüentemente acompanha tais
Definição de Classes de Estímulos estímulo em cuja presença as respostas ocorrem. Os estímulos discriminativos correspondem discriminações (contraste comportamental: ver
Por exemplo, as pressões à barra por um rato em aos estímulos coloquialmente denominados de Capítulo 10). A Figura 8.1 também mostra algu
presença da luz são diferentes de suas pressões sinais ou pistas. Eles não eliciam respostas. Mais mas mudanças em um índice de discriminação,
As palavras latinas habere, to have (ter) e capere, no escuro, e o reforço pode ser programado para precisamente, eles estabelecem a ocasião em que o responder na presença da luz como porcenta
to take ou size (tomar ou captar) reportam-se a raízes pressões à barra na presença, mas não na ausên as respostas têm conseqüências, e diz-se que eles gem do total de respostas. O índice aumentou ao
indo-européias, intimamente ligadas. Habere é um cia de luz. Do mesmo modo, as bicadas de um ocasionam as respostas (cf. provisão: Gibson, longo das sessões. Outras maneiras equivalen
antecessor das palavras inglesas behavior (compor pombo no disco durante a luz verde são diferen 1979). Um exemplo do desenvolvimento de con tes de se descrever esse resultado seriam dizer
tamento), habit (hábito) e inhibit (inibir). Capere le
vou a concept (conceito) e perception (percepção),
tes das bicadas em presença da luz vermelha. trole de estímulos, o controle do responder por que pressionar a barra em presença da luz é um
palavras relevantes para classes de estímulo; assim, Quando o responder é reforçado apenas na pre um estímulo discriminativo, pode ser visto na operante discriminado ou que a luz funciona
essas palavras e behavior são parentes distantes. sença de alguns estímulos, dizemos que o refor Figura 8.1 (Herrick, Myers, & Korotkin, 1959). como um estímulo discriminativo para as pres
Não há elos óbvios entre differentiation (dife ço é correlacionado com aquele estímulo. Uma Os ratos pressionavam uma barra na presença e sões à barra, ou ainda que o pressionar a barra
renciação) e induction (indução), aplicadas a clas classe de resposta criada por este reforço dife
ses de resposta, e discrimination (discriminação) e na ausência de luz, programadas alternadamen está sob controle do estímulo da luz.
generalization (generalização), aplicadas a classes
rencial em relação às propriedades do estímulo te. Quando a luz estava acesa, as pressões à bar
de estímulo. A palavra differentiation (diferencia é chamada de operante discriminado. ra eram ocasionalmente reforçadas com alimen
ção), do latim dis- (separado, distante) mais ferre Os operantes discriminados são um traço di to. Quando a luz estava apagada, as pressões à
(carregar), está relacionada, por meio do indo-euro- fuso do comportamento. Ao dirigir um carro, Seção A A Natureza dos Operantes
çeubher- (carregar ou sustentar), abirth (nascimen barra não eram reforçadas. A notação para o es
avançamos por um cruzamento se o semáforo tímulo correlacionado ao reforço é SD, para o Discriminados
to), transfer (transferência), preference (preferência)
estiver verde, mas não se ele estiver vermelho.
e metaphor (metáfora), mas não &interfere (interfe estímulo discriminativo, ou S+, para o estímulo
rir). A palavra induction (indução), do latim in -(em) Ao falar com alguém, o que dizemos é afetado
positivo; a notação para o estímulo correlacio Podemos ilustrar algumas características dos
mais ducere (conduzir), está relacionada, através do pelo que a outra pessoa diz, por sua postura e
nado com o não reforço ou extinção é SA, tam operantes discriminados com um exemplo hipo-
146 A . C h a r l e s C a ta n ia
Suponhamos que continuemos o reforço di criminação e generalização quando nos referi
ferencial com respeito à localização do estímu mos aos efeitos análogos do reforço diferencial
lo, reforçando as respostas apenas quando ilu com respeito a propriedades do estímulo?
minamos as posições de 9 a 12. O responder au Um fator metodológico pode ser crucial para
menta gradualmente quando essas posições es essa distinção. Quando estudamos o reforço di
tão iluminadas e diminui quando outras posições ferencial com respeito a propriedades da respos
são iluminadas. Os efeitos são parecidos com ta, registramos as respostas em diferentes clas
aqueles da Figura 7.1 em C, D e E. Finalmente, ses, mas além de programar as contingências, não
a maior parte das respostas ocorre com as luzes há muito mais que possamos fazer a respeito
nas posições correlacionadas com o reforço, delas. Se vemos um rato prestes a introduzir seu
como em E, e mesmo que algumas respostas ain focinho na posição 7 da fenda, não podemos im
da ocorram com as luzes em outras posições, pedir que o rato emita aquela resposta naquele
pode-se alcançar um ponto em que a distribui momento, mesmo que ele tenha respondido
FIGURA 8.1 Pressões à barra por um rato ção de respostas não muda muito com a conti muito mais vezes naquela posição do que em
na presença e na ausência de luz. A luz (SD) nuação do reforço diferencial. qualquer outra. Suponhamos, porém, que esti
estava correlacionada ao reforço em inter Nesse exemplo, os estímulos que ocasiona véssemos trabalhando com propriedades do es
valo variável e sua ausência (SA), à extin ram o responder vieram a conformar-se estreita tímulo. Poderíamos escolher entre várias ordens
ção. O índice de discriminação é a porcen
mente com a classe de estímulos correlacionada e freqüências relativas possíveis para a apresen
tagem do total de respostas emitidas na pre
sença de luz (a taxa em SD dividida pela com o reforço. Esse processo é denominado dis tação das luzes. Por exemplo, em vez de apre
soma das taxas em SD e SA multiplicada por criminação e o responder sob tal controle de es sentar luzes com a mesma freqüência em certas
100). Os dados são a mediana das taxas de tímulo é denominado de comportamento discri posições, poderíamos apresentá-las em certas
oito ratos. (Herrick, Myers, & Korotkin, minado. O reforço diferencial estabeleceu uma posições, mas não em outras, de modo que o rato
1959, Figura 2)
classe de respostas definida pelos estímulos em jamais tivesse uma oportunidade de pressionar a
cuja presença elas ocorrem. E quanto às respos barra em presença de alguns estímulos. Essa é a
tas na presença de estímulos fora dos limites cor razão pela qual dizemos que, em procedimentos
relacionados com o reforço (p. ex., posições 6,7 de discriminação, os estímulos estabelecem a
tético comparável ao da Figura 7.1, no capítulo Neste ponto começamos a reforçar as pres e 8, ou 13, 14 e 15)? De acordo com uma inter ocasião para respostas: quando uma classe de
anterior. Novamente temos um rato em uma câ sões à barra apenas se a fenda estiver iluminada pretação estrita, elas não deveriam ser contadas respostas é definida pela presença de um estí
mara com uma fenda em uma parede, mas desta nas posições 9, 10, 11 ou 12; quando a luz apa como membros do operante discriminado; fala mulo, as respostas nesta classe não podem ocor
vez o rato não pode introduzir seu focinho na rece em qualquer outra posição, não reforçamos mos delas em termos de generalização. Mas o rer quando o estímulo está ausente.
fenda. A fenda está coberta com plástico trans as pressões. O efeito inicial do reforço é bastan reforço diferencial gerou respostas tanto dentro Mesmo essa distinção metodológica tem ex
lúcido, e uma série de 15 lâmpadas, por trás do te semelhante àquele em B, na Figura 7.1: o res quanto fora desses limites; assim, elas são parte ceções. Consideremos, por exemplo, o reforço
plástico, pode iluminar os segmentos sucessivos ponder aumenta ao longo de todas as posições. de uma distribuição contínua. diferencial de longos intervalos entre respostas
da fenda. Em outras palavras, as lâmpadas for Em outras palavras, o efeito do reforço não é A solução é a mesma que a do Capítulo 7. (o esquema DRL: Capítulo 7). Se as bicadas de
necem uma dimensão de estímulo cujos compo restrito apenas a estímulos em posições correla Devemos reconhecer duas classes de estímulos: um pombo forem reforçadas somente depois de,
nentes são análogos àqueles da dimensão de res cionadas ao reforço; ele se dispersa para outras uma é a classe correlacionada com uma contin pelo menos, 5 segundos sem bicar, o pombo pode
posta da Figura 7.1. Uma barra fica centralizada posições. A dispersão do efeito do reforço na gência de reforço; a outra é a classe em cuja pre começar a espaçar suas bicadas cerca de 5 se
logo abaixo da fenda e acima de um comedouro. presença de um estímulo para outros estímulos sença o responder ocorre. Não estamos interes gundos uma da outra. Discutimos esse compor
Agora acendemos as lâmpadas por trás da fen não-correlacionados com o reforço é denomina sados em qualquer das classes em si, mas sim na tamento com base na diferenciação de um ope
da, uma por vez, em ordem irregular e registra da generalização. Neste exemplo, reforçar o res correspondência entre elas. Essa discussão acom rante complexo, que consiste de uma pausa mais
mos as pressões à barra que ocorrem em presen ponder em presença de luzes nas posições 9 a 12 panha de perto o que discutimos sobre a diferen uma bicada. Poderíamos, igualmente, tratar a du
ça de cada lâmpada. Se não reforçarmos as pres afetou o responder em presença não apenas da ciação e a indução no Capítulo 7. Isso é apro ração da pausa como uma propriedade de estí
sões à barra, o responder será infreqüente e sem quelas luzes, mas também de luzes em todas as priado, pois podemos considerar um estímulo em mulo e argumentar que o comportamento deve
qualquer relação sistemática com a região da fen outras posições ao longo da fenda. Este exem cuja presença uma resposta ocorre como uma ria ser considerado como uma discriminação ba
da que estiver iluminada. De fato, os dados po plo difere essencialmente do anterior na dimen outra propriedade daquela resposta, como sua seada no tempo transcorrido desde a última bi
dem ser similares àqueles em A, na Figura 7.1, são correlacionada com o reforço: no Capítulo força, duração e topografia. Por que então, nos cada. De fato, neste caso, as terminologias são
com a diferença de que o eixo X agora represen 7, lidamos com uma dimensão de resposta, mas referimos aos efeitos do reforço diferencial com permutáveis. Quando falamos de diferenciação
ta a posição do estímulo, e não a posição da res agora estamos lidando com uma dimensão de respeito a propriedades da resposta em termos e indução ou de discriminação e generalização,
posta. estímulo. de diferenciação e indução, mas falamos de dis a operação subjacente em cada caso é o reforço
A p r e n d iz a g e m 149 150 A . C h a r l e s C a ta n ia
mais, as propriedades do ambiente às quais um então é variada, o responder pode depender de
zão, o experimento foi particularmente apropri partir da qual o rato se aproxima). Por exemplo,
organismo presta atenção podem variar com as quanto o estímulo mudou. Por exemplo, se du
ado para demonstrar algumas das propriedades suponhamos que o braço direito de um labirinto
limitações impostas pelo experimentador (cf. rante uma fase de treino as bicadas de um pom
da atenção. Mas, se nosso interesse principal em T aponte em direção à parede mais iluminada,
fosse a discriminação de forma pelo pombo, te a parede leste de um laboratório, onde ficam as Collier & Rovee-Collier, 1981; Lea, 1979). Por bo no disco forem reforçadas quando o disco
janelas. O rato poderia aprender a virar à direita, exemplo, quando um rato é exposto a sessões estiver iluminado por amarelo, o pombo geral
ríamos que tomar a cor irrelevante e correlacio
nar as mudanças no reforço somente com mu ou poderia aprender a correr em direção à janela. diárias em um aparato em que o alimento é colo mente bicará com taxas cada vez mais baixas à
danças na forma. Poderíamos testar essas alternativas, girando o la cado nas extremidades de cada um dos vários medida que a luz do disco mudar para o laranja,
birinto em T, de modo que o braço direito agora becos, e os becos não são reabastecidos durante depois para o vermelho e para o violeta, na fase
apontasse para o oeste, e o rato se aproximasse do a sessão, o rato aprende a não retomar aos becos de teste. Isso demonstra generalização: os efei
Aprendizagem de Lugar versus ponto de escolha a partir do norte. Se o rato vira à em que já comeu (Olton & Samuelson, 1976). tos do reforço na presença do amarelo estendem-
Aprendizagem de Resposta direita, e, portanto, na direção oposta à da janela, As propriedades espaciais do ambiente são par se para as outras cores.
ele demonstra aprendizagem de resposta. Se vira ticularmente importantes, mas, em circunstânci A Figura 8.3 apresenta dados sobre a gene
As questões precedentes estão relacionadas à esquerda, rumo à janela, exibe aprendizagem de as apropriadas, um rato pode aprender outras pro ralização de bicadas de pombos no disco, a tons
indiretamente a uma antiga controvérsia em Psi lugar, ele se desloca para o mesmo lugar, embora priedades do ambiente. de diferentes freqüências depois que as bicadas
cologia, sobre a aprendizagem de lugar versus a faça isso virando em uma direção diferente. A ques foram reforçadas apenas em presença de um tom
aprendizagem de resposta (p. ex., Restle, 1957). tão é se o rato aprende a virar à direita versus à de 1000 ciclos por segundo (Jenkins & Harri
A resposta de deslocar-se de um lugar para ou esquerda ou a virar a leste versus a oeste. GRADIENTES DE CONTROLE DE son, 1960). Em um procedimento (sem treino de
tro tem ocupado freqüentemente uma posição O desempenho do rato depende, em grande ESTÍM ULO discriminação), o tom estava sempre presente, e
privilegiada em análises comportamentais (p. ex., parte, dos estímulos disponíveis tanto dentro as bicadas eram reforçadas segundo um esque
Olton, 1979). Ir em busca de alimento não é o quanto fora do labirinto. O labirinto típico cos Os procedimentos de discriminação colocam ma de intervalo variável ou VI. Em um segundo
mesmo que produzir alimento permanecendo no tumava ser coberto por uma tela de arame ou uma pesada responsabilidade sobre o experimen procedimento (treino de presença versus ausên
mesmo lugar. Uma diferença importante entre por alguma outra cobertura que permitisse ao tador. Em um procedimento de diferenciação, o cia), o tom estava presente em algumas vezes e
os dois casos é que o ambiente muda mais dras experimentador observar o que o rato estava fa organismo determina a ordem das respostas, mas ausente em outras, e as bicadas eram reforçadas
ticamente quando nos deslocamos para um novo zendo. Se o experimentador podia olhar para em um procedimento de discriminação o expe de acordo com o esquema de VI apenas durante
lugar do que quando introduzimos um novo es dentro do labirinto, o rato também podia olhar rimentador deve decidir-a ordem em que os estí o tom. Após o treino, o reforço foi interrompido,
tímulo no lugar onde estamos. Os humanos em para fora. Embora ratos sejam míopes, o rato mulos são apresentados. Um experimentador que e tons de outras freqüências foram apresentados
particular têm encontrado algumas maneiras de comum pode discriminar a direção geral de lu esteja interessado em algum contínuo de estímulo pela primeira vez, intercalados com a ausência
substituir a locomoção comum por outras res zes e outros aspectos genéricos de um ambiente. (isto é, alguma dimensão ao longo da qual os de tom e com a apresentação do tom original.
postas: para irmos a diferentes lugares pisamos Enquanto houver estímulos disponíveis do lado estímulos podem variar, como a intensidade ou Durante essa fase, cada estímulo era apresenta
em aceleradores, giramos volantes, apertamos bo de fora do labirinto, eles podem tornar-se a base posição de uma luz) deve preocupar-se com do 8 vezes, em ordem mista.
tões de elevadores e subimos em escadas ou estei a partir da qual o rato vira em uma direção parti quantos estímulos apresentar, por quanto tempo Para os três pombos sem treino prévio de dis
ras rolantes. Além disso, o movimento produz mu cular. Mas se esses estímulos são eliminados co e em que ordem e de que forma os estímulos de criminação (Figura 8.3, acima), nem a freqüên
danças contínuas no ambiente, enquanto as seqüên locando-se uma cobertura opaca sobre o labirin veriam ser correlacionados com o reforço e com cia do tom, nem sua presença ou sua ausência
cias de outras respostas podem não produzir qual to, a orientação espacial do labirinto em relação o não-reforço, para mencionar algumas das pos tiveram qualquer efeito substancial sobre o bi
quer mudança até que a seqüência esteja comple à sala toma-se irrelevante, e o rato não pode mos sibilidades mais importantes. A pesquisa sobre car. O gradiente de generalização foi relativa
ta. Além dessas diferenças, então, será que impor trar outra coisa que não a aprendizagem de res gradientes de controle de estímulo busca os efei mente achatado ou, em outras palavras, o efeito
ta se um organismo se desloca até um novo lugar posta. A aprendizagem de lugar ou a aprendiza tos de algumas dessas variáveis. Esses procedi do reforço na presença do tom original esten
ou se produz estímulos novos onde está? gem de resposta dependem, portanto, de como o mentos geralmente envolvem uma fase de trei deu-se uniformemente a todos os outros estímu
Questões desse tipo estavam implícitas na experiementador prepara o problema para o rato. no, durante a qual é programada alguma corre los. Podemos dizer que esses pombos não esta
controvérsia sobre a aprendizagem de lugar ver Ao escolher criteriosamente as condições, um ex lação entre os estímulos e as respostas reforça vam atentando para o tom, porque as mudanças
sus a aprendizagem de resposta. Podemos dife perimentador pode tomar qualquer um dos re das, seguida por uma fase de teste, durante a qual na freqüência do estímulo não fizeram qualquer
renciar as viradas de um rato à direita, no ponto sultados mais provável do que o outro. o reforço é suspenso, enquanto os estímulos no diferença para eles.
de escolha de um labirinto em T, ao reforçar vi Em ambientes naturais, o alimento em um vos e velhos são apresentados. Para os cinco pombos que receberam treino
radas à direita, mas não à esquerda. Podemos en dado local não é necessariamente reabastecido prévio de discriminação (Figura 8.3, abaixo), a
tão perguntar se o responder do rato está basea como no compartimento-alvo de um labirinto de freqüência original produziu taxas de respostas
do em dimensões da resposta (movimentos à di laboratório. Ao forragear, um animal pode tor Gradientes de Generalização mais altas do que qualquer outra freqüência du
reita e não à esquerda) ou em dimensões de estí nar-se mais propenso a deslocar-se para um novo rante a fase de teste; em geral, quanto mais pró
mulo (movimentos em direção a um local parti local do que a retornar a um local onde já consu Se uma resposta é reforçada durante um estí xima uma freqüência estivesse da freqüência
cular, sem levar em consideração a direção a miu o alimento que estava disponível. Uma vez mulo, e alguma propriedade daquele estímulo original, maior era a taxa de respostas nessa nova