Professional Documents
Culture Documents
66370
66370
למידה
שיעור מס' 1
29.10.03
למידה
נקודה חשובה היא ההפרדה בין למידה לביצוע .כיום אין לנו דרך ישירה לבדוק האם
הייתה למידה ,שכן הדרך היחידה שלנו היא התבוננות בהתנהגות של האורגניזם,
:שזה מעט בעייתי ,מכיוון ש
א .אם היה שינוי בהתנהגות של האורגניזם ,זה לאו דווקא מעיד על למידה )למשל
אורגניזם שרץ פעם אחר פעם מקצה לקצה של חדר ,מודדים לו זמן ,ועם הזמן -משך
הזמן עולה ,ולא בגלל שהוא למד משהו ,אלא בגלל שהוא פשוט התעייף( .על כן
הנטייה תהיה לחפש שינויים מתמשכים יותר .גם שינויים מתמשכים הם בגבולות
.שאינם מדויקים ,יש להכיר את הבעייתיות
.ב .אם לא היה שינוי בהתנהגות ,זה לאו דווקא מעיד על כך שלא הייתה למידה
הגדרה :למידה היא שינוי מתמשך בפוטנציאל או במנגנוני ההתנהגות בסיטואציה
מסוימת שנגרם בעקבות התנסות חוזרת בסיטואציה זו ,בתנאי שאי אפשר להסביר
את השינוי בהתנהגות על ידי נטיות ההתנהגות המולדות של האורגניזם ,או התבגרות,
).הבשלה ,או מצב זמני )כמו עייפות
הסבר של ההגדרה :נטיות מולדות -יש התנהגויות מולדות )רפלקסים
ואינסטינקטים( .אלו הם אינם תוצאה של למידה ,ואם הם נעלמים ,זה לא כתוצאה
מלמידה ,אלא מהבשלה של המערכת )פעולת היניקה( .עם זאת בפעולות אלו יש גם
משהו נלמד -כמו ציפורי שיר שנולדים עם היכולת לשיר ,אך היא מושפעת מהלמידה
שלהם מהסביבה עם הזמן .רב התכונות האלו אם כן הן שילוב של הבשלה והתנסות
גם יחד .מצבים זמניים הם לדוגמא מצב העייפות .הביטואציה היא דוגמא נוספת
שאיננה למידה ,ומדובר בירידה בעוצמה של התגובה שלנו .למשל ,אם דלת נטרקת,
ואנחנו נבהלים ,ואחר-כך היא נטרקת שוב ,אנחנו ניבהל פחות .מדוע היא איננה
למידה? מכיוון שהיא איננה מתמשכת )אם מחר זה יקרה ,שוב ניבהל( .סנסיטיזציה
.היא המצב ההפוך ,בו התגובות דווקא מתגברות עם הזמן
:תחום המחקר של התנהגות רפלקסיבית ואינסטינקטיבית
Elicited Behavior
יש לנו גירוי מעורר ,ויש לנו תגובה שנוצרת בתגובה לגירוי .בדרך-כלל ברפלקסים
התגובה מופיעה תמיד כשהגירוי קיים ,ולא מופיעה כשהוא לא קיים) .תמיד נתעטש
כשיש גירוי באף ,וכמעט אף פעם לא אם אין גירוי באף( .מדובר במנגנונים עצביים
מאוד נמוכים ,קשרים מאוד ישירים בין הנוירונים הסנסוריים למוטוריים .עדיין ,גם
הרפלקסים יכולים להיות מושפעים ממנגנונים גבוהים )למשל עם מישהו נוגע לי
בכתף ,ואני עושה משהו ממש ממש חשוב ,אני לא אגיב ישירות באותה עוצמה שאני
).אגיב בכל מצב אחר
אינסטינקט -התנהגויות שאופייניות למין )סוג בעל החיים( ,לעומת רפלקס -שהן
התנהגויות מורכבות יותר ,דפוס שלם של התנהגות )התנהגות מינית ,הגנה על
טריטוריה ,צייד בעלי חיים ,וכו'( .לעיתים קרובות ההתנהגויות האלו מופיעות רק
כשקיים מכלול של תנאים מעבר לגירוי הספציפי ,יש צורך בקונטקסט מסוים מלבד
.הופעתו של הגירוי
התנהגות אינסטינקטיבית היא בעיקר תוצאה של גנטיקה ,בעיקר משהו מולד ,אבל
גם מושפעת מלמידה )כמו דוגמת ציפורי השיר ,או ברווזונים שפוקעים מביצה ,שיש
להם נטייה מולדת ללכת תמיד אחרי האדם הראשון שיראו( .להתנהגויות רפלקסיביות
ואינסטינקטיביות יש בדרך-כלל איזושהי תוצאה )עיטוש לשם הוצאת הדבר שמפריע
לי בתוך האף( .יש הרבה התנהגויות אינסטינקטיביות שלא נעשות בהכרח בהקשר
לתוצאה -למשל תוצאה שאחרי שהוא מחרבן ,הוא עושה פעולה כלשהי עם הרגליים
הקדמיות ,שלפעמים באמת מצליחה לכסות עליו ,אבל לפעמים ממש לא .זה לא
שהוא בודק אחר כך שבאמת הוא כיסה ,ולפעמים הוא סתם עושה את זה על הרצפה
בלי שום תועלת לפעולה ,והוא ממשיך לעשות את זה על אף שהפעולה הזו לא
מובילה בסופו של דבר לתוצאות יעילות כלשהן .אין ספק שההתנהגויות האלו מאוד
מועילות ,אם כי הסיבה של ההתנהגות היא הגירוי הראשון ולא התוצאה שלה!! הרבה
מאוד מההתנהגויות שלנו ,הסיבה להן היא לא התוצאה ,אלא גירוי כלשהו שמביא
להן .מדובר גם בהתנהגויות אינסטינקטיביות ,וגם בהרבה מאוד התנהגויות רגילות.
בדרך-כלל הן באמת מועילות בסופו של דבר ,אך היעילות הזו היא לא הסיבה
.להתנהגות
סוג אחר של התנהגויות אינסטינקטיביות הוא התנהגויות שממשיכות כל עוד הגירוי
ממשיך ,ומפסיקות ברגע שהוא נעלם .היעדר הגירוי מפסיק את ההתנהגות .ישנן
תולעים שנעות כל זמן שהמקום רטוב ,למשל .ברגע שיגיעו למקום יבש ,הן יפסיקו
לנוע .זה בדיוק כמו הסיבה שאין חול על הכביש -כל עוד החול על הכביש ,הוא עף,
והוא מפסיק לעוף רק כשהוא יורד מהכביש ,כשהוא מגיע לצד הדרך .לחול אין רצון,
כפי שלתולעים אין כוונה בהתנהגות זו .השורה התחתונה היא שיש תועלת בהתנהגות
של התולעים )אחרת הן לא היו מתנהגות כך( ,רק שהן לא נעשות מתוך יעילות ,אלא
בתגובה לגירוי )לזוז כל זמן שרטוב מסביבי( .ההתנהגויות ,אם כן ,יכולות להיות מאוד
.מורכבות ,להיראות כפי שיש להן מטרה ,אך בעצם יש להם תועלת ולא מטרה
למידה
שיעור מס' 2
05.11.03
התניה קלאסית
צליל <-מזון
CS <- US
)רפלקס בלתי מותנה )מזון <-ריור
UR <- US
)רפלקס מותנה )צליל –< ריור
CR <- CS
חיזוק -כל דבר שמעלה את הסבירות שתגובה מותנית תתרחש לאחר הצגה של גירוי
.מותנה
)(=Reinforcement
למשל -הקישור בין אירועים חיוביים למקומות שבהם הם התרחשו ,או לחלופין
אירועים שליליים למקומות שבהם התרחשו .אם קרה לי משהו נעים במקום מסוים,
בפעם הבאה ,מכיוון שהוא מתקשר לי לגירוי חיובי ,יהיה לי חשק ללכת לשם שוב.
.וההיפך קורה אם התרחש שם אירוע שלילי בפעם האחרונה שהייתי שם
מכיוון שהתגובה שלנו לדברים מאוד משפיעה על ההתנהגות שלנו ,להיות מודעים
.לסיבות שבגללן אנחנו פועלים באופן מסוים ,זה מאוד יעיל בשינוי ההתנהגות
התופעות הבסיסיות של התניה קלאסית
רכישה -הצגה חוזרת של הגירוי המותנה והגירוי הבלתי מותנה .חזרה זו מביאה
.בהדרגה לכך שהגירוי המותנה יחל לעורר את התגובה המותנית
)(=Acquisition
התגובה המותנית ,בכל מקרה ,היא תמיד חלשה יותר מהתגובה הבלתי מותנית :גם
במובן של כמות )כמה טיפות הכלב מרייר( ,וגם במובן של סבירות )הכלב ירייר לבטח
למראה או לריחו של אוכל ,אך לא ירייר באותה הסבירות לצליל המותנה ,הגירוי
).המותנה
התניית עפעף -צריך לבצע צימוד של מאות פעמים על מנת שההתניה תצליח.
משמיעים צליל )הגירוי המותנה( ,ואחריו שוק חשמלי לעין )גירוי בלתי מותנה(,
והתגובה הבלתי מותנית היא סגירת העפעף .לאחר מספר רב יחסית של פעמים,
החיה סוגרת את העפעף רק למשמע הצליל בלבד ,ללא השוק החשמלי לעין )תגובה
מותנית( .עם זאת עשויה להיות פה גם התניה רגשית ,מכיוון ששוק חשמלי לעין אינו
חוויה חיובית .התחושה הרעה שמתקבלת לאחר הצליל ,היא תגובה בלתי מותנית
שמתפתחת במהירות רבה יותר מהגירוי המוטורי )אחר פעם או פעמיים ,בניגוד למאות
).פעמים שדרושות לתגובה המוטורית
לעיתים אנחנו מודדים את התגובה באופן עקיף ,מה שקורה לעיתים בתגובות רגשיות.
בניסוי הקודם ,איך מדדו שהחיה החלה לפחד מהצליל עוד לפני שהתגובה המוטורית
.של סגירת העין החלה להיצמד גם היא לצליל? על ידי מדידה עקיפה
:מדידה עקיפה -דוגמא לכך היא
Conditioned Suppression
לדוגמא ,לוקחים חולדות שכבר יודעות למשל ללחוץ על דוושה בשביל לקבל מזון
)התניה קלאסית שכבר למדו אותה בניסוי קודם( ,ואחרי שהחולדה המלומדת הזו
לוחצת על הדוושה ,משמיעים לה צליל למשך עשר שניות )והפעם כבר לא נותנים לה
.מזון( .היא מפסיקה ללחוץ על הדוושה .התרחש דיכוי של התגובה המותנית
:במקרה זה אנחנו מסתכלים על שני ערכים מדידים
.מספר הלחיצות על הדוושה בעשר השניות שלפני השמעת הצליל 1.
).מספר הלחיצות על הדוושה בזמן הצליל )עשר שניות 2.
:אנחנו מגדירים יחס דיכוי ,שנקרא
)Suppression Ratio= B/(A+B
לפי היחס הזה שהגדרנו ,אם החולדה מאוד תפחד מהצליל ,הרי שהיא תפסיק
לחלוטין ללחוץ על הדוושה ,ואז היחס הזה יהיה שווה לאפס ,ואם החולדה לא תפסיק
ללחוץ על הדוושה בכלל מכיוון שהיא לא חוששת מהצליל ,הרי שהיחס הזה יהיה
.שווה לחצי .מכאן שהערכים שהמשתנה הזה יכול לקבל נעים בין אפס לחצי
אופציה נוספת היא ניסוי אחר ,בו נלמד חולדה ללחוץ על דוושה בכדי למנוע שוק
)הימנעות( .במקרה זה ,כאשר נשמיע לה צליל ,היא תלחץ על הדוושה לעיתים עוד
יותר קרובות מאשר היא לחצה לפני השמעת הצליל .מכאן שבמקרה זה ,התגובה של
החולדה הפוכה לניסוי הקודם -במקום להפסיק ללחוץ על הדוושה ,היא מגבירה את
.קצב הלחיצות
:דוגמא נוספת למדידה עקיפה תהיה
Conditioned Taste Aversion
התופעה הזו היא תופעה שבה בעל חיים נחשף לגירוי של מזון )בעל טעם וריח
מסוימים( ,בעקבות החשיפה הזו הוא מרגיש לא טוב ,ואז הוא מפתח הירתעות
).אברסיה( לאותו סוג המזון שהוא אכל
ההתניה הזו של האברסיה היא אחת ההתניות היחידות שיכולה להצליח גם אם מספר
שעות לא מצומצם עבר בין פעולת האכילה להתפתחות התחושה הלא טובה בקרב
החיה )בהתניה קלאסית רגילה ,למשל זו של הריור ,הצליל והאוכל ,זה לא היה עובד
).אם היינו משתמשים ברווחי זמן של מספר שעות בין האוכל לצליל ,למשל
Disinhibition
עוצמת
CR
החלמה
ספונטאנית
רכישה הכחדה
צעדים
הכחדה -תמיד מתבצעת אחרי הרכישה .כשאנחנו עושים הכחדה ,אנחנו מציגים את
.הגירוי המותנה ללא הגירוי הבלתי מותנה ,והתגובה תרד בהדרגה
החלמה ספונטאנית -זו התופעה שבה התגובה התאוששה ,לאחר שסיימתי את אימון
ההכחדה ביום הקודם .למשל אם ביום מסוים אימנתי את החיה בהכחדה והיא
הפסיקה לרייר ,הרי שיום אחרי זה ,מבלי ללמד אותה שום דבר מההתחלה ,היא שוב
תרייר מעט כשהיא תשמע את הצליל .לא באותה העוצמה שהייתה מריירת פעם ,אבל
.עדיין תרייר מעט
מדוע התגובה נעלמת? פבלוב חשב שהחיה מעכבת את התגובה שלה .הוא היה בטוח
שהחיה לא שוכחת את התגובה )ההוכחה לכך היא בהחלמה הספונטאנית( ,אלא
מעכבת אותה ,מכיוון שהיא לומדת שאחרי הגירוי המותנה לא יגיע יותר הגירוי הבלתי
מותנה .אם בזמן שהחיה מכחידה את התגובה ,אנחנו חושפים אותה לגירוי אחר )לא
אותו הגירוי הבלתי מותנה שהצגנו קודם( ,הרי שפתאום התגובה המותנית שוב
:תתעורר מעט ,וזו תופעה שנקראת
Disinhibition
בהכחדה עדיף להשתמש באימון רצוף ,ולא בצעדים מרווחים כמו שיעיל יותר לבצע
.ברכישה
Externalבזמן הלמידה ,יש גירוי חיצוני ניטראלי שמעכב את הלמידה )תגובת ראי -
Inhibition
).לדיסאינהיביטציה() .תהליך שמתרחש ברכישה
-הכללה והבחנה
Discrimination and Generalization
הכללה היא מצב שבו הגירוי מעורר תגובה ,למרות שהוא בעצמו לא עבר מעולם את
הצימוד עם הגירוי הבלתי מותנה הרלוונטי -נגיעה בכתף של הכלב עוררה ריור,
למרות שמעולם לא נערך צימוד בין הנגיעה בכתף והאוכל! )וכמה שהנגיעה תהיה
רחוקה יותר מהזנב ,שבו נערך הצימוד המקורי למשל ,עוצמת התגובה תפחת(.
המרחק הזה יכול להיות מרחק פיסי ,או שאם מדובר בצליל -הטונים של הצליל
יכולים להשתנות ,וכל שהשינוי גדול יותר ,כך התגובה תהיה חלשה יותר .כמה
שהגירוי החדש קרוב ודומה יותר לגירוי המותנה הישן ,הרי שהתגובה שתתקבל תהיה
.חזקה יותר
היכולת הזו לעשות הכללה ממצב אחד למצב שהוא דומה לו ,היא יכולת חשובה ,שכן
.בחיים אנחנו לא תמיד מקבלים גירויים שהם שווים אחד לשני בדיוק בכל המובנים
עוצמת
CR
CS
הבחנה היא מצב שבו אנחנו מבחינים בין הגירוי המותנה לבין גירוי אחר שניתן,
וההבחנה הזו בין הגירויים היא קריטית ,שכן לא כל הגירויים יעוררו את התגובה.
הדרך לכך שתהיה למידת הבחנה בקרב החיה היא להציג את הגירוי האחד עם הגירוי
.הבלתי המותנה ,והגירוי השני להציג ללא הגירוי הבלתי מותנה
.CS+יהיה הגירוי אשר מוצג בלוויית הגירוי הבלתי מותנה -
.CS-יהיה הגירוי אשר מוצג ללא הגירוי הבלתי מותנה -
.ככל שההבדל בין שני הגירויים האלו גדול יותר ,כך יהיה קל יותר ללמוד
אם נאמן כלב שכאשר נוגעים לו בזנב ,הוא מקבל אוכל ,כך שנגיעה בזנב בסופו של
דבר מעוררת ריור ,ואנחנו רוצים שנגיעה בכתף לא תביא לריור ,הרי שאחרי נגיעה
בזנב נגיש לכלב אוכל ,ואחרי נגיעה בכתף -לא נגיש לו אוכל .בסופו של דבר הוא
ילמד את ההבחנה בין שני הגירויים ,ואחרי הגירוי המותנה של נגיעה בזנב הוא באמת
ירייר ,ואחרי הגירוי של נגיעה בכתף ,הוא לא ירייר .בעצם למידה רגילה גם היא
למידת הבחנה ,מכיוון שבנוסף לנגיעה בזנב ,למשל ,קורים הרבה דברים סביב
הכלב -אנשים נכנסים ,אנשים מדברים ,צלילים שונים מושמעים ,ואילו הוא צריך
להבחין שרק אחרי הנגיעה בזנב הוא זה שאחריו צריך לרייר ,כי הוא זה שבאופן עקבי
.אחריו מגיע האוכל
הגירוי המותנה מורכב מגירוי כלשהו והקונטקסט שלו .הכלב אמור להבחין בין הגירוי
לבין הקונטקט ,כך שבסופו של דבר אם הקונטקסט יגיע ללא הגירוי -הוא לא יעורר
.תגובה מותנית
למידה
שיעור מס' 3
12.11.03
סוגי התניות
חלוקה של ההתניות על פי המשמעות המוטיבציונית של הגירוי הבלתי 1.
.מותנה
פבלוב הבחין בין שני סוגים של רפלקסים :רפלקסים של הזנה ורפלקסים של הגנה.
כשהוא רצה לחקור רפלקסים של הזנה הוא השתמש במזון ,וכשהוא רצה לחקור
רפלקסים של הגנה הוא השתמש בחומצה חלשה לפה )למשל -מיץ לימון( .בשני
.המקרים התגובה היא ריור ,כלומר -ההבדל בין המקרים הוא לא בתגובה עצמה
ההבחנה שאנחנו עושים היום היא בין גירויים אפטיטיביים )מזון ,מין ,גירויים
).נעימים ( ואברסיביים )גירויים לא נעימים -שוק חשמלי למשל
תורנדייק טען שגירויים אפטיטיביים הם גירויים שהחיה תעבוד על מנת לקבל אותם או
לא תעשה דבר על מנת למנוע אותם .גירויים אברסיביים לטענתו הם גירויים שהחיה
תנסה למנוע אותם או תברח מהם .זאת הגדרה אופרציונאלית שמנחה אותנו כיצד
לבדוק האם גירוי הוא אברסיבי או אפטיטיבי .גירויים אפטיטיביים מעוררים התקרבות,
.ואילו גירויים אברסיביים מעוררים התרחקות
ב .התניה אינהיביטורית -קשר שלילי בין השניים :תמיד כאשר מופיע הגירוי המותנה
.לא יופיע הגירוי הבלתי מותנה ,וההיפך
פבלוב חקר את ההתניה הזו :הוא הצמיד צליל עם מזון ,וכאשר הצליל הופיע עם אור,
:הרי שלא הגיע מזון
צליל )בלבד( <-אוכל
צליל +אור <-לא אוכל
הצעדים האלו הגיעו מעורבבים ,ללא סדר מסוים ביניהם .הצליל מביא כמובן לריור,
.האור לבד לא מביא לשום תגובה אקטיבית ,צליל ואור ביחד לא מביאים לריור
פבלוב רצה לבדוק האם בכל זאת לאור יש איזושהי השפעה ,ואולי הוא מעכב ריור
)הוא בעצמו ללא ההצמדה לצליל( .הוא לקח גירוי בלתי מותנה אחר )מגע בזנב(
והצמיד אותו למזון ,כך שהמגע בזנב הביא בסופו של דבר גם הוא לריור .אחר-כך
.הוא בדק מה קורה כשמציגים את המגע בזנב עם האור -אין ריור
מגע בזנב <-אוכל
מגע בזנב <-ריור
מגע בזנב +אור <-אין ריור
מהתוצאה של הניסוי הזה אפשר כבר לומר שהאור מעכב ריור .למבחן הזה אנחנו
:קוראים
Summation Test
מכיוון שאנחנו בודקים את הסכום של שתי התגובות )מסכמים שתי תגובות ורואים מה
יוצא -לוקחים גירוי שראינו שהוא מעורר ריור ,ולוקחים גירוי שאנחנו חושבים שהוא
מעכב ריור ,וכשיוצא "אפס" ריור ,אנחנו יודעים שלגירוי השני ,במקרה שלנו -לאור,
).יש השפעה שלילית על הריור
באופן כללי אנחנו נגיד שהייתה התניה אינהיביטורית כאשר השינוי בהתנהגות של
הנבדק כתוצאה מההתניה האינהיביטורית הוא הפוך מזה שנראה בהתניה
.אקסיטטורית עם אותו הגירוי הבלתי מותנה
למשל ,אם אנחנו לוקחים יונים ,ואנחנו מסדרים מצב שבו יש איזשהו חלון שמואר
לזמן מה ,ואחר כך לא מואר ,וגם מפעם לפעם הם מקבלות אוכל ,אבל אף פעם
האוכל לא מגיע כאשר החלון מואר ,הרי שזו התניה אינהיביטורית -בהדרגה ,כל פעם
שהחלון מואר ,היונים יתרחקו ממנו .אם היינו עושים הפוך ,וכל פעם שהחלון מואר
היינו מביאים להן אוכל ,הרי שהתגובה שלהן הייתה הפוכה -הן היו מתקרבות לחלון
כשהוא היה מואר .אם כן התגובה של היונים היא הפוכה בשני המקרים האלו ,כפי
.שסיכמנו לעיל ,ועל כן ניתן לומר שהייתה התניה אינהיבטורית
אם כן מתרחקים לא רק מגירויים אברסיביים ,אלא גם מגירויים אינהביטוריים
לאפטיטיביים .כלומר -אם אני מצפה לקבל משהו ,וגירוי מסוים מבהיר לי שאני לא
הולכת לקבל את הדבר החיובי והנעים הזה ,הרי שהגירוי הזה הופך להיות גירוי
.אברסיבי
פבלוב תיאר עוד תנאי שגירוי צריך לעמוד בו על מנת שהוא יהיה אינהיביטורי -התניה
:אינהיביטורית מעכב התניה אקסיטטורית עם אותו הגירוי .למשל
)עשינו התניה אינהיביטורית לאור )אור מסמל שלא יגיע מזון
אם ננסה עכשיו ללמד את החיה שאור מביא מזון ,זה יהיה קשה יותר מאשר ללמד
חיה שלא למדה קודם את ההתניה האינהיביטורית הראשונה .האור היה אברסיבי
אחר ההתניה הראשונה ,ואחר כך אנחנו רוצים להפוך אותו לאפטיטיבי ,תהליך קשה
.וארוך יותר מאשר להפוך אור לאפטיטיבי ממצב ניטראלי
המבחן הזה ,לבדוק אם ההתניה אינהיביטורית על ידי העיכוב של ההתניה
:האקסיטטורית ,נקרא
Retardation Test
ההתניה האינהיביטורית ,עם זאת ,תעזור מאוד אם אני ארצה לעשות התניה
:אקסיטטורית מהמשפחה השנייה ,למשל
אם עשיתי התניה אינהיביטורית לאור ומזון ,הרי שאחר-כך אם ארצה לעשות התניה
בין האור והשוק )האור נשאר אברסיבי!( ,הרי שזה יהיה קל יותר לבצע את ההתניה
השנייה בקרב חיה אשר עשינו לה את ההתניה הראשונה ,מאשר בקרב חיה אשר לא
עשינו לה את ההתניה הראשונה .מכיוון שהאור נותר אברסיבי ,התניה אחת דוחפת
.ומחזקת את השנייה
.אם כן גירוי צריך לעבור שני מבחנים על מנת שנדע שהוא אינהיביטורי
Counter Conditions
גירוי מותנה ניתן להיות מקושר לשתי המערכות -האברסיבית והאפפטיבית ביחד
)הדוגמא הטובה ביותר לכך היא -בעל אוהב ומכה -כך כשהאישה רואה את בעלה,
הוא מעורר בה גם תחושות נעימות וגם תחושות לא נעימות( .עם זאת ,גירוי שמקושר
לשני הצדדים ,יהיה כמובן פחות מעורר מאשר גירוי שנקשר לאחת מן המערכות-
למשל ,גירוי אפפטיבי בלבד יעורר תחושות אפפטיביות חזקות יותר מאשר גירוי
שמקושר לשתי המערכות .אם כן ,זה מפחית מההפעלה של כל אחת מן המערכות
לחוד -אין תחושות חזקות באחת מן המערכות כמו שהיו אם הגירוי לא היה מקושר
.לשתיהן
?איך מקשרים גירויים לשתי המערכות
שלב -1מקשרים את הגירוי המותנה עם מזון
שלב -2מקשרים את הגירוי המותנה עם שוק
.בסופם של שני השלבים יהיה הגירוי המותנה מקושר עם שתי המערכות
יש דמיון בין המצב המוטיבציוני שמופעל על ידי השמטה של משהו חיובי ,לבין קבלה
של משהו שלילי .איך בוחנים את הטענה הזו? על ידי שני ניסויים ,ששניהם נערכו על
-כלב במצב של
Sidman Avoidance
כל פרק זמן מסוים ניתן שוק ,אך הכלב יכול למנוע את השוק על ידי מעבר מצד אחד(
של הקופסא לצד השני ,וכך נוצר מצב שהכלב כל הזמן עובר מצידה האחד של
...).הקופסא לצד השני
:הניסוי הראשון :על הרקע הקודם ניתנים לכלב כל מיני גירויים 1.
גירוי מותנה אקסיטטורי לשוק ,גירוי מותנה אינהיביטורי לשוק ,וגירוי שאינו קשור
.לשוק
הניסוי השני :סט שונה של גירויים :גירוי מותנה אקסיטטורי למזון ,גירוי מותנה 2.
.אינהיביטורי למזון ,וגירוי שאינו קשור למזון
התוצאות הן שגירוי אקסיטטורי לגירוי בלתי מותנה אפטטיבי דומה בהשפעה שלו על
ההתנהגות כמו לגירוי אינהיביטורי לגירוי בלתי מותנה אברסיבי ,וגירוי אקסיטטורי
לגירוי בלתי מותנה אברסיבי הוא בעל השפעה דומה על ההתנהגות כמו ההשפעה של
.גירוי אינהיביטורי לגירוי בלתי מותנה אפטטיבי
:טבלת סיכום
סוג ההתניה וסוג הגירוי אקסיטטורית אינהיביטורית
אפטיטיבי Hope Frustration
אברסיבי Fear Relief
נהוג לומר שישנן שתי משפחות :התקווה וההקלה במשפחה אחת ,ואילו הפחד
והייאוש במשפחה השנייה .קשה מאוד לעבור ממשפחה אחת לשנייה ,אך לעבור
ממצב אחד במשפחה למצב אחר באותה המשפחה ,למשל :קל להפוך גירוי
אקסיטטורי אפטיטיבי לגירוי אינהיבטורי אברסיבי ,ועם זאת קשה להפוך גירוי
אינהיביטורי אברסיבי לאקסיטטורי אברסיבי .לא זאת בלבד שקל לעבור מגירוי אחד
במשפחה לגירוי אחר באותה המשפחה ,הרי שזה עוזר בתהליך הלמידה ומאיץ אותו:
חיה שלמדה קודם גירוי מסוים כאקסיטטורי לאפטיטיבי ,יהיה לה קל יותר ללמוד
.שאותו הגירוי הוא גם אינהיביטורי לאברסיבי
באופן כללי לגירויים אברסיביים ישנם גבולות "פרוצים" יותר -לגירוי אברסיבי עשויה
להיות השפעה גדולה יותר על ההתנהגות מאשר לגירוי אפטטיבי .במילים אחרות ניתן
לומר שיש גבול לכמה שגירוי יכול להיות "טוב" ,ואין כל-כך גבולות לכמה גירוי יכול
"....להיות "רע
הבהרה :המשמעות של גירוי אינהיביטורי היא שאנחנו מצפים ל"אפס תגובה" מצד
הנבדק ,בציפייה שאם הגירוי הזה לא היה מופיע -הייתה מופיעה תגובה כלשהי.
כלומר ,אנחנו מתבססים על ההנחה שאם הגירוי לא היה מופיע ,הייתה מופיעה
התנהגות כלשהי ,ואת העובדה שההתנהגות לא מופיעה ,אנחנו מסבירים באמצעות
.הופעתו של הגירוי המעכב
Latent Inhibition
)עכבה סמויה=(
-בקבוצה אחת
Preexposure
חשיפות חוזרות לאותו הגירוי המותנה .החשיפה לגירוי המותנה נעשית ללא חשיפה
לשום גירוי בלתי מותנה אחריו .אחר פעמים רבות של חשיפה חוזרת כזו ,מתחילים
.ללמד את החיה לקשר בין הגירוי המותנה לגירוי בלתי מותנה מסוים
-בקבוצה השנייה
התניה של אותו הגירוי המותנה ,עם גירוי בלתי מותנה כלשהו .קבוצה זו לא נחשפה
חשיפות מוקדמות וחוזרות לגירוי המותנה ,אלא רק עברה תהליך למידה ,שהקבוצה
הראשונה עברה לאחר שנחשפה מספר רב של פעמים לגירוי המותנה ללא הגירוי
.הבלתי מותנה אחריו
גירויים מורכבים
גירוי שמורכב משני מרכיבים שונים )שני גירויים שונים( .למשל ,גירוי מורכב שמעורר
תגובה מותנית כשהם מופיעים ביחד )בעקבות תהליך למידה( ,והשאלה המתעוררת
.היא -האם כל אחד מן המרכיבים יעורר את התגובה המותנית כשהוא מופיע לבד
פבלוב חקר את השאלה הזו ,והתשובה שלו הייתה שזה לא פשוט בכלל -לעיתים רק
אחד מהגירויים מעוררים את התגובה המותנית ,ולעיתים שני הגירויים מעוררים את
התגובה המותנית ,אך בעוצמה קטנה יותר מאשר במקרים שבו הופיעו ביחד .עם זאת,
.תמיד לפחות אחד מהגירויים יעורר את התגובה המותנית
הצללה -הייתה הצללה לגירוי מסוים אם התגובה אליו בעקבות התניה שלו כחלק
.מגירוי מורכב חלשה יותר מאשר אם היה עובר את ההתניה לבד
נראה ששני הגירויים שמרכיבים את הגירוי המורכב מתחרים על הכוח האסוציאטיבי,
.כאשר ככל שגירוי אחד לוקח יותר מהכוח הזה ,הגירוי השני לוקח פחות
פבלוב גילה שאם אנחנו מדברים על שני גירויים באותו החוש ,הרי שזה עם העוצמה
הגבוהה יותר יעשה הצללה לזה עם העוצמה הנמוכה יותר -למשל ,צליל חזק עם
.צליל חלש ,הרי שהצליל החלש יעבור הצללה על ידי הצליל החזק
אם מדובר בשני גירויים שקשורים בחושים אחרים ,הרי שנאמר שהגירוי בעל
הבולטות הגדולה יותר יעשה הצללה לגירוי בעל הבולטות הנמוכה יותר )וזה קשור,
).כמובן ,בסוג החיה ,מכיוון שגירויים שונים הם בעלי בולטות שונה לחיות שונות
מאוחר יותר גילו כי ישנם שני מרכיבים משפיעים על ההצללה :האחד הוא הבולטות
).שאותו בדקנו בניסוי הראשון( ,והשני הוא התוקף היחסי
תוקף יחסי -אם אחד משני המרכיבים הוא בקורלציה יותר חזקה עם חיזוק מאשר
.המרכיב השני ,הרי שהוא יעשה הצללה לגירוי השני
התוצאות הן שבקבוצה הראשונה אין בכלל התניה לאור ,ובקבוצה השנייה יש מעט
התניה לאור .זה מוכיח את התוקף היחסי -הגירוי שניבא טוב יותר את הגירוי הבלתי
.מותנה ,הוא זה שיעשה הצללה על הגירוי שמנבא טוב פחות את הגירוי הבלתי מותנה
מאוחר יותר גילו כי ישנם שלושה מרכיבים שמשפיעים על ההצללה ,כאשר הנוסף
.הוא ההיסטוריה של הגירוי
חסימה -פרוצדורה שבה אנחנו קודם כל מתנים גירוי פשוט ,ואחר כך מתנים גירוי
מורכב ,ומגלים שהגירוי הפשוט שהותנה חוסם את התנית הגירוי השני בגירוי
המורכב .החסימה היא תת מקרה של הצללה מלאה ,כאשר הסיבה היא ההיסטוריה
)).לא הבדלים בבולטות ולא בתוקף יחסי
ניתן לבטל את ההשפעה של החסימה על ידי שימוש בגירוי בלתי מותנה חזק יותר
בשלב השני .במקרה זה יתרחש ביטול לחסימה ,מכיוון שהחיה תקשר את עוצמתו
העולה של הגירוי הבלתי מותנה להוספתו של המרכיב השני )זה שלא חוזק בשלב
הראשון( לגירוי המורכב .למשל ,בניסוי שלנו ,אנחנו נשתמש בשלב הראשון עם שוק
.בעוצמה אחת ,ובשלב השני בשוק בעוצמה כפולה ,הרי שנבטל את החסימה
:התיאוריה של ואגנר
.Vסך כל הכוח האסוציאטיבי -
.Lהגירוי הבלתי מותנה -
)∆V= K(L-V
צריך לקרוא על המודל הזה של ואגנר בספר ,לא נרחיב עליו יותר מדיי בשיעור .הוא
.מודל מאוד חשוב ,אז לא לפספס אותו בספר .נזכיר אותו גם בשיעור הבא
למידה
שיעור מס' 5
26.11.03
:ניסוי אחר
לקחו יונים ואימנו אותן ללחוץ על מקש כאשר הן שומעות צליל ורואות אור .חלק
.מהיונים עושות זאת על מנת לקבל אוכל ,וחלקן עושות זאת על מנת למנוע שוק
.ביונים שאומנו עם אוכל -האור עשה הצללה לצליל
.ביונים שאומנו עם מניעת שוק -הצליל עשה הצללה לאור
אם כן ,אור בקרב יונים יותר בולט כשמדובר באוכל מאשר בצליל )מכיוון שיונים
בוחרות את האוכל שלהן לפי מראה( ,וצליל יותר בולט כשמדובר בשוק )מכיוון
שצלילים בדרך-כלל מסמנים סכנה יותר מאשר מראה( .גם בניסוי הקודם ניתן
לראות את היתרונות שיש ללמידה הזו :בחיים מה שמקושר לבחילה זה הטעם ,ומה
.שמקושר לשוק חשמלי זה בדרך-כלל גירויים חיצוניים ולא פנימיים
:הסברים לתופעה
מדובר במשהו מולד -אנחנו נולדים עם הבדלים באסוציאביליות של גירויים מותנים 1.
.שונים לגירויים בלתי מותנים שונים
ייתכן והאסוציאביליות של גירויים מסוימים הולכת וגוברת בחלק מן המקרים וחלשה 2.
בחלק מן המקרים בגלל נסיבות המציאות בעולם :באמת סכנות בדרך-כלל מיוצגות
על ידי צלילים בעולם החי ,ועל כן בדרך כלל הלמידה תהיה קלה יותר גם גירויים
.מותנים אשר יש להם קשר כלשהו בעולם המציאות עם גירויים בלתי מותנים
פוביה היא תוצאה של התניה קלאסית של פחד עם גירוי בלתי מותנה טראומטי
במיוחד ) אם ילד ננשך על ידי כלב ,יכול מאוד להיות שהוא יפתח פוביה מכלבים( .זה
.יכול להיווצר על ידי הכללה ,התניות מסדר השני ,ועוד
הפוביה נמשכת מכיוון שלא מכחידים אותה ,ומכיוון שהפחד מחזק אותה .היא לא
עוברת הכחדה בגלל ההימנעות )אם ננשכתי על ידי כלב ,וכעת אני לא מתקרבת
לכלבים ,אין סיכוי שאני אגלה שכלבים הם דווקא די נחמדים ולא תמיד נושכים(.
בנוסף ,הקשר בין הגירוי לפחד הוא עצמו מחזק את הפוביה .מכיוון שאנחנו ממשיכים
.לפחד מהכלב ,הרי שאנחנו נמשיך לחזק את ההתניה שיוצרת את הפוביה
מי שהתחיל לחקור את הנושא של הפוביות היה ווטסון .כבר בתחילת דרכו )עוד לפני
שהתעסק בפוביות( הוא חקר בני אדם בפרוצדורות של התניה קלאסית ,עם גירוי
אברסיבי של שוק .הוא שם לב שמלבד התגובה המותנית שמופיעה כאשר הצליל
מופיע )הגירוי המותנה( ,הייתה גם עלייה בקצב הלב כאשר נשמע הצליל .מכיוון
שווטסון האמין שהכול נלמד )גם התנהגות נורמאלית וגם לא( הוא רצה להראות
.שפחדים נרכשים גם הם בהתניה קלאסית
ריינר ווטסון ב 1920-ערכו ניסוי עם חולדות :אלברט )ילד קטן( שרצה ללטף את
החולדה ,בכל פעם שהוא שלח את ידו ללטף את החולדה ,נשמע צליל חזק ומפחיד,
ואלברט משך את ידו אחורנית .לאחר שלוש הצמדות כאלו ,אלברט כבר פחד
מהחולדה הלבנה כשראה אותה .נראה גם כי הייתה הכללה ,שכן אלברט פחד לא רק
.מהחולדה הלבנה ,אלא גם מארנבת לבנה ,ופרווה לבנה באופן כללי
ווטסון התכוון להכחיד את הפחד של אלברט בפרוצדורה שנקראת "הצפה" .כלומר,
ווטסון התכוון להשמיע את הצליל מבלי החולדות מספר פעמים כך שהפחד יעבור
הכחדה )אבל אמא של אלברט התנגדה להמשך הניסויים באלברט אז הוא נשאר עם
...).הפחדים שלו
סטודנטית של ווטסון )ג'ונס( לקחה ילד ,חשפה אותו לארנבת לבנה וצליל חזק ,כך
שהוא התחיל לפחד מהארנבת .בשלב הבא ,כאשר הילד יושב ואוכל ,היא מניחה את
הארנבת בקצה החדר ,במרחק כזה שהיא עדיין לא מעוררת פחד .הילד ממשיך
לאכול ,ובהדרגה מקרבים אליו את הארנבת ,עד שבסופו של דבר הילד יכול היה
.לשהות במחציתה של הארנבת ואפילו להחזיק בה וללטף אותה
מה שהיא חשבה שהיא עושה זה שהיא מקשרת את הארנבת לתגובה אמוציונאלית
:חיובית )אכילה זה תחושה נעימה( ,ועל כן חשבה שהיא מבצעת
Counter Conditioning
שלושים שנה אחרי ג'ונס ,חוקר בשם וולפ לקח חתולים )עברו מניסויים בבני אדם
לבעלי חיים( וחשף אותם לצליל ושוק עד שהם התחילו לפחד מהצליל .מה שהוא
ראה ,זה שאחד מסימני הפחד של החתולים היה שהם הפסיקו לאכול כאשר הם
שמעו את הצליל .מכיוון שפחד עיכב את האכילה ,הוא חשב גם שההיפך יקרה-
שהאכילה תעכב את הפחד .הוא הניח שאם החתולים ייחשפו לצליל במהלך האכילה,
במשך הזמן הצליל כבר לא יעורר פחד .על מנת שזה יצליח ,יש ליצור מצב שבו
הצליל מעורר רק טיפה פחד ,על מנת שלא ידכא את האכילה ,כדי שהחתול ימשיך
לאכול -אחרת זה לא יעיל .בכלוב שונה מזה שבו ערכו את ההתניה של הצליל
והשוק ,נתנו לחתול לאכול ,השמיעו את הצליל ,והן המשיכו לאכול בנוכחות הצליל.
כעת הצליל מקושר למזון .בהדרגה הן נחשפו לצלילים בזמן שהן אוכלות ,בכלובים
שיותר ויותר דומים לכלוב המקורי שבו נערכה ההתניה של השוק והצליל ,עד שבסופו
של דבר גם באותו הכלוב שבו נערכה ההתניה הראשונה שעוררה את הפחד הם
הצליחו לשמוע את הצליל ולהמשיך לאכול .הוא חשב שסיכוי סביר מאוד שהשיטה
:הזו יכולה לטפל בפוביות רבות גם בקרב בני האדם .בבני האדם השיטה הזו נקראת
Systematic Desensitization
בקרב ילדים אפשר להשתמש באכילה )כשהילד מרגיש לא נוח ,אפשר לתת לו את
הבקבוק שלו ,וזה עוזר לו להירגע( .במבוגרים לא משתמשים באוכל ,אלא משתמשים
בהרפיה .המבוגר מגיע לפסיכולוג ,והדבר הראשון שהוא עושה זה הרפיה .בשלב
הבא בונים ביחד )המטופל והמטפל( סולם של הפוביה :מ"הכי מפחיד" ל"-לא
מפחיד" .למשל ,אם מישהו רוצה לטפל בפוביה של טיסות ,הכי מפחיד אותו לטוס,
פחות מפחיד אותו לשהות במטוס שעדיין לא המריא ,פחות מפחיד אותו זה לשהות
בשדה התעופה ,וכו' ..בשלב השלישי עוברים בסולם מה"לא מפחיד" אל ה"-לא
מפחיד" -בכל שלב כזה חייבים לשמור על ההרפיה .כלומר ,נחשפים לגירויים בסולם
מהכי פחות מפחיד למפחיד ביותר ,תוך שמירה על ההרפיה .וולפ ,כאשר עשה את זה,
דיווח על הצלחה של 90%בטיפול בפוביות ,כאשר את ההצלחה הגדיר כמפגש
.באובייקט המפחיד ביותר עם המטופל .הדגש בשיטת טיפול זו הוא ההדרגתיות
שיטת טיפול אחרת היא "ההצפה" .למשל ,אם מישהו פוחד ממקומות סגורים ,אנחנו
נסגור אותו בארון ,ואחרי שהוא יגמור לפחד ,הוא ייחשף לעובדה ששום דבר נורא לא
קורה כאשר אתה כלוא במקום סגור .שיטת טיפול זו היא מאוד טראומטית ,בניגוד
.לשיטת הטיפול הקודמת
התניה אופרנטית
הקדמה
ההבדל המהותי בין התניה זו להתניה הקלאסית היא הסמיכות .בהתניה קלאסית
הסמיכות היא בין שני גירויים )סמיכות קלאסית( ,ואילו בהתניה אופרנטית הסמיכות
:היא בין תגובה לתוצאה
> ----סמיכות אופרנטית)R – O ( Response and Output
מה שמיוחד בהתניה אופרנטית זה שבאמצעות השליטה בתוצאה ,אנחנו יכולים גם
.לשלוט בהתנהגות
ההנחה היא שכל התנהגות מחוזקת על ידי משהו .אם אנחנו יכולים למצוא מהו
החיזוק של התנהגות מסוימת ,אנחנו יכולים לשלוט בו ובאמצעות השליטה הזו-
.לשלוט גם בהתנהגות
החוקר הראשון הרציני בתחום היה תורנדייק .הוא הושפע מאוד מהתיאוריה של דרווין,
ורצה לחקור את האינטליגנציה בבעלי חיים ,כלומר -האם בעלי חיים יכולים לפתור
בעיות .לשם כך הוא השתמש ב"קופסת הפאזל" ,שהיא קופסא שיש לה איזושהי
דלת ,ויש איזשהו מנגנון )טריק( שפותח את הדלת )חבל ,כפתור ,וכו'( .הרעיון של
הניסוי הוא ששמים את החתול בתוך הקופסא ,ובודקים אם הוא יכול לפתוח את
הדלת .החתולים שהשתמשו בהם היו רעבים ,ובחוץ חיכה להם אוכל .ככל שהחתול
נחשף למצב הזה יותר ויותר ,זמן הניסיונות שלו לפתוח את הדלת התקצר ,עד
שבפעמים האחרונות שבהן החתול הונח בתוך הקופסא ,הוא פתח את הדלת באופן
.מיידי
אם כן ,המסקנות של תורנדייק היו שהלמידה הזו היא למידה הדרגתית ,על ידי ניסוי
וטעייה .לטענתו מה שהחתולים למדו זה לקשר בין גירויי הקופסא לבין התגובה של
פתיחת הדלת ,כך שבכל פעם שהכנסנו אותם לקופסא ,הם ניסו לפתוח את הדלת.
Stimulus Response
זה לא שלחתול יש הבנה מיוחדת ,אלא שנוצר לו מעין אינסטינקט חדש ,אבל נלמד,
שמעצב את ההתנהגות שלו .בעלי חיים יכולים ליצור אסוציאציות ,אבל זה לא אומר
שההתנהגות שלהם היא לצורך מטרה ,אלא היא התנהגות אוטומטית בתגובה
.לגירויים
עם זאת ,תורנדייק תהה אם החתול היה צריך באמת להיות רעב על מנת ללמוד ,או
שגם חתול שבע יכול ללמוד .לאחר מחקרים ,הוא טען שלבעל החיים חייבת להיות
מוטיבציה וחייב להיות חיזוק ,מכיוון שלמידה מתרחשת רק כאשר ללמידה יש תוצאה
)זהו חוק התוצאה( .תוצאה רצויה לחיה תחזק את הקשר בין הגירוי לתגובה ,ואילו
תוצאה שאיננה רצויה לחיה )שלילית( או היעדר תוצאה ,תחליש את הקשר בין הגירוי
לתגובה .מהתגובות אשר מבוצעות בתגובה למצב נתון )בדוגמא שלנו -הקופסא( ,אלו
אשר מלוות סיפוק לחיה תקושרנה חזק יותר למצב ,ואילו אלו אשר לא מלוות סיפוק
או אף לא נעימות לחיה ,הקשר שלהן למצב ייחלש .כאשר החיה תהיה שוב באותו
המצב ,תהיה לתגובות הראשונות סבירות גבוהה להופיע ,ואילו לאחרונות סבירות
.נמוכה
לשים לב -הסמיכות היא בין התגובה לתוצאה ,אך מה שהחיה לומדת זה הקשר בין
.הגירוי לתגובה
.לעשות זאת
מטעם המטרה אנחנו רוצים לבצע התנהגות אחת ,אך מטעם ההרגל אנחנו -
Capture Errors
מבצעים התנהגות אחרת )אנחנו רוצים לפנות ימינה ולנסוע לבית של סבתא ,אבל
).מכיוון שאנחנו רגילים לנסוע הביתה ,אנחנו פונים בסופו של דבר שמאלה בטעות
המחקרים של תורנדייק
תורנדייק טען שעונש היא דרך פחות אפקטיבית משכר חיובי ,והטענה הזו היא נכונה
למדי ,הוכחה במחקרים מאוחרים יותר .עונש מעורר תגובות רבות לא נעימות
)אגרסיביות ,למשל( ,ויותר מכך -כשאנחנו מענישים התנהגות ,אנחנו מלמדים את
בעל החיים מה לא לעשות אבל אנחנו לא ממש מלמדים אותו מה כן לעשות,על כן
חשוב במצבים כאלו להשתמש גם בגירויים אפטיטיביים ,על מנת שהיצור ילמד גם מה
הוא כן צריך לעשות בהדרגה .משום כך תורנדייק עסק במחקרים שלו בעיקר
בחיזוקים חיוביים ולא שליליים .עונש ,אם הוא ניתן לבד ,הוא בדרך כלל לא כל כך
אפקטיבי ,אלא אם הוא באמת מאוד טראומטי ,וגם אז צריך לשלב בינו לבין גירויים
.אפטיטיביים
למידה
שיעור מס' 7
10.12.03
הקדמה
השיטה של תורנדייק מושתת על צעדים מאוד ברורים ,הנשלטים כולם בידי הנסיין,
-ולכן קוראים לה
Discrete Trial.
לעומת השיטה של תורנדייק ,סקינר פיתח שיטה חדשה לשליטה בהתנהגות,
-שקוראים לה
Free Operant.
:הוא עשה אבחנה בין שני סוגים של תגובות
-תגובה אופרנטית .התנהגות אופרנטית 1.
Conditioned Respondent – Elicited
-תגובה קלאסית .התנהגות שנחקרת בעיקר בהתניה קלאסית ,וזו ה 2.
. Respondent Behaviour.
זו נגרמת על ידי איזשהו גירוי :צמצום האישון בתגובה לאור ,הרתיעה של היד
'.כשנוגעים במשהו חם ,וכו
סקינר חשב שההתנהגות מהסוג השני אינה חשובה כל-כך ,כי היא בעיקר בעלת
השפעה על המערכת האוטונומית ,אך היום אנחנו כבר יודעים להתניה הקלאסית יש
השפעה גדולה מאוד על ההתניה האופרנטית ,וגם להתניה הקלאסית יש מקום חשוב
בלמידה הרגשית .אם כן ,ניתן לומר שכיום ידוע שיש להתניה הקלאסית חשיבות
.גדולה יותר מזו שנתן לה סקינר
התנהגות אופרנטית
בעל החיים עושה את הפעולה בעצמו ,ולא בתגובה לאיזשהו גירוי .התגובה
האופרנטית היא תגובה על העולם החיצוני ,יש לה תוצאות בעולם והיא משתנה על פי
התוצאות שלה .תגובה אופרנטית נבדלת מהתגובה הקלאסית בכך שהיא משתנה על
.פי התוצאות שלה ,בעוד שתגובה קלאסית לא
.כלומר ,התגובה מוגדרת על פי התוצאה וההשפעה שלה על העולם
?מהו עונש
כל דבר שמוריד הסתברות תגובה מסוימת .עונש שלילי הוא גירוי שהסרתו בעקבות
התגובה מורידה את הסתברות התגובה .עונש חיובי הוא גירוי שהוספתו בעקבות
.התגובה מורידה את הסתברות התגובה
.רב הגירויים שמשמשים לחיזוקים ועונשים בבני אדם הם חיזוקים ועונשים מותנים
ישנם מעט מאוד גירויים שהם חיזוקים בלתי מותנים ,אלו הם גירויים שבהינתן מצב
החסך המתאים – עוזרים על השמירה של האורגניזם .אלו הם גירויים בלתי מותנים
אפטיטיביים .דוגמאות לגירויים אלו הן מזון ,שתייה ,מין ,שינה ,וכו' .מצב החסך
.המתאים נדרש על מנת ליצור מוטיבציה
ישנם מעט מאוד גירויים שנקרא להם מענישים בלתי מותנים ,גירויים שגורמים למשל
נזק לרקמות -אור חזק ,צליל חזק ,וכו' .אלו הם למעשה גירויים בלתי מותנים
.אברסיביים
סקינר התייחס גם לגירויים שמגיעים לפני התגובה )הבדל נוסף גדול בין
):תורנדייק לסקינר
תורדנייק אומר שבעקבות התניה שבה תגובה מסוימת חוזקה במצב מסוים ,הרי
שבעתיד לתגובה יש סיכוי גבוה יותר להופיע ,מכיוון שנוצר קשר בין המצב לתגובה,
כך שבהדרגה המצב מתחיל לעורר את התגובה באופן אוטומטי .לפי תורנדייק הסיבה
לכך שמופיעה התגובה בעתיד היא בשל הקשר שנוצר בין המצב לתגובה -המצב
מעורר את התגובה .החולדה לוחצת על הדוושה לא מכיוון שהיא מעוניינת באוכל,
אלא מכיוון שדוושה זה דבר שלוחצים עליו ,היא למדה שאף פעם אין כזה דבר יותר
.מדיי ללחוץ על הדוושה
סקינרמסכים שתגובה שמחזקים אותה -הסבירות שלה עולה .עם זאת ,סקינר אומר
שבדרך כלל תגובות מתבצעות ביחס לגירויים מסוימים -אנחנו מרימים את הטלפון
בבית ,למשל ,כשהוא מצלצל .אנחנו נוסעים בכביש ולוחצים על הברקס כאשר
הרמזור נהיה אדום .התגובות וההתנהגות מבוצעות אם כן ביחס לאירועים אחרים-
התנהגות לא מופיעה בריק ,אלא ביחס לגירויים אחרים .המטרה שלנו כחוקרים זה
.לגלות את היחס בין ההתנהגות לבין הגירויים
Shaping
מתקשר לשאלה של תורנדייק -כיצד התגובה הראשונה מתרחשת .בהתניה קלאסית,
אין בעיה כזו ,מכיוון שיש גירוי בלתי מותנה שמעורר את התגובות -ועל כן המקור של
התגובה הוא ברור .גם בהתניה אופרנטית ישנו גירוי בלתי מותנה ,אך הגירוי הבלתי
מותנה לא מעורר את התגובה הרלוונטית להתניה האופרנטית )נתינת מזון לחיה על
כך שלחצה על דוושה היא מעוררת אומנם ריור ותגובות שקשורות למזון ,אך המזון לא
בהכרח קשור ללחיצות על דוושה( .אם כן ,מאיפה מגיעה התגובה הראשונה? אם היא
מאוד רחוקה מרפרטואר ההתנהגות של בעל החיים ,יכול להיות שהתגובה הזו בכלל
.לא תגיע
סקינר הציע את הפרוצדורה שבה אנחנו מחזקים תגובות שהולכות ומתקרבות
לתגובה שאנחנו רוצים בסופו של דבר להגיע אליה ,ובפרוצדורות רבות של אימון
שיטה זו היא ממש נחוצה ,מכיוון שהתגובה שאנחנו מחכים לה רחוקה מאוד
מרפרטואר ההתנהגות של החיה )למשל ,אם אנחנו רוצים שהיונה תסתובב סיבוב
שלם -כדאי לחזק תחילה פניות חדות ימינה ,ולא לחכות שמלכתחילה היונה תעשה
.ההתנהגויות שכן ניתן לחזק אותן ,ויובילו בסופו של דבר להתנהגות הרצויה
Pretraining
למשל ,אם אני לוקחת חולדה ורוצה לאמן אותה לצאת מקופסת סקינר על מנת
לאכול ,אני צריכה קודם לאמן אותה לדעת שיש למשל אוכל בכלל מחוץ לקופסא.
לדוגמא ,אני אדליק אור בכל פעם שנופל אוכל לתא ,ואז החולדה תתקרב ,תבחן את
Auto-Shaping
בדוגמא שלנו ,כשאנחנו מלמדים את החולדה לאכול מתא המזון )"אימון מחסנית"(,
אנחנו מפעילים בעצם סמיכות קלאסית )בין אור למזון( ,ואני יכולה לקבל פה
התנהגות אופרנטית .החולדה תלמד את עצמה שבכל פעם כשיש אור ,אם היא תכניס
את הראש ,אז יהיה מזון .בשלב הראשון המחשב מדליק אור ומזון ביחד ,אחר כך,
כשהחולדה מתקרבת ,בכל פעם שיידלק אור ,המחשב יזרוק מזון לתא רק לאחר
לוחות חיזוק
אימון בחיזוק מלא -על כל תגובה מקבלים חיזוק .בדרך כלל ,גם אם CRF -
אימון בחיזוק חלקי -ישנה איזושהי חוקיות כל פיה התגובות מחוזקות ,ולחוקיות הזו
לוחות מסוג יחס -מתייחס למספר התגובות שצריך לבצע על מנת לקבל חיזוק1. .
FR-כל מספר קבוע של תגובות מחוזק .למשל ,אם אנחנו רוצים לומר שכל - 3
Fixed Ratio
VR-החיזוק לא מופיע אחרי מספר קבוע של תגובות ,אלא אחרי מספר משתנה -
Variable Ratio
.של תגובות
לוחות מסוג אינטרוואל -התגובה הראשונה מחוזקת אחרי פרק זמן מסוים מקבלת 2.
.החיזוק הקודם
החיזוק ניתן בעקבות התגובה הראשונה ,שהתרחשה לאחר פרק זמן מסוים מסיום
האינטרוואל שנקבע .למשל ,אם היונה תלחץ על הדוושה ,היא תקבל חיזוק רק אחרי
).לחיצת הדוושה הראשונה שתופיע בסיום 5שניות )טווח זמן מסוים שקבענו מראש
על שני הסוגים הראשונים אנחנו נרחיב בשיעור הבא ,אך על הסוג השלישי והרביעי
למידה
שיעור מס' 8
17.12.03
התניה אופרנטית -המשך
קצב התגובה
)לחיצות על
)הדוושה ,מצטבר -קצב התגובות העולה
PRP
זמן
)Variable Interval (VI
בגרף הזה קצב התגובה יהיה אחיד )קו ליניארי בגרף( ,מכיוון שהחולדה לא יכולה
לדעת מתי יגיע החיזוק .אנחנו לא נקבל פה סקאלות ,ואנחנו נקבל פה פי.אר.פי רק
אם מדובר במרווחים ארוכים או אם יש זמן מינימום שבו לא מקבלת החולדה חיזוק
)למשל ,אם היא אף פעם לא מקבלת חיזוק בשלושים שניות הראשונות לאחר החיזוק
שלה ,הרי שהיא לאו דווקא תתחיל להגיב בשלושים השניות האלו .עם זאת ,מרגע
שהיא תתחיל להגיב ,התגובה שלה תהיה קבועה ללא מרווחים ועצירות ,מכיוון שהיא
זמן
-ניסוי
נראה שקצב התגובה בלוחות אינטרוואל הוא נמוך יותר מאשר בלוחות יחס ,גם
”“Yoked
כל חיה בקבוצה של הלוח האינטרוואל מצומדת לחיה מסוימת בקבוצה של לוח
.היחס
כל פעם שחיה בקבוצת האינטרוואל מקבלת חיזוק ,גם החיה המוצמדת אליה בקבוצה
השנייה ,בקבוצה של לוחות היחס -תקבל חיזוק .זה מבטיח ששתי היונים )למשל(
מקבלות את החיזוקים בדיוק באותו הזמן -ההבדל הוא שאחת פועלת על פי לוח
אינטרוואל ואחת פועלת על פי לוח אינטרוואל .לגבי כל זוג של יונים ,נראה שזו
שהייתה בקבוצת היחס היה לה קצב תגובות גבוה יותר באופן משמעותי מאשר זו
שנמצאת בקבוצת האינטרוואל .היונה הכי איטית בקבוצת לוחות היחס הייתה מהירה
FI
בלוח האינטרוואל הקבוע ,ההנחה הראשונה שאנחנו צריכים לבצע היא שבעלי חיים
רגישים למעבר הזמן ,ועל כן הם יכולים להבחין בתגובות שונות על פי מתי הם
בעלי חיים לומדים שתגובות שנעשות בפרק זמן מסוים לא מחוזקות ,ורק תגובות 1.
שנעשות אחרי פרק זמן הזה ,מחוזקות .אחרי שהן מקבלות חיזוק ,הן מבינות שמתחיל
פרק הזמן שבו לא יחוזקו התגובות ,ולכן קצב התגובות נפסק לזמן מה .מכיוון שיכולת
הערכת הזמן ,גם שלנו וגם של בעלי החיים ,היא בעלת גבולות ,הרי שההבחנה
הטמפוראלית נשברת ,כלומר -בשלב מסוים החיה אינה יודעת אם פרק הזמן נגמר או
לא ,ואז היא מתחילה שוב להגיב )בדרך כלל עוד לפני שנסתיים פרק הזמן המדובר(,
כאשר קצב התגובה עולה ועולה -ככל שהזמן עובר ,כך יש סיכוי גבוה יותר שהזמן
כל תגובה שמתבצעת במשך האינטרוואל ,בסוף היא מחוזקת .כלומר -החיזוק הוא 2.
על כל התגובות שנעשו במהלך האינטרוואל ,אם כי התגובות מחוזקות באופן שונה.
תגובות שנעשו מוקדם יותר ,כך החיזוק שלה מאוחר יותר ,ואילו ככל שהתגובה
נעשית בשלב מאוחר יותר ,החיזוק שלה מוקדם יותר .על פי דרך התבוננות זו ,כל
התגובות מחוזקות ,אם כי כל אחת באופן שונה .מכיוון שאנחנו יודעים שככל שחיזוק
מגיע בפער גדול מהתגובה עצמה ,הוא פחות אפקטיבי ,הרי שהתגובות המוקדמות
יותר הן פחות מחוזקות ,עד שקצב התגובה של התגובות המוקדמות הוא מאוד נמוך או
אפסי )פי.אר.פי( ,ואילו תגובות שנעשות בשלב מאוחר יותר -החיזוק שלהן מגיע
בסמיכות רבה יותר לתגובה ,על כן התגובה עוברת חיזוק משמעותי ,והיא מופיעה ואף
.בתדירות גבוהה
בלוחות אינטרוואל ארוכים מאוד )של 15דקות ,למשל( ,אנחנו רואים שקצב
התגובות של החיה מאינטרוואל לאינטרוואל מאוד משתנה .למשל ,באינטרוואל של
15דקות ,אפשר לראות כזה שיש בו עשר או עשרים תגובות ,ואחריו אינטרוואל
FR
אמרנו שבלוח חיזוק זה ,אפילו אם יש הפסקה אחרי החיזוק ,הרי שקצב התגובה
אחיד .מרגע שהחיה מתחילה להגיב ,גם אם יש פי.אר.פי ,הרי שקצב התגובה הוא
קבוע ומהיר .כלומר ,בניגוד ללוח האינטרוואל הקבוע ,הרי שבמקרה זה אין עלייה
Discrete Trial
Discrete Trial
יותר לאמן חיות בחיזוק חלקי ,אך לגבי איכות הביצוע בסופו של דבר )קצב התגובות(-
ישנם מחקרים שמצביעים על ממצאים טובים לחיזוק החלקי ,ואילו ישנם מחקרים
:ההסברים לכך
.הלמידה פחות טובה מכיוון שהקשר האס-אר )בין הגירוי לתגובה( הוא פחות חזק 1.
.מכיוון שישנו איחור בחיזוק ,לחיה יש פחות מוטיבציה לבצע את התגובה שוב 2.
אם אנחנו לוקחים חולדה שאומנה עם עיכוב בחיזוק ,ואז מעבירים אותו ללמידה עם
חיזוק מיידי ,אנחנו רואים כבר בצעד הבא שהיא מייד תרוץ מהר יותר .הממצא הזה
תומך בהסבר השני ,שלחיה לא הייתה קודם מוטיבציה ,מכיוון שתהליכים של למידה
הם איטיים יותר ,ועל כן לא נצפה לראות תוצאות מיידיות אם הסיבה הייתה באמת מס'
) 1למידה( .מכיוון שאנחנו מקבלים פה תגובה מיידית ,הרי שכנראה שמדובר בעלייה
.במוטיבציה
אם נשווה חיזוק מייד וחלקי ) 90%חיזוק( לחיזוק מעוכב ומלא -נוכל לראות עד כמה
החולדה מעדיפה את המיידיות ,למעשה .עד כמה החולדה מוכנה "לשלם" על מנת
.והמלא
למידה
שיעור מס' 10
31.12.03
.הבשר
בהתניה אופרנטית -התרחשות חיזוק בקונטקסט מסוים תביא לכך שהתגובה
.בדרך כלל אין קשר ברור בין התגובות שהחיזוק מעורר לבין התגובה האופרנטית
השאלה שהעסיקה את החוקרים ,ועדיין מעסיקה אותם ,האם למעשה מדובר בתהליך
למידה שמתבצע במערכת אחת ,או האם מדובר בשתי מערכות למידה שונות
)תיאורית הגורם האחד אל מול תיאורית שני הגורמים( .ננסה עתה להסביר תופעות
של התניה קלאסית באמצעות התניה אופרנטית ולהיפך ,נראה האם באמת ניתן
בהתניה קלאסית -פבלוב טען שהגירוי הניטראלי שהיה בהתחלה חסר משמעות,
הופך להיות מחליף של הגירוי המותנה בעקבות ההתניה )הצליל עצמו מחליף את
.Stimulus substation
פבלוב טען שהאופן בו זה נעשה הוא יצירת אסוציאציה בין מרכיבי העצבוב של הגירוי
המותנה והבלתי מותנה במוח .כלומר ,האסוציאציה בהתניה קלאסית על פי פבלוב
!האסוציאציה שנוצרת בהתניה קלאסית היא בין הגירוי המותנה לתגובה המותנית
נדון עתה בניסויים אשר מנסים להכריע בין שתי התיאוריות -האם האסוציאציה היא
בין הגירוי המותנה לגירוי הבלתי מותנה )פבלוב( ,או שמא האסוציאציה הנוצרת היא
סוג ראשון של ניסויים כאלו הם ניסויים שבהם מונעים את ביצוע התגובה .למשל ,אם
מזריקים אטרופין -זה מונע ריור .אפשר לבצע התניה של צליל ובשר ,אבל להזריק
לכלב אטרופין במהלך ההתניה ,כך שלמעשה בכל מהלך ההתניה -הכלב לא מרייר.
לפי התיאוריה של פבלוב ,זה לא צריך להשפיע על הלמידה ,מכיוון שהכלב לומד את
הקשר בין שני הגירויים ולא בין גירוי לתגובה .לפי התיאוריה של גות'רי ,החיה לא
אמורה ללמוד בדרך זו ,מכיוון שהאסוציאציה היא בין התגובה לגירוי ,ואם מנעתי את
Sensory pre-conditioning
כאשר בניסויים אלו הוצג גירוי מותנה אחד ,בלוויית גירוי מותנה אחר )כך שנוצרת
ביניהם אסוציאציה( .בשלב הבא הוצג הגירוי המותנה הראשון )בלבד( עם גירוי בלתי
מותנה מסוים שמעורר תגובה מסוימת )ריור ,למשל( ,כך שנוצרת גם ביניהם
אסוציאציה .השאלה היא -מה יקרה אם נציג עכשיו את הגירוי המותנה השני )בלבד(-
אם כן ,המסקנה מניסויים אלו היא שההתניה האופרנטית לא יכולה להסביר את כל
סוג שלישי של מחקרים שהתבצעו ,הם מחקרים שמנסים לשנות את הערך של הגירוי
הבלתי מותנה בעקבות ההתניה .אחרי ההתניה גורמים לכך שהגירוי הבלתי מותנה
יפסיק לעורר את התגובה הבלתי מותנית שעורר עד עתה ,וגורמים לכך שהגירוי הזה
יתחיל לעורר תגובה אחרת .למשל ,לאחר ההתניה בין הצליל ,הבשר והריור ,עושים
מניפולציה כלשהי כך שהבשר יפסיק לעורר ריור ,ויתחיל לעורר תגובה אחרת
במקום .לפי התיאוריה של פבלוב ,אם הגירוי הבלתי מותנה מתחיל לעורר תגובה
אחרת ,הרי שגם הגירוי המותנה צריך להתחיל לעורר את התגובה האחרת ,מכיוון
שיש קשר בין שני הגירויים האלו -ועל כן שינוי באחד יגרור בהכרח שינוי באחר .לפי
התיאוריה האופרנטית לא יחול שום שינוי בעקבות שינוי התגובה שיעורר הגירוי
הבלתי מותנה ,מכיוון שהקשר הוא ישיר בין הגירוי לתגובה -הגירוי הבלתי מותנה לא
.עולה
התגובה של תיאורטיקנים קלאסיים לטענה זו היא שאכן בחלק מההתניות הקלאסיות
אפשר לחשוב על תועלת כלשהו בתגובה המותנית ,אך לא בכולן -לא תמיד קיימת
סמיכות אופרנטית .למשל ,במקרה של עצימת עין לפני שמקבלים שוק חשמלי ,או
כיפוף רגל לפני שמקבלים שוק חשמלי -הן לא תגובות שעוזרות לחיה .ההמשך של
הטיעון של התיאורטיקנים הקלאסיים הוא שגם במקרים שבהם יש סמיכות אופרנטית,
בשלב הראשון לוקחים חיה ומאמנים אותה בניסוי קלאסי רגיל -גירוי מותנה של 1.
שוק .ממשיכים לאמן את החיה עד שהגירוי המותנה מתחיל לעורר את התגובה
המותנית )כיפוף רגל( .מבחינת הנסיין ,אנחנו בסמיכות קלאסית בשלב זה .הטענה
של התיאוריות האופרנטיות היא שהחיה מכופפת את הרגל על מנת להקל על הכאב
.של השוק
בשלב השני מוסיפים סמיכות אופרנטית של השמטה -לאחר הופעתו של הגירוי 2.
המותנה ,אם החיה מגיבה עם התגובה המותנית )כיפוף הרגל( ,היא לא תקבל שום
שוק ,ואם היא לא תגיב עם כיפוף הרגל ,היא תמשיך לקבל שוק .כלומר ,בשלב זה
.להתנהגות זו של החיה
.אחת את השנייה
אותו הדבר מתרחש בניסוי הקודם שדיברנו עליו -בעיקרון מה שכדאי על פי הסמיכות
האופרנטית )מועיל לכלב( ,הוא לכופף את הרגל ,שכן במקרים אלו הוא לא יקבל את
השוק ,הרי שעדיין נראה שקצב כיפופי הרגל יורד )בהתאם לסמיכות הקלאסית,
למידה
שיעור מס' 11
07.01.04
-מקושרת לאוכל ,הרי שהחולדה תלמד להתקרב לדוושה .דוגמא נוספת היא ה
זהו מצב שבו אנחנו מלמדים את החיה תגובה אופרנטית בהסתמכות על -
AutoShapingסמיכות
:סיכום ביניים
ישנה סמיכות קלאסית כמעט בכל התנהגות אופרנטית .במקרים רבים ,כמעט תמיד,
הסמיכות הקלאסית מייצרת התנהגות .ההתנהגויות הרלוונטיות ביותר מבחינת התניה
אופרנטית הם "התקרבות" או "התרחקות" )ריורים ושאר התפתחויות פנימיות פחות
רלוונטיות להתנהגות האופרנטית( .לעיתים ההתנהגויות האלו הן זהות להתנהגות
האופרנטית .עם זאת ,הסמיכות האופרנטית יכולה לעצב את התגובה )קצב למשל(,
מה שהסמיכות הקלאסית אינה יכולה לעשות .אם הסמיכות הקלאסית מייצרת תגובות
שאינן מתאימות לאופרנטית ,היא יכולה להפריע מאוד עד כדי למנוע למידה של
דוגמא נוספת היא הניסיון ללמד דג לנשוך מוט זכוכית על מנת להגיע לנקבה* .
בפעם הראשונה באמת נשך הדג במקרה את המוט וקיבל את הנקבה ,ובפעם השנייה
מה שקרה הוא שהדג התחיל לרקוד ריקוד חיזור לפני מוט הזכוכית ...הסמיכות
דוגמא נוספת -קופסת סקינר .אם אנחנו רוצים ללמד חולדה ללחוץ על דוושה על *
מנת למנוע שוק .אור נדלק עשר שניות לפני ,ואם במהלך עשר השניות האלו
החולדה לוחצת על הדוושה ,הרי שהיא לא תקבל את השוק .יותר קל ללמד את
החולדה ללחוץ על הדוושה לאור המנורה כאשר המנורה היא בצד המנוגד לדוושה
)בצד שמאל של הקופסא למשל ,כאשר הדוושה נמצאת בצד ימין( -מכיוון שהאור
קשור לשוק ,ועל כן לחולדה תהיה נטייה לרוץ לצד השני של הקופסא )לברוח
.Sidmanזוהי הימנעות שאין שום סימן שהאירוע האברסיבי עומד להתרחש ,
Avoidance
אחת לכמה זמן מופיע אירוע אברסיבי )נאמר ,פעם בשלושים בשניות( ,אלא אם החיה
מבצעת את
התגובה לפני שהשוק אמור להופיע .למשל ,אם הכלב עובר מצד אחד לצד השני,
הרי שהוא לא יקבל שוק ,והשוק נדחה לעוד שלושים שניות מזמן התגובה .כשאנחנו
מאמנים בשיטה זו ,אין בכלל גירויים ,והדבר היחיד שבעצם נותר פה זה התגובה,
והסמיכות האופרנטית היא בין התגובה לתוצאה -הליכה מצד אחד לשוק .זוהי
לסמיכות הקלאסית אם כן תפקיד מאוד חשוב בהתניה אופרנטית .היא יכולה לעזור
מאוד ללמוד ,והיא יכולה גם במטלות אחרות להפריע מאוד ללמידה .בלמידה
.מרחבית ,למשל ,לא צריך להניח שום דבר מלבד הסמיכות הקלאסית
!!סיכום
.האופרנטית
.מהניסוי
– תופעה נוספת שמדגימה את ידיעת החיה על התוצאה היא התופעה של
. Latentניסוי שבו מלמדים חולדה במסלול ריצה מצד אחד לצד קופסת המטרה -
extinction
אחרי שהיא למדה לרוץ ,אנחנו שמים אותה בקופסת ההתחלה ,והחולדה מתחילה
לרוץ לאט יותר .על ידי זה שחשפנו אותה לכך שאין אוכל בקופסא ,גרמנו לירידה
בקצב התגובה .בעיקרון המסקנה היא שנוצרה אסוציאציה בין התוצאה לתגובה ,אך
הסבר נוסף לניסוי הזה יכול להיות הכחדה של הסמיכות הקלאסית -קופסת המטרה
כבר לא אפיטיטיבית -תגובת ההתקרבות הנגרמת על ידי הסמיכות הקלאסית כבר לא
:ניסוי
מאמנים חולדה ללחוץ על דוושה על מנת לקבל אוכל .אחרי שהיא למדה ,והיא כבר
לוחצת על הדוושה ומקבלת אוכל בכל פעם ,אנחנו משנים את ערך החיזוק שלה -על
devaluation
ליתיום כלוריד( .אחרי שהיא סיימה ללמוד ,אני נותנת לה לאכול ,ובכל פעם גם
aversion
אחרי הלמידה הזו ,אנחנו שמים את החולדה בחזרה הקופסה .לפי תיאורית הקשר בין
הגירוי לתגובה החולדה צריכה להמשיך ללחוץ על הדוושה .לפי תיאורית הקשר בין
התגובה לתוצאה ,נצפה שהחולדה כבר לא תלחץ על הדוושה ,מכיוון שהיא כבר לא
?נענשת על התגובה שלה ,ועל כן אין זו בדיקה טובה .מה נעשה אם כן
נשווה חיות שעברו הכחדה וחיות שעברו הכחדה וגם
.Reinforcer devaluation
אם כן יש לנו עתה שתי קבוצות בניסוי ,כאשר שתי הקבוצות מתחילות בכך שהן
).ב .קבוצה שעברה את שני התהליכים גם יחד )התהליך המלא שתיארנו קודם
.מהירה יותר מאשר אלו שלא עברו צימוד בין האוכל לבין הליתיום
בקרב הקבוצה של 500צעדים -אין הבדל בין שתי הקבוצות -בין הקבוצה שקיבלה
ליתיום עם אוכל לבין הקבוצה שקיבלה ליתיום בלבד .קבוצה זו מתנהגת על פי
תיאורית הקשר של גירוי ותגובה ,שכן לא אכפת להן בכלל שהערך של החיזוק
.השתנה
החולדות שלא קיבלו את הצימוד בין האוכל לבין הליתיום ,בשבילן המזון הוא עדיין
רצוי וחיובי ,הרי שהן חזרו להגיב מהר מאוד בשתי הקבוצות )אימון ארוך או קצר ,אין
).זה משנה
חולדות שעברו את הצימוד בין האוכל לליתיום ,ברגע שנתנו להם את החיזוק אחרי
התגובה )האוכל( ,קצב התגובה שלהן ירד ,לא משנה באיזו קבוצה מדובר )אימון
).ארוך או קצר
:סיכום הממצאים
הניסוי הזה מדגים שבשלבים מוקדמים את ההתניה אופרנטית ,האסוציאציה
הדומיננטית היא זו שבין התגובה לתוצאה .בשלבים מאוחרים כנראה שהאסוציאציה
!!!לסיכום
.הקשר בין הגירוי לתגובה -כשמופיע גירוי ,החיה תבצע תגובה מסוימת 1.
הקשר בין התגובה לתוצאה -כשמופיעה התגובה ,מגיעה התוצאה ,וגם כשהחיה 2.
).רוצה את התוצאה ,היא מבצעת את התגובה )הקשר פה הוא דו-כיווני ,ולא חד כיווני
תגובות אוטונומיות ,זקוקים לרענון מדי פעם לפעם על מנת שהתגובה לא תעבור
.הכחדה
.אופרנטית
?מדוע זה כך
בהתניה אופרנטית הסמיכות היא בין התגובה לתוצאה -כלומר ,בכדי ללמוד ,אני
חייבת להבין ששני דברים קרו :שהייתה תגובה ,ושהתרחשה תוצאה .אם את אחד
מהצעדים האלו אני לא קולטת ,הרי שלא תתרחש למידה .על כן מידת המשוב
שאנחנו מקבלים על התגובה היא קריטית בהתניה אופרנטית .עם זאת ,בהתניה
קלאסית ,הסמיכות היא בין הגירוי המותנה לגירוי הבלתי מותנה ,ועל כן לתגובה אין
תפקיד חשוב בלמידה -כלומר ,המשוב של התגובה לא חשוב בהתניה הקלאסית .כל
הנושא של הידע על התגובות של החיה הוא חסר משמעות לגמרי עבורה בהתניה
.הקלאסית
:סיכום
אם כן היום מדובר בחלוקה לתגובות שנותנות מעט משוב ,ותגובות שנותנות משוב
רב ,כאשר מדובר ברצף ולא בחלוקה דיכוטומית -התגובות נעות על קשת ,בעלות
למידה
שיעור מס' 12
14.01.04
.ידע
הטענה של טולמן היא לא רק שבעלי חיים רוכשים ידע על העולם ,אלא גם שהידע
הזה הוא הסיבה להתנהגות .כלומר ,לבעלי החיים יש איזושהי מטרה -חולדות לוחצות
על הדוושה כדי לקבל אוכל .שוב אנחנו חוזרים לשאלה -האם להתנהגות יש תועלת
או מטרה? בעבר כאשר דנו בכך שהחלטנו שיש להתנהגות תועלת ,אך לאו דווקא
מטרה .הויכוח אם כן ,הוא לא האם ישנה תועלת בהתנהגות ,אלא האם ההתנהגות
נעשית למען התועלת הזו ,כלומר -עם מטרה .לפי תורנדייק ,ההתנהגות נלמדת מכיוון
שהיא מועילה ,אך עצם הלמידה היא שההתנהגות הופכת להיות אוטומטית בתגובה
לגירויים .לעומתו ,טולמן טוען שההתנהגות מכוונת למטרה ,היא נעשית למען התועלת
.שבכך
בכל מקרה התיאוריה של טולמן לא תוכל להסביר התנהגות קלאסית ,מכיוון שריור,
למשל ,לאו דווקא מועיל לכלב לפני האוכל .על כן בכל הקשור להתנהגות קלאסית,
טולמן טוען שבמעבדה הנסיין בוחר את המטרה .בניסוי אופרנטי הנסיין בוחר מהן
הסמיכויות הקריטיות בעולם של החיה -איזו התנהגות עליה לבצע על מנת להגיע
.למטרה מסוימת
אחרי שהחיה לומדת את הקשר הזה שהנסיין מבקש שהיא תלמד ,היא מבצעת את
ההתנהגות בהתאם .בעיניי טולמן המוטיבציה הבסיסית של כל אחד היא לרכוש ידע
על העולם -לגלות את הקשרים בעולם שלו .מרגע שאיזשהו יצור מגלה קשר בין שני
מאורעות ,הוא מתחיל לפתח ציפייה שגם בעתיד ,אחרי שיקרה מאורע אחד -יתרחש
גם השני )יימשך הקשר( .אפקט הקונטרסט ,למשל ,מדגים את זה -כאשר קוף לוחץ
על דוושה ומקבל בננה ,ואחר כך שוב לוחץ על הדוושה ומקבל חסה ,הוא יזרוק את
.החסה ,יכעס מאוד ,שכן הוא ציפה לבננה וקיבל חסה במקום
טולמן טען בנוסף שאין צורך בחיזוק על מנת שתתרחש למידה ,מכיוון שלבעלי חיים
מוטיבציה טבעית ללמוד על העולם .המקום שבו יש צורך בחיזוק הוא המקום שבו
אנחנו מתרגמים את הלמידה לביצוע -טולמן היה הראשון שעשה את האבחנה הזו בין
למידה וביצוע .אומנם הדרך היחידה שלנו כיום לדעת אם התרחשה למידה זה
להסתכל על הביצוע ,אך הביצוע לטענתו ,הוא רק דרך לצפות בלמידה ,ולאו דווקא
המוטיבציה יוצרת דרישה לאובייקט מטרה .כולנו יודעים איפה הקפיטריה ,אך 1.
אנחנו לא הולכים לשם עכשיו ,מכיוון שאנחנו לא רעבים .כאשר נהיה רעבים,
.המטרה עצמה
.א .חסך -כמה שיותר שעות שהחיה לא אכלה ,כך הדרישה לאוכל גדולה יותר
ב .ערך מזרז -זה משהו שיש לחיזוק או למטרה עצמה ,לא קשור למידת החסך.
למשל ,עוגה מול סנדוויץ' .לבננה בשביל הקוף יש איזשהו ערך מזרז על החסה ,על
אף ששניהם הם בעלי אותו הערך הקלורי )אם דואגים שקערת החסה תהיה גדולה
Incentive Value
המצב המוטיבציוני שלנו קובע לאילו גירויים בסביבה נפנה קשב .אם אני מאוד 2.
רעבה ,אני שמה לב במיוחד לגירויים הקשורים להשגת מזון .אם כן המצב
המוטיבציוני יכול להשפיע גם על הלמידה ,שכן אם המצב המוטיבציוני שלי לא
מתאים לסוג הגירויים שיש בסיטואציה של הלמידה ,הרי שאני לא אלמד ,שכן ברגע
זה אינני יכולה להפנות קשב לגירויים האלו הכרוכים בלמידה .למשל ,אם אני צריכה
.ללמוד למבחן כאשר אני מאוד רעבה ,זה יהיה קשה יותר
.טולמן והתלמידים שלו ערכו ניסויים רבים על מנת להוכיח את הטיעונים של טולמן
Latent learning
המטרה היא להוכיח שחיזוק אינו הכרחי ללמידה ,ולמידה תתרחש גם כשאין חיזוק,
חולדות כמו שאנחנו מאמנים בדרך-כלל -שמו אותן בנקודת ההתחלה ,וכשהם 1.
?לראשונה מחכה להן שם חיזוק )מזון( .השאלה הנשאלת היא -מה יקרה ביום ה12-
נראה שביום ה 12-מספר הטעויות של החולדות מהקבוצה השלישית יורד לאותו
מספר הטעויות של הקבוצה הראשונה .אם כן רואים שעד עתה למעשה ידעו החולדות
של הקבוצה השלישית את אותו הדבר שידעו חולדות הקבוצה הראשונה ,אך לא
הייתה להן מוטיבציה להראות את זה .כשנוצרה להן מוטיבציה לביצוע ,הן ביצעו והראו
:בעיות בניסוי
גם חולדות מהקבוצה השנייה והשלישית למעשה מקבלות חיזוק בסיטואציה ,שכן כל
חולדה מעדיפה להיות בחוץ מאשר כלואה בתוך מבוך .עם זאת ,החיזוק הזה כנראה
לא מספיק חשוב על מנת שנראה שינוי משמעותי בביצוע ,בהתנהגות )לא רואים
.נצליח בניסוי
ניסוי שיוכיח טענה זו
לקחו חולדות מקבוצות של רעב שונות .שמו אותן במבוך ,ונראה כי ככל שהחסך היה
גדול יותר )ככל שהחולדה הייתה רעבה יותר( -הרי שהלמידה הלטנטית הייתה איטית
יותר )למידה שבה אין אוכל בקופסת המטרה בסיום המבוך( .זה מאוד מתאים למה
שטולמן חשב על התפקיד של מוטיבציה למידה ,שכן חולדה שהיא מאוד רעבה ,שמה
.לב לגירויים שקשורים במזון ,ופחות שמה לב לגירויים שאינם קשורים למזון
היו גם ניסויים אחרים שהוכיחו שהתגובה היא לא רק אוטומטית לגירויים ,אלא גמישה
.ומכוונת מטרה
סוג ראשון של ניסויים היה מבוך שמילאו אותו במים ,מבוך רטוב ,ובסוף המבוך
יש פלטפורמה שיש בה מזון .החולדות צריכות לשחות עד לסופו של המבוך ,שם הן
מקבלות מזון .אחרי שהן לומדות לשחות אל סופו של המבוך ,מוציאים את המים מן
המבוך ,והשאלה היא עכשיו -האם החולדות יידעו לרוץ אל המזון? גם הקונטקסט וגם
התגובה היא שונה לחלוטין בין שני ניסויים אלו ,והממצאים הם שיש העברה מלאה
לפי טולמן ,לחולדות בקבוצה מס' 1אמור להיות קל יותר ללמוד ,שכן המטרה
מוגדרת יותר ,קל יותר לכוון אליה .לפי הבהביוריסטים
הממצאים הם לחולדות מקבוצה מס' 1לקח 8צעדים ללמוד את המטלה ,כאשר
אחת הבעיות בניסויים של טולמן היא שכל הניסויים שלו הם מרחביים .בקבוצה מס'
1בניסוי האחרון יש לנו התניה קלאסית מאוד חזקה -קופסת מטרה מס' 1תמיד
מחוזקת ,היא הופכת להיות גירוי אפיטטיבי שתמיד מעוררת התקרבות .עם זאת,
בקבוצה מס' , 2הסמיכות הקלאסית לא מספיקה ,וחייבים ללמוד את הסמיכות
האופרנטית )כי הרי לעיתים מדובר בקופסת מטרה מס' 1ולעיתים בקופסת מטרה
).מס' 2
ניסוי נוסף
אימנו בהתחלה את החולדות ללכת תמיד מקופסת התחלה מס' 1לקופסת סיום מס'
1.
אחר כך הוא שם את החולדות בקופסת התחלה מס' ,2וצופה בהן -לאן הן הולכות
עתה ,לאיזו קופסת מטרה .רואים שהן הולכות לקופסת מטרה מס' 1עדיין ,מה
שתואם את התיאוריה של טולמן ,החולדה חוזרת לקופסת מטרה מס' ,1כמו שעשתה
קודם לכן )כי יודעת שיש שם אוכל ,היא פועלת על פי מטרה( .על פי הבהביוריסטים
החולדה אמורה שוב לפנות ימינה )כמו שלמדה בצעדים הקודמים( ,וכך להגיע הפעם
Moris Water-Maze
לוקחים בריכה של ילדים )קוטר של מטר( ,ממלאים אותה במים ,ושמים פלטפורמה
באחד מן הצדדים של הבריכה ,כך שהפלטפורמה היא מעט מתחת למים .שופכים
אבקת חלב לתוך המים ,על מנת שיהיו לבנים ולא שקופים )אבקת חלב לא מזיקה
לחיות( .שמים את החולדה בתוך המים ,היא שוחה עד שהיא נתקלת בפלטפורמה.
היא עולה עליה ,מתנערת ,עולה על הרגליים האחוריות ומסתכלת מסביב .תוך בערך
.נתקלת בה
פלטפורמה
חולדה
זהו החיפוש היעיל ביותר שהחולדה יכולה לעשות כאשר איננה יכולה להשתמש
.באינפורמציה מרחבית
הדרך הטובה ביותר לדעת אם הגירוי משפיע על ההתנהגות היא לשנות את הגירוי,
ולראות אם יש השפעה על ההתנהגות .בניסוי זה מעבירים את הפלטפורמה לצד אחר
.בתוך הבריכה
שמים את החולדה כעת בתוך המים ,ואז היא שוחה אל הפלטפורמה )היכן שהייתה
קודם לכן( ,מחפשת אותה שם ,וכשהיא לא מוצאת אותה שם ,היא מתחילה לחפש את
הפלטפורמה במקומות אחרים בבריכה .כשהיא מגיעה סוף סוף לפלטפורמה החדשה,
היא עולה עליה ,ושוב מטפסת עליה ,עולה על הרגליים האחוריות שלה ,ומסתכלת
סביב )מה שהפסיקה לעשות בפלטפורמה הקודמת לאחר מספר צעדים ,שכן כבר
).הכירה את הסביבה ,לא הסתקרנה להסתכל מסביב ,רק חיכתה שיוציאו אותה משם
בצעד הבא שוב שמים את החולדה לתוך המים ,והיא שוחה שוב למקום הישן של
הפלטפורמה ,וכשהיא לא מוצאת אותה שם ,היא שוחה אל הפלטפורמה החדשה די
במהירות .מכיוון שאין ממש עונש על טעויות ,הרי שלוקח זמן )מספר צעדים( עד
שהחולדה שוחה ישר למקום החדש של הפלטפורמה ,אלא היא שוחה בהתחלה