Professional Documents
Culture Documents
רציונל :להפוך את תחום החינוך ליותר אקדמי ומבוסס על נתונים ,וכאשר מציגים לנו מחקרים על התערבות או
הצעות למדיניות בבית הספר – שנוכל לפנות לספרות ולבחון עד כמה חזקות הראיות בכיוון מסוים.
שיטת הדבקות – אני דבק בתפיסה מסוימת ולא עסוק בלבחון אם זה נכון או לא נכון .זה מה שאני רוצה •
לחשוב כרגע.
שיטת הסמכות – להישען על אדם או גוף שאנו מתייחסים אליו כבעל ידע ,מתוך הנחה שלי כאדם פשוט •
אין יכולת לדעת מה קורה בעולם ולכן אני נסמך ונשען על מישהו אחר שיודע.
שיטה אינטואיטיבית – האינטואיציה שלנו ,מה כדאי או לא כדאי לעשות .זובי בחינה עצמאית ובחירה •
בדבר ההגיוני ביותר.
שיטה מדעית – מנסה לקחת את האינטואיציה ולאסוף מתוך תצפיות האם יש תמיכה באינטואיציה •
הזאת .האם זה שאני חושב יש פתרון מסוים זה אכן מחזיק מים לאורך מספר של תצפיות .לדוגמה:
בעבר טיפלו במוגלות על ידי עלוקות שהיו מניחים על המוגלה והעלוקה היתה מוצצת את המוגלה – זו
היתה האינטואיציה המדעית באותה תקופה .אבל כאשר עשו בדיקה מדעית ואמרו לנבדק – תנוח
שבועיים ואז תחלים ,וזה לבד הספיק! כלומר העלוקה הכריחה את האדם לנוח וזה מה שעזר לו.
ההנחה היא שיש חוקיות לדברים .כל המדע נשען על האמונה שיש סדר וחוקיות בעולם ואנו רוצים
לחשוף ולהבין אותה.
הניסיון הוא לגלות משהו שנכון על העולם ולא נכון רק בעיני המתבונן – לכן יש פה עניין של
אובייקטיביות ואמפיריות (מדעיות ,ניסויי).
גם הפרשנות של המדענים היא לא תמיד נקיה .התהליך הבסיסי ביותר הוא להעלות השערות על מה
שקורה בעולם ,ואז לעשות ניסוי ולראות האם התצפיות האלה מקבלות תמיכה או מופרכות .יש לשמור
כל הזמן על ראש פתוח ולהבין שלא בטוח שמה שחשבנו שעובד זה אכן כך .התהליך הזה צריך להיות
פתוח ופומבי כי כאשר יותר מאדם אחד חושב על זה אז יש יותר סיכוי שנגיע לתוצאה הנכונה.
כדי שהסבר יהיה מדעי הוא צריך לעמוד בשתי דרישות בסיסיות:
.1רלוונטיות למדע – מתאר דפוס ,למשל" :ככל ש."....
.2בחינות מעשיות – כלומר הדפוס הזה ניתן לבחינה מעשית .מה הכוונה?
א .יכולת ניבוי ולא רק בדיעבד .אם הגעתי להנחה כלשהי היא אמורה לעבוד גם במצבים אחרים .כלומר
לא רק להסביר מה היה בעבר אלא להיות מוכוון לפצור בעיות בעתיד
ב .תוצאות קוהרנטיות ולא סותרות .לתת הסבר עקבי וברור ,שלא משתנה מפעם לפעם או מעלה
תוצאות אחרות ,כי אז זה אומר שאין לנו הסבר טוב ומימלא אי אפשר לעשות איתו ניבוי לעתיד.
ג .ניסוי קונקרטי ולא מעורפל .אם טענו טענה מסוימת אז צריך להסביר מה בדיוק זה אומר בפועל.
למשל אם דברנו על שיטת חינוך מסויימת צריך לפרוט אותה מה זה אומר בפועל.
ד .ניתן לבדוק בתצפית אובייקטיבית .זה לא ניתן בכל דבר (אהבה וכו') אבל זה שימושי מאד.
יש סדרה של שלבים ונסביר זאת באמצעות מחקר( :רפרנס במצגת – Impact factor .כך מודדים אם הז'ורנל
נחשב ,זה בעצם כמה ציטוטים של מאמרים מהז'ורנל הזה נעשו בשנתיים\חמש שנים האחרונות).
ב 2013יצא מאמר שטוען טענה חינוכית :אם תאפשרו לילדים לקרוא ספרות טובה אז הבנת הזולת שלהם תשתפר
= .TOMבמחקר הראו עיניים של אדם והביאו 4אפשרויות לאיך הוא מרגיש ונטען שכשאנשים קראו ספרות
טובה זה גרם להם לחשוב יותר על הדמויות האחרות וגם הצליחו יותר לזהות ולתאר טוב יותר את רגשותיו של
האחר.
יש פה תיאוריה כלשהי .עם שאלה נעשה ניסוח של ההשערה בנוגע לקשר בין קריאת ספרות ויכולות TOM
ניסוח השערה הנודעת לקשר התצפיתי בין המשתנים (מה אנחנו מצפים לראות) .ואז גרמו לאנשים לתרגל את זה,
לקרוא ספרות טובה בדיקת של הקשר על ידי השוואה בין שתי קבוצות שנחשפו או לא נחשפו לספרות כזאת
מגיעים למסקנה.
איך בפועל נעשתה המדידה של הבנת הרגשות של אחרים :הראו להם את המבחן של בארון-כהן של זיהוי רגשות
לפי מראה העיניים בלבד.
לסיכום:
אנשים אחרים שהתרשמו מהמחקר רצו גם הם לבחון את הדבר הזה ובדקו האם סשן אחד כזה כמו שטוענים
החוקרים הראשונים אכן משפר את תפקודי ה .TOMמה שקרה זה ,לאחר 4סשנים כאלה (ב 4מחקרים) ,שאף
מחקר לא הצליח לשחזר את המחקר המקורי .כלומר לא תמיד המחקרים הם אובייקטיבים ,לא כל ממצא
מדעי מתאר לנו מה קורה באמת ,ולא משנה בעד כמה יוקרתי המאמר שבו זה פורסם (הנחה שז'ורנלים כאלה
עשו תהליך שיפוט מאד מתקדם וביקורתי)...
אותו מחקר ביקורת טעם שאנשים שקוראים ספרות באופן כללי מצליחים יותר במבחני זיהוי רגשות ,אבל פעם
אחת של קריאת ספרות טובה לא עושה את השינוי הדרמטי .עם המסקנה הזאת הוא מחזיר את השאלה אל
השולחן.
- Effect sizeכמה שונות מהתופעה זה מסביר לנו ,על איזה אחוז של אנשים אנחנו יכולים להסיק מסקנות? –
גודל האפקט שנמצא במחקר המקורי היה בפועל לא באמת משמעותי (מדדים של גודל האפשק שונים
ממובהקות ,שהיא רק אומרת אם זה מקרי או לא ,ואילו גודל האפקט אומר עד כמה זה משמעותי).
פנו ליותר מ 1500-חוקרים עם השאלה הזאת ,והתשובה שלהם מופיעה בעיגול במצגת .רוב קהילת החוקרים
אומרת שלא ניתן לסמוך על כל פרסום בגלל שלא ניתן לשחזר את התוצאות (התשובה הזאת חזרה במחקרים
מתחומים שונים!) .מה שמעניין שזה נמצא נכון גם על מחקרים של אחרים וגם על מחקרים אישיים – כלומר יש
פה איזה הבנה שגם משהו שגילינו שעובד אנחנו לא תמיד יודעים בהבנה עמוקה איך ,מתי ,ולמה זה עובד.
לאור זאת החלו סדרה של פרוייקטים רב-מעבדתיים על מנת לבדוק מה היכולת לשחזר ולבדוק מחקרים .מובן
שיש בזה קושי ,במיוחד במחקרי התערבות או מחקרי אורך...
לקחו 100מחקרים בפסיכו' וחינוך וניסו לשחזר אותם וגילו ש 36%מחקרים אכן העלו תוצאות כמו המחקר
המקורי ,כלומר 1מתוך שלושה! (במצגת ,ככל שהנתונים יורת כהים אז הנתונים יותר שונים בין המחקר המקורי
וניסיון השחזור שלו .בהיר – קרוב למחקר המקורי .כן\לא – עד כמה זה מובהק).
אח"כ לקחו 100מחקרים בתחום מדעי החברה שהופיעו בז'ורנלים הכי טובים שיש והסיכוי לפרסם שמה נמוך
מאד ,אז הצליחו לשחזר ,62%שניים מתוך שלושה!
פורסם מאמר שנקרא "עובדות יותר חשובות מחידוש" ,המסקנה שלו היא שאנחנו לא רוצים רק לפרסם חדשנות,
התערבויות נהדרות ,להמציא את הגלגל ,אלא אנחנו רוצים שאת התבונות שיש לנו נוכל לסמוך עליהן! נמצא
במאמר הזה שרק אחד מכל אלף מחקרים בודק האם מה שכבר פורסם בעבר הוא בכלל נכון או לא ,וכל השאר
רק מנסים לחדש!
מסקנה :אין ברירה אלא להבין טוב יותר שיטות מחקר וסטטיסטיקה.
פרסום סלקטיבי – (רק מחקר אחד מתוך אלף בודק האם הטענות נכונות .הפוקוס הזה של לפרסם •
דברים חדשים במקום לבחון את השאר הוא בעייתי) .אנחנו מפרסמים רק מה שיוצא מובהק ולא מה
שלא יוצא מובהק וזה פרסום סלקטיבי! עלינו לשכנע שגם תוצאות לא מובהקות הן עדיין משמעותיות,
זוהי אמירה חשובה .כלומר המטרה היא לפרסם משהו משמעותי ולא רק אם הוא מובהק או לא( .זה לא
רק באשמת החוקרים אלא הלחץ של הז'ורנלים שמפרסמים רק מה שמובהק .)..זוהי בעיה מובנית של
פרסום מחקרים מוצלחים אך בפועל אנו יודעים שבשביל להגיע להצלחה במשהו נמצאים בתוך תהליך
ארוך של חוסר הצלחה.
שוני בפרוצדורה – פרק השיטה צריך להיות מאד ברור כדי שאחרים יוכלו לשחזר את הפרוטוקול שלך, •
מה השלבים ,מה קורה בכל חלק ,מה קורה בשפות אחרות ,באוכלוסיות אחרות ,מה המרכיבים שכדאי
וצריך לשמור ומה ניתן להקל לאור ההתאמות למצבים אחרים .אחרת – זה מוביל לשוני בפרוצדורה,
כלומר זה לא שהמחקר המשחזר סותר ומפריך את המחקר המקורי אלא שהמקורי פשוט לא היה מספיק
מדויק ולכן יש קושי מובנה לשחזר אותו.
(שיחזור לא מוקפד) – יש פה תהליך סמוי של אנשים שמנסים לעשות קריירה בזה שהם פוסלים אחרים, •
אלה אנשים שביקורתיים כלפי הממצא הראשוני ולכן לא מקפידים לעשות את מחקר הששחזור שלהם
באותו אופן שבו הוא אמור להיעשות .בעצם המחקר המשחזר לא עומד בסטנדרטים של המקורי .זוהי
תופעה קיימת אך אינה מרכזית ,יותר מרכזי זה השוני בפרוצדורה שנובע מחוסר בהירות ודיוק
בפרוטוקול של המחקר המקורי.
אוכלוסייה הטרוגנית – כל אוכלוסייה שעוברת מחקר היא שונה .השונות באוכלוסיה מביאה לשונות •
בתוצאות .יצאה כתבה שעוסקת בתהליך הארוך של שחזור מחקרים ,החוקרים פה העלו מחקר לז'ורנל
יוקרתי שנעשה על תולעים ואז לקח להם עוד 4שנים כדי לשחזר את המחקר הזה! הם גילו ששני
המחקרים התחילו אותו דבר אבל יש בשלב מסוים בתהליך שוני בין קבוצות התולעים במחקר המקורי
והמשחזר וזה מעיד על שוני בין האוכלוסיות.
חוסר הבנה של שיטות מחקר נכונות וסטטיסטיקה – זהו המרכיב המרכזי ביותר מבחינתנו .בחנו •
במחקר מהם הגורמים שהכי יעזרו לשחזור מחקרים וזו היתה התשובה ,שיפור ההבנה הסטטיסטית.
19.03.2020
רקע קצר על הפילוסופיה של המדע :אריסטו מוטרד משאלת ההסקה הלוגית ,כלומר איך אפשר להסיק שמשהו
אחד קשור לשני .הוא נותן דוגמה לאדם שהולך לטייל במרכז העיר ונופל עליו פסל ,הוא מביא 2אופציות לכך:
יום קודם האדם הזה רצח מישהו ועכשיו זה העונש שלו ,אופציה נוספת שהאדם נגע בפסל והוא נפל ...סביב
הדוגמה הזאת הוא מפתח מאפיינים לסיבתיות.
משתנה תלוי ( – )DVזוהי התופעה הנלמדת ,למשל יכולת ההבנה של הזולת בדוגמה של שבוע שעבר .זהו
המשתנה המושפע\המוסבר והנמדד.
משתנה בלתי תלוי ( – )IDVמועמד להיות גורם להבדלים בין אנשים בתופעה הנלמדת .זה מוצע כהסבר על ידי
החוקרים .למשל בדוגמה משבוע שעבר – עצם החשיפה לספרות יפה מעלה את יכולות ה .TOMזה המשתנה
המשפיע\המסביר ,והוא מתופעל\מיוחס (-מאפיין שמיוחס לתופעה הנחקרת והוא מובנה במשתנה עצמו כלומר
אני כחוקר לא יצרתי אותו אלא יכול רק לשלוט במאפיין הזה).
לדוגמה:
ההשערה שהיתה לחוקרים :קריאה איכותית הבנת הזולת .החוקרים מציעים פה שמה שמסביר יכולות שונות
בהבנת הזולת זה קריאה של ספרות איכותית .זוהי הרמה התיאורטית ,זה מה שמעניין אותנו ,אבל כל מערך
מחקר צריך להיות מתורגם לרמה המעשית שניתן לצפות בה.
ז'אנר הסיפורת (משתנה בלתי תלוי) מבחן זיהוי רגשות (משתנה תלוי).
כל אחד משני המשתנים האלו מתורגם למשהו מעשי .הבנת הזולת תורגמה למבחן זיהוי רגשות ,והקריאה
האיכותית תורגמה לסוגים שונים של ז'אנר ספרותי .ובפועל :נוצרו שתי קבוצות לכל משתנה :ז'אנר -קריאה
עממית וקריאה ספרותית ,מבחן זיהוי רגשות -מבחן זיהוי רגשות הועבר לשתי קבוצות שונות.
לסיכום:
נעסוק כעת בסוגי תקפים שקשורים לקשיים ולביקורות שניתן להציג על מערך המחקר.
תוקף סטטיסטי -בהמשך נעסוק בכמה סוגים של תקפים ,כשהעיקרון הוא האם ההבדל הוא מהימן .1
ומובהק -יכול להיות שההבדל הזה הוא זניח ,לא מובהק ,ואם נחזור על הפרוצדורה נראה שההבדל הוא
חסר משמעות ,חסר מהימנות כי אי אפשר לסמוך עליו.
קשר בין הסיבה והתוצאה -האם הקשר הזה הוא אמיתי או שיש משהו אחר שגרם להבדלים בין שתי .2
הקבוצות ,למשל אם קבוצה אחת קראה את הספרות היפה בתוך מסגרת בית הספר וקבוצה שניה לא
קראה ספרות יפה כי בגלל הקורונה כל אחד קרא בבית מה שיש לו – אז בעצם ההבדל שחשבנו בין
ספרות יפה ועממית לא קשור לסוג הספרות אלא לנסיבות .כלומר הקשר הפנימי שניסינו לצייר פה הוא
קשר שאולי יש בו בעיה.
ביקורת על התרגום שעשינו בין המשתנים התיאורטיים לאלה האופרטיביים .האם ככה באמת בודקים .3
את הבנת הזולת? אולי יש דרך אחרת טובה יותר ואמיתית יותר לבדוק זאת?
ביקרות רביעית קשורה לתרגום של כל המחקר הזה לעולם האמיתי ,לכיתה שלי .האם זה יישומי .4
ושימושי בעולם בחוץ? האם אני יכולה להפוך את זה להתערבות בית ספרית?
נרחיב על כל נקודה:
תוקף סטטיסטי:
האם ההבדל שראינו בין הקבוצות הוא מהימן (הבדל בין ממוצעים) ,או בשפה הסטטיסטית -האם הוא מובהק,
כלומר האם כשנחזור על אותה פרוצדורה נצפה לאותו ההבדל .אם כן – ההבדל אמין ומהימן וקיים באמת .אם
לא – לא ניתן לסמוך על ההבדל הזה ,הוא היה תוצאה מקרית וספציפית רק לאותם אנשים שדגמנו .הוא לא
יעבוד על אוכלוסייה אחרת ולכן לא ניתן לסמוך עליו .ובמילים אחרות – האם ההבדל אומר משהו עקרוני??
א .מצאנו משהו במקרה – 'נפלנו' על כל קבוצה מסוימת שבמקרה אצלה ראינו הבדל בין שני הממוצעים
(בין שתי הקבוצות :קריאה עממית\ספרותית) ,אבל בפועל הקבוצה הטובה יותר היתה כזאת שממילא
מורכבת מאנשים עם יכולות TOMגבוהות יותר וזה לא קשור למה שאנחנו עשינו.
מה גורם לזה?
-בדיקות מרובות :ניסוי שנעשה מלא פעמים אבל בסוף מדווח רק על הפעם היחידה שהצליחה ,או
שבודקים בטרייה של מבחנים כשרק אחד מהם מצליח ואתה מדווח רק על זה ומתעלם מכל שאר
המדדים.
-קריטריון החלטת החוקר ,כלומר נקודה שאנחנו החלטנו שממנה נתייחס לתוצאות כמובהקות
(מובהקות קטנה מ ,)0.05אבל אנחנו תמיד לוקחים ריזיקה שאנחנו טועים ,כלומר שאחד מתוך 20
מקרים שהצהרנו שיש משהו אמיתי – הוא במקרה( .למשל ברפואה לוקחים סיכון של אחד מתוך
אלף!) ,אז כל תחום ,לפי חומרת הטעויות בתחום הזה ,בוחר לעצמו את הנקודה שממנה הוא מצהיר
על הבדלים מסוימים כמשמעותיים.
כשמצאנו משהו במקרה לא ניתן לומר שיש פה תוקף סטטיסטי.
הביקורת כאן היא למה לא יצא מובהק במחקרי השחזור.
ב .פספסנו במקרה – מצאנו משהו אבל הוא לא יחזור על עצמו עוד פעם.
מה גורם לזה?
-גודל מדגם :לקחנו כמות קטנה של אנשים (כך שלא היה מספיק מקום לשונות)?..
-גודל באוכלוסייה :לקחנו אנשים מאד שונים ,הטרוגניות גבוהה ואם היינו שומרים על קבוצות
הומוגניות ואז מפעילים את ההתערבות אז היינו רואים את ההבדל (למשל אם נעביר מערך שיעור על
שתי קבוצות של תלמידים ברמות אינטליגנציה שונות).
-רמת מובהקות :בחרתי קריטריון מאד מחמיר ,למשל ,0.001זה קריטריון מאד נוקשה על מנת
להצהיר על הבדל ולכן לא יכולתי לזהות הבדלים עדינים יותר.
-גודל האפקט :אם ההבדל הוא מאד קטן יכול להיות שלא תראה אותו אם לא תיקח מספיק נבדקים
אבל אם ניקח מערכים גדולים של נבדקים אז
נוכל לזהות הבדלים עדינים .למשל ,אם יש לי
תרופה להצטננות עם אפקט גדול מאד אז מהר
נראה את ההבדלים אבל אם האפקט שלה קטן
נראה את זה רק כשיהיו יותר אנשים.
תוקף פנימי:
מטרה :לתקף את ההשפעה הבלעדית של המשתנה הבלתי תלוי על התוצאה .החשש שלנו הוא שההבדל שמצאנו
הוא מלאכותי ,זה נקרא ארטיפקט .היה פה משתנה חיצוני להתערבות שלנו שהשפיע על גודל האפקט .לדוגמה:
שינויים בהליך הניסוי :למשל הנסיין בקבוצה אחת מאד מאמין בקריאה כדי לשפר הבנת רגשות, -
ואילו בקבוצה השניה הנסיין מאד נטרלי בנוגע לתוצאות ,אז ההבדל בין הקבוצות קשור לא רק לסוג
הטקסט אלא למי שהעביר את המחקר .שתי הקבוצות פה עברו תהליך שונה! כל קבוצה קבלה
טקסט שמתווך על ידי גורם שונה! לכן המסקנה פה יכולה להיות שיש הסבר חלופי לתוצאה.
חוסר שוויון התחלתי בין הקבוצות :אמנם יצא לי שבקבוצה אחת היה תפקוד גבוה יותר מהשניה, -
אבל יכול להיות שההבדל הזה לא קשור לטקסט אלא הוא הבדל מוקדם בין הקבוצות ,קבוצה אחת
מלכתחילה הם פחות טובים ואז גם אם לא היינו עושים כלום עדיין היה אותו הבדל! זה הסבר
חיצוני בכלל להתערבות של הקריאה.
שינויים במהלך הניסוי :יכול להיות שתנאי מסוים התרחש כמו רעש חיצוני ,תקופה מלחיצה ...והוא -
גרם להבדלים בתוצאה של המבחן וזה בכלל לא קשור לסוג הטקסט שקראנו.
פתרונות:
שליטה מקסימלית – תנאים כמה שיותר שווים ,שתי קבוצות שבהן אני בודק את זיהוי הרגשות בלי •
הפרעות של משהו בחוץ למשל :אותו נסיין לשתי הקבוצות.
השמה רנדומלית – משתתף יסווג לכל קבוצה בצורה מקרית .זה אומר שבשתי הקבוצה יהיו אנשים •
חזקים יותר וחלשים יותר בתפקוד שלהם.
קבוצת ביקורת – למשל אפשר ליצור 3קבוצות :קבוצה אחת שקוראת קריאה ספרותית ,קבוצת •
שנייה שקוראת קריאה עממית וקבוצת ביקורת שקוראת קריאה עממית והנסיין עם מוטיבציה גבוהה
להעברה ,כך שאם נוצרו עדיין הבדלים ,אנו יכולים לשלול את המוטיבציה של הנסיין כהסבר אפשרי.
ארטיפקט אומר שההבדל לא קיים ,המניפולציה לא עובדת ,ההבדל שמצאת התקבל במקרה בגלל משהו אחר
שגרם לזה (כמו הבדלים ראשוניים בין הקבוצות עוד לפני המחקר) .זוהי טענה של תוקף פנימי.
טענה של תוקף מבנה :קונפאונד – ההתערבות כן עובדת ,אם תחזור על זה שוב תקבל את אותו הבדל אבל זה לא
בגלל הסיבה שאתה חושב ,התרגום היישומי שאתה עשית לטקסט מסוים עממי או טקסט מסוים ספרותי הוא לא
הולם את מה שרצית באמת לבחון (קריאה עממית\איכותית) ,פשוט בחרת טקסט מעניין יותר בהשוואה לטקסט
פחות מעניין .ללמד ולגרום להנאה ניתן לעשות בכל ז'אנר ולכן ההלימה שאתה עשית לסוג הקריאה היא לא
נכונה.
תוקף חיצוני
זה נוגע לשאלה מה אומר המחקר על העולם האמיתי ,באיזה מידה החוקרים עזרו לנו להגיע להחלטות הנכונות
מציאותית ,האם ההחלטות שלהם מאפשרות לנו לקחת את המסקנות שלהם גם לעולם האמיתי .אפשר להעלות
כמה סוגים של ביקורות בהקשר הזה:
לסיכום:
שאלת התקפים שעסקנו בהם היום שואלת האם ומה ניתן ללמוד מהחקר שעשינו ,כאשר החששות השונים
גורמים לנו להיות מודעים לטעויות בהסקה.
התקף הסטטי והתוקף הפנימי מתייחסים ספציפית למה שמצאנו ושואלים האם ההבדל הוא מהותי ונגרם
מההתערבות שעשינו ,תוקף המבנה והתוקף החיצוני שואלים מה המשמעות של ההבדל הזה.
26.03.2020
מקרה שהיה -אוני' ברקלי מואשמת שהיא מפלה נשים באופן שיטתי בקבלה לתואר שני .כל שנה מתקבלים 10%
גברים יותר בהשוואה לנשים .נוצרה סערה גדולה .לאוני' לא היתה כוונה מוצהרת לעשות הפליה כזאת ,נעשה
ניסיון להבין איך זה קרה ,האם יש פה הטייה סמויה או שניתן להסביר את הנתונים באופן אחר? יכול להיות שיש
משהו נוסף שאנחנו לא מודעים לו...
לכן האוני' ביקשה מכל אחד מהחוגים לדווח מה שכיחות הגברים והנשים שיש שם ,כדי לזהות את "החוג
החולה" שבגללו נוצרו הנתונים האלה.
כלומר יש לנו פה משהו נוסף ,כאשר רק סוכמים את הנתונים בצורה פשוטה רואים הטיה אבל כאשר מסתכלים
פנימה יותר על סוג החוג ומדיניות הקבלה הדברים יותר מתאזנים.
לפעמים צריך לעשות מערכי מחקרי מתקדמים יותר שיעמיקו את ההבנה לנו ,במיוחד כאשר הממצאים לא
מתיישבים עם ההבנה הבסיסית שלנו .אז קודם נראה אם יש בעיה בתקפים ואם זה לא מסביר את התוצאות אז
אולי צריך מערך מחקר יותר מעמיק ומתוחכם שיביא לידי ביטוי דקויות נוספות.
זהו תהליך שקורה בכל תחומי הדעת כאשר מנסים לבחון שאלות מעמיקות.
כלומר עלינו להתקדם מעבר להשוואה הפשוטה כדי שנצליח לומר משהו מדויק ,מעמיק ומרחיב יותר וכך נבין
את התמונה יותר טוב .מסקנה בשבילנו :כאשר אנחנו מתכננים מחקר עלינו לנסות שהוא יהיה כמה שיותר עשיר
מבחינת האינפורמציה שהוא אוסף ,גם אם מעניינת אותנו בסוף השוואה פשוטה בין שתי קבוצות כדאי לנו
לאסוף עוד נתונים שיכולים להעשיר את התמונה שלנו.
כיצד למדוד?
קודם כל יש להשוות בין מחקר מתאמי ומחקר ניסויי .מחקר מתאמי (קורלטיבי) הוא מחקר שבו אנחנו רואים
פשוט מה קורה בעולם ,אנחנו לא מנסים להשפיע על המצב ,אנחנו ניגשים למציאות ומודדים מה קורה שם .אז
למשל בדוגמה שלנו על קריאה והבנת הזולת ,אני אגש לאנשים ופשוט אשאל אותם כמה שעות אתם מקדישים
לקריאה ואיזה סוג קריאה ,אני אבדוק איך הם מתפקדים בזיהוי רגשות ,ככה יהיה לי את שני הנתונים האלה
ואני אבצע מתאם בין השניים .כאמור ,לא השפעתי כלל על הנתונים.
סוג מחקר זה רווח בספרות אבל הבעיה שלו היא שהוא לא מאפשר לדעת מה גרם למה .למשל הדוגמה הקלאסית
של מידת הנעליים ויכולת הצלחה בבגרות -נמצא קשר חיובי בין מידת הנעליים והצלחה בבגרות .הסיבה :כי
ילדים עם מידת נעליים קטנה לא יצליחו בבגרות ולהיפך ,כלומר יש פה השתנות משותפת אבל מחקר מתאמי לא
מאפשר לנו להגיד משהו סיבתי כזה על הקשר שנמצא .מצד שני ,היתרון שבו הוא הקלות והנוחות שניתן לאסוף
את הנתונים.
בקצה השני יש מחקר ניסויי שמנסה לתפעל ולהשפיע על אחד המשתנים כדי שנצליח לטעון משהו נוסף .אז למשל
אקח קבוצה רנדומלית של אנשים ,אחלק לשתי קבוצות ,כל קבוצה תקרא ז'אנר אחר ואז אראה את יכולות הבנת
הנקרא .כלומר אני כחוקר יצרתי איזשהו הבדל ,התערבתי והשוויתי בין המצבים ולכן נוכל לדבר על השפעה!
בדוגמה הקודמת למשל אני אתן לחלק לנעול נעליים קטנות ולחלק גדולות ואבדוק אם יש הבדל בציוני הבגרות.
זה יאפשר לנו לדבר על סיבתיות ,מה שלא ניתן במערך המתאמי.
בין שני הקצוות האלה יש שני סוגי מחקרים רווחים בתחום החינוך:
מחקר אורך :בדיקה לאורך זמן .אני כחוקר לא מייצר את הזמן אלא זה סדר התפתחות כרונולוגי שאני •
יכול לעקוב ולראות מה קורה בכל שלב בהתפתחות ואז להניח על זה הנחות ומסקנות מסוימות .זה לא
ניסויי כי לא עשיתי התערבות ,אבל כן הייתי כפוף לאילוץ כרונולוגי .זה מחקר קוואזי ניסויי ,דמוי ניסויי
אבל לא ממש ניסויי ,רק כפוף לנסיבות .זה לא אני מתפעל את הסיטואציה אלא הזמן.
עוד אופציה :מחקר אורך בין קבוצות שעברו התערבות מסוימת ,ואז יש לי יכולת לטעון על סיבתיות
בנוגע למשתנה אחד של ההתערבות ,אך אין לי יכולת לטעון לסיבתיות בנוגע למשתנה השני של הגיל (וזה
הקוואזי).
מחקר חוצה קבוצות (מחקר רוחב) :החוקר בכוונה פונה לאנשים שהם מקבוצות שונות (מקום מגורים •
שונה ,גיל אחר ,)...לא יצרתי את התפעול הזה ,יש פה הבחנה קיימת וברורה בין קבוצות ואני יכולה
לראות מה קורה בכל קבוצה למרות שלא יצרתי את ההבדל .זה גם יכול להיות ניסויי אם הוספתי
התערבות בכל אחת מהקבוצות אבל רק על זה אני אוכל לטעון לסיבתיות.
לסיכום:
המצב הנקי ביותר ,שלא תמיד אפשרי ,הוא שאני יוצר את ההבדל בין הקבוצות מלכתחילה – מחקר ניסויי .אם
זה אפשרי זה מאד עוזר להגיע למסקנות נקיות וברורות יותר.
א .מערך מחקר תוך נבדקי – כל בנאדם נבדק בשתי מדידות לפני התערבות ואחרי התערבות .למשל גם
כשהוא קורא ספרות פופולרית וגם ספרות עממית ואז ממלא שאלון הבנת הזולת .זה אותו בנאדם בשני
תנאים.
יתרונות:
✓ אקונומי ,חסכוני – דורש פחות נבדקים ופשוט עובדים איתם לאורך זמן.
✓ מצמצם השפעת הבדלים בין אישיים – זה חשוב ביותר .לדוגמה בדוגמה שלנו על קריאה ,היו לנו
שתי קבוצות עם רמה גבוהה\נמוכה של קריאה או הבנת הזולת ,היה לנו הרבה אלמנטים
שיוצרים שונות בין אישית שהיא בכלל לא קשורה להשפעת ההתערבות שלנו (שהיא סוג
הספרות) ,וזה מכניס רעש למדידה ומפחית את הסיכוי שלנו למצוא הבדלים מובהקים .אבל אם
עושים תוך נבדקי והאדם מושווה ביחס לעצמו ,למשל לפני ואחרי התערבות ,אז ההבדלים שיש
בין אנשים הם לא רלוונטיים בכלל ,לא נכנסים לתמונה ,וזה מגדיל את הסיכוי למצוא ממצאים
מובהקים במידה וההתערבות עובדת ,זה מגדיל את התוקף הסטטי.
✓ מחזק עוצמה סטטיסטית – עוצמה זה הסיכוי למצוא הבדלים במידה והם קיימים.
חסרונות:
-חשיפה חוזרת :עייפות ,שעמום ,אימון ,ואז האדם מבין מה קורה פה ומתאמץ במיוחד ולא בגלל
ההתערבות שלי .זה מייצר בעיה בתוקף של המסקנה שלנו( .כדי להתגבר על זה עושים קבוצת ביקורת).
ב .בין נבדקי – זה לא אותו אדם בשני המצבים ,אלא המדגם מחולק לשתי קבוצות וכל קבוצה מקבלת מצב
אחד בלבד.
יתרונות:
✓ נמנעים מהטיות שנובעות מחשיפה חוזרת
✓ המשך של זה -ככה הנבדק נשאר עיוור לתנאים ולמטרות של המחקר.
חסרונות( :אלה היתרונות של התוך נבדקי)
-רעש אפשרי כתוצאה מהבדלים אינדיבידואליים.
-דורש יותר נבדקים.
הערה על עוצמה סטטיסטית ורגישות של מערך מחקר( :מדוע מערך תוך נבדקי מחזק עוצמה? הזכרנו את זה
מקודם וכעת נרחיב)
אפקט -ההבדל בין הממוצעים .אז למשל קבוצה 1הצליחו לזהות הבדלים ברגשות של 25דמויות ,והקבוצה
השניה הצליחה אצל 27דמויות .זהו האפקט – ההבדל בין הממוצעים .ככל שההתערבות יותר משמעותית אז
ההבדל יגדל.
שונות – באיזה מידה יש הבדלים בין אנשים בצורה שאני לא יודעת להסביר אותם ,שונות שלא קשורה
להתערבות שעשיתי .כל יתר ההבדלים שלא קשורים לקבוצה שבה הם היו זה רעש ,זה שונות שכרגע אנחנו לא
יודעים להסביר .יכול להיות שהמדידה שלי לא טובה (כמו משקל מקולקל) או הבדלים בינאישיים...
אפשר לראות שהסיכוי למצוא הבדלים קטנים מושפע רק משונות .ככל שההבדלים המקריים הם גדולים יותר
אז הרגישות של המחקר היא קטנה יותר .ככל שיש שונות מאד גדולה ,למשל שונות באינטליגנציה ,בקבוצה
שקראה ספרות גבוהה ,אז הרגישות שלי להשפעה של ספרות גבוהה תהייה נמוכה כי אני לא אזהה הבדלים
קטנים .אבל ככל שהשונות בין אנשים היא קטנה אז מערך המחקר שלי יותר רגיש גם להבדלים קטנים .רואים
את זה בגרף .כל התפלגות מייצגת ערכים של קבוצה מסוימת.
אנחנו רואים שהממוצעים שונים וגם שיש שונות .בטן גדולה = שונות גדולה ,בטן קטנה = שונות קטנות .מרחק
גדול = אפקט גדול ,מרחק קטן = אפקט קטן.
ככל שהשונות קטנה יותר אז הרגישות עולה ,לכן כדאי לעשות שימוש במחקר שבו השונות קטנה .איך משיגים
את זה? – כלי מדידה מהימנים ,הומוגניות גבוהה בתוך הקבוצה (לדאוג לזה מלכתחילה למשל שכולם באותה
רמת אינטליגנציה או רמת התפתחות ,וכן גם על ידי הקצאה רנדומלית ככה שאם יש הבדלים הם יהיו בשתי
הקבוצות לא ירוכזו הקבוצה אחת).
עוצמה מושפעת גם מהשונות וגם מהאפקט .ככל שההתערבות יותר דרמטית (קריאה של חודש ולא של 10
דקות!) אז יש אפקט גדול יותר ,כלומר יש סיכוי גבוה יותר למצוא הבדל.
בשקופית יש 4מצבים .כאשר מצליחים לצמצם את השונות בתוך הקבוצה ,שזה המעבר מ aל ,bאז צמצמנו את
השונות ואז הגדלנו גם את הרגישות וגם את עוצמת המחקר .פספסתי פה משהו על מעריכים שונים .ואז ממילא
גם העלתי את העוצמה .יש יותר סיכוי שאמצא הבדלים( .אם אני רוצה לשפר את העוצמה והרגישות אני צריכה
לצמצם את השונות).
דרך נוספת לחזק את העוצמה זה לפנות לאפקט .כלומר אם אני חושבת שיש השפעה להתערבות מסוימת אני
אפעיל אותה במידה יותר חזקה .למשל בתרופות ,אני יכולה לקחת מינון נמוך אבל אם אני חושבת שיש לזה
אפקט אז אני אקח מינון גבוה ואז הציפיה היא שיהיה אפקט יותר גדול .יהיה לי סיכוי גבוה יותר לזהות הבדלים.
זה המעבר בין bל .dהרחקתי ממוצעים והגדלים עוצמה .זוהי אותה שונות רק הרחקת ממוצעים לאור התערבות
יותר דרמטית.
cפשוט מראה שבכל מצב ,גם אם השונות גדולה או קטנה ,אני יכולה לעבור בין התערבות חלשה וחזקה שתגרום
לפער יותר גדול בין המצבים.
אז אם רוצים לגלות הבדלים בין קבוצות אנחנו רוצים לצמצם הבדלים שלא קשורים למערך המחקר (-צמצום
השונות) או להגדיל את ההתערבות ( -חיזוק העוצמה) .במערך תוך נבדקי אנחנו מצמצמים הבדלים בין אישיים
ואז אנחנו רגישים יותר להבדלים של ההתערבות כלומר הרגישות שלי עלתה וממילא העוצמה עלתה ולכן מערך
תוך נבדקי מחזק את העוצמה.
כאמור זה מחזק את התוקף הסטטי .דברנו שבוע שעבר על טעות ביתא – פספוס אפקט קיים ,ייתכן שלא מצאתי
את האפקט כי המדידה לא היתה מספיק רגישה ,ולכן אם אנחנו מעלים רגישות אנחנו מצמצים את טעות ביתא!
יכולת הסקה טובה על סיבתיות (סולומון)
סולומון אומר שאם יש אפשרות לעשות תוך נבדקי ובין נבדקי ,אז למה שלא נעשה את שניהם? – זהו מערך
מעורב .הוא הציע את מערך המחקר האידאלי מבחינת הסקה על סיבתיות – וכך צריך לכלול 4תנאים:
- Rזה סימון של המילה רנדומלי ,כלומר המשתתפים בקבוצה הגיעו בצורה מקרית .זהו סיווג רנדומלי שמחלק
בצורה שווה הבדלים מוקדמים.
- Oמייצג את המילה מדידה O .מופיע פעמיים כי הוא מסמן שמדדתי פעמיים .למשל לפני ואחרי התערבות.
אם נשווה את קבוצות 3ו 1זה יראה האם עצם המדידה המוקדמת עשתה השפעה :השוואה בין 2Oו 5O-מראה
את השפעת המדידה הקודמת .אם רואים את אותו ערך אז זה מראה שהמדידה המוקדמת לא השפיעה ,אבל אם
היה להם ערך שונה זה מראה שהמדידה המוקדמת כן השפיעה .זהו הערך של הוספת קבוצה 3וכנ"ל לגבי :4
אנחנו רוצים לדעת מה הערך ללא התערבות מוקדמת וללא מניפולציה כלל – אולי היתה פה בשילה טבעית או
החלמה טבעית מבלי לעשות כלום .נשווה את 4לקבוצה 3ונראה אם ההתערבות עזרה בלי המדידה המוקדמת.
אפשר לומר שגם קבוצות 2,4הם קבוצות ביקורת 2 .מבקרת את השפעה של ההתערבות 4 ,מבקרת את ההשפעה
של ההתערבות הממוקדת וגם של המדידה המוקדמת .קבוצת הניסוי היא כאילו קבוצה .1
ברגע שיש לנו את ארבע הקבוצות האלה היכולת שלנו לדעת מה השפיע על מה היא דיי גבוהה כי כל איום או
סכנה לטעות נבדק פה ,לכן הצורה של סלומון היא הצורה הכי אידאלית לעשות מחקר .החיסרון – נוספו עוד
קבוצות ,זה דורש זמן ומשאבים ,אבל אם חשוב להבין משהו אז זאת הדרך הנכונה כדי להסיק על סיבתיות.
23.04.2020
מחקר עדכני יותר על כמות גדולה של התערבויות בחינוך ,בדק האם האפקט שלהן חוזר על עצמו בתנאי מעבדה
אידאליים ,רק 42%מהן עבדו שוב בפעם השניה.
לאחר מכן עשו סקירה נוספת על 90התערבויות ובדקו מה קורה כשהתוכנית מיושמת בשטח – עם מורה אחר,
תלמידים אחרים ,אזור אחר בארץ ,שעה אחרת וכדומה ,וראו שזה צונח ל 12%כלומר רק התערבות אחת מתוך
.10כלומר יש לנו קושי אמיתי לדעת איזה מההתערבויות שלנו עובדות .יש עליה הדרגתית בראיות שמראות
שמדדי התוצאה בשיפור של התלמידים -בפועל הם לא מראים תוצאה כשחוזרים עליהם.
אז יש לנו פה שאלה אמיתית ,כשאנחנו קוראים במחקר על התערבות שעובדת זה בכלל לא בטוח שהיא תעבוד
כשמישהו אחר מיישם אותה ,או בפועל בכיתה ,עם נסיבות של הכיתה ,מדינה ,וכו'...
לכן החוקר הזה אומר קודם כל לבדוק את האמינות של המחקר שאנחנו מתבוננים עליו לפני שמיישמים אותו.
קודם להיות בטוחים שהמידע שיש לנו על ההתערבויות הוא אמין ואמיתי .צריך להיות יותר ערניים באיזה הקשר
ההתערבות עובדת ,על מה היא משפיעה שאמור להוביל לתוצאה הרצויה .כל המידע המתסכל הזה שעלה פה יכול
לעזור לנו לגשת בצורה שיטתית ולהסיר את המחסומים שהיו ביישום התוכניות הללו.
יצירת תנאי מעבדה להצלחת ההתערבות – זה המצב האידאלי כי יש מקסימום שליטה על נטרול הפרעות •
חיצוניות ,זוהי בדיקה של יישום התוכנית בצורה מדויקת – זה מגדיל את הסיכוי שנמצא אפקט( .מחזק
ת .סטטי ופנימי) (זה גם מה שראינו עם המחקר בהרווארד ,שכשחוזרים על מחקר בתנאי מעבדה הוא
אכן עובד ב 40%מהמקרים) .המחיר של הסטריליות הזאת זה שבמציאות המחקר פחות רלוונטי (פוגע
בת .החיצוני) .אי אפשר לתפוס את שתי הנקודות ,בוחרים מה יותר חשוב בשלב של המחקר ,האם
אתה בהתחלה ורוצה לבדוק שזה עובד ,או שכבר הגעת לזה ואתה רוצה לבחון את המצב בשטח ,אז אתה
מלכלך את תנאי המעבדה אבל מקבל אפקט מציאותי יותר .זהו פער מובנה ביכולת לתפוס את השליטה
וגם את הרלוונטיות למציאות.
סלומון הציע לעשות מדידה מוקדמת (וגם קבוצה אחת בלי מדידה מוקדמת) כי המדידה הזאת מאפשרת •
לזהות הבדלים מאד קטנים ועדינים ,בגלל שהאדם נבדק ביחס לעצמו (זה ת .סטטיסטי) ,אבל זה יוצר
סוג של התערבות ,כי כשאדם יודע שהוא נמדד זה כבר משפיע עליו ,וככה זה לא משקף את המצב הטבעי
(פוגע בת .פנימי וחיצוני) .עצם המדידה מכניסה התערבות ואז אני לא יודעת מה השפיע ,אני לא אוכל
לומר שההתערבות עובדת תמיד ,אולי נגיד רק שכשאדם יודע שמודדים אותו זה עובד .כלומר יש פה
פגיעה בתוקף פנימי וחיצוני .שוב רואים את הפער המובנה ,אני רוצה להגדיל את רגישות המחקר אבל
יש לזה מחיר .הפתרון של סלומון זה הוספת עוד קבוצות.
השמה רנדומלית (ולא שהאדם בוחר) מחזקת את התוקף הפנימי אבל זה גם מייצר שתי קבוצות עם •
אנשים שונים במאפיינים שלהם וזה מכניס שונות גדולה ולכן גם מחליש את הרגישות להבדלים (פוגע
בת .סטטיסטי).
אז מה עושים?
הפתרון הוא לשאול את עצמנו באיזה שלב של בניית הידע אנחנו נמצאים .שלב ראשוני של ביסוס התערבות
מסוימת שהיא אכן עובדת – צריך לתעדף את מאפייני המחקר שמגדירים את התוקף הפנימי ,את היכולת לדעת
מה הסיבה לתוצאה שראינו -שנצליח לשחזר אותה ,שהיא לא מקרית מתוך סיבה שרירותית .שלב מאוחר יותר
כשרוצים להבין את התערבות -אחרי שכבר ראינו בשטח שהיא עובדת ,אנחנו רוצים לדעת מה המרכיב הגרעיני
שההתערבות משפיעה ומקדמת אותו ,אנחנו עכשיו שואלים את עצמנו מה קורה כאן מבחינה תיאורטית ,אז
נתעדף את מה שמחזק תוקף מבנה .בנוסך ,נתעדך את מערכי המחקר שמחזקים תוקף חיצוני כלומר התאמת
המחקר להקשרים שונים.
יש מאמר שיצא לפני עשור שטען שכל הגילויים הכי חשובים במדע היו אצל אנשים שסובלניים לעמימות .כי
מתחילים מחקר ויש הרבה קשיים ,אנחנו בודקים משהו שלא ברור איך זה עובד ולכן ברור שניתקל במצבים שמה
שנרצה לא יעבוד בצורה חלקה ,התגובה הראשונה היא אומנם התסכול אבל התגובה הבאה צריכה להיות סבלנות
ולבדוק מה פה לא עבד .רק ככה מתקדמים.
הערכה מסכמת :2יש שאלות שאנחנו שצריכים לשאול את עצמנו כשרואים מחקר ,והתשובות עליהן יגידו לנו
אם ההתערבות טובה או לא (מתוך האגודה למחקרי מניעה):
א .האם ההתערבות על מרכיביה השונים אכן אפקטיבית? איך עושים את זה – רואים שנעשו מחקרים עם
קבוצת ביקורת בהשמה רנדולמית .אם זה לא נעשה לא נוכל להסיק על ת .סטטי ופנימי .הראיות חלשות.
אבל אם זה נעשה עם לפחות קבוצת ביקורת אחת (סלומון זה האידאל) עם השמה רנדומלית לקבוצות –
אז כבר אנחנו יודעים שחשבו על ההתערבות הזאת בצורה מסודרת .דבר נוסף ,צריך שבמחקר יהיו
מינימום שתי נקודות מדידה ,למשל לפני ואחרי או שהתוכנית הצליחה להוכיח שהיא עובדת אחרי שנה
(אם בדקו את התלמידים אחרי שנה וראו שקבוצת ההתערבות טובה יותר מקבוצת הביקורת) .דבר נוסף,
לראות שהמדדים של התוצאות באמת משקפים את המדדים שההתערבות מנסה להשפיע עליהם .המדד
שאתה מראה בו השתפרות אמור להיות קשור למרכיב שלך בתוכנית.
ג .מרכיב שהרבה התערבויות נופלות בו :האם יש תיאוריה ברורה לגבי הגורם לאפקטיביות של
ההתערבות?
(איך אפשר להסביר את הפער בין מדידות שמצליחות במעבדה וצונחות בביצוע שלהם בשטח –)
צריך לזהות משתנים מתווכים – צריך לזהות מה בדיוק ההתערבות עושה ,זה קשור לתוקף מבנה,
התערבות טובה היא כזאת שיודעת להגיד מה קרה באמצע ,בין ההתערבות ובין התוצאות .לדוגמה
התערבות שעושה הנחיית הורים ואז תוצאה שההתנהגות של הילד השתפרה -מה קרה שם באמצע? אולי
זה התגובות של ההורים שהן רגועות יותר ,אולי זה ההקשבה שלהם ,בעצם מה המשתנה המתווך שהוביל
לתוצאה הרצויה.
לפרוט את כל שלבי ההצלה זה חשוב מאד ,כי זה מאפשר לתוכנית להיות גמישה בפוטנציאל שלה
להתאים למקומות נוספים.
ד .פוטנציאל התאמה והטעמה של ההתערבות:
עכשיו כשאני רוצה להמליץ על ההתערבות אני חייבת לציין מה יעזור לה לפעול כראוי באוכלוסייה
הרחבה ,למשל מספר מפגשים שנחוצים ,זה משהו שממש משפיע .הירידה הזאת לפרטים יכולה להנחות
אנשים על העיקרון ,כלומר זה לא חובה לעשות בדיוק איקס מפגשים ,אבל חובה לעשות מספיק מפגשים
עד שרואים שהמיומנות שרציתי להשפיע עליהם אכן נרכשה .זה בעצם התאמה אישית של ארסנל הכלים
שדרכם עושים את ההתערבות ,אבל ההתערבות עצמה היא אותה התערבות .נגיד הבנו שחשובה תשומת
הלב וההקשבה ,עכשיו המטפל עצמו יתאים איך לעשות את זה ,בשיחה ,או במשחק (זה לא חייב להיות
דווקא מה שאני כחוקר עשיתי ,אבל זה על אותו עיקרון)...זה נותן הרבה גמישות לך ולאחרים להשתמש
בתוכנית.
סוכנים חלופיים הכוונה למי שמעביר את ההתערבות .יש תוכנית שבנויות בצורה שנועדה לא לאפשר
בקלות לאנשים אחרים לעשות את ההתערבות (למשל כי הם רוצים להרוויח כסף מהתוכנית ,אין להם
עניין להסביר לך בדיוק איך תוכל להחליף אותם וליישם את ההתערבות).
30.04.2020
דוגמה :2תחום ריפוי בעיסוק ,מחקר שבדק שתי קבוצות התערבות ,המדד הוא כמה זמן לוקח לאנשים שעברו
אירוע מוחי לעשות פעולה מסוימת.
מצוינות פה שורה של פעולות כמו להרים סל ,לקפל מגבת ,אלה המדדים התלויים בתחום ריפוי בעיסוק .ההנחה
היא שככל שלוקח לאדם יותר זמן לעשות את הפעולה אז המצב המוטורי שלו ירוד יותר .זה המשתנה התלוי.
יש התערבות מסורתית שפשוט חוזרים על הפעולה עם הבנאדם שוב ושוב ,והחוקרים רוצים לעודד התערבות
חדשה שבה לא אומרים לאדם איך לעשות את הפעולה אלא שימצא בעצמו דרך לעשות אותה – זוהי ההתערבות
החדשה .זה דומה מאד לשאלות שיעניינו אותנו בהקשר חינוכי -רוצים שאדם ירכוש מיומנות כלשהי בכיתה,
והשאלה היא האם להראות לו את הפעולה הזאת או לתת לו לגלות לבד את הדרך שעובדת בשבילו .הרעיון ברמה
התיאורטית הוא שיש הבדלים אישיים ולכל אחד יש דרך משלו .ברמה האופרציונלית ,ההתערבות נעשית כך
שאומרים לאדם מה לעשות ושימצא את הדרך.
יש פה קבוצת ביקורת וניסוי ,ורואים ביחד לכל אחת מהפעולות :אדום – לפני התערבות ,כחול – אחריה.
מה שאמור היה לפתור את זה זוהי הקצאה רנדומלית ואז הדברים מתאזנים .אם היו מעט מדי משתתפים אז
מאד קל לטעות ולייחס אפקט להתערבות כשבפועל זה אפקט שקשור להבדלים המוקדמים בין אנשים.
צריכה להיות צורת דיווח אחידה ,וגם כשקוראים תוצאות של מחקרים אחרים יש לבחון את הסקאלות
(לשאול את עצמנו האם זוהי טעות אנוש או הסתרה של אחד ההבדלים) .בכל אופן ,בהצגה אנחנו רואים בעזרת
הכוכביות שמי שעשה התערבות חדשה היו לו מגוון תפקודים שהשתפרו .כאן זה לא שהדיווח הסטטי הוא
מוטעה ,כי באמת היו יותר מטלות עם שיפור מובהק ,אבל הפרשנות של הממצא יכולה להיות קשורה לזה
שההתערבות עבדה ,או שהיא לא עבדה אלא שמצאו הבדל במקרה (טעות אלפא).
כאשר מציגים גרף כלשהו ,צריך לחפש מדד שנותן אינדיקציה האם הממוצע מייצג טוב את מה שקרה שם
או לא .בהקשר הזה נכנס רווח בר סמך ,סטיית תקן וטעות תקן .יש מגוון מדדים שמנסים לאמוד עד כמה
הממוצע מייצג טוב את הנתונים שמרכיבים אותו.
דוגמה :4מדד של מספר התנהגויות ומחשבות שמטרידות את האדם 3 ,קבוצות :טיפול התנהגותי ,קוגניטיבי-
התנהגותי ,ללא טיפול.
(בעיקרון הז'ורנלים עצמם צריכים לעשות ביקורת ולבדוק שהמאמרים מדווחים כמו שצריך ,לא מכניסים רעש.)..
לתקשר בצורה נקיה ואחידה את מה שחשוב .יש להימנע מאסוציאציות לא קשורות.
האנטנה זה הממוצע של העמודה ,מצפים שב 95%מהמקרים הממוצע יהיה ,15ואם הממוצע חורג מהאנטנות זה
אומר שיש משהו שונה שהוא לא הטיפול הרגיל...
לסיכום:
ז'ורנל ברמה גבוהה יותר או שפונה לקהל יותר רחב – אז ינסו לעשות עבודה טובה יותר בתקשור של הממצאים.
היסטוגרמה :גרף עמודות לתיאור משתנה רציף (אפשר למדוד כמה אנשים נמצאים בכל נקודה על הרצף).
ישנן צורות שונות של התפלגויות ,לדוגמה פה ,ציר - xמדובר על ציונים של .0-100ציר - yצפיפות או שכיחות
המקרים.
אז ההתפלגות העליונה משקפת מרכז ברור ,יש ציון ממוצע ,דומה להתפלגות אחידה ,השכיחות לקבל את
המקרים עם הציון הנמוך היא אותה שכיחות כמו לקבל את החלק הגבוה או האמצעי .כלומר השכיחות היא
דומה בכל הערכים השונים .רואים את זה גם בקווים למטה שהם פזורים לאורך ציר האיקס .בעצם הרבה אנשים
קבלו ציון בכל אחד מהציונים ....ולכן חישוב הציון הממוצע בהתפלגות כזאת יגיד מעט מאד כי השונות היא
גדולה!
הגרף האמצעי ,השכיח יותר:
התפלגות כאילו נורמלית ,מה
שאנחנו רואים זה את הציונים
השונים בציר איקס והשכיחות
שלהם ,ציר וואי אחוז המקרים.
סביב המרכז היו הכי הרבה מקרים,
ובחלקים הגבוהים והנמוכים פחות.
הקווים למטה מראים את הערכים
בפועל .הרבה תופעות בטבע נראות
ככה.
לסיכום ,ההסטוגרמה מראה לנו את ערכי המשתנה שאני מודד בציר איקס (ביצוע במבחן) וציר וואי שכיחות
הערכים.
בעזרתה מבינים את המגמה המרכזית ,יכולים לראות אם יש בעיה במבחן (כמו אפקט תקרה ורצפה) ,או בכלל
אם אין מגמה מרכזית כי השונות כל כך גדולה..
כאשר אנחנו מראים התפלגות חשוב לנו גם לדעת את השונות האינדיבידואלית סביב המאפיין המרכזי.
צורת ההתפלגות ,בנוסף למגמה המרכזית ולשונות ,מראה לנו גם מדדים של הטיה וגבנון .הטיה – מתייחסת
לזנבות -באיזה מידה הזנבות הם סימטריים ,האם הם שיקוף אחד של השני (כמה ערכים חריגים יש) .בהתפלגות
נורמלית אין הטיה (גם בהתפלגות אחידה) .גבנוניות – הדבשת של ההתפלגות ,כמה היא רחבה ,כמה פחוסה,
לעומת הזנבות .את כל זה מבינים מההסטוגרמה ,והעיקר זה המגמה המרכזית וגם השונות האינדיבידואלית
(מדדי פיזור) .
(זה לא משנה אם הממוצע הוא 50או ,95חובה להיות התפלגות נורמלית סביב הממוצע .זה המטרה של מבחן,
למצוא הבדלים בין תלמידים כדי שנוכל לתת מענה בהתאם).
מה השימוש שיש למגמה מרכזית ולפיזור סביבה? (למדדי מרכז ופיזור)
מגמה מרכזית = ניבוי .אם אני יודעת מה הממוצע וישאלו אותי כמה תלמיד קיבל בערך ,אז אני אגיד את
הממוצע .החשיבות הגדולה של מדדי המרכז היא להבין את המגמה המרכזית כי זה עוזר לי לעשות ניבוי על
התופעה הנחקרת .אבל זה רק ניבוי ,והשאלה הבאה היא מה הוודאות של הניבוי הזה?? -זה משהו שתלוי בפיזור
סביב הממוצע ,מתייחס אל המדדי הפיזור.
רואים את זה בשתי ההתפלגויות פה ,בשתיהן אותו
ממוצע ,רק שאחת עם גבנון נמוך וזנבות מאסיביים
והשניה להיפך.
אם אני צריכה לעשות ניבוי כמה קיבל תלמדי בכיתה – אני אגיד את ציון הממוצע .אבל אם ישאלו אותי עד
כמה אני בטוחה בניבוי -אז כשיש פיזור קטן יותר השימוש בממוצע הוא יותר מוצלח .הוא יותר אומר מה שקורה
באמת בכיתה ,לעומת זאת במצב שיש שונות גבוהה ,זה אומר שהממוצע פחות מייצג .זה אומר שאם ננסה לתאר
מה קורה בכיתה באמצעות הממוצע ,זה לא יגיד הרבה .השלכה של זה :אם אנחנו רוצים לעשות התערבות בכיתה
בתחום מסוים ,ומדדנו את התפקוד הזה ורואים שיש שונות גבוהה מאד אז אנחנו צריכים לעשות התערבויות
שמותאמות פרטנית למי שגבוה\נמוך בתפקוד .מצד שני ,אם אנחנו רואים שהשונות קטנה אז אנחנו יכולים
להתאים מערך אחד לכל האנשים.
(איך מגדירים שונות קטנה\גדולה כך שיהיה אפשר\אי אפשר להסתמך על הממוצע? – זה תלוי בתחום שעוסקים
בו ,או שאם אני לא יודעת את זה אז להשוות לשונות שיש בקבוצה אחרת).
07.05.2020
כיצד אפשר להשתמש בשיטות הצגה ויזואליות וסטטיסטיות כדי להבין יותר טוב את הנתונים ,למשל אם
התערבות בכיתה עובדת?
בוקספלוט:
בכל תוכנה סטטיסטית יש אפשרות לייצר גרף כזה.
הבוקספלוט לא כולל ערכים חריגים ,אם למשל מישהו קיבל 0הוא לא יתכנס בין שתי האנטנות ,הן מראות את
הטווח של כל הציונים למעט אנשים שקיבלו ציון מאד חריג .איך קובעים מה חריג? ברירת המחדל של
הבוקספלוט זה לבדוק מה הגודל של הקופסה ,ומי שמעל פעם וחצי של הגודל הזה בשני הקצוות לא נכנס ,ככה
קובעים את גבולות האנטנה .זה עוזר למקד את הנתונים.
.1האם בכלל יש לנו הבדל או שכל ההבדל שאנחנו רואים התקבל במקרה? ככל שהמובהקות יותר נמוכה
זה אומר שיש יותר סיכוי שאם תחזור על זה תגיע לאותם נתונים( .מובהקות של 0.01או )0.05
.2עד כמה ההבדל הזה הוא משמעותי? (האם ההתערבות הביאה לשיפור קטן או גדול?) זה המשמעות של
גודל האפקט .זה קשור לתוקף חיצוני ששואל עד כמה ההתערבות שעשינו אפשר ללמוד ממנה על העולם
החיצוני ,גודל האפקט נותן נתון סטטיסטי שאומר עד כמה זה מסביר הבדלים בעולם האמיתי.
מובהקות = מה הסיכוי שנקבל הבדל פעם נוספת .גודל אפקט = עד כמה ההבדל הזה הוא משמעותי ,עד
כמה ההתערבות מוצלחת.
דבר חשוב נוסף שיש לבחון כאשר משווים בין שתי קבוצות הוא מבחן לוין – בודק הנחה של שוויון בין השונויות,
כלומר לכל אחת מקבוצות המחקר יש את ה SDשלה והשאלה היא עד כמה ההבדל הזה בין הקבוצות הוא
משמעותי .בדוגמה פה יש הבדל של 3נקודות ב SDורואים את זה גם בטווח של האנטנות .מבחן לוין משווה את
המרחק בין האנטנות ואומר עד כמה זה זניח או חשוב.
תוצאה מבוהקת במבחן לוין אומרת שההבדל בין השונויות
בקבוצה הוא משמעותי .כאשר אין מובהקות במבחן לוין זה
אומר שההבדלים לא משמעותיים.
תכלס אנחנו רוצים שמבחן לוין לא יצא מובהק ,כלומר שלא תהיה הפרה של השוויון .לא מעניין אם יש פיזור
גדול או קטן בתוך הקבוצות אלא שהוא יהיה דומה.
מזה משנה אם יש הומוגניות בין השונויות או לא? אם השונות בשתי הקבוצות היא לא זהה יש משהו נוסף
שהשפיע על הציונים .יש פה בעצם משתנים מתערבים .לוין אומר טענה עקרונית :אם הפיזור לא זהה בין
הקבוצות אז יש משהו נוסף שהשפיע על אחת הקבוצות ,חוץ מזה שעשיתי התערבות ,וגרם לה להיות לא רק
בממוצע שונה אלא בפיזור שונה .פיזור שונה אומר תיזהר מלעשות טענה פשוטה כמו – ההתערבות עובדת או לא
עובדת כי כנראה יש משהו נוסף שהשפיע כפי שמעיד הפיזור השונה .לוין מזמין אותנו להבין יותר טוב מה קורה
בנתונים שלנו .נראה עוד כמה דוגמאות כדי להמחיש את זה:
מבחן ( :3רואים שנתון 8הוא חריג ,הוא מצוין מחוץ לאנטנות ולכן כדאי
לבדוק אותו)
[ Dfזה דרגות חופש ,זה נותן עוגן למספר המשתתפים (צריך להוסיף 2במבחן טי וזה אומר שהיה 44משתתפים.
- Tלוקח את ההבדל בין הממוצעים ואומר כמה זה משמעותי במושגים של ציוני תקן ( 2 .)Zומעלה זה מובהק.
- Pזה מובהקות - Cohen's d .גודל אפקט]
מבחן לוין בדוגמה פה בעצם אומר שכדאי לנו לחקור יותר טוב את הנתונים ולהבין עבור מי ההתערבות שלנו
עובדת.
מבחן :4לפי הבוקספלוט אפשר להניח שלא יהיה הבדל מובהק בממוצעים ,נבדוק בנתונים – וזה באמת מעיד על
הבדל לא מובהק ( ,)0.3 = pאבל אם נסתכל על מבחן לוין אנחנו מבינים שההומוגניות לא שווה בצורה מובהקת
לחלוטין ,יש הפרה מובהקת של השווין (באנטנות) .בגלל שמדד לוין אומר את זה – אם היינו עושים רק את מבחן
tהיינו מגיעים למסקנה שההתערבות לא עובדת ,שזה בזבוז זמן וכסף וסוגרים את הסיפור .אבל אם מעמיקים
לכיוונים סטטיסטיים נוספים כמו בעזרת מבחן לוין אנחנו מבינים שסה"כ ההתערבות לא עבדה ,אבל זה בגלל
השונות בין האנשים! ואז המסקנה תהיה :כהכללה פשטנית ההתערבות לא עובדת ,אבל אם אני מסתכל לעומק
על הנתונים והפרת ההומוגניות זה אומר לי לעשות בדיקה נוספת על מי זה כן עובד ועל מי לא( .לוין מזהיר לא
לעשות הכללה פשטנית של עובד לא עובד).
מסקנות מהשיעור:
.1הבנה שכדאי ללמוד יותר לעומק את הנתונים שיש לנו ,איך? קודם כל להסתכל על המובהקות ועל גודל
אפקט (עד כמה זה מתרגם להיות משהו משמעותי?) ,אפקט גדול -זאת ההתערבות שכדאי להתחיל
איתה .זה קריטי בעולם של משאבים מוגבלים .גודל אפקט עוזר לנו לעשות מדרג של ההתערבויות ואז
לבחור אחת מתוך בחירה מושכלת.
.2לא לחשוב רק על השפעות פשטניות ,אלא יש השפעות חשובות נוספות כמו הפרת ההומוגניות ,שזה אומר
שגורם נוסף השפיע על הנתונים וממלא המסקנה הפשטנית לא מספיקה וצריך להעמיק מתי ואיך ולמי
זה עובד או לא.
14.05.2020
נדבר על מצב אחר של השוואה בין שתי קבוצות :כאשר מדובר באותם האנשים ,למשל כשבודקים אותם לפני
ואחרי התערבות ,או כשאותו אדם נבדק בשני סוגים של מבחנים ,למשל כישורים קוגניטיביים וכישורים
חברתיים – ורואים אם יש הבדל בין התפקוד שלו בשני ההיבטים .כל זה נכנס לקטגוריה של מדידה חוזרת.
טעות הדגימה:
בעניין המובהקות ,חשוב לדייק את המושג טעות הדגימה:
מה גורם לחוסר מובהקות? -חוסר מובהקות הוא כאשר הבדל בין שני ממוצעים הוא מקרי .כיצד זה ייתכן?
טעות הדגימה – כאשר אני עושה דגימה של אנשים מתוך כלל המשתתפים ,אני בעצם לוקח רק חלק מהאנשים
ולא את כולם ,ובגלל שלקחתי רק חלק אז יכול להיות פער בין קבוצת הדגימה והקבוצה הכללית .הדוג' המוכרת
היא סקרים של דעת קהל לפני הבחירות ,לא תמיד דעת הקהל משקפת את התוצאות האמיתיות של האוכלוסייה.
טעות הדגימה אומרת שהמסקנה לא בטוח מייצגת את המציאות בצורה טובה ,כי התבססנו רק על חלק
מהאוכלוסייה.
תזכורת :אוכלוסייה = כלל האנשים שמעניין אותי לדעת לגביהם (אוכ' לא חייב להיות מלא אנשים ,זה פשוט
אלה שמעניין אותי להסיק עליהם מסקנות ,ומתוכם לוקחים מדגם) ,מדגם – מי שהשתתף במחקר שלי .מה
שבפועל מעניין אותנו זה האוכלוסייה.
הציונים שאני עלולה לקבל על המדגמים הקטנים נותנים לי טווח מסוים (נגיד פה )92-104ולטווח הזה אנחנו
קוראים טווח ביטחון ,רווח בר סמך .ואז כל דגימה שניקח נופלת בתוך הטווח הזה ,ומשקפת שונות סביב
הממוצע .אם יוצאת תוצאה בתוך הטווח הזה ,יהיה אפשר להשליך ממנה על קבוצה אחרת באוכ'.
בכל מחקר יש טעות דגימה כי כמעט ולא ניתן לעשות מחקר על האוכ' כולה ,לכן תמיד יצאו לי תוצאות
גבוהות\נמוכות יותר מהאוכ' עצמה.
במילים אחרות ,יכולים להיות הבדלים בין ממוצעים שהם מקריים ,פשוט נובעים מהעובדה שלקחתי מדגם ,וזה
נקרא טעות הדגימה ,ואז למרות שנראה הבדל בין שתי קבוצות (למשל אחת שעברה התערבות ואחת שלא) הוא
בעצם נובע מזה שלקחתי אנשים שונים למחקר שלי ולא בגלל ההתערבות .לדוגמה אם אנשים שעברו התערבות
קבלו ממוצע ,104ומי שלא עבר התערבות הממוצע היה ,100שזה אמנם הבדל של 4נקודות אבל יכול להיות שזה
לא מובהק ,כי גם מתוך אלה שלא עברו התערבות היו כאלה שהיו יכולים לקבל בין ...92-104טעות הדגימה
אומרת שזה לא מובהק ,סתם נפלת על אנשים כאלה במדגם שלך .אלה הבדלים מקריים שנובעים מטעות
הדגימה .וזה בדיוק הערך של Pשמשמעותו מה הסיכוי שההבדל שמצאנו בין הקבוצות נובע מטעות הדגימה.
כאשר 0.14=Pזה אומר שיש 14%שכל ההבדלים שמצאנו נבעו מטעות הדגימה 0.9=P ,זה אומר שכל ההבדלים
שמצאנו נובעים מטעות הדגימה 0.1=P ,זה אומר שיש רק סיכוי של אחוז אחד שניתן לייחס את ההבדלים האלה
לטעות הדגימה ,לזה שסתם בדקתי אנשים שונים .זוהי רמת המובהקות!
במדעי החברה :אם הסיכוי של ההבדלים שמצאתי נמוך מחמישה אחוז ,כנראה שזה לא טעות הדגימה ,כנראה
שהחוקר עשה משהו שבאמת גרם להבדלים ,אבל כל עוד P>0.05זה אומר שיש סיכוי גדול שההבדלים שמצאני
הם כי דגמתי אנשים שונים ,ואפילו אם לא הייתי מסתכלת על קבוצת ההתערבות אלא על קבוצתה ביקורת הייתי
רואה שיש הבדלים.
נראה את זה ויזואלית:
ניקח דוגמה ממחקר שראינו לפני שני שיעורים ,מחקר שבו אנשים התבקשו לומר עד כמה מתעוררות בהם
תחושות של חמלה ודאגה כאשר הם
שומעים שמישהו אובחן בקורונה .ציר y
זה הממוצע של רגש דאגה ורואים את
הממוצע אצל גברים ונשים .התשובות
היו בין .0-6ממוצע הגברים היה 4
וממוצע הנשים היה מעט גבוה יותר.
זה מדגם של 1000איש כאן ,וכלל שיש יותר אנשים הרווח בר סמך נמוך (אבל זה גם תלוי ברווח שאנחנו שמים על
ציר הווי כמו שראינו באחד השיעורים קודם).
הסימן הקטן הזה בעצם אומר שאם נפנה ל 1000נשים אחרות יצא לנו עמודה מעט שונה.
השרטוט מימין בעצם אומר שלא צריך את כל העמודות ,מספיק שיביאו לי רק את הטווחים עצמם .הנקודה
באמצע זה הממוצע של כל הממוצעים וסביב הנקודות של הממוצעים זה הטווח של הרווח בר סמך.
בגלל זה צריך כמות מסוימת של אנשים ,כי ככל שמשתתפים יותר אנשים אז ההשפעה של ערך חריג
מצטמצמת .הרווח בר סמך מצטמצם ככל שהמדגם יותר גדול.
למה אנחנו מסתכלים על התצוגה הזאת ולמה היא שימושית? – בעצם זה עוזר לנו לראות בעין האם יש הבדלים
שהם מובהקים .סורקים את הגרף ובלי לקרוא את המאמר יודעים אם זה מובהק .כאשר ממוצע של קבוצה אחת
לא נופל בתוך הרווח בר סמך של קבוצה שניה ,וגם להיפך -הממוצע של הקבוצה השניה לא נופל ברווח בר סמך
של הקבוצה האחרת אז זה מובהק בוודאות ,כי הרווח בר סמך מתייחס לטווח שבו יפלו 95%מהמדגמים
החלקיים שמתייחסים לקבוצה הזאת ,ואם יש לנו ממוצע של קבוצה אחרת והוא לא נופל בטווח הזה של
המדגמים בין אנשים זה מצביע על כך שכאשר עושים מבחן סטטי ההבדל הוא מובהק .לכן הסתכלות כזאת היא
מאד נוחה.
בינתיים הבנו שיש את הרעיון של המובהקות שאומר מה הסיכוי שהבדלים בין שתי קבוצות נובעים כולם מזה
שלקחתי אנשים שונים ,שזה נקרא טעות הדגימה -עצם פעולת הדגימה של אנשים ספציפיים ולא אחרים.
הערך של Pאומר לנו את הסיכוי שההבדלים האלה נובעים מטעות הדגימה ובאיזה סיכוי .אם ההבדל הזה גדול
מ 5%זה מצב שבו התוצאה שלי לא מובהקת .לבדוק אם לא פספסתי
האתר נקרא בדיקת סטטיסטיקה .אפשר להעלות אליו קבצים ,והאתר ישר
לוקח את כל הדיווחים של R F tואומר :זה מה שדווח בפועל במאמר ,וזה
מה שהיה אמור להיות מדווח כשמחשבים את הערכים האלה ביחס לנתונים
חשובים נוספים...ובעצם רואים אם מה שהחוקרים דיווחו הוא עקבי עם
מה שהיו אמורים לדווח .זה טוב כדי לראות כשאנחנו כותבים מאמר שלא דיווחנו על משהו טעות ,אפילו טעות
הקלדה...
21.05.2020
עד כה הסתכלנו על אבחנה בין שני מצבים .היתה לנו הנחה שיש הבדל בין שתי קבוצות מסיבה מסוימת
(התערבות ,הבדלים אישיים .)..העניין הוא שבחיים עצמם יש יותר מגורם אחד שמשפיע על התוצאות שאנחנו
רואים.
להשלים .רוב המחקרים שנעסוק בהם ננסה לראות גורמים נוספים שעשויים להיות רלוונטיים ,ואז לראות למי
מהם יש יותר 'כוח' להשפיע על התוצאות .אמנם אנחנו אוהבים לעשות הכללות פשוטות אבל בחיים זה לא כך...
ביטא – המדד של גודל אפקט .הוא קשור למדד cohenבמבחני t
והוא אומר כמה מוצלח המשתנה הזה בהבדלים בנתונים שלנו .אם
זה מסביר לנו סביב ה 5%הוא מוצלח במידה נמוכה – 10% ,בינונית,
– 20%מעולה .פה במקרה הוא מסביר 2אחוז וזה קטן .אפשר לראות
את זה גם בטבלה של גודל המדד כהן.
נראה את ויזואלית:
הנקודה כאמור מייצגת ממוצע ,האנטנות את הרווח בר סמך ( -הטווח שבו אנחנו צופים שיצאו הממוצעים של
95%של אותן דגימות קטנות מתוך הקבוצה הגדולה ,לכן כשממוצע של קבוצה אחת הוא מחוץ לטווח של קבוצה
אחרת אז נגיד שהוא לא אחד מאותן דגימות קטנות אפשריות ולכן כנראה שהוא שונה מהותית מהקבוצה
השניה) .לא במקרה יצא כך.
ציר איקס – מגעיל .הצבעים – מבהיל .ציר וי – עוינות.
בנוגע למדד המגעילות :אנחנו יודעים שזה מובהק ,גודל אפקט גבוה.
בגרף אנחנו מתעלמים מכמה זה מבהיל ,אנחנו משווים את המרחק בין
הנקודות בכל אחד מהעמודות בתנאים – גבוה\נמוך .הממוצע של כל שתי
נקודה בעמודה יצא איפשהו באמצע ,ומראה שכשהחרק מגעיל יש יותר
עוינות כלפיו( .ומופיע בטבלה העליונה בצילום מסך הקודם).
נראה את הגודל אפקט – אנחנו כבר יודעים לומר כמה משתנה מסוים הוא חשוב או לא לפי גודל האפקט שלו.
(אם היינו מסתכלים רק על המובהקות היינו אומרים שכולם חשובים ,אבל לא יודעים מה יותר או פחות ,עכשיו
אנחנו יודעים שמגעיל ומפחיד חשובים באותה מידה) .גודל האפקט אינטראקציה הוא חצי מהגודל אפקט של
מגעיל ומפחידות .אמנם בגרף זה נראה יותר אבל בניתוח הסטטי זה מסביר רק ( 10%לעומת האחרים שמסבירים
.20%איך אפשר להסביר את זה?
יש הערה קטנה שמופיעה מתחת לטבלה של האפקטים שאומרת שהאפקטים שאנחנו רואים מתעדפים הפשטה,
מתעדפים הסברים שנותנים יתרון לאפקטים עיקריים ,לטענות כלליות (כמו :ההתערבות עובדת .המגעילות של
העכביש חשובה .המצב הקודם קריטי) .ניתוחי השונות של פישר ,בצורה מובנית ,הולכים לפי מתן קרדיט גבוה
יותר להסברים פשטניים יותר .רק אחרי שניתן מקום להבדלים העיקריים ניתן קרדיט לאינטראקציה ,אבל זוהי
בחירה ,זוהי גישה אחת ולאו דווקא הנכונה (למרות שהיא ברירת המחדל כאן) כי כאשר יש לנו מצב של
אינטראקציה היכולת להגיד מתי משהו משפיע היא יותר מעניינת מאשר הטענה הכללית הפשטנית .לכן כיום
ההנחיות של המאמרים דורשות קודם לדווח על אינט' ,כי היא מאפילה על האפקטים הכלליים .אפקט עיקרי
הכוונה "האפקט תמיד עובד" .אפקט האינטראקציה המדויק יותר הוא " -תלוי ב."..
יש אפשרות בניתוח של רגרסיה לבחור לאיזה אפקט נותנים משקל גבוה יותר.
[לסיכום :מבחן - tמשתנה אחד .מבחן – Fכמה גורמים והשוואה ביניהם באמצעות גודל אפקט והתרומה
היחסית של כל גורם ,ואינט' – מורכבת ,האפקט תלוי בגורמים נוספים].
נתמקד באינטראקציה ברגרסיה ,ונראה כלי חינמי שימושי לחקור את זה:
מאמר של קובי:
https://www.tandfonline.com/doi/figure/10.1080/02699931.2020.1724893?scroll=top&needAccess=true
האם אנשים שיותר אמפתיים הם גם מצליחים יותר להבין רגשות של הזולת (האם הבנת הזולת הולכת יחד עם
אכפתיות?) .אכפתיות נבדקה בשני מובנים – האם כשאדם שומע על קושי של הזולת זה גורם לו להיכנס גם ללחץ
בעצמו (מדד :לחץ) ,ועד כמה זה מעורר אכפתיות (קונסורן).
באופן כללי מצאו פה אפקט כללי לדאגה – ככל שאני דואג יותר לזולת אני יותר מבין אותו .יש אפקט עיקרי
שלילי למצוקה – ככל שזה גורם לי יותר לחץ אני פחות אעזור .וגם אפקט אינט' כנ"ל.
מדידת המשתנים פה היא רציפה .בניגוד למבחני tו Fשראינו עד עכשיו שהיו שתי קטגוריות (גבוה\נמוך).
רגרסיה
רגרסיה היא ניסיון לחזות את הקשר בין שני משתנים.
שני הנתונים האלה הם בלתי תלויים אחד בשני .אני יכולה לבחור קווים
שונים עם אותו שיפוע ,אבל הקבוע שלהם שונה – כלומר נקודת החיתוך עם
ציר ה yהיא שונה( .צד ימין) .וכנ"ל הפוך ,ייתכן קבוע זהה אבל המגמה היא
שונה לחלוטין ,כמו בצד שמאל שבה רואים שיש ירידה ועליה ,עם מקדם
זהה.
כאמור קו הרגרסיה מנסה להתאים את הנתונים שלנו לקו ישר כדי שיהיה אפשר לעשות ניבוי .ניתן לבחור הרבה
סוגים של קו ,הרבה שיפועים...ונשאלת השאלה מהי הדרך הטובה ביותר לקבוע איזה קו להעביר?
אנחנו בעצם רוצים להתאים קו ישר לנתונים שלנו ,שיש לו את שני המאפיינים הנ"ל ,ולשאול איזה ערכים נבחר
ל .b1 ,b0יש לנו הרבה נתונים שמיוצגים בנקודות ,ואפשר להעביר ביניהן הרבה קווים ,אז איך נדע איזה הנכון?
יש שיטה סטטיסטית שנקראת שיטת הריבועים הפחותים -אנחנו רוצים להעביר קו ישר שכשאר נבדוק כמה
הוא רחוק בפועל מכל נקודה שלנו ,ונחבר את כל המרחקים האלה ,יצא לנו המרחק הנמוך ביותר .אי אפשר סתם
לחבר את כל המרחקים האלה ,צריך לזכור שחלקם מעל וחלקם מתחת לקו והחיבור שלהם יתקזז אחד את השני
ואנחנו לא רוצים את זה ,אנחנו רוצים את המרחק הכללי ,ולכן נעלה אותם בריבוע ויצא לנו ערך חיובי – ומכאן
השם "הריבועים הפחותים" ,ריבועים = המרחק בריבוע של כל אדם מהקו (כדי להיפטר מערכים שליליים) ואז
סוכמים את כל המרחקים הריבועיים האלה ובודקים מתי יוצא לי קו שמגיע למספר הכי פחות ,הכי נמוך .בסוף
זה קו שהכי קרוב לכל הנקודות .ברגע שנבחר קו ספציפי אנחנו יודעים איפה נקודת החיתוך עם ציר הוי ( )b0ויש
לנו גם את השיפוע (.)1b
דוגמה חישובית -מכירות שיש לתקליטי מוזיקה .יש קובץ נתונים מצורף.
200אלבומים שחברה מסוימת מכרה ,אנחנו יודעים כמה היא הרוויחה על כל
אלבום ,ויש לנו גם פרטים על כמה היא השקיעה באלבום זה ,ועכשיו החברה
רוצה לבנות מודל שמנבא כמה היא תרוויח על אלבום מסוים כאשר היא
מפרסמת אותו כדי להתנהל בצורה כלכלית יותר טובה.
נתונים מהחברה על המכירות – ,yכמה השקיעו בפרסום – ציר .xכל נקודה זה אלבום שנמכר והקו הישר הוא
ניסיון להתאים את קו הרגרסיה .במצגת רואים את אותו דבר בצורה פחות נקיה בפלט של ( .spssאת הערכים
המספריים של הקבוע והמקדם – התוכנה מוציאה לנו).
כשנדע מהו קו הישר נוכל גם לעשות בו שימוש ,נוכל לנבא עם המאפיינים הללו מצב עתידי -אם אציב סכום
מסוים ב xמה יצא לי ה( .yהשורה התחתונה זה שמות המשתנים עצמם במקום להשתמש באיקס ווי).
לאחר שמצאנו את הקו רוצים לדעת עד כמה הוא מוצלח ,בשביל זה יש לנו ערך נוסף שמופיע מעל הישר ,וזה R
בריבוע ,עם ערכים בין אפס למאה .דומה לגודל אפקט שדברנו במבחני ,Fזה מתאר עד כמה מוצלח הקו הזה .ככל
שהערכים נמוכים יותר וקרובים לאפס זה אומר שהוא מצליח להסביר מעט הבדלים בין נתונים ,ככל שהערכים
קרובים ל 1זה אומר שהוא מצליח להסביר יותר שונות בנתונים( .בדוגמה :אחוז השונות המוסברת במכירות על
ידי האיקס שלנו) .משתנה Rחייב להיות קשור לשיפוע – יש ביניהם קשר ישיר .בעצם השאלה שלנו היתה עד כמה
מוצלח הקו הישר שהתאמנו ובשביל זה צריך לחשב את הדיוק שלו שזה אותו ערך של Rבריבוע .דיוק של 33%
אומר שמשתנה האיקס שלי ,ההשקעה בפרסום ,מסביר כשליש מההבדלים בכמות המכירות.
לסיכום :בונים קו רגרסיה ,מכניסים משתנים לתוך הקו הזה (קבוע ,מקדם שיפוע) ,ורואים מה ה Rבריבוע שהקו
נותן( .למשל ננסה כיתות גדולות\קטנות יותר ,וכמה קיבלו בממוצע ארצי ,ואז לפי זה משרד החינוך יכול לבדוק
אם כמות התלמידים בכיתה קשורה לזה ,כנ"ל עם ובלי מזגן בחודש יוני ולראות אם הבדלים טמפ' משפיעים,
הרבה מעט עזרים ,חומר פתוח\סגור - ...המשותף הוא שצריך לעשות קירוב לינארי – להתאים קו ישר).
אחוז השונות המוסברת – עד כמה השינוי בערכים של משתנה איקס הוא משמעותי ,כי הוא מסביר ערכים
במשתנה התלוי .זה נותן מושג כמותי לכמה משמעותי המשתנה הזה וככה אפשר לדעת אם שווה לי להשקיע בו.
[מתאם ורגרסיה :מתאם זה השיפוע ,זה ,b1והרגרסיה משתמשת במתאם שיש בין הנתונים כדי לייצר קו שאומר
ניבוי ספציפי .אני לא יכולה להשתמש במתאם כי אין לי את המשוואה ,הוא רק אומר את השיפוע ,ולא נותן את
כל המשוואה לניבוי ספציפי) .משוואת רגרסיה לא רק נותנת b1שזה המתאם ,אלא גם נותנת את הקבוע ואז
כשיש לי את שניהם אני יכולה להשתמש בניבוי שלי].
יש להבדיל בין ניבוי ובין וודאות בניבוי .כשיש רק משתנה אחד שמעניין
אותנו ,למשל כמה נרוויח על מכירה של אלבום ,הדרך לעשות ניבוי היא
באמצעות מדד מרכז כמו ממוצע (אני אשאל כמה הרווחתי בממוצע על
אלבום חדש) .זה כשאין לי אינפורמציה על שום דבר אחר כמו כמה
השקעתי בפרסום .אבל יש גם וודאות בניבוי – כמה אתה חושב שהניבוי
שלך נכון .ככל שהאנטנות ,הפיזור סביב הממוצע ,הוא קטן יותר אז אני
יותר בטוח ,אבל כשהפיזור הוא גדול אז אני יכולה לתת ניבוי רק על סמך
מדד מרכז אבל זה יהיה יותר בהיסוס.
היתרון של הרגרסיה הוא שיש משתנים נוספים שקשורים לתופעה שלי ,קו הרגרסיה מאפשר לי לעשות ניבוי וגם
לעשות חישוב יותר ספציפי שמתייחס לאינפורמציה שיש לי גם על המשתנה השני – כמות הפרסום שהושקע
באלבום .ואז ישאלו אותי לגבי הוודאות וזה יהיה תלוי במתאם ,בשיפוע .ככל שהקשר הוא חזק יותר אז אהיה
יותר בטוח ,או במדד של ה Rבריבוע זה נותן את אותה תובנה .אם יהיה Rשמסביר רק שני אחוז ,זה בעצם אומר
שאני יכולה לעשות ניבוי אבל שיש עוד מלא משתנים שיכולים להשפיע על זה...
מקבלים את Rבריבוע בפלט.
משוואת הרגרסיה היא לא מוגבלת לעבודה עם משתנה אחד ,היא כללית ואפשר להכיל אותה בהרבה מאד
משתנים .נכניס עוד משתנים ונראה ביחד לכל אחד מהם אם הוא עוזר או לא עוזר ,נסתכל על ערך הביתא שלו
ונראה עד כמה הוא משמעותי .ביתא גדולה -משתנה משמעותי ,נמוכה – לא משמעותי ,ולפעמים היא כל כך
נמוכה שיגידו לנו שהוא בכלל לא רלוונטי ,הוא לא שונה בצורה מובהקת מהקו השטוח (שיפוע אפס) ואת זה נראה
בעמודת מובהקות הימנית .מובהק זה אומר שהשיפוע כל כך קטן שהוא לא באמת שונה מקו שטוח לחלוטין ולכן
הוא בעצם לא משמעותי.
א .איך לעשות ניבוי ספציפי .תנו לי ערכי איקס ואכניס למשוואה ואגלה על התופעה המעניינת.
ב R .בריבוע – עד כמה הקו הזה הוא מוצלח ואולי צריך לחשוב על לבנות קווים אחרים.
ג .ניתן להוסיף עוד משתנים ועל כל אחד אראה ערך שונה...
[הערה :השתנות לינארית = השתנות קבועה .רגרסיה היא מודל כללי ,היא לא חייבת להיות רק בקו לינארי,
אפשר גם קו אקספוננציאלי למשל .לוקחים נוסחה לא של קו ישר אלא נוסחה של קו כזה ,ומחשבים איזה ערכים
של בי אפס ,אחד ושתיים שהוא המקדם של האיקס...מתאימים באותה צורה של ריבועי פחותים ומתארים ככה
את המגמה]...
11.06.2020
השיעור היום – איך אפשר להשתמש בדיווח העצמי כדי להפיק ממנו מידע מדויק כמה שיותר..
בעיות כמו:
המטרה שלנו היא להוציא מהשאלון הזה יחס אל התופעה ,ולא שאלה ספציפית ולכן אנחנו לוקחים את כל
הנתונים שנאספו בשאלון ומנסים לצמצם אותם.
הנבדק עונה על כל שאלה\מדד\פריט ,ואז אני בודק אם כמה כאלה קשורים ביניהם ,וכשקיים קשר זה נקרא
פקטור.
מהי מהימנות?
מהימנות = היכולת של מדד לייצר את אותן התוצאות תחת אותם תנאים (*כמובן לשים לב לפריטים הפוכים.)..
יש לנו מדד של קרונבך אלפא שאומר עד כמה יש מדידה טובה באמצעות כל הפריטים האלה .מעל 0.7זה נחשב
מדד מהימן .צריך להיות מינימום של 0.6כדי להגיד שיש עולם תוכן אחיד ,מ 0.7-זה בסדר 0.8-0.9 ,זה
מצוין.
יש לנו גם אפשרות סטטי' לבקש מהתוכנה לזהות שאלות שכנראה לא הבינו אותם כראוי ולכן הוציאו ציון נמוך.
זה העמודה הימנית שאומרת מה תהיה המהימנות אם נסיר כל אחד מהפריטים (בהקשר לבעיה שציינו מקודם
בדיווח אישי ,כאשר ניסוח השאלה לא מובן ,וזה הכלי הסטטי' להתגבר על זה).
כל פעם שאנחנו מחברים שאלות אנחנו צריכים לבדוק שהן מייצגות עולם תוכן אחיד ,וזה בעזרת אלפא קרונבך
מעל .0.7
יש נוסחה של אלפא קרונבך שמשמעותה – אלפא קורנבך קשור ישירות למספר הפריטים שיש ,ככל שיש יותר
פריטים המהימנות הפנימית תהיה יותר גבוהה כי המשקל של פריט אחד שלא תואם לפריט אחר הוא קטן יותר.
לכן יש חוקרים ששואלים את אותה שאלה בהרבה דרכים כדי :א .לא ליפול בבעיית הניסוח שלל השאלה .ב .כדי
להגדיל את המהימנות .עושים ניתוח גורמים החל מ 100משתתפים ,ככל שיש יותר אנשים הנתונים יותר יציבים
ופחות תלויים במדגם ספציפי .אם אני רוצה לתקף שאלון שישתמשו בו בספרות צריך מאות אנשים.
אחרי שהצלחנו לפשט את עולם התוכן עם ניתוח גורמים ,אני בודק אם אני רוצה את כל השאלות או שכדאי
להוריד חלק כי לא הבינו אותן או כי לא הפכתי את הפריט ,עכשיו אני יכולה לזהות ולומר – זה המדד שלי .זה
הפקטור .הכלל הוא שכל שאלה בפני עצמה כוללת רעש כי אולי אנשים הבינו אותה בצורה מאד ספציפית ואז
כדאי להוציא אותה.
18.06.2020
* ההבדל בין סקירה למטא אנליזה שבמאמרי סקירה יש רק תיאור של מחקרים ובמטא אנליזה יש חישוב
סטטיסטי -חישוב ממוצע של כל המחקרים כדי לתת גודל כמותי לתופעה הנחקרת.
חשיבות המטא אנליזה היא סינתזה של מאמרים כשבסוף אנחנו רוצים תשובה לשאלה האם קיים קשר בין
המשתנים (במילים אחרות – האם יש מובהקות) ,ומה גודל האפקט?
כיסוי חלקי של הממצאים הקיימים – יכול להיות שלא התייחסנו בחישוב לכל הספרות הקיימת .מטא •
אנליזה זה כמו שם קוד כזה שכאילו משדר יותר אמינות וכאילו אפשר לחשוב שהממצא שהיא מציגה
טוב יותר ,אבל יכול להיות שלא דאגו לחפש את כל המחקרים הרלוונטיים.
פתרון :בכל מטא אנליזה נצפה לראות התייחסות ברורה לדרך שבה הם בחרו מחקרים שנכסים למטא
אנליזה .לרוב גם תהיה טבלה שמתארת את המחקרים ,מהן מילות החיפוש ,הערות כמו – רק מחקר
שהיה לו קבוצת ביקורת נכנס וכו' ...זה משהו שצריך לחפש אותו כשאנחנו קוראים מטא אנליזה .אם
הכללים לפיהם הכניסו מחקרים נשמעים לנו הגיוניים אז זה סבבה ,אם לא ,זה מחקר שמנסה להתהדר
במטא אנליזה אבל בפועל יש בחירה סלקטיבית של מחקרים...
דיווח חלקי של ממצאים :גם אם כחוקר אעשה עבודה טובה ,סקירת ספרות טובה ,טבלה עם כל •
המשתנים שיש להם ערך להבנת התופעה – עדיין אין לי שליטה על מה שמפורסם בפעול ,יכול להיות שיש
מחקרים שהתוצאה שלהם היתה שההתערבות לא עובדת ,או שמשחקי מחשב לא מגבירים אלימות –
והם פשוט לא מספיקים לפרסם את זה כי הז'ורנלים לא מקבלים את המחקר שלהם (כי זה פחות מעניין
– פרסום סלקטיבי) .כלומר אני כחוקר עשיתי סקירה טובה ,אבל לא היתה לי אפשרות לעשות את זה
באמת כי אנשים לא מפרסים את המחקרים שלהם (נגיד הם הציגו קשר אבל לא מאד מרשים ולכן
הז'ורנלים בחרו לא לפרסם אותם).
הרעיון הזה עוזר לנו לתאר הטיה בפרסום ,בשקף ,זה שיש מחקר חריג מעיד שהגיוני שיש עוד מחקרים
חריגים שכנראה לא פורסמו ,לא הוצגו ...זה מעורר אצלנו תהיה איך רק מחקר אחד הגיע לתוצאה
קיצונית וכל האחרים לא ,זה קצת לא הגיוני אם כולם בחנו פחות או יותר באותה דרך ,אולי זה כי הוא
היחיד שהיה לו האומץ לפרסם את זה ,ואחרים שגם קיבלו תוצאה כזאת לא פרסמו.
הקו המרכזי זה גודל אפקט ,הנקודות הספציפיות זה מחקרים בודדים והגודל אפקט שלהם .ציר איקס
משקף את גודל הקורלציה (מרחק כהן) ,פיזור הנקודות סביב הקו...
גם בשני התרשימים למטה רואים פיזור סימטרי למעלה או פיזור לא סימטרי למטה – שזה מעיד על
הטיית פרסום .יש מחקר עם תוצאה חריגה שמטה את הממוצע .יש מבחן סטטי' שבודק את זה –
egeer's testוהציון שלו משקף את פיזור המחקרים סביב הממוצע.
מטא אנליזה רצינית צריכה לתת דיווח של הטיית פרסום ,כדי שנדע שהבעיה הזאת טופלה .הרבה פעמים
יופיע הגרף הזה ,ואם לא אז יהיה נתון סטטי' כמו איגר טסט .כאשר הוא לא מובהק זה אומר שהפיזור
תקין.
סיכום:
בשורות התחתונות בצבע ירוק יש תיאור של הקשר הממוצע שהם מצאו .0.12 :כלומר לאורך כל המחקרים
הקשר בין משחקי וידאו אלימים ובין התנהגות אלימה יש קשר חיובי ,מובהק ,מבוסס על יותר מ11,000
משתתפים ,יש פיזור טבעי סביב הממוצע.
אז ראינו שהם עשו כיסוי של כל הממצאים הקיימים – מילות חיפוש וכו' ,הם גם תיארו את הטיית הפרסום
במקום אחר במאמר ,בנוגע לבעיה השניה על שונות בין מחקרים – הם הציגו את הטבלה ,אבל הדגש הוא לבדוק
האם ההבדלים האלה הם משתנים ממתנים (כלומר לבדוק שאין שונות משמעותית בין המחקרים ואם יש אז
לבדוק מה בדיוק פה הם משתנים ממתנים).
הערה :בשקף הזה אלה בעצם מחקרים שמחולקים לפי מוצא אתני ,וגם ממוצע כללי לכולם ביחד .השקף הקודם
זה התייחסות רק לקבוצה אתנית אחת ובשקף הנוכחי אנחנו רואים את של כל המחקרים ביחד.
יש מבחן סטטי שאומר עד כמה הממוצע הגלובלי שראינו ברנדום הוא מייצג טוב את כל המחקרים שנסקרו או
שהוא קצת מלאכותי כי יש שונות גבוהה ,וזה יעודד אותי כחוקר לחפש מה מסביר את ההבדלים האלה .כאן
החוקרים טענו שהמוצא האתני עוזר להסביר את ההבדלים( .רואים את זה ברנדום של כל אחת מהקבוצות
האתניות).
במבחן הטרוגניות אפשר להכניס משתנים ספציפיים שעלו בטבלה הקודמת ,ולראות איך כל אחד מהם משפיע על
ההטרו גניות וככה נדע מה המשתנה הממתן (זה יוצא כמו פלט של רגרסיה עם כל אחד מהמשתנים וציון
ההטרוגניות שהוא מגורם לו) .במחקר כאן הם לא הביאו את הפלט הזה ולכן אנחנו לא רואים ,אבל יצא להם
שהמוצא האתני הוא זה המשפיע ,ולכן הם הציגו חלוקה כזאת בפלט פה למעלה.
(בניגוד למחקר שראינו עם החלוקה לקבוצות אתניות – שהם עשו את החישוב הזה ,וזה יצא משתנה מתווך ,ולכן
ככה הציגו לנו את התוצאות!)
25.06.2020
השלמות:
מטא אנליזה – מעניין אותנו רק קשר מסוים בין שני משתנים ,אמרנו שיש מדד שבודק את האפקט שאנחנו
מחפשים ,לוקחים הרבה בדיקות כאלה ,עם הרבה חזרות ובסוף מוציאים מסקנה כללית.
רגרסיה :בודקים מה המשקל של גורמים שונים בעיצוב במציאות .בפועל התופעות שמעניינות אותנו מושפעות
מגורמים שונים ,והשאלה היא איך אנחנו יכולים לדעת מה המשקל של כל גורם פה .הניתוח הסטטי' הוא
רגרסיה ,אנחנו עסקנו במקרה הפשוט" ,רגרסיה פשוטה" – גורם אחד שאנחנו מחפשים את המשקל שלו ,כמו
כמות הכסף שהושקעה בפרסום ואיך היא משפיעה על כמות המכירות .לא נכנס שם סוג המוזיקה ,המגדר של
האומנים ,נראות וכו'...
דוגמה:
האם יש דרך נוספת לגלות דברים נוספים שקשורים למשתנה התלוי? נעזר בניתוח רגרסיה מרובה.
לכל רגרסיה יש קבוע ויש שיפוע .מה השינוי שחל בציר הוואי עם התקדמות של צעד אחד בציר האיקס? על
כל צעד אחד בציר האיקס ,על כל 1000פאונד שמושקעים בפרסום של התקליט ,יחול שינוי של 0.096
אלפים בציר הוואי .כלומר המודל מנבא רווח של 96פאונדים על כל השקעה של 1000פאונד.
* במודל הרגרסיה אפשר לכלול גם משתנים שאינם רציפים ,למשל עבור מגדר אפשר לציין בן כאפס ובת
כאחד ואז נוכל ללמוד לגבי התרומה היחודית של משתנה זהבתוך הרגרסיה.
סיכום על המבחנים:
תשובה א'.
דוגמאות לשאלות:
סעיף ב מסתכלים על הבי ,שזה שינוי באחוז הדיוק עם כל התקדמות של צעד בזיהוי רגשות אז זה לא נכון
סעיף א :ללא אכפתיות -כשהיא על אפס ,אז הדיוק עומד על – 23נכון ,כי הקבוע עומד על כמעט 23זה בשורה
למעלה .22.95
. 5לאחר ביצוע ניתוח גורמים מגשש נשאף לעבור מאוסף משתנים____ למספר גורמים____ אשר_____
א .במתאם גבוה ,קטן ,במתאן גבוה
ב .במתאם ,זהה ,איננו במתאם
ג .במתאם ,גדול יותר ,אינם במתאם
ד .המתאם ,קטן יותר ,אינם במתאם
המטרה היא לקחת הרבה משתנים שכולם קשורים ולקבץ אותם לקבוצות נפרדות .אז התשובה היא ד .יש בין כל
הגורמים מתאם גבוה ,אנחנו רוצים לצמצם אותם למספר קטן של גורמים שהם מובחנים ולכן שהגורמים האלה
אינם במתאם.
.6חוקר בחן את הקשר שבין מין המשתת ,לביצוע במבחן זיהוי רגשות .התקבלו הממצאים הבאים:
א .לנשים יש ממוצע נמוך יותר ביכולתן לזהות רגשות בצורה מדוייקת.
ב .לנשים יש שונות גבוהה יותר ביכולתן לזהות רגשות בצורה מדוייקת.
ג .במדגם בהספציפי שנבדק ,נשים הצליחו טוב יותר מגברים ,אך לא ניתן להכליל ממצא זה.
ד .במדגם הספציפי שנבדק ,נשים הצליחו טוב יותר מגברים ,וניתן להכליל ממצא זה.
רואים שאצל נשים יש פחות שונות כי הבוקס פלוט קטן יותר .רואים שיש הבדל בין גברים ונשים .הלוין אומר
שההנחה של שוויון שונויות הופרה ולכן זה לא לגיטימי לעשות את ההכללה הזאת שנשים כאילו יותר טובות
מדברים כי אצל הגברים יש הרבה מאד שונות ,חלקם דומים לנשים וחלקם מאד דומים .לכן ההכללה היא
בעייתית .לכן התשובה היא ג .תשובה ב לא נכונה ורואים את זה גם בבוקס פלוט וגם בעמודה של סעיף תקן.