Professional Documents
Culture Documents
סיכום כללי
במידה והערך הנבדק/הנצפה מצוי "מספיק רחוק" ממוצע ההתפלגות (ימינה או שמאלה) ניתן לשער
(בהסתברות גבוהה) כי איננו שייך להתפלגות הנוכחית ,וככל הנראה משתייך להתפלגות אחרת (בעלת
ממוצע גדול יותר או קטן יותר ,בהתאם להשערות והממצאים).
התפלגות
הדגימה של ממוצעים
נדמיין כי אנו דוגמים מדגמים רבים (אינסוף) בגודל זהה ,ומחשבים ממוצע (סטטיסטי) עבור כל מדגם.
במקרה זה נקבל התפלגות של ממוצעים (סטטיסטיים) יחסית קרובים לתוחלת (פרמטר) האוכלוסייה –
כלומר ,פיזור (שונות) ממוצעי המדגמים סביב תוחלת האוכלוסייה יחסית קטן.
ככל שהמדגמים גדולים יותר פיזור (שונות) הממוצעים קטן יותר (ולהיפך).
מטרת המבחן :לבדוק האם סטטיסטי המדגם (ממוצע) שייך להתפלגות האוכלוסייה הידועה
(מכונה .)H0במידה והתשובה שלילית (הסטטיסטי "נופל" באזור הדחייה) ניתן להסיק (ברמת
סיכון/מובהקות שנקבעה טרם המבחן – אלפא) כי ככל הנראה המדגם אינו שייך לאוכלוסייה הנבדקת (
,)H0אלא לאוכלוסייה אחרת (מכונה )H1בעלת הממוצע שונה.
שלבי המבחן:
שלב -1ניסוח השערות:
בשלב זה יש לנסח את כיוון השערות המחקר .שימו לב כי סימן השווה תמיד מופיע ב ,H0 -וכי ההשערות
המבחן ממצות ומוציאות.
חד כיווני ימני/חיובי -ממוצע המדגם גדול מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
__≤ H 0 :μ
x
__>H 1 :μ x מימין ל.)H0-
דו-כיווני -ממוצע המדגם שונה מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה או מימין או
__= H 0 :μ
x
__≠ H 1 :μ
x משמאל ל.)H0-
2
חד כיווני שמאלי/שלילי -ממוצע המדגם קטן מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
__≥ H 0 :μ
x
__<H 1 :μ x משמאל ל.)H0-
שלב -2הנחות:
לגבי התפלגות האוכלוסייה ,המדגם והדגימה.
הנחות לגבי האוכלוסייה: .1
א .המשתנה באוכלוסייה מתפלג נורמלית (במידה וזה נתון/ידוע).
__= μ
x ב .תוחלת האוכלוסייה (- )H0
ג .השונות באוכלוסייה ידועה -
הנחות לגבי אופן הדגימה והמדגם: .2
א .הדגימה מקרית ובלתי-תלויה של תצפיות המדגם.
ב .גודל המדגם הוא __=.n
___=X ג .ממוצע המדגם (סטטיסטי המדגם) הוא
הנחות לגבי אופן התפלגות הדגימה: .3
א .מתפלגת נורמלית (קומבינציה ליניארית של משתנה המתפלג נורמלית ,רק אם זה נתון
בהנחות לגבי האוכלוסייה) ,או נורמלית בקירוב (ע"פ משפט הגבול המרכזי ,כאשר .)n≥30
ב .בהנחה כי H0נכונה:
הדגימה היא (אומד חסר הטיה). תוחלת התפלגות )1
היא- טעות התקן )2
מתי? בדיקת השערות לגבי תוחלת של אוכלוסייה אחת ,כאשר שונות/סטיית-התקן באוכלוסייה
אינן ידועות .נקראת גם התפלגות .t
מטרת המבחן :ההבדלים בין מבחן zלמבחן tנובעים מעצם העובדה שהשונות באוכלוסייה איננה
ידועה וצריך לאמוד אותה בהתבסס על המדגם.
4
מדוע צריך את השונות/סטיית התקן באוכלוסייה? למעשה בכדי לחשב את סטטיסטי המבחן (ציון התקן
של סטטיסטי/ממוצע המדגם) ולבחון היכן הוא נופל (באזור האי-דחייה או הדחייה).
האומדן:
את האומדן לשונות/סטיית התקן באוכלוסייה נהוג לסמן "בכובע" -האומדן לסטיית התקן
↔^σ ^
x Sx באוכלוסייה
חישוב האומדן לשונות/סטיית-התקן באוכלוסייה ע"פ המדגם (מגודל :)n
n
= ^σ
⋅x S
x
√ n− 1
שלבי המבחן:
שלב -1ניסוח השערות :זהה לשלב 1במבחן Zלממוצע יחיד.
בשלב זה יש לנסח את כיוון השערות המחקר .שימו לב כי סימן השווה תמיד מופיע ב ,H0 -וכי ההשערות
המבחן ממצות ומוציאות.
חד כיווני ימני/חיובי -ממוצע המדגם גדול מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
__≤ H 0 :μ
x
__>H 1 :μ x מימין ל.)H0-
דו-כיווני -ממוצע המדגם שונה מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה או מימין או
__= H 0 :μ
x
__≠ H 1 :μ
x משמאל ל.)H0-
5
חד כיווני שמאלי/שלילי -ממוצע המדגם קטן מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
__≥ H 0 :μ
x
__<H 1 :μ x משמאל ל.)H0-
שלב -2הנחות:
לגבי התפלגות האוכלוסייה ,המדגם והדגימה.
הנחות לגבי האוכלוסייה: .7
א .המשתנה באוכלוסייה מתפלג נורמלית (במידה וזה נתון/ידוע).
__= μ
x ב .תוחלת האוכלוסייה (- )H0
ג .השונות באוכלוסייה איננה ידועה (בשונה ממבחן )Z
הנחות לגבי אופן הדגימה והמדגם: .8
א .הדגימה מקרית ובלתי-תלויה של תצפיות המדגם.
ב .גודל המדגם הוא __=.n
___=X ממוצע המדגם (סטטיסטי המדגם) הוא ג.
בשונה ממבחן – zע"פ סטיית התקן במדגם
=S
___
x סטיית התקן במדגם היא ד.
)
אומדים את סטיית התקן באוכלוסייה ( σ^ x
הנחות לגבי אופן התפלגות הדגימה: .9
ג .מתפלגת נורמלית (קומבינציה ליניארית של משתנה המתפלג נורמלית ,רק אם זה נתון
בהנחות לגבי האוכלוסייה) ,או נורמלית בקירוב (ע"פ משפט הגבול המרכזי ,כאשר .)n≥30
ד .בהנחה כי H0נכונה:
הדגימה היא (אומד חסר הטיה). תוחלת התפלגות )1
מתי? אמידה לגבי תוחלת של אוכלוסייה אחת ,כאשר שונות/סטיית-התקן באוכלוסייה ידועות
ואינן-ידועות (מצב גם של התפלגות zוגם של התפלגות .)t
מטרת המבחן:
7
ישנם מקרים בהם אנו לא יודעים מהו הפרמטר (התוחלת) באוכלוסייה ,ובאמצעות אמידה אנו
רוצים לאמוד (להעריך) מהו הפרמטר באוכלוסייה? או מהו השינוי בפרמטר (עקב טיפול כלשהו)?
באמידה אנו בודקים מהו הפרמטר באוכלוסייה? או בכמה הפרמטר השתנה/גדל/קטן?
במקרה של אמידה ,ההנחה הכללית היא" :כי העץ אינו נופל רחוק מהתפוח"
באמידה ,אנו אומדים את התוחלת של האוכלוסייה באמצעות טווח ביטחון (רווח בר סמך)
סביב סטטיסטי המדגם (כלומר ,באמצעות מדגם אומדים את האוכלוסייה ,או את השינוי שחל
בה).
ניתן לראות כי כל רווח-סמך (ברמת בטחון )α-1סביב ממוצע של מדגם "הנופל" באזור
האי-דחייה (בבחינת השערות ברמת מובהקות ,)αיכלול את תוחלת האוכלוסייה – כלומר ,כל
רווח-סמך הכולל את השערת האפס ( ,)µ0מעיד על תוצאת מבחן לא-מובהקת (קבלת .)H0
וההיפך -כל רווח-סמך שאינו כולל את השערת האפס ( ,)µ0מעיד על תוצאת מבחן מובהקת
(דחיית .)H0
סוגי אמידה:
אמידה דו-צדדית (רווח-סמך) – מהו טווח (רווח-סמך) הפרמטר הנאמד משני צדיו של .1
הסטטיסטי ,או בכמה יש שינוי בפרמטר של האוכלוסייה (ברמת בטחון .)α -1
α α
( ) ( )
2 2
≤ p [x− z c ⋅σ
≤x μ
=x x+ z c ⋅σ x
] 1− α
אמידה חד-צדדית חיובית (חסם תחתון) – מהו הערך הנמוך ביותר (חסם תחתון) של .2
הפרמטר באוכלוסייה ,או בכמה גדל הפרמטר באוכלוסייה (ברמת בטחון .)α -1
p [x− z (αc ⋅σ
)
=x μ x
≤ ] 1− α
אמידה חד-צדדית שלילית (חסם עליון) – מהו הערך הגבוה ביותר (חסם עליון) של הפרמטר .3
באוכלוסייה ,או בכמה קטן הפרמטר באוכלוסייה (ברמת בטחון .)α -1
) (α
≤ p [μ
=x x+ z c ⋅σ x
] 1− α
**באמידה במבחן ,tיש להחליף את ה Z-הקריטי ב t-קריטי מתאים לפי דרגות חופש.
אמידה עבור אוכלוסייה אחת כאשר שונות האוכלוסייה ידועה (התפלגות :)z
אמידה זו זהה לזו שהוצגה ברציונל תהליך האמידה .שימו לב ,כי מדובר על אמידה של ממוצע יחיד כאשר
השונות באוכלוסייה ידועה ,לכן הנחות האמידה דומות לאלו שהנחנו במבחן zלממוצע יחיד.
שלב -1הנחות:
לגבי התפלגות האוכלוסייה ,המדגם והדגימה.
הנחות לגבי האוכלוסייה: .13
א .סטיית התקן באוכלוסייה ידועה -
והמדגם: הנחות לגבי אופן הדגימה .14
א .הדגימה מקרית ובלתי-תלויה של תצפיות המדגם.
ב .גודל המדגם הוא __=.n
___=X ג .ממוצע המדגם (סטטיסטי המדגם) הוא
הנחות לגבי אופן התפלגות הדגימה: .15
א .מתפלגת נורמלית (קומבינציה ליניארית של משתנה המתפלג נורמלית ,רק אם זה נתון
בהנחות לגבי האוכלוסייה) ,או נורמלית בקירוב (ע"פ משפט הגבול המרכזי ,כאשר .)n≥30
=μ
x μx תוחלת התפלגות הדגימה היא אומדן בלתי מוטה לתוחלת באוכלוסייה – ב.
טעות התקן היא- ג.
8
שלב -2האמידה:
אמידה דו-צדדית/חד-צדדית חיובית/שלילית .16
__=1− α
רמת ביטחון- .17
__=α רמת סיכון- .18
מציאת ערך של Zקריטי בהתאם לרמת הסיכון .19
חישוב האמידה -חסם עליון/תחתון/רווח בר סמך .20
α α
( ) ( )
2 2
≤ p [x− z c ⋅σ
≤x μ
=x x+ z c ⋅σ x
] 1− α
שלב -3מסקנה:
התוחלת של _______ היא בין ______ ל , _______ -ברמת בטחון של ____ (דו-צדדית ,רווח בר סמך).
התוחלת של _______ היא לפחות _______ ,ברמת ביטחון של ___ (חד צדדית חיובית ,חסם תחתון).
התוחלת של _______ היא לכל היותר ______ ,ברמת ביטחון של ___ (חד צדדית שלילית ,חסם עליון).
אמידה עבור אוכלוסייה אחת כאשר שונות האוכלוסייה אינה-ידועה (התפלגות :)t
במקרה של אמידת רווח-סמך (או חסם עליון/תחתון) יש לאמוד את השונות באוכלוסייה (במידה ואינה
ידועה) ,ועל כן יש לעבור להתפלגות tעם דרגות החופש ( )dfהמתאימות .שימו לב ,כי מדובר על אמידה
של ממוצע יחיד כאשר השונות באוכלוסייה איננה ידועה ,לכן הנחות האמידה דומות לאלו שהנחנו במבחן
tלממוצע יחיד.
שלב -1הנחות:
לגבי התפלגות האוכלוסייה ,המדגם והדגימה.
הנחות לגבי אופן הדגימה והמדגם: .21
א .הדגימה מקרית ובלתי-תלויה של תצפיות המדגם.
ב .גודל המדגם הוא __=.n
___=X ממוצע המדגם (סטטיסטי המדגם) הוא ג.
=S
___
x ד .סטיית התקן במדגם היא
הנחות לגבי אופן התפלגות הדגימה: .22
א .מתפלגת נורמלית (קומבינציה ליניארית של משתנה המתפלג נורמלית ,רק אם זה נתון
בהנחות לגבי האוכלוסייה) ,או נורמלית בקירוב (ע"פ משפט הגבול המרכזי ,כאשר .)n≥30
=μ
ב .תוחלת התפלגות הדגימה היא אומדן בלתי מוטה לתוחלת באוכלוסייה – x μ x
n
= =σ^ X
√n
√
σ^ x S ⋅x n− 1
√n טעות התקן היא- ג.
שלב -2האמידה:
אמידה דו-צדדית/חד-צדדית חיובית/שלילית .23
__=1− α
רמת ביטחון- .24
__=α
רמת סיכון- .25
דרגות חופשdf=n-1 - .26
מציאת ערך של Tקריטי בהתאם לרמת הסיכון ודרגות החופש .27
9
חישוב האמידה -חסם עליון/תחתון/רווח בר סמך .28
α α
( ) ( )
2 2
≤ ^p [x− tc (n− 1⋅)σ
≤x μ
⋅x x+ t c (n− 1
=) σ x
^ ] 1− α
שלב -3מסקנה:
התוחלת של _______ היא בין ______ ל , _______ -ברמת בטחון של ____ (דו-צדדית ,רווח בר סמך).
התוחלת של _______ היא לפחות _______ ,ברמת ביטחון של ___ (חד צדדית חיובית ,חסם תחתון).
התוחלת של _______ היא לכל היותר ______ ,ברמת ביטחון של ___ (חד צדדית שלילית ,חסם עליון).
בדיקת השערות ואמידה לגבי הפרש שתי תוחלות של שתי אוכלוסיות בלתי-תלויות (מדגמים
בלתי-תלויים) ,כאשר שונות/סטיית-התקן באוכלוסייה אינן-ידועות (התפלגות .)t
מתי? במקרים מסוג זה נוהגים לדגום שני מדגמים (אחד מכל אוכלוסייה) ולבדוק את ההפרש בין ממוצעי
המדגמים.
סוגי אוכלוסיות:
בבחינת המבחן המתאים להפרש ממוצעים יש להבחין בין אוכלוסיות תלויות (כאשר ישנו קשר בין
המדגמים) ואוכלוסיות ב"ת (כאשר אין קשר בין המדגמים).
מדגמים תלויים/מזווגים -כאשר ישנו קשר משפחתי מדרגה ראשונה בין המדגמים (למשל ,בעל
ואישה ,הורים וילדים ,אחים וכו') .כאשר אותו פרט (נבדק) נמדד יותר מפעם אחת (למשל ,כל
נבדק ממלא שאלון בבוקר ושאלון בערב) -משתנה תוך נבדקי.
מדגמים בלתי-תלויים/בלתי-מזווגים -כאשר מדובר על שני מדגמים עם נבדקים שונים (בכל
מדגם) ,שאינם בעלי קשר משפחתי מדרגה ראשונה (בעל ואישה ,הורים וילדים ,אחים וכו') -
משתנה בין נבדקי.
נקודות חשובות:
10
בכדי להשתמש בנוסחה לחישוב טעות התקן ,יש להניח שוויון שוניות (השונות של
המדגמים/אוכלוסייה שווה – הומוגניות של שוניות).
ה SPSS-יודע לחשב את המבחן הנוכחי גם כאשר הנחה זו אינה מתקיימת (אין שוויון
שונויות) -אנו לא נלמד את הנוסחה למצב הנ"ל (שהיא קצת שונה וקצת יותר מסובכת מהנוסחה
שלמדנו) ,אך בשאלות SPSSנוכל לבצע את המבחן גם ללא הנחה זו.
תמיד נבצע את הבדיקה כך שתהיה לנו תוצאה חיובית -נחסר בין הממוצע הגבוה לנמוך,
נבדוק השערות לכיוון ימין ,חיוביות.
1 x 2−
(x− ) μ (x − x
)2
)= t (x − x 1
1 2 σ^ (x − x
1 )2 סטטיסטי המבחן-
fd = n 1+ n −
2 2 דרגות חופש-
α α
( ) ( )
p [(x− ) t c (n2 +n − 2 )¿ σ^ (x − x )¿ μ −
1 x 2− 1 μ 2¿ (x − x 2 )+ t c (n2 + n − 2 )¿ σ^ (x− ] 1− α
=
1 2 1 2
1 1 2 1
)x2
רווח סמך-
שלבי המבחן:
שלב -1ניסוח השערות:
בשלב זה יש לנסח את כיוון השערות המחקר .שימו לב כי סימן השווה תמיד מופיע ב ,H0 -וכי ההשערות
המבחן ממצות ומוציאות.
חד כיווני ימני/חיובי -ממוצע המדגם גדול מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
__≤ H 0 :μ
x
חד כיווני שמאלי/שלילי -ממוצע המדגם קטן מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
__≥ H 0 :μ
x
__<H 1 :μ x משמאל ל.)H0-
שלב -2הנחות:
לגבי התפלגות האוכלוסייה ,המדגם והדגימה.
הנחות לגבי האוכלוסייה: .29
א .המשתנה באוכלוסיות מתפלג נורמלית (במידה וזה נתון/ידוע).
ב .השונות באוכלוסיה שווה (הכרחי רק בחישוב ידני ,כשאין )SPSS
11
ג .סטיית התקן באוכלוסיות איננה ידועה
הנחות לגבי אופן הדגימה והמדגם: .30
א .הדגימה מקרית ובלתי-תלויה של תצפיות המדגם.
ב .גודל המדגמים__=n1, n2=__ -
X−
____1 X
=
2 הפרש ממוצעי המדגמים (סטטיסטי המדגם) ג.
=S
__= 2,__ S
ד .סטיית התקן במדגמים-
1
ג .חד כיווני שמאלי -ממוצע המדגם קטן מתוחלת/ממוצע ( H0כלומר ,שייך ל H1-המצויה
משמאל ל.)H0-
t (x − x ≤−
) tc
1 2 אזור דחייה-
t (x − x >−
) tc
1 2 אזור האי-דחייה-
fD = n 1+ n −
2 2 דרגות חופש
13
מבחן tואמידה להפרש ממוצעים תלויים
בדיקת השערות ואמידה לגבי הפרש שתי תוחלות של שתי אוכלוסיות תלויות (מדגמים תלויים) ,כאשר
שונות/סטיית-התקן באוכלוסייה אינן-ידועות (התפלגות .)t
מתי?
כאשר ישנו קשר משפחתי מדרגה ראשונה בין המדגמים (בעל ואישה ,הורים וילדים ,אחים וכו'). .1
כאשר אותו פרט (נבדק) נמדד יותר מפעם אחת (למשל ,כל נבדק ממלא שאלון בבוקר ושאלון .2
בערב) -משתנה תוך נבדקי.
דוגמא -למשל ,רוצים לבדוק האם ישנו הבדל במצב הרוח של אנשים בבוקר לעומת הערב .על מנת
לבדוק את השאלה דוגמים 30אנשים ומודדים את מצב רוחם (באמצעות שאלון) בבוקר ובערב -במבחן
משווים בין ממוצע מצב הרוח בבוקר לזה שבערב.
14
טעות התקן של התפלגות הדגימה -בדומה למבחן tלממוצע יחיד ,רק הפעם נעבוד עם .4
"מדגם" של הפרשים (.)d
שלב -2הנחות:
לגבי התפלגות האוכלוסייה ,המדגם והדגימה.
הנחות לגבי האוכלוסייה: .35
א .המשתנה באוכלוסייה מתפלג נורמלית (במידה וזה נתון/ידוע).
ב .השונות באוכלוסייה איננה ידועה
הנחות לגבי אופן הדגימה והמדגם: .36
א .הדגימה מקרית ובלתי-תלויה של תצפיות המדגם.
גודל המדגמים_____=n1=n2 - ב.
=d הפרש ממוצעי המדגמים (סטטיסטי המדגם) הוא ___ ג.
16
∑ (d− d )2 ∑ )(d 2
=S
d
√ n
=
√ n
− (d )2
ד .סטיית התקן במדגם היא
הנחות לגבי אופן התפלגות הדגימה: .37
ה .מתפלגת נורמלית (קומבינציה ליניארית של משתנה המתפלג נורמלית ,רק אם זה נתון
בהנחות לגבי האוכלוסייה) ,או נורמלית בקירוב (ע"פ משפט הגבול המרכזי ,כאשר .)n≥30
ו .בהנחה כי H0נכונה:
(אומד חסר הטיה).
=μ
=d μ
d 0 תוחלת התפלגות הדגימה היא )1
n
= ^σ
d
σ^ d
√n
=
⋅S d
√ n− 1
√n טעות התקן היא- )2
18
אלפא אפוסטריורית ב -SPSSנהוג לכנות גם רמת המובהקות ( )sigולסמן באות .p ג.
ברירת המחדל של SPSSהיא בדיקה דו"צ ,וכדי לגלות את האלפא של מבחן חד-צדדי
צריך לחלק את האלפא שמוצגת ב.2
אם האלפא שמוצגת ב SPSSהיא הרבה מעל 5%בזמן שרמת הסיכון היא ,5%אנחנו לא
דוחים את השערת ה 0בטוח ,באופן אוטומטי .למשל אם רמת הסיכון היא 0.05וקיבלנו
.0.52
אם האלפא שמוצגת היא גדולה אך במעט מרמת הסיכון שלנו ,ננסה להשיג תוצאה
מובהקת יותר ע"י הגדלת המדגם.
דוגמא:
טעויות החלטה:
במבחנים לבדיקת השערות ההחלטה הסופית עשויה להיות אי-דחיית השערת האפס ( )H0או דחיית
השערת האפס (למעשה להניח כי הנתונים שייכים להתפלגות אחרת .)H1
19
מכיוון שתהליך זה אינו ודאי (הסקה ממדגם לאוכלוסייה) ,אנו עוסקים בהסתברויות אותן ניתן לחלק ל4-
מצבים אפשריים (ניתן לבחון בהתאם לאלפא אפריורית או אפוסטריורית):
טעות מסוג ראשון (טעות - )דחינו את H0בטעות ,כלומר הסקנו שסטטיסטי המבחן אינו .1
שייך להשערת האפס (נפל באזור הדחייה) ,אך למעשה (במציאות) הוא שייך להשערת האפס
(טעות זו משקפת את ההסתברות לדחיית H0בטעות ומכונה רמת סיכון/מובהקות – ערך האלפא).
רמת ביטחון (( - -1לא-דחינו את H0בצדק .מייצגת את ההסתברות לקבל את השערת האפס .2
בצדק.
השטחים שמתחת
ל H0 -בהתאם
לערך הקריטי וכיוון
ההשערות
טעות מסוג שני (טעות – ) βלא-דחינו את H0בטעות ,כלומר הסקנו שסטטיסטי המבחן שייך .3
להשערת האפס (נפל באזור האי-דחייה) ,אך במציאות הוא אינו שייך להשערת האפס ,אלא
להשערה האלטרנטיבית ( H1ההסתברות לטעות מסוג זה היא ערך הבטא).
עוצמת המבחן (( - 1− βדחינו את H0בצדק .עוצמת המבחן מבטאת את ההסתברות .4
שהמחקר יניב תוצאות מובהקות ,כאשר השערת המחקר נכונה (כלומר ההסתברות שסטטיסטי
המדגם באמת שייך ל (.H1
השטחים
שמתחת לH1 -
בהתאם לערך
הקריטי וכיוון
ההשערות
H10
לסיכום:
c10
Z
1− α ,) βוכנ"ל גם בין רמת הביטחון ( ) αלטעות בטא ( קיים יחס הפוך בין טעות אלפא ( •
) ועוצמת המבחן ( .) 1− β
(למשל (במבחן חד זנבי ימני) ,כאשר מקטינים את האלפא (הערך הקריטי זז ימינה) הבטא גדלה,
או ההפך (במבחן חד זנבי ימני) ,כאשר מגדילים את האלפא (הערך הקריטי זז שמאלה) הבטא
קטנה).
) 1− α ,) 1− βוכנ"ל גם בין רמת הביטחון ( ) αלעוצמת המבחן ( קיים יחס ישר בין אלפא ( •
.) β ובטא (
20
(למשל (במבחן חד זנבי ימני) ,כאשר מגדילים את רמת הביטחון (הערך הקריטי זז ימינה) עוצמת
המבחן קטנה .או ההפך (במבחן חד זנבי ימני) ,כאשר מקטינים את רמת הביטחון (הערך הקריטי
זז שמאלה) עוצמת המבחן גדלה).
מתאים ל 4 ,3ו:5-
ככל שהחפיפה בין H0ל H1 -גדולה יותר ,עוצמת המבחן תהיה נמוכה יותר .מכאן ,ככל שסטיית
התקן באוכלוסייה גדולה יותר ,תהיה יותר חפיפה בין ההתפלגויות ועוצמת המבחן תקטן .וגם ככל
שנגדיל את גודל המדגם טעות התקן (הפיזור של התפלגות הדגימה) תקטן ועוצמת המבחן תגדל.
ואותו העיקרון חל על סוג המבחן הסטטיסטי – למשל ,במבחן zעוצמת מבחן גדולה יותר ממבחן t
(עם מספר דרגות חופש יחסית נמוך).
ניתן לראות כי ככל שפיזור (שונות) ההתפלגויות גדול יותר עוצמת המבחן קטנה יותר.כפי שידוע לנו
משיעורים קודמים הפיזור של התפלגויות הדגימה תלוי בפיזור באוכלוסייה וגודל המדגם.
גודל האפקט -גודל האפקט אומד את ההבדל בין האוכלוסיות (המרחק בין H0ל ,)H1-או את .6
הקשר בין שני משתנים .ככל שגודל האפקט גדול יותר ,עוצמת המבחן גדולה יותר.
21
ניתוח שונות חד-כיווני (מבחן )F
מתי? בדיקת הסקה סטטיסטית לגבי הבדל בין תוחלות של יותר משתי אוכלוסיות בלתי תלויות
(התפלגות .)F
מטרת המבחן :במצב של 3קבוצות או יותר ,רמת הסיכון האפריורית של המבחן גדלה (בשל ההשוואות
המרובות) -בעיית תיסוף האלפא (.)α
ככל שנבצע יותר השוואות כך הסיכון לבצע טעות מסוג ראשון (טעות אלפא) גדל יותר (מעבר לאלפא
האפריורית שלקחנו בכל השוואה) .למשל ,עבור 3השוואות ברמת סיכון ( 0.05כל השוואה) ,הסיכון
המצטבר הוא ( 0.14שימו לב – היחס המצטבר אינו ליניארי).
כדי לפתור את הבעיה נשתמש במבחן ניתוח שונות.
הרציונל מאחורי ניתוחי שונות (( ,ANOVAהוא להשוות את השונות בתוך הקבוצות( MSW -למשל,
22
הבדלים אינדיבידואלים וטעויות דגימה " -רעש"/טעות) לשונות בין הקבוצות( MSB -השונות בין ממוצעי
הקבוצות ,התפזרות הממוצעים סביב הממוצע המשוקלל ,למעשה האפקט/ההבדל בין הקבוצות).
ככל שהשוני בין הקבוצות גדול יותר כל יש אפשרות שלפחות אחת הקבוצות היא בעלת אפקט גדול יותר.
כאשר-
כאשר-
סימונים:
iיסמן כל תצפית ו j-יסמן כל קבוצה ( Xi,jהתצפית במקום iשבקבוצה .)jלמשל:
X1,1=150הוא הערך של התצפית הראשונה בקבוצה הראשונה.
מספר התצפיות בכל קבוצה יסומן ב ,nj -וסה"כ הנבדקים יסומן ב ,N-למשל:
מספר הנבדקים בקבוצה הראשונה הוא n1=7וn2=8
סה"כ נבדקים (מעבר לקבוצות) N=18
.למשל:
X j הממוצע של כל קבוצה יסומן ב-
X1 הממוצע של הקבוצה הראשונה-
X הממוצע המשוקלל של כל הקבוצות יסומן ב-
=X
∑ n ⋅X
j j
23
נוסחאות:
SS B n j ( x j X ) 2
SS
MS B j B
df
df B J 1B
SSW
SS ( xij x j ) 2
שלבי המבחן:
שלב -2הנחות:
הדגימה מקרית ובלתי-תלויה של תצפיות.
משקל התפוחים מתפלג נורמלית באוכלוסיות.
המדגמים בלתי-תלויים (ב"ת).
24
גודל המדגמים_=n1=_, n2=_, n3 :
השונויות באוכלוסיות הומגניות (שוויון שונויות).
x=j
∑ x ji
n j ראשית נחשב את הממוצע של כל קבוצה-
=X
∑ n ⋅x
j j
25
דחיית – H0תוצאה מובהקת ,במידה וסטטיסטי המבחן "נפל" באזור הדחייה .מצב בו לפחות
אחת התוחלות שונה.
2
:) η אמידה -גודל אפקט – אטא בריבוע (
גודל האפקט הוא גורם המשפיע על עוצמת המבחן.
גודל האפקט – גודל האפקט אומד את ההבדל בין האוכלוסיות (המרחק בין H0ל ,)H1-או את הקשר בין
שני משתנים .ככל שגודל האפקט גדול יותר ,עוצמת המבחן גדולה יותר.
(למדנו כי ישנן דרכים שונות לחישוב גודל אפקט ,למשל הבדל בין שתי אוכלוסיות ניתן לחשב ע"י ,Cohen’s d
2
.)) η
2
) rאו אטא בריבוע ( וגודל אפקט לקשר בין משתנים ניתן לחשב ,למשל ע"י מתאם פירסון בריבוע (
בניתוח שונות חד כיווני חישוב גודל האפקט מחושב ע"פ אטא בריבוע:
אם נרצה לבדוק את אחוז ההצלחה ,כמה מהשלם הוא אפקט? נחלק את SSBב.SST
מה אנחנו בעצם מקבלים? את האחוז שנהיה צודקים בניבוי שלנו .אם יצא לנו ,0.7שזה ,70%זה אומר
שנהיה צודקים ב 70%מההשערות שלנו כשננסה לשייך תצפית כלשהי לאחת הקבוצות בהתאם לממוצע
שלה.
אטא בריבוע משקפת את היחס בין שונות הניבויים (השונות המדגמית בין הקבוצות – )SSB
לבין השונות הכללית (במדגמים.)SST -
ככל שהיחס הנ"ל גבוה יותר (נע בין 0ל )1-האפקט גדול יותר.
את יחס זה ניתן הפוך לאחוזים ע"י כפילתו ב ,100-ואז ניתן לדווח על אחוז השונות המוסברת (כמה אחוז
מהשונות הכללית ניתן להסביר באמצעות השונות בין הקבוצות).
2
SS B SS B
=η =
SS W +SS B SS T
SST=SSB
SS
SSB
+SSW
W
2
η0∗01 אחוז השונות המוסברת ע"י הבדלים בין קבוצות
2
(η − ∗1 0
)01 אחוז שונות לא מוסברת
מתי? ניתוחי המשך ל( ANOVA-מבחן )Fהמבוצע כאשר יש יותר משתי אוכלוסיות ב"ת .כאשר יש לנו
בהשערה את מקור האפקט וכיוונו נוכל לבצע מבחן של השוואות מתוכננות.
מטרת המבחן :באמצעות ניתוחי שונות ( )ANOVAניתן לבחון האם קיים הבדל בין יותר משני ממוצעים
(אוכלוסיות) -כלומר ,האם כל הממוצעים שווים ( ,)H0או האם לפחות אחד מהממוצעים שונה מהשאר?
27
במידה והמבחן ( )ANOVAיצא מובהק (דחינו את השערת האפס) ,ניתן להניח כי לפחות אחד
מהממוצעים שונה מהשאר ,וכעת ניתן לבצע ניתוחי המשך (השוואות/קונטרסטים) על מנת לאבחן אילו
ממוצעים גדולים/קטנים יותר מהשאר – למעשה לאבחן את מקור האפקט וכיוונו.
סימונים:
( ψפסי) והיא משקפת השוואה (קונטרסט) בבחינת השערות המחקר ,מסומנת באות
השוואה בין שתי קבוצות "על" ,הכוללות את ממוצעי הקבוצות במערך מאוזן ע"פ משקולות.
מקדמי התוחלות/ממוצעים מכונים משקולות ומסומנים באות ( .Cjלדוגמא ,שיערנו כי
ממצוע של קבוצה 3גדול ממוצעי קבוצות 1ו ,2המשקולת של קבוצה 3נשארת בשלמותה
והמשקולת השנייה מתחלקת בין קבוצה 1לקבוצה ,2כך שלכל קבוצה יש מקדם של 0.5בעוד
שלקבוצה 3יש מקדם .1מזיזים את כל הXים לצד אחד ויוצרים השערה עם 0בצד השני) .יש
כלומר אם נחבר את המשקולות נקבל .0 ∑ C =j 0 לשים לב כי חייב להתקיים-
נוסחאות:
השוואות (קונטרסטים) מתוכננות מתפלגות tעם df=N-j
ψ=∑ (C ⋅μ
)j j פרמטר (באוכלוסיות)-
=ψ
^ ∑ (C ⋅x
)j j סטטיסטי המדגם-
2
C j
=σ^ψ
√
^ SM ∑
(⋅W
n j
)
בהנחה שיש שוויון שונויות טעות התקן-
ψ−
^ ψ
=tψ
^
^σ^ψ
סטטיסטי המבחן-
דרגות חופש (מאבדים Jדרגות חופש ,אחת עבור כל מדגם במערך המחקר הכולל)-
fd =∑ n−j J= N− J
α α
( ) ( )
2 2
p [ψ−
^ t c (N− J⋅)σ ψ
≤^⋅^ ψ≤ ψ + tc (N− J
^ =^)σ ψ
^ ] 1− α
רווח סמך-
שלב -2הנחות:
הדגימה מקרית ובלתי-תלויה של תצפיות. •
משקל התפוחים מתפלג נורמלית באוכלוסיות. •
המדגמים בלתי-תלויים (ב"ת). •
גודל המדגמים( ?=n1 :שיטה ( ?=n2 ,)1שיטה ( ?=n3 ,)2שיטה .)3 •
השונויות באוכלוסיות הומגניות (שוויון שונויות). •
SS W ∑ ∑ (x ji− x j)2
=SM W =
fd W N− J האומדן לשונות בתוך האוכלוסיות- •
=ψ
^ ∑ (C ⋅x
)j j סטטיסטי המדגם- •
2
C j
=σ^ψ
√
^ SM ∑
(⋅W
n j
)
טעות התקן (של סטטיסטי המבחן)- •
מתי? ניתוחי המשך ל( ANOVA-מבחן ,)Fבדיקת השערות מאוחרות לגבי כיוון ומקור האפקט המבוצע
כאשר יש יותר משתי אוכלוסיות ב"ת .כאשר יש לנו בהשערה את מקור האפקט וכיוונו נוכל לבצע את
המבחן.
30
מטרת המבחן :השוואות הבודקות הבדלים בין הממוצעים אותם החוקר רוצה לבדוק לאחר איסוף
וניתוח הנתונים .למעשה אפקטים/הבדלים שהחוקר גילה בדיעבד ,ומעוניין לבדוק לאחר שראה את
הממצאים.
שלב -2הנחות:
הדגימה מקרית ובלתי-תלויה של תצפיות. •
משקל התפוחים מתפלג נורמלית באוכלוסיות. •
המדגמים בלתי-תלויים (ב"ת). •
גודל המדגמים( ?=n1 :שיטה ( ?=n2 ,)1שיטה ( ?=n3 ,)2שיטה .)3 •
השונויות באוכלוסיות הומגניות (שוויון שונויות). •
SS W ∑ ∑ (x ji− x j)2
=SM W =
fd W N− J האומדן לשונות בתוך האוכלוסיות- •
=ψ
^ ∑ (C ⋅x
)j j סטטיסטי המדגם- •
2
C j
=σ^ψ
√
^ SM ∑
(⋅W
n j
)
טעות התקן (של סטטיסטי המבחן)- •
32