Professional Documents
Culture Documents
תורת הקבוצות:
שיוויון – שתי הקבוצות מכילות בדיוק את אותם האיברים ,לא משנה מה סדר האיברים. •
}A={1,3,5} B={5,3,3,1
A=B
הכלה – קבוצה Bהיא תת קבוצה של Aאם כל איבר של Bשייך גם ל.A •
Aאו B A B
}A={2,4,6,8 }B={4,6
*כל קבוצה היא תת קבוצה של עצמה.
כאשר Bהוא תת קבוצה של Aאבל אינה שווה ל( Aב Aנמצאים איברים נוספים שאינם נמצאים
ב )Bנאמר כי Bהיא תת קבוצה של ממש של .)B A( A
קבוצות מיוחדות:
• קבוצה ריקה – קבוצה שלא מכילה אף איבר ומסומנת באות Øאו {}.
Øהיא תת קבוצה של כל קבוצה אחרת בעולם.
עולם התוכן (הקבוצה הכללית ) – קבוצת כל האיברים הרלוונטים לדיון מסויים .קבוצה זו •
מסומנת בד"כ באות Ωאו .ω
לדוגמה :אנו עוסקים בתוצאות הטלת קוביה אז {Ω =}1,2,3,4,5,6
A
B
A B
C
איחוד – איחוד של קבוצות Aו Bהיא קבוצת האיברים ששייכים לפחות לאחת מקבוצות •
אלה .או ל Aאו ל Bאו לשתיהן)A∪B( .
חיתוך – חיתוך של קבוצות Aו Bהוא קבוצת האיברים ששייכים לשתי הקבוצות ביחד .כל •
האיברים שנמצאים גם ב Aוגם ב.)A∩B( B
אם אין לקבוצות איברים משותפים A∩B= Øאז נאמר שהקבוצות זרות.
**איחוד וחיתוך הן פעולות סימטריות.
̅
משלים – המשלים של קבוצת Aהיא קבוצת האברים שלא נמצאת ב.𝐴 - A •
חיסור – A-Bהיא קבוצת האיברים שנמצאים ב Aולא שייכים ל( Bלא שייכים לקבוצת •
החיתוך).
̅ =Ω↔Ω
Ø ̅ =Ø ̅̅̅̅̅̅̅
̅𝐵 ∪ ̅𝐴 = 𝐵 ∩ 𝐴 חוקי מורגן:
A∩Ø=Ø
𝐴∪ Ω=Ω
𝐴∪ Ø=A
̅𝐵 ∩ 𝐴 = 𝐵 𝐴 −
וקטורים ומטריצות:
פעולות על וקטורים:
סכום של וקטורים – אם Xו Yהם שני וקטורים בעלי אותו מספר איברים אז X+Yהוא גם וקטור •
בעל nאיברים שבו האיבר במקום ה iהוא .Xi+Yi
כפל וקטור בסקלאר – אם xהוא וקטור ו bהוא סקלאר אז bxהוא וקטור שבו האיבר במקום הi •
הוא .b*xi
5 4∗5 20
3 4∗3 12
⌈ = 𝑋𝑏 → 𝑋 = ⌈ ⌉ 𝑏 = 4 ⌉ ⌈=⌉
0 4∗0 0
2 4∗2 2
מכפלה פנימית (מכפלה סקלארית – ) dot product/אם Xו Yהם שני וקטורים בעלי אותו מספר •
איברים ,nאז המכפלה הפנימית שלהם היא לא וקטור אלא סקלאר ששווה לסכום מכפלת
האברים שלהם.
X*Y = x1*y1 + x2*y2 + x3*y3 + ….. + xn*yn
5 2
3 −1
)𝑋 = ⌈ ⌉ 𝑌 = ⌈ ⌉ → 𝑋𝑌 = (5 ∗ 2) + (3 ∗ −1) + (0 ∗ 8) + (2 ∗ 12
0 8
2 12
= 10 − 3 + 0 + 24 = 31
סכום האיברים בוקטור – אם Xהוא וקטור בעל nאיברים ניתן לכתוב את סכום האיברים כך •
𝑛
אם
x 1=x2=x3=…=xi=…=xn=b
אז
𝑛
𝑏 ∗ 𝑛 = 𝑏 ∑ 𝑥𝑖 = 𝑏 + 𝑏 + 𝑏 + ⋯ +
𝑖=1
ובקצרה
𝑏 ∗ 𝑛 = 𝑏∑
𝑖𝑦 ∑ = ∑ 𝑥𝑖 +
𝑖=1 𝑖=1
ובקצרה
𝑖𝑦 ∑ ∑ 𝑥𝑖 + 𝑦𝑖 = ∑ 𝑥𝑖 +
3 17 1 12
X = [5 2 7 12] ∑ 𝑋 = 78
6 4 9 0
תרגיל לבית:
]Y=[a,2,-2,7] X=[4,5,9,-1
.1מצא את .a
𝑖𝑥 ∑ni=1
∗ 𝑦𝑖 = (𝑎 ∗ 4) + (2 ∗ 5) + (−2 ∗ 9) + (7 ∗ −1) = 4𝑎 + 10 −
= 4a-15=2918 − 7
4a=44
A=11
.2חשבו )𝑦 ∑(3𝑥 +
∑(3𝑋 + 𝑌) = 3 ∑ 𝑋 + ∑ 𝑌 = (3 ∗ 𝑥1 + 𝑦1) + (3 ∗ 𝑥2 + 𝑦3) + 3 ∗ 𝑥3 +
∗ 𝑦3) + (3 ∗ 𝑥4 + 𝑦4) = (3 ∗ 11 + 4) + (3 ∗ 2 + 5) + (3 ∗ −2 + 9) + (3
)7 − 1
= (33+4)+(6+5)+(-6+9)+(21-1) = 37+11+3+20 = 71
קומבינטוריקה
דוגמה :1
מטילים קוביית משחק.
באותו האופן ,מספר התוצאות לניסוי שבו מוטלת קוביה 3פעמים הוא .6 X 6 X 6 = 216
עקרון הכפל – ניסוי מורכב בעל Kשלבים ובכל שלב מספר שונה של תולדות אפשריות שיסומן ב.n
מספר התולדות האפשרי של הניסוי המורכב:
𝒌𝒏 × … × 𝟑𝒏 × 𝟐𝒏 × 𝟏𝒏
דוגמה :1
משתתף בתוכנית קסמים בטלוויזיה מתבקש להטיל מטבע ,אח"כ לשלוף קלף מתוך חפיסת קלפים
תקנית ,להטיל עוד מטבע ,ולבסוף לחשוב על מספר מקרי בין 1ל.10-
בכמה אפשרויות שונות יכול המשתתף לבצע את המטלה?
2 X 52 X 2 X 10 = 2080
דוגמה :2
מבחן אמריקאי כולל 20שאלות ,לכל אחת 4תשובות אפשריות.
בכמה דרכים שונות יכול קוף ,שאינו יודע לקרוא ,לפתור את המבחן?
420
מקרה פרטי של חוק הכפל – כאשר לכל אחד מ Kהניסויים הפשוטים יש אותו מספר תולדות nאז מספר
התולדות האפשרי של הניסוי המורכב:
𝒌𝒏 = 𝒏 × … × 𝒏 × 𝒏 × 𝒏
דוגמה :4
כמה תת-קבוצות ניתן ליצור מקבוצה בת 2איברים? 3איברים? nאיברים?
∅ {𝐴} = 𝐴,
∅ {𝐴, 𝐵} = 𝐴, 𝐵, 𝐴𝐵,
𝑛{𝑛} = 2
כל איבר יכול להכנס/לא להכנס לתת הקבוצה ( 2אפשרויות) כפול nאברים (.)2n
דוגמה :1
בכמה דרכים אפשר לסדר 4ילדים בשורה?
4 × 3 × 2 × 1 = 4! = 24
דוגמה :2
בניסוי פסיכולוגי 4חלקים ,כל חלק הינו תנאי אחר בניסוי .מאחר שהשפעת סדר התנאים על תוצאות
הניסוי אינה ידועה ,החליט החוקר שכל הסדרים האפשריים של תנאים אלה יכללו בניסוי .כמה
סדרים כאלה קיימים?
4 × 3 × 2 × 1 = 4! = 24
!𝑛 = 𝑛 × (𝑛 − 1) × (𝑛 − 2) × … × 1
!10
בכמה דרכים ניתן לסדר בשורה 10ילדים ,מהם 6בנים ו 4-בנות ,אם הילדים מכל מין מתעקשים
לעמוד זה לצד זה?
!𝑛
!)𝑘 (𝑛 −
דוגמה :1
בכיתה 30תלמידים .בכמה דרכים ניתן לבחור מתוכם ועד ,שכולל יו"ר ,סגן ,וגזבר?
פתרון:
דרך א':
יש 30אפשרויות לבחור את היו"ר ← לאחר שזה נבחר ,נותרו 29אפשרויות לבחור את הסגן← לבסוף,
נותרו 28אפשרויות לבחירת הגזבר.
אילו כל הספרים היו מובחנים זה מזה (לכל אחד היה צבע שונה) היו 5! = 120אפשרויות .במצב שבו
חלק מהאיברים לא מובחנים ,יש לחלק את סך כל האפשרויות במספר הסידורים הפנימיים של
הקבוצה הלא מובחנת ,כלומר !. 3
!5 5×4×3×2×1
!3
= 3×2×1
לכן ,מספר הסידורים הוא = 5 × 4 = 20
דוגמה :3
בכיתה 30תלמידים .בכמה דרכים ניתן לבחור מתוכם ועד של 3תלמידים?
כאן ,בניגוד למצב הקודם ,גם האיברים שנבחרים אינם מובחנים .לכן ,נחלק את מספר הסידורים
הכללי גם במספר הסידורים הפנימיים של הקבוצה הנבחרת .במקרה זה ,מספר האפשרויות הוא:
!30 30×29×28 24,360
= !. 27!×3 !3
= 6
= 4,060
קומבינציות:
מספר האפשרויות לבחור (לא לסדר) Kאיברים מתוך nאיברים( .בניגוד לפרמוטציות ,האברים בקבוצה
הנבחרת אינם מובחנים זה מזה -סדר הבחירה לא חשוב).
𝑛 !𝑛
=) (
𝑘 !𝑘 × !)𝑘 (𝑛 −
דוגמה: 1
12נבדקים השתתפו בניסוי זיכרון שבו למדו רשימה של 50מילים ,ולאחר חצי שעה התבקשו
לאחזר את המילים מהזיכרון .שנה לאחר הניסוי ,הוחלט לדגום 5מבין הנבדקים ולבקש מהם
לאחזר שוב את המילים ,כדי לבדוק מהם מאפייני הזיכרון שנה לאחר הלמידה .בכמה דרכים ניתן
לבצע את הדגימה?
פתרון:
12 !12
=) ( = 792
5 !(12 − 5)! ∙ 5
תרגילים נוספים:
.2בכמה דרכים ניתן לחלק nגברים ו n-נשים לזוגות מעורבים (גבר ואישה)?
!𝑛
נעמיד את הנשים בשורה נתונה וביחס אליה נסדר את שורת הגברים ,כל סידור של שורת
הגברים ייצור לנו שילוב זוגות אחר.
.3בכמה מספרים 10ספרתיים אין ספרות צמודות זהות?
910
.4בכמה דרכים שונות ניתן לסדר nאנשים במעגל?
!)(𝑛 − 1
.5לרמי יש:
שלושה פוסטרים זהים של 'היהודים',
פוסטר אחד של 'נקמת הטרקטור',
פוסטר אחד של 'פונץ'
ופוסטר אחד של 'רוקפור'.
רמי החליט להתאים את עיצוב החדר שלו לשנות ה 2000-ולחלק את הפוסטרים שלו בין
חבריו לכיתה ,כך שלכל חבר יהיה לכל היותר פוסטר אחד .בכיתה של רמי יש 10ילדים.
כמה אפשרויות חלוקה יש לרמי?
10 !10
=) (
6 !4! 3
הסתברות:
ההסתברות של מאורע מסוים היא הסיכוי שמאורע זה יתרחש (ההסתברות של Aהיא פונקציה של מאורע
)Aהנעה במספר בין 0ל 1כולל .נסמן הסתברות באות .P
פונקציית הסתברות:
חוקים נוספים:
)𝐴(𝑃 ̅ ) = 1 −
𝑨(𝑃 •
𝑃(∅) = 0 •
המשלים לעולם התוכן הוא קבוצה ריקה .אם ההסתברות של עולם התוכן הוא 1הרי
שההסתברות לקבוצה ריקה המשלימה שלו יהיה .0
אם 𝐵 ⊆ 𝐴 ,אז )𝐵(𝑃 ≤ )𝐴(𝑃 •
𝑃(𝐴) ≤ 1 •
Aהיא תת קבוצה של עולם התוכן ולכן תהיה קטנה או שווה ל 1אך לא גדולה מ.1
)𝐵 ∩ 𝐴(𝑃 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − •
גישה שכיחותנית ( – )frequentistהסתברות כשכיחות יחסית .שכיחות המאורע היא מספר הפעמים
שמאורע זה התרחש.
מרחב הסתברות סימטרי (מרחב בעל הסתברות אחידה) – לכל אחד מהתולדות במרחב המדגם •
יש הסתברות שווה .ההסתברות של מאורע Aשווה למספר התולדות במאורע זה ,לחלק למספר
התולדות הכללי.
)𝐴(𝑛
)𝛺(𝑛 = 𝑃
הסתברות סובייקטיבית – הסתברות כאמונה .אירוע חד פעמי שאליו מייחסים הסתברות המבטאת את
מידת האמונה באירוע שיתקיים.
דוגמה :1
מחלות מעיים ו"מחלת גבהים" הן שתיים מהבעיות הרפואיות הנפוצות ביותר של ישראלים
שמטיילים בצפון הודו .נניח שבקרב אוכלוסייה זו ,ההסתברות ללקות במחלת מעיים היא
,0.5וההסתברות ללקות במחלת גבהים היא .0.3כמו כן ,ההסתברות שלמטייל/ת יהיו גם
מחלות מעיים וגם מחלת גבהים היא .0.2
P(A-B)=0.3 P(B-A)=0.1
P(A+B)=P(A)+P(B)+P(AB)=0.5+0.3-0.2=0.6
דוגמה :2
ההסתברות שסטודנט לפסיכולוגיה טייל במזרח הרחוק לפני לימודיו היא .45%ההסתברות
שסטודנט לפסיכולוגיה רוצה להתקבל למגמה הקלינית היא .70%מה ההסתברות שאדם,
שנדגם אקראית מבין הסטודנטים לפסיכולוגיה ,טייל במזרח או רוצה להיות קלינאי?
P(A)=0.45טייל במזרח
P(B)=0.70רוצה להיות קלינאי
) P(ABלא ניתן לדעת באופן מדויק אלא רק טווח (בין 0.15ל)0.45
)P(AB)=P(A)-P(B)-P(AB
לא ניתן לחשב את ההסתברות הכוללת משום שלא ניתן לדעת את הסתברות החיתוך.
הסתברות מותנית – ההסתברות של תנאי מסוים ( )Aבתנאי שמאורע אחר ( )Bהתרחש.
מספר האיברים במאורע לחלק למספר האיברים בעולם התוכן = ההסתברות למאורע( .לכן מספר
האיברים בחיתוך חלקי מספר האיברים של Bשווה להסתברות של החיתוך חלקי ההסתברות ל.)B
)𝐴|𝐵(𝑃 ≠ )𝐵|𝐴(𝑃
דוגמה :1
א .בוחרים ילד/ה באופן מקרי .מה ההסתברות שדגמנו מישהו ימני?
𝑛(𝑅) 26
= )𝐴(𝑃 = = .65
𝑛(𝛺) 40
ב .בוחרים ילד/ה באופן מקרי .מה ההסתברות שדגמנו ילדה ימנית?
𝑛(𝑅 ∩ 𝐺) 16
= )𝐴(𝑃 = = .4
)𝛺(𝑛 40
)𝐵 ∩ 𝐴(𝑃
= )𝐵|𝐴(𝑃
)𝐵(𝑃
חוק הכפל –
דוגמה :1
כד מכיל 8כדורים אדומים ו 4-כדורים לבנים .מוציאים מהכד שני כדורים ללא החזרה .אם נניח
שבכל הוצאה יש לכל הכדורים שבכד סיכויים שווים להיבחר ,מהי ההסתברות ששני הכדורים
שהוצאו הם אדומים?
8
= ) P(R1
12
7
= ) P(R 2 |𝑅1
11
7 8
= ) P(R1 ∩ R 2 ) = P(R 2|𝑅1 ) × P(R1 ×
11 12
אם A1,A2,A3,…Anהם מאורעות זרים שאיחודם הוא כל מרחב המדגם .מאורע Bהנמצא באותו מרחב
מדגם
הוא בהכרח בעל חיתוכים עם לפחות חלק ממאורעות .Aניתן לפרק את מאורע
Bלאיחוד המאורעות הזרים.
מתוך סטטיסטיקה של תיקי משטרה רבים מעריכים שחוקר באמצעות מכונת אמת (פוליגרף) מגלה
שקרן בסיכוי של 80%ומזהה דובר אמת בסיכוי של .90%מעריכים גם כי 70%מהאנשים המובאים
לבדיקה במכונה הם שקרנים.
)= .14 + .27 - .41דובר אמת∩ "דובר אמת"() + Pשקרן∩ "דובר אמת"(")= Pדובר אמת"(P
חוק :Bayes
לפי נוסחת ההגדרה של ההסתברות המותנית
)𝐵∩𝐴(𝑃
= )𝐵|𝐴(𝑃 )𝐵(𝑃
בנוסף,
)𝐴(𝑃 ∙ )𝐴𝑃(𝐵/
= )𝐵|𝐴(𝑃
)𝐵(𝑃
מאורע Aבלתי תלוי במאורע Bאם )𝐴(𝑃 = )𝐵|𝐴(𝑃 (כלומר מאורע Bאינו משפיע)
)𝐵∩𝐴(𝑃 )𝐵∩𝐴(𝑃
. = )𝐵|𝐴(𝑃 ונקבל )𝐴(𝑃 = נציב
)𝐵(𝑃 )𝐵(𝑃
אי תלות היא סימטרית .כלומר אם Aבלתי תלוי ב ,Bאז גם Bבלתי תלוי ב.A -
מאורע שהוא קבוצה ריקה הינו בלתי תלוי בכל מאורע אחר. -
(מאחר והמאורע הוא קבוצה ריקה ,שני אגפי האי שיווין שווים ל 0והוא מתקיים – לכן
המאורע הריק יהיה בלתי תלוי לכל מאורע אחר).
מאורעות זרים הינם תמיד תלויים. -
(החיתוך שלהם הוא קבוצה ריקה וההסתברות של החיתוך יהיה ,0אם כל אחת
מהקבוצות גדולה מ 0המכפלה שלהם תהיה גדולה מ 0כלומר לא שווה להסתברות
החיתוך).
דוגמה :3
רופא טוען ,כי 30%מהחולים המגיעים למרפאתו מתלוננים על כאב ראש .בקרב 40%מהחולים
המגיעים למרפאה הוא מאבחן חרדה .כמו כן 15% ,מהחולים המגיעים למרפאה מתלוננים על כאב
ראש ,אבל אינם בעלי חרדה.
P(A ∩ B) = 0.15
נניח והיו נתונים רק . 𝑃(𝐴) = .4, 𝑃(𝐵) = .3:כיצד הייתה נראית הטבלה במצב של אי-תלות?
משתנה מקרי הוא פונקציה המוגדרת על מרחב המדגם ,כך שלכל תוצאה במדגם מתאים ערך מספרי
כלשהו.
נסמן משתנים מקריים באותיות גדולות (… )X,Y,ואת ערכי המשתנים המקריים באותיות קטנות (….)x,y,
דוגמה :1
נניח שהניסוי הוא הטלת 3קוביות ,והמשתנה המקרי (מ"מ) הוא סכום התוצאות.
במקרה זה ,הערכים האפשריים שיכול לקבל המשתנה המקרי הם כל המספרים השלמים
בין 3ל ,18-סה"כ 16ערכים אפשריים.
דוגמה :2
נניח שהניסוי הוא הטלת מטבע מספר רב של פעמים ,והמשתנה המקרי הוא מספר הפעמים
שהתקבלה התוצאה "עץ" לפני שהתקבלה התוצאה "פלי" בפעם הראשונה.
במקרה זה ,הערכים האפשריים שיכול לקבל המ"מ הם כל המספרים השלמים בין 0ל.∞-
דוגמה :3
נניח שהניסוי הוא השתתפות במשחק רולטה ,שבו משלמים ₪ 100כדי להשתתף במשחק,
ואפשר לזכות ב ₪ 1000-או להפסיד .המשתנה המקרי הוא הרווח של המהמר.
דוגמה :1
נניח שהניסוי הוא הטלת קובייה 3פעמים ,והמשתנה המקרי 𝑋 הוא מספר הפעמים
שהתקבלה התוצאה " ."1מהם הערכים האפשריים של המשתנה ,ומהי ההסתברות לכל
אחד מהם?
(הטלות של קוביות הן בלתי תלויות אחת בשנייה ולכן הסתברות החיתוך הן מכפלה של
ההסתברויות הפשוטות)
5 5 5 125
= )𝑃(𝑋 = 0 = ∙ ∙ = .579
6 6 6 216
1 5 5 5 1 5 5 5 1 25 75
= )𝑃(𝑋 = 1 ∙∙ ∙ + ∙ ∙ + ∙ ∙ =3 = = .347
6 6 6 6 6 6 6 6 6 216 216
1 1 5 1 5 1 5 1 1 5 15
= )𝑃(𝑋 = 2 ∙∙ ∙ + ∙ ∙ + ∙ ∙ =3 = = .069
6 6 6 6 6 6 6 6 6 216 216
1 1 1 1
= )𝑃(𝑋 = 3 = ∙ ∙ = .005
6 6 6 216
← שלושת ההסתברויות האלו משלימות ל – 1משום שהן ממצות את עולם התוכן וזרות
אחת לשנייה.
משתנה מקרי בדיד:
משתנה מקרי בדיד – משתנים מקריים בעלי מספר סופי (או בן-מניה – מספר אינסופי של מספרים שלמים)
של איברים.
משתנה מקרי רציף – משתנים מקריים בעלי אינסוף ערכים אפשריים( .לרוב משתנים פיזיקליים).
כל משתנה מקרי שערכיו נמדדים אמפירית הינו בדיד באופן מעשי .אולם פעמים רבות נרצה להתייחס
אליו כאל משתנה מקרי רציף.
פונקציית מסת הסתברות ( – )PMF – Probability Mass Functionפונקציה המייחסת הסתברות לערכים
של משתנה מקרי בדיד.
דוגמה :1
דוגמה :1
התוחלת של משתנה מקרי Xמסומנת ] E[Xאו באות 𝜇 ומוגדרת על ידי הסכום (סיגמה) של כל אחד
מהערכים כפול ההסתברות שלו .בכך נתחשב גם בערכים וגם בהסתברות שלהם (הבדלה בין הסתברויות
שונות לערכים שונים).
)𝑥(𝑃 ∙ 𝑥 ∑ = ]𝑋[𝐸
𝑥
דוגמה :1
דוגמה :2
מהמר משתתף במשחק קלפים המוגדר באופן הבא .מוציאים קלף מקרי מחפיסת קלפים תקנית .אם
יצא קלף של "תמונה" (נסיך ,מלכה או מלך) ,המהמר מקבל .₪ 10אם יצא קלף של מספר ,הוא
משלם .₪ 2.5האם כדאי למהמר להשתתף במשחק?
היא מה תוחלת הרווח של המהמר .כלומר ,מה יהיה ממוצע הרווח שלו בכל משחק ,אילו היה משחק
מספר רב של פעמים.
הסיכוי לרווח של ₪ 10הוא הסיכוי לקבל אחד משלושת קלפי התמונה כפול ארבע
(תלתן/עלה/יהלום/לב) לחלק למספר הקלפים בחפיסה.
40 10
= )𝑃(𝑋 = −2.5 =
52 13
הסיכוי לרווח של "( ₪ 2.5-הפסד") הוא הסיכוי לקבל אחד מעשרת הקלפים הנותרים כפול ארבע
(תלתן/עלה/יהלום/לב) לחלק למספר הקלפים בחפיסה.
התוחלת שווה לסכום של כל אחד המערכים ( )+10/-2.5כפול ההסתברות שלו .תוחלת הרווח
חיובית ,ולכן כדאי למהמר להשתתף במשחק.
חוקי התוחלת:
תוחלת של קבוע –
אם 𝑘 הוא קבוע (משתנה מקרי שיש לו רק תולדה אחת אפשרית שהיא )1 = 100%אז 𝑘 = ]𝑘[𝐸 .
דוגמה :1
כדי להשתתף במשחק ,כל משתתף משלם שני דולר .מה תוחלת הרווח במשחק זה?
דוגמה :1
Xהוא מ"מ המציין את התוצאה של הטלת קוביה .חשבו את ] .𝐸[𝑋 2
אם Xהוא התוצאה של הטלת קובייה אז התוחלת שלו שווה ל( 3.5חושב בסעיפים הקודמים) (כלומר ,אם
במשחק נשלם על פי תוצאת הקוביות תוחלת הרווח תהיה .)3.5התוחלת של ( X2כלומר ,תוחלת הרווח
במשחק שבו נשלם לפי תוצאת הקוביות בריבוע) תהיה לא שווה ל.3.52
𝟐)]𝑿[𝑬( ≠ ] 𝟐𝑿[𝑬
נניח ש 𝑋-הוא מ"מ ,ו 𝑎, 𝑏 -קבועים .נגדיר מ"מ חדש( 𝑌 = 𝑏𝑋 + 𝑎 ,נוסחה של קו ישר) .במקרה זה𝑌 ,
נקרא טרנספורמציה ליניארית של 𝑿 (שינוי של קו ישר) מפני שהוא מוגדר על-ידי הפעלת נוסחת הקו
הישר על 𝑋 .ניתן לחשב את התוחלת של Yבאופן ישיר על ידי .X
הוכחה:
שונות ()variance
עבור משתנה מקרי שהינו קבוע ,התוחלת מאפיינת לחלוטין את ההפלגות .בכל מצב אחר ,נרצה לדעת עד
כמה הערכים של המשתנה המקרי קרובים או רחוקים לתוחלת.
דוגמה :1
סטיית תקן ( – )Standard Deviationמוגדרת על-ידי שורש השונות ,ומסומנת באות 𝜎 (סיגמה קטנה).
סטיית התקן לא מעידה על ה Xהגדול ביותר או הקטן ביותר האפשרי ,אלא על הסטייה הממוצעת.
)𝑋(𝑟𝑎𝑉√ = 𝜎
הוכחה:
נניח ש 𝑋-הוא משתנה מקרי ,ו 𝑎, 𝑏 -קבועים .נגדיר משתנה מקרי חדש – 𝑎 .𝑌 = 𝑏𝑋 +
הוכחה:
] 𝑽𝒂𝒓[𝒀] = 𝐸[(𝑌 − 𝜇)2 ] = 𝐸[[(𝑏𝑋 + 𝑎) − (𝑏𝜇 + 𝑎)]2 ] = 𝐸[(𝑏𝑋 − 𝑏𝜇)2 ] = 𝐸[[𝑏(𝑋 − 𝜇)]2
]𝑿[𝒓𝒂𝑽 ∙ 𝟐𝒃 = ] = 𝐸[𝑏 2 ∙ (𝑋 − 𝜇)2 ] = 𝑏 2 ∙ 𝐸[(𝑋 − 𝜇)2
שונות של הטרנספורמציה הליניארית מושפעת רק מ( bכפל בקבוע) ואינה מושפעת מ( aתוספת או הורדה
של קבוע).
דוגמה:
פתרון:
𝑋𝑌 = 3.77
התפלגות ברנולי:
התפלגות ברנולי – משתנה מקרי בעל שני ערכים בלבד .נסמן "הצלחה"=" ,1כישלון"=.0
תוחלת –
שונות –
𝑝 = )𝑝 𝐸[𝑋 2 ] = 12 ∙ 𝑝 + 02 ∙ (1 −
לכן:
השונות תהיה הכי גדולה כאשר Pו Qיהיו שווים זה לזה ( – )0.5השונות תהיה שווה ל.0.25
דוגמה :1
תוחלת𝐸(𝑋) = 𝑝 = .9 :
מבצעים 𝑛 ניסויי ברנולי ,שהסתברות ההצלחה בכל אחד מהם היא 𝑝 והסתברות הכישלון 𝑝 .𝑞 = 1 −
מספר ההצלחות ב 𝑛-ניסויי ברנולי הוא מספר בין 0ל( 𝑛-משתנה מקרי בדיד).
𝒏
𝒌𝑷(𝑿 = 𝒌) = ( ) ∙ 𝒑𝒌 ∙ (𝟏 − 𝒑)𝒏−
𝒌
כאשר
𝑛 !𝑛
=) (
𝑘 !𝑘 ∙ !)𝑘 (𝑛 −
𝑘𝑃 = 𝑝𝑘 ∙ (1 − 𝑝)𝑛−
𝑛
קיימים ) ( רצפים שונים כאלה ,ולכן ההסתברות לקבל kהצלחות באופן כללי היא
𝑘
𝒏
𝒌𝑷(𝑿 = 𝒌) = ( ) ∙ 𝒑𝒌 ∙ (𝟏 − 𝒑)𝒏−
𝒌
הוכחה "אינטואיטיבית" :עבור ,n=1מדובר בהתפלגות ברנולי ,שהתוחלת שלה .pאם נבצע nניסויים
בלתי-תלויים כאלה ,תוחלת מספר ההצלחות תהיה 𝑝 ∙ 𝑛 .
הוכחה "אינטואיטיבית" :עבור n=1מדובר במשתנה ברנולי בעל שונות )𝑝 ,𝑝(1 −אם נבצע nניסויים
בלתי תלויים כאלה ,שונות מספר ההצלחות תהיה )𝑝 .𝑛 ∙ 𝑝(1 −גם כאן ,ככל ש p-קרוב יותר ל ,0.5-כך
השונות גדולה יותר.
הנחות המודל הבינומי – התפלגות בינומית היא פונקציית התפלגות תיאורטית ,שבבסיסה עומדת ההנחה
שההסתברות ל p-הינה זהה בכל שלב .מכאן ,שהמודל הבינומי מניח אי-תלות בין התוצאות של הניסויים
השונים .זוהי הנחה תיאורטית שהחוקר מקבל כאשר הוא מחליט להשתמש במודל הבינומי.
(הנכונות של הסתברויות שמופקות מהמודל הבינומי תלויה באמיתות הנחות אלה – הטענה שמשתנה
מסויים מתפלג בינומית הינה תיאוריה על העולם).
דוגמה :1
נניח שהניסוי הוא הטלת קובייה 3פעמים ,והמ"מ 𝑋 הוא מספר הפעמים שהתקבלה התוצאה " ."1מהם הערכים
האפשריים של המשתנה ,ומהי ההסתברות לכל אחד מהם?
נגדיר :הצלחה – התקבלה התוצאה " ,"1כישלון – התקבלה תוצאה שאינה "."1
1 5
=𝑝 ;q = ;n = 3
6 6
דוגמה :2
הסתברות ההצלחה בטיפול קצר טווח לחרדה חברתית היא .0.7נדגמו 5אנשים בעלי חרדה חברתית וקיבלו טיפול
זה.
מהי פונקציית מסת ההסתברות עבור מספר האנשים שעבורם הצליח הטיפול?
𝑛
𝑘𝑃(𝑋 = 𝑘) = ( ) ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−
𝑘
5
𝑃(𝑋 = 0) = ( ) ∙. 70 ∙ (1 − .7)5−0 = .002
0
5
𝑃(𝑋 = 1) = ( ) ∙. 71 ∙ (1 − .7)5−1 = .028 0.40
1
5 0.30
𝑃(𝑋 = 2) = ( ) ∙. 72 ∙ (1 − .7)5−2 = .132
2
)P(X
0.20
5
𝑃(𝑋 = 3) = ( ) ∙. 73 ∙ (1 − .7)5−3 = .309
3 0.10
5 0.00
𝑃(𝑋 = 4) = ( ) ∙. 74 ∙ (1 − .7)5−4 = .360
4 0 1 2 3 4 5
5 X
𝑃(𝑋 = 5) = ( ) ∙. 75 ∙ (1 − .7)5−5 = .168
5
דוגמה :3
סטודנט לפסיכולוגיה משתתף בניסוי שבו הוא נדרש ללמוד 12מילים ,ולאחר מכן נדרש לשלוף אותן מהזיכרון.
נניח שההסתברות לשלוף כל מילה בודדת מהזיכרון היא .80%
כמו-כן נניח ,כי שליפה של מילה מסוימת הינה בלתי תלויה במילים האחרות ,וכן הסתברות השליפה זהה עבור כל
המילים.
פתרון:
12
𝑃(𝑋 = 11) = ( ) ∙ .811 ∙ (1 − .8)12−11 = .206
11
12
𝑃(𝑋 = 12) = ( ) ∙ .812 ∙ (1 − .8)12−12 = .069
12
ההסתברות לשלוף יותר מ 10מילים:
תוחלת:
𝐸[𝑋] = 𝑛 ∙ 𝑝 = 12 ∙ .8 = 9.6
שונות:
𝑉𝑎𝑟[𝑋] = 𝑛 ∙ 𝑝 ∙ 𝑞 = 12 ∙ .8 ∙ .2 = 1.92
סטיית תקן:
𝒌𝝀
!𝒌 ∙ 𝝀𝑷(𝑿 = 𝒌) ≈ 𝒆− פונקציית מסת הסתברות עבור התפלגות פואסונית –
נשתמש בהתפלגות פואסונית כאשר הפרמטר הנתון הוא 𝜆 ,ולא pאו .nכלומר ,לא תהיה נתונה הסתברות
ולא גודל מדגם ,אלא מספר מאורעות ממוצע (ממוצע זה יתייחס לרוב ליחידת זמן מסוימת).
כמו בהתפלגות בינומית ,גם התפלגות פואסונית נוטה להיות סימטרית ככל ש 𝜆 -גדולה יותר.
הנחות המודל הפואסוני – בדומה להתפלגות בינומית ,גם התפלגות פואסונית היא מודל מתמטי תיאורטי,
שמתבסס על הנחות מסויימות ,ומותנה בהן:
א .הנחת ההסתברויות השוות של המודל הבינומי (מפני שהתפלגות פואסונית מבוססת על בינומית)
ב .ההסתברות ששני מאורעות יתרחשו בדיוק יחד היא .0
דוגמה :1
במצב מנוחה ,מספר פוטנציאלי הפעולה של נוירון מסויים במוח של עכבר מתפלג
פואסונית ,ושווה ל 10-פעמים בשניה בממוצע .חוקר הקליט את פעילות הנוירון
באמצעות אלקטרודה .מה ההסתברות שבשניה מסויימת יימדדו בדיוק 8פוטנציאלי
פעולה?
𝑘𝜆
∙ 𝜆𝑃(𝑋 = 𝑘) = 𝑒 −
!𝑘
108
∙ 𝑃(𝑋 = 8) = 𝑒 −10 = .11
!8
התפלגות גיאומטרית:
מבצעים סדרה של ניסויי ברנולי .בכל אחד מהניסויים ,הסתברות שווה לתולדה "הצלחה" – .Pנגדיר את
המשתנה המקרי ,Xכמספר הניסויים שיש לבצע עד שמתקבלת "הצלחה" בפעם הראשונה.
𝒑 ∙ 𝟏𝑷(𝑿 = 𝒌) = (𝟏 − 𝒑)𝒌−
ההסבר לכך הוא שעל מנת שהתולדה "הצלחה" תופיע בפעם הראשונה בניסוי ה ,k-צריכים להיות קודם
לכן ) (k-1ניסויים שבהם התולדה הייתה "כישלון".
𝟏
= )𝑿(𝑬 תוחלת של Xמ"מ המתפלג גיאומטרית
𝒑
𝒑𝟏−
= )𝑿(𝒓𝒂𝑽 𝟐𝒑
המתפלג גיאומטרית שונות של Xמ"מ
תכונת חוסר זיכרון – בגלל שהתוצאות בלתי תלויות זו בזו ,ההסתברות שהתולדה הצלחה תופיע בפעם
הראשונה בניסוי ה kבהינתן שב nההטלות הראשונות התולדה הייתה כישלון הוא ))𝑛 𝑃(𝑋 = (𝑘 −
דוגמה :1
מטילים קובייה פעם אחר פעם ,עד שמתקבלת התוצאה " ."6מה ההסתברות שמספר ההטלות
הוא ?10מה התוחלת ומה השונות של משתנה זה?
5 1
𝑃(𝑋 = 10) = (1 − 𝑝)9 ∙ 𝑝 = ( ) 9 ∙ = .032
6 6
1 1
= )𝑋(𝐸 = =6
𝑝 1
6
𝑝1−
= )𝑋(𝑟𝑎𝑉 = 30
𝑝2
דוגמה :2
נתון כי בשלוש ההטלות הראשונות לא התקבלה התוצאה "."6כעת ,מה הסיכוי שמספר ההטלות
הנדרש (עד לקבלת " )"6יהיה ?10
בגלל שהתוצאות ב"ת זו בזו ,ניתן פשוט לחשב את ההסתברות שמעכשיו מספר ההטלות יהיה :7
𝑃(𝑋 = 7) = (1 − 𝑝)6 ∙ 𝑝 =. 8336 ∙ .166 = .055
)𝑃(𝑋 = 10 | 𝑋 > 3) = 𝑃(𝑋 = 7 הקובייה לא זוכרת את רצף התוצאות הקודם .לכן
משתנים מקריים רציפים יכולים לקבל כל ערך ממשי שהוא בטווח מסוים.
– Xמשתנה מקרי רציף
דוגמה :1
𝒃
עבור משתנה מקרי רציף ,ה CDFיוגדר – 𝒙𝒅 )𝒙(𝒇 ∞𝑭(𝑿 ≤ 𝒃) = ∫𝑿=−
)𝑋(𝑓 נקראת פונקציית צפיפות ההסתברות )( (Probability Density Function; PDFזו המקבילה
הרציפה לפונקציית מסת ההסתברות) .הסתברות מיוצגת על-ידי השטח מתחת לפונקציה (ציר ה Yאינו
מייצג הסתברות).
זמן הנהיגה של אדם בין ביתו לבין מקום עבודתו מתפלג באופן אחיד בין 20דקות לחצי שעה .כלומר ,כל
אחד מהזמנים בין 20ל 30-דקות סביר באותה המידה .מה ההסתברות שביום מסוים משך הנסיעה יהיה 22
דקות לכל היותר?
𝑐 20 ≤ 𝑥 ≤ 30
{ = )𝑥(𝑓 פונקציית הצפיפות היא:
𝑒𝑠𝑖𝑤𝑟𝑒0 𝑜𝑡ℎ
22
ולכן ההסתברות המבוקשת היא𝑃(𝑋 ≤ 22) = ∫−∞ 𝑓(𝑋) 𝑑𝑥 :
משתנים מקריים רציפים מיוחדים:
𝟐)𝝁−(𝒙−
𝟏
= )𝒙(𝒇 𝒆∙ 𝟐𝝈𝟐 פונקציית הצפיפות של ההתפלגות נורמלית –
𝝈𝝅𝟐√
משתנה מקרי נורמלי מאופיין על-ידי שני פרמטרים 𝜇 ,ו .𝜎 2 -נסמן ) 𝟐𝝈 .𝑿~𝑵(𝝁,
התפלגויות גאוסיאניות נבדלות זו מזו בתוחלת ובסטיית התקן (עבור כל ערך של פונקציה נקבל התפלגות
גאוסיאנית אחרת).
חישוב הסתברויות במודל הנורמלי – מאחר והתפלגות נורמלית היא רציפה ,הסתברות תחושב על-ידי
שטח מתחת לפונקציית צפיפות ההסתברות ,או על-ידי פונקציית ההתפלגות המצטברת.
כלומר,
∞
𝑥𝑑 )𝑥(𝑓 ∞𝐹(𝑥) = ∫−
−(𝑥−𝜇)2
1
= )𝑥(𝑓) 𝜎𝜋2
𝑒∙ 2𝜎2 (
√
Xהוא משתנה מקרי רציף שמתאר את משך הזמן שחולף עד ההצלחה הראשונה (הערכים של Xתמיד יהיו
גדולים או שווים ל.)𝑥 ≥ 0 – 0-
← אם משתנה מתפלג פואסונית – משך הזמן יתפלג בצורה אקספוננציאלית.
𝜆 קצב האירועים – ככל שקצב האירועים גבוה יותר ,משך הזמן שנצטרך לחכות עד להצלחה הראשונה
יהיה נמוך יותר.
נסמן )𝜆(𝑋~exp
1
= )𝑋(𝑟𝑎𝑉 שונות התפלגות אקספוננציאלית –
𝜆2
1
סטיית תקן – = )𝑋(𝐸 = )𝑋(𝑟𝑎𝑉√ = )𝑋(𝜎
𝜆
דוגמה :1
יוסי נפרד מחברתו לפני כשנתיים ,אבל עדיין מתגעגע אליה .הדבר מתבטא בכך שהוא ממשיך
לחשוב עליה לעיתים תכופות .אם מספר המחשבות על מירי מתפלג פואסונית ,והקצב שלהן
הוא פעמיים בשבוע ,מה ההסתברות שלא יחשוב על מירי ביומיים הקרובים?
2
קצב המחשבות מתפלג פואסונית 𝜆 = 7 ,מחשבות ביום.
אם Xמבטא את מספר הימים ,אז ההסתברות שיחשוב על מירי ביומיים הקרובים
(אם הוא חושב על מירי פעמיים בשבוע ,אז "בממוצע" הוא חושב עליה כל 3.5ימים).
התפלגויות אמפיריות
התפלגויות ספציפיות שנאספות על פי מדגם מהן נסיק מידע לגבי המשתנה התיאורטי .מתוך התפלגות
תיאורטית מסוימת ניתן לדגום אינסוף מדגמים שונים מגודל ,Nכל אחד יכלול תצפיות אחרות.
פרמטרים – מאפיינים של התפלגות תיאורטית .כאשר נרצה להשתמש במודל תיאורטי מסוים ,כלומר
נחליט שמשתנה כלשהו מתפלג באופן מסוים ,הפרמטרים יהיו למעשה מאפיינים של התפלגות
האוכלוסייה (קבועים שמגדירים באופן מדויק את צורת ההתפלגות).
(שלוש קבוצות של סטטיסטים – מדדי מרכז ,מדדי פיזור ,מדדים למיקום יחסי).
מדדי מרכז:
מתארים את המרכז של התפלגות המדגם ,משמשים כדי לאמוד את המרכז של ההתפלגות התיאורטית
שממנה המדגם נלקח.
שכיח ( – MO )modeהערך בעל השכיחות הגדולה ביותר ,השכיח לא מושפע מערכים קיצוניים במדגם.
חציון ( – MD )medianהערך האמצעי בהתפלגות ,שחצי מהערכים גבוהים ממנו וחצי נמוכים ממנו .כדי
לחשב את החציון ,נסדר את הערכים מהקטן לגדול ,החציון יהיה הערך האמצעי .אינו מושפע מערכים
קיצוניים במדגם .כאשר מספר הערכים במדגם הינו זוגי ,החציון יחושב כממוצע הערכים המרכזיים.
קריטריון הריבועים הפחותים – סכום ריבועי הסטיות מהממוצע קטן יותר מסכום ריבועי
הסטיות מכל ערך אחר.
נתונה התפלגות אמפירית (הת' מדגם) .48, 52, 76, 88, 92, 92, 100 :בהתפלגות זו .N=7
𝑀𝑜 = 92
𝑀𝑑 = 88
48 + 52 + 76 + 88 + 92 + 92 + 100
= ̅𝑥 = 78.29
7
מדדי פיזור:
באפיון משתנים מקריים יש להתייחס לא רק על ידי מרכז ,אלא גם לפיזור הערכים סביב מדדים אלו.
אחוז הסטיות מהשכיח – כשמדד המרכז הוא השכיח ,מדד הפיזור הוא אחוז התצפיות שסוטות (שונות)
מהשכיח (בלי התייחסות לגודל הסטייה) .שווה לאפס כאשר כל הערכים במדגם שווה זה לזה.
ממוצע הסטיות המוחלטות מהחציון ( – AD )mean absolute deviationכשמדד המרכז הוא חציון.
שונות ( – )varianceכשמדד המרכז הוא הממוצע ,מדד הפיזור יהיה ממוצע ריבוע הסטיות מהממוצע.
∑(𝑥 − 𝑥̅ )2
= 𝑆2
𝑁
טווח ( – )rangeהפרש בין הערך הגבוה ביותר לערך הנמוך ביותר בהתפלגות .מושפע רק מערכים קיצוניים.
טווח מקוצץ ( – )truncated rangeטווח המחושב לאחר הסרת הערכים הקיצוניים בהתפלגות.
קיצוץ מקובל הוא טווח בין רבעוני ( )inter-quartile rangeהמחשב את הטווח של 50%
המרכזיים של ההתפלגות לאחר הסרת הרבע העליון והתחתון של ההתפלגות.
נתונה התפלגות אמפירית (הת' מדגם) .48, 52, 76, 88, 92, 92, 100 :בהתפלגות זו .N=7
𝑀𝑜 = 92
5
∶ אחוז הסטיות מהשכיח = .71 = 71%
7
𝑀𝑑 = 88
48 + 52 + 76 + 88 + 92 + 92 + 100
= ̅𝑥 = 78.29
7
∑(𝑥 − 𝑥̅ )2 2,555.43
= : 𝑆 2שונות = = 365.06
𝑁 7
∶ 𝑆 = √365.06 = 19.11סטיית תקן
מדדים למיקום יחסי מצביעים על מיקום של ערך בודד בתוך ההתפלגות .מדדים למיקום יחסי הינם חסרי
יחידות ,כלומר לא קשורים ליחידות המדידה של המשתנה המקורי .לכן ,הם מאפשרים להשוות בין
ערכים שונים שנלקחו מהתפלגויות שונות.
מאונים ( – )percentilesהמאון של ערך מסוים הוא החלק היחסי של ההתפלגות שנמצא מתחת לערך זה
(מספר בין .)0-100קיימות מספר דרכים שונות לחישוב המאון בהינתן התפלגות מדגם ,דרכים אלה
מובילות לתוצאות שונות במדגמים קטנים ,אך נוטות להתכנס לתוצאה דומה במדגמים גדולים .שיטות
לחישוב מאונים לא מתאימות למדגמים קטנים מאוד.
החציון הוא המאון ה ,50-המאון ה 25נקבע רבעון תחתון( ,)𝑄1המאון ה 75נקרא רבעון עליון( .)𝑄3
דוגמה :1
בהתפלגות מדגם ,אם המאון של הערך X=34הוא 75אז 75%מהערכים בהתפלגות נמצאים מתחת
ל .34-נסמן זאת . 𝑃𝑥=34 = 75
אם nהוא מספר שלם אזי הערך הרלוונטי הוא זה שנמצא במקום ה𝑿𝒑 = 𝑿𝒏 n-
אם nמספר לא שלם נפריד את nלשני חלקים ,המספר השלם kוהחלק העשרוני ( dלדוגמה אם
,n=4.23אזי k=4ו)d=.23 -
) 𝒌𝑿 𝑿 = 𝑿𝒌 + 𝒅(𝑿𝑲+𝟏 −
דוגמה :2
נתונה ההתפלגות האמפירית .48, 52, 76, 88 :מהו הערך במאון ה) 𝑋𝑝=33( ?33-
𝑃 33
=𝑛 = )(𝑁 + 1 (4 + 1) = 1.65
100 100
נפריד את nלשני חלקיםk=1, d=.65:
𝑛∙100
= ( Pכאשר Pהוא המאון 𝑁+1
ערך זה בהעברת אגפים חישוב המאון של הערך – Xנמצא את המיקום של
̅𝑥 𝑥 −
= 𝑥𝑍
𝑆
Zיכול להיות מספר חיובי (גדול מהממוצע) או שלילי (נמוך מהממוצע) ,ציון התקן של ממוצע המדגם הוא
.0
ציון התקן הוא ערך שאינו תלוי ביחידות המדידה של המשתנה ,מאפשר להשוות בין ציונים שונים ביחידות
מדידה שונות.
דוגמה :1
בהתפלגות האמפירית ,48, 52, 76, 88, 92, 92, 100 :ראינו כי 𝑥̅ = 78.29, 𝑠 = 19.11
לכן
100 − 78.29
= 𝑍𝑥=100 = 1.14
19.11
52 − 78.29
= 𝑍𝑥=52 = −1.38
19.11
ממוצע ציוני התקן שווה ל – 0אם ניקח מדגם ,ונמיר את כל הערכים מציוני גלם לציוני תקן ,אז •
ממוצע ציוני התקן יהיה .0
(𝑥 − 𝑥̅ ) 1
∑ 𝑧∑ 𝑠 ∙ ∑(𝑥 − 𝑥̅ ) 0
= ̅𝑍 = 𝑠= = =0
𝑁 𝑁 𝑁 𝑁
השונות של ציוני התקן שווה ל( 1 -ולכן גם סטיית התקן שווה ל – )1 -אם ניקח מדגם ,ונמיר את •
כל הערכים מציוני גלם לציוני תקן ,אז שונות ציוני התקן יהיה .1
∑(𝑧 − 𝑧̅)2 ∑(𝑧 − 0)2 ∑ 𝑧 2
= 𝑧𝑆2 = =
𝑁 𝑁 𝑁
(𝑥 − 𝑥̅ )2
∑ 1 ∑(𝑥 − 𝑥̅ )2 1
= 𝑠2 ∙= 2 = 2 ∙ 𝑠2 = 1
𝑁 𝑠 𝑁 𝑠
ציוני תקן הם טרנספורמציה ליניארית של ציוני הגלם – אם המשתנה Xהוא ציוני גלם ,אז ניתן •
לכתוב את ציוני התקן כ.𝑍 = 𝑏𝑋 + 𝑎 :
𝑥 − 𝑥̅ 1 ̅𝑥
=𝑍 = ∙𝑥−
𝑠 𝑠 𝑠
1 ̅𝑥
𝑠 = 𝑏) (𝑠 𝑎 = −
טרנספורמציה לציוני תקן לא משנה את צורת ההתפלגות באופן כללי (התפלגות נורמלית
סטנדרטית נוצרת על ידי טרנספורמציה לציוני תקן של משתנה שמתפלג נורמלית ,ציוני תקן של
משתנה אחר ,שאינו מתפלג נורמלית ,אינם מתפלגים נורמלית).
סולמות מדידה
סווג משתנים על פי סולמות מדידה – מדידה על פי חוקים שונים ,וסווג משתנים לפי מאפיינים שנובעים
מחוקים אלו (יגדירו עבור כל משתנה את התכונות שלו וסיווג הניתוח הסטטיסטי שמתאים לו).
סולם שמי – נומינלי ( – )nominal scaleלא מתבצעת מדידה אלא רק מתן שם/תווית מספרית לערכים
מסוימים (לדוגמה :מין [גבר/אישה] ,נטייה פוליטית [רפובליקנים/דמוקרטים]) .הניתוח הסטטיסטי של
משתנים נומינליים ייעשה בד"כ באמצעות מדדים של שכיחות ,שכיח ,ואחוז סטיות מהשכיח.
סולם סדר – אורדינלי ( – )ordinal scaleמסדר תצפיות ,אובייקטים או מאורעות לפי סדר מסוים
(לדוגמה :רמת השכלה [יסודית/תיכונית/אקדמית] ,סדר ההגעה לקו הסיום בתחרות ריצה ,פריט בשאלון
שעבורו הנסדק מסמן ערך בין .)1-5הניתוח הסטטיסטי ייעשה בד"כ* באמצעות מדדים הקשורים בסדר –
מאונים ,חציון ,סטיות מהחציון.
סולם רווח – אינטרוולי ( – )interval scaleבסולם זה נתייחס לא רק לסדר בין ערכים שונים ,אלא גם
להפרשים ביניהם ,קיימת יחידת מדידה קבועה ואפשר למדוד באמצעותה הפרשים .בסולם זה נקודת
האפס נקבעה באופן שרירותי ואינה מציינת אפס כמות (לדוגמה :טמפרטורה) .הניתוח הסטטיסטי יכול
להיעשות באמצעות כל סוגי הסטטיסטים.
סולם מנה ( – )ratio scaleבסולם זה לא נתייחס רק לסדר ולהפרש בין הערכים ,אלא גם ליחס ביניהם.
בסולם זה נקודת האפס מציינת אפס כמות (לדוגמה :משתנים פיזיקליים – אורך ,שטח ,נפח ,משקל).
הניתוח הסטטיסטי יכול להיעשות באמצעות כל סוגי הסטטיסטים.
הניתוח הסטטיסטי נעשה על מספרים ,אולם האופן שבו מפיקים מספרים אלה אינה קשורה •
לסטטיסטיקה.
רוב הניתוח הסטטיסטי מתבצע לפי סטטיסטים ופרמטרים המתאימים לסולם רווח ומנה ,גם אם •
המשתנים הרלוונטיים נמדדים בסולם סדר.
הניתוח הסטטיסטי צריך להיות בעל משמעות ,אך לא חייב להיגזר בהכרח מסולם המדידה. •
מדדי קשר
מתאם פירסון:
דיאגרמת הפיזור של המשתנים ( – )scatter plotכל אחד מהצירים ( )X,Yמבטא משתנה אחר ,כל נקודה
על הגרף מבטאת תצפית במדגם.
במדגם בו יש Nתצפיות ,אשר לכל אחת מהן ערך בשני משתנים ( )X,Yנמיר את הערכים לציון תקן בכל
𝒚𝒁∗ 𝒙𝒁
∑ = 𝒚𝒙𝒓 אחד מהמשתנים בנפרד .מתאם פירסון למדגם זה:
𝑵
מתאם פירסון יהיה שווה לממוצע מכפלות ציוני התקן בשני המשתנים.
ברביע הראשון יהיו התצפיות בהן שני ציוני התקן יהיו חיוביים (מעל הממוצע) •
ברביע השני תצפיות בהן אחד מהציונים גבוה מהממוצע ואחד נמוך •
ברביעי השלישי תצפיות בהן שני ציוני התקן מתחת לממוצע •
ברביע הרביעי תצפיות בהן אחד מהציונים נמוך מהממוצע ואחד גבוה (הופכי לרביע השני). •
המתאם יהיה חיובי כאשר רוב התצפיות יהיו ברביע הראשון או בשלישי (שתי התצפיות גבוהות/נמוכות
מהממוצע) ,המתאם יהיה שלילי כאשר רוב התצפיות יהיו ברביע השני או ברביעי (אחת מהתצפיות נמוכה
מהממוצע והשנייה גבוהה מהממוצע).
חישוב מתאם על פי ציוני גלם –
̅𝑦 𝑥 − 𝑥̅ 𝑦 −
)̅𝐲 ∑ 𝑍𝑥 ∙ 𝑍𝑦 ∑( 𝑠𝑥 )( 𝑠𝑦 ) ∑(𝐱 − 𝐱̅)(𝐲 −
𝑦𝑥𝑟 = = =
𝑁 𝑁 𝐲𝐒 𝐱𝐒𝐍
שונות משותפת ( – )covarianceסטטיסטי המבטא את הקשר בין המשתנים ( .)X,Yיכול להיות כל מספר
(ולכן לא ניתן להשוות בין שונויות משותפות שונות).
בודק עד כמה הקשר בין המשתנים הוא מונוטוני (כאשר משתנה אחד עולה – השני עולה בהתאמה ולהפך).
סולם המדידה של המשתנים (או של אחד מהם) הוא סולם סדר – לא יהיה משמעות לחישוב •
ממוצע וסטיית תקן ואין משמעות לקשר ליניארי.
כאשר הקשר הוא אינו קשר ליניארי. •
הקשר בין הדירוגים יכול להיות ליניארי גם כאשר הקשר בין המשתנים אינו ליניארי.
על מנת לחשב מתאם ספירמן ,נהפוך את ציוני הגלם בשני המשתנים לדירוגים ולאחר מכן נחשב מתאם
פירסון בין הדירוגים.
לדוגמה:
נדרג את ערכי ה( Xגיל) על פי סולם סדר עולה וכן את ערכי ה( Yציון זכרון) על פי סולם סדר עולה.
בערכי ה ,Yבהם יש שני ערכים זהים ( ,)12הערך של כל אחד מהם יהיה הממוצע בין שני המקומות
אותם הם יתפסו בסולם הסדר ( – 2.5ממוצע בין המקום ה 2וה.)3-
חישוב ( 𝑋 2האות היוונית "חי" בריבוע) – מושפע מגודל המדגם ומספר התאים בטבלה (.)𝑋 2 ≥ 0
(𝑂𝑏𝑠 − 𝐸𝑥𝑝)2
∑ = 𝜒2
𝑝𝑥𝐸
𝜒2
√ = 𝑉 𝑠 𝐶𝑟𝑎𝑚𝑒𝑟 ′
)𝑁(𝑘 − 1
Nהוא גודל המדגם k ,הוא המספר הקטן מבין מספר הטורים או מספר השורות.
דוגמה:
נבדק הקשר בין קיומו של דיכאון אחרי לידה לבין מספר הלידה במשפחה (ראשונה ,שניה ,שלישית
ומעלה) .נאספו הנתונים הבאים אודות 100יולדות.
observed
דיכאון -דיכאון + סה"כ
לידה 1 10 35 45
לידה 2 5 25 30
לידה +3 5 20 25
סה"כ 20 80 100
expected
דיכאון -דיכאון + סה"כ
לידה 1 45 ∗ 20
100
=9
45 ∗ 80
100
= 36 45
לידה 2 30 ∗ 20
100
=6
30 ∗ 20
100
= 24 30
לידה +3 25 ∗ 20
100
=5
25 ∗ 80
100
= 20 25
סה"כ 20 80 100
טבלת – expectedבאמצעותה נלמד על העוצמת הקשר בין המשתנים .טבלה הנבנית במכוון בה אין
קשר בין המשתנים .נבלה את הטבלה בהנחה של אי תלות (חוסר קשר) בה )𝐵(𝑃 ∙ )𝐴(𝑃 = )𝐵 ∩ 𝐴(𝑃
ככל שההבדל בין הטבלאות גדול יותר (ההבדל בין מצב של חוסר קשר גדול יותר) כך קיים יותר
קשר בין הנתונים.