Professional Documents
Culture Documents
-קשורים לינארית בפונ' – קשורים לינארית1 , אזי לא קיים קשר לינארי בין שני המ"מ )בלתי לתלויים לינארית( .אם 1 אם 0
לינארית הפוכה.
דוגמאות למ"מ בדידים חשובים:
שונות תוחלת פונ' התפלגות התפלגות
1 1 , ( ברנולי עם פרמטר ) pלרוב מרחב מדגם פשוט0,1 :
0 1 ~
סיפור :הסיכוי להצלחה בהטלת מטבע בודדת
1 1 בינומי עם פרמטרים n,p
~ ,
,
סיפור :הסיכוי ל k-עצים ב n-הטלות מטבע ) – pסיכוי לעץ(
0
∑ .מכאן גם ניתן לחשב את התוחלת והשונות לבינומי ~ , וב"ת ,אזי: ,…, ~ נשים לב כי אם
פואסוני עם פרמטר
· ,
! ~
0
סיפור :הסיכוי להתרחשות kאירועים בפרק זמן קבוע בקצב ,
כאשר מס' אירועים בכל פרק זמן אינו תלוי בזמנים אחרים
1 1 1 · , גיאומטרי עם פרמטר p
1 ~
סיפור :הסיכוי שהעץ הראשון שנקבל יהיה בהטלה הk-
1 היפרגיאומטרית עם פרמטרים N,D,n
1 ~ , ,
סיפור :מתוך אוכלוסיה בגודל Nהמכילה Dפריטים מיוחדים
ממנה שולפים nפריטים ,הסיכוי שמתוכם kפריטים יהיו
מיוחדים
| | · נוסחה חשובה להתפלגות מותנית להחלפת סדר ההתניה:
3 אריאל סטולרמן
פרדוקס סימפסון:
פרדוקס סטטיסטי בו הצלחת קבוצת מחקר מסויימת נראית שונה כאשר מאחדים בין קבוצות.
דוגמא שניתנה בשיעור :אחוז הקבלה של בנות לאונ' נמוך מאחוז הקבלה של בנים ,אך אם מסתכלים על כל פקולטה בנפרד מקבלים שבכל פקולטה
אחוז הקבלה של הבנות גדול מאחוז הקבלה של הבנים .לכאורה מקבלים כאן פרדוקס ,אך ניתן לראות שהנתונים מאפשרים זאת באמצעות משחק
עם הנוסחאות )בייס ,ההסתברות השלמה(.
(. עד תצפיות ,והחציון עדיין בטווח של האוסף המקורי )שהוא חציון :בערך ,למשל במדגם אי זוגי נוכל לקלקל את עד •
.למשל :עבור ממוצע ;0 :חציון ; :ממוצע קצוץ . : נקודת השבירה האסימפטוטית :גבול נקודת השבירה כאשר ∞
) (2אינווריאנטיות )אי תלות בסקאלה(:
:פונ' מונוטונית .למשל :ממוצע :לא; חציון :כן; קצוץ :לא. ,עבור אינוו' לטרנס' מונוטונית היא שמתקיים:
תמציות למיקום:
:המקיימת: באופן אבסטרקטי – "אמצע" הנתונים שלנו )כמו ממוצע או חציון( .פורמלית ,פונקציה
•
•
4 אריאל סטולרמן
דוגמאות לתמציות למיקום )מקיימות את שתי התכונות(:
∑
ממוצע: •
הוא השברון ה i-עבור סטטיסטי הסדר ,כלומר Xממויין( . )הורדת הקצוות; ∑ ממוצע קצוץ : •
תמציות לפיזור:
:המקיימת: פונקציה
•
,מכאן ש: 0, ·| | •
0 •
דוגמאות לתמציות לפיזור:
,נק' שבירה אסימפ' ) 0מספיק לשנות תצפית אחת ל .(∞- טווח: •
אסימפטוטית .0השונות האמפירית לא מקיימת את התכונה השניה, ,נק' שבירה ∑ סטיית התקן האמפירית: •
,נק' שבירה בערך ,אסימפ' . . . טווח בין רביעונים: •
,כלומר :חציון כל הערכים המוחלטים של ההפרשים מהחציון. | . | ) MADהמדד המשוגע(: •
תמציות למיקום ,היא תמצית לפיזור )לפי התכונות( . , , | נק' שבירה :אסימפ' .טענה :כל תמצית מהצורה| :
תמציות לנטייה:
-לוקחים ממוצע שני סדרונים הנמצאים במרחק שווה מהאמצע ,ומחסירים החציון. . נגדיר תחילה פונ' נטייה :Sk
∑
מדד :Pearson •
∑
.נגדיר את החותך: אנו רוצים מחצית מהנקודות מעל הקו ומחצית מתחת ,נסמן: •
עבור בדיוק מחצית מהתצפיות ,כנדרש. מתקיים ש0- עבור הקו החסין שהתקבל
•
אז נקבל ,ומכאן שאין קשר לסקאלה של הצירים .אם 0 , , , f ,טרנס' לינארית ,אזי: אם 0 •
. , שזה שווה ל-
1, 0
.אם הקו עובר בכל הנקודות ,נקבל | .|1 , 1, 0 •
0, 0
1 1 •
: משמעות
( מוסבר ע"י קו הריבועים הפחותים .כלומר ,אם נקח הוא :אחוז השונות המוסברת ,כלומר ,איזה אחוז מהשונות שהתחלנו ממנה )
( נקבל שהשונות של yהוא RSSעבור ערכים אלו של .a,b )ואז 0
.כמו כן נקבל קו אופקי ,שלא מסביר כלום מהשונות של ,yכלומר לא "מפחית" מהשונות שהיתה קודם. הסבר :אם ניקח שיפוע ,0ברור ש0-
.כלומר 0 ,אחוז מהשונות הוסבר ע"י הקו ,ולכן סכום ריבועי המרחקים מהקו הוא השונות שהיתה ונשארה. לכן ה RSS-שנקבל הוא
קטן. בקיצור :פיזור גדול סביב הקו = אחוז מוסבר קטן =
: תכונות וחולשות
זהו מדד לאיכות המודל הלינארי .רצוי להשוות לפי מדד זה רק בין מודלים שהותאמו על אותם נתונים . •
תמיד( . מדד זה רגיש לגודל הרעש – תכונה רצויה ,אך גם רגיש לכמות הנתונים – תכונה לא רצויה )עם 2נק' בלבד נקבל 1 •
6 אריאל סטולרמן
ּ
ניתוח שאריות וטרנס' ללינאריו ת:
כמוגדר לעיל. -מטריצה שכל שורותיה הן – וקטור שורה של כל ה; - ,…, ,כאשר כאן: | |
. .
~ .דוגמאות: , או בקיצור: ~ עבור nגדול מספיק ניתן להגיד כי 0,1
√/
∑ .לפי משפט הגבול המרכזי נקבל את הקירובים : ~ , ~ , •
∑ . .
(. )כי , ~ , ~ ומכאן שגם ,
.
~ . , ~ : 0,1 •
)נובע מאי שוויון צ'בישב( . חוק המספרים הגדולים0 : •
,אלא בדיוק כך . , לא מתפלג בקירוב , ממוצע של מ"מ המתפלגים •
8 אריאל סטולרמן
מבוא להסקה סטטיסטית:
מושגי יסוד באמידה:
אוכלוסיה :אוסף סופי /אינסופי של פריטים בעלי תכונה /תכונות המעניינות אותנו . •
התפלגות האוכלוסיה :תיאור הסתברותי של הערך Xשל תכונה המעניינת אותנו בפרט מקרי באוכלוסייה .למשל : •
.1 ~ ,יהיה 1בהסתברות pו 0-בהסתברות Xקטגוריאלי בעל שני ערכים )כמו מגדר(: o
~ :תיאור יכול להיות מדוייק רק עבור אוכ' אינסופית לא בת מניה .לרוב יהווה קירוב מספק .במקרה של , o
אוכלוסיה סופית ,ההתפלגות האמיתית של Xהיא פשוט ההתפלגות האמפירית של האוכלוסיה .
פרמטר :תמצית של התכונה המעניינת אותנו באוכלוסיה ,למשל תוחלת .נסמן פרמטר המעניין אותנו באות המתאימה ,או באופן גנרי . : •
מדגם מקרי ) :(random sampleבגודל nהוא אוסף nפרטים הנדגמים בסיכוי שווה עם החזרה מהאוכלוסיה .המדגם הוא מ"מ מקרי n •
. ,…, וערכיו הם גם וקטור nמימדי: ,…, מימדי:
. ,והוא גם מ"מ .את ערכו במדגם נסמן סטטיסטי ) :(statisticתמצית מספרית של המדגם .נסמנו ב- •
אומד לפרמטר ) :(estimatorסטטיסטי שמכוון להעריך את אורכו של הפרמטר באוכלוסיה .למשל :ממוצע המדגם המקרי כאומד ל . - •
. , 1מתקיים: כך שברמת ביטחון , רווחי סמך ברמת סמך )ביטחון( :ערכים •
למקרים נורמלי וברנולי: תכונה כללית של ממוצע המדגם
-חסר הטייה . •
. •
,כלומר :עם מספיק נתונים ,האומד שלנו יהיה נכון . אומד מוצע ל . -עקיבות: יהי
הגדרת התכנסות בהסתברות:
כאומד ל -הוא תמיד עקיב )בנוסף להיותו תמיד חסר הטיה( .כמו .למשל, | | 0, אמ"מ: נאמר כי
~ . 0, הוא עומד עקיב במקרה האחיד של כן ̂ במקרה הבינומי .דוגמא פחות טרוויאלית:
עקיבות אינה גוררת חוסר הטיה . •
אך הוא לא עקיב . . כמו כן חוסר הטיה אינה גוררת עקיבות .למשל בהתפלגות נורמלית נקח את •
9 אריאל סטולרמן
גישות ליצירת אומדים:
פונקצית הנראות ):(Likelihood
מדגם מקרי .אזי: ,…, פונקצית צפיפות /הסתברות( ,ו- במקרה הבדיד; נתייחס באופן כללי ל- )או ~ נניח
.ℓדוגמאות: ; ; -היא פונקצית הנראות .לרוב נשתמש בטרנס' logשל הנראות: ; ·… ·
כפונקציה של ,ונשווה לאפס למציאת קיצון ,וע"י נגזרת שניה נוודא שזהו אכן מקסימום )נגזרת שניה קטנה מאפס( .דוגמאות:
∑
̂ . הוא בינומי :מתברר שאכן ̂ •
∑
̂ גם כן . נורמלי )שונות ידועה(: •
,0 ,…,
. , … ,זה יתקיים שיקיים ,ולכן נרצה את הערך החוקי המינימלי של המקרה האחיד: •
0, /
. ,ולכן בודאות עבור
תכונות אנ"מ:
רווחי סמך:
רווחי סמך ומשמעותם:
כך ש: , 1מוגדר ע"י הערכים 0 .רווח סמך ברמת סמך ואומד ~ ,פרמטר נתון
, 1 , 1
.(1 ,אז נאמר שיש לנו רמת סמך של ) 95% בד"כ ילקח 0.05
. · , · ונקבל: אומד ל , -נדרוש דוגמא :במקרה הנורמלי,
√ √
.כעת נוכל לחשב: ~ 0, הם מ"מ ב"ת ,מכאן ש : , ~ , ,אזי , ~ , נמוך ממנו :יהיו
√
,ונדע מה הסיכוי . 1של .את התשובה לזה נשווה לרמת הסמך , 2 1
√ √ √ √
. אז .כאשר ∞ , ב- דרגות חופש .בחישוב רווח סמך עם שונות לא ידועה נחליף את -כלומר עם 1 ~
√/
10 אריאל סטולרמן
רווחי סמך לפרמטר בינומי:
~ ,רוצים למצוא רווח סמך ל p-כאשר נשתמש באומד ̂ .החישוב המדויק ארוך ומסורבל ,לכן יש שתי גישות:
1 משמעות :ברמת ביטחון של בערך )בגלל הקירוב ושימוש באומד לשונות( ̂ ̂ , קירוב נורמלי: •
בדיקת השערות:
מושגי יסוד:
( :ברירת המחדל ,העובדה שאנו רוצים להפריך באמצעות הנתונים ,וזאת רק אם נסיק בצורה ברורה שאינה נכונה . השערת האפס ) •
( :ברור . / אלטרנטיבה ) •
.המבחן :אם כך ש- יהיה אזור הדחיה .מבחן סטטיסטי ברמה : מבחן סטטיסטי ברמה :נניח •
,נדחה את השערת האפס ,אחרת נקבלה .קיימים הרבה איזורי דחיה )המייצגים אלטרנטיבות( ,נבחר את האחד המייצג את
האלט' המעניינת אותנו .הערה :במקרה הרציף יהיה זה שוויון ממש .
כיצד נבחר בין אזורי דחיה אפשריים:
: ,נמצא את דוגמא במקרה הנורמלי :ונניח אנו דוחים עבור ערכים גבוהים ,אז, ∞ :
·
√/ √/ √/ √
שנבחר כאלט' .באופן דומה עבור אלט' של ערכים ,אזור דחיה זה יהיה נכון לכל כיוון שלא משתמשים כלל בערך של האלט'
. והתפלגות .במקרה שונות לא ידועה :שימוש ב- או אלט' דו כיוונית – פשוט איחוד שני איזורי דחיה זרים ,ושימוש ב- נמוכים מ-
)כאן . :במקרה זה נשתמש בקירוב הנורמלי ,אך כלל ההחלטה )גדול שווה ל (10-ייבדק על , : דוגמא למקרה הבינומי:
. מתבטאת העובדה שאנו בודקים את ההסתברות ליפול באזור הדחיה תחת השערת האפס( .למקרה זה נקבל, ∞ :
סוגי השערות:
. : השערה פשוטה :השערה הכוללת רק ערך אחד לפרמטר ,למשל: •
. :לא נעסוק בהשערות אפס מורכבות . של ,למשל: השערה מורכבת :השערה הכוללת אוסף ערכים •
היא דו-צדדית. : היא חד צדדית ,ואילו מהצורה : אלטרנטיבה מהצורה
משמעות :pvalue
הסיכוי לדחות את השערת האפס גדל .אם נשנה משהו בנתונים ,למשל נגדיל את השונות ,נקבל בהכרח אזור דחיה גדול יותר ערכים נמוכים
כלשהי. pvalueגדול יותר ,שמשמעו – פחות סיכוי לדחות את השערת האפס .לא להתבלבל :דחיית השערת האפס היא עבור רמת ביטחון
11 אריאל סטולרמן
גדול יותר .אינטואיטיבית: נקבל ,אם נשנה את 144 16 , 175, : 170, : בדוגמת גבהי סטודנטים170 ,
כשהשונות גדלה ,פחות מפתיע אותנו לקבל במרחק 5ס"מ מהתוחלת מאשר קודם ,לכן פחות סביר לדחות את השערת האפס.
סוגי טעויות ועוצמת מבחן:
. ואזור דחיה ,רמה ,סטטיסטי : , :
וזה שווה ל . - תחת כשהיא נכונה .זהו הסיכוי ש- טעות מסוג ראשון :הסיכוי לדחות את •
. כשהאלטרנטיבה נכונה: טעות מסוג שני :הסיכוי שלא נדחה את •
. 1 כשהאלטרנטיבה נכונה: עוצמת מבחן :הסיכוי שכן נדחה את •
. ̂ | · נראות מקסימלי( .נשתמש בקירוב הנורמלי כדי לקבל מבחן עוצמה מקסימלית ברמה בקירוב :
. | ,נקבל כי מבחן NPיהיה xעצמו: : , : פואסון:
∑
,
∑
)כלומר הקו הוא קבוע ללא שיפוע ,ונזכר שזה אומר ש , -אחוז השונות : ~ .ההשערות שנבדוק0 : 0, , מודל :
. : המוסבר ,הוא ,(0והאלטרנטיבה0 :
~ . ∑, ,כלומר הוא אומד חסר הטיה ל .b-לבסוף נקבל: , :מקבלים כי כיוון שע"פ המודל 0
כיוון שיש לנו 2פרמטרים שאומדים במקרה זה( ,ולכן )2 ∑ ,ואומד חסר הטיה ל: - ~ : ∑ 0, מכאן ש:
∑ / ∑ /
. ∞, , · , · נקבל את אזור הדחיה, ∞ :
√ √
כמו במקרה הנורמלי הרגיל. .קיים מבחן : ,והאלטרנטיבה היא 0 : נקבל כי 0
∑ ∑
ד"ח : ,ונערוך מבחן tעם 2 השונויות( לקבלת אומד:
,ונקבל : .דרגות החופש יחושבו לפי תיקון :Welch‐SatterWiate לא מניחים שוויון שונויות: •
∑
, | , · ,ומכאן: )ב( שונות לא ידועה:
13 אריאל סטולרמן
נסכם את המקרים השונים:
לא מזווגים מזווגים
נכון אך מפסידים עוצמה )פחות נכון :עדיין מקבלים מבחן ברמה ב"ת ,
דרגות חופש בזיווג(
לא נכון :רמת המבחן אינה ,עוצמת המבחן קטנה כיוון ש: נכון תלויים ,
(. , )כי 0
n
נושאים נוספים:
השוואות מרובות :לא נכלל בסיכום.
מבחנים סטטיסטיים לא פרמטריים :לא נכלל בסיכום.
אמידה בייסיאנית:
-ה"אמונה" את ההתפלגות המקדימה )אפריורית( של אותו אומדים הוא לא מספר אלא מ"מ .נסמן ב- לפי הגישה הבייסיאנית ,הפרמטר
שלנו לגבי הפרמטר לפני שראינו את הנתונים .עם קבלת הנתונים נעדכן את ההתפלגות להתפלגות האפוסטריורית .עדכון ההתפלגות בהינתן :
, | ·
| | ·
והחישובים מסובכים. ישירות .מצד שני ,לא תמיד יהיה לנו ידע על יהיה רווחי בגישה זו .כמו כן ניתן להסיק על אם יש לנו ידע טוב על ,
דוגמא למקרה הנורמלי ,שונות ידועה:
~ )נצפה שהתוחלת תהיה קרובה ל ,(0-נחשב ונקבל: 0, , | ~ ,מדגם בגודל ,nומעריכים את .לפי אמידה בייסיאנית :נניח
·
~ | · ,