רגרסיה ג20

‫רגרסיה‬
‫קו הרגרסיה‬
‫הרגרסיה מהווה הרחבה של רעיון המתאם‪ .‬המתאם מציג את עוצמת הקשר הלינארי בין שני משתנים‪.‬‬
‫הרגרסיה " מנצלת" את הקשר הזה לניבוי‪ .‬אם יש קשר חזק בין משתנים אזי אם יודעים ערך של משתנה אחד יודעים "בערך" מהו הערך של‬
‫המשתנה השני‪ .‬הרגרסיה מספקת את הנוסחה שמנבא את הערך של המשתנה השני‪.‬‬
‫קו הרגרסיה‪ .‬גם משקף את הקשר הלינארי‬
‫בין המשתנים וגם מאפשר לנבא‪.‬‬
‫התרשים להלן מציג נתונים של ‪ 200‬תקליטורים‬
‫שהופקו בלונדון‪ .‬כל נקודה בגרף היא תקליטור‪ .‬עבור כל‬
‫תקליטור נתונים ההשקעה בפרסום ומכירות התקליטור‪.‬‬
‫(עיינו במצגת בנושא מתאם במידה ואתם מתקשים)‬
‫‪400‬‬ ‫הקו המשורטט הוא קו הרגרסיה‪ .‬הקו הישר שממוצע‬

‫המרחקים שלו מכל הנקודות הוא הקטן ביותר‪ .‬כלומר‬
‫הוא הקרוב ביותר אל הנקודות‪.‬‬
‫בקו הרגרסיה אפשר להשתמש כקו ניבוי‪ .‬נניח שאנו‬

‫מכירות תקליטורים (באלפים)‬
‫‪300‬‬
‫מפיקים תקליטור חדש ויש לנו סכום של ‪0150000‬‬
‫שטרלינג לפרסום‪ .‬כמה צפוי להיות מספר תקליטורים‬
‫שנמכור?‬
‫‪200‬‬
‫‪100‬‬
‫אם נשקיע ‪ 1,500,000‬שטרלינג אנו צפויים על פי‬

‫קו הרגרסיה למכור כ – ‪ 280,000‬תקליטורים‬
‫‪0‬‬ ‫‪500,000‬‬ ‫‪1,000,000‬‬ ‫‪1,500,000‬‬ ‫‪2,000,000 2,500,000‬‬

‫השקעה בפרסום (בשטרלינג)‬
‫איך זה נראה ב‪?spss -‬‬
‫לעיתים נוצרים כמה מודלים של רגרסיה‪ .‬הם נבדלים‬
‫זה מזה במשתנים הבלתי תלויים ‪ .‬בדוגמה יש לנו רק‬
‫משתנה בלתי תלוי אחד (השקעה בפרסום) ולכן רק‬ ‫השיטה שבה הורינו למחשב למצוא את מודל‬
‫מודל אחד אפשר‪ .‬בדוגמה בהמשך נראה כיצד נוצרים‬ ‫הרגרסיה‪ .‬בדוגמה הזו השיטה היא ‪ Enter‬או‬
‫יותר ממודל אחד‬ ‫בעברית רגרסיה כפויה‪ .‬כפינו על המחשב בדיוק‬
‫אילו משתנים בלתי תלויים יהיה ברגרסיה‪ .‬בהמשך‬
‫נראה דוגמה עם כמה שיטות והנקודה הזו תתבהר‬
‫‪Variables Entered/Removed‬‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Variables Removed‬‬ ‫‪Method‬‬
‫‪1‬‬ ‫‪Advertsing Budget‬‬
‫‪.‬‬ ‫‪Enter‬‬
‫)‪(thousands of pounds‬‬
‫המשתנים הב"ת של המודל‪ .‬במקרה שלנו במודל רק‬ ‫המשתנים הב"ת שהיו במודל‬
‫משתנה בלתי תלוי אחד – ההשקעה בפרסום‬ ‫והוצאו ממנו‪ .‬בדוגמה הנוכחית לא‬
‫(‪)Advertising Budget‬‬ ‫קיימים‪ .‬נראה כאלו בדוגמה‬
‫אחרת‬
‫‪Model Summary‬‬
‫‪Adjusted R‬‬ ‫‪Std. Error of‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square‬‬ ‫‪Square‬‬ ‫‪the Estimate‬‬
‫‪1‬‬
‫‪.578‬‬ ‫‪.335‬‬ ‫‪.331‬‬ ‫‪65.991‬‬
‫המתאם בין המשתנה‬

‫הבלתי תלוי לתלוי‬ ‫הריבוע של המתאם‪ .‬מכונה גם אחוז‬
‫שונות מוסברת‪ .‬משקף את גודל הקשר‬
‫בין המשתנים‪ .‬במקרה הזה ‪33.5%‬‬
‫לעומת ‪ 100%‬שהוא קשר מושלם‬
‫(המשך התקליטורים)‬ ‫איך זה נראה ב‪?spss -‬‬
‫אנובה כמו תמיד‪" ,‬מחליטה" ‪ H0‬או ‪ H1‬כלומר האם יש מובהקות או אין‪.‬‬
‫במקרה זה האם המודל של הרגרסיה מובהק‪ .‬האם המשתנים הבלתי תלויים‬
‫יש מובהקות!‪ Sig ,‬קטן מ‪ .0.05 -‬זה אומר שהמודל שלנו מובהק‬
‫שלנו במודל עוזרים לנו לשפר את הניבוי‪.‬‬
‫כלומר הוא עדיף על מודל שבו לא משתמשים במשתנים הב"ת‬
‫לניבוי המכירות‪.‬‬
‫‪ANOVA‬‬
‫‪Sum of‬‬
‫‪Model‬‬ ‫‪Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪433687.833‬‬ ‫‪1‬‬ ‫‪433687.833‬‬ ‫‪99.587‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪862264.167‬‬ ‫‪198‬‬ ‫‪4354.870‬‬
‫‪Total‬‬ ‫‪1295952.000‬‬ ‫‪199‬‬
‫‪Coefficients‬‬
‫‪Standardized‬‬
‫‪Unstandardized Coefficients‬‬ ‫‪Coefficients‬‬
‫‪Model‬‬ ‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪134.140‬‬ ‫‪7.537‬‬ ‫‪17.799‬‬ ‫‪.000‬‬
‫‪Advertsing Budget‬‬
‫‪.096‬‬ ‫‪.010‬‬ ‫‪.578‬‬ ‫‪9.979‬‬ ‫‪.000‬‬
‫)‪(thousands of pounds‬‬
‫המקדמים שמופיעים בנוסחת (מודל) הרגרסיה‪ .‬על פי נתונים אלו‬ ‫מציג את נוסחת הרגרסיה ביחידות של סטיות תקן (נסמן ס‪.‬‬
‫המודל הוא‪:‬‬ ‫ת)‪ .‬הנוסחה ביחידות אלו היא‪:‬‬
‫מכירות= ‪ •0.096 +134.4‬פרסום‬ ‫מכירות (ס‪.‬ת)= ‪ • 0.578 +134.4‬פרסום (ס‪.‬ת)‬
‫‪:‬למשל אם נפרסם ב‪( 1500-‬אלף שטרלינג) נקבל‬
‫‪134.4+0.0096 •1500= 278.4‬‬
‫כלומר צפוי שנמכור כ‪ 278 -‬אלפי תקליטורים‪ .‬שימו לב שזה‬ ‫מקדם חיובי בנוסחת הרגרסיה‪.‬‬ ‫המובהקות של המקדם‪ .‬חשוב בעיקר‬
‫בדיוק מה שקיבלנו בגרף שמופיע בתחילת המצגת‬ ‫אומר שככל שההשקעה בפרסום‬ ‫המקדם של המשתנים הבלתי תלויים‪.‬‬
‫גבוהה יותר כך גם המכירות‬ ‫במקרה זה המקדם של הפרסום מובהק‬
‫‪.‬גבוהות יותר‬ ‫כלומר יש קשר מובהק בין פרסום‬
‫למכירות‬
‫רגרסיה מרובה‬
‫הרגרסיה מתחילה להיות מעניינת כשהיא רגרסיה מרובה‪.‬‬

‫אני יודע‪ ,‬אני יודע‪ ,‬רגרסיה ועניין זה לא בדיוק הולך אצלכם ביחד אבל בכל זאת הבה ננסה להמריא קצת ונגלה אמפתיה‬
‫מתונה למתעניינים‪.‬‬
‫ברגרסיה מרובה אנו מנסים ל"נבא" או להסביר את המשתנה התלוי (למשל מכירות תקליטורים) באמצעות יותר ממשתנה‬
‫בלתי תלוי אחד‪ .‬קשה לצפות שנוכל להסביר משתנה שאינו פיסיקלי באמצעות משתנה אחד בלבד‪ .‬כשמדובר באנשים‪,‬‬
‫בפסיכולוגיה‪ ,‬בחינוך יש משתנים רבים שמעורבים‪ .‬משתנה אחד יסבירו לנו במקרים אלו רק חלק קטן יחסית של המשתנה‬
‫התלוי‪ .‬מידת ההסבר נקבעת על ידי הערך של המתאם בריבוע‪ ,‬בדוגמה הקודמת ערך המתאם בריבוע היה כ‪ 33%-‬ואז‬
‫אומרים שהפרסום מסביר ‪ 33%‬מהמכירות‪ .‬אבל זה מודל לא מספק אנחנו מעוניינים במודלים שמסבירים במידה גבוהה‬
‫בהרבה את המשתנה התלויה‪ .‬הדרך למציאת מודלים טובים יותר היא הוספה של עוד משתנים בלתי תלויים למודל‬
‫הרגרסיה‪.‬‬
‫בדוגמה שלהלן נכלול במודל הרגרסיה של מכירות התקליטורים עוד ‪ 2‬משתנים בלתי תלויים‪:‬‬
‫מספר ההשמעות ברדיו בשבוע הראשון‬
‫האטרקטיביות של הלהקה המבצעת כפי שהוערכה על ידי שאלונים מתאימים שהועברו‪.‬‬
‫כמו כן נמשיך לכלול ברגרסיה את ההשקעה בפרסום‬
‫סה"כ נקבל מודל רגרסיה הכולל עתה ‪ 3‬משתנים בלתי תלויים‪.‬‬
‫רגרסיה מרובה‪ :‬איך זה נראה ב‪?spss -‬‬
‫בדיוק כמו רגרסיה רגילה אבל עם עוד משתנים‬
‫•‬
‫‪Variables‬‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬
‫‪1‬‬
‫‪Attractiveness of Band, Advertsing Budget (thousands of‬‬
‫‪Enter‬‬
‫‪pounds), No. of plays on Radio 1 per week‬‬
‫המשתנים הבלתי תלויים של המודל‪ .‬בדוגמה‬ ‫משתנים בלתי תלויים שבמהלך‬ ‫השיטה שהורינו לבצע את הרגרסיה‪.‬‬
‫הזו‪ 3 ,‬משתנים בלתי תלויים‪ :‬אטרקטיביות‬ ‫חישוב הרגרסיה המחשב השמיט‬ ‫במקרה זה שיטת ‪ Enter‬המכונה גם‬
‫הלהקה‪ ,‬השקעה בפרסום‪ ,‬השמעות ברדיו‪.‬‬ ‫מהמודל‪ .‬בשיטת הרגרסיה‬ ‫רגרסיה כפויה‪.‬‬
‫הכפויה המחשב לא מוציא אף‬
‫פעם משתנים מהמודל‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square‬‬ ‫‪Adjusted R Square‬‬ ‫‪Std. Error of the Estimate‬‬
‫‪1‬‬ ‫‪.815‬‬ ‫‪.665‬‬ ‫‪.660‬‬ ‫‪47.087‬‬
‫המתאם בין המשתנים הבלתי‬ ‫הריבוע של המתאם=אחוז שונות מוסברת‪.‬‬

‫תלויים לתלוי‪ .‬המתאם כעת הוא‬ ‫משקף את גודל הקשר בין המשתנים‪66% .‬‬
‫גבוה בהרבה ממודל הרגרסיה‬ ‫לעומת ‪ 33%‬כאשר רק הפרסום היה במודל‪.‬‬
‫הקודם שבו רק הפרסום היה‬ ‫הוספת ‪ 2‬משתנים למודל הכפילה את חוזק‬
‫במודל‪ 0.815 .‬לעומת ‪0.578‬‬ ‫המודל‪.‬‬
‫רגרסיה מרובה‪( spss :‬המשך)‬
‫יש מובהקות!‪ Sig ,‬קטן מ‪ .0.05 -‬המודל שלנו מובהק‬

‫כלומר הוא עדיף על מודל שבו לא משתמשים במשתנים‬
‫הב"ת לניבוי המכירות‪.‬‬
‫‪ANOVA‬‬
‫‪Model‬‬ ‫‪Sum of Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬

‫‪1‬‬ ‫‪Regression‬‬ ‫‪861377.418‬‬ ‫‪3‬‬ ‫‪287125.806‬‬ ‫‪129.498 .000‬‬
‫‪Residual‬‬ ‫‪434574.582‬‬ ‫‪196‬‬ ‫‪2217.217‬‬
‫‪Total‬‬ ‫‪1295952.000‬‬ ‫‪199‬‬
‫‪Coefficients‬‬ ‫‪Standardized‬‬
‫‪Model‬‬ ‫‪Unstandardized Coefficients‬‬ ‫‪Coefficients‬‬
‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪-26.613‬‬ ‫‪17.350‬‬ ‫‪-1.534 .127‬‬
‫)‪Advertsing Budget (thousands of pounds‬‬ ‫‪.085‬‬ ‫‪.007‬‬ ‫‪.511‬‬ ‫‪12.261 .000‬‬
‫‪No. of plays on Radio 1 per week‬‬ ‫‪3.367‬‬ ‫‪.278‬‬ ‫‪.512‬‬ ‫‪12.123 .000‬‬
‫‪Attractiveness of Band‬‬ ‫‪11.086‬‬ ‫‪2.438‬‬ ‫‪.192‬‬ ‫‪4.548 .000‬‬
‫המקדמים שמופיעים בנוסחת (מודל) הרגרסיה‪ .‬על פי נתונים אלו המודל הוא‪:‬‬ ‫המובהקות של כל משתנה ב"ת‬
‫מכירות= ‪ • 0.085 +26.6-‬פרסום ‪ • 3.367 +‬השמעות ברדיו ‪ • 11.086 +‬אטרקטיביות להקה‬ ‫קטנה מ‪ ,0.05 -‬לכן יש קשר‬
‫מובהק בין כל אחד מהמשתנים‬
‫הב"ת לבין מכירות התקליטורים‬
‫‪ = Beta‬מקדמי הרגרסיה ביחידות של סטיית תקן‪ .‬אנו רואים שהעלאה של סטיית תקן אחת בפרסום‬
‫מביאה בערך לעליה של חצי סטית תקן במכירות (‪ .)0.511‬העלאה של סטיית תקן בהשמעה מביאה‬
‫לעליה של כחצי סטיית תקן במכירות (‪ ,) 0.512‬והעלאה של סטיית תקן באטרקטיביות הלהקה מביאה‬
‫לעליה של פחות מ חמישית בסטיית התקן של המכירות (‪ .)0.192‬בפשטנות ניתן להסיק מכך‬
‫שהפרסום ומספר ההשמעות משפיעות במידה דומה על המכירות ושהאטרקטיביות משפיעה הרבה‬
‫פחות מהם‪.‬‬
‫רגרסיה מרובה ‪ :‬סיכום ביניים – הטבלאות ותפקידם‬
‫מציין אלו משתנים בלתי תלויים במודל‬
‫מציין מה המתאם והשונות המוסברת של המודל‪ .‬ככל שהשונות המוסברת גדולה יותר אנחנו שמחים יותר‪ .‬סימן שהמשתנים‬
‫הבלתי תלויים מסבירים בצורה שלמה יותר את המשתנה התלוי‪( .‬שונות מוסברת מקסימלית אפשרית ‪)100%‬‬
‫‪ANOVA‬‬
‫מראה אם המודל מובהק או לא‪ .‬האם ניתן להסיק מן המדגם (שבאמצעותו בנינו את המודל)‪ .‬אל האוכלוסייה‪ .‬אם אין‬
‫מובהקות אין שום משמעות לתוצאות גם אם השונות המוסברות יצאה גדולה‪ .‬אין מובהקות אומר שאת השונות המוסברת‬
‫שקיבלנו ניתן להסביר במקריות גרידא‪.‬‬
‫משמשת לכמה דברים‪:‬‬
‫א‪ .‬לחילוץ נוסחת הרגרסיה‪ .‬מקדמי ה‪ B-‬הם המספרים שמופיעים בנוסחה‬
‫ב‪ .‬לבחינה עבור כל משתנה בלתי תלוי האם הוא משפיע במובהק על המשתנה התלוי‬
‫ג‪ .‬מקדמי ה‪ -‬ביתא משקפים את מידת ההשפעה של כל משתנה על המשתנה התלוי‪ .‬ככל שה ביטא (ערך מוחלט שלו כי‬
‫ביטא יכול להיות גם שלילי) גדול יותר כך פירושו של משתנה שזו הביטה שלו יש יותר השפעה על המשתנה התלוי‪ .‬אם‬
‫משווים את הביטות של המשתנים הבלתי תלויים אפשר לראות מי משפיע יותר ומי משפיע פחות‪.‬‬
‫רגרסיה מרובה – שיטות החישוב‪ ,‬משתנים שיצאו‪ ,‬מובהקות המשתנים‬
‫ישנן כמה אפשריות לחישוב מודל הרגרסיה‪ .‬בדוגמאות הקודמות הופעלה שיטת הרגרסיה הכפויה (‪ .) Enter‬בשיטה זו אנו כופים על המחשב את המשתנים הבלתי תלויים שיהיו במודל‪ .‬יש שיטות אחרות שבהן אנו מאפשרים‬
‫למחשב להחליט על המשתנים הבלתי תלויים‬
‫הפעלה ראשונה באמצעות רגרסיה כפוייה ‪Enter -‬‬ ‫אנו נדגים כמה מהשיטות באמצעות הדוגמה הבאה‬
‫אנו כופים על המחשב להכניס את כל המשתנים הבלתי תלויים למודל‪.‬‬ ‫המתייחסת ליחסים בן בני זוג‪ .‬משתנים מנבאים (בלתי‬
‫תלויים)‪:‬‬
‫‪ ‬הסתגרות (הימנעות מקשר)‬
‫‪ ‬חרדה (בהקשר של יחסים עם אנשים‪ ,‬נטישה וכד')‬
‫‪Variables Entered/Removed‬‬ ‫‪ ‬זמן הקשר עם בן הזוג‪.‬‬
‫‪Variables‬‬ ‫‪ ‬גיל האדם‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬ ‫‪ 2‬המשתנים הראשונים מבטאים תכונת אופי או דפוס‬
‫‪1‬‬ ‫התנהגות של אדם (נמדדו על פי שאלונים מתאימים)‬
‫‪histagrut, harada,‬‬
‫‪relation time, age‬‬
‫‪. Enter‬‬ ‫ובמידה רבה ניתן להתייחס להם כאופינים לאדם‪.‬‬
‫משתנה תלוי‪ :‬זעם – מידת הזעם הקיימת כלפי בן‬
‫הזוג‪.‬‬
‫המחשב יוצר מודל שבו‬
‫נמצאים כל המשתנים הבלתי‬
‫תלויים שביקשנו לכלול‬ ‫אנו מנסים לברר באיזו מידה ניתן להסביר (או לנבא)‬
‫את מידת הזעם כלפי בן הזוג באמצעות ההסתגרות‪,‬‬
‫החרדה ואורך הקשר הזוגי‪.‬‬
‫‪Adjusted Std. Error of‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square‬‬ ‫‪R Square the Estimate‬‬
‫‪1‬‬ ‫‪.418‬‬ ‫‪.175‬‬ ‫‪.157‬‬ ‫‪.65203‬‬
‫שיטות החישוב‪ ,‬משתנים שיצאו‪ ,‬מובהקות המשתנים (המשך)‬ ‫רגרסיה מרובה –‬
‫‪ANOVA‬‬
‫‪Sum of‬‬ ‫‪Mean‬‬
‫‪Model‬‬ ‫‪Squares‬‬ ‫‪df‬‬ ‫‪Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪16.918‬‬ ‫‪4‬‬ ‫‪4.229‬‬ ‫‪9.948‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.928‬‬ ‫‪188‬‬ ‫‪.425‬‬ ‫המודל מובהק‪.‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬
‫אין קשר מובהק בין הגיל לזעם‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪.676‬‬ ‫‪.366‬‬ ‫‪1.845‬‬ ‫‪.067‬‬
‫‪age‬‬ ‫‪.000‬‬ ‫‪.013‬‬ ‫‪-.002‬‬ ‫‪-.012‬‬ ‫‪.990‬‬ ‫אין קשר מובהק בין זמן הקשר לזעם‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.025‬‬ ‫‪-.167‬‬ ‫‪.868‬‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.043‬‬ ‫‪.390‬‬ ‫‪5.813‬‬ ‫‪.000‬‬
‫‪histagrut‬‬ ‫יש קשר מובהק בין החרדה לזעם‪.‬‬
‫‪.114‬‬ ‫‪.050‬‬ ‫‪.151‬‬ ‫‪2.270‬‬ ‫‪.024‬‬
‫למשתנים הבלתי תלויים‪" :‬גיל" ו‪"-‬משך הקשר" יש מקדמים ‪ 0‬במודל‬ ‫יש קשר מובהק בין הסתגרות לזעם‪.‬‬
‫הרגרסיה‪ .‬כלומר הם לא חלק מהמודל‪ .‬הם גם יצאו לא מובהקים (ראה‬
‫עמודת ‪ .) Sig‬לעיתים למשתנים לא מובהקים המקדמים יוצאים שונים‬
‫מ‪ .0-‬גם במקרה הזה הם לא ‪ 0‬ממש אלא פשוט קטנים מאלפית‪ .‬ניתן‬
‫לראות את זה כי מקדמי הביטא (‪ )Beta‬שלהם קטנים מאוד אבל לא ‪0‬‬
‫המשך שיטת רגרסיה כפויה = ‪Enter‬‬ ‫רגרסיה מרובה –‬
‫‪ANOVA‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪16.918‬‬ ‫‪4‬‬ ‫‪4.229‬‬ ‫‪9.948‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.928‬‬ ‫‪188‬‬ ‫‪.425‬‬ ‫המודל מובהק‪.‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬ ‫מודל מובהק אומר שלאחד‬
‫המשתנים או יותר יש קשר‬
‫מובהק למשתנה התלוי‬
‫אין קשר מובהק בין הגיל לזעם‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪.676‬‬ ‫‪.366‬‬ ‫‪1.845‬‬ ‫‪.067‬‬
‫‪age‬‬ ‫‪.000‬‬ ‫‪.013‬‬ ‫‪-.002‬‬ ‫‪-.012‬‬ ‫‪.990‬‬ ‫אין קשר מובהק בין זמן הקשר לזעם‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.025‬‬ ‫‪-.167‬‬ ‫‪.868‬‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.043‬‬ ‫‪.390‬‬ ‫‪5.813‬‬ ‫‪.000‬‬
‫‪histagrut‬‬ ‫יש קשר מובהק בין החרדה לזעם‪.‬‬
‫‪.114‬‬ ‫‪.050‬‬ ‫‪.151‬‬ ‫‪2.270‬‬ ‫‪.024‬‬
‫למשתנים הבלתי תלויים‪" :‬גיל" ו‪"-‬משך הקשר" יש מקדמים ‪ 0‬במודל‬ ‫יש קשר מובהק בין הסתגרות לזעם‪.‬‬
‫הרגרסיה‪ .‬כלומר הם לא חלק מהמודל‪ .‬הם גם יצאו לא מובהקים (ראה‬ ‫(‪)0.05 < 0.024‬‬
‫עמודת ‪ .) Sig‬לעיתים למשתנים לא מובהקים המקדמים יוצאים שונים מ‪.0-‬‬
‫גם במקרה הזה הם לא ‪ 0‬ממש אלא פשוט קטנים מאלפית‪ .‬ניתן לראות את‬
‫זה כי מקדמי הביטא (‪ )Beta‬שלהם קטנים מאוד אבל לא ‪0‬‬
‫‪ -‬רגרסיה כפויה בבלוקים‬ ‫שיטת ‪Hierarchic Regression‬‬
‫בשיטה זו אנו מפרקים את המשתנים הבלתי תלויים לבלוקים‪.‬‬
‫מודל ‪ 1‬כולל את בלוק המשתנים הבלתי תלויים הראשון‪ .‬למודל ‪ 2‬מתווסף הבלוק השני וכך הלאה‪ .‬כל שלב כולל את הבלוקים‬
‫הקודמים ומוסיף עוד בלוק‪ .‬המודל האחרון כולל את כל הבלוקים‪.‬‬
‫אפשר לראות שיטה זו כגרסה של רגרסיה כפויה אלא שהפעם אנו מחלקים אותה לשלבים‪ .‬למחשב אין "שיקול דעת"‪ .‬והוא‬
‫מפעיל את השלבים בדיוק על פי הבלוקים שקבענו‪.‬‬
‫‪Variables Entered/Removed‬‬ ‫•‬ ‫בדוגמה זו אנו שוב עוסקים בזעם ביחסים הזוגיים‪.‬‬
‫ומנסים לברר כיצד ‪ 4‬המשתנים הבלתי תלויים‬
‫‪Variables‬‬
‫משפיעים עליו‪ .‬בניגוד לדוגמה הקודם עתה אנו‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬
‫‪1‬‬
‫מחלקים את המשתנים הבלתי תלויים ל‪ 2-‬בלוקים‪:‬‬
‫‪relation time, age‬‬ ‫‪.‬‬ ‫‪Enter‬‬
‫בלוק ‪ :1‬משך הקשר והגיל‬
‫‪2‬‬ ‫‪histagrut, harada‬‬ ‫‪.‬‬ ‫‪Enter‬‬
‫בלוק ‪ :2‬הסתגרות וחרדה‪.‬‬
‫מודל ‪ 1‬כולל את הבלוק של "משך‬ ‫הבלוק הראשון כולל משתנים "טכניים"‪ ,‬כאלו שאין‬
‫מודל ‪ 2‬כולל גם את הבלוק‬ ‫היחסים" וה"גיל"‬ ‫לנו שליטה עליהם‪ .‬והבלוק השני כולל מאפייני אישיות‬
‫הראשון ומוסיף אליו את הבלוק‬ ‫ואנו רוצים לבחון מה התרומה של כל בלוק למודל‬
‫השני‪" :‬חרדה" ו"הסתגרות"‬ ‫(ליכולת להסביר את הזעם)‬
‫‪Change Statistics‬‬
‫‪Adjusted R Std. Error of‬‬ ‫‪Sig. F‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square Square‬‬ ‫‪the Estimate R Square Change‬‬ ‫‪F Change‬‬ ‫‪df1‬‬ ‫‪df2‬‬ ‫‪Change‬‬
‫‪1‬‬ ‫‪.068‬‬ ‫‪.005‬‬ ‫‪-.006‬‬ ‫‪.71229‬‬ ‫‪.005‬‬ ‫‪.441‬‬ ‫‪2‬‬ ‫‪190‬‬ ‫‪.644‬‬
‫‪2‬‬ ‫‪.418‬‬ ‫‪.175‬‬ ‫‪.157‬‬ ‫‪.65203‬‬ ‫‪.170‬‬ ‫‪19.370‬‬ ‫‪2‬‬ ‫‪188‬‬ ‫‪.000‬‬
‫השונות המוסברת על ידי מודל ‪1‬‬ ‫השונות המוסברת על ידי מודל ‪2‬‬ ‫הבלוק של משתני האישיות‪ :‬הסתגרות וחרדה‪.‬‬
‫(הבלוק הראשון ) היא ‪( 0.005‬חצי‬ ‫הכולל את ‪ 2‬הבלוקים היא‬ ‫הוסיף עוד ‪ 17%‬לשונות המוסברות‪ .‬זה ערכה של‬
‫אחוז)‪ .‬קשר חלש מאוד למשתנה זעם‪.‬‬ ‫‪ .17.5%‬חישוב פשוט מראה‬ ‫הרגרסיה בבלוקים אנו מבינים את ערכו של כל בלוק‬
‫שהתוספת של הבלוק השני‬ ‫בהסברת המשתנה התלוי‬
‫לשונות המוסברת היא ‪17%‬‬
‫טבלת האנובה ה"רגילה"‪ .‬אלא שהפעם‬ ‫‪ - Hierarchic Regression‬המשך‬
‫המחשב מספק טבלת אנובה לכל מודל‬
‫שנוצר‪ .‬במקרה הזה ‪ 2‬מודלים‪ .‬מודל ‪1‬‬
‫שכולל את הבלוק הראשון ומודל ‪2‬‬
‫שכולל את הבלוק הראשון והשני ביחד‪.‬‬
‫‪ANOVA‬‬
‫‪Model‬‬ ‫‪Sum of Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬ ‫מודל ‪ 1‬איננו מובהק‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪.448‬‬ ‫‪2‬‬ ‫‪.224‬‬ ‫‪.441‬‬ ‫‪.644‬‬
‫‪Residual‬‬ ‫‪96.398‬‬ ‫‪190‬‬ ‫‪.507‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬ ‫מודל ‪ 2‬מובהק‬
‫‪2‬‬ ‫‪Regression‬‬ ‫‪16.918‬‬ ‫‪4‬‬ ‫‪4.229‬‬ ‫‪9.948‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.928‬‬ ‫‪188‬‬ ‫‪.425‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬
‫מקדם שלילי בנוסחת הרגרסיה‪ .‬אומר שככל שהגיל גבוה‬
‫מקדמי נוסחת הרגרסיה‬ ‫יותר כן קטן הזעם‪ .‬תוצאה יפה‪ ,‬אלא שבמקרה שלנו‬
‫של מודל ‪1‬‬ ‫המשתנה גיל כלל אינו מובהק ולכן לא באמת תוצאה‬
‫‪Unstandardized‬‬ ‫‪Standardized‬‬
‫‪Coefficients‬‬ ‫‪Coefficients‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪1.934‬‬ ‫‪.322‬‬ ‫‪6.007‬‬ ‫‪.000‬‬
‫‪age‬‬ ‫‪-.004‬‬ ‫‪.014‬‬ ‫‪-.048‬‬ ‫‪-.288‬‬ ‫‪.774‬‬ ‫המובהקות של‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.022‬‬ ‫‪-.133‬‬ ‫‪.894‬‬ ‫המשתנים במודל ‪.2‬‬
‫‪2‬‬ ‫)‪(Constant‬‬ ‫‪.676‬‬ ‫‪.366‬‬ ‫‪1.845‬‬ ‫‪.067‬‬ ‫הסתגרות ןחרדה‬
‫‪age‬‬ ‫‪.000‬‬ ‫‪.013‬‬ ‫‪-.002‬‬ ‫‪-.012‬‬ ‫‪.990‬‬ ‫מובהקים‪ ,‬גיל ומשך‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.025‬‬ ‫‪-.167‬‬ ‫‪.868‬‬ ‫היחס לא מובהקים‬
‫‪histagrut‬‬ ‫‪.114‬‬ ‫‪.050‬‬ ‫‪.151‬‬ ‫‪2.270‬‬ ‫‪.024‬‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.043‬‬ ‫‪.390‬‬ ‫‪5.813‬‬ ‫‪.000‬‬
‫מקדמי נוסחת‬
‫הרגרסיה של מודל ‪2‬‬
‫שיטת ‪ - Hierarchic Regression‬הסוף‬
‫הפעם "צצה" לנו טבלה נוספת‪ .‬טבלת המשתנים שלא נכללו במודלים‪.‬‬
‫במקרה שלנו היו ‪ 2‬מודלים‪ .‬במודל השני נכללו כל המשתנים אבל במודל הראשון "כפינו" על המחשב להכניס רק את הבלוק‬
‫הראשון ולא להכניס את משתני הבלוק השני‪ .‬בטבלה שלמטה המחשב "מזכיר" לנו את זה‪.‬‬
‫‪Excluded Variables‬‬
‫‪Collinearity Statistics‬‬
‫‪Partial‬‬ ‫‪Tolerance‬‬
‫‪Model‬‬ ‫‪Beta In‬‬ ‫‪t‬‬ ‫‪Sig.‬‬ ‫‪Correlation‬‬
‫‪1‬‬ ‫‪histagrut‬‬ ‫‪.148‬‬ ‫‪2.054‬‬ ‫‪.041‬‬ ‫‪.148‬‬ ‫‪.988‬‬
‫‪harada‬‬ ‫‪.388‬‬ ‫‪5.733‬‬ ‫‪.000‬‬ ‫‪.385‬‬ ‫‪.977‬‬
‫שני המשתנים של הבלוק השני‪ ,‬לא נכללו במודל‬

‫הראשון‪.‬‬
‫רגרסיה מרובה – שיטת ‪Stepwise‬‬
‫בשיטה זו אנו מאפשרים למחשב לבנות בצורה עצמאית את המודל‬
‫המחשב עובד בשלבים‪ .‬בשלב הראשון הוא בוחר להכניס למודל את המשתנה שלו קשר מובהק עם המשתנה התלוי ושיש לו את הקשר החזק ביותר‬
‫( מתאם גבוה) עם המשתנה התלוי‪ .‬בשלב השני הוא בוחר מתוך המשתנים שנותרו את המשתנה המובהק שלו הקשר החזק ביותר וכך הלאה (התיאור‬
‫פשטני במקצת אבל ממחיש את הרעיון) עד שאו נגמרו כל המשתנים או לא נותרו עוד משתנים בלתי תלויים מובהקים‪.‬‬
‫המחשב בחר במשתנה חרדה‬
‫כמודל הראשון‬
‫‪Variables‬‬ ‫‪Variables‬‬ ‫המחשב "מסביר" את שיטת‬
‫‪Model‬‬ ‫‪Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬ ‫העבודה שלו‪ .‬משתנה מובהק עם‬
‫‪1‬‬ ‫‪Stepwise (Criteria: Probability-of-F-to-enter‬‬ ‫‪ p<0.05‬נכנס למודל‪ .‬משתנה‬
‫‪harada‬‬ ‫‪.‬‬ ‫שהמובהקות שלו יורדת עם‬
‫‪<= .050, Probability-of-F-to-remove >= .100).‬‬
‫‪2‬‬ ‫התפתחות המודל ל ‪ p>0.1‬מוצא‬
‫‪Stepwise (Criteria: Probability-of-F-to-enter‬‬
‫‪histagrut‬‬ ‫‪.‬‬ ‫מן המודל‪.‬‬
‫‪<= .050, Probability-of-F-to-remove >= .100).‬‬
‫במקרה הזה ‪ 2‬המשתנים שנכנסים‬
‫נשארו מובהקים מספיק עד לסיום‬
‫המחשב יצר את מודל ‪ 2‬באמצעות הוספה של משתנה "הסתגרות"‪.‬‬ ‫ולכן נותרו במודל‪.‬‬
‫במודל ‪ 2‬יש שני משתנים ב"ת‪" :-‬חרדה" ו‪"-‬הסתגרות"‬
‫‪Change Statistics‬‬
‫‪R‬‬ ‫‪Adjusted R‬‬ ‫‪Std. Error of the‬‬ ‫‪R Square‬‬ ‫‪F‬‬ ‫‪Sig. F‬‬
‫‪Model‬‬ ‫‪R Square Square‬‬ ‫‪Estimate‬‬ ‫‪Change‬‬ ‫‪Change df1‬‬ ‫‪df2‬‬ ‫‪Change‬‬
‫‪1‬‬ ‫‪.390 .152‬‬ ‫‪.147‬‬ ‫‪.65575‬‬ ‫‪.152‬‬ ‫‪.441‬‬ ‫‪2‬‬ ‫‪190‬‬ ‫‪.644‬‬
‫‪2‬‬ ‫‪.417 .174‬‬ ‫‪.165‬‬ ‫‪.64887‬‬ ‫‪.022‬‬ ‫‪19.370‬‬ ‫‪2‬‬ ‫‪188‬‬ ‫‪.000‬‬
‫המשתנה השני "הסתגרות" ( נוסף במודל ‪ )2‬מסביר עוד ‪ 2.2%‬מהזעם‬ ‫המשתנה הראשון "חרדה" (מודל ‪ )1‬מסביר ‪ 15.2%‬מהזעם‬
‫שיטת ‪ - Stepwise‬המשך‬
‫‪.‬‬
‫‪ANOVA‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪14.714‬‬ ‫‪1‬‬ ‫‪14.714‬‬ ‫‪34.218‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪82.131‬‬ ‫‪191‬‬ ‫‪.430‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬ ‫שני המודלים מובהקים‬
‫‪2‬‬ ‫‪Regression‬‬ ‫‪16.850‬‬ ‫‪2‬‬ ‫‪8.425‬‬ ‫‪20.010‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.996‬‬ ‫‪190‬‬ ‫‪.421‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬
‫‪Unstandardized‬‬ ‫‪Standardized‬‬
‫‪Coefficients‬‬ ‫‪Coefficients‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪1.022‬‬ ‫‪.144‬‬ ‫‪7.087‬‬ ‫‪.000‬‬
‫מקדמי המשתנים המנבאים במודל‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.042‬‬ ‫‪.390‬‬ ‫‪5.850‬‬ ‫‪.000‬‬ ‫הרגרסיה כאשר ערכי המשתנים‬
‫‪2‬‬ ‫)‪(Constant‬‬ ‫‪.661‬‬ ‫‪.215‬‬ ‫‪3.083‬‬ ‫‪.002‬‬ ‫מבוטאים ביחידות של סטיות‬
‫‪harada‬‬ ‫‪.250‬‬ ‫‪.042‬‬ ‫‪.393‬‬ ‫‪5.964‬‬ ‫‪.000‬‬ ‫התקן‪ .‬אנו רואים (מודל ‪)2‬‬
‫‪histagrut‬‬ ‫‪.112‬‬ ‫‪.050‬‬ ‫‪.149‬‬ ‫‪2.252‬‬ ‫‪.025‬‬ ‫שהעלאה בסטיית תקן אחת של‬
‫חרדה גורמת לעליה של ‪0.393‬‬
‫מקדמי נוסחת הרגרסיה של כל‬ ‫בזעם לעומת זאת עליה בסטיית‬
‫אחד מהמודלים‬ ‫תקן בהסתגרות מביאה לעליה של‬
‫‪ 0.149‬סטיות תקן בלבד של זעם‪.‬‬
‫שיטת ‪ - Stepwise‬הסוף‬
‫המשתנה ‪ histagrut‬נמצא אמנם מובהק (‪ )p=0.025‬אבל‬

‫בשיטה הזו כל פעם מוכנס למודל רק משתנה אחד נוסף‪.‬‬
‫במודל הראשון הכניס המחשב ‪ Harada‬למודל‪Harada .‬‬
‫סה"כ הוריני למחשב לשתף ‪ 4‬משתנים ב"ת‬
‫נמצא גם הוא מובהק והשפעתו על זעם נמצאה גדולה‬
‫במודל‪ .‬בשיטת ה ‪ stepwise‬כל פעם מכניס‬
‫יותר מזו של היסתגרות ולכן הועדפה עליו‪ .‬מסיים את‬
‫המחשב רק עוד משתנה נוסף אחד‪ .‬במודל‬
‫מלאכתו‪.‬‬
‫הראשון הוא הכניס את "חרדה" ולא הכניס‬
‫את שלושת המשתנים המצוינים פה‪.‬‬
‫‪Excluded Variables‬‬
‫‪Collinearity Statistics‬‬
‫‪Partial‬‬ ‫‪Tolerance‬‬
‫‪Model‬‬ ‫‪Beta In‬‬ ‫‪t‬‬ ‫‪Sig.‬‬ ‫‪Correlation‬‬
‫‪1‬‬ ‫‪age‬‬ ‫‪-.008‬‬ ‫‪-.125‬‬ ‫‪.901‬‬ ‫‪-.009‬‬ ‫‪.977‬‬
‫‪relation time‬‬ ‫‪-.011‬‬ ‫‪-.167‬‬ ‫‪.868‬‬ ‫‪-.012‬‬ ‫‪.981‬‬
‫‪histagrut‬‬ ‫‪.149‬‬ ‫‪2.252‬‬ ‫‪.025‬‬ ‫‪.161‬‬ ‫‪.999‬‬
‫‪2‬‬ ‫‪age‬‬ ‫‪-.025‬‬ ‫‪-.365‬‬ ‫‪.716‬‬ ‫‪-.027‬‬ ‫‪.966‬‬
‫‪relation time‬‬ ‫‪-.027‬‬ ‫‪-.401‬‬ ‫‪.689‬‬ ‫‪-.029‬‬ ‫‪.971‬‬
‫במודל ‪ 2‬הוסיף המחשב למשתנה "חרדה" את‬ ‫המשתנים "גיל" (‪ )age‬ו‪" -‬משך היחסים"‬
‫המשתנה "היסתגרות" ולכן לא שיתף במודל את‬ ‫(‪ )relationtime‬נמצאים לא מובהקים והמחשב‬
‫המשתנים שמצוינים פה‪."gil", "relationtime" :‬‬ ‫מסיים את מלאכתו‪.‬‬
‫המחשב לא ממשיך למודל ‪ 3‬כי בבדיקות שערך‬
‫שני המשתנים הללו נמצאים על ידו לא מובהקים‪.‬‬
‫סוף מצגת‬

רגרסיה ג20

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

רגרסיה ג20

Uploaded by

Copyright:

Available Formats

‫רגרסיה‬

‫‪400‬‬ ‫הקו המשורטט הוא קו הרגרסיה‪ .‬הקו הישר שממוצע‬

‫בקו הרגרסיה אפשר להשתמש כקו ניבוי‪ .‬נניח שאנו‬

‫אם נשקיע ‪ 1,500,000‬שטרלינג אנו צפויים על פי‬

‫‪0‬‬ ‫‪500,000‬‬ ‫‪1,000,000‬‬ ‫‪1,500,000‬‬ ‫‪2,000,000 2,500,000‬‬

‫המתאם בין המשתנה‬

‫הרגרסיה מתחילה להיות מעניינת כשהיא רגרסיה מרובה‪.‬‬

‫המתאם בין המשתנים הבלתי‬ ‫הריבוע של המתאם=אחוז שונות מוסברת‪.‬‬

‫יש מובהקות!‪ Sig ,‬קטן מ‪ .0.05 -‬המודל שלנו מובהק‬

‫‪Model‬‬ ‫‪Sum of Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬

‫שני המשתנים של הבלוק השני‪ ,‬לא נכללו במודל‬

‫המשתנה ‪ histagrut‬נמצא אמנם מובהק (‪ )p=0.025‬אבל‬

You might also like