You are on page 1of 18

‫רגרסיה‬

‫קו הרגרסיה‬
‫הרגרסיה מהווה הרחבה של רעיון המתאם‪ .‬המתאם מציג את עוצמת הקשר הלינארי בין שני משתנים‪.‬‬
‫הרגרסיה " מנצלת" את הקשר הזה לניבוי‪ .‬אם יש קשר חזק בין משתנים אזי אם יודעים ערך של משתנה אחד יודעים "בערך" מהו הערך של‬
‫המשתנה השני‪ .‬הרגרסיה מספקת את הנוסחה שמנבא את הערך של המשתנה השני‪.‬‬
‫קו הרגרסיה‪ .‬גם משקף את הקשר הלינארי‬
‫בין המשתנים וגם מאפשר לנבא‪.‬‬
‫התרשים להלן מציג נתונים של ‪ 200‬תקליטורים‬
‫שהופקו בלונדון‪ .‬כל נקודה בגרף היא תקליטור‪ .‬עבור כל‬
‫תקליטור נתונים ההשקעה בפרסום ומכירות התקליטור‪.‬‬
‫(עיינו במצגת בנושא מתאם במידה ואתם מתקשים)‬

‫‪400‬‬ ‫הקו המשורטט הוא קו הרגרסיה‪ .‬הקו הישר שממוצע‬


‫המרחקים שלו מכל הנקודות הוא הקטן ביותר‪ .‬כלומר‬
‫הוא הקרוב ביותר אל הנקודות‪.‬‬

‫בקו הרגרסיה אפשר להשתמש כקו ניבוי‪ .‬נניח שאנו‬


‫מכירות תקליטורים (באלפים)‬

‫‪300‬‬
‫מפיקים תקליטור חדש ויש לנו סכום של ‪0150000‬‬
‫שטרלינג לפרסום‪ .‬כמה צפוי להיות מספר תקליטורים‬
‫שנמכור?‬
‫‪200‬‬

‫‪100‬‬

‫אם נשקיע ‪ 1,500,000‬שטרלינג אנו צפויים על פי‬


‫קו הרגרסיה למכור כ – ‪ 280,000‬תקליטורים‬

‫‪0‬‬ ‫‪500,000‬‬ ‫‪1,000,000‬‬ ‫‪1,500,000‬‬ ‫‪2,000,000 2,500,000‬‬


‫השקעה בפרסום (בשטרלינג)‬
‫איך זה נראה ב‪?spss -‬‬
‫לעיתים נוצרים כמה מודלים של רגרסיה‪ .‬הם נבדלים‬
‫זה מזה במשתנים הבלתי תלויים ‪ .‬בדוגמה יש לנו רק‬
‫משתנה בלתי תלוי אחד (השקעה בפרסום) ולכן רק‬ ‫השיטה שבה הורינו למחשב למצוא את מודל‬
‫מודל אחד אפשר‪ .‬בדוגמה בהמשך נראה כיצד נוצרים‬ ‫הרגרסיה‪ .‬בדוגמה הזו השיטה היא ‪ Enter‬או‬
‫יותר ממודל אחד‬ ‫בעברית רגרסיה כפויה‪ .‬כפינו על המחשב בדיוק‬
‫אילו משתנים בלתי תלויים יהיה ברגרסיה‪ .‬בהמשך‬
‫נראה דוגמה עם כמה שיטות והנקודה הזו תתבהר‬
‫‪Variables Entered/Removed‬‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Variables Removed‬‬ ‫‪Method‬‬
‫‪1‬‬ ‫‪Advertsing Budget‬‬
‫‪.‬‬ ‫‪Enter‬‬
‫)‪(thousands of pounds‬‬

‫המשתנים הב"ת של המודל‪ .‬במקרה שלנו במודל רק‬ ‫המשתנים הב"ת שהיו במודל‬
‫משתנה בלתי תלוי אחד – ההשקעה בפרסום‬ ‫והוצאו ממנו‪ .‬בדוגמה הנוכחית לא‬
‫(‪)Advertising Budget‬‬ ‫קיימים‪ .‬נראה כאלו בדוגמה‬
‫אחרת‬

‫‪Model Summary‬‬
‫‪Adjusted R‬‬ ‫‪Std. Error of‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square‬‬ ‫‪Square‬‬ ‫‪the Estimate‬‬
‫‪1‬‬
‫‪.578‬‬ ‫‪.335‬‬ ‫‪.331‬‬ ‫‪65.991‬‬

‫המתאם בין המשתנה‬


‫הבלתי תלוי לתלוי‬ ‫הריבוע של המתאם‪ .‬מכונה גם אחוז‬
‫שונות מוסברת‪ .‬משקף את גודל הקשר‬
‫בין המשתנים‪ .‬במקרה הזה ‪33.5%‬‬
‫לעומת ‪ 100%‬שהוא קשר מושלם‬
‫(המשך התקליטורים)‬ ‫איך זה נראה ב‪?spss -‬‬
‫אנובה כמו תמיד‪" ,‬מחליטה" ‪ H0‬או ‪ H1‬כלומר האם יש מובהקות או אין‪.‬‬
‫במקרה זה האם המודל של הרגרסיה מובהק‪ .‬האם המשתנים הבלתי תלויים‬
‫יש מובהקות!‪ Sig ,‬קטן מ‪ .0.05 -‬זה אומר שהמודל שלנו מובהק‬
‫שלנו במודל עוזרים לנו לשפר את הניבוי‪.‬‬
‫כלומר הוא עדיף על מודל שבו לא משתמשים במשתנים הב"ת‬
‫לניבוי המכירות‪.‬‬
‫‪ANOVA‬‬
‫‪Sum of‬‬
‫‪Model‬‬ ‫‪Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪433687.833‬‬ ‫‪1‬‬ ‫‪433687.833‬‬ ‫‪99.587‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪862264.167‬‬ ‫‪198‬‬ ‫‪4354.870‬‬
‫‪Total‬‬ ‫‪1295952.000‬‬ ‫‪199‬‬

‫‪Coefficients‬‬
‫‪Standardized‬‬
‫‪Unstandardized Coefficients‬‬ ‫‪Coefficients‬‬
‫‪Model‬‬ ‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪134.140‬‬ ‫‪7.537‬‬ ‫‪17.799‬‬ ‫‪.000‬‬
‫‪Advertsing Budget‬‬
‫‪.096‬‬ ‫‪.010‬‬ ‫‪.578‬‬ ‫‪9.979‬‬ ‫‪.000‬‬
‫)‪(thousands of pounds‬‬

‫המקדמים שמופיעים בנוסחת (מודל) הרגרסיה‪ .‬על פי נתונים אלו‬ ‫מציג את נוסחת הרגרסיה ביחידות של סטיות תקן (נסמן ס‪.‬‬
‫המודל הוא‪:‬‬ ‫ת)‪ .‬הנוסחה ביחידות אלו היא‪:‬‬
‫מכירות= ‪ •0.096 +134.4‬פרסום‬ ‫מכירות (ס‪.‬ת)= ‪ • 0.578 +134.4‬פרסום (ס‪.‬ת)‬
‫‪:‬למשל אם נפרסם ב‪( 1500-‬אלף שטרלינג) נקבל‬
‫‪134.4+0.0096 •1500= 278.4‬‬
‫כלומר צפוי שנמכור כ‪ 278 -‬אלפי תקליטורים‪ .‬שימו לב שזה‬ ‫מקדם חיובי בנוסחת הרגרסיה‪.‬‬ ‫המובהקות של המקדם‪ .‬חשוב בעיקר‬
‫בדיוק מה שקיבלנו בגרף שמופיע בתחילת המצגת‬ ‫אומר שככל שההשקעה בפרסום‬ ‫המקדם של המשתנים הבלתי תלויים‪.‬‬
‫גבוהה יותר כך גם המכירות‬ ‫במקרה זה המקדם של הפרסום מובהק‬
‫‪.‬גבוהות יותר‬ ‫כלומר יש קשר מובהק בין פרסום‬
‫למכירות‬
‫רגרסיה מרובה‬

‫הרגרסיה מתחילה להיות מעניינת כשהיא רגרסיה מרובה‪.‬‬


‫אני יודע‪ ,‬אני יודע‪ ,‬רגרסיה ועניין זה לא בדיוק הולך אצלכם ביחד אבל בכל זאת הבה ננסה להמריא קצת ונגלה אמפתיה‬
‫מתונה למתעניינים‪.‬‬

‫ברגרסיה מרובה אנו מנסים ל"נבא" או להסביר את המשתנה התלוי (למשל מכירות תקליטורים) באמצעות יותר ממשתנה‬
‫בלתי תלוי אחד‪ .‬קשה לצפות שנוכל להסביר משתנה שאינו פיסיקלי באמצעות משתנה אחד בלבד‪ .‬כשמדובר באנשים‪,‬‬
‫בפסיכולוגיה‪ ,‬בחינוך יש משתנים רבים שמעורבים‪ .‬משתנה אחד יסבירו לנו במקרים אלו רק חלק קטן יחסית של המשתנה‬
‫התלוי‪ .‬מידת ההסבר נקבעת על ידי הערך של המתאם בריבוע‪ ,‬בדוגמה הקודמת ערך המתאם בריבוע היה כ‪ 33%-‬ואז‬
‫אומרים שהפרסום מסביר ‪ 33%‬מהמכירות‪ .‬אבל זה מודל לא מספק אנחנו מעוניינים במודלים שמסבירים במידה גבוהה‬
‫בהרבה את המשתנה התלויה‪ .‬הדרך למציאת מודלים טובים יותר היא הוספה של עוד משתנים בלתי תלויים למודל‬
‫הרגרסיה‪.‬‬

‫בדוגמה שלהלן נכלול במודל הרגרסיה של מכירות התקליטורים עוד ‪ 2‬משתנים בלתי תלויים‪:‬‬
‫מספר ההשמעות ברדיו בשבוע הראשון‬
‫האטרקטיביות של הלהקה המבצעת כפי שהוערכה על ידי שאלונים מתאימים שהועברו‪.‬‬
‫כמו כן נמשיך לכלול ברגרסיה את ההשקעה בפרסום‬
‫סה"כ נקבל מודל רגרסיה הכולל עתה ‪ 3‬משתנים בלתי תלויים‪.‬‬
‫רגרסיה מרובה‪ :‬איך זה נראה ב‪?spss -‬‬
‫בדיוק כמו רגרסיה רגילה אבל עם עוד משתנים‬

‫•‬
‫‪Variables Entered/Removed‬‬
‫‪Variables‬‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬
‫‪1‬‬
‫‪Attractiveness of Band, Advertsing Budget (thousands of‬‬
‫‪Enter‬‬
‫‪pounds), No. of plays on Radio 1 per week‬‬

‫המשתנים הבלתי תלויים של המודל‪ .‬בדוגמה‬ ‫משתנים בלתי תלויים שבמהלך‬ ‫השיטה שהורינו לבצע את הרגרסיה‪.‬‬
‫הזו‪ 3 ,‬משתנים בלתי תלויים‪ :‬אטרקטיביות‬ ‫חישוב הרגרסיה המחשב השמיט‬ ‫במקרה זה שיטת ‪ Enter‬המכונה גם‬
‫הלהקה‪ ,‬השקעה בפרסום‪ ,‬השמעות ברדיו‪.‬‬ ‫מהמודל‪ .‬בשיטת הרגרסיה‬ ‫רגרסיה כפויה‪.‬‬
‫הכפויה המחשב לא מוציא אף‬
‫פעם משתנים מהמודל‬

‫‪Model Summary‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square‬‬ ‫‪Adjusted R Square‬‬ ‫‪Std. Error of the Estimate‬‬
‫‪1‬‬ ‫‪.815‬‬ ‫‪.665‬‬ ‫‪.660‬‬ ‫‪47.087‬‬

‫המתאם בין המשתנים הבלתי‬ ‫הריבוע של המתאם=אחוז שונות מוסברת‪.‬‬


‫תלויים לתלוי‪ .‬המתאם כעת הוא‬ ‫משקף את גודל הקשר בין המשתנים‪66% .‬‬
‫גבוה בהרבה ממודל הרגרסיה‬ ‫לעומת ‪ 33%‬כאשר רק הפרסום היה במודל‪.‬‬
‫הקודם שבו רק הפרסום היה‬ ‫הוספת ‪ 2‬משתנים למודל הכפילה את חוזק‬
‫במודל‪ 0.815 .‬לעומת ‪0.578‬‬ ‫המודל‪.‬‬
‫רגרסיה מרובה‪( spss :‬המשך)‬

‫יש מובהקות!‪ Sig ,‬קטן מ‪ .0.05 -‬המודל שלנו מובהק‬


‫כלומר הוא עדיף על מודל שבו לא משתמשים במשתנים‬
‫הב"ת לניבוי המכירות‪.‬‬
‫‪ANOVA‬‬

‫‪Model‬‬ ‫‪Sum of Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬


‫‪1‬‬ ‫‪Regression‬‬ ‫‪861377.418‬‬ ‫‪3‬‬ ‫‪287125.806‬‬ ‫‪129.498 .000‬‬
‫‪Residual‬‬ ‫‪434574.582‬‬ ‫‪196‬‬ ‫‪2217.217‬‬
‫‪Total‬‬ ‫‪1295952.000‬‬ ‫‪199‬‬

‫‪Coefficients‬‬ ‫‪Standardized‬‬
‫‪Model‬‬ ‫‪Unstandardized Coefficients‬‬ ‫‪Coefficients‬‬
‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪-26.613‬‬ ‫‪17.350‬‬ ‫‪-1.534 .127‬‬
‫)‪Advertsing Budget (thousands of pounds‬‬ ‫‪.085‬‬ ‫‪.007‬‬ ‫‪.511‬‬ ‫‪12.261 .000‬‬
‫‪No. of plays on Radio 1 per week‬‬ ‫‪3.367‬‬ ‫‪.278‬‬ ‫‪.512‬‬ ‫‪12.123 .000‬‬
‫‪Attractiveness of Band‬‬ ‫‪11.086‬‬ ‫‪2.438‬‬ ‫‪.192‬‬ ‫‪4.548 .000‬‬

‫המקדמים שמופיעים בנוסחת (מודל) הרגרסיה‪ .‬על פי נתונים אלו המודל הוא‪:‬‬ ‫המובהקות של כל משתנה ב"ת‬
‫מכירות= ‪ • 0.085 +26.6-‬פרסום ‪ • 3.367 +‬השמעות ברדיו ‪ • 11.086 +‬אטרקטיביות להקה‬ ‫קטנה מ‪ ,0.05 -‬לכן יש קשר‬
‫מובהק בין כל אחד מהמשתנים‬
‫הב"ת לבין מכירות התקליטורים‬
‫‪ = Beta‬מקדמי הרגרסיה ביחידות של סטיית תקן‪ .‬אנו רואים שהעלאה של סטיית תקן אחת בפרסום‬
‫מביאה בערך לעליה של חצי סטית תקן במכירות (‪ .)0.511‬העלאה של סטיית תקן בהשמעה מביאה‬
‫לעליה של כחצי סטיית תקן במכירות (‪ ,) 0.512‬והעלאה של סטיית תקן באטרקטיביות הלהקה מביאה‬
‫לעליה של פחות מ חמישית בסטיית התקן של המכירות (‪ .)0.192‬בפשטנות ניתן להסיק מכך‬
‫שהפרסום ומספר ההשמעות משפיעות במידה דומה על המכירות ושהאטרקטיביות משפיעה הרבה‬
‫פחות מהם‪.‬‬
‫רגרסיה מרובה ‪ :‬סיכום ביניים – הטבלאות ותפקידם‬

‫‪Variables Entered/Removed‬‬
‫מציין אלו משתנים בלתי תלויים במודל‬

‫‪Model Summary‬‬
‫מציין מה המתאם והשונות המוסברת של המודל‪ .‬ככל שהשונות המוסברת גדולה יותר אנחנו שמחים יותר‪ .‬סימן שהמשתנים‬
‫הבלתי תלויים מסבירים בצורה שלמה יותר את המשתנה התלוי‪( .‬שונות מוסברת מקסימלית אפשרית ‪)100%‬‬

‫‪ANOVA‬‬
‫מראה אם המודל מובהק או לא‪ .‬האם ניתן להסיק מן המדגם (שבאמצעותו בנינו את המודל)‪ .‬אל האוכלוסייה‪ .‬אם אין‬
‫מובהקות אין שום משמעות לתוצאות גם אם השונות המוסברות יצאה גדולה‪ .‬אין מובהקות אומר שאת השונות המוסברת‬
‫שקיבלנו ניתן להסביר במקריות גרידא‪.‬‬

‫‪Coefficients‬‬
‫משמשת לכמה דברים‪:‬‬
‫א‪ .‬לחילוץ נוסחת הרגרסיה‪ .‬מקדמי ה‪ B-‬הם המספרים שמופיעים בנוסחה‬
‫ב‪ .‬לבחינה עבור כל משתנה בלתי תלוי האם הוא משפיע במובהק על המשתנה התלוי‬
‫ג‪ .‬מקדמי ה‪ -‬ביתא משקפים את מידת ההשפעה של כל משתנה על המשתנה התלוי‪ .‬ככל שה ביטא (ערך מוחלט שלו כי‬
‫ביטא יכול להיות גם שלילי) גדול יותר כך פירושו של משתנה שזו הביטה שלו יש יותר השפעה על המשתנה התלוי‪ .‬אם‬
‫משווים את הביטות של המשתנים הבלתי תלויים אפשר לראות מי משפיע יותר ומי משפיע פחות‪.‬‬
‫רגרסיה מרובה – שיטות החישוב‪ ,‬משתנים שיצאו‪ ,‬מובהקות המשתנים‬
‫ישנן כמה אפשריות לחישוב מודל הרגרסיה‪ .‬בדוגמאות הקודמות הופעלה שיטת הרגרסיה הכפויה (‪ .) Enter‬בשיטה זו אנו כופים על המחשב את המשתנים הבלתי תלויים שיהיו במודל‪ .‬יש שיטות אחרות שבהן אנו מאפשרים‬
‫למחשב להחליט על המשתנים הבלתי תלויים‬

‫הפעלה ראשונה באמצעות רגרסיה כפוייה ‪Enter -‬‬ ‫אנו נדגים כמה מהשיטות באמצעות הדוגמה הבאה‬
‫אנו כופים על המחשב להכניס את כל המשתנים הבלתי תלויים למודל‪.‬‬ ‫המתייחסת ליחסים בן בני זוג‪ .‬משתנים מנבאים (בלתי‬
‫תלויים)‪:‬‬
‫‪ ‬הסתגרות (הימנעות מקשר)‬
‫‪ ‬חרדה (בהקשר של יחסים עם אנשים‪ ,‬נטישה וכד')‬
‫‪Variables Entered/Removed‬‬ ‫‪ ‬זמן הקשר עם בן הזוג‪.‬‬
‫‪Variables‬‬ ‫‪ ‬גיל האדם‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬ ‫‪ 2‬המשתנים הראשונים מבטאים תכונת אופי או דפוס‬
‫‪1‬‬ ‫התנהגות של אדם (נמדדו על פי שאלונים מתאימים)‬
‫‪histagrut, harada,‬‬
‫‪relation time, age‬‬
‫‪. Enter‬‬ ‫ובמידה רבה ניתן להתייחס להם כאופינים לאדם‪.‬‬
‫משתנה תלוי‪ :‬זעם – מידת הזעם הקיימת כלפי בן‬
‫הזוג‪.‬‬
‫המחשב יוצר מודל שבו‬
‫נמצאים כל המשתנים הבלתי‬
‫תלויים שביקשנו לכלול‬ ‫אנו מנסים לברר באיזו מידה ניתן להסביר (או לנבא)‬
‫את מידת הזעם כלפי בן הזוג באמצעות ההסתגרות‪,‬‬
‫החרדה ואורך הקשר הזוגי‪.‬‬
‫‪Model Summary‬‬
‫‪Adjusted Std. Error of‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square‬‬ ‫‪R Square the Estimate‬‬
‫‪1‬‬ ‫‪.418‬‬ ‫‪.175‬‬ ‫‪.157‬‬ ‫‪.65203‬‬
‫שיטות החישוב‪ ,‬משתנים שיצאו‪ ,‬מובהקות המשתנים (המשך)‬ ‫רגרסיה מרובה –‬

‫‪ANOVA‬‬
‫‪Sum of‬‬ ‫‪Mean‬‬
‫‪Model‬‬ ‫‪Squares‬‬ ‫‪df‬‬ ‫‪Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪16.918‬‬ ‫‪4‬‬ ‫‪4.229‬‬ ‫‪9.948‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.928‬‬ ‫‪188‬‬ ‫‪.425‬‬ ‫המודל מובהק‪.‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬

‫‪Coefficients‬‬
‫‪Standardized‬‬
‫‪Unstandardized Coefficients‬‬ ‫‪Coefficients‬‬
‫אין קשר מובהק בין הגיל לזעם‬
‫‪Model‬‬ ‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪.676‬‬ ‫‪.366‬‬ ‫‪1.845‬‬ ‫‪.067‬‬
‫‪age‬‬ ‫‪.000‬‬ ‫‪.013‬‬ ‫‪-.002‬‬ ‫‪-.012‬‬ ‫‪.990‬‬ ‫אין קשר מובהק בין זמן הקשר לזעם‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.025‬‬ ‫‪-.167‬‬ ‫‪.868‬‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.043‬‬ ‫‪.390‬‬ ‫‪5.813‬‬ ‫‪.000‬‬
‫‪histagrut‬‬ ‫יש קשר מובהק בין החרדה לזעם‪.‬‬
‫‪.114‬‬ ‫‪.050‬‬ ‫‪.151‬‬ ‫‪2.270‬‬ ‫‪.024‬‬

‫למשתנים הבלתי תלויים‪" :‬גיל" ו‪"-‬משך הקשר" יש מקדמים ‪ 0‬במודל‬ ‫יש קשר מובהק בין הסתגרות לזעם‪.‬‬
‫הרגרסיה‪ .‬כלומר הם לא חלק מהמודל‪ .‬הם גם יצאו לא מובהקים (ראה‬
‫עמודת ‪ .) Sig‬לעיתים למשתנים לא מובהקים המקדמים יוצאים שונים‬
‫מ‪ .0-‬גם במקרה הזה הם לא ‪ 0‬ממש אלא פשוט קטנים מאלפית‪ .‬ניתן‬
‫לראות את זה כי מקדמי הביטא (‪ )Beta‬שלהם קטנים מאוד אבל לא ‪0‬‬
‫המשך שיטת רגרסיה כפויה = ‪Enter‬‬ ‫רגרסיה מרובה –‬

‫‪ANOVA‬‬
‫‪Sum of‬‬ ‫‪Mean‬‬
‫‪Model‬‬ ‫‪Squares‬‬ ‫‪df‬‬ ‫‪Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪16.918‬‬ ‫‪4‬‬ ‫‪4.229‬‬ ‫‪9.948‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.928‬‬ ‫‪188‬‬ ‫‪.425‬‬ ‫המודל מובהק‪.‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬ ‫מודל מובהק אומר שלאחד‬
‫המשתנים או יותר יש קשר‬
‫מובהק למשתנה התלוי‬

‫‪Coefficients‬‬
‫‪Standardized‬‬
‫‪Unstandardized Coefficients‬‬ ‫‪Coefficients‬‬
‫אין קשר מובהק בין הגיל לזעם‬
‫‪Model‬‬ ‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪.676‬‬ ‫‪.366‬‬ ‫‪1.845‬‬ ‫‪.067‬‬
‫‪age‬‬ ‫‪.000‬‬ ‫‪.013‬‬ ‫‪-.002‬‬ ‫‪-.012‬‬ ‫‪.990‬‬ ‫אין קשר מובהק בין זמן הקשר לזעם‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.025‬‬ ‫‪-.167‬‬ ‫‪.868‬‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.043‬‬ ‫‪.390‬‬ ‫‪5.813‬‬ ‫‪.000‬‬
‫‪histagrut‬‬ ‫יש קשר מובהק בין החרדה לזעם‪.‬‬
‫‪.114‬‬ ‫‪.050‬‬ ‫‪.151‬‬ ‫‪2.270‬‬ ‫‪.024‬‬

‫למשתנים הבלתי תלויים‪" :‬גיל" ו‪"-‬משך הקשר" יש מקדמים ‪ 0‬במודל‬ ‫יש קשר מובהק בין הסתגרות לזעם‪.‬‬
‫הרגרסיה‪ .‬כלומר הם לא חלק מהמודל‪ .‬הם גם יצאו לא מובהקים (ראה‬ ‫(‪)0.05 < 0.024‬‬
‫עמודת ‪ .) Sig‬לעיתים למשתנים לא מובהקים המקדמים יוצאים שונים מ‪.0-‬‬
‫גם במקרה הזה הם לא ‪ 0‬ממש אלא פשוט קטנים מאלפית‪ .‬ניתן לראות את‬
‫זה כי מקדמי הביטא (‪ )Beta‬שלהם קטנים מאוד אבל לא ‪0‬‬
‫‪ -‬רגרסיה כפויה בבלוקים‬ ‫שיטת ‪Hierarchic Regression‬‬
‫בשיטה זו אנו מפרקים את המשתנים הבלתי תלויים לבלוקים‪.‬‬
‫מודל ‪ 1‬כולל את בלוק המשתנים הבלתי תלויים הראשון‪ .‬למודל ‪ 2‬מתווסף הבלוק השני וכך הלאה‪ .‬כל שלב כולל את הבלוקים‬
‫הקודמים ומוסיף עוד בלוק‪ .‬המודל האחרון כולל את כל הבלוקים‪.‬‬
‫אפשר לראות שיטה זו כגרסה של רגרסיה כפויה אלא שהפעם אנו מחלקים אותה לשלבים‪ .‬למחשב אין "שיקול דעת"‪ .‬והוא‬
‫מפעיל את השלבים בדיוק על פי הבלוקים שקבענו‪.‬‬

‫‪Variables Entered/Removed‬‬ ‫•‬ ‫בדוגמה זו אנו שוב עוסקים בזעם ביחסים הזוגיים‪.‬‬
‫ומנסים לברר כיצד ‪ 4‬המשתנים הבלתי תלויים‬
‫‪Variables‬‬
‫משפיעים עליו‪ .‬בניגוד לדוגמה הקודם עתה אנו‬
‫‪Model‬‬ ‫‪Variables Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬
‫‪1‬‬
‫מחלקים את המשתנים הבלתי תלויים ל‪ 2-‬בלוקים‪:‬‬
‫‪relation time, age‬‬ ‫‪.‬‬ ‫‪Enter‬‬
‫בלוק ‪ :1‬משך הקשר והגיל‬
‫‪2‬‬ ‫‪histagrut, harada‬‬ ‫‪.‬‬ ‫‪Enter‬‬
‫בלוק ‪ :2‬הסתגרות וחרדה‪.‬‬
‫מודל ‪ 1‬כולל את הבלוק של "משך‬ ‫הבלוק הראשון כולל משתנים "טכניים"‪ ,‬כאלו שאין‬
‫מודל ‪ 2‬כולל גם את הבלוק‬ ‫היחסים" וה"גיל"‬ ‫לנו שליטה עליהם‪ .‬והבלוק השני כולל מאפייני אישיות‬
‫הראשון ומוסיף אליו את הבלוק‬ ‫ואנו רוצים לבחון מה התרומה של כל בלוק למודל‬
‫השני‪" :‬חרדה" ו"הסתגרות"‬ ‫(ליכולת להסביר את הזעם)‬

‫‪Model Summary‬‬
‫‪Change Statistics‬‬
‫‪Adjusted R Std. Error of‬‬ ‫‪Sig. F‬‬
‫‪Model‬‬ ‫‪R‬‬ ‫‪R Square Square‬‬ ‫‪the Estimate R Square Change‬‬ ‫‪F Change‬‬ ‫‪df1‬‬ ‫‪df2‬‬ ‫‪Change‬‬
‫‪1‬‬ ‫‪.068‬‬ ‫‪.005‬‬ ‫‪-.006‬‬ ‫‪.71229‬‬ ‫‪.005‬‬ ‫‪.441‬‬ ‫‪2‬‬ ‫‪190‬‬ ‫‪.644‬‬
‫‪2‬‬ ‫‪.418‬‬ ‫‪.175‬‬ ‫‪.157‬‬ ‫‪.65203‬‬ ‫‪.170‬‬ ‫‪19.370‬‬ ‫‪2‬‬ ‫‪188‬‬ ‫‪.000‬‬

‫השונות המוסברת על ידי מודל ‪1‬‬ ‫השונות המוסברת על ידי מודל ‪2‬‬ ‫הבלוק של משתני האישיות‪ :‬הסתגרות וחרדה‪.‬‬
‫(הבלוק הראשון ) היא ‪( 0.005‬חצי‬ ‫הכולל את ‪ 2‬הבלוקים היא‬ ‫הוסיף עוד ‪ 17%‬לשונות המוסברות‪ .‬זה ערכה של‬
‫אחוז)‪ .‬קשר חלש מאוד למשתנה זעם‪.‬‬ ‫‪ .17.5%‬חישוב פשוט מראה‬ ‫הרגרסיה בבלוקים אנו מבינים את ערכו של כל בלוק‬
‫שהתוספת של הבלוק השני‬ ‫בהסברת המשתנה התלוי‬
‫לשונות המוסברת היא ‪17%‬‬
‫טבלת האנובה ה"רגילה"‪ .‬אלא שהפעם‬ ‫‪ - Hierarchic Regression‬המשך‬
‫המחשב מספק טבלת אנובה לכל מודל‬
‫שנוצר‪ .‬במקרה הזה ‪ 2‬מודלים‪ .‬מודל ‪1‬‬
‫שכולל את הבלוק הראשון ומודל ‪2‬‬
‫שכולל את הבלוק הראשון והשני ביחד‪.‬‬

‫‪ANOVA‬‬

‫‪Model‬‬ ‫‪Sum of Squares‬‬ ‫‪df‬‬ ‫‪Mean Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬ ‫מודל ‪ 1‬איננו מובהק‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪.448‬‬ ‫‪2‬‬ ‫‪.224‬‬ ‫‪.441‬‬ ‫‪.644‬‬
‫‪Residual‬‬ ‫‪96.398‬‬ ‫‪190‬‬ ‫‪.507‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬ ‫מודל ‪ 2‬מובהק‬
‫‪2‬‬ ‫‪Regression‬‬ ‫‪16.918‬‬ ‫‪4‬‬ ‫‪4.229‬‬ ‫‪9.948‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.928‬‬ ‫‪188‬‬ ‫‪.425‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬
‫מקדם שלילי בנוסחת הרגרסיה‪ .‬אומר שככל שהגיל גבוה‬
‫מקדמי נוסחת הרגרסיה‬ ‫יותר כן קטן הזעם‪ .‬תוצאה יפה‪ ,‬אלא שבמקרה שלנו‬
‫של מודל ‪1‬‬ ‫המשתנה גיל כלל אינו מובהק ולכן לא באמת תוצאה‬
‫‪Coefficients‬‬
‫‪Unstandardized‬‬ ‫‪Standardized‬‬
‫‪Coefficients‬‬ ‫‪Coefficients‬‬
‫‪Model‬‬ ‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪1.934‬‬ ‫‪.322‬‬ ‫‪6.007‬‬ ‫‪.000‬‬
‫‪age‬‬ ‫‪-.004‬‬ ‫‪.014‬‬ ‫‪-.048‬‬ ‫‪-.288‬‬ ‫‪.774‬‬ ‫המובהקות של‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.022‬‬ ‫‪-.133‬‬ ‫‪.894‬‬ ‫המשתנים במודל ‪.2‬‬
‫‪2‬‬ ‫)‪(Constant‬‬ ‫‪.676‬‬ ‫‪.366‬‬ ‫‪1.845‬‬ ‫‪.067‬‬ ‫הסתגרות ןחרדה‬
‫‪age‬‬ ‫‪.000‬‬ ‫‪.013‬‬ ‫‪-.002‬‬ ‫‪-.012‬‬ ‫‪.990‬‬ ‫מובהקים‪ ,‬גיל ומשך‬
‫‪relation time‬‬ ‫‪.000‬‬ ‫‪.001‬‬ ‫‪-.025‬‬ ‫‪-.167‬‬ ‫‪.868‬‬ ‫היחס לא מובהקים‬
‫‪histagrut‬‬ ‫‪.114‬‬ ‫‪.050‬‬ ‫‪.151‬‬ ‫‪2.270‬‬ ‫‪.024‬‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.043‬‬ ‫‪.390‬‬ ‫‪5.813‬‬ ‫‪.000‬‬
‫מקדמי נוסחת‬
‫הרגרסיה של מודל ‪2‬‬
‫שיטת ‪ - Hierarchic Regression‬הסוף‬
‫הפעם "צצה" לנו טבלה נוספת‪ .‬טבלת המשתנים שלא נכללו במודלים‪.‬‬
‫במקרה שלנו היו ‪ 2‬מודלים‪ .‬במודל השני נכללו כל המשתנים אבל במודל הראשון "כפינו" על המחשב להכניס רק את הבלוק‬
‫הראשון ולא להכניס את משתני הבלוק השני‪ .‬בטבלה שלמטה המחשב "מזכיר" לנו את זה‪.‬‬

‫‪Excluded Variables‬‬
‫‪Collinearity Statistics‬‬
‫‪Partial‬‬ ‫‪Tolerance‬‬
‫‪Model‬‬ ‫‪Beta In‬‬ ‫‪t‬‬ ‫‪Sig.‬‬ ‫‪Correlation‬‬
‫‪1‬‬ ‫‪histagrut‬‬ ‫‪.148‬‬ ‫‪2.054‬‬ ‫‪.041‬‬ ‫‪.148‬‬ ‫‪.988‬‬
‫‪harada‬‬ ‫‪.388‬‬ ‫‪5.733‬‬ ‫‪.000‬‬ ‫‪.385‬‬ ‫‪.977‬‬

‫שני המשתנים של הבלוק השני‪ ,‬לא נכללו במודל‬


‫הראשון‪.‬‬
‫רגרסיה מרובה – שיטת ‪Stepwise‬‬
‫בשיטה זו אנו מאפשרים למחשב לבנות בצורה עצמאית את המודל‬
‫המחשב עובד בשלבים‪ .‬בשלב הראשון הוא בוחר להכניס למודל את המשתנה שלו קשר מובהק עם המשתנה התלוי ושיש לו את הקשר החזק ביותר‬
‫( מתאם גבוה) עם המשתנה התלוי‪ .‬בשלב השני הוא בוחר מתוך המשתנים שנותרו את המשתנה המובהק שלו הקשר החזק ביותר וכך הלאה (התיאור‬
‫פשטני במקצת אבל ממחיש את הרעיון) עד שאו נגמרו כל המשתנים או לא נותרו עוד משתנים בלתי תלויים מובהקים‪.‬‬
‫המחשב בחר במשתנה חרדה‬
‫כמודל הראשון‬
‫‪Variables Entered/Removed‬‬
‫‪Variables‬‬ ‫‪Variables‬‬ ‫המחשב "מסביר" את שיטת‬
‫‪Model‬‬ ‫‪Entered‬‬ ‫‪Removed‬‬ ‫‪Method‬‬ ‫העבודה שלו‪ .‬משתנה מובהק עם‬
‫‪1‬‬ ‫‪Stepwise (Criteria: Probability-of-F-to-enter‬‬ ‫‪ p<0.05‬נכנס למודל‪ .‬משתנה‬
‫‪harada‬‬ ‫‪.‬‬ ‫שהמובהקות שלו יורדת עם‬
‫‪<= .050, Probability-of-F-to-remove >= .100).‬‬
‫‪2‬‬ ‫התפתחות המודל ל ‪ p>0.1‬מוצא‬
‫‪Stepwise (Criteria: Probability-of-F-to-enter‬‬
‫‪histagrut‬‬ ‫‪.‬‬ ‫מן המודל‪.‬‬
‫‪<= .050, Probability-of-F-to-remove >= .100).‬‬
‫במקרה הזה ‪ 2‬המשתנים שנכנסים‬
‫נשארו מובהקים מספיק עד לסיום‬
‫המחשב יצר את מודל ‪ 2‬באמצעות הוספה של משתנה "הסתגרות"‪.‬‬ ‫ולכן נותרו במודל‪.‬‬
‫במודל ‪ 2‬יש שני משתנים ב"ת‪" :-‬חרדה" ו‪"-‬הסתגרות"‬

‫‪Model Summary‬‬
‫‪Change Statistics‬‬
‫‪R‬‬ ‫‪Adjusted R‬‬ ‫‪Std. Error of the‬‬ ‫‪R Square‬‬ ‫‪F‬‬ ‫‪Sig. F‬‬
‫‪Model‬‬ ‫‪R Square Square‬‬ ‫‪Estimate‬‬ ‫‪Change‬‬ ‫‪Change df1‬‬ ‫‪df2‬‬ ‫‪Change‬‬
‫‪1‬‬ ‫‪.390 .152‬‬ ‫‪.147‬‬ ‫‪.65575‬‬ ‫‪.152‬‬ ‫‪.441‬‬ ‫‪2‬‬ ‫‪190‬‬ ‫‪.644‬‬
‫‪2‬‬ ‫‪.417 .174‬‬ ‫‪.165‬‬ ‫‪.64887‬‬ ‫‪.022‬‬ ‫‪19.370‬‬ ‫‪2‬‬ ‫‪188‬‬ ‫‪.000‬‬

‫המשתנה השני "הסתגרות" ( נוסף במודל ‪ )2‬מסביר עוד ‪ 2.2%‬מהזעם‬ ‫המשתנה הראשון "חרדה" (מודל ‪ )1‬מסביר ‪ 15.2%‬מהזעם‬
‫שיטת ‪ - Stepwise‬המשך‬
‫‪.‬‬

‫‪ANOVA‬‬
‫‪Sum of‬‬ ‫‪Mean‬‬
‫‪Model‬‬ ‫‪Squares‬‬ ‫‪df‬‬ ‫‪Square‬‬ ‫‪F‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫‪Regression‬‬ ‫‪14.714‬‬ ‫‪1‬‬ ‫‪14.714‬‬ ‫‪34.218‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪82.131‬‬ ‫‪191‬‬ ‫‪.430‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬ ‫שני המודלים מובהקים‬
‫‪2‬‬ ‫‪Regression‬‬ ‫‪16.850‬‬ ‫‪2‬‬ ‫‪8.425‬‬ ‫‪20.010‬‬ ‫‪.000‬‬
‫‪Residual‬‬ ‫‪79.996‬‬ ‫‪190‬‬ ‫‪.421‬‬
‫‪Total‬‬ ‫‪96.845‬‬ ‫‪192‬‬

‫‪Coefficients‬‬
‫‪Unstandardized‬‬ ‫‪Standardized‬‬
‫‪Coefficients‬‬ ‫‪Coefficients‬‬
‫‪Model‬‬ ‫‪B‬‬ ‫‪Std. Error‬‬ ‫‪Beta‬‬ ‫‪t‬‬ ‫‪Sig.‬‬
‫‪1‬‬ ‫)‪(Constant‬‬ ‫‪1.022‬‬ ‫‪.144‬‬ ‫‪7.087‬‬ ‫‪.000‬‬
‫מקדמי המשתנים המנבאים במודל‬
‫‪harada‬‬ ‫‪.248‬‬ ‫‪.042‬‬ ‫‪.390‬‬ ‫‪5.850‬‬ ‫‪.000‬‬ ‫הרגרסיה כאשר ערכי המשתנים‬
‫‪2‬‬ ‫)‪(Constant‬‬ ‫‪.661‬‬ ‫‪.215‬‬ ‫‪3.083‬‬ ‫‪.002‬‬ ‫מבוטאים ביחידות של סטיות‬
‫‪harada‬‬ ‫‪.250‬‬ ‫‪.042‬‬ ‫‪.393‬‬ ‫‪5.964‬‬ ‫‪.000‬‬ ‫התקן‪ .‬אנו רואים (מודל ‪)2‬‬
‫‪histagrut‬‬ ‫‪.112‬‬ ‫‪.050‬‬ ‫‪.149‬‬ ‫‪2.252‬‬ ‫‪.025‬‬ ‫שהעלאה בסטיית תקן אחת של‬
‫חרדה גורמת לעליה של ‪0.393‬‬
‫מקדמי נוסחת הרגרסיה של כל‬ ‫בזעם לעומת זאת עליה בסטיית‬
‫אחד מהמודלים‬ ‫תקן בהסתגרות מביאה לעליה של‬
‫‪ 0.149‬סטיות תקן בלבד של זעם‪.‬‬
‫שיטת ‪ - Stepwise‬הסוף‬

‫המשתנה ‪ histagrut‬נמצא אמנם מובהק (‪ )p=0.025‬אבל‬


‫בשיטה הזו כל פעם מוכנס למודל רק משתנה אחד נוסף‪.‬‬
‫במודל הראשון הכניס המחשב ‪ Harada‬למודל‪Harada .‬‬
‫סה"כ הוריני למחשב לשתף ‪ 4‬משתנים ב"ת‬
‫נמצא גם הוא מובהק והשפעתו על זעם נמצאה גדולה‬
‫במודל‪ .‬בשיטת ה ‪ stepwise‬כל פעם מכניס‬
‫יותר מזו של היסתגרות ולכן הועדפה עליו‪ .‬מסיים את‬
‫המחשב רק עוד משתנה נוסף אחד‪ .‬במודל‬
‫מלאכתו‪.‬‬
‫הראשון הוא הכניס את "חרדה" ולא הכניס‬
‫את שלושת המשתנים המצוינים פה‪.‬‬
‫‪Excluded Variables‬‬
‫‪Collinearity Statistics‬‬

‫‪Partial‬‬ ‫‪Tolerance‬‬
‫‪Model‬‬ ‫‪Beta In‬‬ ‫‪t‬‬ ‫‪Sig.‬‬ ‫‪Correlation‬‬
‫‪1‬‬ ‫‪age‬‬ ‫‪-.008‬‬ ‫‪-.125‬‬ ‫‪.901‬‬ ‫‪-.009‬‬ ‫‪.977‬‬
‫‪relation time‬‬ ‫‪-.011‬‬ ‫‪-.167‬‬ ‫‪.868‬‬ ‫‪-.012‬‬ ‫‪.981‬‬
‫‪histagrut‬‬ ‫‪.149‬‬ ‫‪2.252‬‬ ‫‪.025‬‬ ‫‪.161‬‬ ‫‪.999‬‬
‫‪2‬‬ ‫‪age‬‬ ‫‪-.025‬‬ ‫‪-.365‬‬ ‫‪.716‬‬ ‫‪-.027‬‬ ‫‪.966‬‬
‫‪relation time‬‬ ‫‪-.027‬‬ ‫‪-.401‬‬ ‫‪.689‬‬ ‫‪-.029‬‬ ‫‪.971‬‬

‫במודל ‪ 2‬הוסיף המחשב למשתנה "חרדה" את‬ ‫המשתנים "גיל" (‪ )age‬ו‪" -‬משך היחסים"‬
‫המשתנה "היסתגרות" ולכן לא שיתף במודל את‬ ‫(‪ )relationtime‬נמצאים לא מובהקים והמחשב‬
‫המשתנים שמצוינים פה‪."gil", "relationtime" :‬‬ ‫מסיים את מלאכתו‪.‬‬
‫המחשב לא ממשיך למודל ‪ 3‬כי בבדיקות שערך‬
‫שני המשתנים הללו נמצאים על ידו לא מובהקים‪.‬‬
‫סוף מצגת‬

You might also like