You are on page 1of 4

‫תרגיל מס' ‪4‬‬

‫רגרסיה רבת משתנים ‪Multiple Regression Model -‬‬

‫שאלה ‪1‬‬
‫הקובץ ‪ HPRICE‬כולל נתונים על מחירי דירות שנמכרו במהלך ‪ 1998‬באזור מסוים בארה"ב‪ .‬הקובץ‬
‫כולל את המשתנים הבאים‪:‬‬
‫‪ = price‬מחיר הדירה (באלפי דולרים)‬
‫‪ = bedrooms‬מספר חדרי שינה‬
‫‪ = bathrooms‬מספר חדרי שירותים‬
‫‪ = Otherrooms‬מספר חדרים אחרים‬
‫‪ = age‬גיל הדירה (בשנים)‬
‫‪ = area‬שטח הדירה (‪)meters2‬‬

‫א‪ .‬אמדו את המודל הבא באמצעות קובץ זה‪:‬‬


‫‪(1) price =  0 + 1age +  2bedrooms + 3bathrooms +  4otherrooms + u‬‬
‫ב‪ .‬מהי המשמעות של כל אחד מהמקדמים?‬
‫ג‪ .‬הוסיפו למשוואה משתנה מסביר נוסף‪ area :‬ואמדו את המודל מחדש‪ .‬מה קרה למקדמים‬
‫של מספר חדרי שינה‪ ,‬מספר חדרי שירותים ומספר חדרים אחרים במודל זה בהשוואה‬
‫למקדמים שקיבלתם במודל (‪ ?)1‬למה הם השתנו? הציעו פרשנות למקדם של ‪.area‬‬
‫ד‪ .‬אמדו עכשיו מודל מצומצם יותר הכולל רק את ‪ age‬ו‪ area-‬כמשתנים מסבירים‪ .‬השוו בין ‪R2‬‬
‫שקיבלתם במודל זה ל‪ R2-‬שקיבלתם במודל שבסעיף ג'‪ .‬האם יש הבדל גדול? הסבירו למה‬
‫לדעתכם יש או אין הבדל גדול בין ערכים של ‪ R2‬בשני המודלים‪.‬‬

‫שאלה ‪2‬‬
‫חוקר אמד את המשוואה הבאה המסבירה את מחירי הבתים (באלפי ‪ )₪‬כפונקציה של שטח הדירה‬
‫(‪( )area‬במטר מרובע)‪ ,‬מספר חדרי שינה (‪ )bedrooms‬ומספר חדרי אמבטיה )‪:(bathrooms‬‬

‫א‪ .‬נניח כי בעל דירה מחליט לחלק חדר שינה לשני חדרי שינה‪ .‬מהי העלייה הצפויה במחיר‬
‫הדירה?‬

‫ב‪ .‬נניח כי בעל דירה מחליט להרחיב את שטח הבית ולבנות חדר שינה נוסף בגודל של ‪ 3‬מטר‬
‫מרובע‪ .‬מהי העלייה הצפויה במחיר הדירה?‬

‫‪1‬‬
‫שאלה ‪3‬‬
‫הקובץ ‪ WAGE1‬כולל‪ ,‬בין היתר‪ ,‬את המשתנים הבאים‪( wage :‬שכר לשעה)‪( educ ,‬שנות השכלה)‪,‬‬
‫‪( exper‬שנות ניסיון בשוק העבודה) ו‪( tenure -‬שנות וותק עם המעסיק הנוכחי)‪.‬‬

‫א‪ .‬אמדו את המודל הבא באמצעות קובץ זה‪:‬‬


‫‪(1) ln( wagei ) =  0 + 1educi +  2 exp eri + 3tenurei + ui‬‬
‫הערה‪ :‬צריך להגדיר את המשתנה )‪ln(wage‬‬
‫מהי המשמעות של כל אחד מהמקדמים?‬ ‫ב‪.‬‬
‫מהו פער לוג השכר הצפוי בין פרט עם ‪ 12‬שנות השכלה‪ 20 ,‬שנות ניסיון בשוק‬ ‫ג‪.‬‬
‫העבודה ו‪ 10-‬שנות וותק לבין פרט עם ‪ 12‬שנות השכלה‪ 20 ,‬שנות ניסיון ו‪ 8-‬שנות‬
‫וותק?‬
‫‪2‬‬
‫אמדו את המודל מחדש לאחר הוספת המשתנה ‪ ( exper‬צריך להגדיר את‬ ‫ד‪.‬‬
‫המשתנה) ופרשו מחדש את המקדמים‪.‬‬
‫במודל (‪ )1‬הנחנו כי לוג השכר עולה מונוטונית עם הניסיון‪ .‬האם הדבר נכון גם‬ ‫ה‪.‬‬
‫למודל שניסחתם בסעיף ד'? איך נראה הקשר בין לוג השכר לבין שנות ניסיון לפי‬
‫מודל זה? אחרי כמה שנות ניסיון מגיע השכר למקסימום עבור רמת השכלה וותק‬
‫נתונה?‬

‫שאלה ‪4‬‬
‫נתונים שלושה מודלים‪:‬‬

‫‪(1) ln( wagei ) =  0 + 1educi +  2 exp eri + ui‬‬


‫‪(2) ln( wagei ) =  0 + 1educi +  i‬‬
‫‪(3) exp eri =  0 + 1educi + i‬‬

‫א‪ .‬אמדו את שלושת המודלים באמצעות הקובץ ‪.wage1‬‬


‫ב‪ .‬האם האומדן ל ‪  1‬שונה מהאומדן שהתקבל ל ‪ ?  1‬אם כן‪ ,‬מדוע?‬

‫ג‪ .‬הראו (על ידי חישוב) את הקשר בין ‪ ˆ1,ˆ1,ˆ1, ˆ2 ,‬והסבירו את התוצאה‪.‬‬

‫ד‪ .‬האם הטענה הבאה נכונה? "אם שנות ההשכלה אינן מתואמות עם הניסיון אז ‪̂1 = ˆ1‬‬

‫‪2‬‬
‫שאלה ‪5‬‬
‫הקובץ ‪ WAGE2‬כולל‪ ,‬בין היתר‪ ,‬את המשתנים הבאים‪:‬‬
‫‪ = wage‬השכר לשעה‬
‫‪Ln(wage) = lwage‬‬
‫‪ = educ‬מספר שנות השכלה‬
‫‪ = age‬גיל‬
‫‪ = IQ‬ציון במבחן ‪IQ‬‬
‫‪ = feduc‬מספר שנות ההשכלה של אב הפרט‬
‫‪ = meduc‬מספר שנות ההשכלה של אם הפרט‬

‫בשאלה זו ננסה לאמוד את התשואה להשכלה על ידי מספר מודלים חלופיים‪.‬‬

‫א‪ .‬מאחר ואין בידנו מידע לגבי מספר שנות ניסיון של כל פרט בשוק העבודה‪ ,‬עליכם להגדיר משתנה‬
‫חדש ‪ ,pexp -‬המבטא קירוב למספר שנות ניסיון של הפרט‪ ,‬בעזרת הנוסחה הבאה‪:‬‬
‫‪pexp=age-educ-6‬‬
‫מה ההיגיון העומד מאחורי ההגדרה הזאת?‬

‫ב‪ .‬הגדירו משתנה נוסף (‪ )pexp2‬המבטא את הניסיון בריבוע‪ pexp2=pexp2 :‬ואמדו את המודל‬
‫הבא‪:‬‬

‫האם יש בעיה באמידת המודל? הסבירו מדוע‪ .‬במידה וישנה בעיה באמידת המודל‪ ,‬הציעו פיתרון‪.‬‬

‫ג‪ .‬אמדו את המודל הבא והציעו פרשנות לאומד ל‪: -‬‬

‫ד‪ .‬הוסיפו למודל (‪ )1‬את המשתנה ‪ IQ‬כמשתנה מסביר ואמדו את המודל‪:‬‬

‫מה קרה לאומד לתשואה להשכלה שבמודל (‪ )2‬בהשוואה לאומד שקיבלתם במודל (‪ ?)1‬הסבירו‬
‫זאת באופן אינטואיטיבי ובעזרת נוסחה‪.‬‬

‫ה‪ .‬הוסיפו למודל שאמדתם בסעיף ד' (מודל ‪ )2‬את המשתנה ‪ feduc‬ואמדו את המודל הבא‪:‬‬

‫מהי המשמעות של המקדם למשתנה ‪ ?feduc‬מדוע לדעתכם המשתנה ‪ feduc‬משפיע על שכר‬


‫הפרט? מה קרה לאומד לתשואה להשכלה במודל (‪ )3‬בהשוואה לאומד שקיבלתם במודל (‪ ?)2‬הציעו‬
‫הסבר לתוצאות‪ .‬מה קרה למקדם של ‪ IQ‬במודל (‪ )3‬בהשוואה למקדם שקיבלתם במודל (‪?)2‬‬

‫‪3‬‬
‫ו‪ .‬הוסיפו למודל (‪ )3‬את המשתנה ‪ meduc‬ואמדו את המודל הבא‪:‬‬

‫האם האומד לתשואה להשכלה השתנה באופן משמעותי בהשוואה לאומד שקיבלתם במודל (‪?)3‬‬
‫‪ -‬בהשוואה לאומד‬ ‫הציעו הסבר לתוצאה‪ .‬מה קרה לאומד לשונות האומד של ‪- feduc‬‬
‫שקיבלתם במודל (‪ ?)3‬הסבירו‪.‬‬

‫ז‪ .‬אם מטרת החוקר הינה לקבל אומד חסר הטיה לתשואה להשכלה‪ ,‬באיזה מודל (מתוך מודלים ‪1-‬‬
‫‪ )4‬הייתם בוחרים? הסבירו מדוע‪.‬‬

‫שאלה ‪6‬‬
‫הניחו כי הפרודוקטיביות של עובד תלויה בשני גורמים‪ :‬מספר שעות הכשרה (‪ )training‬ויכולת העובד‬
‫(‪ )ability‬ומתוארת על ידי המודל הבא המקיים את ההנחות הקלאסיות ‪:1-4‬‬

‫)‪(1‬‬ ‫‪prod =  0 + 1training +  2 ability + ‬‬


‫נתון כי העובדים בעלי יכולת נמוכה קיבלו יותר שעות הכשרה כך שהמתאם בין המשתנים ‪ training‬ו‪-‬‬
‫‪ ability‬הוא שלילי‪.‬‬
‫( המחושב מתוך הרגרסיה הבאה‪:‬‬ ‫מה סביר להניח שתהיה ההטיה של ‪( ̂ 1‬ביחס ל‬

‫‪.‬‬

‫‪4‬‬

You might also like