You are on page 1of 8

‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫תרגיל מסכם ב‪ :SPSS -‬רפואה שנה א'‬


‫לפניך קובץ נתונים של מחקר שבדק את הקשר בין מחלת לב לגורמי סיכון שונים ומשתני רקע‪ .‬המחקר כלל ‪168‬משתתפים‪.‬‬
‫קליטת הנחקרים התבצעה ב ‪ 1990‬והנחקרים היו במעקב לתקופה מקסימאלית של ‪ 10‬שנים או עד להופעת מחלת לב‪ .‬נמדדו‬
‫גורמי סיכון כמו סוכרת‪ ,‬יתר לחץ דם והרגלי עישון‪ ,‬כמו גם פעילות גופנית והערכה עצמית של איכות חיים הקשורה‬
‫לבריאות‪ .‬יש למלא את המטלות שלהלן ולכתוב על הדפים את התשובות לשאלות המבוקשות‪.‬‬
‫רשימת המשתנים במחקר‪:‬‬
‫קודים‬ ‫שם המשתנה משתנה‬
‫בקובץ‬
‫מספר רץ מ‪ 1-‬עד ‪168‬‬ ‫מספר סקר‬ ‫‪num‬‬
‫‪ .1‬כן‬ ‫מחלת לב‬ ‫‪heartdis‬‬
‫‪ .0‬לא‬
‫זכר‬ ‫‪.1‬‬ ‫מגדר )מין(‬ ‫‪gender‬‬
‫נקבה‬ ‫‪.2‬‬
‫תאריך במבנה של ‪ 2‬עמודות ליום‪ 2 ,‬לחודש ו‪4-‬‬ ‫תאריך לידה‬ ‫‪birth_date‬‬
‫עמודות לשנה‬
‫תאריך במבנה של ‪ 2‬עמודות ליום‪ 2 ,‬לחודש ו‪4-‬‬ ‫תאריך קליטה למחקר‬ ‫‪date‬‬
‫עמודות לשנה‬
‫גובה בס"מ‬ ‫גובה‬ ‫‪height‬‬
‫משקל בק"ג‬ ‫משקל‬ ‫‪weight‬‬
‫משקל בק"ג‬ ‫משקל לאחר ‪ 5‬שנות מעקב‬ ‫‪weight2‬‬
‫ישראל‬ ‫‪.1‬‬ ‫ארץ לידה‬ ‫‪country‬‬
‫אחר‬ ‫‪.2‬‬
‫לא רלבנטי ילידי ישראל‬ ‫‪.0‬‬ ‫שנת עליה לישראל‬ ‫‪aliya‬‬
‫שנה עבור ילידי חו"ל‬
‫מספר שנות לימוד‬ ‫השכלה‬ ‫‪educat‬‬
‫נשוי‪/‬אה‬ ‫‪.1‬‬ ‫מצב משפחתי‬ ‫‪familyst‬‬
‫בודד‪/‬ה )רווק‪/‬אלמן‪/‬ה‪ ,‬גרוש‪/‬ה(‬ ‫‪.2‬‬
‫ציון הנע בין ‪ 0‬ל‪ ,100 -‬כאשר ‪ 0‬מציין ללא פעילות בכלל ו‪100-‬‬ ‫פעילות גופנית‬ ‫‪exercise‬‬
‫מציין פעילות גופנית מצוינת לגיל ומין הנחקר‪.‬‬
‫ערך של ‪ total‬כולסטרול‬ ‫כולסטרול‬ ‫‪choles‬‬
‫כן‬ ‫‪.1‬‬ ‫יתר לחץ דם‬ ‫‪hbp‬‬
‫‪ .0‬לא‬
‫כן‬ ‫‪.1‬‬ ‫סוכרת‬ ‫‪diabetes‬‬
‫‪ .0‬לא‬
‫כן‬ ‫‪.1‬‬ ‫היסטוריה משפחתית של מחלת לב‬ ‫‪fam_his‬‬
‫‪ .0‬לא‬
‫כן‬ ‫‪.1‬‬ ‫אורח חיים מתוח‬ ‫‪stress‬‬
‫‪ .0‬לא‬
‫נמוכה‬ ‫‪.0‬‬ ‫רמת חשיפה לעישון )הוגדר לפי‬ ‫‪smoke‬‬
‫בינונית‬ ‫‪.1‬‬ ‫משך העישון וכמות הסיגריות(‬
‫גבוהה‬ ‫‪.2‬‬
‫ערך של טריגליצרידים‬ ‫טריגליצרידים‬ ‫‪tgl‬‬
‫ציון הנע בין ‪) 0‬איכות חיים גרועה( ל ‪) 100‬איכות חיים מעולה(‪.‬‬ ‫איכות חיים‬ ‫‪qol36‬‬
‫מתוך שאלון ‪ SF36‬האומד איכות חיים הקשורה לבריאות‪.‬‬
‫מספר שנים במעקב או עד להופעת מחלת לב‬ ‫זמן במעקב‬ ‫‪follow_up‬‬
‫דרום‬ ‫‪.1‬‬ ‫איזור מגורי הנבדק בארץ‬ ‫‪region‬‬
‫מרכז‬ ‫‪.2‬‬
‫צפון‬ ‫‪.3‬‬
‫‪1‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .1‬בקובץ הנתונים שלפניך המשתנים אינם מוגדרים על פי סוגם וכן מספר התווים עבור כל משתנה אינו נכון‪.‬‬
‫נא להגדיר בצורה נכונה את סוגי המשתנים ואת מספר התווים לפני ואחרי הנקודה העשרונית של המשתנים שלהלן‪:‬‬
‫מחלת לב‪ ,‬מגדר )מין(‪ ,‬כולסטרול‪ ,‬רמת חשיפה לעישון והזמן במעקב‪.‬‬
‫נא להוסיף תוויות לערכי המשתנה )‪ (Value labels‬למשתנים המתאימים מתוך המשתנים הנ"ל‪.‬‬

‫‪ .2‬במהלך ניקוי קובץ הנתונים נמצא ערך שגוי של ‪ 2204‬במשתנה טריגליצרידים )‪ .(tgl‬לא ניתן היה לשחזר את הערך הנכון‬
‫והוחלט להשאירו בקובץ אך לנטרל את השפעתו על תוצאות עיבוד הנתונים‪.‬‬

‫א‪ .‬נא לאתר את הערך השגוי ולנטרל את השפעתו על תוצאות עיבוד הנתונים מבלי למחוק אותו מקובץ הנתונים‪.‬‬
‫ב‪ .‬הערך השגוי שייך למספר סקר‪___________70___:‬‬
‫ב‪ .‬מדוע לדעתך יש לנטרל את השפעתו של ערך זה על תוצאות עיבוד הנתונים?‬

‫_____הערך משפיע על תוצאות של מבחנים סטטיסטיים והוא אינו נכון‪ .‬לכן יכול להביא למסקנות מוטעות‪.‬‬
‫_________________________________________________________________‬

‫______________________________________________________________________‬

‫‪ .3‬נא לחשב את גיל הנחקרים בשנים בעת קליטתם למחקר‪ .‬נא להציג טבלת שכיחויות של המשתנים מין ‪ ,((gender‬רמת‬
‫חשיפה לעישון וגיל‪ ,‬יחד עם מדדי מרכז ופיזור המתאימים ביותר )מדד מרכז אחד ומדד פיזור אחד עבור כל משתנה(‪.‬‬

‫‪(Transform – compute - XDATE.YEAR(date)-XDATE.YEAR(birth_date‬‬

‫מדד הפיזור וערכו‬ ‫מדד המרכז וערכו‬ ‫משתנה‬


‫אין‬ ‫שכיח‪) 1 -‬זכר(‬ ‫מין‬
‫טווח‪2-‬‬ ‫חציון ‪1-‬‬ ‫רמת חשיפה לעישון‬
‫סטיית תקן‪9.572 -‬‬ ‫ממוצע – ‪67.45‬‬ ‫גיל‬

‫‪ .4‬החוקרים רצו ליצור משתנה חדש של "ציון חומרת המחלה" הבנוי מסכום אריתמטי של גורמי הסיכון הבאים‪ :‬יתר לחץ דם‪,‬‬
‫סוכרת‪ ,‬היסטוריה משפחתית של מחלת לב ואורח חיים מתוח‪.‬‬

‫א‪ .‬נא ליצור את המשתנה החדש‪.‬‬


‫ב‪ .‬נא להציג את השכיחויות של המשתנה החדש יחד עם הגרף המתאים ביותר‪.‬‬

‫‪ .3‬כמותי‬ ‫‪ .2‬סודר‬ ‫כי לדעתי המשתנה הוא‪ .1 :‬איכותי‬ ‫הצגתי גרף‪ .1 :‬עוגה ‪ .2‬עמודות ‪ .3‬היסטוגרמה‬

‫‪2‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .5‬נא לבדוק האם יש קשר בין משתני הרקע‪ :‬מצב משפחתי‪ ,‬ארץ לידה‪ ,‬רמת חשיפה לעישון והשכלה לבין מחלת לב‪ .‬נא לציין‬
‫בטבלה שבהמשך את הסטטיסטי וערכו ואת הערך של ‪.p‬‬

‫האם ההבדל מובהק ברמת מובהקות‬ ‫‪p value‬‬ ‫הסטטיסטי וערכו‬ ‫משתנה‬
‫של ‪) =0.05‬כן‪/‬לא(‬
‫מצב משפחתי‬
‫ארץ לידה‬
‫השכלה‬
‫רמת חשיפה לעישון‬
‫איזור מגורים‬

‫על סמך העיבוד שבוצע בשאלה ‪ 5‬נא לענות על השאלות הבאות‪:‬‬

‫א‪ .‬מה אחוז הבודדים )רווק‪/‬אלמן‪/‬גרוש( בקרב קבוצת החולים במחלת לב ומה האחוז בקבוצת אלה שאינם חולים?‬

‫___________________________________________________________________________‬

‫ב‪ .‬מה הממוצע וסטיית התקן של מספר שנות לימוד )השכלה( בקבוצת החולים ובקבוצת אלה שאינם חולים?‬

‫____________________________________________________________________________‬

‫ג‪ .‬נא לכתוב מסקנה מילולית לשאלה האם יש קשר בין רמת חשיפה לעישון לבין מחלת לב‪________________ :‬‬

‫_____________________________________________________________________________‬

‫_____________________________________________________________________________‬

‫‪3‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .6‬נא לבדוק האם קיים קשר בין גורמי הסיכון שבטבלה לבין מחלת לב‪ ,‬רק בקבוצת הסוכרתיים )‪ ,(diabetes = 1‬בגברים‬
‫ובנשים בנפרד‪.‬‬

‫גברים‪:‬‬

‫האם ההבדל מובהק ברמת‬ ‫‪p value‬‬ ‫הסטטיסטי וערכו‬ ‫גורם סיכון‬

‫מובהקות של ‪) =0.01‬כן‪/‬לא(‬
‫פעילות גופנית‬
‫יתר לחץ דם‬
‫טריגליצרידים‬

‫נשים‪:‬‬

‫האם ההבדל מובהק ברמת‬ ‫‪p value‬‬ ‫הסטטיסטי וערכו‬ ‫גורם סיכון‬

‫מובהקות של ‪) =0.01‬כן‪/‬לא(‬
‫פעילות גופנית‬
‫יתר לחץ דם‬
‫טריגליצרידים‬

‫נא לכתוב מסקנה מילולית האם יש קשר בין פעילות גופנית ומחלת לב לפי מין הנחקרים‪__________________ :‬‬

‫_____________________________________________________________________________‬

‫_____________________________________________________________________________‬

‫‪4‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .7‬נא לבדוק האם קיים מתאם )קורלאציה( ליניארי בין משקל לגובה ובין כולסטרול לפעילות גופנית‪.‬‬

‫א‪ .‬נא להציג את הגרף המדגים את המתאם של המשתנים יחד עם קו הרגרסיה ו ‪.r2‬‬

‫ב‪ .‬על סמך התוצאות נא למלא את הטבלה הבאה‪:‬‬

‫האם המתאם מובהק ברמת‬ ‫‪p value‬‬ ‫מקדם המתאם וערכו‬ ‫מתאם בין המשתנים‪:‬‬
‫מובהקות של ‪) =0.05‬כן‪/‬לא(‬
‫משקל וגובה‬
‫כולסטרול ופעילות גופנית‬

‫ג‪ .‬האם לדעתך הקשר שנמצא בין רמת כולסטרול לפעילות גופנית הוא קשר ליניארי ישר או הפוך ומה משמעותו?‬

‫_______________________________________________________________________‬

‫ד‪ .‬נא לכתוב את המשמעות של הערך של ‪ r2‬שהתקבל עבור המתאם שבין רמת כולסטרול לבין פעילות גופנית‪:‬‬

‫_______________________________________________________________________‬

‫_______________________________________________________________________‬

‫‪ .8‬מחקרים הראו שיש קשר הדוק בין איכות חיים )‪ (QOL36‬לבין רמת הפעילות הגופנית‪:‬‬
‫א‪ .‬בדוק‪/‬י טענה זו‪ ,‬ונמק האם לדעתך הקשר הוא לינארי‪ ,‬או לא‪-‬לינארי‪.‬‬
‫_______________________________________________________________________‬

‫_______________________________________________________________________‬

‫‪ .9‬אחד החוקרים גרס שיש לבדוק את נושא הקשר בין איכות חיים לרמת פעילות גופנית‪ ,‬לאחר קיבוץ לקבוצות – הוא הגדיר‬
‫כי איכות חיים תתחלק ל ‪ 4‬קבוצות )‪ 41-60 ,16-40 ,0-15‬ו ‪ 61‬ומעלה(‪ ,‬וכי רמת הפעילות הגופנית תחולק ל ‪ 3‬קבוצות )עד‬
‫‪ ,34-66 ,33‬ו ‪ 67‬ומעלה(‪ .‬לאחר מכן הוא החליט לבדוק את הקשר בין שני המשתנים הנ"ל‪.‬‬
‫באיזה מבחן תעשה‪/‬י שימוש?‬ ‫‪.1‬‬
‫_______________________________________________________________________‬

‫אם נרצה לבדוק את נושא הקשר בין איכות חיים לאיזור המגורים בארץ‪ .‬באיזה מבחן תעשה‪/‬י שימוש?‬ ‫‪.2‬‬
‫_______________________________________________________________________‬

‫האם במבחן זה ההבדלים מובהקים סטטיסטית )יש לציין את הסטטיסטי וערכו ואת הערך של )‪? p‬‬ ‫‪.3‬‬
‫______________________________________________________________________‬

‫‪5‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .10‬הנחקרים היו במעקב למשך תקופה מקסימאלית של ‪ 10‬שנים או עד להופעת מחלת לב‪ .‬לאחר ‪ 5‬שנות מעקב נשקלו‬
‫הנחקרים פעם נוספת‪.‬‬
‫א‪ .‬נא לבדוק האם יש הבדלים במשקלי הנחקרים בעת הקליטה למחקר ולאחר ‪ 5‬שנים‪.‬‬
‫ב‪ .‬האם נמצאו הבדלים מובהקים סטטיסטית )יש לציין את הסטטיסטי וערכו ואת הערך של )‪? p‬‬
‫_____________________________________________________________________‬

‫_______________________________________________________________________‬

‫ג‪ .‬נא לנסח מסקנה מילולית על סמך התוצאות שהתקבלו‪_________________________________ :‬‬

‫_______________________________________________________________________‬

‫ד‪ .‬מה מספר הנחקרים שנכללו בעיבוד זה‪ ______________:‬מה הסיבה לדעתך למספר זה? ____________‬

‫__________________________________________________________________________‬

‫ה‪ .‬אחד החוקרים גרס כי עיקר ההבדל הנ"ל נובע משוני במשקלי הנשים‪ .‬אי לכך‪ ,‬הוא החליט לבדוק רק בקרב נשים האם‬
‫יש הבדל בין משקלן בעת עריכת המחקר ו ‪ 5‬שנים אח"כ‪.‬‬
‫‪ (I‬באיזה מבחן תעשה‪/‬י שימוש?‬
‫_______________________________________________________________________‬

‫‪ (II‬האם נמצאו הבדלים מובהקים סטטיסטית )יש לציין את הסטטיסטי וערכו ואת הערך של )‪? p‬‬
‫_____________________________________________________________________‬

‫_______________________________________________________________________‬

‫‪ .11‬אחד החוקרים טען שאין משמעות קלינית להשוואה של ממוצעי רמות כולסטרול ושיש להשוות את אלה עם רמת‬
‫כולסטרול גבוהה )< ‪ ( 220‬לאלה עם רמה נורמאלית )> ‪.(220‬‬

‫א‪ .‬נא להשוות את רמת הכולסטרול )גבוהה‪/‬נורמאלית( בקרב אלה עם וללא מחלת לב‪.‬‬

‫ב‪ .‬האם נמצאו הבדלים מובהקים סטטיסטית )יש לציין את הסטטיסטי וערכו ואת הערך של )‪? p‬‬

‫_______________________________________________________________________‬

‫_______________________________________________________________________‬

‫ג‪ .‬נא לכתוב מסקנה מילולית לבדיקת הקשר שבין רמת כולסטרול למחלת לב‪__________________ :‬‬

‫______________________________________________________________________‬

‫______________________________________________________________________‬

‫‪6‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .12‬אחד החוקרים הציע לבדוק האם יש קשר בין חשיפה לעישון לבין הכולסטרול )ערך של ‪ total‬כולסטרול(‪ ,‬ובין איזור‬
‫המגורים לבין הכולסטרול‪.‬‬

‫נא לבצע את הבדיקה בדרך המתאימה ביותר ולענות על השאלות הבאות‪:‬‬

‫א‪ .‬האם יש קשר מובהק מבחינה סטטיסטית בין עישון ורמת כולסטרול )יש לציין את הסטטיסטי‪ ,‬ערכו וה ‪ ,(p value‬ובין‬
‫איזור המגורים לכולסטרול?‬

‫_______________________________________________________________________‬

‫ב‪ .‬בין אילו קבוצות השוואה של חשיפה לעישון יש הבדלים מובהקים סטטיסטית )ברמת מובהקות של ‪ (=0.05‬ברמות‬
‫הכולסטרול?‬

‫______________________________________________________________________‬

‫______________________________________________________________________‬

‫ג‪ .‬כתוב מסקנה מילולית לשאלה המחקרית שנבדקה ובסס את תשובתך על החלק האנליטי והתיאורי שבעיבוד‪.‬‬

‫______________________________________________________________________‬

‫______________________________________________________________________‬

‫ד‪ .‬האם יש קשר מובהק מבחינה סטטיסטית בין עישון ורמת כולסטרול בקרב אלה שהיו במחקר כמעט עד לתום המעקב )‪9‬‬
‫שנים ומעלה(? )יש לציין את הסטטיסטי‪ ,‬ערכו וה ‪ (p value‬באיזה מבחן השתמשת ? נמק מדוע בחרת במבחן סטטיסטי‬
‫זה‪.‬‬

‫______________________________________________________________________‬

‫______________________________________________________________________‬

‫‪7‬‬
‫ד"ר עמליה לוי וד"ר צבי פרי‬ ‫רפואה שנה א'‬ ‫ביוסטטיסטיקה ו ‪SPSS‬‬

‫‪ .13‬חוקר ביקש ליצור שלושה מודלים לניבוי איכות חיים הקשורה לבריאות )‪ .(qol36‬מודל אחד לפי הערך של‬
‫הכולסטרול‪ ,‬השני לפי המשקל בקליטה למחקר והשלישי לפי מספר שנות לימוד‪.‬‬

‫נא ליצור את שלושת המודלים ועל סמך התוצאות לענות על השאלות הבאות‪:‬‬

‫איזה מן המודלים מובהק? מהו ה ‪?p value‬‬ ‫‪.1‬‬

‫________________________________________________________________‬

‫מהו ערכי ה ‪ ?B‬מהו ערכי ה ‪ β‬של המודלים? האם יש הבדלים ביניהם? אם כן מדוע?‬ ‫‪.2‬‬

‫________________________________________________________________‬

‫________________________________________________________________‬

‫על סמך תוצאות המודלים השונים מהו המשתנה המנבא החשוב ביותר ? על אילו ערכים מתבססת תשובתך?‬ ‫‪.3‬‬

‫_________________________________________________________________‬

‫מה רמת איכות החיים כאשר רמת הכולסטרול שווה ל ‪: 0‬‬ ‫‪.4‬‬

‫__________________________________________________________________‬

‫על פי מודל הניבוי מה תהייה רמת איכות החיים של אדם שרמת הכולסטרול שלו שווה ל ‪:85‬‬ ‫‪.5‬‬

‫_________________________________________________________________‬

‫‪8‬‬

You might also like