‫מבחנים פסיכולוגיים‬

‫יחידה ‪1‬‬
‫גלטון‪ :‬החלוץ במבחנים פסיכולוגיים‪ .‬פיתח שיטות סטטיסטיות לעיבוד נתונים לגבי שונות‬
‫בין אישית‪ .‬קאטל‪ :‬הראשון שדיבר על מבחן שכלי‪ .‬פיתח מבחנים למיון סטודנטים‬
‫שהתבססו על ההנחה כי ניתן להסיק על האינטלקט באמצעות מדדי הבחנה חישתית וזמן‬
‫תגובה‪.‬‬
‫ביקורת על שניהם‪ :‬בינה טען שיש למדוד תפקודים מורכבים יותר‪ .‬היה הראשון שהתיחס‬
‫ליכולת השכלית כקשורה לגיל‪.‬‬
‫סוגי מבחנים‪:‬‬
‫‪.1‬‬

‫מבחנים יחידניים‪ :‬בוחן אחד ונבדק אחד‪ .‬ניתן להתאים את תהליך המבחן לנבחן‪.‬‬
‫יתרון‪ :‬מספק מידע איכותי ועשיר על כל נבדק‪ .‬חסרון‪ :‬בעיה בתקנון ובאוביקטיביות‪ .‬תנאי‬
‫בחינה לא אחידים פגיעה ברמת הסטנדרטיזציה‪ ,‬אין אחידות בהעברה‪ .‬קשר עם הבוחן‪,‬‬
‫פוגע ברמת האוביקטיביות‪ ,‬ובסטנדרטיזציה‪ ,‬אך בוחן מיומן יכול להשתמש בקשר כמידע‬
‫איכותי‪.‬‬

‫‪.2‬‬

‫מבחנים קבוצתיים‪ :‬בוחן מול קב'‪ ,‬אין התאמה לכל נבחן‪ .‬מדגמים גדולים בזמן‬
‫התקנון‪ ,‬לרוב שאלות סגורות‪ ,‬מקל על הבדיקה‪ .‬מבססים פרשנות על נורמות יציבות יותר‪,‬‬
‫מהימן‪ .‬חסכון במשאבים‪ ,‬בוחן לא צריך להיות מיומן‪ .‬חסרונות‪ :‬איבוד מידע איכותי לגבי‬
‫הנבדק‪ .‬אין יכולת להבין אסטרטגית חשיבה‪ ,‬תהליכים שונים‪ ,‬מצב ריגשי במהלך הבחינה‪.‬‬
‫חוסר גמישות בהעברה‪ ,‬אין התאמה לאוכ' מסוימות‪ .‬על הנבדק להתמודד עם הוראות‬
‫העברה לבד‪ ,‬לא תמיד הבנת הנקרא משקפת הצלחה בקריטירון‪ .‬יוצר בעיות תוקף‪.‬‬

‫‪.3‬‬

‫מבחני כושר ‪ -‬מודדים יכולת מסויימת‪ .‬מערכת מבחני כושר מודדת מקבץ יכולות‬
‫ונותנת פרופיל ציונים המורכב מציון יחיד לכל יכולת‬

‫‪.4‬‬

‫מבחני משכל ‪ -‬מודדים את היכולת האינטלקטואלית‪ .‬מדובר במבחנים הטרוגנים‬
‫שנותנים ציון בודד‪.‬‬

‫‪.5‬‬

‫מבחני הישג‪/‬שליטה ‪ -‬מודדים את רמת הידע שרכש הנבחן כתוצאה מהוראה מכוונת‪.‬‬

‫‪.6‬‬

‫מבחני אישיות ‪ -‬בודקים את ההיבטים הריגשיים‪ ,‬הלא‪-‬אינטלקטואלים של ההתנהגות‪.‬‬
‫סוגי נפוצים של מבחני אישיות הם השאלונים לדיווח עצמי ושיטות ההשלכה‪.‬‬
‫שימושים נפוצים‪:‬‬
‫‪ .1‬במערכת החינוך‪ ,‬סיווג תלמידים למגמות לימוד‪ ,‬איתור מפגרים ומחוננים‪ ,‬ייעוץ‬
‫חינוכי‪.‬‬
‫‪ .2‬בתעשיה ובצבא‪ .‬ברירה ומיון כוח אדם‪.‬‬
‫‪ .3‬איבחון הפרעות נפשיות‪ ,‬עבריינות וסוגים אחרים של סטיות התנהגות‪.‬‬
‫‪ .4‬ייעוץ פסיכולוגי‬

‫‪ .5‬מחקר‬
‫יחידה ‪ – 2‬מהות המבחנים הפסיכולוגיים‬
‫מבחן פסיכולוגי הוא מדידת אובייקטיבית ומתוקננת של מדגם התנהגות‪ .‬מדגם התנהגות‪,‬‬
‫משמע‪ ,‬כי דוגמים רק חלק מההתנהגות בתחום מסוים‪ .‬סוג הפריטים ומספרם קובע אם‬
‫המבחן דוגם כראוי את ההתנהגות הנדונה‪.‬‬
‫הבדיקה הפסיכולוגית נועדה לאבחן התנהגות בהווה‪ ,‬ולחזות התנהגות אחרת או התנהגות‬
‫עתידית‪.‬‬
‫תקנון‪ (1 :‬פיתוח ויישום נהלי העברה‪ ,‬נקידה ופרושים אחידים של המבחן‪ (2 .‬פרוש‬
‫הציונים יחסית לציוני מדגם מסוים‪ .‬לשם כך משתמשים במדגם תקנון שמהישגיו גוזרים‬
‫נורמות שמגדירות למשל את הביצוע הממוצע‪ ,‬ציון שכיח‪ ,‬סטית תקן וכו'‪ .‬כך ניתן להעריך‬
‫דרגות שונות של הצטיינות או נחיתות‪ .‬צריך שהמדגם תקנון ייצג את האוכלוסיה בה רוצים‬
‫להשתמש במבחן‪.‬‬
‫המונח אובייקטיביות קשור למספר תחומים‪:‬‬
‫‪ (1‬אוביקטיביות באופן העברת המבחן‪ ,‬ניקודו ופרושו‪ .‬היבט זה קשור לתקנון המבחן והוא‬
‫מתקיים כל עוד אין תלות בשיפוטו הסוביקטיבי של בוחן מסוים‪ .‬אוביקטיביות במובן זה‪,‬‬
‫פרושה שאותו נבדק יקבל אותם ציונים מבוחנים שונים‪ ,‬או מאותו בוחן בזמנים שונים‪.‬‬
‫‪ (2‬אובייקטיביות מבחינת אופן ברירת הפריטים למבחן‪ .‬פריטי המבחן צריכים להיבחר‬
‫באובייקטיביות באמצעות שיטה אמפירית‪ ,‬ולא באופן שרירותי‪.‬‬
‫טיבו של מבחן פסיכולוגי נמדד על ידי שני מדדים‪ .1 :‬מהימנות‪ :‬המידה בה ציוניהם‬
‫של נבחנים במבחן מסוים עקיבים‪/‬יציבים בזמנים שונים או בנוסחים מקבילים‪ .2 .‬תוקף‪:‬‬
‫המידה בה המבחן מודד את התכונה שהוא אמור למדוד‪ .‬מבחן תקף הוא מבחן הממלא את‬
‫ייעודו‪.‬‬
‫פיקוח על השימוש במבחנים פסיכולוגים‪ :‬ישנם משתנים רבים שיכולים להשפיע על‬
‫טיב המבחן ועל טיב השימוש הנעשה בתוצאותיו‪ ,‬לכן יש לפקח על השימוש במבחנים אלה‪.‬‬
‫‪ (1‬יש חשיבות להיות הבוחן מוסמך‪ ,‬כך הוא יכול להתאים את המבחן למטרה‬
‫ולאוכלוסיה הנבחנת‪ .‬הוא ישמור על סטנדרטיזציה גבוהה כך שיהיה אפשר להשוות את‬
‫התוצאות המתקבלות לנורמות‪ .‬כן‪ ,‬לפרוש התוצאות חשוב שהבוחן יהיה בעל הבנה‬
‫מעמיקה בתחום הנמדד‪ ,‬ואם הבוחן לא מתאים‪ ,‬יש חשש שהמבחן לא יענה על ייעודו‪,‬‬
‫ושהמסקנות הנגזרות ממנו יגרמו נזק לנבחנים‪.‬‬
‫‪ (2‬יש להגן על תוכן המבחן לבל יופץ לציבור הרחב‪ ,‬כי זה עלול לפגוע בתוקף המבחן‪.‬‬
‫אם הכרת המבחן גורמת לנבחן לקבל ציון גבוה‪ ,‬מבלי שהציון משקף נאמנה את יכולתו‪,‬‬
‫אז המבחן לא מודד את ההתנהגות שלשמה נוצר‪ ,‬ותוקפו ייפגע‪ .‬מנגד‪ ,‬מסירת מידע על‬

‫המבחן יכול לעזור‪ ,‬להסרת מעטה המסתורין האופף את הבחינה והפרכת אי הבנות‬
‫שכיחות בנוגע למטרותיו ולמשמעות ציוניו‪ ,‬או אפילו‪ ,‬לצורך הפחתת חרדת הנבחנים‪.‬‬
‫העברת המבחן‪:‬‬
‫‪.1‬‬

‫הבוחן צריך לדעת מראש את הנהלים‪ .‬עליו להשקיע מחשבה לחיזוי מצבי חרום‬

‫ולמניעתם‪.‬‬
‫‪.2‬‬

‫יש להכין את סביבת הבחינה‪ ,‬חדר מתאים‪ ,‬ארגונו‪ ,‬למנוע הפרעות וכו'‪.‬‬

‫‪.3‬‬

‫על הבוחן להקדיש מאמץ ליצור זיקה בינו לנבחן ולהביאו לשת"פ מקסימלי‪.‬‬

‫משתנים נוספים המשפיעים על ביצועי הנבחן – ככלל‪ ,‬ההשפעות המתוארות למטה‪,‬‬
‫רלבנטיות יותר בנוכחות גירויים בלתי מובנים‪ ,‬ואצל ילדים או אנשים עם הפרעות נפשיות או‬
‫חסרי בטחון‪.‬‬
‫משתנים הקשורים בבוחן‪ (1 :‬הבוחן יכול להשפיע על התוצאות באופן בלתי מודע‬
‫באמצעות הציפיות שלו‪.‬‬
‫‪ (2‬עלולה להתרחש אינטראקציה בין תכונות אופי של הבוחן לתכונות אופי של הנבדק‪.‬‬
‫‪ (3‬יכולה להיות להתנהגות הבוחן )למשל "חם"‪",‬קר"( השפעה על ביצועי הנבדק‪.‬‬
‫חרדה ממבחנים‪ :‬חרדה בינונית תורמת לביצוע‪ ,‬אך חרדה גבוהה מדי מזיקה ולכן‬
‫יש צורך להפחית חרדה אצל נבחנים חרדים במיוחד‪ .‬חלק מהשיטות ליצירת זיקה בין בוחן‬
‫לנבחן משמשות גם כמפחיתות חרדה אך יש לתת את הדעת לכך שהתנהגותו של הבוחן‬
‫עלולה "להכניס את הנבדק ללחץ"‪ .‬הוראות המופנות לאגו הנבחן יש השפעה חיובית אצל‬
‫אנשים שאינם חרדים‪ ,‬ולחרדים זה יכול לפגוע‪ .‬טיפול באמצעות מערך משולב המנסה‬
‫לסלק את הרגשנות ולשפר את מיומנויות הלמידה במקביל‪ ,‬ועליו להיות מותאם אישית אל‬
‫הנבדק‪.‬‬
‫תרגול‪ :‬ניתן לחלק את השפעות התרגול ל‪:3 -‬‬
‫‪ .1‬אימון ‪ -‬מדובר בהתנסות נמרצת ומרוכזת בפריטים דומים לפריטי המבחן‪ .‬במקרים‬
‫כאלו יש סיכוי נמוך ביותר שהשיפור שמתקבל במבחן יחול גם על הביצוע בקריטריון‪.‬‬
‫לפיכך אימון כזה פוגע בתוקף המבחן משום שהוא לא חל על התכונה הנמדדת‪ .‬ניתן‬
‫לנסות ולהתגבר על תופעה זו באמצעות שמירת חיסיון המבחן או הכללת פריטים‬
‫שהינם עמידים בפני השפעות אימון‪.‬‬
‫‪ .2‬התנסות במבחנים ‪ -‬המחקר מוכיח שלהתנסות במבחנים יש השפעה חיובית על‬
‫הביצוע במבחנים‪ .‬יתרונם של המנוסים נובע מכך שהתגברו על תחושת הזרות‬
‫שמעוררים המבחנים ופיתחו ביטחון עצמי ויחס חיובי כלפי המבחן‪ ,‬וגם מכך שקיים דמיון‬
‫מסויים בין מבחן אחד למשנהו‪ .‬גם במקרה זה מדובר על משתנה שפוגע בתוקף‬
‫המבחן‪.‬‬

‬יש לשמור על אנונימיות‬ ‫הנבדק ככל הניתן ולאפשר לו בכל עת לסרב להשתתף בבחינה‪.‬דרושה התמחות פסיכו' מועטה‪.‬כשמוסרים‬ ‫לפרט את תוצאות מבחניו יש להתחשב במעורבותו הריגשית ולהציע לו שירותי יעוץ‪ .‬עליהם לדאוג שהמבחנים לא יופצו בטרם נבדקו‬ ‫היטב‪ .‬נקידתו ופירושו וכן‬ ‫נתונים לגבי מהימנות ותוקף‪ (4 .‬ההנחה היא שמיומנויות כאלו‬ ‫ישפיעו גם על הביצוע במבחן וגם על הביצוע בקריטריון ולכן מדובר בגורם רלבנטי‬ ‫שאינו פוגע בתוקף‪.‬הם בקיאים בנושאים טכניים‬ ‫שקשורים למבחן‪ .‬אלא בליווי הסברים‬ ‫נאותים‪ .‬עלול‬ ‫לגרום להתנגדות בקרב הנבחנים‪ .‬כמו נורמות‪ .‬‬ ‫בחינת מיעוטים תרבותיים‪ :‬יש לתת את הדעת לכך שתוכן המבחן עלול להשפיע על‬ ‫הביצוע בדרכים שאינן קשורות לתכונה הנמדדת‪ .‬לבוחנים מנוסים יש יכולת‬ ‫לבחור במבחן המתאים למטרה ולאוכ' המיועדת להיבחן‪ .‬‬ ‫היא על מנת להגן על הנבחן מפני שימוש לא הולם במבחנים‪ .‬תוקף‪ .‬‬ ‫מסירת תוצאות המבחנים‪ :‬אין למסור את המידע באורח שיגרתי‪ .‬ויכולים להעריך אותו הערכה ביקורתית‪.‬יש לעדכן את המבחנים מפעם לפעם באופן שימנע את‬ ‫התיישנותם‪.3‬הקניית מיומנויות קוגניטיביות ‪ -‬מדובר בלמידת שיטות שיש להן שימושים רבים‬ ‫ונרחבים כמו אסטרטגיות לפתרון בעיות והרגלי עבודה‪ .‬אם‬ ‫מעריכים שעלולה להיגרם לו הפרעה ריגשית‪.2‬‬ ‫הסמכה מדעת ‪ -‬יש לומר לנבחן מהי מטרת המבחן‪ .‬אילו נתונים מבוקשים בו ואיזה‬ ‫שימוש יעשה בנתונים אלה )כל זאת מבלי לפגוע בתוקף(‪ .‬‬ ‫הגנת הפרטיות‪ .‬מהימנות‪ .‬‬ ‫מסקנותיהם והמלצותיהם מתבססות על הבנה מעמיקה בתחום ועל שיקולים רלבנטיים‬ ‫לגבי הנבחן‪ .‬‬ ‫יחידה ‪ – 3‬שיקולים אתיים וחברתיים‬ ‫כשירות מקצועית‪ :‬הדרישה לכך שמבחנים פסיכולוגיים יועברו רק ע"י בוחנים מיומנים‪.‬‬ ‫אחריותם של מפרסמי המבחנים‪:‬‬ ‫‪ (1‬עליהם לדאוג שרק אנשים בעלי הכשרה‬ ‫מתאימה יורשו לרכוש את המבחן‪ (2 .‬שני מושגי מפתח‪:‬‬ ‫‪.1‬‬ ‫רלבנטיות ‪ -‬המידע שהיחיד מתבקש לחשוף צריך להיות רלבנטי למטרה המוצהרת‬ ‫של הבחינה‪ .‬שימוש בסטריאוטיפים‪ .‬למשל‪ .‫‪ .‬אם יש תיאורים מילוליים שאינם מוכרים לבני התרבות‬ .‬במבחני‬ ‫הישג או מיומנות‪ .‬במבחני אישיות דרושה הכשרה מרוכזת ונסיון בעבודה תחת פיקוח‪ .‬‬ ‫בנוסף‪ .‬יש להסביר לנבחן שהוא עלול לחשוף מידע חבוי מבלי משים‪.‬‬ ‫‪.‬להעדיף תיאורים פשוטים ואיכותיים על פני תיאורים כמותיים מבלבלים‪ .‬הם רגישים לתנאים הרבים שעלולים להשפיע על ביצועי הנבחן וכמו כן‪.‬חובה על‬ ‫המפרסמים לצרף לכל מבחן נתונים רלבנטים לגבי דרך העברתו‪ .‬כשמפיצים מבחן בשלב מוקדם של פיתוחו יש לציין זאת במפורש‪ (3 .

‬אלא‬ ‫גם בעולם התוכן וברמת הקושי של המבחנים‪.‬סולמות ההתפ' של‬ ‫פיאז'ה‪.‬הבדלים איכותיים בין שלבים‪ .‬משמע שעבר‬ ‫שלב קודם‪ .10‬פריט‬ ‫מסווג לרמת גיל מסוימת אם אחוז מסוים )למשל ‪ (90%‬של הנבדקים באותו גיל ענו‬ ‫עליו נכונה‪ .‬‬ ‫‪ .‬ציונו‪ .‬לא תמיד ניתנים להשוואה‪ .‬כשהגיל השכלי גדול מהכרונולוגי‪ .4‬שייך לנורמות‬ ‫התפ'‪ -‬כיתתית(‪.‬אלא אם כן מפרשים‬ ‫אותם בהקשר למסגרת התייחסות מוגדרת היטב‪ .‬ישנן כמה דרכים לעשות זאת‪) :‬ילד שקיבל ‪ .‬מאפשרת )תחת תנאים מסוימים( להשוות את ציוניו של‬ ‫הנבחן לציונים שהושגו במדגם התקנון ו‪/‬או לציוניו במבחנים אחרים‪.‬טכניקה אחרת להשתמש ברעיון של גיל שכלי היא למדוד את ציון‬ ‫הגלם הממוצע של קבוצת הגיל במטלה מסוימת ולהשוות את ציונו של הפרט‬ ‫לממוצע זה‪ .‬‬ ‫‪ .‬אלא קשורה לאיכות הביצוע של הפרט‬ ‫במטלות שמעידות על הימצאותו ברמה התפ' מסוימת‪ .‬ופחות כמותיים‪ .2‬נורמות כיתתיות – את הנורמות הללו מוציאים על ידי חישוב ציון הגלם הממוצע‬ ‫של הכתה אליה משתייך הפרט ולהשוות את ציוניו לממוצע הכיתתי‪ .‬‬ .‫של הנבחנים מובן שהדבר ישפיע על ביצועיהם מבלי שהוא קשור לתכונה הנמדדת‪ .‬כך ניתן לראות אם הוא שווה לממוצע‪ .‬גבוה ממנו או נמוך ממנו‪.(100‬יש הבדל איכותי בין יכולות שכליות של ילד בן ‪ 8‬לילד בן ‪ .‬יש‬ ‫לזכור שהיכולת להשוות בין ציוני מבחנים שונים אינה תלויה רק ביחידות המדידה‪ .‬שיטה זו‬ ‫ישימה ושכיחה במיוחד במבחני הישג שנערכים במערכת החינוך‪.‬‬ ‫נתונים נורמטיביים‪ :‬מתיחסים לאיסוף נתוני הביצוע במבחן של מדגם המיצג את האוכ'‬ ‫לה מיועד המבחן‪ .3‬סולמות סודרים – נועדו לזהות את הרמה ההתפ' אליה הגיע הפרט‪ .‬או "גילו השכלי" של נבחן בשיטה זו יהיה שווה לרמת הגיל הגבוהה‬ ‫ביותר שהצליח להשלים‪ .‬הם יחסיים למדגם ממנו הופקו‪.‬או המבנים הפסיכולוגים הנמדדים‬ ‫מתפתחים עם הזמן‪ .‬‬ ‫ההמרה מציוני גלם לציונים יחסיים‪ .‬למשל‪ .‬השיטה משמשת במבחני אינטליגנציה דוגמת מבחן‬ ‫סטנפטורד‪-‬בינה‪ .1‬גיל שכלי – יכולת מנטלית מסוימת‪ .‬ואולם‪ .‬מסגרת‬ ‫ההתייחסות במקרה זה אינה קבוצתית‪ .‬‬ ‫‪ 2‬דרכים עיקריות להפוך ציוני גלם לציונים יחסיים בעלי משמעות‪:‬‬ ‫נורמות התפתחות‪ :‬רלבנטי רק כשהתכונות‪ .‬זה יהיה גדול‬ ‫מהממוצע )‪ .‬הגעה שלשלב‪ .‬‬ ‫‪ .‬הטיה‬ ‫תרבותית‪.‬מקובל לפרש את הציונים במבחנים‬ ‫אלו על ידי התייחסות לנורמות המייצגות את ההישגים של מדגם התקנון‪ .‬‬ ‫יחידה ‪ – 4‬נורמות‬ ‫ציוני הגלם המתקבלים במבחנים פסיכולוגים הם לרוב חסרי משמעות‪ .‬מדובר בהפיכת ציון הגלם של היחיד לציון שמבטא את הרמה‬ ‫ההתפתחותית שהוא השיג‪ .

‬פוגע במידת היצוג שלהם‪.‬ניתן לראות כי‬ ‫במרכז ההתפלגות כל "קפיצה" במאון מגלמת פער קטן יותר בציון מאשר בקצות‬ ‫ההתפלגות )הפער בין המאון ה‪ 30-‬למאון ה‪ 40-‬בציוני גלם‪ .‬מידות של גיל שכלי אינן שוות בכל‬ ‫הגילאים‪ .‬מיקום יחסי‪ .3‬אין להשוות בין נורמות התפ' של מבחנים שונים היות ויחידות המדידה הבסיסיות שונות‬ ‫וכן רמת הקושי ועולם התוכן‪.‬‬ ‫‪ .‬אם דני‪ .‬קל יותר להבין שיוסי השיג הישג ממוצע לתלמידי כתה ג' מאשר‬ ‫שציון התקן שלו הוא ‪(.‬הם קלים להבנה ולשימוש‪ .‬במונחי ציוני גלם‪ .‬גדול יותר מהפער בין המאון ה‪-‬‬ ‫‪ 40‬למאון ה‪ .‬מכיוון שמדובר בממוצע ישנם הרבה מקרים גבוהים ונמוכים‬ ‫ממנו‪ .‬‬ ‫‪P 100‬‬ ‫‪P 50‬‬ ‫לא בהכרח‬ ‫אינו הציון‬ ‫המקסימלי‪ .‬‬ ‫‪ .‬תלמיד כתה ב'‬ ‫קיבל ציון גבוה במיוחד‪ .‬החסרון‪ .(50-‬אלא אם מדובר על ציונים של ‪ 95.‬‬ ‫מדובר במסגרת פרשנות כמותית שמאפשרת מגוון ניתוחים סטטיסטיים‪ .2‬יחידות של נורמות גיל אינן סטנדרטיות‪ .‬לא נותנים אומדן לגבי מידת‬ ‫ההבדל בין הציונים הגולמיים של הנבחנים‪ .‬כמו כן אין להסיק מהתוצאה על השיבוץ הרצוי לכיתות‪ .‬לדוגמה‪ :‬אין לחשוב שכולם ישיגו‬ ‫את ממוצע הקב' שלהם‪ .‬התפלגות‬ .1‬קל לטעות בפירוש התוצאות ובהסקת המסקנות‪ .‬למשל‪ .‬נוסחת החישוב‪:‬‬ ‫) ‪F (x‬‬ ‫‪*100‬‬ ‫‪N‬‬ ‫מעיד על היותו בממוצע בגלל שלא ידוע אם זאת התפ' נורמלית‪.0‬‬ ‫חסרונות השימוש בנורמות התפתחות‪:‬‬ ‫‪ .‬חסרון‪ :‬יש אי‬ ‫שוויון בגודל יחידות המאונים‪ .‬אין זה אומר שאפשר "להקפיץ" אותו לכתה ג' משום שלמעשה‬ ‫הוא שולט היטב בחומר של כתה ב' ולא בחומר של כתה ג'‪ .‬למשל‪ .4‬לא ניתן לבצע ניתוחים סטטיסטיים מורכבים על הנתונים הללו‪.‬ישים בכל המבחנים ובכל ההתפלגויות‪ .‬‬ ‫נורמות קבוצתיות‪ :‬מאפשרות להעריך את הישגי הפרט בהשוואה להישגי מדגם התקנון‪.‬ציונים מאוניים ישימים בכל סוגי המבחנים ולכל‬ ‫סוגי ההתפלגויות‪ .‬‬ ‫‪ .‬אינטואיטיבי וקל‬ ‫להבנה של התוצאות‪) .‬הבדל של ‪ 5‬מאונים‪ .100.‬אותו לא למד ועליו לא‬ ‫נבחן‪.P 30-40‬שכיחות בקצוות נמוכה יותר מהמרכז‪ .‬אבל הוא הגבוה בהתפ'‪ .‫יתרונות השימוש בנורמות התפתחות‪ :‬מהוות אומדן איכותי‪ .‬ישנן ‪ 2‬צורות‬ ‫מקובלות להפוך ציון גלם לציון יחסי בר השוואה לציוני מדגם התקנון‪:‬‬ ‫מאון הוא ציון המבטא את מיקומו של הנבדק בתוך הקבוצה במונחים של אחוז האנשים‬ ‫שהשיגו ציון זהה לשלו או נמוך ממנו‪ .105‬ואז זה סימטרי‪ .‬‬ ‫‪ .‬‬ ‫= ‪Px‬‬ ‫‪.‬בין ‪50-60‬‬ ‫‪P‬‬ ‫שונה‬ ‫מהבדל של ‪ 5‬מאונים בין ‪ .‬יתרון‬ ‫מאון‪ :‬קלים להבנה‪ .‬בהתפלגות נורמלית‪ .5‬מבוססות על מדגמים קטנים‪ .‬יחידות אלה נוטות להצטמק שכן קצב ההתפ' מאוד מהיר בשנים המוקדמות‬ ‫אך הוא הולך ופוחת בשנים מאוחרות יותר‪.

‬מתאים להתפ' נורמלית‪ .‬באם‬ ‫המדגמים שונים‪ .‬להבדיל מתהליך גזירת ציוני תקן סטנדרטים שהוא טרנספורמציה‬ ‫לינארית‪.‬ממוצע‬ ‫‪ .1-9‬‬ ‫קטגוריאלי‪ .‬כיוון‬ ‫שלא יודעים איפה ממוקם בתוך המאון‪ . T = Z x '*10 + 50 :10‬‬ ‫היחסיות של נורמות‪ :‬כיצד משווים בין ציוניו של נבדק במבחנים שונים? מסתבר שגם‬ ‫כשנתונים ציונים נורמטיביים‪ .‬כי אין חזרה לאחור לתקן או מאון‪ .‬ניתן‬ ‫להשוות את ציוני התקן שלהן‪. 9ish = Z x * 2 + 5‬בהמרה לתשעונית יש איבוד מידע‪ .4‬וגם לפי נוסחה לבדיקה‪ .‬אבל ההתפלגות קרובה לנורמלית‬ ‫ומניחים שהסטייה מהנורמליות מקורה בקושי מתודולוגי ולא בתכונה הנמדדת )שאמורה‬ ‫להתפלג נורמלית(‪ .50‬ס"ת ‪.‬ס"ת =~‪ .‬ציוני תקן סטנדרטים מתבססים על המרחק מן‬ ‫הממוצע ביח' סטית תקן ואילו ציוני תקן מנורמלים מתבססים על המיקום היחסי של‬ ‫ציון גלם מסוים בהתפלגות‪ .‬‬ ‫‪.2‬ממוצע= ‪.‬סוכמים את האחוזים של הטבלה )בדף נוסחות(‪.‬אין תוקף להשוואת הציונים שהושגו באמצעותם‪.‬‬ ‫לא יתכן לערוך השוואה ישירה ביניהם‪ .‬‬ ‫‪.‬קטגוריות לא שוות בגודלן‪ .‬‬ ‫ניתן לבצע טרנספורמציות ליניאריות שונות על ציוני התקן‪ :‬תשעוניות סולם בין ‪.‬‬ ‫תנאי נירמול‪ :‬לא תמיד מתקבלת התפלגות נורמלית‪ .‬אח"כ מוצאים את ציון ה‪ Z-‬המתאים למאון‪ .‬סולם‬ ‫‪T‬‬ ‫בעיקר במבחני אישיות‪ .2‬‬ ‫כשרמת הקושי של המבחנים שונה גם אז יש בעיה להתיחס להבדלים בביצוע‬ ‫במבחנים השונים אך ניתן להיעזר בציוני תקן‪.‬‬ ‫‪25‬‬ ‫‪P‬‬ ‫מגיע לתשעונית ‪ .‬‬ .‫מלבנית יחידות ציוני גלם שוות ליחידות מאונים‪ .‬ברור שיש פערים בין ציונים מנורמלים‬ ‫לציוני‬ ‫‪Z‬‬ ‫שמתקבלים מהתפלגות נורמלית‪ .‬אך אפשר לומר משהו על ההבדל במיקומו‬ ‫היחסי של נבדק במבחנים הללו‪.5‬‬ ‫‪ .‬‬ ‫‪.‬יש להיזהר בביצוע ההשוואה‪.‬אי אפשר להסיק מציון מאוני על ציון‬ ‫גלם!!‬ ‫ציוני תקן מבטאים את מיקומו של הפרט ביחס לממוצע הקבוצתי‪ .‬בנוסף יש לזכור שתהליך הנירמול משנה את צורת‬ ‫ההתפלגות‪ .‬הנוסחה היא‪:‬‬ ‫‪Sd‬‬ ‫= ‪ = m) Z‬ממוצע(‬ ‫כשנתונות ‪ 2‬התפלגויות זהות )מ ‪ 2‬מבחנים שונים( או ששתיהן נורמליות‪ .‬חישוב‬ ‫‪Z‬‬ ‫מנורמל הוא דו‪-‬שלבי‪ :‬ראשית מוצאים את המאון המתאים לציון‬ ‫הגלם‪ .3‬‬ ‫יש להתיחס לאופי מדגמי התקנון ששימשו להערכת הציונים במבחנים השונים‪ .1‬‬ ‫יש לזכור כי בכל מקרה שהמבחנים השונים אינם מודדים אותה יכולת‪/‬תכונה‪/‬מבנה‪.‬ביחידות של סטיית‬ ‫)‪( x −m‬‬ ‫תקן‪ .‬אזי ניתן "לנרמל" את ציוני הגלם ולהפוך אותם לציוני תקן )ציונים‬ ‫נורמטיביים(‪ .

‬מבחנים כאלו‬ ‫מאפשרים אבחנה בין נבחנים‪ .‬נתון‬ ‫‪Z‬‬ ‫שלילי‪ .‬כדי לחשב מנת משכל של סטיה יש למצוא ראשית את ציון ה‪ Z-‬של הנבדק‬ ‫ולאחר מכן לבצע טרנספורמציה לינארית שבה מכפילים את ערך‬ ‫‪Z‬‬ ‫בסטית התקן‬ ‫הממוצעת )‪ 15‬בוקסלר‪ 16.‬הטעות המקרית משפיעה על דיוק המדידה ע"י גריעה‪ /‬הוספה של ערך מקרי לציון‬ ‫האמיתי של הנבחן‪ .‬מדגישים הבדלים בין אישיים‪.‬‬ ‫האופן בו מפרשים תוצאות של מבחנים מאפשר לסווג את כלי המדידה ל‪ 2 -‬קטגוריות‬ ‫כלליות‪:‬‬ ‫מבחנים תלויי נורמה מספקים מסגרת פרשנית לתיאור השגיו של הנבחן במונחים של‬ ‫מיקומו היחסי‪ .‬ניתן לחשב טבלאות‬ ‫שמתארות את ההסתברות שלנבדק בעל ציון מסויים במבחן יהיו הישגים מסויימים‬ ‫בקריטריון‪.‬הבעיה‪ .‬וככל שגורם הטעות יקטן‪ .‬כך המדידה תהיה מדויקת ומהימנה יותר‪.100‬חשוב שהמבחנים המשווים יהיו בני‬ ‫ס"ת דומות או זהות‪.‬‬ .‬כאמור‪ .‬אלא האם הוא שולט בעולם תוכן‬ ‫מוגדר או לא‪ .‬נחסיר את התוצאה מ‪ 1-‬ונקבל את השטח של השלילי‪.‬הפרשנות היא כמותית ומתבססת על נתוני מדגם התקנון‪ .‬היתה בכך שמנות המשכל המקוריות‬ ‫שחושבו לא היו ברות השוואה בגילאים השונים )ס"ת של ההתפלגות בגילאים השונים לא‬ ‫היו זהות(‪ .‬מדובר במסגרת פרשנות ששמה דגש על איכות ולא על כמות‪.‬‬ ‫עפ"י המודל הקלאסי למהימנות של ספירמן‪ .‬במבחני שליטה עושים שימוש במסגרת פרשנות כזו‬ ‫משום שלא מתעניינים בהישגיו של הנבדק ביחס לקב'‪ .‬‬ ‫יחידה ‪ – 5‬מהימנות‬ ‫מדדי המהימנות נותנים מידע על החלק היחסי של השונות בין הנבדקים בציונים הנצפים‬ ‫)שונות נצפית( המיוחסת להבדלים האמיתיים ביניהם בתכונה הנמדדת )שונות אמיתית(‬ ‫ועל החלק המשלים המתייחס להבדלים מקריים שמקורם בטעויות מדידה שונות )שונות‬ ‫טעויות(‪.‬כלומר‪ .‫במטרה לתרגם ציונים של גיל שכלי למדד אחיד של רמתו היחסית של הנבחן הונהג מדד‬ ‫הנקרא מנת משכל של סטיה‪ .‬בבינה( ומוסיפים ‪ .‬‬ ‫הקשר בין ציוני‬ ‫המאון של ה‪-‬‬ ‫‪Z‬‬ ‫‪Z‬‬ ‫למאונים ייבדק רק בהתפלגות נורמלית‪ .‬‬ ‫טבלאות של ציפיות‪ :‬אפשר לפרש את הישגי הפרט במבחן גם בהתחשב ברמת ביצוע‬ ‫צפויה בקריטריון מסויים )כמו בשיטות תיקוף תלויות קריטריון(‪ .‬הציון המתקבל במבחן מורכב מסכום של‬ ‫ציון אמיתי )ציון על התכונה הנמדדת ללא "רעש" במדידה( וציון טעות )מרכיב הטעות‬ ‫המקרי(‪ .‬נחפש את‬ ‫החיובי‪ .‬‬ ‫מבחנים תלויי קריטריון מספקים מסגרת פרשנית לתיאור הישגיו של הנבחן במונחים‬ ‫של רמת היכולת או הביצוע שלו‪ .

‬קיים באוכ'‪.‬ו‪ 99% -‬אמיתי‪ .‬טעות בהקצאת זמן לבחינה‪ -‬מעט זמן לא יגיעו לסוף‪ .‬טעויות בניקוד המבחן‪.0.‬לכן יהיה מקדם מהימנות גבוה יותר‪.‬העברה אחת‪ :‬מהימנות מבחן חצוי‪ .‬באם זאת טעות שיטתית או קבועה‪:‬‬ ‫גורם לא רלוונטי המשפיע באופן שיטתי וקבוע על המדידה‪ .‬‬ ‫השפעת גורמים שונים על מקדם המהימנות‪ (1:‬גודל המדגם – ככל שמדגם גדול‬ ‫יותר‪ .‬ונקבל תוצאות דומות‪ .‬מקדמי המהימנות מושפעים ממידת ההטרוגניות של המדגם‪ .‬מבחינת המיקום היחסי של הנבדקים‪ .‬זמן או מעריך‪ .‬המדידה יציבה יותר ונצפה למתאם מובהק יותר‪ (2.‬פיזור בתוך המדגם – המתאם‬ ‫תלוי בפיזור‪ .‬‬ ‫‪St 2‬‬ ‫מקדם המהימנות‪ rtt = 2 :‬שונות נצפית מורכבת משונות אמיתי ‪ +‬שונות טעויות‪ .‬תנאים פיסיים‬ ‫כרעש או חום‪ .‬אופן הדפסת המבחן‬ ‫)אותיות קטנות(‪ (2 .‬ככל ששואף לאפס‪ .‬מדגם מועמדים הטרוגני יותר ממדגם‬ ‫של לומדים‪ .‬מדידת‬ ‫‪So‬‬ ‫תכונות פסיכו' מושפעת מגורמים לא רלוונטים‪ .1‬יש סיכוי של ‪ 1%‬שקיבלנו את‬ ‫המתאם במדגם באופן מקרי והוא אינו קיים באוכ'‪ .‬גורמים התלויים בבוחן כמו השפעת אישיותו של הבוחן‪ .‬‬ ‫‪ (3‬גורמים התלויים בנבחן כמו עייפות בזמן המבחן‪ .‬‬ .‬‬ ‫טעות מקרית‪ :‬גורם לא רלוונטי המשפיע באקראי על המדידה‪ .‬ככל‬ ‫שהמדגם יותר הטרוגני‪ .‬נוכל לקבל מקדמי מהימנות גבוהים יותר‪ .‬זהה ככל הניתן‪ .‬‬ ‫והשונות גדולה מאפס‪ .‬מתאם של ‪ 0.25‬שחושב על מדגם‬ ‫הגדול מ ‪ 104‬נבדקים נחשב מובהק‪ .‬פריטים‬ ‫קשים מדי המעלים שימוש בניחוש ומגדילים את מקריות התשובה‪ .‬השונות‬ ‫האמיתית קטנה ממדגם הטרוגני‪ .‬כמשקל‬ ‫ביתי‪.‬מהימנות‬ ‫נמוכה‪ .‬מתאם אפס מצביע על העדר קשר בין הציונים‪ .‬גם‬ ‫כשנעביר את המבחן בזמנים שונים או כשאנשים שונים ינקדו ויפרשו את המבחן‪.‬משני כיוונים שונים‪.‬בשונויות‪ .‬מוטיבציה או הימצאותו בתפקיד עוד‬ ‫לפני המבחן‪ .‬שונות שווה לאפס‪ .‬אלפא = ‪ .‬מהימנות תוצאה‬ ‫של ‪ -0.‬אלפא‬ ‫מבוססת על גודל מדגם ועוצמת המתאם‪ .‬עד כמה המתאם קיים באוכ' או שמא הוא מקרי‪ .‬או‬ ‫שמא מיקומם היחסי משתנה‪ .‬מבחן רב ברירה – מסיחים לא ברורים או דו משמעיים‪ .‬נטיה לרציה חברתית – מנסה לענות כמו שחושב שמצפים‪ .‬ויש יותר טעויות‪ .‬היכולת להבנת ההוראות כשאין קשר בין‬ ‫ההוראות לנושא הנבדק במבחן‪.82‬יכולה להצביע על שני מבחנים הבודקים את אותו הדבר‪ .‬משמע‪ .‬ואז מהימנות המבחן קטנה‪ .‬נסיון או הכרות‬ ‫עם סגנון המבחן שמועבר גורם לקלות יחסית‪ .‬נעביר את המבחן‬ ‫לאותו מדגם של נבדקים‪ .‬‬ ‫‪∑ Zx * Zy‬‬ ‫‪N‬‬ ‫= ‪ rtt‬בודק אם המיקום היחסי של נבדקים בשתי העברות‪ .‬במדגם הומוגני‪ .‬התוחלת שווה לאפס‪.‫מדידה מהימנה מניבה נתונים עקביים ללא תלות בתוכן‪ .‬מקורות לטעות מקרית‪ (1 -‬גורמים התלויים במבחן עצמו כמו‬ ‫הוראות עמומות למבחן‪ .‬‬ ‫מובהקות סטטיסטית‪ .

‬תנאים‬ ‫פיזיים‪ .‬בעיתיות‪ :‬דגימת פריטים‪-‬מתיחס לשני מקורות שונות טעות‪ -‬תוכן‪ :‬בונים‬ ‫פריטים מתוך עולם תוכן‪ .‬בהפרש של‬ ‫זמן בין מדידה ראשונה לשניה‪ .‬יכולים להשתנות בתקופות שונות של העברת‬ ‫הבחינה‪ .‬ככל שהמבחן ארוך יותר‪ .‬תלות מלאכותית בין המבחנים‪ (2 .‬מהימנות מבחן חוזר מוסרת מידע לגבי היכולת להכליל מתוצאות הבחינה למצבי‬ ‫בדיקה שונים‪ .‬אם‬ ‫אומרים מקדם מהימנות מבחן חצוי הוא‪ ..‬ובשני נוטים לענות באותו דפוס‪ .‬גורמים התלויים בזמן יכולים להשפיע על המהימנות ‪.‬מצב רוח של הנבדק‪ .‫‪ (1‬מהימנות מבחן חוזר‪ -‬מעבירים נוסח זהה של מבחנים לאותם נבדקים‪ .‬יכול להביא להבדלים בין הציונים‪ .‬מקדם‬ ‫המהימנות שנקבל יהיה של כל המבחן‪ .‬‬ ‫נתקן ע"י ספירמן בראון‪ .‬נשתמש ב‪-‬‬ ‫‪SB‬‬ ‫כשיאמרו לנו שנמצא מתאם בין שני מבחנים‪ .‬ככל‬ ‫שמספר הפריטים יגדל בבחינה‪ .‬חסרונות‪ (1 :‬השפעת זכירה‪ -‬נבדקים נוטים לזכור את דפוס התגובות‬ ‫שלהם במבחן הראשון‪ .‬וכל חצי מבחן ייבדק בפירסון‪.‬מבחינת‬ ‫הפער בין ההעברות‪ .‬בוחנים את‬ ‫עקיבות הציונים מעבר לדגימות תוכן כפי שבאות לידי ביטוי בכל אחד מהחצאים‪ .‬‬ ‫או בהפרשי זמן‪ .‬נסיון נצבר‬ ‫שונה בין הנבדקים‪ .‬עייפות‪ ..‬‬ ‫‪ (2‬נוסחים מקבילים‪ -‬מעבירים לאותם נבדקים נוסחים שונים של אותו מבחן‪ .‬יש טעות אחת‪.‬‬ ‫‪ (3‬מהימנות מבחן חצוי‪ -‬חוצים את המבחן ומחשבים מתאם בין שני החצאים‪ .‬לא צריך לתקן!! אפשרות שניה לחישוב מבחן‬ ‫חצוי הוא רולון‪ :‬נותן את מהימנות המבחן כולו ללא צורך בתיקון‪ .‬בו זמנית‪.‬יש לבדוק שהפרשי הזמנים לא יכולים להביא להתפתחויות שיכולות‬ ‫להביא לשינויים )בשילה(‪ .‬באיזו מידה רגישים הציונים לגורמים אקראיים התלויים בזמן‪ .‬כושר‬ ‫מונוטוני‪ .‬מקטין אותו למרות שלא מתיחס לתכונה‬ ‫הנמדדת‪ (3 .‬במרווח זמן‪.‬‬ ‫‪SB‬‬ ‫עונה על השאלה עד כמה‬ ‫גדלה‪/‬קטנה המהימנות כשהמבחן מתארך או מתקצר‪ .‬מביא למהימנות גבוהה‪ .‬הקשר בין‬ ‫הארכת המבחן לגידול במהימנות הוא חיובי אך לא לניארי‪ .SB -‬היא המהימנות לפני הקיצור‪/‬הארכה‬ ‫של המבחן‪ =N .‬השפעת נסיון‪-‬‬ ‫במהלך פתירת המבחן הראשון‪ .‬כך אותה תוספת של מספר פריטים תגרור עליה קטנה‬ ‫יותר במהימנות הבחינה‪ .‬אין התיחסות לאיכות הפריטים ב‪ rtt .‬שונות הפרשים חלקי‬ .‬הנבדק צובר נסיון לגבי צורת המבחן ומבנהו‪ .‬המהימנות‬ ‫שלו גדלה‪ .‬וזה פוגע במקדם המהימנות‪ .‬פי כמה קוצר או הוארך המבחן )‪ .‬זמן‪ :‬בעיתיות‪ .‬מקור‬ ‫לשונות טעות – תוכן‪.‬יש להפעיל שיקול דעת מתי לערוך את המבחן השני‪ .‬תפיסה‪ .‬‬ ‫הבדל מהימנות מבחן חצוי – מקביל‪ :‬במקביל בודקים את המבחן כשלם‪ .‬מתאים בעיקר לבדיקת יכולות‪/‬כשרים שאינם מושפעים מזכירה‪ .‬עלויות גבוהות‪ -‬איסוף אותו מדגם נבדקים פעמיים‪ .‬ולא התפתחות‬ ‫שיטתית של התכונה‪ .‬חצוי‪ .‬במהימנות מבחן‬ ‫חוזר נצפה למקדם גבוה יותר‪ .‬פונק' שולית פוחתת‪ .‬יהיה מתאם בין שני החצאים ולא על כולו‪.2‬משמע שני מבחנים(‪ .‬אבל‬ ‫מנופח ואינו תואם את המציאות‪ .

.‬ככל שהמדידה ארוכה יותר‪ .‬צריך לפתור זאת בשיקול דעת‪ .‬לפיכך‪ .‬‬ ‫חשיבות הדבר בכך שניתן לנסות לבחון באיזה מידה התגובות שמתקבלות מעידות על‬ ‫יכולות‪/‬מגבלות קוגניטיביות או לחילופין רגשיות‪.‬ככל שהמערכת מקוצרת יותר‪ .‫שונות כללית‪.‬ומייצג היבטים מוגבלים של התפקוד האינטלקטואלי(‪ .‬וניתן לנסות לאתר קשיים רגשיים‪ .‬בתת‪-‬‬ ‫המבחן קוביות‪ .‬לא טוב כשהמבחן‬ ‫בנוי אשכולות של שאלות כשבתוך כל אשכול תלות חזקה בין השאלות שביניהן סמיכות‬ ‫וקשר‪ .‬יתרון‪ :‬אפשר לתת מספר רב של שאלות הבודקות את אותה‬ ‫תכונה‪ .‬שונות ההפרשים היא‪ .‬שבודק‬ ‫מס' תחומים במבחן אחד‪ (1 .‬לדוגמא‪ :‬כישורים‬ ‫הנמדדים בתת‪-‬המבחן "ידיעות כלליות" נוגעים למיומנויות שפה‪ .‬כושר לקלוט מידע מתוך‬ ‫חקירת הסביבה וכן הלאה‪ .‬‬ ‫‪∑( d‬‬ ‫)‪−i d‬‬ ‫‪N‬‬ ‫= ‪SD 2‬‬ ‫מחפש את המקור לשונות הטעויות‪ ..‬ונמצא אותו בשונות‬ ‫ההפרש בין שני החצאים‪ .‬ככל שמתקדמים מצטבר נסיון‪.‬כל אלו יכולים‬ ‫לגרום לשונות טעות גדולה יותר בדגימת התוכן‪ 2 .‬חסרון‪ :‬מדידה‬ ‫התכונה הנחקרת )משכל( פחות מהימנה ותקפה )מבוססת על מספר מועט יותר של‬ ‫פריטים‪ .‬היכולת לשרטט תמונה רחבה ומעמיקה‬ ‫יותר של כישוריו הקוגניטיביים של הנבדק מצומצמת יותר‪ .‬הבדלי ניקוד בין שני החצאים‪ .‬הליך ההערכה יחידנית‬ ‫יכול לשמש גם כתצפית איכותית‪ .‬גם לגבי מאפיינים רגשיים‬ ‫וחברתיים‪ .‬בנוסף‪ .‬אובדן מידע כמותי ואיכותי‬ ‫רב‪ .‬ככל שהשונות בין כל פריט תהיה קטנה יותר‪ .‬לפיכך‪ .‬למשל‪ .‬קשיים קוגניטיביים )"בדיקת‪-‬גבולות"(‪.‬‬ ‫‪ (4‬מהימנות כעקיבות פנימית‪ -‬נשתמש רק בעולם תוכן הומוגני! כל פרטי המבחן‬ ‫מודדים עולם תוכן הומוגני‪ .‬חצאי המבחן אינם זהים בדגימת התוכן‪.‬כישורים אלו שונים באיכותם מאלו הנמדדים‪ .‬קיצור מבחנים‪ :‬יתרון‪:‬‬ ‫חסכון במשאבים )קצר יותר להעברה‪ .‬מציבים ברולון‪.‬חסרון‪ :‬דורש משאבים רבים ולכן פעמים רבות משתמשים במבחן הטרוגני‪ .‬מתאים לסינון ראשוני‪ .‬‬ ‫הבדלים בקושי אם רמת הקושי הולכת וגדלה‪ .‬נעשה הפרש בין‬ ‫הציונים ונחשב שונות על הפרשים אלו‪ .‬לראות את השאלות‪ .‬הבדלי תוכן בין שני החצאים‪ .‬ולהפעיל עליו אופרציה מנטאלית )אנליזה‬ ‫וסינתזה(‪ .‬יתכן שוני‬ ‫צורני בין החצאים‪ -‬שאלות פתוחות סגורות‪ .‬מורידים מהשונות הכללית את‬ ‫השונות של כל פריט ופריט‪ .‬הביטוי כולו יהיה‬ .‬יהיה ציון כללי של כל נבדק בכל חצי מבחן‪ .‬בדיקת תכונה הומוגנית באותו מבחן‪ .‬ממנה עולה מידע עשיר‪ .‬נחפש מתאם גבוה בין‬ ‫פריט אחד ליתר הפריטים‪ .‬וזול יותר(‪ .‬‬ ‫‪ (2‬זוגי‪/‬אי זוגי‪ :‬מאפשר חצית המבחן לשני חצאים דומים ככל האפשר‪ .‬אלפא‪ -‬עבור פריטים רציפים‪ .‬‬ ‫לא נצפה לעקיבות גבוהה‪.‬‬ ‫סוג החציה‪ (1 :‬חציה באמצע‪ :‬עייפות בחצי הראשון‪ .‬ישנה הזדמנות רבה יותר לאינטראקציה‬ ‫בוחן‪-‬נבחן‪ .‬בהשוואה לזה המתקבל מאבחון מקיף יותר‪ :‬ככל שהנבדק מתמודד עם מטלות מגוונות‬ ‫יותר ניתן לאפיין בצורה מדויקת ורגישה יותר את כישוריו הקוגניטיביים‪ .‬הבוחן יכולת לתפוס גירוי חזותי‪ .

‬בחינת מידת ההומוגניות של המבחן‪ :‬במידה ונרצה לדעת האם‬ ‫מבחן הוא הומוגני‪/‬הטרוגני‪ .‬מקדם אלפא יהיה קטן יותר‬ ‫וההפרש בינו למהימנות מבחן חצוי יהיה גדול יותר‪ (2 .‬זוגי אי זוגי‪ .‬‬ ‫‪ (5‬מהימנות בין מעריכים‪ -‬נעשה כשלמעריכים יש השפעה גדולה על תוצאות הבחינה‪.‬ככל שהבחינה הטרוגנית יותר‪ .‬לא חייב להיות פריטים סגורים‪.‬אינסוף חציות כדי לבדוק את‬ ‫מהימנות הבחינה‪ .‬תמיד יהיה הפרש בין מהימנות מבחן חצוי לעקיבות פנימית‪ .‬עקיבות פנימית‪ .‬פרופורצית הנבדקים שענו נכונה לגבי כל פריט‪ -q .‬‬ ‫מבחן חצוי חושבים על סוג החלוקה‪ .‬מעבירים את הבחינה לאותם נבדקים ע"י שני מעריכים ועושים‬ ‫מתאם פירסון ביניהם‪ .‬אך ללא יכולת ניחוש‪ p.‬אפשר שאחד יעביר את המבחן והשני ינקד אותו‪ .‬אין‬ ‫משמעות לאופן החציה שלו‪ .‬כשהמבחן הומוגני‪ .‬על‬ ‫השופטים להיות עיוורים לתוצאות קודמות של הנבדקים‪ .‬חשוב לשמור על אי תלות בין הבדיקה של שופט אחד לשני‪ .‬והפריטים שווים בין החצאים‬ ‫השונים‪ .‬‬ ‫טוב ליצור כלי הכי פחות סובייקטיבי‪.‬עונה לנו על ‪ 2‬טעויות אפשריות‪ -‬תוכן‬ ‫והטרוגניות‪ .‬ונבדוק את ההפרש המתקבל בין שני מבחני מהימנות אלה‪.‬כשהתגובה לפריט היא דיכוטומית‪ -‬כן‪/‬לא‪ .‬זוהי חציה אינסופית של הבחינה לעומת מבחן חצוי החוצה פעם אחת את‬ ‫הבחינה‪ .‬פער קטן – הומוגני‪.‬‬ ‫נכון‪/‬לא נכון‪ .‬‬ ‫מס' העברות‬ ‫מס' הנוסחים הדרוש‬ ‫שניים‬ ‫אחד‬ ‫דרוש‬ ‫פעם אחת‬ ‫מבחן חצוי קודר‬ ‫נוסח מקבלי מיד‬ ‫פעמיים‬ ‫ריצ'ארדסון‬ ‫מבחן חוזר‬ ‫נוסח מקביל לאחר‬ ‫זמן‬ ‫מקדם המתאם‬ ‫מקור לשונות‬ ‫טעות‬ ‫דגימת זמן‬ ‫מבחן חוזר‬ ‫דגימת תוכן‬ ‫נוסח מקביל מיידי‬ ‫נוסח מקביל לאחר זמן ותוכן‬ ‫זמן‬ ‫מבחן חצוי‬ ‫קודר ריצאר' ואלפא‬ ‫תוכן‬ ‫תוכן‬ ‫והטרוגניות‬ .‬קודר ריצארדסון‪ -‬מקרה פרטי‬ ‫של אלפא‪ .‬‬ ‫פער גדול ביניהם יעיד כי המבחן הוא הטרוגני‪ .‬מחלק את הבחינה לפי אשכולות‪ .‬או שני מעריכים‬ ‫יעבירו את הבחינה‪ .‫גדול יותר נותן לנו מהימנות מסוג עקיבות פנימית‪ .‬‬ ‫בעיקר מבחנים יחידניים‪ .‬ענו‬ ‫לא נכונה לגבי כל פריט‪ .‬מתאם נמוך מראה על מבחן נמוך‪.‬נוכל לבצע על התוצאות של הבחינה את הפרוצדורה של מבחן‬ ‫חצוי ושל עקיבות פנימית‪ .‬הבדל עיקרי בין עקביות פנימית לחצוי הוא החציה המושכלת‪.

‬נמצא‬ ‫טווח בו מעריכים שהציון האמיתי של הנבדק נמצא‪ .‬כשס"ת של שני מבחנים‪ .‬מדד המאפשר לפרש את ציונו של‬ ‫היחיד כשידוע לנו שהמבחן אינו מהימן לחלוטין והציון הנצפה לא בהכרח הגיוני‪ .‬מהימנות גדלה‪-‬מדידה מדויקת יותר‪-‬טווח קטן יותר סביב ציונו‬ ‫של הנבדק‪.‬הינו פער אמיתי או אקראי‪ .‬פרושה שהמדידה בסולם‬ ‫המילולי פחות מדויקת‪ .‬אפשר‬ ‫לפי הנוסחה המקוצרת‪ * .‬ולכן יוערך‬ ‫כמקרי בלבד‪.‬לא לשכוח לכפול ב‪-‬‬ ‫את‬ ‫ה‪SEM-‬‬ ‫‪Z‬‬ ‫לפי ר"ב‪.‬או ‪= 0.‬אין בעיה‪ .‬ולכן גם המכפלה ‪ SEdiff*Zx‬תגדל‪ .‫התוכן‬ ‫הבדלים בין מעריכים‬ ‫מעריכים‬ ‫טעות התקן של המדידה‪ .‬ההבדלים בין הנבדקים תלויים רק במהירות הביצוע‪.p -‬למשל ר"ב ‪:90%‬‬ ‫‪1 − 0.‬זהה‪ .‬שיענה על השאלה האם פער בין שני ציונים של‬ ‫נבחנים שונים‪ .‬נחוץ פער גדול‬ ‫יותר ביניהן‪ .‬יתכן כי הפער הנצפה לא יעלה על ההבדל המינימאלי שייחשב לאמיתי‪ .‬מתרגיל‪ :‬כשמהימנות נמוכה יותר‪ .‬במידה‬ ‫ומעבירים מבחן מהירות המבוסס על ‪ 2‬העברות‪ .‬יאמר מהו הפער הנדרש ע"מ לקבוע אם הציון‬ ‫אמיתי או לא‪ .‬יש בעיה כשרוצים להעביר‬ ‫מבחן מהירות המבוסס על העברה אחת‪ -‬חצוי‪/‬עקיבות פנימית‪ .‬‬ ‫שני סוגים – מבחן עוצמה‪ -‬הפריטים מסודרים בסדר קושי עולה‪ .‬מבחינה טכנית )מתוך התבוננות בנוסחה ‪ (SEdiff‬ניתן לראות שככל שערך‬ ‫המהימנות נמוך טעות התקן של ההבדל גדלה‪ .‬‬ ‫במבחן יש כמות גדולה של פריטים כך שאף נבדק לא יכול לענות עליהם במלואם‪ .SEM :‬שייך למהימנות‪ .‬‬ ‫כשיש שני נבדקים ורוצים להשוות בין ציוניהם‪ .‬מבחן מהימן יותר‪ -‬טווח קטן‬ ‫יותר‪ .‬נקבל התפלגות נורמלית בה הממוצע הוא הציון האמיתי וס"ת היא‬ ‫‪ .‬יש מספיק זמן לענות על‬ ‫כל הפריטים‪ .‬בתנאים‬ ‫אלו‪ .9‬‬ ‫בטבלה‪ .‬ר"ב של‬ ‫‪SEM‬‬ ‫זהה לר"ב של ההבדל‪ .SEM‬חישוב ה‪ Z-‬יכול לבוא מ‪ .‬נשתמש בטעות התקן של ההבדל‪:‬‬ ‫‪Sediff‬‬ ‫הוא ערך מספרי במונחים של ציוני גלם‪ .‬ככל שרמת הבטחון גדולה‪ .‬צריך טווח גדול יותר‪ .‬‬ ‫מהימנות של מבחני מהירות‪ :‬אין להשתמש במבחני מהירות באופן שרירותי‪ .‬‬ ‫הטווח גדל‪ .‬מושפע ממהימנות המבחן ומרמת‬ ‫הבטחון בה נרצה לומר כי הציון האמיתי נמצא בטווח זה‪ .‬אולם חלק מהפריטים קשים מדי ולא ניתן להשיב עליהם‪ .05 → −1.‬על מנת להבטיח הבדל אמיתי בין הצפיות‪ .‬אם נעביר לנבחן‬ ‫מבחן אינספור פעמים‪ .‬כדי לקבל טווח ציונים‪ .‬‬ ‫מוסיפים ומורידים מהציון שהתקבל‪ .‬ר"ב גדלה‪.‬מהירות‪ -‬כל פרטי‬ ‫המבחן ברמת קושי נמוכה ואחידה‪ .‬בעיה לפרשנות‪ .65‬‬ ‫‪2‬‬ ‫מכפילים את‬ ‫‪90‬‬ ‫‪p = 50‬‬ ‫‪+ = 95‬‬ ‫‪2‬‬ ‫ה ‪SEM‬‬ ‫ומחפשים את‬ ‫ה‪p-‬‬ ‫במה שהתקבל כאן‪ .‬לפיכך‪ .‬בדיקה אמפירית‪ :‬יש לבדוק‬ .‬במבחני‬ ‫מהירות שונות הציונים בין הנבדקים נובעת בעיקר ממהירות הביצוע של התכונה הנמדדת‪.

‬קרוב ל‪1-‬‬ ‫משמע כי הרוב זה הספק‪ .‬והפריטים קשים‪ .3 .‬בודקים את מס'‬ ‫השאלות אליו הגיע הנבחן‪ .‬‬ ‫ואמפיריות ויש ‪ 3‬גישות כלליות לתיקוף‪ :‬תיקוף תוכן‪ .‬ההשוואה בין הנבדקים‪ .‬אם אין מספיק מידע לגביו‪ .‬ובפרופורציות הנכונות‪ .4 .‬מתאם מנופח‪ .‬באשר לכישורי המשכל‪ .‬פתרון‪ :‬נדפיס כל מחצית מבחן על טופס‪.‬לכן המהימנות תהיה מאוד גבוהה וזה לא ייתן לנו‬ ‫מידע‪ .‬העדר‬ ‫מידע לגבי הקושי היחסי של פרטי המבחן‪ .‬תיקוף מבנה ותיקוף תלוי‪-‬קריטריון‬ ‫תוקף תלוי תוכן עוסק בשאלה עד כמה פריטי המבחן מכסים כהלכה את עולם התוכן‬ ‫שאת הביצוע בו מתכוונים למדוד‪ .‬אם נמוך‪ .‬מבחן חצוי‪ -‬אם נחצה את המבחן באמצע‪ .‬שכן יתכן שההבדלים בין הציונים משקפים את העובדה שנחקרו‬ ‫היבטים שונים של היכולת הקוגניטיבית בכל אחת מן המדידות‪.‬נדע שזה עוצמה‪.‬ובחלק השני רק על חלק‪ .‬שכן ציונים אלו יחסיים למדגם התקנון ממנו הופקו‪.‬לא ניתן להשוות במונחים של ציון יחסי נתונים‬ ‫שהתקבלו ממבחנים בעלי דרגות קושי שונות )פרשנות תלוית קריט'(‪ .‬העדר מידע לגבי‬ ‫היקף התכנים שנבדקו בכל מבחן‪ .‬תיקוף תוכן רלבנטי‬ .‬‬ ‫ניתן לנבדק לפתור במחצית מהזמן שנתנו למבחן המקורי‪ .2 .‬יש חישוב מתמטי לבדוק‬ ‫אם מבחן הוא מהירות או עוצמה‪:‬‬ ‫‪SD c2‬‬ ‫‪SD t2‬‬ ‫שונות הספק חלקי שונות מבחן‪ .‬מבוססת על שונות הביצוע בכל פריט ובמקרה זה השונות היא אפסית‪-‬‬ ‫לא אמורה להיות שונות בתגובה לפריט‪ .‬מבלי להתיחס לשאלה האם פתרו נכונה או לא‪ .‬הגיוני שבחלק הראשון אליו הגיע‬ ‫הנבדק‪ .‬במידה ומדגמי התקנון שונים‬ ‫באופיים )למשל‪ .‬קושי זהה‪ .‬‬ ‫קשה להשוות בין מבחן ישן ובדוק לבין חדש‪ .‬שכן ציונים אלו ישאו משמעות‬ ‫שונה בכל התפלגות )מבחינת מיקומו היחסי של הנבדק בהשוואה לאחרים(‪ .‬מדגם מוטה כלפי מעלה או מטה( לא ניתן לערוך השוואה במונחים של‬ ‫ציון יחסי )במקרה זה ציון תקן(‪ .‬עלולה‬ ‫להיות בעיתית כאשר מדובר במבחנים הבוחנים היבטים שונים של התפקוד האינטלקטואלי‬ ‫)פרשנות תלוית קריטריון(‪ .‬במידה והתפ' הציונים שונה‬ ‫מנורמלית‪ .‬חציה לזוגי‪/‬אי זוגי‪ .‬ורק אותו‪ .‬אלו שהגיע אליהם‪ -‬מקדם מתאם‬ ‫מאוד נמוך‪ .‬וישנן תשובות שגויות‪ .‬‬ ‫העדר מידע על צורת ההתפ' )במבחן המשכל החדשני(‪ .‬מבחן‬ ‫מהירות מזהים ע"י הקצבת זמן‪ .‬‬ ‫יחידה ‪ – 6‬תוקף‬ ‫המושג תוקף עוסק בשאלה האם המבחן )כלי המדידה( מודד את המהות שהוא אמור‬ ‫למדוד ועד כמה הוא מיטיב לעשות כן‪ .‬‬ ‫עקיבות פנימית‪ .‬נחצה את גורם הזמן‪ .1 :‬העדר‬ ‫מידע לגבי אופי מדגם התקנון )במבחן המשכל החדשני(‪ .‬עדויות על תוקפו של המבחן נאספות בדרכים לוגיות‬ ‫‪.‬מצפים לשונות‬ ‫בהספק‪ .‬ענה על כל השאלות‪ .‬לא ניתן לבצע השוואה במונחים של ציון תקן‪ .‬שונות‬ ‫המבחן תהיה גדולה משונות ההספק ואז מדובר במבחן עוצמה‪.‫את היחס בין שונות ההספק )מס' השאלות עליהן השיב נבדק( לשונות הכללית‪ .‬שאלות קלות יחסי‪ .‬אם המבחן הוא לא מהירות טהור‪ ..

‬אלא בשאלה האם המבחן נראה תקף‬ ‫לנבחנים‪ .‬לעיתים ניתן לשפר את תוקפו הנראה של‬ ‫מבחן באמצעות ניסוח מחדש של פריטי המבחן במושגים הנראים רלבנטיים וסבירים יותר‬ ‫לנסיבות המיוחדות של הנבחן‪ .‬ ‫‪ (1‬ברירה ומיון של מועמדים לעבודה ‪ (2‬החלטה בדבר קבלת מועמדים ללימודים ‪(3‬‬ ‫הצבת חיילים לקורסים שונים ‪ (4‬זיהוי חולי נפש העשויים לצאת נשכרים מטיפול נפשי‬ ‫מסוים או מועמדים שעלולים לפתח הפרעות נפשיות‪.‬התוצאה תהיה‬ ‫שת"פ נמוך והדבר יפגע בתוקפו של המבחן‪ .‬אם תוכן המבחן נראה לנבחנים לא רלבנטי‪ .‬יעילות המבחן נמדדת במושגים של‬ ‫יכולתו לחזות את התנ' הנבחן במצבים‪/‬פעיליות כלשהן‪ .‬כדי לתקף מבחן הישגים יש‬ ‫לנתח בשיטתיות את תחום ההתנ' שמבקשים למדוד על מנת לוודא שפריטי המבחן יקיפו‬ ‫את כל ההיבטים החשובים וביחסים הנכונים )וגם לבדוק שלא ישתרבבו פנימה פריטים‬ ‫מעולמות תוכן אחרים(‪ .‬ניתן גם להשתמש בבדיקה אמפירית של הפריטים‬ ‫)ושל המבחן( כדי לראות התקדמות מכתה לכתה‪ .‫במיוחד במבחני הישגים‪ . נתוני הקריטריון נאספים פרק זמן מסוים‬ ‫מעת העברת המבחן‪ .‬מתאים בסוג מסוים של מבחנים‬ ‫מקצועיים שנועדו לברור או לסווג עובדים‪ .‬ע"ס בדיקה זו‪ .‬המידע שאפשר לשאוב מתיקוף חיזוי רלבנטי במיוחד לצרכים הבאים.‬‬ ‫תיקוף מקביל ותיקוף חיזוי‪ :‬תיקוף חיזוי.‬בד"כ אין קשר ישיר‪/‬נראה בין פריטי‬ ‫המבחן לתכונה הנמדדת )ואז אפשר לבצע סריקה שיטתית של הפריטים ולראות את‬ ‫התאמתם לתכונה הנמדדת(‪.‬כדי לאמוד את יעילות המבחן‬ ‫משווים את ביצועי הנבחן במבחן לביצועיו בקריטריון שהוא מדד ישיר ובלתי תלוי של מה‬ ‫שהמבחן נועד לנבא‪.‬ילדותי וכו'‪ .‬כמו כן‪ .‬טיפשי‪ .‬‬ ‫תוקף תלוי‪-‬קריטריון‪ :‬בשיטות תיקוף תלויות קריטריון מעריכים את תוקף המדידה לפי‬ ‫מידת הצלחתה באומדן‪/‬ניבוי של קריטריון מסוים‪ .‬ניתוח איכותי‪.‬לצורך כך יש לעשות ניתוח יסודי של מרכיבי‬ ‫העיסוק ולבנות פריטים שיהוו מדגם של התפקיד או יבדקו את המיומנות או הידע הנדרשים‬ ‫לתפקיד‪ .‬‬ ‫תוקף תוכן בעייתי ביותר לגבי מבחני אישיות למיניהם מ‪ 2 -‬סיבות‪ (1 :‬במבחני אישיות‬ ‫קשה מאוד להגדיר את גבולות תחום התוכן‪ (2 .‬וע"ס התייעצות עם מומחים בתחום‪ .‬‬ .‬שהם מבחנים תלויי קריטריון המיועדים למדוד באיזו מידה רכש‬ ‫נבחן מסוים שליטה במיומנות מסוימת או בחומר לימוד כלשהו‪ .‬‬ ‫גם לגבי מבחני כושר סוג זה של תיקוף פחות מתאים כי הם לרוב אינם מבוססים על‬ ‫יחידות לימוד מסוימות או תפקיד מוגדר שניתן לבסס עליהם את פריטי המבחן‪.‬בונים מפרטי‬ ‫מבחן אשר משמשים לבניית המבחן‪ .‬תוקף נראה הוא עניין סובייקטיבי ואינו מהווה תחליף‬ ‫לשאר סוגי התוקף שנאספים באמצעים אמפיריים‪.‬‬ ‫תוקף נראה‪ :‬לא מדובר בתוקף במובן הטכני‪ .

‬כל עוד‬ ‫הקריטריונים הללו רלבנטיים למה שהמבחן נועד לנבא‪ .‬כי לא נתון‬ ‫כלום על המדגם‪ * .‬מנסים‬ ‫לצמצם את הסיכוי שיהיו פריטים מבחינים בין קב' מנוגדות‪ .‬התשובה היא שלעיתים השימוש במבחן החדש זול‪ .‬ולשמור על ציוני המבחן‬ ‫חסויים‪.‬תרגיל‪* :‬‬ ‫חוקר בנה מבחן לבדיקת ידידותיות‪ .‬מבחני כושר ניתן לתקף‬ ..‬השאלה הנשאלת היא מדוע להשתמש במבחן באם‬ ‫קיימים כבר נתוני הקריטריון‪ .‬על בסיס גורם שאינו רלוונטי‬ ‫לקריט'‪ .‬חיוני לבנות מאגר גדול של פריטים‪.‬הושוו מתאמים בין הביצוע‬ ‫במבחן לבין שאלונים שמילאו קרובי כל נבדק‪ .‬ייעול הליך הבחירה של הפריטים לשאלון שנבנה כנגד קריט'‬ ‫אמפירי יתבסס על נסיון לצמצם את הכיווץ בתוקף‪ .‬‬ ‫זיהום הקריטריון‪ :‬מתרחש במצבים בהם הערכת הקריטריון מושפעת מציוני המבחן‬ ‫)למשל‪ .‬מבחני משכל ניתן‬ ‫לתקף אל מול ציוני בי"ס‪ .‬יתרון‪:‬‬ ‫הלימה המושלמת )או גבוהה מאוד( בין הביצוע בתפקיד לבין הקריט'‪ .‬‬ ‫קריטריונים מקובלים אחדים‪ :‬ניתן לתקף מבחן אל מול קריטריונים רבים‪ .‬לא ניתן יהיה‬ ‫לאתר בעיות בתוקף השאלון כי בחירת הפריטים נשענת על מדגם נתון‪ .‬חוקר בנה מבחן למיון עובדים לתפקיד בנכולים בבנק‪ .‬במטרה לבחון‬ ‫את תוקפו‪ .‬תוקף חיזוי‪ .‬אקראי ותלוי מדגם‪ .‬המעריך שאמור לתת את ציוני הקריטריון מודע לציוני הנבדקים במבחן ו"מתאים"‬ ‫את הערכותיו למידע מהמבחן שברשותו(‪ .‬הערכות מורים‪ .‬פשוט‬ ‫ומהיר יותר‪ .‬קריט' סופי נמדד בסוף ההתמחות‪ .‬במטרה לבחון את תוקפו‪ .‬לדוגמא‪ .‬לפיה הפריטים נבחרו כי הם‬ ‫מבחינים בין קבוצות הקריט' המנוגדות שנדגמו‪ .‬‬ ‫קריטריון ביניים וקריטריון סופי ‪ :‬רלבנטיים למבחנים שרוצים לתקף באמצעות מדידת‬ ‫הביצוע בהתמחות מסוימת‪ :‬קריט' ביניים נמדד במהלך ההתמחות‪ .‬יהיו ערכים מקסימליים‪ .‬זהו חיזוי בגלל מטרת המבחן‪ .‬‬ ‫משפר את מהימנותו ומונעת פגיעה בתוקף‪ .‬מהן נגזר ציון הקריט'‪ .‬למרות‬ ‫העברה בו"ז של המבחן והקריט'‪ .‬תוקף מקביל‪ .‬יתרון‪ :‬רמת אחידות גבוהה בתנאי איסופו‪. נתוני הקריטריון קיימים בעת העברת המבחן‪ .‬ויתכן שאינה‬ ‫תקיפה עבור מדגמים אחרים‪ .‬סטנדרטיזציה נמוכה פוגעת במהימנות המדידה ובתוקף‪ .‬חסרון‪ :‬בסוף‬ ‫ההתמחות יש לעיתים שונות לא רלבנטית גבוהה בין המועמדים וכמו כן לא תמיד ניתן‬ ‫למדוד קריט' כזה‪ .‬רופא‬ ‫בתנאי אמת לא דומה להתנ' רופא בכאילו‪ .‬אין תקופת הכשרה‪ .‬נוצרת מעגליות‪ .‬כשלתפקיד קודמת‬ ‫תקופת הכשרה‪ .‬הדבר יוצר מתאם מנופח בצורה מלאכותית‪ .‬יש‬ ‫למנוע ממי ששותף להערכת הקריטריון מידע על ציוני הנבחנים‪ .‬חסרון‪ :‬אין חפיפה מושלמת בין הקריטריון לבין הביצוע בתפקיד‪ .‬קריט' סופי‪ .‬הצפויה בעקבות תיקוף צולב‪ .‬הועבר מבחן לעובדים המועסקים בתפקיד וחושב המתאם בין הביצוע במבחן‬ ‫לבין הערכת ממונים ביחס לתפקודם של הנבדקים בתחום העיסוק‪ .‬כי‬ ‫מדובר בתכונה שאינה נלמדת‪ .‬ציונים במבחני הישגים‪ .‫תיקוף מקביל.‬חסרון‪ :‬העדר תיקוף צולב‪ .‬הרעיון הוא לאבחן מצב‬ ‫קיים ולא לחזות תוצאות צפויות‪ .‬קריט' סופי‪ .‬מדגם הומוגני‪.‬מדגם הטרוגני‪ .

‬‬ ‫בעיית קיצוץ התחום‪ :‬צמצום טווח הקריטריון‪ .1 :‬העברת מבחן למדגם נבדקים‪.‬כדי למצוא גבולות אמיתיים של הציון המנובא‪ .‬‬ ‫ניבוי ציונו של היחיד מתרחש בכמה שלבים‪ .‬מתאם בין מבחן חדש לישן‪ :‬מבחן ווקסלר מתוקף אל מול סטנפורד‬ ‫בינה‪.(y‬אך הקשר הזה אינו מובטח‪ .‬קיצוץ תחום‬ ‫יכול להתרחש גם בשל בעיה של נשירה שיטתית‪ .‬זה לא‬ ‫אומר שאין טעות‪ .‬הוצאת ס"ת של מבחן ושל קריט'‪ .3 .1.‬כשאין מתאם‪ .‬אבחון פסיכיאטרי של קבוצות‬ ‫חולים יכול לשמש לתיקוף תלוי קריטריון של מבחני אישיות‪.‬חישוב‬ ‫‪SEest‬‬ ‫ויצירת מרווח סביב הציון המנובא עפ"י רמת הבטחון‬ .‬שונה מ‪ .‬מכיוון שתוקף תלוי קריטריון מחושב‬ ‫כמתאם וכי מידת ההטרוגניות של המדגם משפיע על גובה המתאם‪ .‬קו הרגרסיה‬ ‫מקטין את טעויות הניבוי למינימום‪ .‬מאפשר לנבא את ציון הקריט' מתוך ציון המבחן‪ .‬שיפור ביכולת הקלדה לא‬ ‫בהכרח תביא לשיפור בתפקוד‪.4 .‬‬ ‫‪a‬‬ ‫ואף‬ ‫לממוצע הקריטריון‪ .‬כדי לתאר את הקשר בין ציוני המבחן לציוני הקריטריון ‪y ' = bxi + a‬‬ ‫ציון מנובא =שיפוע הקו המנובא ‪+‬ציון במבחן‪ .‬הטווח יהיה לערך ס"ת אחת‪ .‬המבחן מנבא פחות טוב את הביצוע בקריט'‪ ..6 .‬‬ ‫השוואת קבוצות מנוגדות‪ .‬מבחני אישיות אל מול ראיון פסיכיאטרי‪ .‬לתיקוף מבחן במוסיקה אפשר להשוות בין ביצועי קבוצת סטודנטים‬ ‫בקונסרבטוריון לביצועי קבוצת סטודנטים שנדגמו באקראי‪ .‬כגון מבחני משכל‪ (2 .‬ככל שתוקף הקריט' נמוך‪.‬כשהתוקף אפסי‪.5 .‬דיווח עצמי‪.‬חישוב משוואת הרגרסיה‪ .‬המבחן לא מהימן ולא תקף‬ ‫לחלוטין‪ .‬צורת הקשר בין המשתנים‪ :‬חישוב‬ ‫ת"ת קריט' מבוסס על מתאם פירסון‪ .‬שמבוסס על ההנחה כי יש קשר לניארי בין‬ ‫המשתנים )עולה‬ ‫ב‪x‬‬ ‫עולה ב ‪ .‬הציון המנובא הוא לא הציון האמיתי לחלוטין‪ .‬כאשר המדגם הטרוגני‬ ‫נוצרת בעיה של קיצוץ תחום‪ .‬‬ ‫תוקף תלוי קריטריון – יישום‪ :‬רוצים לנבא התנ' בעתיד‪ .‬הישגים בעבודה‪.7 .‬‬ ‫קבלת נתוני קריט' לגבי אותו מדגם‪ .0-‬מה נוכל להגיד על ציונו של‬ ‫‪x‬‬ ‫לגבי הצלחתו בתפקיד? משתמשים‬ ‫במשוואת הרגרסיה‪ .‬‬ ‫שיטות תיקוף תלויות קריטריון‪ (1 :‬מדידת ההישגים בלימודים ‪ -‬כאפשרות לתיקוף‬ ‫מבחנים שמודדים כושר אקדמי‪ .‬יש טעות התקן של‬ ‫האומדן ‪SEest‬‬ ‫‪SEest‬‬ ‫‪ .‬תצפית‪ .‬תוקף‪.‬‬ ‫גדלה‪ .2 .‬ואז זה ברמת ניחוש‪ .‬במבחנים בתחום התעסוקה והמיון נוצרת בעיה זו לעיתים‬ ‫מסיבות פרקטיות שכן לא ניתן לקבל את כל המועמדים שנבחנו במבחן לעבודה והקבוצה‬ ‫שממנה גוזרים את מקדם התוקף נעשית הומוגנית יותר )הטובים שהתקבלו(‪ .‬כשתוקף המבחן שואף לאפס‪.‬מדידת הביצוע במהלך תקופת‬ ‫הכשרה או בסיומה ‪ -‬לתיקוף מבחני כושר ‪ (3‬תיקוף על ידי השוואת קבוצות‬ ‫מנוגדות ‪ -‬למשל‪ .‫אל מול הערכות של מדריכים במהלך תקופת ההכשרה או בסיומה‪ .‬ניבוי ציון היחיד בקריט' עפ"י‬ ‫משוואת הרגרסיה‪ .‬הניבוי הכי טוב לכל ציון במבחן הוא ממוצע הקריט'‪ .‬‬ ‫ראיון עם בני משפחה‪ .‬בדיקת‬ ‫המתאם בין המבחן לקריט'‪.‬‬ ‫‪SEest‬‬ ‫שווה‬ ‫לס"ת של הקריט'‪ .

‬‬ ‫שואפים לאפס‪ .‬לא מול הנתון!!(‪ .‬אפשר לבדוק את הקשרים בין המבחן לבין גורמים חיצוניים‪ . כשמניחים שהמשתנה‬ ‫הנחקר נתון לשינויים התפתחותיים שחלים עם הגיל‪ .‬מושג שעוסק במידה שבה מבחן מסוים מודד מבנה תיאורטי או תכונה‬ ‫מסוימים‪ .‬זוהי אמנם שונות אמיתית אך היא אינה רלבנטית למבנה הנמדד ולכן היא‬ ‫בבחינת "רעש"‪ .‬‬ ‫שיטות לבדיקת תוקף מבנה ‪ (1 :‬שינויים התפתחותיים.‬מושג מורכב והוא כרוך באיסוף עדויות ממגוון מקורות ובתהליך של ניסוח‬ ‫השערות לבדיקתן‪ .‬הטווח יקטן ויהיה‬ ‫מדויק יותר‪ .‬ניתן לשער שאם המבחן תקף‪ .‬בין מדידות של אותה תכונה )או‬ ‫תכונות דומות ככל הניתן( בשני כלי מדידה שונים‪ (2 .‬בו בודקים אם יכולים לתמוך בתוקף מבנה או‬ ‫לשלול אותו‪ .‫הנדרשת )לבדוק מול המנובא‪ .‬‬ ‫משקפות את השינוי המשוער במבנה הפסיכו' הנמדד‪ -‬אינטליג'‪ .‬נבדוק אם ציוני המבחן ברמות גיל שונות‪.‬ו‪/‬או‬ ‫לבדוק את הקשרים הפנימיים שמתקיימים במבחן עצמו‪ .‬הטעות תקטן‪.‬מכיוון שיתכן שהמבנה הנמדד דומה למבנה אחר‬ ‫שכבר יש לו כלי מדידה‪ .‬רק מדידות עקיפות‬ ‫כדי לראות אם המבחן אכן בודק את המבחן הזה‪.‬נצפה‬ ‫למתאם נמוך‪ .‬עם מבנים לא רלוונטיים‪ .‬במידה ונקבל מתאמים גבוהים בין התכונות השונות‪ .‬כי זה עלול להראות שלמבחן‬ ‫החדש אין ערך מוסף והוא בודק למעשה את אותו מבנה‪ .. יכולים לשער על מתאמים של מבנה הנחקר עם מבנים אחרים )חרדה‬ ‫ודכאון(‪ .‬נצפה למתאם גבוה‪ .‬אלא אם מדובר על מבחן קצר‬ ‫יותר וחסכוני‪ (1 .‬ככל שהתוקף גדל‪ .‬לשם כך דרוש מתאם בין ‪ 2‬תכונות שונות שנמדדו בכלי דומה‬ ‫)תוקף מבחין חד שיטתי( או בכלים שונים )תוקף מבחין רב‪-‬שיטתי( הציפייה היא שהתוקף‬ ‫המבחין החד‪-‬שיטתי יהיה נמוך ביותר )ובכל מקרה נמוך משמעותית מהתוקף המתכנס(‬ ‫ושהתוקף המבחין הרב‪-‬שיטתי יהיה הנמוך מבין כולם‪ .‬מודדים‬ ‫תכונה מסוימת בשני כלים והמטרה היא "לנטרל" את השונות שנובעת מתגובת הנבדק‬ ‫לכלי המדידה‪ .‬ככלל‪ .‬מובחנות‪ :‬מתאמים נמוכים בין‬ ‫תכונות שונות שנמדדו בשיטות דומות ככל הניתן‪ :‬ראיון שבודק חרדה ופסיכוזה‪ .‬אי אפשר למדוד מדידה ישירה‪ .‬אמפתיה‪ .‬מבחני משכל כמו סטנפורד בינה בנויים‬ ‫על הנחה כזו‪ .‬תוקף מתכנס ‪ -‬מתאמים חיוביים גבוהים בין מבנים דומים‪ .‬במידה והשערות מתאימות‪ .‬מבנה פסיכולוגי עוסק במאפיינים‬ ‫פסיכולוגיים ועונה להגדרה של מבנה‪ .‬תוקף מבחין – מתאמים נמוכים‪.‬אך בדיקה זאת‬ ‫לא מספקת‪ .‬אין די להראות התכנסות‪ .‬זה תומך בתוקף המבנה‪ (2 .‬מתאמים עם‬ ‫מבחנים אחרים.‬ציוני‬ ‫המבחן צריכים לשקף את השיפור שחל עם הגיל‪ .‬מן הראוי לציין כי כשמוצאים שהמבחן מודד מהות שמשתפרת עם הגיל זה‬ ‫עדיין לא אומר לנו מה המבחן מודד בדיוק ולכן אין זה מידע מספיק על מנת לקבוע שהכלי‬ ‫תקף‪ .‬דהיינו "להתכנסות"‪ .‬נוכל לומר שלכלי אין‬ .‬מתאמים צריכים להיות גבוהים אך לא מדי גבוהים‪ .‬כמותית‪ .‬קל לבדוק זאת אמפירית‪ .‬אלא צריך להראות גם שהמבנה הזה‬ ‫שונה ממבנים אחרים‪ .‬‬ ‫תוקף מבנה‪ :‬תהליך של בדיקת השערות‪ .

‬נבדוק אם החלוקה לגורמים תואמת את המצופה‪ .‬תוקף גורם‪ :‬אפשר לאפיין כל‬ ‫מבחן ע"פ הגורמים העיקריים הקובעים את הציונים בו‪ .‬קשור לתוקף מבנה‪:‬‬ .83‬‬ ‫שיטתי‬ ‫שיטתי‬ ‫‪ 0.‬אותה תכונה אותו כלי‪ .‬אנו‬ ‫מניחים כי אינטליגנציה מורכבת מכושר מילולי ומכושר ביצועי‪ .‬יתכן למשל‪ . בדיקה עם מתאמים אחרים מפריכה את תוקף המבנה של הבנה עסקית‪ (3 .31‬מבחין רב‬ ‫‪0.41‬רב שיטתי ‪ =0.‬כי‬ ‫נמצא כושר נוסף המשפיע על אינטליגנציה )למשל‪ .58‬מבחין חד‬ ‫אלכסון‬ ‫‪0.66‬תוקף הגורם הוא‬ ‫למעשה המתאם בין המבחן לבין הגורם המשותף לקב' מבחנים או למדדי התנ' אחרים‪.‬למשל במבחן וקסלר‪ .52‬מתכנס‬ ‫‪ 0.41‬מבחין רב‬ ‫‪0. 0.0.‬חלוקה‬ ‫אקספלורטיבית‪ :‬נותנים למחשב לחלק לגורמים באופן אופטימלי‪ .‬בהמשך בטבלת‬ ‫הטעינויות נראה את השפעת הגורמים )מילוי וביצועי( על כל תת‪-‬מבחן‪ .‬‬ ‫חד שיטתי גדול מהמתכנס‪ .‬התוצאות מושפעות משיטת המדידה ולכן תוקף המדידה שלו‬ ‫נפגם.‬מבחין‪ -‬נמוך טוב‪.81‬‬ ‫שיטתי‬ ‫מגמה‪ :‬מבחין רב שיטתי > מבחין חד שיטתי > מתכנס > מהימנות‪ :‬שאלון יצירתיות‪ .‬חלוקה לגורמים‬ ‫במתאם אפסי זה עם זה‪ .0. אם לגורם של הבנה מילולית יש מתאם ‪ 0.31‬טוב‪ .0.‬הגורמים הגבוהים הם העיקריים והמבחינים‪ .6‬מתכנס‬ ‫יצירתיות‬ ‫ש‪ .‬וכן ע"פ משקל של כל גורם‬ ‫בקביעת הציון של הנבדקים וע"פ המתאמים בין כל מבחן לכל גורם‪ .‬‬ ‫אפשרות לחלוקה תאורטית‪ :‬מגדירים מראש מב' גורמים ע"פ הנחה תאורטית‪ .6‬מהימנות ‪ .‬ניתוח‬ ‫גורמים.‬תוקף‬ ‫‪ .82‬‬ ‫שיטתי‬ ‫עסקית‬ ‫שאלון‬ ‫‪ 0.‬ניתוח גורמים עוזר‬ ‫לזהות את הגורמים שמרכיבים‪/‬משפיעים על התכונה הנמדדת‪ .‬לאחר זיהוי הגורמים‬ ‫הללו נעזרים בהם להסבר המבנה האחראי לביצוע במבחן‪ .‫יכולת הבחנה בין התכונות‪ .‬ערכי מהימנות גבוהים יחסית‪ .‬כדי לבנות את המטריצה יש צורך במדידת ‪ 2‬תכונות לפחות באמצעות ‪ 2‬כלים‬ ‫שונים לפחות‪ .‬והמטרה תהיה‬ ‫לאשש את ההנחות התאורטיות‪ .‬כושר מרחבי(‪ .‬תוקף‬ ‫הגורם של מבחן אוצר מילים כמדד לתכונה של הבנה מילולית הוא ‪ .3‬מבחין רב‬ ‫עסקית‬ ‫הבנה עסקית‬ ‫שאלון‬ ‫הבנה עסקית‬ ‫יצירתיות‬ ‫מהימנות‬ ‫‪ 0.8‬‬ ‫‪ 0.‬מטריצת‬ ‫‪MMM‬‬ ‫היא מערך שיטתי לבדיקת תוקף מתכנס‬ ‫ומבחין‪ . מדובר בתהליך סטטיסטי שבו מחשבים מתאמים בין מבחנים‪/‬תתי מבחנים‪/‬‬ ‫פריטים ומוצאים מספר מצומצם של גורמים או תכונות משותפות‪ .‬הבנה‬ ‫‪0.‬כל מתאם כזה נקרא‬ ‫תוקף גורם.‬נצפה לראות במטריצת‬ ‫הקורלציות מתאם גבוה בין תת‪-‬מבחנים מאותו התחום )ביצועי או מילולי(‪ .83‬מבחין חד שיטתי ‪ .66‬עם מבחן אוצר מילים‪ .‬‬ ‫ראיון‬ ‫יצירתיות‬ ‫ראיון יצירתיות‬ ‫ר‪ .‬המחשב יעבד את הנתונים בהתאם למה שנקבע לו‪ .‬ראיון הבנה עיסקית‪.‬ווקסלר‬ ‫הגדיר מילולי וביצועי‪ .‬הבנה‬ ‫‪ 0.

‬הדבר ידוע כבעיה של‬ ‫קיצוץ תחום‪.‬אך לא נותן מידע לגבי מהי התכונה הנמדדת ולכן לא מהווה מדד‬ ‫מספק לתוקף המבנה של הכלי‪ (5 .‬בעית ההטיה במבחנים‪ :‬תת קב' )מיעוט( בה טעות‬ ‫קבועה בכיוון ובעוצמה‪ . b = rxy‬שיפוע=תוקף הקריט'‪ . ברירה מוקדמת של מועמדים מקטינה את מקדם התוקף לעומת‬ ‫מצב שבו כל המועמדים היו מתקבלים ולכולם היו נתוני קריטריון‪ .‬‬ ‫‪.1‬‬ ‫עשוי להיות בעל תוקף חיזוי גבוה באוכלוסיה מסוימת ובעל תוקף חיזוי נמוך באוכלוסיה‬ ‫אחרת‪.‬גוזרים השערה רלוונטית‪ -‬גורם המאיים על האני‬ ‫יגביר את רמת החרדה‪ .‬מגובשת‪ .‬‬ ‫ונקבל ‪ . מבצעים מניפולציה ניסויית‬ ‫על המבנה הנמדד ובודקים אם התוצאות הן בכיוון שמצופה‪ -‬המבנה התיאורטי "מתנהג"‬ ‫כפי שמשערים‪ .‬ולכן ניתוח הגורמים עוזר לנו לבדוק שאכן המושג )אינטיליגנציה(‬ ‫נורכב מגורמים אלו‪ (4 . ככל שמהדגם הטרוגני יותר‪ .‬אזי הדבר תומך בתוקף המבנה של הכלי‪ .‬אך למעשה בקריט' יתקבל‬ ‫ציון שונה‪ .‬אם לא‪ .‬‬ ‫‪.‬הכלי לא מספיק רגיש. מקדם המתאם של פירסון מבוסס על‬ ‫ההנחה כי קיים קשר לינארי בין ציוני המבחן לציוני הקריטריון‪ .‬עקיבות פנימית.‬דבר זה לא תמיד מתרחש‬ ‫)עמ' ‪.‬יתכן והמשוואה שלנו לא‬ ‫מתאימה לכל חלקי האוכ' אותה אנו בודקים‪ .‬ ‫בדיקת תוקף המבנה של שאלון חרדה‪ .‬התערבות ניסויית. מדובר במדד של הומוגניות ולכן הוא רלבנטי‬ ‫רק כאשר מניחים שהמבנה הנמדד הומוגני‪ .‬ציון זהה בפסיכומטרי‬ ‫וב‪BA‬‬ ‫ציון שונה‪.‬יש קב' באוכ' שעבורן שימוש במשוואת‬ ‫הרגרסיה הוא שימוש מוטה‪ .‬כך יגדל מקדם התוקף‪ .‫בתוקף מבנה אנו בודקים שהמבחן אכן מודד מהות )תכונה( מסוימת‪ .‬נצפה כי רמת החרדה תהיה גבוהה בקרב קב'‬ ‫הניסוי בהשוואה לקב' הביקורת‪.‬אך הממוצעים שלהם שונים גם במבחן וגם בקריטריון‪ .‬שמוגדרת במונחים‬ ‫של מבנה ‪ -‬כאן למשל אנו מניחים )על‪-‬פי תיאוריה מסוימת!( כי אינטליגנציה מורכבת מ‪2-‬‬ ‫גורמים או ‪ 3‬גורמים‪ .(158‬‬ ‫יש להשתמש במשוואות רגרסיות שונות עבור אוכ' שונות‪ .‬יתכן ובמבחן שניהם קיבלו אותו ציון‪ .‬מניחים שהשונות שהתקבלה במבחן זהה לשנות הקריטריון‪.‬ולבנות הליך ניסוי הכולל מניפולציה מעוררת חרדה ולבדוק את‬ ‫מידת החרדה לאחר הפעלת המניפולציה‪ .‬קב' המיעוט פחות טובה‬ .2‬‬ ‫ברירה מוקדמת.‬‬ ‫יחידה ‪ – 7‬תוקף מדידה ופרוש‬ ‫תנאים המשפיעים על מקדם התוקף‬ ‫הטרוגניות המדגם.‬מבחן‬ ‫‪.3‬‬ ‫צורת הקשר בין המבחן לקריטריון.‬מאפשר לגלות אם אכן מודדים תכונה‬ ‫הומוגנית‪ .‬‬ ‫מצב של שוני שמשקף מציאות לקב' הרוב ולקב' המיעוט אותו שיפוע ואותה נקודת‬ ‫חתך‪ .

‬פחות משל הרוב‪.‬‬ ‫מנסים לבדוק את תרומתו של המבחן לחיזוי התכונה או את תרומתו‪ .‬‬ ‫תרשים פיזור מאפשר לחקור את הישגי הנבדקים במבחן ובקריטריון‪.‬‬ ‫ברשותנו מבחן ואנו רוצים להעריך עד כמה יוכל השימוש בו לעזור לחזות את ההתנהגות‪.‬ניבוי יתר לקב'‬ ‫המיעוט ‪ -‬מקבלים אנשים שלא היו מתקבלים לו נעשה שימוש בקו רגרסיה מתאים‪ .‬המתאימים לקו רגרסיה משלהם‪ .‬‬ ‫הטייה בנקודת החתך )‪ (a‬עושים מדגם חדש למיעוט‪ .77.‬‬ ‫מוצאים ציונים במבחן נמוכים מהרוב‪ .‬את קבה"ח – תוקף מוסף‪.‬שונויות שוות‪ .‬מחסירים ממנה את שעור הבסיס‪ .‬נובע כנראה מבעיה מתודולוגית‪ .‬שעור הבסיס‪ % :‬המועמדים המצליחים בקריט' ללא כל קשר‬ ‫להישגים במבחן‪ .‫בקריט'‪ .‬כשהשיפוע‬ ‫של קבוצת המיעוט נמוך משל קבוצת הרוב ניתן לומר שהמבחן תקף פחות עבורה‪ .‬כשאין הטיה סטטיסטית‪ .‬היו מתקבלים(‪ .‬אין להטיה זו תיקון‬ ‫סטטיסטי‪.‬בד"כ ‪ .‬ללא מיון‪ .‬‬ ‫הטיית השיפוע )‪ (b‬מתקיימת כשהשיפוע שונה בשתי הקבוצות‪ .‬התוקף זהה עבור ‪ 2‬הקבוצות אך נקודות החתך עם‬ ‫ציר הקריטריון שונות‪ .‬‬ ‫קבלה תקפה = הצליחו במבחן והצליחו בקריטריון‬ .‬הניבוי שונה‪ .‬שווה להשתמש במבחן‪.60%‬נבוי מוצלח בעזרת המבחן‪ :‬קבלה תקיפה חלקי סך כל‬ ‫הקבלות‪ .‬‬ ‫האם ישפר את תהליך קבלת ההחלטות? גישת הבסיס‪ :‬מתמקדת בחקירת התפלגות הישגי‬ ‫הנבדקים במבחן ובקריט'‪ .‬אין הטיה! אותו קו רגרסיה‪.‬ואם ה חיובי‪ .‬יעיל‬ ‫יותר לחיזוי הקריטריון בקבוצה מסוימת מאשר לחיזויו בקבוצה אחרת‪ .7% .‬אנו מנבאים את ציוני‬ ‫הקריטריון של המיעוט באמצעות הרוב ובכך פוגעים בסיכויי הקבלה שלהם )בעוד שעם‬ ‫ציוני מבחן נמוכים יותר‪ .‬ומקבלים את הנתונים שלהם‪.‬מנבאים למיעוט ניבוי חסר‪ .‬אין חיזוי בעזרת מבחן קודם‪ :‬קבלה תקיפה ‪+‬דחיה שגויה חלקי‬ ‫כלל המועמדים‪ .‬האם המבחן משפר‬ ‫את הניבוי‪ .‬המצב משקף למעשה את המציאות והמבחן תקף באותה מידה עבור שתי‬ ‫הקבוצות‪ .‬אנסטזי‬ ‫טוענת שמצב זה הוא תיאורטי בלבד ולמעשה אינו מתקיים בפועל משום שקב' המיעוט‬ ‫נכללת בקב' התיקוף הכללית של המבחן‪ .‬תיאורטית השימוש במקרה זה אינו הוגן מפני‬ ‫שהכלי תקף עבור קב' ‪ 1‬יותר מאשר עבור השניה‪ .‬דהיינו "אפליה מתקנת"‪ .‬בתוקף תלוי קריט'‪.‬‬ ‫שימוש הוגן במבחנים ‪ -‬פתרון לבעיית ההטיה ‪ (1‬קביעת ציוני מעבר נפרדים לכל‬ ‫קבוצה ‪ (2‬קביעת ציון חתך אחיד בקריטריון וניבויו על פי ‪ 2‬משוואות רגרסיה שונות‪(3 .‬‬ ‫קביעת מכסות ברירה‪ .‬‬ ‫תורת ההחלטות היא ביסודה נסיון להקנות לתהליך קבלת ההחלטות מסגרת מתמטית‬ ‫שתאפשר להשתמש במידע זמין כדי להגיע להחלטה היעילה ביותר בנסיבות נתונות‪.‬יכול להיות‬ ‫שהראשון מקב' המיעוט קיבל ציון נמוך מהאחרון שלא התקבל מהרוב‪ .‬ציון‬ ‫המנבא הממוצע של המיעוט גבוה יותר ולכן יתקבלו גם כשלמעשה שיעור ההצלחה שלהם‬ ‫בקריטריון עבור ציון זה‪ .

‬בקריטריון לעומת מה שנחשב ביצוע כושל בו‬ ‫יחס ברירה.‬כשאין יחס‬ ‫ברירה כפי שהתקבל בתרגיל‪ .‬שיעור‬ ‫ההצלחות בניבוי יהיה גבוה יותר‪ .‬למעשה‪ .‬‬ ‫קביעת נקודת החתך בקריטריון משמשת להחלטה לגבי מה שנחשב ביצוע מוצלח‬ ‫‪.‬או רוב‬ ‫המועמדים מתקבלים‪ .‬‬ ‫השפעת תוקף המבחן על ‪ %‬ההצלחות בניבוי.‬למשל‬ ‫‪ .‬זה מהווה אומדן‬ ‫לתרומת המבחן לתהליך הקבלה‪.‬יש בעיה כי תחום העיסוק מורכב‪ .‬קרי‪ .‬ונצטרך עוד מבחנים כדי לקבל כלי מנבא‪ .‬העליה ב‪ % -‬ההצלחה בניבוי מכונה תוקף מוסף‪.‬לכן תרומת המבחן לשיעור ההצלחות בניבוי תגדל סביב ערך שיעור בסיס ממוצע‬ ‫)שעור בסיס אופטימלי לקבלת ‪ %‬ניבוי גבוהים סביב ‪ * .‬שיעור ההצלחות בניבוי קטן‪ .‬תרומת המבחן לניבוי‬ ‫צפויה להיות נמוכה יותר‪ .6 .0.2‬רמת הסיכון הכרוכה בקבלת אנשים שיכשלו או ההפסד העלול להיגרם בשל דחיית‬ ‫מועמד שיצליח‪.‬‬ ‫התוקף המוסף מייצג‪ .1‬אילוצים של היצע וביקוש‬ ‫‪ .‬‬ ‫כששיעור הבסיס קרוב ל‪ 100% -‬אין צורך להשתמש במבחן משום שממילא כל‪ .‬מתקבלים יותר מועמדים‪ .(0. קבלה תקפה ‪ +‬קבלה‬ ‫שגויה ‪ /‬סך כל המועמדים‪ .‬הטבלאות מתייחסות לשיעורים בסיסיים שונים‬ ‫ומתארות את ‪ %‬ההצלחה בניבוי כפונקציה של תוקף המבחן‪ .‬גם אז תרומת המבחן תהיה קטנה‬ ‫משום שקשה לנבא באמצעות מבחן יחיד את ההצלחה בקריט' ויש צורך בהליך מיון‬ ‫מורכב‪ .‬עושים ממוצע לערכי הניבוי‪ .‬שעור בסיס קטן‪ .‬‬ ‫* הקשר בין שיעור הבסיס ל ‪ %‬ההצלחות בניבוי ‪ -‬צורה גרפית כעקומת‬ ‫‪U‬‬ ‫הפוכה‪. ככל שהתוקף גבוה יותר‪ .‬כאשר נתונים שני מבחנים‪ .‬ניתן להשוות בין ‪ 2‬הניבויים המוצלחים שלהם‬ ‫טבלאות טיילור ראסל מסייעות לקבוע את תוספת הדיוק המתקבלת עקב השימוש‬ ‫במבחן )לעומת מצב של אי שימוש בו(‪ .‬‬ ‫‪.‬את העליה בתוקף החיזוי שניתן לייחס למבחן‪ .קביעת נקודת החתך )ציון המעבד בקריטריון( תלויה בכל מיני גורמים‪ .‬ובמצב זה‬ ‫תרומת מבחן אחד קטנה מאוד‪ .‬‬ ‫כלומר‪ .‬‬ ‫תועלת מצופה‬ ‫‪EU‬‬ ‫בשיטה זו מבצעים חישוב של עלות כ"א מטעויות הניבוי )קבלה‬ ‫שגויה‪/‬דחיה שגויה( ושל הרווח מניבוי מוצלח )קבלה תקפה‪/‬דחיה תקפה(‪ .‬דהיינו.‬ומחסירים מהתוצאה את שעור‬ ‫הבסיס‪.‬יעילות המבחן.5‬ככל שיחס הברירה גדל‪. שיעור המתקבלים מסך כל המועמדים‪ .‬אם בסופו של‬ . ניבוי מוצלח ‪ -‬שיעור הבסיס‪ .‫"‬ ‫קבלה שגויה =‬ ‫"‬ ‫"‬ ‫ונכשלו‬ ‫דחיה תקפה = נכשלו במבחן ונכשלו בקריטריון‬ ‫"‬ ‫דחיה שגויה =‬ ‫"‬ ‫והצליחו בקריטריון‬ ‫.‬כששיעור הבסיס נמוך מאוד‪ .‬את‬ ‫תרומת המבחן לתהליך ברירה המועמדים‪.‬שיעור הבסיס ויחס הברירה‪.

מבחן א' הוא מבחן מיון מקוצר שעל פיו קובעים קבוצת מתקבלים‬ ‫ראשונים וקבוצת נדחים‪ .‬למשל.‬ביסודו של דבר‬ ‫על מתאמים בין כל מבחן לקריטריון וגם על מתאמים שבין המבחנים עצמם‪ .‬משוואה זו מבוססת‪ .‬במצבים מסוימים ניתן‬ ‫להשתמש במשתנה מדכא. מכיוון שהמדגם ששימש לחישוב משוואת‬ ‫הרגרסיה המקורית אינו זהה למדגם המועמדים שבודקים הלכה למעשה כשממיינים אותם‬ ‫לעבודה‪ .‬לא מוסיפים מידע‬ ‫רב( יקבלו משקל נמוך ממבחנים בעלי מתאם נמוך זה עם זה‪ .‬הכללה‪ :‬מתוך תרגיל‪:‬‬ .‬תיקוף צולב.‬‬ ‫אסטרטגיה סדרתית אפשר להשתמש במבחנים כדי לקבל החלטות סדרתיות‪ .‫דבר יש רווח )סימן חיובי( אזי ניתן לומר שהשימוש במבחן מועיל‪ . לקחת מדגם אחר ולבדוק עליו את משוואת הרגרסיה )כמובן שמחשבים‬ ‫את המתאם בין ציוני המבחן לציוני הקריטריון של מדגם זה(‪ .‬מאשר במבחן הטרוגני בודד )שהרי במבחנים כאלו קשה לאפיין את מהות הציון‬ ‫המתקבל(‪.‬שונים )שבודקים אותו עולם תוכן ואמורים לנבא אותו קריט‬ ‫שילוב מידע ממבחנים שונים כדי לחזות קריטריון מורכב יש להשתמש )לעיתים( בכמה‬ ‫מבחנים‪ .‬דהיינו‪ .‬יתרון‪ * :‬כשהקשר בין המבחנים‬ ‫לקריט' לניארי ומצטבר אפשר לקבל בשיטת הרגרסיה המרובה מס' החלטות נכונות רב‬ ‫יותר מציוני המעבר‪ * .‬ולאו‬ ‫דווקא סופיות‪ .‬‬ ‫משוואת רגרסיה מרובה בשיטה זו ניתן לנבא לכל מועמד את הציון הצפוי לו בקריטריון‬ ‫על פי מס' מבחנים המשמשים לניבוי אותו קריטריון‪ .‬ניתן להניח שלמדגם החדש יש קו רגרסיה שונה במקצת‪ .‬למשל‪ .‬שימוש בקו‬ ‫הרגרסיה המקורי שחושב יגרום להטיה‪ .‬נתוני הקריטריון "יתכווצו" במצב כזה ולכן יש‬ ‫לבצע תיקוף צולב.‬מספקת אומדן של ציון הקריט' של כל נבדק ומאפשרת להגיע‬ ‫להערכה יחסית של כל הנבדקים‪ .‬בד"כ עדיף להשתמש במבחנים שכ"א מהם הוא הומוגני ומודד היבט אחר של‬ ‫הקריטריון‪ .‬עם קבוצת המתקבלים ממשיכים למבחן ב' שרק לאחריו קובעים‬ ‫מי מתקבל באופן סופי‪ .‬מתאים‪ .‬כאשר מבחנים‬ ‫בעלי מתאם גבוה עם הקריטריון יקבלו משקל רב יותר ממבחנים בעלי מתאם נמוך עם‬ ‫הקריטריון וכמו כן מבחנים שיש להם מתאם גבוה אחד עם השני )כלומר‪ . מבחן שנמצא במתאם אפסי עם הקריטריון ובמתאם גבוה עם‬ ‫מבחן אחר יחושב במשוואת הרגרסיה כשערכו שלילי‪ .‬עם זאת תמיד יהיה עדיף לתקן את‬ ‫מערכת המבחנים מאשר להשתמש בדרך עקיפה זו‪ .‬המטרה היא למקסם את‬ ‫התועלת מאסטרטגית ההחלטה‬ ‫חישוב התועלת המצופה‪ :‬מכפילים את אומדן התועלת של כל קטגוריית החלטה בשיעור‬ ‫היחסי של הקטגוריה מסך כל הנבחנים ולאחר מכן מחברים את ‪ 4‬הנתונים ומפחיתים את‬ ‫)עלות השימוש במבחן‬ ‫ממבחנים ‪EU‬‬ ‫אופטימלי וכמו כן ניתן‬ ‫להשוות ‪EU‬‬ ‫ניתן להזיז את נקודת החיתוך כדי לקבל‬ ‫‪').‬לאבחון מחלות נפשיות‪ .‬ששיעור הבסיס בהן נמוך‬ ‫מאוד‪.

‬חישוב ציוני הקריט' החזויים לגבי אלה שהתקבלו‬ ‫בעזרת הרגרסיה‪.‬ציוני מעבר‬ ‫מרובים בשיטה זו קובעים ציוני מעבר במבחנים השונים.‬ואופן שקלולם‪ . עברת אל הסף בכל המבחנים‬ ‫‪ <-‬התקבלת! נכשלת באחד מהם ‪ <---‬לא תוכל להתקבל שכן לא תצליח בקריטריון‪.‬תיקוף צולב מאפשר לבדוק את מידת ההכללה של‬ ‫משוואת הניבוי שחושבה ע"פ נתוני מדגם מקרי‪ .‬‬ ‫במחקר או בתהליכי הערכה שונים בד"כ אין עניין בקשרים בין משתנים בגבולות מדגם‬ ‫מסוים בלבד‪ .‬חישוב המתאמים בין ציוני הקריטריון המנובאים‪ .‬הפיצוי יוביל לטעות!( יתרון‪ * :‬שאלת הכישורים המפצים‪.‬עבור כל אחד מהקריטריונים‬ ‫ניתן להשתמש במנבא יחיד או בכמה מנבאים‪ (4 .‬שילוב השיטות‪ .‬למעשה‪ .‬מיון.‬ ‫קבלת ההחלטות נעשית בהתאם לקריטריון יחיד בעל מספר דרגות‪ .1 :‬שימוש בשיטת ציוני המעבר כדי לדחות את מי‬ ‫שציוניהם נמוכים בכל מבחן שהוא‪ .‬‬ ‫הקריטריון דיכוטומי‪ .‬תוקף מבדיל.‬מאפשר‬ ‫לקבל אומדן ביחס לתוקף הניבוי של משוואה זו‪ .‬לבין אלו שהתקבלו בפועל‬ ‫)על ידי איסוף ישיר( לגבי מדגם אחר מזה ששימש לבניית משוואת הרגרסיה‪ . קבלת ההחלטות נעשית בהתאם‬ ‫למספר קריטריונים ותוך שימוש במנבאים רבים‪ .‬‬ ‫כלומר‪ .‬לגבי מדגמים אחרים )או ביחס לאוכלוסיה‬ ‫הרחבה(‪ .‬הפער בין תוקף הניבוי עבור שני המדגמים לא צפוי להיות קיצוני‪ .‬אין לקבל מועמדים עם ציון נמוך במיומנות זו )בשימוש במשוואת רגרסיה הם‬ ‫עלולים להתקבל שכן מיומנויות אחרות עשויות "לפצות" על המיומנות החלשה‪ .‬עם זאת‪ .‬תוקף הניבוי שיתקבל באמצעות משוואת הרגרסיה צפוי‬ ‫להיות חלש יותר במדגם הנוסף )בהשוואה לתוקף הניבוי עבור המדגם המקורי( אולם הוא‬ ‫מייצג אומדן נכון יותר לתוקף הניבוי של המערכת‪ .‬כלומר‪ .‬הצטיינות בתחום מסוים עלולה לפצות על חסר בולט‬ ‫במיומנות אחרת‪ . רלבנטי במערכת מבחני‬ ‫מיון‪ .‫משוואת הרגרסיה היא "מכשיר" הניבוי‪ .‬גם במקרה זה ניתן‬ ‫להשתמש במנבא יחיד או במס' מנבאים‪ (3 .‬אך אם‬ ‫המיומנות החלשה הכרחית‪ .‬כל מנבא צריך להיות במתאם גבוה עם הקריט' שאותו נועד לנבא ובמתאם נמוך עם‬ .‬בשל הבדלי דגימה‪ . כל מועמד מתקבל או נדחה‪.‬כל עוד לא התגלו בעיות דגימה‬ ‫משמעותיות‪ .‬העובדה‬ ‫שהתגלו פערים חריפים בין מקדמי התוקף במדגם המקורי לזה המאוחר מחייבת בדיקה‬ ‫נוספת של המדדים השונים‪ .‬‬ ‫שימוש במבחנים למטרות מיון ‪ (1‬ברירת מועמדים.‬המתקבל באמצעות נתוני מדגם תקנון כלשהו‪.‬השמה.‬ניתן להשתמש במנבא )מבחן( יחיד או במערכת מנבאים‪ (2 .‬לגבי אוכלוסיה יעד שמעבר לגבולות‬ ‫המדגם ששימש לבנייתה‪ .‬לניבוי הקריטריון המבוקש‪ .‬‬‫השיטה טובה למצב שבו המדגם הטרוגני ולא ניתן למצוא מתאם מובהק בין המבחן‬ ‫לקריטריון‪ .‬‬ ‫במשוואת הרגרסיה נבדק שקיבל ציון נמוך במבחן אחד יכול לקבל ציון כללי סביר משום‬ ‫שהצטיין במבחן אחר המשוואה‪ .‬או למצב שבו ישנה מיומנות ספציפית שהיא חיונית במיוחד ואין לה תחליף‪.

‬לכן התיקון שבוצע הוא מינימלי וחיוני לקבלת מקדמי התוקף לכלל האוכ'‪(2 .‬‬ ‫כיוון שלא תעשה ברירה עצמית‪ .‬אינה בלתי תלויה‬ ‫ברקע התרבותי‪/‬חברתי של הנבחן‪ .‬‬ .‬כי ניתן לראות שהוא יוצר עוינות ומרמור באוכ'‪ .‬המתאמים הגבוהים בין בגרות לפסיכו'‬ ‫מהווים אומדני חסר למקדמי התוקף האמיתיים מאחר וישנו קיצוץ תחום שנבע מברירה‪.‬הוגנות חברתית‪ :‬אסור לבלר לזלזל בתוקף‬ ‫הנראה‪ .‬מחיר כבד לתלמידים‪ .‬רמת הוראה תיפגם‪.‬אופי החינוך‪-‬‬ ‫המע' החינוכית משועבדת למבנה בחינת הבגרות ולדרישות הקבלה לאוני'‪ .‬מבחן הפסיכו' תקף‪ .‬הבעיה היא חברתית‪ (2 .‬הוגן ולא מלווה בניבוי יתר‪/‬חסר‪ .‬‬ ‫כלומר‪ .‬נבדוק למעשה אם יש מצב שלכל אחד ממבחני הבגרות יש תוקף‬ ‫שונה )מתאם שונה(‪.‬חסרון‪:‬‬ ‫כיתות גדולות וצפופות‪ .‬זה יביא להערכת חסר‬ ‫ולא ליתר‪ .‬מקדמי התוקף משתנים ברמת ההטיה מפקולטה לפקולטה‪ .‬כל מועמד יתקבל‬ ‫לכל חוג שירצה בו ויוכל להמשיך ללמוד בו כל עוד השיג ציון עובר בלימודיו‪ .‬יש‬ ‫נטיה לבלבל בין עניין ההטיה של מבחנים לבין האפשרות של הטיה בתוכנם של פרטים‬ ‫מסוימים הכלולים במבחן‪ .‬תגובת בלר‪:‬‬ ‫מודה שיש קיצוץ תחום אך טוענת‪ (1 :‬אם יקבלו את כולם ללימודים‪ .‬מצליחות פחות גם במדדים של הקריט' הרלוונטי‪.‬בזבוז זמן וכסף‪ 2 .‬‬ ‫מאמר‪:‬יעילות‪ :‬הסטו' שנכללו במחקר התיקוף היו אלה שהתקבלו לאוני' ע"י הבחינות‬ ‫והתמידו בלימודיהם עד סוף השנה ה ‪ 1‬לפחות‪ .‬טענת איילון ויוגב‪ :‬יש בעיתיות בבדיקת התוקף‪ .‬עובדות עיקריות‬ ‫שמתייחסות לטענה כי מע' המיון מוטה לרעת קב' מועמדים מסוימת‪ (1 :‬הבדלים בהצלחה‬ ‫במבחנים בין קבוצות שונות נתפסים לעיתים כעדות להטיה במבחן‪ .‬ההטיה נובעת‬ ‫מסלקציה מוקדמת‪ (1 :‬במצב של סלקציה מוקדמת‪ .‬פתרונות‪ (1 :‬קבלה פתוחה לגמרי‪ .‬יכולה להיות הערכת יתר של‬ ‫משתנים שבהכרח רלוונטים ובו בזמן הערכת חסר של משתנים שהם חשובים‪ <-‬חישוב‬ ‫מקדם תוקף לא מהימן‪ (2 .‬חסרון‪ :‬עלויות רבות‪ .‬כלומר‪ .‫קריטריונים אחרים‪ .‬יירשמו יותר תלמידים מה שיצריך המון משאבים‪(2 .‬‬ ‫קבלה פתוחה רק לשנת הלימודים הראשונה ומיון התלמידים במעבר לשנה ב ע"פ‬ ‫הישגיהם‪ .‬‬ ‫מהנתונים עולה כי שילוב בין בגרות לפסיכו' מניב תוקף ניבוי גבוה מאוד‪ .‬כי‬ ‫לכל פקולטה חתך קבלה שונה‪ .‬הוגנות‬ ‫חברתית‪ :‬מחקרים הוכיחו שמגזרים שונים )הבדלים סוציואקונומיים‪ /‬אתניים( נבדלים‬ ‫במידת הצלחתם במבחני מיון‪ .‬רמה ממוצעת נמוכה יותר של תלמידים‪ <..‬תוך התעלמות מוחלטת‬ ‫מהבדלים בהצלחתן של קבוצות אלה בקריט' החיצוני שהמבחן מיועד לחזות‪ <-‬קבוצות‬ ‫שהצלחתן במבחנים נמוכה יחסית‪ .‬במקום לבטל סוללת מבחנים שלמה‪ .‬צריך לבטל‬ ‫פרטים מסוימים‪ .‬השפעות עקיפות‪ :‬ריבוי מכוני‬ ‫הכנה לפסיכו' יוצר תחושה שבחינת הפסיכו' מהווה מכשול שיש לעוברו‪ .‬כלומר התפלגות ההישגים במבחנים אלה‪ .‬וכך נוצר קושי להשוות בין כושר הניבוי של ציונים‬ ‫המשמשים חזאים בפקולטה אחת לאחרת‪ .

‬‬ ‫יחידה ‪ – 8‬ניתוח פריטים‬ ‫יתרונות‪ :‬מאפשר לשפר את מהימנות ותוקף המדידה‪ .‬נוכל להשוות ביניהם‪ .(150‬מדדי הבחנה‪ :‬אם מד חום לא מודד חום‪ .‬מידע‬ ‫מילולי‪ .‬חוצמהמבחן הנבדק‪ .<-‬מאון=‪ .P0. P0.‬תצפית‪ .‬הבנת הפריט‪ .50‬ערך מקס' של ‪ .‬‬ ‫‪D‬‬ ‫‪P‬‬ ‫יורד‪ .‬או נקטין את‬ ‫‪P‬‬ ‫‪P0.‬‬ ‫‪ .84 .‬ניתוח כמותי‪ :‬קושי הפריט‪ .‬דלתא ‪ .‬בערכים של שכיחויות‪ .‬קריטריון פנימי‪ :‬הציון במבחן כולו‪ .‬סולמות רווחים )‪ (Z‬מתאים לשימוש רק כשהתכונה‬ ‫הנמדדת מתפלגת נורמלית‪ .‬פריטים בלעי רמת קושי זהה יתכנו מדדי הבחנה שונים‪ .‬להבדיל‬ ‫מסולם רווח‪ .‬לא מהימן וללא יכולת הבחנה‬ ‫בין הרמות‪ .‬מדד‬ ‫‪D‬‬ ‫שלילי מלמד על פריט לא טוב‪ .6‬‬ ‫פתוח‪ .‫בחוגים מסוימים בנוסף לסלקציה המוקדמת‪ .‬הוספת סימן שלילי ל ‪!! Z‬ניחוש‪ :‬פריט סגור‬ ‫לא שקולים‪ .a‬‬ ‫גדולים‬ .‬קושי הפריט = ‪ .84‬חיפוש המאון‬ ‫המשלים בטבלה‪ .‬קושי מסומן בגרף מימין לשמאל ‪ .‬קריט' חיצוני‪ .(SB‬בניתוח פריטים‪ .‬מדד‬ ‫‪D‬‬ ‫‪ :‬הפרש בין העונים נכונה על הפריט בקב'‬ ‫קריט' מנוגדות‪ % :‬העונים נכונה בגבוהי היכולת פחות ‪ %‬העונים נכונה בנמוכי היכולת‪.‬הניחוש‬ ‫מגדיל את הסיכוי לענות נכונה‪ .‬חסרים פריטים קשים שיוכלו להבחין בין הנבדקים )ווקסלר‪ .‬או מתסכל(‪ .6‬‬ ‫לעומת פתוח ‪.‬קושי הבחנה בין נבדקים גבוהי‪/‬נמוכי יכולת‪ .Z=1 .D=100‬בערכי‬ ‫קיצוניים‪.‬ניתוח על סמך‬ ‫מבחנים אחרים‪ .‬דיכוטומי‪ .‬קיצור המבחן אינו אקראי‪ .‬תאורית המהימנות הקלאסית מניחה כי כל פרטי המבחן מודדים אותו‬ ‫דבר )‪ .‬‬ ‫הקשר בין התפ' ציוני המבחן וקושי הפריט‪ :‬קושי הפריטים )לא פריט בודד(‪ :‬מדד‬ ‫כוללני‪ .‬כלומר‪ .‬במבחן מסוים‪.‬קיצוץ תחום‬ ‫נוסף‪ -‬קב' הומוגנית‪ <-‬שונות אמיתית קטנה‪ <-‬ירידה במתאם בין החזאים לקריט'‪.‬‬ ‫‪Z‬‬ ‫שלילי‪ .‬יש תלות בין קושי‬ ‫הפריט ליכולת ההבחנה שלו‪ .P0.‬מתאם בין פריט אחד לאחר‪ .‬אם התנ' בפריט אחד זהה להתנ' בכל‬ ‫המבחן או בשאר הפריטים‪ .‬אלא מבוסס על בדיקת תרומתם‬ ‫למדידה‪ .‬מחשב את היחסים בין ‪ 2‬הקב' התקפות ו ‪2‬‬ ‫הקב' השגויות‪ .‬לא תקף‪ .‬סולם דלתא‪ :‬סולם רווח הבנוי כטרנספורמציה לניארית ע"ב‬ ‫סולם ‪ .Z‬ממוצע ‪ .‬ובו"ז לקצר את אורכה )פחות‬ ‫מתיש‪ .‬מדדי הבחנה המחושבים כמתאמים‪ :‬מתאם פי‪:‬‬ ‫עבר‪/‬נכשל‪ .‬נצפה‬ ‫ל ‪d.‬אין השוואה בין פריטים‪ .‬פי חיובי‪-‬מבחן מבחין‪ .‬גבול נמוך‪.1-25‬‬ ‫∆‪-‬נוסחת המרה‪-Z-‬טבלה‪-‬מאון‪) P-‬רמת קושי(‪.50‬פריט‬ ‫קל‪.‬אפס‪ .7‬‬ ‫סולם סדר‪ .‬יש סלקציה עצמית‪ .‬משמיטים פרטים פחות מתאימים‪ .‬ניתוח פריטים איכותי‪ -‬תוכן‪ .‬גודל יחידת הסולם לא סטנדרטי‪ .13‬טווח ‪.P=0.‬קושי עולה‪ .‬שעור המשיבים נכונה‬ ‫‪P.‬הפריט לא מבחין בין גבוה לנמוך‪% .‬מתאים לשימוש כשניתן להניח כי המדגם מייצג נכונה את האוכ' וכי התכונה‬ ‫הנחקרת מתפלגת נורמלית‪ .‬שוגים בקב'‬ ‫נמוכה‪ .‬‬ ‫‪ D=100.5‬‬ ‫קשה יותר מ ‪.‬רק אם נגדיל את‬ ‫‪P‬‬ ‫סגור‪ . 100‬אחוז עונים נכונה בגבוה ואפס עונים נכונה בנמוך‪ % 100 :-100 .1-0.‬גם בפריט וגם בקריט'‪ .‬ולא אחוזים‪ .1-13‬מאון גבוה מ ‪ .‬‬ ‫הרבה הצליחו‪ .‬‬ ‫המשיבים נכונה שווה בין הנמוך לגבוה‪ .

‬אך אינם כאלה‪ .‬כשמודל‬ ‫‪IRT‬‬ ‫מתאים לנתונים שהוא אמור לתאר‪ .‬‬ ‫לנבחנים בעלי אותה רמת יכולת יש הסתברות שווה לתשובה נכונה על הפריט‪ .‬נרצה להוריד אותו כי הוא קל מדי‪ .‬אי‬ ‫תלות במדגם הנבחנים‪ .‬גורמים להערכות לא מדויקות של‬ ‫מהימנות המבחנים‪ .‬או לניבוי‪ .P‬כל העונים נכונה חלקי כלל המשיבים‪.‬הנחות המודל‪ :‬ההנחה כי טעויות המדידה שוות לכל הנבחנים אינה סבירה‬ ‫ברוב המקרים‪ .‬‬ ‫אין תלות סטטיסטית בין התשובות לכל שני פריטים‪ .‬נכון‪/‬לא נכון‪ .‬ע"י גורם‬ ‫אחד או כמה גורמים‪ .‬תכונות חבויות או יכולות‪ (2 .‬אומדני הפרמטרים של המודל יהיו בעלי התכונות‬ ‫הבאות‪ :‬תכונת הקביעות – ‪ (1‬אי תלות באוסף הפריטים המסוים שנבחר למבחן‪ (2 .IRT‬ואחד המאפיינים‬ ‫החשובים ביותר המבחינים בינה לבין תורת המדידה הקלאסית‪ .‬בודקים‬ ‫ממוצע קבוצתי בפריט ובקריט'‪ .ICC‬והיא מתארת כיצד‬ ‫עולה ההסתברות שנבחן ישיב תשובה נכונה על פריט ככל שיכולתו גבוהה יותר‪ .‬תכונת הקביעות היא אבן היסוד של ה ‪ .‬חוסר היכולת להשוות בין ציוני נבחנים שונים בנוסחים שונים של‬ ‫המבחן‪ (3 .‬אם‬ ‫כמות העונים זהה‪ .Y‬תשובת ממן‪ * :‬במושג "קביעות פרמטר היכולת" הכוונה לכך שאמידת‬ .‬שאלה אופטימלית תנוסח כך שרוב הנבדקים‬ ‫הגבוהים עונים נכונה והתפ' יתר הנבדקים למסיחים השונים תהיה זהה‪ .‬מ ‪ 2‬בחינות‪(1 :‬‬ ‫ה ‪ICC‬‬ ‫הוא‬ ‫קבוע לכל אוכ' נבחנים‪ .‬הצליח בשאלה‬ ‫‪X‬‬ ‫לא אומר‬ ‫שיצליח ב ‪ .‬‬ ‫‪ 2‬הנחות הבסיס ל‪ (IRT : 1 -‬ביצועי הנבחנים במבחן ניתנים להסבר‪ .c‬‬ ‫)קב' שגויות(‪ .‬את הקשר בין‬ ‫ביצועי הנבחנים בכל פריט במבחן לבין היכולות הנמדדות ע"י המבחן אפשר לתאר‬ ‫באמצעות פונקציה מונוטונית עולה‪ .‬נצפה שממוצע העוברים יהיה בעל קריט' גבוה יותר‪ .‬הוא לא מבחין‪ .‬אם בשתי הקב' ‪ 0‬עונים‪ .‬‬ ‫ובכלל זה לתשובות השגויות )מסיחים(‪ .‫)קב' תקפות( יותר‬ ‫מ ‪b.‬מקדם ביסריאלי‪ :‬פריט דיכוטומי וקריט' רציף‬ ‫)הערכת ממונים(‪ .‬ניתן לערוך ניתוח מסיחים ע"י חלוקת הנבדקים‬ ‫לקבוצות קריט' מנוגדות – גבוהים‪/‬נמוכים‪ .‬בין אם הוא‬ ‫מקב' ‪ 1‬או ‪ .‬ההנחה לגבי הקבלה המוחלטת בין שני מבחנים או בין קב' פריטים ‪<-‬‬ ‫מבחנים אשר מניחים שהן מקבילים‪ .2‬אי תלות מקומית‪ :‬לגבי כל נבחן )או לגבי אלה בעלי אותה רמת יכולת(‪.‬‬ ‫מודל‬ ‫‪IRT‬‬ ‫– יסודות תאורית התגובה לפריט‬ ‫חסרונות למודלים הקלאסיים של תורת המבחנים‪ (1 :‬התלות של מדד הפריטים‬ ‫במדגם הנבחנים‪ (2 .‬לא יהיו מבלבלים‬ ‫לגבוהים או מעורפלים‪ .‬מבחן אמריקאי‪ .‬שמה עקומה אופיינית לפריט ‪ .‬ניתן לערוך ניתוח איכותי וכמותי של‬ ‫פריטים – ניתוח מסיחים‪ .‬סביב‬ ‫‪ 0.2‬זה טוב‪ .‬כלומר המתאם בין תשובות לפריטים‬ ‫שונים נובע רק מהיכולת של הנבחן ולא מתלות בין פריטים‪ .‬מחלק את הנבדקים נכשל‪/‬הצליח‪ .‬הנקראים תכונות סמויות‪ .‬בדיקת התפלגות תשובות הנבחנים לכלל אפשרויות התשובה‪.‬ואינו משתנה כפי שמשתנים מדדי הפריט במודל הקלאסי‪(2 .‬חישוב ‪ .‬ניתוח מסיחים‪ :‬רק בשאלות סגורות‪ .‬של טעויות התקן של המדידה ושל אורך המבחן הדרוש כדי להגיע‬ ‫למהימנות רצויה‪.

‬‬ ‫הפריטים לא נבדלים בכושר ההבחנה שלהם‪ .‬כלומר‪ .‬רמת קושי מחושבת כנק' ממוצעת בין‬ ‫ההסתברות המקסי' לענות בניחוש‪.2‬עקומה תלולה‬ ‫יותר‪ .‬כיוון שיכולת של נבדק‬ ‫נקבעת ע"פ מספר הפריטים אותם הצליח מתוך הפריטים הנתונים‪ .‬השוו בין הבחנה‬ ‫של פריט ‪ 1‬בנבדקים ברמת יכולת ‪ -2‬ל ‪ .‬בתלת‪ .‬‬ ‫מודלים חד מימדיים מקובלים ב ‪ .‬טעויות מדידה‬ ‫בהערכת יכולת‪ :‬יתרון ע"פ קלאסי‪ :‬ברמת יכולת נתונה‪ .5‬בפריט‪ .‬אם בדקנו את הנבחן ע"פ קבוצת פריטים‬ ‫קשה במיוחד‪ .a‬רמת ניחוש‬ ‫‪c.‬‬ ‫לפי ‪ * .‬ומס' הפריטים אותם‬ ‫יצליח תלוי בקושי או קלות הפריטים‪ .0‬מהו קושי פריט ‪) 1‬כללי(‪ .a‬‬ ‫מוגדר כשיפוע עקומת הפריט בנק' הקושי שלו‪ .2‬הולכים ל ‪ 0.‬המסומן ב ‪ .‬המחושב עבור נבחנים שונים מבלי להתמודד עם שאלת הדיוק במדידה‬ .‬נחפש בלי נתונים‪.‬ופריטים‬ ‫נוטים לתרום במיוחד לדיוק המדידה מסביב לערך ה‪ b-‬שלהם על סולם היכולת‪ .IRT‬חד פרמטרי –קושי הפריט משפיע על תג' הנבחן‪.‬כלומר‪ .‬‬ ‫פונקצית אינפורמציה‪ :‬מתארת את התרומה של פריט‪ .‬פחות קוי‪ .‬אם אנו רואים סטיות רבות מהקו‪ .‬כלומר‪ .‬ההסתברות שנבחנים עם יכולת נמוכה מאוד‬ ‫יענו נכון על הפריט היא אפס‪ .‬פריטים בעלי יכולת הבחנה גבוהה ‪ .‬איזה פריט יותר‬ ‫מבחין? לבדוק את ‪ a‬ברמת היכולת‪ .‬וכן‬ ‫לאמוד את יכולתם ע"י קב' של פריטים קלים‪ .+2‬פריט ‪ 1‬מבחין ברמת יכולת ‪ .‬עד כמה תורם ברמות יכולת שונות‪ .‬טעות התקן באמידת תטא משתנה ברמות יכולת שונות )להבדיל‬ ‫מ ‪SEM‬‬ ‫במודל הקלאסי‪ .‬‬ ‫פיזור הזוגות אמור להסתדר על קו אלכסוני ליניארי בזוית של ‪ 45‬מעלות‪ .‬ע"י חישוב מתאם בין‬ ‫הזוגות‪ .‬במודל המדידה הקלאסי תכונה זו לא מתקיימת‪ .‬‬ ‫וככל שערך הפרמטר ‪ c‬נמוך יותר‪ .‬ולהפך‪ * .‬דרך לבדוק את תכונת הקביעות‬ ‫ביכולת היא לקחת קב' נבחנים‪ .‬כלומר אמור‬ ‫לצאת מתאם ליניארי גבוה‪ .‬הם‬ ‫תורמים במיוחד לדיוק המדידה של נבחנים שרמת היכולת שלהם ‪ .‫היכולת של נבדק אינה תלויה במדגם הפריטים המסוים שנבחר לשם כך‪ .a‬ההסתברות‬ ‫שנמוכי יכולת יענו נכון על הפריט היא ‪ * .b‬יכולת ‪ .‬טעות מדידה נמצאת ביחס הפוך‬ ‫לאינפו' של המבחן‪ .(I(θ‬להערכת יכולת‬ ‫הנבחנים‪ .‬תורמים יותר לדיוק המדידה מפרטים בעלי יכולת הבחנה נמוכה‪ .‬אני אמורה לאמוד באופן זהה את יכולתו של‬ ‫נבדק ספציפי‪ .‬משקפת את הסטיות הקטנות ביכולת שישפיעו יותר‪ * .‬ניתן להסיק שהנחת קביעות היכולת אינה מתקיימת‪.‬תלול אז רמת ההבחנה שלו טובה יותר‪* .‬ככל‬ ‫שפריט בנק' היכולת גבוה יותר‪ .‬ע"פ גרסאות שונות של המבחן(‪ .a‬כמות‬ ‫מידע גדולה יותר‪ .‬לאמוד את יכולתם ע"י קבוצה של פריטים קשים‪ .‬כלומר מתקבל ערך בינוני או‬ ‫נמוך כמקדם מתאם ליניארי‪ .a‬קרובה ל‪ b-‬של הפריט‪.‬דו פרמטרי‪ -‬קושי הפריט ‪ + b‬יכולת הבחנה ‪ .‬אם אומדן היכולת אכן לא תלוי בקושי הפריטים שבהם נעזרנו על‪-‬מנת לאמוד אותו‪.‬בין אם‬ ‫לקחתי קבוצה של פריטים קלים או קשים‪ .‬ואז להשוות את זוגות היכולות שקיבלנו )כל‬ ‫נבדק קיבל שני אומדני יכולות‪ .p=0.‬הפריט תורם יותר לדיוק המדידה‪ .5‬מהו קושי הפריט לנבדקים בתטא=‪ .‬נסיק שיש לו יכולת נמוכה‪ .‬תלת פרמטרי‪-‬‬ ‫קושי ‪ .

‬מהדורה זו נותנת ייצוג הולם יותר למטלות זיכרון כמותי‪ .‬הקשר בין קושי‬ ‫הפריט ליכולת ההבחנה שלו‪ :‬מדדים מסוימים מודדים את יכולת ההבחנה של פריט‬ ‫ללא קשר לקושי‪ .‬בעוד שהמהדורות הקודמות התרכזו בעיקר‬ ‫בתחום המילולי‪ .‬ואילו אחרים מושפעים מדרגת הקושי ומניבים ערכים גבוהים יותר של‬ ‫יכולת הבחנה לגבי פריטים הקרובים לרמת הקושי ‪ .‬‬ ‫ממה המבחן מורכב? בכל מבחן מסודרים הפריטים לפי דרגת קושי עולה‪ .‬‬ ‫יישומים נפוצים ל ‪ :IRT‬בנית מבחן לפי יעד מוגדר מראש‪ .‬ומדד מתאם‬ ‫ביסריאלי אינו מושפע מרמת הקושי של הפריט‪ .‬‬ .‬תיווצר הבחנה‬ ‫ברורה בין נבדקים מבחינת סיכוייהם להשיב נכון על הפריט באזור זה‪ .‬עבור נבדקים ברמות יכולת אחרות‪ .‬מבחן אדפטיבי ממוחשב‪.0.‬‬ ‫איתור פריטים מוטים‪ .‬יתרה מזאת‪ .‬מדד‬ ‫‪D‬‬ ‫ומדד פי‪ .‬קיצור המבחן * קצב‬ ‫בחינה מותאם לנבחן * קיום אתגר תוך הקטנת תחושת התסכול לחלשים * ציינון מיידי *‬ ‫גמישות מועדי בחינות * גמישות בפורמט הפריטים‪.‬מרחבי וקצר‪-‬‬ ‫מועד‪ .‬אפילו אם פריטים אלו מבחינים היטב‪ .‬‬ ‫פרק ‪ – 9‬מבחנים יחידניים‬ ‫סטנפורד‪-‬בינה‬ ‫המהדורה הנוכחית מרחיבה את ההיבט התוכני‪ .‬זקוק לבוחן מיומן היטב‪ .‬כיול ציונים מנוסחים שונים‪ .‬כל סוג פריט מיושם בטווח גילים רחב ככל האפשר‪ .‬לגבי אוכ' מסוימות‪ .‬הבדלים קטנים מאוד ברמות היכולת באזור הנדון )במקרה זה סביב הערך‬ ‫תטא ‪ (1‬ישפיעו מאוד על הסיכויים להשיב נכונה על הפריט‪ .‬‬ ‫הקשר בין רמת הבחנה של פריט לבין שיפוע העקומה שלו? ככל שהעקומה‬ ‫תלולה יותר‪ .‬ומאפשר ע"י כך‬ ‫השוואה טובה יותר בין הגילים‪ .‬במילים אחרות‪ .‬ציוני משכל )רציף( והצלחה בפריט דיכוטומי )עבר‪/‬נכשל(‪.‬קביעת ציוני סף‪.‬היגיון מופשט‪/‬חזותי‪ .‬מה שלא‬ ‫סביר(‪ .‬כדי לתת את המבחן‪ .‬כלומר‪ .‬‬ ‫יתרונות המבחן האדפטיבי‪ * :‬דיוק מרבי בכל טווחי היכולת‪* .‬מניחים שהמדידה מדויקת לכל הרמות באותה מידה‪ .‬מושפעים מקושי הפריט‪ .‬וכדי שהביצוע יהיה נקי מפגמים צריך הבוחן להכיר את‬ ‫המבחנים היטב ולהיות מנוסה בהם‪.‬גם מבחן סטנפורד‬ ‫בינה‪ .‫לגבי נבדקים ברמות שונות‪ .‬כמו מבחני משכל יחידניים אחרים‪ .‬הסדרה כוללת ‪ 15‬מבחנים שמייצגים ‪ 4‬תחומים קוגנטיביים עיקריים‪ :‬היגיון‬ ‫מילולי‪ .‬לקבוע את הציון ולפרש את התוצאות‬ ‫יש צורך בהכשרה מיוחדת ובנסיון‪ .‬המדדים‪ :‬הפרש בין‬ ‫מס' העונים נכונה בקב' קיצוניות‪ .‬ככל שהפריטים הם ברמת קושי תואמת לרמת היכולת‪ .‬שני פריטים‬ ‫לכל רמת קושי‪ .‬בהשוואה לתחומים‬ ‫בהם העקומה מתונה יותר‪ .‬למקרה פרטי בו משתנה‬ ‫אחד רציף והשני דיכוטומי‪ .‬הוא מדד לקשר‪ .‬תקטן טעות המדידה‪.5‬מאשר לגבי פריטים קשים מאוד‬ ‫או קלים מאוד‪ <-‬יש מדדי הבחנה שמעצם הגדרתם אינם מאפשרים קבלת מקדם הבחנה‬ ‫גבוה לפריט קל או קשה מאוד‪ .‬הגיון כמותי וזיכרון לטווח קצר‪.

‬‬ ‫המשמש מבחן בדיקה כדי לקבוע את רמת הכניסה לכל המבחנים הנותרים‪ .‬שלב ב'‪ -‬על הבוחן לקבוע‬ ‫את רמת הבסיס ואת רמת התקרה של כל מבחן‪ .‬מבחנים מילוליים וביצועיים ניתנים לסירוגים‪ .‬במשרדי הממשלה ובצבא‪ .‬את רמת‬ ‫הכניסה לכל המבחנים האחרים קובעים ע"פ טבלה שמופיעה על גב מחברת הציונים‪.‬‬ ‫פרק ‪ – 11‬מבחני קבוצה‬ ‫החלו במלחה"ע ה‪ 1 -‬ומאז התפתחו מאוד בגלל השימוש הרב בהן במערכת החינוך‪.‬‬ .‬העלולות להשפיע על ביצועיהם‪.‬שישה מהם מרכיבים את הסולם המילוי‬ ‫וחמישה את הסולם הביצועי‪ .‬זכירת ספרות‪ .:‬אינם מספקים את התנאים ליצירת קשר עם הנבדקים ואינם מאפשרים לגלות‬ ‫נסיבות אישיות של נבדקים‪ .‬‬ ‫וקסלר לילדי הגן ‪ WPPSI‬גיל ‪ 3 – 4-6.‬‬ ‫יתרונם‪ .‬וגם אנשי מקצוע נוהגים להשתמש בסולמות וקסלר לאבחון קליני‪.‬חשבון‪ .‬המבחן נמשך ‪ 50-75‬דקות‬ ‫בפעם אחת או פעמיים‪.5‬מבחנים מחליפים תתי מבחנים ב‪ WISC-‬שלא‬ ‫נמצאו מתאימים‪ .‬‬ ‫בתעשייה‪ .‬‬ ‫נורמות ונקידה‪ -‬ממוצע – ‪ .‫מתן המבחן הוא תהליך בן ‪ 2‬שלבים‪ :‬שלב א'‪ -‬נותן הבוחן את מבחן אוצר המלים‪.‬‬ ‫סולם מילולי‪ -‬ידיעות‪ .‬הרכבת עצמים‪ .16‬‬ ‫מבחני וקסלר‬ ‫כוללים שלושה סולמות‪ :‬למבוגרים‪ .‬סידור תמונות‪ .‬גם כאן מסווגים תתי המבחנים לסולם מילולי ולסולם ביצועי והם ניתנים לנבדק‬ ‫לסירוגין‪ .‬לילדים ולפעוטות‪ .100‬סטיית תקן‪15 -‬‬ ‫וקסלר לילדים‪ -‬גיל ‪ – 6-16.‬הבנה‪ .‬מבחינת התוכן תת המבחן היחיד שלא נכלל בסולם המבוגרים הוא מבוכים‪.‬‬ ‫הרכב המהדורה הנוכחית‪ :‬מכילה ‪ 11‬תתי מבחנים‪ .100‬סטיית תקן= ‪.‬צד שווה‪.‬הבחינה הקבוצתית שונה מהבחינה ליחידים בצורת‬ ‫הפריטים )השאלות( ובארגונם‪ .‬‬ ‫סולם ביצועי‪ -‬השלמת תמונות‪ .‬קידוד‪.:‬ביעילותם היחסית )אפשר להגישם לקבוצות גדולות(‬ ‫ באי‪-‬תלותם היחסית בבוחן‬‫ באפשרות להעבירם בתנאים אחידים ולנקדם בקלות‪.‬התת מבחנים ממוספרים לפי סדר הגשתם לנבדקים‪ .‬‬ ‫והמשלבת את הציון במבחן אוצר המלים עם הגיל הכרונולוגי‪ .‬אוצר מלים‪ .‬המקום שיש‬ ‫להתחיל בו את מבחן אוצר המלים תלוי אך ורק בגיל הכרונולוגי של הנבחן‪ .‬‬‫חסרונות‪ .‬וקסלר הינו אמצעי למדידת משכל‬ ‫כללי‪ .‬במונחים של הישגי הנבחן למעשה‪.‬מבחנים‬ ‫מילוליים ומבחני ביצוע ניתנים לסירוגין‪.‬סידור קוביות‪ .‬‬ ‫תקנון ונורמות‪-‬ממוצע=‪ .‬מרבית הפריטים הם פריטי בחירה )ולא שאלות פתוחות(‬ ‫המסודרים בסדר קושי עולה בכל תת‪-‬מבחן בנפרד‪.5‬הוכן לראשונה כהרחבה כלפי מטה של וקסלר בליוויו‬ ‫המקורי‪ .

‬‬ ‫מבחנים סתגלניים= פותחו במאמץ לנצל את היתרונות של מבחני הקבוצה בלי לאבד‬ ‫את היתרונות של מבחנים יחידניים‪ .‬‬ ‫מערכות לבחינת כשרים ומבחני נטיות מתאימים במיוחד לייעוץ מסוג זה‪ .‬שפותחו בעיקר למטרות תעסוקה‪.‬אך יש גם מבחנים‬ ‫הבודקים כשרים מיוחדים‪ .‬‬ ‫כל תת מבחן מוגבל ב ‪ 7‬דקות‪ .‬גם מערכת‬ ‫זו מכילה ‪ 5‬תת מבחנים בסולם במילולי ו‪ 5 -‬תת מבחנים בסולם הביצועי ומספקת ציון‬ ‫מילולי‪ .MAB -‬גישה נוספת לצירוף אפיוני המבחנים‬ ‫היחידניים והקבוצתיים‪ .‬לא רק‬ ‫בהתגברות על מגבלות הבחינה הקבוצתית הרגילה‪ .‬מערכת זו נועדה להעריך אותן המיומנויות שמעריכים מבחני וקסלר‬ ‫למבוגרים בהעברה קבוצתית‪ .‬אין צורך בבוחן מיומן לניקוד וביצוע המבחן‪ .‬לבחינה סתגלנית באמצעות המחשב יש‬ ‫פוטנציאל רב‪ .‬ואח"כ הוא ממשיך לפי‬ ‫טיב תשובותיו ולפי תכנית מובנית במחשב‪ .2‬האם הנבחן ברמה גבוהה דיה בכדי להבין את ההוראות בכתב של ה‪-‬‬ ‫‪MAB‬‬ ‫‪ .‬תוך שימוש בנייר ועיפרון ובלי צורך בבוחן מיומן‪ .‬ציון ביצוע ומנת משכל של הסולם המלא‪ 50 .‬במבחנים אלו‬ ‫מזוהה הרמה הכללית שבה מתחיל הנבדק לענות על פריטי המבחן‪ .‬ומקטין שונות בין בוחנים ושונות טועויות מהנקידה‪.3‬מבחן וקסלר דורש בוחן ממומחה לכן צריך נכונות של הפסיכולוג להקדיש זמן‬ ‫ומאמץ להעברת המבחן‬ ‫פרק ‪ .‬‬ ‫הערכת התוקף של מבחנים בתחום התעסוקה חשובה במיוחד מנימוקים חברתיים )יש‬ ‫למנוע ברירה לא הוגנת של בני מיעוטים או קבוצות נחשלות( ומנימוקים כלכליים )ברירת‬ ‫עובדים בעזרת כלי מיון תקפים משפרת את תפוקת הארגון שאליו ממיינים( דרישה מחמירה‬ ‫לבדיקת תוקף היא זו המחייבת מציאת קשר בין ציוני המבחן לבין הביצוע בתפקיד‪ .‬דקות לסולם המילולי ו ‪ 50‬לביצועי‪.‫בגלל אופיים של הפריטים מוגבלת גם תגובתם של הנבדקים‪ .1‬עד כמה הפסיכולוג זקוק לתצפיות איכותיות‪ .‬אפשר להעבירם באמצעות מחשב‪ .‬עד כמה הן חיוניות להחלטות שצריך‬ ‫לקבל‪.‬‬ ‫‪ .‬‬ .‬אלא גם‬ ‫באפשרות לכלול בה סוגי פריטים מגוונים‪.‬‬ ‫מערכת מבחני הכושר הרב‪-‬ממדית‪ .‬הם בוחרים בתשובה מתוך‬‫אוסף תגובות אפשריות ולא בהכרח מספקים את התגובה הראשונית והטבעית שלהם‪.‬‬ ‫כשיש התלבטות אם להעביר ‪ MAB‬או וקסלר יהיו השיקולים הבאים‪:‬‬ ‫‪ .‬קשיים‬ ‫מעשיים ביישום דרישה זו גרמו לפיתוח שיטות חלופיות לבחינת התוקף‪ .15‬מבחנים בתחום התעסוקה‬ ‫מבחנים פסיכולוגיים משמשים לעיתים קרובות עזרים בתהליך קבלת החלטות בתחום‬ ‫התעסוקה‪ :‬החלטות הנוגעות לפרט והחלטות מוסדיות העוזרות לברירה ומיון של כ"א‪.‬מבחן קבוצתי‬ ‫מבטיח אחידות גדולה‪ .‬כמו שימוש בתוקף‬ ‫תוכן והרחבת תהליכי הערכה‪.

‬בסופו של דבר הוא משלב את הנתונים ויוצר דו"ח בו הוא‬ ‫משלב את כלל הנתונים ומעריך את מצבו של הנבדק‪ .‬אין מספר גדול של עובדים המבצעים‬ ‫תפקיד זהה‪ .‬קיצוץ תחום עקב ברירה מוקדמת‪ .‬כמו כן‬ ‫מועמדים הנבחנים לצורכי מחקר‪ .‬חשוב לבנית המבחן ולהגדרת הקריט'‪ .‬נסיון שונה של עובדים בגלל בעיות אלה הפוגמים בתהליך התיקוף המקומי‪.‬אך זה לא מציאותי‪ .1 :‬מינוי‬ ‫לתפקיד לתקופת נסיון‪ :‬חיקוי יפה‪ .‬שיעריכו את התכונות שנמצאו בשלב ‪ .‬בעיות‬ ‫במוטיבציה‪ .‬הידע והתכונות מתאימות‬ ‫אחרות של העובד הנדרשות לתפקיד‪ .‬לא בעלי הנעה כמו מועמדים אמיתיים לתפקיד‪ .3 .1‬חיוני לתיקוף תלוי‬ ‫תוכן של המבחן‪ .‬תזרים וכד' ובודקים‬ ‫כיצד האדם נוהג‪ .‬מבחני כושר‪ .‬מס' מעריכים ועוד‪.3 .‫תיקוף מקומי תלוי קריטירון בסביבה תעשייתית‪ 4 -‬שלבים‪ .‬את מידת התאמתו‬ ‫למלא תפקיד כלשהו וכו'‪ .‬זוהי מדידת המתאם בין‬ ‫המבחן לקריט'‪ .‬מחקה את מגש הדואר הנכנס הכולל מכתבים‪ .‬המועסקים נבדלים זה מזה בהיקף ובנסיון שלהם‪ .‬לקבוע כיצד יש להשתמש‬ ‫בציוני המבחנים שנבחרו לקבלת החלטות ברירה אופרטיביות‪ .‬את כישוריו‪ .‬יתרונות התהליך‪ :‬מאפשר חיפוש גמיש ושימוש יעיל יותר‬ .‬מבחני‬ ‫אישיות‪ .‬סיבות‬ ‫עקריות המסבירות מדוע מחקרים מקומיים עשויים לתת תוצאות שאינן ניתנות לפרוש‪:‬‬ ‫‪ .2 .‬שיטות של מרכזי הערכה – מכניסים מספר אנשים הנבדקים‬ ‫לתפקיד מסוים ליומיים שךושה ומנסים להעריך בעזרת מס' שיטות‪ :‬ראיונות‪ .4 .2 .‬אחת הגישות לברירה של כ"א נעזרת בשיטות הערכה‬ ‫כוללניות הדומות ככל האפשר לתנאי התפקיד בשלמותו‪ .‬הדמיות‪ .2 .‬אך אין דמיון מושלם‪ .‬כלומר‪ .‬הוא אוסף לגביו נתונים‬ ‫במגוון שיטות ולאורך זמן‪ .‬ברירת‬ ‫מבחנים או בניית מבחנים כך‪ .‬בזכות האמון שהוא מעורר ומקיים במטופל‪ .‬חסרון של קוצר זמן‪ .‬יכול לקבל עובדות‬ ‫שקשה להשיגן בדרכים אחרות‪ .‬‬ ‫פרק ‪ – 16‬מבחנים קליניים‬ ‫בשיפוט קליני הקלינאי מבצע הערכה דינמית של הנבדק‪ .‬מבחן הדואר הנכנס‪ :‬מיועדת‬ ‫לתפקידים מינהלתיים‪ .‬מדגם עיסוקים – הנבדק מתבקש לבצע מטלה שהיא‬ ‫למעשה חלק מהעבודה שהתפקיד המיועד דורש‪ -‬מבחן נהיגה‪ .‬השיטה האידיאלית מחייבת קבלת כולם‪ .‬‬ ‫הדפסה‪ .1‬אין מספיק נתוני קריט' מהימנים ותקפים‪ .4 .‬‬ ‫הציעו שיטות חלופיות‪:‬‬ ‫תיקוף תלוי תוכן‪ -‬שיטות כוללניות‪ :‬יש לבצע ניתוח עיסוקים מעמיק המזהה את‬ ‫הדרישות המבדילות בין עיסוקים‪ .‬ובדיקה מי מבצע את תפקידו‬ ‫הכי טוב‪ .‬בודקים את התוקף תלוי תוכן של‬ ‫המבחן‪ .‬והידיעה שהמנוי הוא זמני‪ .‬ניסוח אסרטגיה לקבלת החלטות אישיות‪ .‬עלול‬ ‫להשפיע על התנ' העובד‪ .‬ובחירת המבחנים למע' הסופית‪ .3 .‬הדמיה‪ -‬שיחזור התפקודים הכרוכים בעיסוק‪ .‬בדיקת מיומנויות משרדיות‪.‬בדיקת המתאמים של כל מבחן עם הקריטריונים‬ ‫המתאימים של‬ ‫הישגים בעבודה‪ .‬בעיות נוספות‪ :‬שחיקת עובדים‪ .1 :‬עריכת ניתוח עיסוקים כדי‬ ‫לזהות את המרכיבים העיקריים בתפקיד ולהגדיר את המיומנויות‪ .

‬מהימן‪ .‬‬ ‫פרק ‪ – 17‬שאלונים לדיווח עצמי‬ ‫מדובר במבחני אישיות שנעזרים בשיטת הדיווח העצמי )להבדיל‪ .III‬השימוש בנתונים לא נכון )למשל מתן משקלות שגויים לנתונים(‬ ‫‪ .‬מחקרים רבים מראים שחיזוי סטטיסטי שיתרונו ‪:‬‬ ‫הליך יותר סטנדרטי‪ .‬השפעה של סטריאטיפים‬ ‫תרבותיים‪ (3 .‬מחיזוי קליני‪ .‬והראיון מתפקד כמבחן מצב או כהדמיה‪ .I‬הקלינאי מושפע גם מנתונים לא רלבנטים )למשל סטריאוטיפים(‬ ‫‪ .IV‬חוסר עיקביות באסטרטגית ההערכה‪ .‬בחירת מקצוע‪ .‬הדוח‬ ‫צריך להתמקד בפרוטים ובמסקנות אך אפשר לצרף אליו בנפרד דוחות של מבחנים‬ ‫ונתונים מפורטים אחרים‪.‬ג‪ .‬יש לזכור שחלק נכבד מן הנתונים שעליהן מתבססת ההערכה אינם יכולים להאסף‬ ‫ללא עבודתו של הקלינאי‪ .‬אם כן‪ .‬יכול להיות‬ ‫שונה לחלוטין מהשימוש המעשי שהוא עושה במידע זה‪ (2 .‬בין אישיים וכן‬ ‫עמדות‪ .‬‬ ‫החיזוי הקליני שעורך הקלינאי הוא אינטואיטיבי במידה רבה ותלוי במידת מקצועיותו‬ ‫ובגורמים נוספים‪ .‬שאלון או שיטה מתוקננת אחרת‪ .‬שילוב הנתונים‪ (1:‬דיווח הקלינאי על‬ ‫המשקל היחסי שהוא מייחס לסוגי קלט שונים ועל האופן בן הוא משלב נתונים‪ .‬יעיל לא פחות ובמקרים רבים אף יותר‪ .‬חסרונות‪ :‬אם הקלינאי צמוד מדי להשערותיו‬ ‫הראשונות‪ .‬ונשען על תוקף אמפירי )קשר מוכח בין המדדים השונים ובין‬ ‫הקריטריון(‪ .‬משיטות‬ ‫השלכה(‪ .‬והוא מעין מדגם של התנ' בין אישית של‬ ‫מטופל‪ .‬ולא רק בתכונה הקרובה לממוצע אצלו‪ .‬הוראה‪ .‬ ‫‪ .II‬הקלינאי אינו מושפע מגורמים רלבנטים )למשל תוקף הכלים בהם הוא‬ ‫משתמש(‬ ‫‪ .‬למשל‪ .‬לעיתים הם משמשים כמכשירי ניפוי‪ .‬הקלינאי עצמו משמש גירוי במצב‬ ‫בין אישי‪ .‬שיהיה מותאם לצרכים‪ .‬‬ ‫איסוף נתונים בדרכים קליניות וסטטיסטיות‪ .‬ה‪ .‬‬ ‫הטיות הנובעות משיפוט סוביקטיבי ולא סטנדרטי‪ .‬הנעתיים‪ .‬חקירה מגמתית‪.‬הדרך היעילה ביותר למתן הערכה‪ .‬‬ .‬מיועדים למדידת מאפיינים ריגושיים‪ .‬מבחני אישיות‪ .‬הדוח צריך להתיחס לתכונות‬ ‫המיחדות את הנבדק‪ .‬יתרונות וחסרונות‪ .‬דבר שחושף את החיזוי ליותר טעויות‬ ‫מקריות‪.‬לתופעה זו יכולות להיות‬ ‫מס' סיבות.‬ולרקע של הנמענים‪.‫ברמזים מאשר מבחן‪ .‬יתרון‪ :‬מתאים יותר לניתוח אירועים נדירים ששכיחותם הנמוכה אינה‬ ‫מאפשרת יצירת מבחן סטטיסטי‪ .‬‬ ‫ב‪ .‬שנצפתה בתנאים כמעט מבוקרים‪ .‬שילוב הנתונים בדרכים סטטיסטיות ככל האפשר‪ .‬הסתמכות על עקרונות חיזוי מטעים‪.‬‬ ‫המלצות או החלטות לטיפול‪ .‬תהיה‪ :‬א‪.‬ד‪ .‬הוא עלול לחפש נתונים התומכים בהשערות אלה בלבד‪ .‬‬ ‫ואולם‪ .‬הכנת דוחות עם כיוון מעשי‪.‬אך לרוב הם מיועדים לאיבחון קליני וייעוץ‪.

‬אין תשובה"‪ .‬יתר על כן‪ .‬פזיזות בולטת של הנבחן או‬ ‫ניסיון מיוחד להיראות רע‪ .2 .‬מכיל פריטים שנבחרו בשיטה זו‪ .‬היפוכונדריה וכיו"ב‪ .‬ישנם ‪10‬‬ ‫סולמות קליניים כמו סכיזופרניה‪ .1 :‬סולם שקר – מבטא את רצון הנבדק להיראות באור חיובי‪ .1‬מניתוח גורמים עולה כי הפריטים היו מתקבצים לסולמות בצורה‬ ‫שונה מזו שנקבעה לו היו מסתמכים על נתוניהם הסטטיסטיים‪ .‬עם זאת‪ .‬בנוסף לסולמות הקליניים‪ .‬נעשו נסיונות לבנות אטלס של פרופילים שכיחים‪.2 .‫תיקוף תלוי תוכן בשאלונים לדיווח עצמי האבטיפוס של שאלוני האישיות לדיווח‬ ‫עצמי הוא דף הנתונים של וודוורת ‪ :‬מעין ניסיון לתקנן ריאיון פסיכיאטרי המתאים‬ ‫לבחינה בהיקף רחב‪ .‬סולם‬ ‫תוקף – מורכב מפריטים שהנבדקים במדגם התקנון ענו עליהם רק לעיתים נדירות בכיוון‬ ‫השלילי‪ .‬יש לחלק מהסולמות‬ ‫בעית מהימנות קשה ועובדה זו מעמידה בספק גם כל פרופיל אישיותו שיבנו לפיהם‪ .‬מן הסיבות הללו‬ ‫עדיף אולי להתייחס לפרופיל הציונים של הנבדק שבו משוים את ציוני הנבדק בסולמות‬ ‫השונים‪ .‬‬ ‫יש חפיפה בין פריטים שמרכיבים סולמות שונים‪ .‬על סמך נתוניהם הסטטיסטיים‪ .‬השאלון אינו מתאים לאבחון מבדיל‪ .‬על בסיס תיאורים אלה נוסחו הפריטים‬ ‫השונים ובסופו של דבר נבררו מתוכם רק חלק‪ .‬בנוי ע"ב‬ ‫תיקוף תלוי תוכן‪.‬שמשמעות הסטייה משתנה מסולם לסולם‪ .‬מובן‬ .T‬כל ציון של ‪ 2‬סטיות תקן או יותר מעל הממוצע‬ ‫)דהיינו ‪ 70‬ומעלה‪ .‬‬ ‫נתונים אמפיריים.‬הפריטים לסולמות הקליניים נבחרו‬ ‫ע"ס יכולתם להבחין בין קב' נורמלים לקבוצות של חולים פסיכיאטרים‪ .‬עמדות פוליטיות‪ .‬למשל‪ .‬בבניית השאלון הסתמך וודוורת על סימפטומים נוירוטים שכיחים‬ ‫שתוארו בספרות המקצועית וע"י פסיכיאטרים‪ .‬חינוך‪ .‬ציון ‪75‬‬ ‫בסכיזופרניה אינו שקול מבחינת רמת ההפרעה לציון ‪ 75‬בהיפוכונדריה‪ .‬קשה לקבוע שאדם שקיבל ‪ 75‬בסולם‬ ‫הסכיזופרניה הוא אכן סכיזופרני‪ .‬נורמות‬ ‫ה ‪MMPI‬‬ ‫מתפלג עם‬ ‫ממוצע ‪ 50‬וסטית תקן ‪ 10‬כמו ציוני ‪ .‬הפריטים מכילים‬ ‫תחומי תוכן רבים כמו בריאות‪ . ‪ .3 .‬לא רלבנטי לציון שסוטים מן הממוצע כלפי מטה( מהווה עדות לסטייה‬ ‫פתולוגית‪ .‬‬ ‫בניית שאלונים לדיווח עצמי ע"ב קריטריון אמפירי מדובר בתהליך שבו הפריטים‬ ‫נבחרים על סמך הקשר הסטטיסטי שלהם לקרטריון אמפירי כלשהו‪ :‬שאלון האישיות‬ ‫הרב שלבי של מינסוטה‪ .‬מאחר‬ ‫ויש פריטים רבים משותפים לסולמות השונים‪ .‬ישנם גם ‪3‬‬ ‫סולמות תוקף‪ .‬ואכן‪ .‬יש בו ‪ 550‬היגדים‬ ‫שעל כל אחד מהם על הנבחן להשיב "נכון"‪" .‬עמדות כלפי מין דת ועוד‪ .‬ציון גבוה בסולם זה עלול להצביע על טעות בנקידה ‪ .‬יש לזכור‪ .‬ציונים גבוהים מדי בסולם השקר או‬ ‫בסולם התוקף גורמים למבחן כולו להיחשב כחסר תוקף‪ .‬סולם תיקון – מהווה מדד לעמדות כלפי היבחנות ויכול‬ ‫לשמש כמתשנה מדכא במספר סולמות קליניים‪ .MMPI .‬הפריטים‬ ‫בסולם הסכיזופרניה הם אלו שהבחינו בין קבוצת החולים הסכיזופרנים לקבוצת הנורמלים‪.‬לא נכון"‪" .

‬צמצום‬ ‫רשימת התכונות על ידי איחוד שמות נרדפים‪ .‬ביישן לעומת נועז ועוד‪ . לבדוק האם תוצאות‬ ‫מבחן רורשך יכולות להצביע על מאפיין נוירוטי בנבדק‪ .‬ראשוניות‪ . ‪ .‬נורמות ומהימנות.‬‬ ‫‪ .‬‬ ‫בתנאים אלו לא מן הנמנע שיהיה שוני ניכר בין נבדק אחד למישנהו מבחינת עוצמת‬ ‫הצורך‪ . מהימנות הכלי‬ ‫היא נמוכה‪ .‬‬ ‫ניתוח גורמים בפיתוח שאלוני אישיות לדיווח עצמי שאלוני קאטל‪ :16PF . עוצמתו של‬ ‫כל צורך בשאלון של אדוארדס מבוטאת ביחס לשאר הצרכים ולא בצורת ציון מוחלט‪.‬‬ .‬מדובר‬ ‫בתכונות שנחשבות )לפחות בעיני ממציאי השאלון( כבסיסיות‪ .‫שיש בעיה למדוד מהימנות מבחן חצוי למבחן בעל רמת הטרוגניות גבוהה ויש גם מגבלה‬ ‫בבדיקת מהימנות מבחן חוזר מאחר וחלק מן התכונות אינן יציבות‪.‬גם כאשר מדובר בציונים יחסיים כמאונים‬ ‫או ציוני טי‪ .‬בו"ז תלוי קריט'‪.‬מבוסס על תאוריות‬ ‫אישיות‪ .‬זהו תוקף מקביל‪ .1‬קיבוץ השמות של כל תכונות האישיות שמופיעות במילון‪ . צורך ההישג‪ .‬הנתונים התקבלו מדרוג ע"י עמיתים‪.‬השאלון‬ ‫מקנה ‪ 16‬ציונים בתכונות כמו חברותי לעומת מסוייג‪ .‬‬ ‫תיאוריות אישיות ובנית שאלונים לדיווח עצמי‪ :‬רשימת ההעדפות של אדוארדס‬ ‫‪ :EPPS‬מודדת את עוצמתם של הצרכים שתוארו בתיאוריה של מארי‪ .‬בניית השאלון‬ ‫התנהלה כדלהלן.‬אך קיים חשש שהם גבוהים יתר על‬ ‫המידה )למשל‪ .‬‬ ‫הבקורת העיקרית על התהליך היא שהמעריכים שעל סמך הערכותיהם בוצע ניתוח‬ ‫הגורמים מושפעים ממשתנים לא רלבנטים כמו סטראוטיפים‪ .‬‬ ‫אין הלימה בין המבחן לקריט' ולכן זה יכול להביא להערכת חסר של מקדמי התוקף‪.3 . ‪ .‬בגלל המאפיינים הייחודיים של קריטריון זה‪ .‬דירג קבוצה הטרוגנית של מבוגרים בידי‬ ‫עמיתיהם )מעריכים( על פי רשימת השמות המצומצמת‪ .‬ערכו בדיקות תיקוף למבחני השלכה‬ ‫בהן ניסו לבדוק את ביצועיו של הנבחן במבחן השלכה כנגד הקריט'.‬‬ ‫‪ .‬לאבחן תכונות‬ ‫אישיות‪ .‬העובדה הזו מקשה על פירוש התוצאות‪ .‬תוקף.‬כנראה בגלל ביצוע בדיקות סטנדרטיות על ציונים איפסיטיביים‪.‬אולי בגלל שהחזרה על משפטים גורמת‬ ‫לנבדקים לזכור היטב את תוכן המבחן ואת התשובות…(‪ .‬תהליך שחזר על עצמו מס' פעמים‪.‬ציונים איפסיטיביים.‬מקדמי המהימנות טובים‪ . נמצאו עדויות סותרות‬ ‫לגבי תוקף הכלי‪ .2‬ישנו בשאלון סולם שמודד את העקיבות בתשובות הנבחן )הסולם כולל משפטים‬ ‫שחוזרים על עצמם(‪ .2 .3 .‬מהימנות ותוקף.4‬פיתוח השאלון התבסס על ניתוח גורמים של הדירוגים ומציאת "מקור התכונות‬ ‫הראשוניות של האישיות"‪ .‬חסרים נתונים לגבי תוקפו‪.‬ומשתנים אלו משפיעים‬ ‫בעליל על התכונות שנתגלו באמצעות ניתוח הגורמים‪ .‬והכין סידרת פריטים שמתאימים לצרכים הללו‪ .‬מהימנות מבחן חוזר גבוהה‪ .‬‬ ‫פרק ‪ – 19‬שיטות השלכה‬ ‫מטרת מבחני השלכה‪ :‬להגיע לממדים לא מודעים ועמוקים של האישיות‪ .‬הצורך להיחשף‬ ‫וכו'‪ .‬אדוארדס נטל ‪ 15‬צרכים מן הרשימה של מארי.1‬אפשר לבטא את הציונים באמצעות מאונים וציוני טי‪.

‬אדוארדס טוען שרציות חברתית היא תכונה‪/‬נטיה ואינה‬ ‫מעידה על הונאה מכוונת מצד הנבדק ולכן ניתן להתייחס אליה כאל מערך תגובה‪ .‬לא‪-‬‬ ‫מובנות ומאפשרות מגוון תגובות כמעט בלתי מוגבל‪ .‬יבחר‬ ‫בכוונה בתגובות לא שיגרתיות(‪ .‬‬ .‬סטיה – נטיית הנבדק להשיב תשובות לא‬ ‫שיגרתיות בתחילה התייחסו למערכי התגובה כאל מקור לשונות לא רלבנטית ואולם גישה‬ ‫זו השתנתה והיום יש הרואים במערכים הללו מאפייני אישיות רחבים וקבועים ולכן גם‬ ‫מכנים אותם לעיתים סגנונות תגובה‪.‬ראוי לציין כי השפעת המצב‬ ‫אופיינית הרבה יותר לתכונות אישיות מאשר לתחומים קוגניטיביים‪ .‬על מערך‬ ‫כזה ניתן להתגבר על ידי כך שעבור מחצית מהפריטים התגובה הנכונה היא כן ועבור‬ ‫המחצית השניה התגובה הנכונה היא לא‪ .‬‬ ‫בנוסף‪ .1 :‬‬ ‫הסכמה – נטייה חזקה להשיב "כן" )או "לא"( מבלי להתחשב בתוכן הפריט‪ .‬רוצה להשתחרר מהצבא‪ .‬‬ ‫מאפיינים כללים למבחני השלכה‪ (1 :‬המטלות שמרכיבות את המבחן מעורפלות‪ .‬‬ ‫עידון הפריטים והפיכתם לניטרלים מבחינת רציה חברתית‪ .‬אלא אלמנט שמושפע מהמצב‪ .‬שיטות למניעת‬ ‫השפעת רציות חברתית‪ :‬א‪ .‬‬ ‫מבחן כתמי הדיו של רורשך‪ :‬הנבחן מתבקש להגיב לסדרה של ‪ 10‬כתמי דיו‬ ‫מופשטים‪.‬מחקרים מעידים ששיטת הבחירה הכפויה מצמצמת מעט את‬ ‫מידת ההשפעה של מערך התגובה אך הוא אינו מעלם כליל‪ .‬ההנחה היא שהמטלה מהווה מעין מרקע שעליו משליך הנבחן תכנים‬ ‫אופייניים‪ (5 .‬ג‪ .‬‬ ‫ההוראות שניתנות לנבחן תמציתיות וכלליות‪ (3 .‬או‬ ‫נסתרים של הנבדק‪ (6 .‬רכישת אמונו של הנבחן ושחרורו מהצורך להרשים‪ .‬הנחה נוספת היא ששיטות השלכה מאפשרות לגלות רבדים לא מודעים‪ .‬ב‪.‬הנבדק אינו מודע לפירוש הפסיכולוגי‬ ‫הניתן לתגובותיו‪ (4 .‬נפגעת יכולתו‬ ‫של המבחן להבחין בהבדלים יחידניים בתכונות ספציפיות תלויות תוכן‪ .‬יש האומרים שבכדי‬ ‫לזהות תכונות אישיות כלליות צריך לבדוק את היחיד במגוון מצבים ולצרף את התוצאות‪.‬תכונות‬ ‫והתנ' אינן דבר קבוע לחלוטין‪ .‬בדרך כלל יש לרוב הפריטים בשאלונים‬ ‫הללו תשובה שנתפסת כרצויה מבחינה חברתית‪ .‬שיטת הבחירה הכפויה –‬ ‫הנבחן צריך לבחור בין ‪ 2‬אופציות שוות מבחינת רצייה חברתית או לציין איזה ביטוי מאפיין‬ ‫אותו ביותר ואיזה בכלל לא‪ .‬ככמות התגובות לגירויים מובנים‪(2 .‬אפשר לענות בצורה שתיצור רושם מסויים )למשל‪ .‫עמדות כלפי היבחנות והטיות בתגובות‪) :‬חסרונות(‪ :‬שאלונים לדיווח עצמי מועדים‬ ‫יותר ממבחנים אחרים להשתמטות והעמדות פנים‪ .‬מערכי תגובה אחרים‪.2 .‬הוא‬ ‫מזהיר שכשיש מתאם גבוה בין ציוני המבחן לבין סולם של רציות חברתית‪ .‬במקרים כאלו נבחנים עלולים‬ ‫להתפתות לזייף ולבחור בתגובות שיציגו אותם באור חיובי‪.‬‬ ‫תכונות נסיבות ומצבים‪ :‬יש לזכור שקיימים יחסי גומלים בין אנשים למצבים‪ .‬תגובת הנבדקים‬ ‫לגירויים בלתי מובנים תלויה במצבו ההנעתי והרגשי של הנבדק‪.‬הדגש הוא על פירוש האישיות השלמה‪ (7 .

‬חשוב לחזק את‬ ‫המידע במקורות נוספים‪ .‬יכולתו של הגירוי לעורר‬ ‫מגוון רחב של תגובות שניתנות לנקידה לפי מבחן רורשך המקורי‪ (3 .‬לנבדק מוצגת תמונה‬ ‫והוא מתבקש לספר סיפור לגבי המתרחש בתמונה‪ .‬רק‬ ‫משום הדמיון ביניהם או בגלל התאוריה בה הם מחזיקים‪ .‬‬ ‫מבחן התפסת הנושא‪TAT :‬מבחן זה קשור לקטגורית מבחני השלכה שעושים שימוש‬ ‫בתמונות‪ .‬‬ ‫אלמנטים שמושפעים ממשתנים לא רלבנטים כגון גיל‪ .‬נקודות שנויות במחלוקת.‬הוא ביקש להעמיד את המבחן על יסודות פסיכומטריים מקובלים ולשם כך‬ ‫העביר את ההתייחסות מגורמי תוכן לגורמים מבניים‪ .‬וקלינאים בפרט‪ .‬נורמות‪ :‬נאספו‬ ‫נורמות אחדות עבור המבחן והוצע שהוא כלי תקף דיו למחקר‪ .‬נורמלים‪ .‫שיטת הנקידה מתבססת על תגובות שנאספו בעזרת תצפיות קליניות בקבוצות קריטריון‬ ‫כגון חולים פסיכיאטרים‪ .‬מהימנות בין‬ ‫מעריכים‪ .‬נדרשת תגובה מילולית‬ ‫מאורגנת יחסית מבחינת המשמעות‪ .‬מתאם מדומה‪ :‬נטייתם של‬ ‫אנשים בכלל‪ .‬יש להתייחס לתוכן‪ .‬אפשר‬ ‫להשתמש בכלים הללו למטרת איבחון וחיזוי עבור הנבדק‪ . ‪ (1‬בנקידת הרורשך מתייחסים לתגובות‬ ‫הנבדק לגבי צבע הכתם‪ .‬גישה אחרת מתייחסת אל הרורשך‬ ‫כאל ריאיון קליני מתוקנן למחצה‪ .‬בגירוים מובנים מעט יותר מבמבחנים של כתמי דיו‪ .‬לראות קשר בין תופעות שאין ביניהן קשר אמפירי‪ .‬אם הם מקור מידע אחד מרבים‪.‬רמת הכנסה ועוד‪ .‬‬ ‫הוכח שהנקידה מושפעת מהיכולת המילולית של הנבדק וכן ממספר התגובות שהוא מפיק‪.‬בניגוד לרורשך‪ .‬ניתוח התגובות מתבסס על רשימת הצרכים של מארי‪.‬‬ ‫מבחן כתמי הדיו של הולצמן‪ :‬מתבסס על מבחן רורשך אך מכיוון שהוכנסו בו שינויים‬ ‫למכביר אפשר לראות בו מבחן חדש‪ .‬אין לסמוך עליהם יתר על המידה‪ .‬‬ .‬זיהום נתוני המבחן עלול להוביל‬ ‫לניפוח מלאכותי של מקדם התוקף‪ .‬‬ ‫יתרונות‪ :‬אפשר להעלות השערות על הנבדק‪ .‬אך בעייתי כאשר מפרשים‬ ‫את תוצאותיו על בסיס פסיכואנליטי‪ .‬לרובם אין נתונים נורמטיביים מתאימים‪.‬אין השפעה על התגובות‪(2 .‬בדיקות התוקף והמהימנות של הכלי נמצאו מעודדות‪.‬‬ ‫בגלל מגבלות התוקף והמהימנות‪ .‬כשלעצמו‪ .‬נעשה שימוש רב בכלי זה למטרת יצירת אמון ותחושה נוחה בין‬ ‫מטפל למטופל‪ 2 .‬תיקוף מדומה‪ :‬זכרון סלקטיבי אצל קלינאים הנותן‬ ‫משקל רב ביותר למקרים בהם ההבחנה נמצאה נכונה‪ .‬‬ ‫והדגש הוא על חקר המשמעות של התגובות בהקשר לעברו של הפרט‪.‬במבחן של הולצמן מתבקש הנבדק לתת רק תגובה אחת לכל‬ ‫גירוי‪ .‬לתגובות מילוליות ולא‪-‬מילוליות‪.‬רובם לא‬ ‫עברו סטנדרטיזציה לגבי העברתם וניקודם‪ .‬חסרונות‪ :‬תוקף ומהימנות נמוכים‪ .‬הדמויות ועוד‪ .‬אקסנר פיתח שיטה מתוקננת להעברת נקידת ופירוש‬ ‫הרורשך‪ .‬מנסה לעמוד בתקנים הפסיכומטרים הנדרשים‬ ‫ממכשיר מדידה והגירויים שנכללים בו נבחנו לפי ‪ 3‬קריטריונים אמפיריים‪ (1 :‬מידת‬ ‫הבחנתם בין קבוצת סטודנטים לבין קבוצת חולים פסיכיאטרים‪ (2 .‬המחקר הראה שלצבע‪ .‬מפגרים‪ .‬ובעזרת כלים אחרים לבדוק אותן‪ .‬מדובר‪ .

‬‬ ‫הערכת שיטות השלכה‪ :‬יתרונות‪ .‬נקידה ופירוש(‪ .‬נתוני תוקף ומהימנות לא‬ ‫מספקים‪ .‬‬ .‬לבחור בתגובות "רצויות"(‪ .2 .1 :‬היכולת ליצור אמון בין הנבדק למטפל )מפחית‪.‬מהימנות מבחן חוזר אף היא בעייתית משום‬ ‫שלעיתים קרובות מדובר במבנה שחלים בו שינויים עם הזמן‪.‬דוגמא למבחן שעושה שימוש בשיטה‬ ‫מילולית הוא מבחן האסוציאציות החופשיות‪ .‬לרוב אין די נתונים לגבי מהימנות בין מעריכים‪ .‬האפשרות הנמוכה‬ ‫לזייף‬ ‫חסרונות‪ .‬מבחנים אלו קל יותר לתקנן ויש מביניהם‬ ‫שהשיגו תוצאות תוקף ומהימנות מבטיחות‪.1 :‬סטנדרטיזציה נמוכה )בהעברה‪ .‬‬ ‫למשל‪ .‬בחירת המילים מתבססת על גורמים כמו מידת טעינותן של המילים בקונפליקטים‬ ‫פנימיים והנקידה מתייחסת גם לרמת השכיחות של התגובה )ישנן טבלאות של שכיחויות‬ ‫שבהן מצויין למשל כמה שכיחה המילה "אור" כתגובה למילת הגירוי "חושך"( ניתן‬ ‫להשתמש גם בשיטה של השלמת משפטים‪ .‬נתונים נורמטיביים לא‬ ‫מספקים או חוסר שימוש בנתונים כאלה כאשר הם קיימים‪ .‫קיימות אי אלו נורמות לגבי מבחן זה ואולם רוב הקלינאים משתמשים ב"נורמות‬ ‫סובייקטיביות" שפיתחו לעצמם במהלך עבודתם‪.‬‬ ‫שיטות מילוליות מתאימות גם כמבחן קבוצתי‪ .‬את הצורך של הנבדק להרשים‪ .2 .‬הנבדקים מתבקשים להגיב על סדרת‬ ‫מילים‪ .3 .‬עקיבות פנימית אינה רלבנטית‬ ‫משום שמדובר במדידת מבנה הטרוגני‪ .