You are on page 1of 9

‫'מחזור ‪ – 2026‬סמסטר א‬

‫נועה לוי‬

‫דיאגנוזה ומדדי תוקף למבחנים‬

‫עבור כל בדיקה שנבצע נרצה לדעת‪:‬‬

‫מה המשמעות שלה?‬ ‫‪.1‬‬


‫מה היא מודדת?‬ ‫‪.2‬‬
‫עד כמה אנחנו בטוחים בתוצאה של הבדיקה?‬ ‫‪.3‬‬
‫האם לבדיקה שלנו ולתוצאות שלה יש משמעות קלינית?‬ ‫‪.4‬‬

‫תוקף‪ -‬כל בדיקה שנעשה בקליניקה נרצה שתפריד לנו בין בריאים לחולים‪ .‬היכולת הזו תגדיר את התוקף של המבחן‪.‬‬
‫נסתכל על המשתנים הנבדקים ונראה איך הם משפיעים על התוצאה שלנו‪.‬‬

‫סוגי משתנים‪ -‬הגדרת המחלה בהתאם ליכולת של כלי המדידה שלנו לגלות אותה‪.‬‬

‫משתנה דיכוטומי‪ -Bimodal distribution -‬כן או לא חד משמעי‪ ,‬כמו סרטן למשל‪ .‬בדיקות בהן קל לקבוע‬ ‫‪.1‬‬
‫ערך מעליו או מתחתיו אדם בריא‪/‬חולה‪.‬‬
‫משתנה רציף‪ -Unimodal distribution -‬משתנים רציפים שעלינו להגיד טווח תקין‪ -‬כמו רמת סוכר‪,‬‬ ‫‪.2‬‬
‫כולסטרול ועוד‪.‬‬

‫השוואות תוצאות המבחן לתבחין הזהב‪ -Gold standard -‬יקבע את תוקף‬


‫המבחן‪ .‬מבחן שיכול להיות חיובי‪/‬שלילי ונשווה אותו לתבחין זהב‪ ,‬נשווה אותו‬
‫לאבחון שלנו‪ .‬יכול להיות שבאבחון שלנו נקבל תוצאה שלילית אך לפי תבחין הזהב‬
‫הוא למעשה חולה‪ .‬וכך להפך‪ .‬במצב זה נרצה לאמת את התוצאה‪ .‬לא נשתמש‬
‫במבחן זה כל פעם כי הוא פולשני יותר‪ ,‬יקר יותר ומורכב יותר‪ .‬נשתמש בתבחין‬
‫הזהב כדי לקבוע מדד רציף או דיכוטומי לקביעת מחלה ללא שימוש בתבחין זהב בפעם הבאה‪ .‬כאשר אין מדד חד‬
‫משמעי מה ההפרדה בין חולים לבריאים‪ -‬אנו רוצים לדייק את המבחן כמה שניתן‪.‬‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫בשלב הראשון‪ -‬נקבע מדד גבוהה‪ -‬ונראה מה אחוזי הצלחה‪.‬‬


‫בשלב השני‪ -‬נקבע מדד הפרדה נמוך יותר ונבדוק מה אחוז ההצלחה של המבחן‪.‬‬

‫‪A=GOLD STANDARD‬‬
‫במציאות אין לנו את העקומות הבי‪-‬מודליות‪ ,‬יש לנו חפיפה בין הערכים ועלינו להחליט אם להציב את הגבול למטה‬
‫ולהסתכן בהבחנה חיובית שקרית כדי לא לפספס אף חולה‪ ,‬או למעלה ובאבחנה שלילית שקרית‪.‬‬

‫ההחלטה תיקבע לפי המשמעות הקלינית והכלכלית‪ .‬במציאות לא יהיה לנו גולד סטנדרט‪.‬‬

‫‪ -False positive‬שיעור החיוביים השגויים הוא ערך מובנה בתוך תוצאות בדיקות המעבדה‪:‬‬

‫לפי ההגדרה‪ ,‬אלו שקיבלו ערך העולה על שתי סטיות תקן מהממוצע האוכלוסייתי מוגדרים כ‪"-‬לא‬ ‫•‬
‫נורמאליים"‪.‬‬

‫לפיכך‪ ,‬אחד מכל ‪ 20‬נבדקים (‪ )5%‬יהיה בעל תוצאות לא נורמאליות ללא כל עדות למחלה‪.‬‬ ‫•‬

‫‪ -False negative‬הנורמה נקבעת ביחס לאוכלוסייה‪ ,‬אבל לא תמיד תהיה רלוונטית ברמת הפרט‪ .‬יש הבדל לעיתים בין‬
‫התוצאות באוכלוסייה לבין מה שבפועל קורה ברמת הנבדק‪.‬‬

‫מדדי תוקף‪-‬‬

‫רגישות‪ -Sensitivity-‬יכולת המבחן לזהות נכון את כל הנבדקים שהם בעלי המחלה‪ .‬מתייחס רק לקבוצת‬ ‫‪.1‬‬
‫החולים (לפי מבחן הזהב) מבין הנבדקים‪ .‬רגישות היא תכונה קבועה של המבחן‪ .‬החישוב המתמטי‪:‬‬
‫מספר הנבדקים החולים שנמצאו חולים ע"י המבחן מחולק בסך הנבדקים החולים בפועל (‪)FN + TP‬‬

‫‪a‬‬
‫‪ytivitisneS‬‬ ‫( ‪=P‬‬ ‫)‬
‫‪a+ c‬‬
‫זהו שיעור המבוטא באחוזים ‪ % -‬במבחן אידיאלי הרגישות = ‪100%‬‬
‫סגוליות‪-Specificity-‬יכולת המבחן לזהות נכון את כל הנבדקים הבריאים‪ .‬מתייחס רק לבריאים (לפי מבחן‬ ‫‪.2‬‬
‫הזהב) מבין הנבדקים‪ .‬סגוליות היא תכונה קבועה של המבחן‪ .‬החישוב המתמטי‪:‬‬
‫מספר הנבדקים שנמצאו בריאים ע"י המבחן מחולק בסך הנבדקים הבריאים בפועל (‪)FP + TN‬‬
‫‪d‬‬
‫‪yticificepS‬‬ ‫( ‪=P‬‬ ‫)‬
‫‪d+ b‬‬
‫זהו שיעור המבוטא באחוזים ‪ % -‬במבחן אידיאלי הסגוליות = ‪100%‬‬
‫דיוק המבחן‪-‬תוקף‪ -Validity-‬ניקח את ה‪ TP‬ואת ה‪ TN‬ונשאל מה ההסכמה הכללית בין התוצאות לבין‬ ‫‪.3‬‬
‫תבחין הזהב‪ .‬עד כמה המדידה קרובה לערך האמיתי‪.‬‬
‫‪a+ d‬‬
‫‪ytidilaV‬‬ ‫( ‪=P‬‬ ‫)‬
‫‪a+ b+ c+ d‬‬

‫שימוש במבחנים מרובים‪-‬‬

‫בטור‪ -Sequential-‬בדיקה שנבצע שלב אחר שלב‪ .‬נתחיל במבחן פשוט‪ ,‬זול ולא פולשני ורק נבחנים שבו‬ ‫‪.1‬‬
‫מאובחנים כחולים יעברו לשלב הבא הפולשני יותר‪ .‬כך מפחיתים את ה‪ .FP‬מגביר את הסגוליות ומפחית את‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫הרגישות‪ .‬נשאל את עצמנו מה תהיה הרגישות של מבחן בטור‪:‬‬


‫כדי שאדם יוגדר כחולה הוא יצטרך להיות מוגדר כחולה בשני השלבים‪.‬‬
‫∩‪P A‬‬
‫כדי שיוגדר כבריא‪ -‬מהפיק שיהיה בריא באחד מהמבחנים כדי שיוגדר בריא‪.‬‬ ‫) ‪( B =) P (A )× P (B‬‬
‫∪‪P A‬‬
‫‪( B =) P A‬‬ ‫) ‪) B( −) P (A∩ B‬‬
‫‪( +P‬‬
‫במקביל‪ -Simultaneous-‬נבצע שני מבחנים במקביל ומספיק שאדם יצא חולה באחד מהמבחנים כדי שנגדיר‬ ‫‪.2‬‬
‫אותו כחולה‪ .‬כדי להימנע ככל הניתן מ‪ .FN‬כאן מספיק שאדם יאובחן כחולה באחת הבדיקות‪ ,‬וזה מפחית את‬
‫הסגוליות ומגביר את הרגישות‪.‬‬
‫כדי לאבחן אדם כחולה‪:‬‬
‫∪‪P A‬‬
‫כדי לאבחן אדם כבריא‪:‬‬ ‫‪( B =) P A‬‬ ‫) ‪) B( −) P (A∩ B‬‬
‫‪( +P‬‬
‫∩‪P A‬‬
‫) ‪( B =) P (A )× P (B‬‬
‫השוואה בין מבחן בטור למבחן במקביל‪:‬‬ ‫‪.3‬‬

‫ערכים מנבאים‪-‬‬

‫ערך מנבא חיובי ‪ -Positive predictive value -‬בהינתן תוצאה חיובית‪ ,‬האם אני חולה? מה החלק של ה‪TP‬‬ ‫‪.1‬‬
‫מתוך כל החיוביים במבחן?‬

‫‪VPP‬‬ ‫‪=P‬‬ ‫‪(a+a b =) PPT( PT+PF‬‬ ‫)‬

‫וערך מנבא שלילי ‪-Negative predictive value -‬בהינתן תוצאה שלילית‪ ,‬האם אני חולה? מה אחוז‬ ‫‪.2‬‬
‫הבריאים מתוך המאובחנים כחולים?‬

‫‪d‬‬ ‫‪NT‬‬
‫‪VPN‬‬ ‫‪=P‬‬ ‫) (‬
‫‪c+ d‬‬
‫( ‪=P‬‬
‫‪NT +‬‬ ‫‪NF‬‬
‫)‬

‫השפעת הימצאות וסגוליות על הערך המנבא‪ -‬הרגישות והסגוליות הן מדדים יציבים שמאפיינים את התבחין‪ -‬לא‬
‫משנה כמה חולים או בריאים יהיו באוכלוסייה תמיד נאתר אחוז מסוים מתוך החולים והבריאים‪ .‬ערך מנבא חיובי‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫וערך מנבא שלילי הם לא מדדים יציבים של המבחן והם תלויים בהמצאות המחלה באוכלוסייה הנסקרת ובסגוליות‬
‫והרגישות‪.‬‬

‫‪ecnelaverP‬‬
‫↑‬ ‫‪→VPP‬‬
‫↑‬ ‫‪VPN‬‬
‫↓‬

‫‪ecnelaverP‬‬
‫↓‬ ‫‪→VPP‬‬
‫↓‬ ‫‪VPN‬‬
‫↑‬

‫‪ytivitisneS‬‬
‫↑‬ ‫‪wol(eslaf‬‬
‫‪evitagen‬‬ ‫‪→) VPN‬‬
‫↑‬

‫‪yticificepS‬‬
‫↑‬ ‫‪wol‬‬
‫‪( eslaf‬‬
‫‪evitisop‬‬ ‫→‬
‫‪) VPP‬‬
‫↑‬

‫כשנרצה לבדוק אוכלוסייה נרצה לבדוק את האוכלוסייה שבסיכון גבוהה‪ ,‬ולשם כך נבדוק מחלק שהשכיחות שלה‬
‫באוכלוסייה ושהערך המנבא שלה גבוהים שניהם‪ ,‬אחרת המדד יהיה לא אמין ולא נוכל להסתמך עליו‪.‬‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫נוכל לשפר את ערך הניבוי החיובי אם ההימצאות לא בשליטתינו על ידי שינוי הרגישות של המבחן והסגוליות של‬
‫המבחן‪ .‬הסגוליות תשפיע יותר על הערך החיובי‪ ,‬אך שניהם יעלו את את הערך המנבא‪ .‬הסיב לכך היא שברוב המחלות‬

‫רוב האוכלוסייה תהיה בצד הבריא ולכן שוני שם ישפיע יותר על ערך הניבוי החיובי‪.‬‬

‫מהימנות‪ -Reliability-‬יכולת כלי המדידה לספק תוצאות עקביות בניסיונות חוזרים‪ .‬מקורות למהימנות נמוכה‬
‫(הטיית מדידה)‪.‬‬
‫‪ : Intra-subject variation‬שונות בתנאי המדידה (מקום‪ ,‬זמן‪ -)....‬למשל מדידת לחץ דם בבוקר‪/‬ערב‪.‬‬ ‫‪.1‬‬
‫מכשיר מדידה מקולקל ‪ /‬לא מכויל‪ :‬יביא לשגיאות קבועות‪.‬‬ ‫‪.2‬‬
‫שונות בין מכשירים‪ :‬תביא לשונות אקראית בתוצאות‪.‬‬ ‫‪.3‬‬
‫‪ :Intra-observer variation‬שונות בקריאות חוזרות ע"י אותו בודק‪.‬‬ ‫‪.4‬‬
‫‪ :Inter-observer variation‬שונות בין בודקים‪ .‬מדדים להעריך שונות בין בודקים‪:‬‬ ‫‪.5‬‬
‫נחשב את אחוז ההסכמה בין שני הבודקים‪:‬‬ ‫א‪.‬‬
‫ב‪.‬‬

‫אחוז ההסכמה החיובית בין שני הבודקים‪ .‬נתעלם מתא ההסכמה של השלילי של שניהם‪ ,‬אלא ניקח רק‬
‫כאשר לפחות אחד מהם אבחן פתולוגיה‪ ,‬ונגדיר את אחוז ההסכמה החיובי‪:‬‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫מדד קפא‪ % -‬ההסכמה שמעבר למקריות‪ .‬מדד זה יבטל את המקריות בין תוצאות הבדיקות של‬ ‫ג‪.‬‬
‫הבודקים‪ .‬נקבל ערך באחוזים‪.‬‬

‫במונה ‪ :‬בכמה עולה ההסכמה בין הבודקים על הסכמה מקרית לגמרי?‬


‫במכנה ‪ :‬בכמה לכל היותר יוכלו הבודקים לשפר את מידת ההסכמה ביניהם מעבר להסכמה המקרית‬
‫הסכמה מצוינת מעבר למקריות‪ :‬קפא > ‪75%‬‬
‫הסכמה בינונית עד טובה מעבר למקריות‪ :‬קפא ‪40-75%‬‬
‫הסכמה נמוכה מעבר למקריות‪ :‬קפא < ‪40%‬‬
‫סיקור (‪ - )screening‬ניסיון לגלות באמצעות בדיקות או פרוצדורות אחרות‪ ,‬מחלה לא ידועה או פגם בשלב מוקדם‬
‫הניתן לטיפול‪ .‬במטרה לשנות את מהלך המחלה‪.‬‬
‫הערכת תוכנית סיקור באוכלוסייה‪ -‬בהחלטה על בדיקת סקר יש להפריד בין החלטה ברמת האוכלוסייה להחלטה‬
‫ברמת הפרט‪.‬‬

‫האם החולים מפיקים תועלת מגילוי מוקדם של המחלה?‬ ‫‪.1‬‬


‫האם ניתן לגלות את המחלה מוקדם?‬ ‫א‪.‬‬
‫מה הרגישות והסגוליות של התבחין?‬ ‫ב‪.‬‬
‫מה הערך המנבא של התבחין?‬ ‫ג‪.‬‬
‫מה הסיכון לאלו שנבדקים?‬ ‫ד‪.‬‬
‫מה המשמעות של תוצאות תבחין "חיוביים שגויים" (‪?)FP‬‬ ‫ה‪.‬‬
‫מה העלות של גילוי מוקדם מבחינת הקצאת משאבים?‬ ‫ו‪.‬‬
‫מה התועלת לחולים שמתגלים באמצעות התבחין והאם ישנה תועלת לכלל הנסקרים בתוכנית?‬ ‫ז‪.‬‬
‫מדדי תוצא להערכת היעילות של תוכנית לגילוי מוקדם‪-‬‬ ‫‪.2‬‬
‫ירידה בתמותה באוכלוסייה הנסקרת‬ ‫א‪.‬‬
‫ירידה בשיעור הקטלניות באלו שנסקרו‬ ‫ב‪.‬‬
‫עליה באחוז המקרים שהתגלו בשלב מוקדם יותר של המחלה‬ ‫ג‪.‬‬
‫ירידה בשיעור הסיבוכים‬ ‫ד‪.‬‬
‫מניעה או ירידה בשיעור החזרה של המחלה או בגרורות (לסרטן)‬ ‫ה‪.‬‬
‫שיפור באיכות החיים לאלו שנסקרו‬ ‫ו‪.‬‬

‫בבדיקת סקר חייבים להיות מספר דברים שיתרחשו כדי שהיא תהיה כדאית‪ .‬הראשון‪ -‬הורדה של אחוז התמותה‬
‫בעקבות המחלה‪ .‬שני‪ -‬התוצרים הרפואיים חייבים להתעלות על הסכנות הכרוכות בבדיקה‪ .‬שלישי‪ -‬מחיר הבדיקה צריך‬
‫להיות סביר על כל שלביה‪ ,‬ניקח בחשבון את כל שלבי הבדיקה ונבדוק האם הוא משתלם ביחס להשפעה שתהיה לבדיקה‬
‫על החברה‪ .‬רביעי‪ -‬על ההמלצות שנציע להיות ריאליות ופרקטיות לביצוע אחרת אין טעם בבחינה אם לא נוכל להציע‬
‫טיפול מקדים אפקטיבי‪.‬‬

‫השלבים הטבעיים של התפתחות מחלה‪ -‬ברגע שנבצע סיקור‬


‫אוכלוסייה תהיה לנו האפשרות לצבור "פער" לפני התפתחות המחלה‬
‫ולנסות למנוע אותה טרם התפרצה‪.‬‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫שלבים של מניעת מחלה‪-‬‬

‫בעיות מתודולוגיות שאופייניות למבחני הסקר‪-‬‬


‫הטיה = כל טעות שיטתית החוזרת על עצמה ומביאה להערכה שגויה של המצב האמיתי‪.‬‬
‫‪-Selection bias‬הטיות בחירה‪-‬‬ ‫‪.1‬‬
‫הטיית מתנדבים ( ‪)referral bias, volunteer bias‬‬
‫האם אלו שנסקרו דומים בתכונותיהם לאלו שלא נסקרו?‬
‫בד"כ מתנדבים הם בריאים יותר ובעלי הענות טובה להמלצות רפואיות לעומת הכלל‪.‬‬
‫נצפה תמותה נמוכה יותר בקרב הנסקרים‪ ,‬שאינה קשורה לסיקור אלה לתכונותיהם‪ ,‬אפילו אם‬
‫הגילוי המוקדם לא השפיע לטובה‪.‬‬
‫מתנדבים עשויים להיות בעלי סיכון עודף והתנדבו בגלל חרדה עקב סיפור משפחתי חיובי‪.‬‬
‫הבעיה‪ :‬איננו יודעים באיזה כיוון פעלה הטיית הבחירה‪.‬‬
‫‪Information bias‬‬ ‫‪.2‬‬
‫‪ -Lead time bias‬לא השפענו על זמן המחלה‪ ,‬הזמן מהגילוי עד התמותה‬ ‫‪.3‬‬
‫היה יותר ארוך‪ ,‬אך נקודת התמותה עצמה לא השתנתה וכן רק הוספנו זמן‬
‫לפני הגילוי ולא שינינו את זמן המחלה‪.‬‬

‫‪-Length time bias‬‬ ‫‪.4‬‬


‫האם אלו שמאובחנים באמצעות הסיקור הם בעלי פרוגנוזה טובה משל אלו שאינם מאובחנים על ידי הסיקור?‬
‫האם המהלך הטבעי של המאובחנים בסיקור הוא איטי יותר ללא קשר לטיפול המוקדם שיינתן להם עקב‬
‫האבחון?‬
‫ייתכן שהשלב הקליני שונה באורכו בין אנשים שונים‪.‬‬
‫גידולים אגרסיביים גדלים מהר‪ ,‬מתפשטים מהר‪ ,‬והפרוגנוזה של החולים בהם גרועה יותר‪.‬‬ ‫•‬
‫השלב הפרה‪-‬קליני והשלב הקליני קצרים יותר‬ ‫•‬
‫‪ -Overdiagnosis/over detection bias‬הטיית גילוי יתר‪ -‬מצב בו מתגלים חולים בעלי פרוגנוזה טובה‪:‬‬ ‫‪.5‬‬
‫בתחילת הפעלת תוכנית סקירה ישנה התלהבות יתר לגלות מקרים ואז שיעור החיוביים שגויים (‪)FP‬‬
‫עלול לעלות‪.‬‬
‫במחלות בעלות דרגות חומרה קלות וגם קשות‪.‬‬
‫כתוצאה‪ ,‬תמהל קבוצת המאובחנים ב"חולים" (שהם למעשה אינם חולים) בעלי פרוגנוזה טובה והישרדות‬
‫מצוינת‪ ,‬מה שישפיע על אומדני ההערכה של התוכנית‪:‬‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫‪year survival-5‬‬
‫‪year survival-10‬‬
‫השוואה בין האפשרויות השונות לתוצאה במצב של גילוי מוקדם‪ :‬דוגמא על גילוי של סרטן‬

‫יתרונות וחסרונות במבחני סיקור‪:‬‬

‫יתרונות‪:‬‬ ‫חסרונות‪:‬‬

‫הפחתת תחלואה ותמותה אמיתיים‪.‬‬ ‫‪‬‬ ‫אם הבדיקה היא ‪ FN‬האישור לבריאות‬ ‫‪‬‬
‫שיפור פרוגנוזה לחולים שאותרו בסריקה‪.‬‬ ‫‪‬‬ ‫מטעה‪.‬‬
‫תוצאות חיוביות לאדם בריא‪ FP -‬גורמת‬ ‫‪‬‬
‫טיפול פחות רדיקלי לריפוי חולים המאובחנים‬ ‫‪‬‬
‫למצוקה נפשית והיא מזיקה לו עד שמתבררת‬
‫מוקדם‪.‬‬
‫הטעות‪.‬‬
‫מעניק חיזוק שהאדם בריא‪.Reassurance -‬‬ ‫‪‬‬
‫חיזוק חיובי כאשר תוצאות הבדיקה תקינה‬ ‫‪‬‬
‫חיסכון במשאבים לטיפול‬ ‫‪‬‬
‫עלולה לגרום להפחתת מודעות האדם‬
‫לבריאותו ("נבדקתי‪ ,‬הכל בסדר")‪.‬‬
‫טיפול‪-‬יתר לחולים הגבוליים שללא איתור‬ ‫‪‬‬
‫מוקדם כלל לא היו מטופלים‪.‬‬
‫הבדיקות עצמן עלולות לגרום נזק‪.‬‬ ‫‪‬‬
‫'מחזור ‪ – 2026‬סמסטר א‬
‫נועה לוי‬

‫בזבוז משאבים‪.‬‬ ‫‪‬‬

You might also like