Professional Documents
Culture Documents
أفضل الممارسات في الانحدار اللوجيستي Statistical Analysis Egypt
أفضل الممارسات في الانحدار اللوجيستي Statistical Analysis Egypt
تأليف
جايسون أوزبورن
ترجمة
د .حصة بنت عبداهلل العقيل
أ .سامي بن سعد العنزي
راجع الترجمة
أ .د .الحسيني عبدالبر راضي
Best Practices in
Logistic Regression
Jason W. Osborne
University of Louisville
املحتويات
27 الفصل األول :مقدمة يف مفهوم االنحدار اللوجس��تي ثنايئ املتغري ...................................
أوجه الشبه واالختالف عىل مستوى الفرضيات األساسية ما بني انحدار املربعات
39 الصغرى االعتيادية OLSواالنحدار اللوجستي ..............................................................................................
46 أوجه الش��به ما بني انحدار املربعات الصغرى االعتيادية واالنحدار اللوجستي ......
م��ا املقصود بدالة تحلي��ل التاميز؟ وكيف يُ َعد االنحدار اللوجس��تي أفضل منها
47 أو مختلفا ً عنها؟.........................................................................................................................................................................................
الصفحة املوضوع
خالصة 48 .................................................................................................................................................................................................................
مراجع 49 ..................................................................................................................................................................................................................
يتعامل االنحدار اللوجستي مع املتغريات الثنائية التابعة؟ 51 .. ُ الفصل الثاين :كيف
االحتامالتُ واالحتامالت الرشطية واألرجحيات 53 ................................................................................................
تجربة ذهنية موجزة عىل املنحنى اللوجستي 57 .................................................................................................
فوائد األرجحية مقارن ًة باالنحدار البس��يط للمربعات الصغرى االعتيادية OLS
للنتائج الثنائية 59 ..........................................................................................................................................................................................
نسب ُة األرجحية (60 ........................................................................................................................................ )Odds Ratio
اللوغاريتم الطبيعي لألرجحية 61 ..............................................................................................................................................
ُمل َّخص ما سبق 63 ........................................................................................................................................................................................
ما زال هناك مزي ٌد من املتعة مع اللوغاريتامت واألرجحيات واالحتامالت 64 .......................
عود ٌة إىل اللوغاريتم 65 ..........................................................................................................................................................................
أين يكون اللوغاريتم للمجموعة األخرى؟ 67 ............................................................................................................
التحويل العكيس مبارش ًة من اللوغاريتامت إىل االحتامالت الرشطية 68 ..................................
بعض مزايا االحتامالت الرشطية 69 ..........................................................................................................................................
فرتة الثقة -اللوغاريتامت ،ونسب األرجحية واالحتامالت املتنبأ بها 72 ..................................
سبب وجيه يدعوك لالهتامم بهذه األمور -وضوح الصلة 75 ................................................................. ٌ
متارين إثرائية 76 ..............................................................................................................................................................................................
إجابات 78 ................................................................................................................................................................................................................
صياغة برمجية لألمثلة 81 .....................................................................................................................................................................
مراجع 82 ..................................................................................................................................................................................................................
أفضل املامرسات يف االنحدار اللوجستي 8
املحتويات
الصفحة املوضوع
83 الفصل الثالث :إجراء انحدار لوجستي بسيط .......................................................................................
84 السكَّري ............................................................................ مثال :1العالق ُة بني البدانة والتش��خيص بداء ُّ
96 مثال موجز لهذه النتائج ..............................................................................................................................................................
106 مثال :2العالقة بني فقر األرسة واالنس��حاب من املدرسة قُ َبيل التخرج .............................
120 نفس نتائج نس��ب األرجحية التي تقل عن 1.0؟ .............................................. كيف ميكننا أن رِّ
123 خالصة .................................................................................................................................................................................................................
131 الفصل الرابع :دليل عميل الختبار الفرضيات ،وتنقية البيانات لالنحدار اللوجستي ..
الصفحة املوضوع
135 مصفوفة البيانات DATA MATRIXاملستعرضة بالكامل ...........................................................
أي من املتغ�يرات ذات األهمية، من��وذج مح َّدد بش��كل صحي��ح (مل تتم إزال��ة ٍّ
138 وال يتضمن أي متغريات هامشية) .................................................................................................................................. َّ
139 عندما تكون دالة الربط اللوغاريتمي مناسبة ..................................................................................................
139 حينام تكون العالقات «خطية عىل اللوغاريتم الطبيعي لألرجحية» ...................................
155 فحص البيانات من أجل الحاالت املؤثرة بشكل غري مناسب .........................................................
الصفحة املوضوع
الفصل الخامس :املتنبئات املتصلة ملاذا ُي َعدتقسيم املتغريات املستمرة إىل فئات أمراً غري مرغوبٍ فيه؟ 191 ..
ما املقصود بالتقسيم الفئوي؟ وما سبب وجوده؟ 193 ......................................................................................
ما مدى انتشار هذه املامرسة؟ 195 ............................................................................................................................................
ملاذا يعمد الباحثون إىل استخدام التقسيم الثنايئ واألساليب املشابهة؟ 198 ..........................
مساوئ استخدام نقاط االقتطاع 200 ........................................................................................................................................
هل يُ َعد تفس ُري نتائج التحليالت أكرث سهولة مع املتغريات املقسمة ثنائياً؟ 202 .................
هل ت ُ َعد التحليالت التي تتضمن متغريات ثنائية التقس��يم أسهل حسابياً؟ 203 ..................
ُقسمة ثنائياً؟ 204 ..................................................... هل ميكن االعتامد بشكلٍ أكرب عىل املتغريات امل َّ
التقسيم الثنايئ يزيد من فاعلية املقياس 204 .................................................................................................................
هل يتعامل التقس��يم الثنايئ مع التوزيع غري الطبيعي ،والقيم املتطرفة بش��كلٍ
فعال؟ 214 ...................................................................................................................................................................................................................
تحلي��ل املجموعات املتطرفة يُ َعد بش��كل عام أمرا ً غري حكي��م ،وغالباً ما يكون
مضلالً 217 ....................................................................................................................................................................................................................
بعض املآخذ األخرى عىل استخدام التقسيم الثنايئ 218 ...................................................................................
اختف��اء االنحناء ال َخطّي والتفاعالت أو عدم القدرة عىل رصدها 218 ..............................................
يُ َعد املتغري فئوياً يف طبيعته 219 .......................................................................................................................................................
الداللة القطعية الوهمية 219 .............................................................................................................................................................
التقسي ُم الثنايئ للمتغريات ،واالنحدار اللوجستي 220 .........................................................................................
ضبط دقة تحليل ميتا Meta-Analysisللنتائج 223 ..........................................................................................
ماذا عن األفكار املتعلِّقة بالتقس��يم الفئوي لعدد Kمن املجموعات؟ 223 ..............................
إذا ً ما أفضل املامرسات يف االنحدار اللوجستي ذي املتغريات املتصلة؟ 223 .............................
أفضل املامرسات يف تسجيل النتائج من املتغريات املتصلة :االحتامالت الرشطية 227 .. ُ
11 أفضل املامرسات يف االنحدار اللوجستي
املحتويات
الصفحة املوضوع
خالصة 230 .................................................................................................................................................................................................................
متارين إثرائية 231 ..............................................................................................................................................................................................
إجابات 233 ................................................................................................................................................................................................................
مراجع 237 ..................................................................................................................................................................................................................
ات مستقلة غري مرتب ٍة فئويًّا يف االنحدار اللوجستي 239 .. الفصل السادس :استخدا ُم متغري ٍ
الرتتيب 239 ........................................................................................................................................................ ORDINALITY
الفرتات املتساوية 239 .................................................................................................... EQUAL INTERVALS
نقطة الصفر الحقيقية 240 ...................................................................................... TRUE ZERO POINT
تصنيفات مختلفة للقياس 241 ..........................................................................................................................................................
الرتميز الوهمي 243 ............................................................................................................... DUMMY CODING
ح ِّدد املجموعة املرجعية 243 ..............................................................................................................................................................
ح ِّدد املتغريات الوهمية املرمزة 244 ..........................................................................................................................................
بدائل للرتميز الوهمي 248 .....................................................................................................................................................................
مقارنات االختالف (نقيض هيلمرت 253 .............................................................. )Reverse Helmert
تباينات االنحراف 255 ............................................................................................................. deviation contrasts
مقارنات برنامج 256 ....................................................................................................................................................................... SAS
الرتميز الوهمي يف برنامج 259 .......................................................................................................................................... SAS
خالصة 261 .................................................................................................................................................................................................................
متارين إثرائية 261 ..............................................................................................................................................................................................
إجابات 262 ................................................................................................................................................................................................................
صياغة برمجية لألمثلة 271 .....................................................................................................................................................................
مراجع 274 ..................................................................................................................................................................................................................
أفضل املامرسات يف االنحدار اللوجستي 12
املحتويات
الصفحة املوضوع
275 الفصل السابع :التأثريات املنحنية يف االنحدار اللوجستي ........................................................
283 إضافة أجزاء مكعبة ومربعة إىل تحليل االنحدار اللوجستي .........................................................
288 والت بوكس تيدويل ............. Box-Tidwell تقدي ُر العالقات املنحنية باستخدام تح ُّ
290 تنقية البيانات والتأثريات املنحنية ...................................................................................................................................
الصفحة املوضوع
صياغة برمجية لألمثلة 320 .....................................................................................................................................................................
مراجع 322 ..................................................................................................................................................................................................................
الفصل الثامن :االنحدا ُر اللوجستي مع متغريات مستقلة متعددة :فرص ومخاطر 323 ..
أساسياتُ املتنبئات املتعددة 324 ...................................................................................................................................................
ما اآلثار املرتتبة عىل هذا اإلجراء؟ 325 ...................................................................................................................................
مثال موجز للتحليالت السابقة 329 ............................................................................................................................................
طرق إدخال مختلفة 330 ..........................................................................................................................................................................
طرق اإلدخال امل ُت َحكَّم بها عن طريق املستخدم User-Controlled Methods
331 ........................................................................................................................................................................................................ of Entry
اإلدخال الهرمي 331 .................................................................................................................... Hierarchical Entry
اإلدخال التجميعي 332 ................................................................................................................... Blockwise Entry
اإلدخال امل ُت َحكَّم به عن طريق الربمجيات 334 ........... Software-Controlled Entry
قضايا متعلِّقة بالعالقات الخطية املتداخلة 336 ......... COLLINEARITY ISSUES
تقيي��م النموذج بش��كل ش��امل؛ مل��اذا ال يوجد معام��ل تحدي��د R2لالنحدار
اللوجستي؟ 339 ....................................................................................................................................................................................................
تفاعالت 343 .............................................................................................................................................................................................................
ما التفاعل؟ 343 ....................................................................................................................................................................................................
مش��كالت إجرائية يف االختبار؛ من أجل التفاعالت بني املتغريات املتصلة 344 .......................
مشكالت إجرائية مع الرسم البياين 348 ..................................................................................................................................
مثال موجز لتحليل تفاعل 352 .........................................................................................................................................................
التفاعل بني املتغريات الفئوية واملتغريات املتصلة 353 .......................................................................................
التفاعل وتنقية البيانات 359 ................................................................................................................................................................
أفضل املامرسات يف االنحدار اللوجستي 14
املحتويات
الصفحة املوضوع
تفاعالت االنحناء 361 ............................................................................................. curvilinear interactions
املرحلة :1قم بإنش��اء املتغريات قبل التحليل 364 .....................................................................................................
املرحلة :2ق��م ببناء معادلتك بتمهل 364 .............................................................................................................................
تفاعل انحناء مع متغريات فئوية 370 ......................................................................................................................................
خالصة 374 .................................................................................................................................................................................................................
متارين إثرائية 375 ..............................................................................................................................................................................................
إجابات 376 ................................................................................................................................................................................................................
مراجع 386 ..................................................................................................................................................................................................................
الفصل التاس��ع :نظرة عامة ومخترصة عىل انحدار االحتامل 387 ..................................................
ما وحدة االحتامل؟ 387 .............................................................................................................................................................................
صلة وحدة االحتامل 390 .........................................................................................................................................................................
ملاذا يوجد هناك نوعان مختلفان من اإلجراءات إذا كانا يحققان النتائج نفسها؟ 394 ...
ُحصلة من قاطع رسيع التأثر 399 ...................................................................................................................... القيمة امل َّ
بعض املزايا اللطيفة لوحدة االحتامل 404 ..........................................................................................................................
فرضيات انحدار وحدة االحتامل 404 ........................................................................................................................................
خالصة وخامتة 404 ...........................................................................................................................................................................................
متارين إثرائية 405 ..............................................................................................................................................................................................
صياغة برمجية لألمثلة 405 .....................................................................................................................................................................
مراجع 406 ..................................................................................................................................................................................................................
والتعميم يف االنحدار اللوجستي 407 ........................................................... ُ الفصل العارش :التكرا ُر
حجم العينة والقوة والتقلُّب يف االنحدار اللوجستي 408 ..............................................................................
ما القوة اإلحصائية؟ وملاذا يجب عليك أن تهتم بشأنها؟ 409 ...................................................................
15 أفضل املامرسات يف االنحدار اللوجستي
املحتويات
الصفحة املوضوع
409 كيف يرتبط االختبار اإلحصايئ لفرضية العدم بالقوة؟ ...........................................................................
الصفحة املوضوع
الطرق الحديثة والف َّعالة للتعامل مع البيانات املفقودة 463 .. ُ الفصل الحادي عرش:
التعامل مع بيانات ناقصة أو غري مكتملة يف االنحدار اللوجس��تي 463 ..........................................
البيانات املفقودة ليست كلها متامثلة 467 .......................................................................................................................
فئات الفقدان :ملاذا نهتم مبا إذا كانت البيانات مفقود ًة عش��وائياً بشكل تام أم ال؟ 471 ..
كيف تعرف أ َّن البيانات لديك مفقودة عشوائياً بشكل تام ( ،)MCARأو مفقودة
بشكل عشوايئ ( )MARأو مفقودة بشكل غري عشوايئ ()MNAR؟ 474 ....................................
ماذا نفعل مع البيانات املفقودة؟ 478 ....................................................................................................................................
فقدان البيانات عشوائياً بشكل تام (479 .............................................................................................. )MCAR
استبدال املتوسط 481 ................................................................................................................ Mean Substitution
التنسيب القوي ،والتنسيب الضعيف 482 ................... Strong and weak imputation
خالصة 485 .................................................................................................................................................................................................................
البيانات املفقودة بشكلٍ غري عشوايئ 485 ..........................................................................................................................
تأثرياتُ الحذف بطريقة القوائم ( listwiseتحليل الحالة الكاملة) 486 ......................................
اآلثار الضارة الستبدال املتوسط 490 ...........................................................................................................................................
تأثريات التنسيب الضعيف weak imputationلل ِق َيم 491 ........................................................................
التنسيب القوي 492 ..................................................................................................................... Strong imputation
إذا ً أين سيرتكنا ذلك؟ 494 ........................................................................................................................................................................
التنسيب املتع ِّدد كطريقة حديثة لتقدير البيانات املفقودة 494 ..........................................................
كيف ميكن للفقدان أن يكون بح ِّد ذاته متغريا ً مثريا ً لالهتامم؟ 496 .................................................
خالصة :فوائد معالجة البيانات املفقودة بطريقة مناسبة 497 ................................................................
متارين إثرائية 499 ..............................................................................................................................................................................................
مراجع 501 ..................................................................................................................................................................................................................
17 أفضل املامرسات يف االنحدار اللوجستي
املحتويات
الصفحة املوضوع
الفصل الثاين عرش :االنحدار اللوجستي املتعدِّ د والرتتيبي 503 .......................................................
االنحدار اللوجستي املتع ِّدد مع متغري متصل 508 ...................................................................................................
التوجه إىل ما هو أبعد من االنحدار اللوجس��تي املتعدد البسيط 510 .............................................
املزي ُد من الحدود ذات التعقيدات يف االنحدار اللوجستي املتعدد 512 .....................................
االنحدا ُر اللوجستي املتع ِّدد كسلسلة من معادالت االنحدار اللوجستي الثنايئ 515 ....
أمثلة عىل تنقية البيانات باستخدام االنحدار اللوجستي الثنايئ 518 ................................................
اختبار ما إذا كان ميكن دمج املجموعات 521 ...............................................................................................................
منوذج اللوغاريتم املنتظم (االحتامالت املتناسبة) 525 .......................................................................................
فرضيات منوذج االحتامالت الرتتيبية أو التناسبية 527 .........................................................................................
تفسري نتائج التحليل 530 ..........................................................................................................................................................................
تفسري القواطع 531 ..........................................................................................................................................................................................
تفسري تقديرات املعلمة 532 ................................................................................................................................................................
تنقي ُة البيانات ،ومناذج أكرث تطورا ً يف االنحدار اللوجستي الرتتيبي 533 ........................................
ملاذا ال نس��تخدم انح��دار املربعات الصغ��رى االعتيادية فقط له��ذا النوع من
التحليل؟ 534 ............................................................................................................................................................................................................
خالصة واستنتاجات 535 ............................................................................................................................................................................
متارين إثرائية 536 ..............................................................................................................................................................................................
إجابات 537 ................................................................................................................................................................................................................
مراجع 557 ..................................................................................................................................................................................................................
الفصل الثالث عرش :النمذجة ذات املستويات املتعددة مع االنحدار اللوجستي 559 ..
ما النمذجة الخطية الهرمية؟ 561 .................................................................................................................................................
ما هيكل البيانات الهرمي؟ 561 ........................................................................................................................................................
أفضل املامرسات يف االنحدار اللوجستي 18
املحتويات
الصفحة املوضوع
562 ........................................................................................................................................................... مشكلة البيانات املتشعبة
564 كيف تعمل النامذج الهرمية؟ متهيد موجز ...........................................................................................................
وبالتايل؛ ماذا سيحدث لو كانت هذه البيانات التي تم تحليلها عن طريق االنحدار
574 اللوجستي البسيط بدون حساب هيكل بيانات متشعبة؟ ...............................................................
الذي��ن قابلته��م يف حي��ايت .وعىل الرغم من دراس��تي لبعض املقررات يف من��اذج االنحدار
املتغ�ِّي�ات املتعددة ،والنمذج��ة الخطية الهرمية
رِّ وتحلي��ل التباي��ن ( ،)ANOVAوإحصاء
ومنذجة املعادالت البنائية والقياس النفيس؛ فوجدتُ أنه مل يتم تغطية االنحدار اللوجس��تي
يف تخصص��ات علم النفس وغريه من التخصصات االجتامعي��ة يف ذلك الوقت .ويف الواقع؛
ف��إن العديد من الكتب القدمية واملحببة ل��دي؛ مثل :الكتاب الرائع عن االنحدار لصاحبيه
بيدهازر Pedhazurوكوهني ،Cohenوكتاب املتغريات املتعددة لـتاباكنيك Tabachnick
وفي��دل ،Fidelوه��ي الكتب التي اعتدتُ عىل اس��تخدامها وأنا طالب دراس��ات عليا وأنا
الكتب
ُ أستاذ مس��اعد؛ إال إنها مل تنجح يف تغطية املوضوع يف ذلك الوقت )2(.غالباً ما توفِّر
اإلحصائية يف وقتنا الحارض والتي تَ ْع َنى مبوضوع االنحدار عىل مس��توى الدراس��ات العليا -
مقدم ًة بس��يط ًة عن موضوع االنحدار اللوجستي كام هو الحال مع النسخ الحديثة للكتب
التي ذكرتها سابقاً.
ويف الواقع ،لقد ش��اءت األقدار أن ينتهي يب األمر ألعمل إحصائياً وباحثاً مس��اعدا ً لعدة
رشعت يف دراس��ة ع��دة مواد يف علم االوبئة والعمل مع باحثي ُ أعوام يف كلية الطب .وقد
استخدمت االنحدار اللوجستي بصور ٍة
ُ العلوم الطبية؛ إال إنني عىل األرجح مل يس��بق يل أن
اكتشفت أن االنحدار اللوجستي يُستَخ َدم عىل نطاقٍ واسع خارج إطارُ مهم ٍة ومفيدة .لقد
العلوم االجتامعية التي اعتَدْتُ مامرس��تها .فقد اعت��اد باحثو العلوم الطبية؛ مثل :الطب،
والعناية الصحية ،والتمريض ،وعلم األوبئة عىل اس��تخدام االنحدار اللوجس��تي أو أي نوع
مناس��ب من االنحدار ملد ٍة طويلة .إال إن االنحدار اللوجستي ومع األسف يُ َعد موضوعاً ذا
طبيع��ة يصعب التعامل معها؛ إذ تجنب بعض الباحثني التعامل معه ،يف حني أس��اء البعض
اس��تخدامه أو قراءة نتائجه ،األمر الذي س�تراه حتى يف أقوى املجالت العلمية ،والتي أُع ِتيد
استخدام االنحدار اللوجستي فيها (Davies, Crombie, & Tavakoli, 1998; Holcomb,
.)Chaiworapongsa, Luke, & Burgdorf, 2001
( )2بالطبع فقد كان ذلك قبل وقت طويل جدا ً .لقد اعتدنا عىل حساب املؤرشات اإلحصائية؛ من خالل نقشها عىل لوح
نذهب إىل الفصل الدرايس مشياً من خالل طريق متصاعد ويف أثناء تساقط الثلوج ،عىل
ُ طيني؛ باإلضافة إىل كوننا
كل يشء طوال السنة ،كام كانت األقل الجزء األخري كان حقيقياً قبل التغريات املناخية .لقد كانت الثلوج تغطي َّ
بغض النظر عن االتجاه الذي تسلكه ،أو أنها تبدو وكأنها متصاعدة بسبب الرياح .املغزى من كل
الطرق متصاعد ًة ِّ
هذا هو أ َّن ذلك حدث قبل مدة طويلة للغاية.
( )3وبالرغم من ذلك؛ فإ َّن قياسات انحدار املربعات الصغرى عىل مستوى املامرسة الفعلية ال يجب أن تكون عىل الدوام
متصل ًة أو عىل هيئة فرتات.
لقد شاهدتُ عىل مدا ِر السنوات العديد من املحاوالت اليائسة الكتشاف أوجه االختالف
بني املجموعات يف املتغريات املتعددة ،وذلك لغرض بناء نظرية أو محاولة فهمها ،كاستخدام
اختبارات t-testأو تحليل التباين ( .)ANOVAفعىل سبيل املثال :يستطيع الباحثُ النظر
يف االختالفات بني مجموعة األش��خاص الذين يصابون مبرض معني وبني مجموعة األشخاص
الذي��ن ال يصابون به؛ وذلك من خالل اس��تخدام عدة متغريات كالعمر وال ِع ْرق واملس��توى
ؤش كتلة الجسم BMIوعادات التدخني ورشب املرشوبات الروحية ،واملشاركة التعليمي و ُم رِّ
يف أنشطة متنوعة وهكذا؛ فلرمبا نستطيع رؤية اختالف كبري بني املجموعتني يف مؤرش كتلة
الجسم ومتوس��ط مرات تناول املرشوبات الروحية باألس��بوع؛ فهل هذا يعني أنه بإمكاننا
أن نفرتض وجود ارتباط بس��يط بني هذين املتغريين واحتاملي��ة اإلصابة باملرض؟ بالتأكيد
ال؛ ب��ل م��ن املمكن أنه ال أحد من هذه املتغريات يُ َعد عام��ل تنبؤ حقيقي لإلصابة باملرض
عىل اإلطالق؛ فكون الش��خص بدين��اً ويحتيس الرشاب عدة مرات باألس��بوع؛ فإن ذلك قد
يكون عائدا ً لكونه يعيش يف جزء معني من املجتمع ،والذي يرتبط ببعض العادات الغذائية؛
مثل :مدى تناول الخرضوات والفواكه الطازجة ،أو مامرس��ة التامرين الرياضية ،أو مستوى
الضغوطات النفس��ية أو التع ُّرض لغاز التوكس�ين الس��ام يف بيئة العمل والتي قد تكون يف
الواقع مرتبطة باألسباب الرئيسية لإلصابة باملرض.
ومع كامل احرتامي لجميع من س��بقني بالقيام باألنواع نفس��ها من التحليل اإلحصايئ؛
فقد كانت الخيارات القابلة للتطبيق قبل اس��تخدام الحاس��ب اآليل يف العمليات اإلحصائية
ذات النط��اق الواس��ع مح��دود ًة تاريخياً ،وهو -ع�لى األرجح -ما جع��ل معظم الباحثني
يع��دون إج��راء االنحدار اللوجس��تي أم��را ً يف غاي��ة التعقي��د .ولكن لنفك��ر حيال هذه
اإلج��راءات للحظات؛ حيث توجد هناك العدي��د من املآخذ عىل املنهجية التي ذكرتها للت ِّو.
أح��د املآخذ التي قد يع��اين منها الباحثون هي اإلش��كاليات املتعلِّقة بالق��وة ،والتي غالباً
ما تظه ُر حينام يقوم الباحث بتكييف معدالت الخطأ من النوع األول Type I errorوالتي
غالباً ما تش�ترطها التحليالت ذات املتغريات املتعددة (واألس��وأ ه��و حينام يخفق الباحث
بالقي��ام بذلك) .إضاف ًة إىل أن��ه ال ميكن للباحثني األخذ بعني االعتبار ،كيف س��تتغاير تلك
املتغريات محل الدراسة عند استخدام منهجية اختالفات املجموعة .هذه اإلشكالية شبيهة
حينام يتم اختبار عدة ارتباطات بسيطة ومرتبة عوضاً عن إجراء االنحدار الخطي .وتأكيدا ً
31 أفضل املامرسات يف االنحدار اللوجستي
الفصل األول
لذلك؛ فإنه من املمكن أن تجد بعض العالقات املختلفة ما بني املتغريات ،إال إنه من الصعوبة
أي املتغريات أو املتنبِئات تُ َعد األقوى أو األهم للدراس��ة حتى تقوم بنمذجة
التع�� ُّرف عىل ِّ
هذه املتغريات مستخدماً اختبارات ذات طبيعة معينة؛ كاالنحدار املتعدد أو تحليل املسار
أو منذجة املعادالت البنائية.
لرمبا األمر األكرث تشويش��اً لذهني هو حقيقة أ َّن هذه اإلسرتاتيجية التحليلية متنعنا من
اختب��ار التفاعالت ،والتي هي عاد ًة ما ت ُ َعد من أكرث النتائ��ج املثرية لالهتامم .لنتخيل بأننا
اختالفات ترتبط بالجنس( )4ما بني الطالب الذين تخرجوا والذين مل يكملوا الدراسة. ٍ وجدنا
ووجدنا أيضاً فروقات مرتبطة مبس��توى دخل رَأس الطالب الذين تخرجوا والذين مل يكملوا
الدراس��ة .قد يكون ذلك أم��را ً مثريا ً لالهتامم؛ ولكن ماذا لو ُوجِ��د يف الواقع تفاعل ما بني
جن��س الطالب ودخل األرسة ،وهو األمر الذي س��يؤدي إىل التنبؤ باحتاملية تخ ُّرج الطالب
أو انس��حابه ،ماذا لو كانت احتاملية انس��حاب الطالب الذكور أعىل من اإلناث يف العائالت
الغنية ،وأن احتاملية انس��حاب اإلناث أعىل يف العائ�لات الفقرية؟ تلك النتائج قد تحكمها
سياسات أو مامرسات منطقية؛ لكن ال ميكننا اختبار هذا النوع من التفاعل باستخدام طرق
التحلي��ل املذك��ورة يف األعىل .فاالنحدار اللوجس��تي (كام هو الحال م��ع انحدار املربعات
الصغ��رى االعتيادية) يقوم بنمذجة املتغ�يرات بطريقة تجعلنا نحصل عىل األثر الفريد لها،
وبش��كل ُمحكَم لجمي��ع املتغريات األخرى يف املعادلة .وبذلك س��نحصل عىل نظرة دقيقة
ألي املتغريات التي ت ُ َعد أداة تنبؤ فريدة (أو لها عالقة) بالنتيجة امل ُسته َدفة.
ومتطورة ِّ
فبغض النظر عن السامت الحظت أ َّن البعض يس��تخدم التجميع كإسرتاتيجية؛ ِّ ُ أيضاً لقد
والنتائ��ج املتعلِّقة باألفراد ،قد يقوم الباحثون بالتجميع إىل فصل أو مس��توى درايس واحد.
وحينه��ا قد يعتقد بعض الباحث�ين بأنهم أصبحوا ميلكون متغ�يرا ً متصالً (من 0 إىل100%
( )4لرمبا اعتاد القراء عىل رؤية (اختالف النوع) عوضاً عن (اختالف الجنس) ،وهو مثال عىل الطابع واللغة املستخدمة
لدى جمعية علم االجتامع األمريكية والتي تقوم بتقنني معاين املصطلحات بشكل مشابه حني يتم استخدام مفردة
التعزيز السلبي عوضاً عن مفردة العقاب ،وهو يف الواقع معنى مختلف للغاية .سوف أقوم باستخدام مفردة
(الجنس) يف كتايب هذا للتعبري عن الجنس البيولوجي (ذكور أم إناث) .وسوف أقوم باستخدام مفردة (النوع) للتعبري
عن السلوك الذكوري أو األنثوي يف علم االجتامع .كال املصطلحني ليسا مرتادفني يف املعنى ،وسيكون دمجهام تحت
مصطلح واحد ضارا ً باملعنى (.)Mead, 1935; Oakley, 1972
أفضل املامرسات يف االنحدار اللوجستي 32
مقدمة يف مفهوم االنحدار اللوجستي ثنايئ املتغريات
كمع��دل للتخرج ملدرس��ة واحدة) ،أو كدالة نس��بة الذك��ور أو اإلناث يف مدرس��ة واحدة
ومتوس��ط دخل األرسة .من وجهة نظري؛ فإن ذلك س��يؤدي إىل إس��اءة استخدام البيانات
بش��كلٍ كب�ير وإىل ضياع البيانات ،وس��يقود يف النهاي��ة إىل نتائج مضلل��ة .يف الواقع ،ذلك
إىل« أي
ّ س��يغري جوهر السؤال من «ما املتغريات التي تسهم يف إكامل الطالب لدراستهم؟»
من متغريات بيئة املدرس��ة تس��هم يف معدل إمتام الطالب لدراس��تهم؟» .إضاف ًة إىل ذلك؛
فق��د تح َّول��ت متغريات التنبؤ؛ عىل س��بيل املثال :م��ن جنس الطالب إىل نس��بة الطالب
الذك��ور واإلناث ،وم��ن ِع ْرق الطالب إىل نس��بة الطالب الذين تم تعريفه��م ك ِع ْرق معني،
وم��ن َوضْ ع العائلة االقتص��ادي واالجتامعي إىل متوس��ط الوضع االقتص��ادي واالجتامعي
للعائل��ة ضمن حدود املدرس��ة .فه��ذه عبارة عن متغ�يرات مختلفة يف األس��اس ،وبالتايل
فإ َّن التحليل الذي يستخدم هذه اإلسرتاتيجيات سوف يقوم باإلجابة عىل أسئلة مختلفة يف
أساسها .إضاف ًة إىل ذلك ومن خالل اكتشايف الشخيصُ ،
رأيت أ َّن استخدام التجميع يقود إىل
املبالغ��ة يف تقدير أحجام التأثري ،وإىل ضَ ْعف التحليل املناس��ب أو حتى إىل ما هو أكرث من
يغي من طبيعة السؤال ومن طبيعة املتغري ،وميكن له أن يؤدي ذلك .وبالتايل؛ فإن التجميع رِّ
إىل مبالغة غري مناسبة يف تقدير نسبة أحجام التأثري والتباين املحسوب لذلك.
إنني عىل يق ٍني من أ َّن البعض منكم قد تس��اءل حول الس��بب الذي مينعنا من حس��اب
معادلة انحدار املربعات الصغرى االعتيادية ،OLSوذلك باس��تخدام القيم الثنائية كمتغريٍ
كتب االنحدار القدمية واملعروف بنموذج تابع .يُ َعد ذلك إجرا ًء س��ليامً وغالباً ما ناقَشَ ��تْ ُه ُ
االحت�مال الخطي ،Linear probability modelاألمر الذي يختلف عماَّ يُس�� َّمى بنموذج
االحتاملية (والذي سأقوم باستيفائه الحقاً) .وهناك العديد من املزايا التي ستنتج من خالل
مقدرتنا عىل تقدير التأثريات الفريدة لعدة متغريات مس��تقلة ،واختبار األهمية النسبية يف
التنبؤ بالنتائج يف آنٍ واحد ،عىل عكس النهج الذي ت َّم وصفه باألعىل.
تطلب منه ذلك؛ إال إنه توجد
ُ يف الواقع ،س��يقوم الربنامج اإلحصايئ بإجراء التحليل حني
هناك العديد من اإلشكاليات املتعلِّقة يف هذا النهج:
-أوله��ا :القي��م التي ت َّم التنبؤ بها (والتي من املف�ترض أن تكون عبارة عن احتامالت متنبأ
بها) ،والتي من املمكن أن ترتاوح خارج النطاق املسموح به (من 0.00إىل .)1.00
33 أفضل املامرسات يف االنحدار اللوجستي
الفصل األول
-ثانياً :ميكن للبواقي أن تأخذ القيم 0أو -1أو .1وبالتايل؛ فهي ليس��ت باملوزعة طبيعياً،
وليس��ت مبتامثلة التفاوت .يُ َعد ذلك وبشكل مخترص ودون الخوض يف التفاصيل تحليالً
غ�ير مالئم نس��ب ًة إىل كوه�ين وآيكن وكوه�ين وويس��ت (& Cohen, Cohen, West,
قمت باس��تخدام جز ٍء بسيط من بيانات دراسة .)Aiken, 2002ولتوضيح املس��ألة فقد ُ
التعليم املس��تمر التي تحتوي ع�لى بيانات منذ الع��ام )Ingels, 1994( 1988يف التنبؤ
بإك�مال الطالب لدراس��تهم (وليس انس��حابهم) من خالل متغريات بس��يطة يف طبيعتها
كال ِع ْرق ،ومعدل الطالب ،واملش��كالت الس��لوكية للطالب .وس��نعود لبيانات هذا املثال
الحق��اً .أم��ا اآلن ،فبإمكان��ك أن ترى من خالل الش��كل ( )1.1أ َّن إج��راء هذا النوع من
التحليل باس��تخدام انحدار املربعات الصغرى االعتيادية OLSس��يؤدي إىل َخ ْرق متوقع
لفرضيات التحليل األساسية .فالبواقي( )5عىل سبيل املثال ليست موزع ًة طبيعياً.
ون َِص��ل بذلك إىل أوجه ش��ب ٍه كبرية من ناحية املفهوم ما ب�ين انحدار املربعات الصغرى
االعتيادية OLSواالنحدار اللوجس��تي؛ فمن ناحي ٍة إجرائية؛ فإ َّن االنحدارين كليهام ميلكان
متغ�يرا ً تابع��اً وحي��دا ً؛ باإلضافة إىل متغري مس��تقل واحد أو أكرث .ك�ما أن كال االنحدارين
يمُ كِّنان م��ن تقييم التأث�يرات الفريدة ملتغريات التنبؤ املس��ت ِقلَّة (وتفاعالته��ا أو مكوناتها
املنحني��ة خطي��اً حينام يكون األم��ر مس��تحباً) يف آنٍ واحد ،كام أ َّن كليه�ما يتيحان فَ ْحص
البواق��ي؛ لغ��رض البح��ث ع��ن القي��م الش��اذة أو إج��راء التحلي��ل اإللحاق��ي أو لغرض
اختب��ار الفرضي��ات األساس��ية .ك�ما ميك ُن ل��كال االنحدارين اس��تقبال البيان��ات املدخلة
يف آنٍ واح��د؛ كالبيان��ات الهرمية أو الت��ي عىل هيئة مجموعات (مجموع��ة من املتغريات
()6
املس��تقلة يت ُّم إدخالها بش��كل متزام��ن) ،والعديد من إج��راءات االنح��دار التدريجية.
( )5ما البواقي؟ يُ َعد الباقي ذا معانٍ متعدد ٍة للعديد من الناس (خطأ التقدير ،وخطأ التباين ،والتباين املجهول ،والتأثري
وبغض النظر عن تفسريك للبواقي؛ فهي تعني عملياً الفارق ما بنيِّ الفريد ،واملسافة ما بني خط االنحدار والبيانات).
ال ِق َيم امل ُتن َّبأ بها لألفراد (والتي تم التنبؤ بها من خالل معادلة خط االنحدار) وما بني قيمهم الحقيقية.
( )6العدي ُد من القراء اعتادوا عىل االستياء من إجراءات االنحدار التدريجية ،وهو أم ٌر يتناقض مع الجيل السابق؛
ففي ذهني أ َّن إجراءات االنحدار التدريجية لها مكانة عالية ما بني األدوات اإلحصائية ،ومن املفرتض علينا اإلملام
بها ،واستخدامها حينام يكون أمر استخدامها مناسباً .وبالنسبة ألولئك الذين يتساءلون عن متى يُ َعد من املناسب
استخدامها؛ فاإلجابة ستكون عىل األغلب (أبدا ً) .ويف الواقع؛ فإن موضوع اإلجراءات التجريبية يقع خارج نطاق هذا
الكتاب؛ إال إنه بإمكان القراء املهتمني يف هذا الجانب العودة إىل املصادر املعتادة ملوضوع االنحدار؛ مثل :كوهني
وآخرون ) (Cohen et al. 2002وبيدهازر (.)Pedhazur, 1997
أفضل املامرسات يف االنحدار اللوجستي 34
مقدمة يف مفهوم االنحدار اللوجستي ثنايئ املتغريات
وباس��تخدام كال االنحدارين؛ ستكون لدينا القدرة عىل تقييم مجموعة املتغريات املستقلة؛
أي من املتنبئات هو األق��وى يف تنبؤ أم ٍر معني ،واإلجاب��ة عىل العديد من
لغ��رض تحدي��د ٍّ
األسئلة املختلفة يف طبيعتها أم ٌر جعل من االنحدار أدا ًة يف غاية األهمية يف الطرق الكمية.
شكل :1.1بواقي انحدار املربعات الصغرى االعتيادية ذي املخرجات الثنائية Binary Outcome
مصدر البيانات :الدراسة الطولية للرتبية الوطنية يف العام ،1988املركز الوطني لإلحصاء الرتبوي ،قسم التعليم يف الواليات املتحدة األمريكية.
National Education Longitudinal Study of 1988 (NELS88), National Center for Educational Statistics
(http://nces.ed.gov/surveys/nels88/).
ج -ت ُ َعد األخطاء املعيارية يف غاية الفاعلية؛ مبعنى آخر :إنه ال توجد طريق ٌة أخرى للتقدير
ق��ادر ًة عىل توليد أخطاء معيارية أقل (إذا كانت لدي��ك الرغبة يف التع ُّرف عىل املزيد
ح��ول تقدير املربعات الصغرى االعتيادية؛ فإن كتاب كوهني وآخرين (Cohen et al.,
)2002يحتوي عىل مقدم ٍة مثالية للغاية ِح َيال هذا املوضوع).
الح��ظ عبارة “حين�ما يتم تحقيق الفرضيات األساس��ية”؛ فنحن ال نعل��م غالباً يف أثناء
تحقيق الفرضيات األساس��ية أم ال؛ إذ يَ ْعم ُد املؤلفون إىل عدم اإلشارة إليها
ُ البحث ما إذا ت َّم
َّفت كتاباً كامالً عن األس��باب التي
يف الوقت الذي كانوا قد تحققوا منها .ويف الواقع فقد أل ُ
تجعل من تنقية البيانات واختبار الفرضيات األساس��ية أم��را ً يف غاية األهمية (Osborne,
.)2012كام أ َّن كتاب االنحدار كوهني وآخرين ( )Cohen et al., 2002يش�ير وبوضوح إىل
أنه حينام يت ُّم َخ ْرق الفرضيات األساسية (عىل سبيل املثال :يف حالة وجود قيمة شاذة)؛ فإنه
من املحتمل أن يواجه التحليل اإلحصايئ العديد من اإلش��كاليات (انظر تحديدا ً إىل :كتاب
كوهني وآخري��ن (( )Cohen et al., 2002يف فصله العارش ،أو كتاب أوزبورن (Osborne,
،)2012والتي ت ُ َعد من أفضل الكتب من وجهة نظري) .سنس��تفيض يف موضوع الفرضيات
األساسية من خالل بضعة أجزاء من هذا الفصل.
نظرة بسيطة متع ِّمقة على التقدير بأسلوب اإلمكان األعظم Maximum
:Likelihood Estimation
يُ َعد التقدي ُر بأس��لوب اإلمكان األعظم أح َد التطورات يف اإلحصاء ،والتي انترشت بشكلٍ
كبري بعد توس��يع استخدام التطبيقات اإلحصائية يف الحاس��ب اآليل .وعىل نح ٍو مغاير عن
تقدير املربعات الصغرى االعتيادية ،والذي يرتكز عىل مجموعة األس��ئلة التي يستطيع من
خالله��ا الباحث ،وحتى الربنامج اإلحص��ايئ من الوصول إىل النتائج ،يُ َعد التقدير بأس��لوب
الربنامج اإلحصايئ يقو ُم باختيار
َ اإلمكان األعظم عملي ًة تكراري ًة يف طبيعتها؛ مبعنى آخر :فإ َّن
ٍ
مقياس معني .فإذا مجموع��ة من ال ِق َيم املبدئية كمعامالت يت ُّم حلُّها ومقارنتها باس��تخدام
الحل واملقياس املستخدم بعيدين عن بعضهام بشكلٍ أكرب من املطلوب؛ فسيتم محاولة كان ُّ
الحل ألهداف الخوارزمية حل جديد ،عىل أمل أن يقرتب ُّ الوصول إىل قيمة جديدة وإيجاد ٍّ
كل تك��رار .ويف مرحلة م��ا ،يتم قبول التكرار األخري عىل أس��اس أن��ه التقدير النهايئ م��ع ِّ
37 أفضل املامرسات يف االنحدار اللوجستي
الفصل األول
للتأثريات ،وذلك ما س�يراه الباحثون يف النتيجة .لك أن تتخيل مدى الكثافة الحسابية لهذه
العملي��ة ،وملاذا مل ينترش اس��تخدامها إىل أن أصبح اس��تخدا ُم الحاس��ب اآليل يف العمليات
اإلحصائية أمرا ً متاحاً عىل نطاقٍ واسع.
حل يوفِّر قواطعيهدف التقدير بأسلوب اإلمكان األعظم ( )MLEبشكلٍ عام إىل إيجاد ٍّ ُ
املتغي التابع ،Y
ومي��والً ملتغريات التنبؤ ،والت��ي تزيد من قيمة احتامل حصول األف��راد يف رِّ
مع معلومية درجاتهم يف متغريات التنبؤ ( ... ،X2,X1إلخ) .بعبار ٍة أخرى ،تقوم الخوارزميات
بزيادة إمكانية الحصول عىل عينة الدراسة (البيانات أو القيم املشاهدة) ،طاملا أن النموذج
واملعلامت قد تم تقديرها .لقد قمنا بتدوين القيم لبعض املتغريات لعد ٍد من األفراد ،والتي
عاد ًة ما تكون مصدرا ً للعالقات واالرتباطات داخل حدود مجتمع الدراسة .تحاول خوارزمي ُة
التقدير بأس��لوب اإلمكان األعظم ( )MLEأن توفِّر منوذج��اً؛ لري ِّجح احتاملية الحصول عىل
النتائج .ومن ناحية نظرية؛ فإن كالً من انحدار املربعات الصغرى االعتيادية OLSوالتقدير
بأسلوب اإلمكان األعظم ( )MLEيقومان مبحاولة تلخيص املشاهدات .كام أن كال التحليلني
يستخدمان طرقاً رياضي ًة فقط ألجل الوصول إىل هذا الهدف.
التقدير بأس��لوب اإلمكان األعظم يف تص ُّوري مشابه ملا ميكن تسميته باملفهوم الحديس
الختب��ار الفرضيات وقيمة االحت�ماالت ( .)P valuesفالوص��ف الحقيقي لقيمة االحتامل
( )P valueهو احتاملية الحصول عىل املش��اهدات حينام تكون الفرضيات األساسية ()H0
صحيحة بالنسبة ملجتمع الدراسة )7(.إذا ً فمن ناحية املفهوم؛ فإ َّن التقدير بأسلوب اإلمكان
تحس��ن من األعظ��م ( )MLEيحاول تقدي��ر املعلامت املختلف��ة (امليول والقواطع) التي ِّ
النموذج الذي ت َّم تش��كيله بنا ًء عىل املش��اهدات أو تعيد بناءه .لذلك إذا كان طول النساء
يف مجتمع الدراسة مرتبطاً مع مقاس أحذيتهم ارتباطاً إيجابياً قويًّا كام تدعمه املشاهدات؛
فإن التقدير بأس��لوب اإلمكان األعظم س��يقوم بتوفري املعامالت وامليول التي س��تزيد من
احتاملية الحصول عىل عينة املش��اهدات التي تحتوي ع�لى العالقة الظاهرة ما بني الطول
ومقاس الحذاء .س��يقوم التقدير بأس��لوب اإلمكان األعظم ( )MLEمبحاولة الحصول عىل
التقدي��رات وبش��كلٍ متكرر بنا ًء عىل معام�لات ضئيلة االختالف؛ حتى تك��ون متالمئ ًة مع
( )7وهو ليس كذلك؛ إذ إنه يتعارض مع اعتقادات شهرية؛ كاحتاملية الخطأ واحتاملية الحصول عىل النتائج عشوائياً ... إلخ.
كام أنه ليس باألمر الذي نرغب فعالً يف تحليله (احتاملية أن تكون الفرضيات البديلة صحيحة).
املش��اهدات بأفضل صورة ممكنة ،أو بعبارة أخرى؛ حتى تفشل تلك التكرارات املتوالية يف
تحسني املالمئة بشكل جيد.
خطية العالقة:
أح ُد الفرضيات األخرى الخاصة بانحدار املربعات الصغرى االعتيادية هي غالباً ما يُطلَق
عليها فرضية الخطية ،وتعني بشكلٍ عام أن اإلطار الصحيح للعالقة قد ت َّم منذجته؛ ولكن يف
حالة انحدار املربعات الصغرى االعتيادية والعديد من التحليالت األخرى؛ فإن الفرضية تعني
وجود العالقة الخطية بني املتغري التابع واملتغري املس��تقل .تعميم ش��بيه بعالقات السطح
واألبعاد املتعددة ،هو يف الواقع انحدار متعدد ذو متغريين مستقلني أو أكرث؛ ولكن التفكري
بعم��ق حول هذا النوع م��ن التعميامت الخطية ذات األبعاد املتع��ددة يصيبني بالصداع،
ولذل��ك أميل إىل االكتفاء باألمثلة ثنائية أو ثالثية األبعاد .ما يثريين حيال هذا املوضوع هو
39 أفضل املامرسات يف االنحدار اللوجستي
الفصل األول
أنني غالباً ما أجد العالقات يف طبيعتها منحني ًة ،ليس فقط يف العلوم االجتامعية ولكن أيضاً
يف العلوم الصحية .ومن األمثلة التي خطرت يل رسيعاً حيال هذا الجانب هي العالقة ما بني
الحالة النفس��ية (عىل س��بيل املثال :الضغط النفيس) واألداء لـلوفتوس Loftusولوفتوس
Loftusوكيتش��ام Ketchamيف العام ،1992ودراسة سوليفان Sullivanوباجات Bhagat
يف الع��ام ،1992ودراس��ة ياجني Yegiyanوالن��ج Langيف الع��ام )8(. 2010ومنحنيا منو
إنج��ازات الطالب الذي أنجز فيها فرانس��يس Francisوتشاتسش��نيدر Schatschneider
وكارلس��ون Carlsonيف العام ،2000وتجربة رس��كورال Rescorlaوروسينثال Rosenthal
يف الع��ام .2004ومتوس��ط الدرجات والتوظيف يف مدارس الط�لاب الثانوية التي قام بها
كويرك Quirkوكيث Keithيف العام ،2001ودراس��ة عالقات االس��تجابة لجرعات العالج
لدافيس Davisوسفيندسقارد Svendsgaardيف العام ،1990ومثال العمر والرضا املعييش
ملروكزيك Mroczekوسبايرو III Spiro IIIيف العام .2005
فعىل س��بيل املثال :يبني فرانس��يس وآخ��رون ) Francis et al. (2000أن النمط العام
لالق�تراب من من��و اإلنجاز مع مرور الوق��ت يُ َعد منحني��اً خطياً .ففي الش��كل ُ 1.2
كنت
قمت بنمذجته من خالل بياناتهم املنشورة .يف قد استعرضت لكم منحنى النمو والذي قد ُ
ُ
حالة خرق الفرضية الخطية فإن أمرين يُ َعد احتامل حدوثهام واردا ً بشكلٍ كبريٍ .األمر األول:
ه��و إغفال بعض النتائج املثرية لالهتامم .واألمر الث��اين :هو أن انحدار املربعات الصغرى
االعتيادية س��وف يقوم بالتقليل من تقدير العالقة وإس��اءة تش��خيص طبيعتها الحقيقية.
ولحس��ن الحظ؛ فإ َّن هناك ع��ددا ً متنامياً من الطرق الحتواء االختب��ارات الخاصة بتأثريات
االنحن��اء الخطي؛ إذ يعود ذل��ك إىل وجود برامج إحصائية كانت قد بدأت بتطبيق خيارات
االنحناء الخطِّي لالنحدار.
نسب ذلك غالباً إىل يركيز ودوسون ( ،)Yerkes & Dodson, 1908كام يدعوه البعض -وأنا واح ٌد منهم -مبنحنى
( )8يُ َ
األداء والتوتر .انظر تيجن ) Teigen (1994للحصول عىل ملحة تاريخية عن مجموعة كبرية من النظريات والدراسات.
شكل :1.2عالقة منحنية بني ُع ْمر الطالب ،ودرجة اختبار تحصيل القراء
مصدر البيانات :كتاب مقدمة إىل تحليل منحنى منو األفراد لفرانسيس Francisوتشاتسشنيدر Schatschneider
وكارلسون ،Carlson, 2000كتاب الطالب املتعلِّق ببحث أطباء األطفال والصحة النفسية (صفحة 51إىل .)73نيويورك
(.)NY: Kluwer/Plenum
يُ َعد االنحدار اللوجستي بطبيعته انحدارا ً غري خطي ،األمر الذي سنقوم مبناقشته الحقاً
مفصل يف الفصول القادمة ،وتحديدا ً الطريقة التي ينتهجها االنحدار اللوجستي يف بش��كل َّ
تحوي��ل املتغريات ثنائية التقس��يم (فئوية) إىل متغريات تابعة ،والت��ي ميكن التنبؤ بها من
خالل املتغريات ثنائية التقس��يم أو الفئوية أو املتصلة التي تتضمن تحويالً ال خطياً .ت َص َّور
معي اآلن أن متغريا ً تابعاً عىل ش��كل منحنى (حرف )Sوالذي ميثِّل احتاملية أ َّن ش��خصاً ما
سوف يكون يف مجموعة أو أخرى (كام هو الحال يف الشكل .)1.3ال يجب عليك القلق اآلن
حيال التفاصيل املتعلِّقة بكيفية تكوين املتغريات التابعة يف االنحدار اللوجس��تي ،فس��وف
نحظى بالكثري من املتعة حينام نقوم باستكش��اف ذلك الحقاً وبش��كلٍ ش��املٍ .ما وجدته
أمرا ً يُ َعد مثريا ً لالهتامم هو أنَّه وعىل الرغم من أن الخاصية األساس��ية لالنحدار اللوجس��تي
41 أفضل املامرسات يف االنحدار اللوجستي
الفصل األول
(التح�� ُّول اللوغاريتمي)( )9تعد منحنية خطياً ،إال أن الفرضية الخطية التزال قامئة وواضحة.
وبالتحديد فإن الفرضية األساسية تشري إىل وجود عالقة خطية بني املتغريات املستقلة (والتي
ت ُ َع��د خطي ًة عىل التح��ول اللوغاريتمي) وبني املتغري التابع .األمر يُ َعد مش��ابهاً عند قيامنا
بتكوين منوذج يف انحدار املربعات الصغرى االعتيادية OLS؛ إذ إنه بإمكاننا منذجة العالقة
والتي هي باألصل غري خطية عىل التحول اللوغاريتمي ،وهو األمر الذي سنقوم بالخوض يف
تفاصيله بشكلٍ أعمق يف الفصل السابع.
شكل :1.3دالة االنحناء املعياري اللوجستي
الحظ أ َّن (الالخطية) تض��م مفهوم التقاطعات ،والتي تعتمد فيها تأثريات املتغري التابع
ع�لى تأثريات املتغري اآلخر؛ فعىل س��بيل املث��ال :كان هناك الكثري م��ن النقاش حول تأثري
اخت�لاف الجن��س عىل درج��ة تحصيل اختب��ار الرياضيات؛ حيث كانت ه��ذه قضية محل
الدراس��ة يف الع��ام 1980م عندما بدأ املرك��ز الوطني لإلحصاء التعليم��ي يف مرحلة طالب
( )9ت ُ َعد هذه عبارة رائعة حني يتم استخدامها بأريحية يف أثناء النقاشات ،قم مبحاولة استخدامها ومن ث َ َّم تابع مدى
تقدم مكانتك االجتامعية.
املدارس الثانوي��ة وما بعدها (املعلومات ،والبيانات متاحة عىل الراب��ط http : // nces . ed.
.)gov/ pubsearch/ getpubcats.asp?sid = 022يف الع��ام 1980كنا قد علمنا أ َّن اإلناث
أقل يف محصلة اختبار الرياضيات مقارن ًة بالذكور .وكام يوضح لنا الش��كل يُؤ ِّديْ َن بش��كلٍ ّ
كل املدارس .نستطيع أن نرى وجود منط عام يف هذا ،1.4يُ َعد النمط العام غري متامثلٍ يف ِّ
فجوات أكرب يف تحصيل الرياضيات ،بينام متتلك املدارس ٍ املثال؛ أذ إ َّن املدارس الكربى متتلك
()10 ٍ
فجوات أصغر يف التحصيل. الصغرى
شكل :1.4العالقة بني حجم املدرسة ،وجنس الطالب يف تنبؤ تحصيل الطالب لدرجات الرياضيات
مصدر البيانات :بيانات املدارس الثانوية ،وما بعد الثانوي (.)http://nces.ed.gov/pubsearch/getpubcats.asp? sid = 022
وبعبارة أخرى ،يختلف تأثري جنس الطالب بنا ًء عىل حجم املدرس��ة (ورمبا ذلك بسبب
ع��دة متغ�يرات أخرى) .ومجددا ً ،فإن هناك العديد من األس��باب لحدوث ذلك (والتي لن
نخوض فيه��ا)؛ ولكن النتيجة التي ته ُّم املوضوع تُ َعد مثري ًة لالهتامم .هذا األمر ليس فقط
عبارة عن عالقة خطية؛ بل العديد من العالقات الخطية واملتنوعة والتي تعتمد عىل السياق
الذي يجد الطالب أنفسهم فيه .وبشكلٍ مشابه؛ فإنك عىل األرجح ستقوم بنمذجة وإيجاد
( )10الحظ أ َّن ذلك ليس مثاالً عىل االنحدار اللوجستي؛ إذ إننا سنخوض يف التفاعالت يف االنحدار اللوجستي من خالل الفصل
الثامن .تم الحصول عىل هذه النتائج من خالل تحليل النمذجة الهرمية الخطية ( )HLMذي املتغري املتصل التابع
(سوف نقوم بتقديم ،ومناقشة تحليل النمذجة الهرمية الخطية لعالقته باالنحدار اللوجستي يف الفصل الثالث عرش).
تأثريات التفاعل حني قيامك بإجراء االنحدار اللوجس��تي .وسوف نقوم باستعراض تأثريات
مفصل من خالل الفصل الثامن. التفاعل بشكلٍ َّ
القياس المثالي:
عىل األغل��ب؛ إنه يُ َعد رسا ً صغريا ً وقذرا ً يف العلم اإلحصايئ ،وهو أننا دامئاً نفرتض مثالية
القياس عىل الرغم من أنه نادرا ً ما يتم تحقيق ذلك؛ فدامئاً نفرتض يف أغلب اإلجراءات اإلحصائية
محل الدراسة وإىل املدى الذي لن نقيسه فعالً ،وذلك سوف املتغيات َّ
بأننا س��نقوم بقياس رِّ
يجعل من حدوث التحيزات أو إساءة التقديرات أمرا ً واردا ً وبشدة .ففي االرتباط واالنحدار
البس��يطني ،يكون التأثري عاد ًة ناتجاً من إساءة تقدير التأثريات محل الدراسة .وعىل الرغم
من ذلك؛ فإنه من املمكن للتأثريات أن تكون غري قابلة للتنبؤ أو ُمشَ َّوشة بالنسبة لالنحدار
املتع ِّدد والتحليالت األخرى امل ُعقَّدة .فإذا قررت مثالً القيام بدراسة مستوى تحصيل الطالب؛
من خالل استخدام البيانات املتوفِّرة عن الحالة االجتامعية واالقتصادية ألرسة الطالب SES؛
فستكون غري قاد ٍر عىل التحكُّم يف قيمة التأثري عىل الوجه األكمل حينام يكون قياسك لوضع
ُتغيات
الطال��ب االجتامعي واالقتصادي غري دقيق .ذلك س��يؤدي إىل الزي��ادة يف تقدير امل رِّ
املستقلة األخرى حينام تتداخل مع التباين ،والذي كان من املفرتض أن يتم التخلص منه يف
تعاملت مع هذه اإلش��كالية
ُ متغري الحالة االجتامعية واالقتصادية ألرسة الطالب .SESلقد
بتعمق يف مواضع أخرى؛ لذا س��وف أقوم بتوجيه القراء املهتمني بذلك عوضاً عن تلخيصها
هنا (.)Nimon, Zientek, & Henson, 2012; Osborne, 2003, 2008, 2012
للمتغ�ِّي�ات؛ ولذلك فهام يُع َّدان
رِّ ويقوم االنحدار اللوجس��تي أيضاً عىل ج��ودة القياس
متشابهني من هذه الناحية.
متجانس��اً لجميع نقاط البيانات حول خط االنحدار .وألن االنحدار اللوجس��تي ليس إجرا ًء
معلمياً؛ فإنه ال يفرتض التفاوت أو الثبات بالنس��بة للتباين .إال إنه هناك بعض الفرضيات
املثرية لالهتامم واملتعلِّقة بالتناثر ،والتي تبدو متشابه ًة بالنسبة يل.
فالتناث ُر هو مفهوم ميكن اس��تيعابه بسهولة ،وذلك من خالل تخ ُّيل الكثري من الصناديق
الصغرية واملصفوفة سوياً .كل صندوق ميثل تركيب ًة من متغري تابع وآخر مستقل .فإذا َ
كنت
تقوم مثالً بالبحث يف مس��توى ضغ��ط الدم واحتامالت اإلصابة بجلطة دماغية؛ فس��يكون
لديك صناديق لكل مدى من ضغط الدم ،والذي ميثل األش��خاص املصابني عن غري املصابني
بجلطات دماغية .وحني قيامك بأخذ عينة من مجتمع الدراسة؛ فإنه يتوجب عليك الحرص
عىل ملء جميع الصناديق التي يف حوزتك قدر املس��تطاع .فالبيانات املتناثرة هي مصطلح
يتم إطالقه حينام تكون بعض هذه الصناديق غري ممتلئة ،األمر الذي مينع التقدير بأسلوب
اإلمكان األعظم من القيام بتشكيل التقديرات عىل نحو ف َّعال .وبشكلٍ عام؛ فإن الفارق ما
الصغرى االعتيادية واالنحدار اللوجس��تي يُ َعد موضوعاً مثريا ً لالهتامم،
بني انحدار املربعات ُّ
وسوف نقوم بفحص واختبار الفرضيات األساسية عىل نح ٍو من التفصيل يف الفصل الرابع.
استقاللية المشاهدات:
نفرتض اس��تقاللية املشاهدات يف أغلب التحليالت ،باستثناء حني قيامنا بنمذجة بيانات ُ
متشعبة أو ذات مقاييس متكررة بالتحديد .ونظرا ً أل َّن معظم البيانات يف العامل (خاص ًة يف
العلوم االجتامعية ويف بعض العلوم األخرى كالعلوم الطبية) غالباً ما تأيت عىل هيئة سالسل
هرمي��ة أو مجموعات .وميكن النقاش يف مدى س��لبيات وإيجابيات هذه الفرضية؛ فلنقل
عىل س��بيل املث��ال :إن الباحثني قد قاموا باختي��ار عينة أفراد من مراك��ز صحية ،أو قاموا
باختي��ار عينة طالب من مدارس أو فصول دراس��ية؛ فإنهم يف الواقع قد قاموا باختيار عينة
أفراد هم باألساس متشابهون يف نوا ٍح كثرية مقارن ًة باألفراد الذين تم اختيارهم عشوائياً من
مجتمع س��كاين كامل .هذا األمر ينتهك وبوضوح فرضية استقاللية املشاهدات ،وقد يؤدي
بس��ط حول هذا املفهوم واإلش��كاليات التي من إىل تح ُّي��ز النتائج؛ وللحصول عىل متهيد ُم َّ
املمك��ن مواجهتها ،بإمكانك العودة لكت��اب أوزب��ورن ) Osborne (2000أو الذهاب إىل
الفصل الثالث عرش والذي يناقش إجراء النمذجة الهرمية الخطية لالنحدار اللوجستي.
45 أفضل املامرسات يف االنحدار اللوجستي
الفصل األول
= - 2االنحراف
) Ln
االحتامل املرجح للنموذج املالئم
االحتامل املرجح للنموذج املشبع ( (معادلة رقم )1٫1
( )11أعتذر إن كان الحديث عن االنحراف يف االنحدار اللوجستي ليس مبستوى اإلثارة حني يتم الحديث عن االنحراف
السلويك أو االجتامعي.
من ناحية املفهوم ،توجد هناك العديد من الطرق لتقييم النموذج اإلجاميل يف االنحدار
اللوجس��تي ،إال إن اختالف هذه الطرق يستند بش��كلٍ كبري عىل نوعية االنحرافات ،وكيف
يتم التفكري بها؛ فإذا كنت عىل معرف ٍة بأنواع أخرى من التحليالت التي تس��تخدم اإلمكانية
الكربى؛ فإنك قد س��بق وأن َ
رأيت إمكانية ( )- 2 Logالكربى والتي يتم اس��تخدامها بشكل
مامثل .فاالنحرافات وإمكانيات ( )- 2 Logالكربى تعد متطابقة من ناحية املفهوم.
ما المقصود بدالة تحليل التمايز؟ وكيف يُ َعد االنحدار اللوجستي أفضل
منها أو مختلفاً عنها؟
ناقش��ت بش��كلٍ مخترص فكرة إجراء انحدار املربعات الصغ��رى االعتيادية ُ س��بق وأن
باس��تخدام متغري ثنايئ تاب��ع .هذا النوع م��ن التحليل يُد َعى بنم��وذج االحتامل الخطي،
وبإيجاز فإ َّن هذا النهج يحمل يف طياته العديد من اإلشكاليات واملآخذ؛ فعىل سبيل املثال:
بإم��كان االحت�ماالت امل ُتن َّبأ بها أن تتخطى امل��دى ( 0.00إىل )1.00وال��ذي يُ َعد أمرا ً جائزا ً
م��ن ناحية املفه��وم؛ إذ يتفاوت التباين الخاص بالبواقي ،كام أنها غ�ير ُموزَّعة طبيعياً .أما
التحلي��ل املتاميز للمجموعتني؛ فقد تم تطوي��ره يف بداية القرن العرشين (.)Fisher, 1936
ات معينة للتنبؤ، ويغلب اس��تخدام هذا اإلجراء عمليًّ��ا يف تصنيف األفراد بنا ًء عىل متغ�ير ٍ
ُ
وذلك لغرض معرفة ما إذا كان ميكن للباحثني القيام بالتنبؤ بتش��خيص الطبيب الش��خيص
(عىل س��بيل املثال) .يتم يف التحليل املتاميز اس��تخدام مجموعة من املتنبئات؛ ألجل توليد
معادلة التنبؤ والتي ت ُس َّمى بالدالة الخطية املتاميزة ،ويتم وزن كل متن ّبئ مبعامل (كام هو
وبدرجات تم التنبؤ بها .ولعله من البديهي ٍ الحال يف انحدار املربعات الصغرى االعتيادية)
أن يتطاب��ق التحليل املتاميز رياضيًّا مع دال��ة االحتامالت الخطية (،)Cohen et al., 2002
وقت مىض ،إال أنه ليس وبذلك فإنه يحمل املهام نفسها .ورغم أنه كان يُ َعد إجرا ًء مجدياً يف ٍ
كذل��ك يف وقتنا الحايل .ولذا أرى أنه من املفرتض عىل الباحثني القيام باس��تخدام االنحدار
اللوجستي والذي يُ َعد اإلجراء األكرث نجاحاً لهذا الغرض.
الخالصة:
يُ َعد االنحدار اللوجستي وافدا ً جديدا ً عىل صندوق األدوات اإلحصائية للباحثني خصوصاً
يف مجال العلوم االجتامعية؛ ولكنه يُ َعد املامرسة األفضل حال ًّيا حينام يتم التعامل مع نتائج
ذات طبيعة ثنائية أو نوعية .ومن خالل املادة التي يحتويها هذا الكتاب؛ فس��وف نتمكن
من استكش��اف جميع الطرق املتنوعة والتي يتشابه ويختلف فيها االنحدار اللوجستي مع
انحدار املربعات الصغ��رى االعتيادية؛ فإذا كان انحدار املربعات الصغرى االعتيادية مألوفاً
لديك؛ فس��وف تجد االنحدار اللوجستي أمرا ً س��هل الفهم؛ حيث تختلف التفاصيل الفنية
يف مكنونه��ا اختالفاً كبريا ً ،كام توجد هناك بعض الفروقات الدقيقة واملثرية لالهتامم ،والتي
يتوجب عىل املتمرس�ين يف االنحدار اللوجس��تي إجادتها؛ (ولكن من باب العدل؛ فإن هناك
الكثري من الفروقات الدقيقة واملمتعة التي يحتاج املتمرس��ون يف انحدار املربعات الصغرى
االعتيادي��ة إىل إجادتها أيضاً) .س��وف نأخذ كل موضوع عىل ِح�� َدة ،ويف النهاية أمتنى أنك
ستبدأ يف تقدير مدى جامل وقوة هذا النوع من االنحدار ،وستكون جاهزا ً الستخدامه بنا ًء
عىل أفضل املامرسات التي تع ِّززها باألدلة.
:مراجع
- Cohen, J., Cohen, P., West, S., & Aiken, L. S. (2002). Applied multiple regression/ correlation
analysis for the behavioral sciences. Mahwah, NJ: Lawrence Erlbaum.
- Davies, H. T. O., Crombie, I. K., & Tavakoli, M. (1998). When can odds ratios mislead? British
Medical Journal, 316, 989–991.
- Davis, J. M., & Svendsgaard, D. J. (1990). U-Shaped dose-response curves: Their occurrence and
implications for risk assessment. Journal of Toxicology and Environmental Health, Part A Current
Issues, 30(2), 71–83.
- Fisher, R. (1936). The use of multiple measurements in taxonomic problems. Annals of Eugenics,
7, 179–188. doi: citeulike-article-id:764226
- Francis, D., Schatschneider, C., & Carlson, C. (2000). Introduction to individual growth curve
analysis. In D. Drotar (Ed.), Handbook of research in pediatric and clinical child psychology (pp.
51–73). New York, NY: Klewer/Plenum.
- Holcomb, W. L., Jr., Chaiworapongsa, T., Luke, D. A., & Burgdorf, K. D. (2001). An odd measure of
risk: use and misuse of the odds ratio. Obstetrics and Gynecology, 84(4), 685–688.
- Hosmer, D. W., & Lemeshow, S. (2000). Applied logistic regression. Hoboken, NJ: Wiley.
- Ingels, S. (1994). National Education Longitudinal Study of 1988: Second follow-up: Student
component data file user’s manual. Washington, DC: U.S. Department of Education, Office of
Educational Research and Improvement, National Center for Education Statistics.
- Loftus, E. F., Loftus, E., & Ketcham, K. (1992). Witness for the defense: The accused, the eyewitness,
and the expert who puts memory on trial. New York, NY:
- St. Martin’s Griffin.
- Mead, M. (1935). Sex and temperament in three primitive societies. New York, NY: Morrow.
- Mroczek, D. K., & Spiro III, A. (2005). Change in life satisfaction during adulthood: findings from
the veterans affairs normative aging study. Journal of Personality and Social Psychology, 88(1), 189.
- Nimon, K., Zientek, L. R., & Henson, R. K. (2012). The assumption of a reliable instrument and
other pitfalls to avoid when considering the reliability of data. Frontiers in Psychology, 3(102).
- Oakley, A. (1972). Sex, Gender, and society. London: Temple Smith.
- Osborne, J. W. (2000). Advantages of hierarchical linear modeling. Practical Assessment, Research
& Evaluation, 7(1).
- Osborne, J. W. (2003). Effect Sizes and the disattenuation of correlation and regression coefficients:
Lessons from educational psychology. Practical Assessment, Research, and Evaluation, 8(99).
- Osborne, J. W. (2008). Is disattenuation of effects a best practice? In J. W. Osborne (Ed.), Best
practices in quantitative methods (pp. 239–245). Thousand Oaks, CA: Sage.
- Osborne, J. W. (2012). Best practices in data cleaning: A complete guide to everything you need to
do before and after collecting your data. Thousand Oaks, CA: Sage.
- Osborne, J. W., & Waters, E. (2002). Four assumptions of multiple regression that researchers
should always test. Practical Assessment, Research, and Evaluation, 8(2).
- Pedhazur, E. J. (1997). Multiple regression in behavioral research: Explanation and prediction. Fort
Worth, TX: Harcourt Brace College.
- Quirk, K. J., Keith, T. Z., & Quirk, J. T. (2001). Employment during high school and student
achievement: Longitudinal analysis of national data. The Journal of Educational Research, 95(1),
4–10.
- Rescorla, L., & Rosenthal, A. S. (2004). Growth in standardized ability and achievement test scores
from 3rd to 10th grade. Journal of Educational Psychology, 96(1), 85.
- Sullivan, S. E., & Bhagat, R. S. (1992). Organizational stress, job satisfaction and job performance:
Where do we go from here? Journal of Management, 18(2), 353–374.
- Teigen, K. H. (1994). Yerkes-Dodson: A law for all seasons. Theory & Psychology, 4(4), 525–547.
- Yegiyan, N. S., & Lang, A. (2010). Processing central and peripheral detail: How content arousal
and emotional tone influence encoding. Media Psychology, 13(1), 77–99.
- Yerkes, R. M., & Dodson, J. D. (1908). The relation of strength of stimulus to rapidity of habit-
formation. Journal of Comparative Neurology and Psychology, 18(5), 459–482.