Professional Documents
Culture Documents
(دراسة تطبيقية)
مقدمه
dr-abdelreheembassuny@outlook.com
https://caf.journals.ekb.eg/
:الملخص
السكري وإنشاء دالة تميزية تقوم
ُ يهدف البحث إلى تحديد العوامل المؤثرة في اإلصابة بمرض
غير مصاب) وذلك من خالل مجموعة من،بالتمييز والفصل بين األشخاص إلى مجموعتين ُهما (مصاب
، مرض النقرس، ممارسة الرياضة، التدخين، النوع، السن، ضغط الدم، الوزن،العوامل المؤثرة وهي الوراثة
شخص منهم350 وتم التطبيق على عينة من. وأمراض القلب والكلى، الحالة االجتماعية،الكوليسترول
غير مصاب وبعد التأكد من مالئمة التحليل التمييزي للبيانات وتكوين دالة تمييزية182 ُمصاب و168
، ضغط الدم، السن،السكري الوزن ُ للفصل والتمييز تبين أن أكثر العوامل المؤثرة في اإلصابة بمرض
أما.المتغيرات لعدم معنوياتها
ُ وتم استبعاد باقي، النوع، الكوليسترول، الوراثة، ممارسة الرياضة،التدخين
) يليه ضغط%79.4( المتغيرات ُمساهمة في التمييز والفصل بين المجموعات هو الوزن بنسبة
ُ عن أكثر
) والكوليسترول بنسبة%28.9( ) ثم السن بنسبة%31( ) يليه الوراثة بنسبة%33.2( الدم بنسبة
أخير النوع بنسبة
) و ًا%19.8( ) ثم ممارسة الرياضة بنسبة%20.8( ) والتدخين بنسبة%24.2(
) وحساسية%9.4( ) بنسبة خطأ%90.6( ) كما تبين كفاءة الدالة التمييزية في التصنيف بنسبة%10(
.)%88.1( ) ونوعية بنسبة%92.9(
Abstract:
The research aims to determine the factors that affect the incidence
of diabetes and establish discriminant function that separates people from
with and without disease groups. this is done through a set of factors,
genetics, weight, blood pressure, age, gender, smoking and exercise, gout
and cholesterol, social status, and heart and kidney disease. After checking
the fit of the discriminant analysis to the data and creating the discriminant
function for separating and distinguish, it was concluded that the most
important factors affecting the incidence of diabetes are weight, age, blood
pressure, smoking, exercise, genetics, cholesterol and gender the
remaining variables were excluded because they were not significant. the
variables that contribute most to segregation are weight (79.4%), blood
pressure (33.2%), genetic (31%), age (28.9%) cholesterol (24.2%), smoking
(20.8%), exercise (19.8%) and gender (10%) it also shows that the
discriminative function is (90.6%) efficient, and attributed if wrong (9.4%),
sensitivity (92.9%), qualitative (88.1%).
299
مقدمة:
شهدت السنوات األخيرة زيادة ملحوظة في اعداد المصابين بمرض السكري حتى اننا ال نكاد نرى
بيت بدون مريض السكري حتى أصبح غالبية المصريين يتعايشون مع هذا المرض على أنه صديق وفي
ولكنه غير وفي ألنه في أي لحظة قد يفتك بحياة المريض وخاصة ان لمرض السكري مضاعفات خطيرة
تصيب القلب والشرايين واالعصاب والكلى والعين فقد كان ومازال مرض السكري وراء ارتفاع نسبة الوفيات
سواء كان بشكل مباشر أو غير مباشر ،ويرجع األطباء السبب إلى عدم مقدرة البنكرياس على فرز كمية
االنسولين المطلوبة أو االنسولين المنتج غير فعال مما يؤدي إلى اضطرابات ومنها ارتفاع نسبة السكر في
الدم مما يضر الكلى واألوعية الدموية والقلب والعين وغيرها ويرجع مرض السكري إلى مجموعة من العوامل
أهمها عامل الوراثة وضغط الدم والوزن الزائد والنوع وممارسة الرياضة والتدخين والكوليسترول وأمراض القلب
والكلى.
ويعتبر أسلوب تحليل التمايز أهم األساليب اإلحصائية متعددة المتغيرات التي تستخدم في معالجة
البيانات الوصفية ويعتمد على بناء دالة تسمى دالة التمايز وهي عبارة عن توليفة خطية لمجموعة من
المتغيرات المستقلة وهذه الدالة تعمل على تقليل التشابه في أخطاء التصنيف ويهدف التحليل التميزي إلى
تصنيف المشاهدات إلى مجموعاتها الصحيحة بأقل خطأ تصنيف ممكن ،ويختلف أسلوب التمايز مع ُكل من
تحليل التباين وتحليل االنحدار حيث المتغير التابع نوعي ،بينما في األسلوبين األخيرين يكون ُمتغير كمي،
إن االنحدار اللوجستي
كما يتشابه تحليل التمايز مع االنحدار اللوجستي إذا يفسر ُكل منهما ُمتغير وصفي أال َ
المستقلة تتبع التوزيع الطبيعي. ال يتطلب أن تكون ُ
المتغيرات ُ
ُمشكلة البحث:
ُيعد االهتمام بالقطاع الصحي وصحة المواطن من أولويات أي حكومة حتى يواكب أي تقدم كما
يعد مرض السكري من االمراض األصيلة في الشعب المصري في مختلف االعمار ومن هذا المنطلق تبدأ
مشكلة البحث في الظهور كما أن معظم الدراسات اهتمت بالتحليل احادي المتغير أو ثنائي المتغير ولم
يتطرق اال القليل إلى التحليل متعدد المتغيرات ومن هنا لزم البحث في األساليب اإلحصائية التي تهتم بدراسة
متغيرات متعددة او مجموعة من المتغيرات في آن واحد حتى يمكن الوقوف على أهم العوامل المؤثرة على
اإلصابة بمرض السكري ومحاولة الحد منها.
أهمية البحث:
يستمد البحث أهميته من خطورة مرض السكري وما ينتج عنه من مضاعفات خطيرة كأمراض
القلب والكلى والعين وغيرها مما يؤدي إلى ارتفاع نسبة الوفيات واهدار الكثير من األموال على القطاع
300
واألخرى غير المصابة بمرض السكري ثم تصنيف المشاهدات الجديدة وتوزيعها على إحدى المجموعتين
وبالتالي التشخيص المبكر والحفاظ على أرواح البشر واألموال الطائلة التي تنفق عليها.
أهداف البحث:
للبحث أهداف عديدة أهمها- :
-1القاء الضوء على أسلوب التحليل التمييزي كأحد أساليب التحليل االحصائي متعدد المتغيرات.
-2تحديد العوامل المؤثرة في اإلصابة بمرض السكري.
-3انشاء دالة تمييزية تصنف األشخاص إلى مجموعتين (مصاب وغير مصاب).
-4تحديد األهمية النسبية للعوامل المؤثرة في اإلصابة بمرض السكري ومدى مساهمة كل عامل في التمييز
والتصنيف.
-5تصنيف األشخاص أو المفردات الجديدة وتوزيعها على إحدى المجموعتين.
301
اللوجستي يستخدم في حالة العينات الصغيرة حيث ان ال يشترط ان تتبع المتغيرات التوزيع الطبيعي كما
توصلت الدراسة إلى أن نتائج الطريقتين كانت متقاربة عندما كان حجم العينة كبير.
-2دراسة عبد الكريم (- :)2006
هدفت الدراسة إلى استخدام الطرق التمييزية اإلحصائية لتشخيص بعض أمراض القلب حيث تناول
يضا جمعت منالبحث أسلوب التحليل التمييزي والنموذج اللوجستي وتم التطبيق على عينة من 206مر ً
ثالث مستشفيات مختلفة وكانت المتغيرات المستقلة هي العمر والوزن والطول وضغط الدم ونسبة
الكوليسترول في الدم والنوع والمتغير التابع نوع المريض (تصلب الشرايين = ،1جلطة قلبية = )2وتم
التوصل إلى النموذج اللوجستي أعطى نسبة خطأ تصنيف أقل من النموذج التمييزي.
-3دراسة الجاعوني ،غانم (- :)2007
ضمن هذا البحث دراسة أحد أساليب التحليل اإلحصائي متعدد المتغيرات وهو أسلوب التحليلتَ َ
التمييزي الذي يعد من األساليب اإلحصائية المتقدمة التي تستخدم في توصيف وتوزيع االسر داخل الهيكل
االقتصادي واالجتماعي للمجتمع ويساعد في رسم خطط التنمية االقتصادية واالجتماعية التي تهدف إليها
العبء الضريبي واإلعانات الحكومية ألسرالدولة والوقوف إلى أنسب الطرق في حيث عدالة توزيع الدخل و ِ
المجتمع بصورة أكثر واقعية.
-4دراسة الشمراني (- :)2008
هدفت الدراسة إلى التعرف على كيفية استخدام التحليل التمييزي وكذلك استخدام تحليل التباين
متعدد المتغيرات وذلك في حالة عامل واحد أو عاملين وكذلك مدى إمكانية تقييم كفاءة النموذج التمييزي
واختيار القدرة التمييزية للنموذج ومقارنة جوانب الشبه واالختالف بينها ،توصلت الدراسة إلى ان تشابه
افتراضات تحليل التباين المتعدد والتحليل التمييزي وفي حالة وجود عاملين يعد استخدام تحليل التباين المتعدد
امر ضرورًيا عن وجود تفاعل أم ال وبعده يأتي دور التحليل التمييزي لتحديد الدوال التمييزية لكل مجموعة.
ًا
-5دراسة ):Roush and Kelly (2009
Linear discriminant هدفت هذه الدراسة إلى عمل مقارنة بين تحليل التمايز الخطي
) analysis (LDAوتحليل التمايز اللوجستي )Linear logistic discrimination analysis (LLD
وتحليل التمايز الخطي باستخدام الرتب LDA based on ranksوتحليل التمايز المختلط Mixture
)discriminant analysis (MDAباالعتماد على دراسة محاكاة مونت كارلو وتوصلت الدراسة إلى أن كل
من تحليل التمايز الخطي وتحليل التمايز اللوجستي لهم نفس الدقة في التصنيف كما أشارت النتائج إلى
تحليل التمايز المختلط بشكل عام هو أكثر النماذج قابلية للتطبيق وأكثرهم دقة للتصنيف وخاصة إذا كانت
أن تحليل التمايز باالعتماد على الرتب أكثر دقة للتصنيف عن كل من
البيانات ال تتبع التوزيع الطبيعي كما َ
تحليل التمايز الخطي وتحليل التمايز اللوجستي.
-6دراسة الجزار (- :)2012
302
هدفت الدراسة إلى المقارنة بين انسب أساليب التصنيف والتنبؤ وهي التحليل التمييزي الخطي
وأسلوب االنحدار اللوجستي المتعدد وكان المعيار المستخدم للمقارنة بينهما هو دقة التصنيف والمساحة تحت
المنحنى ) Area under the roc curve (AUCلتحليل الـ Receiver operating characteristic
) curve (ROCعلى بيانات مولدة بالحاسب بهدف مقارنة قدرة كال النموذجين على التصنيف والتنبؤ تحت
تأثير االختالف في حجم البيانات وعدد فئات المتغير التابع والمسافة بين متوسطات المجموعات التي تحتاج
إلى تصنيف وتبين تشابه كبير في المعامالت التي تم تقديرها وكان األسلوب اللوجستي أعلى بقليل من
التحليل التمييزي في دقة التصنيف إال أنه عند أخذ معيار Specificity , Sensitivityوالمساحة تحت
المنحنى AUCلتحليل ROCفقد وجد ان الفارق بين النموذجين ضئيل ً
جدا.
-7دراسة هاشم (- :)2014
سعت الدراسة إلى استخدام التحليل التمييزي المتعدد لتصنيف مراحل اإلصابة بمرض الفشل
الكلوي المزمن وتضمنت الدراسة عينة من 322وتم إيجاد الدالة التمييزية وتصنيف مراحل اإلصابة بمرض
الفشل الكلوي المزمن على أساس مجموعة من المتغيرات وهي العمر والحالة االجتماعية والمهنة والسكن
وعدد األطفال ومستوى الدخل وتبين معنوية متغير المهنة في التمييز والتصنيف كما أن للدالة قدرة عالية
على التمييز وتصنيف األشخاص.
-8دراسة ُسليمان (- :)2015
هدفت الدراسة إلى المقارنة بين التحليل التمييزي والنموذج اللوجستي ونماذج الشبكات العصبية في
تصنيف المشاهدات وتم ذلك بالتطبيق على العوامل المؤثرة على كفاية دخل األسرة وهي حجم األسرة وطبيعة
ملكية السكن ووجود طلبة يدرسون بالجامعات وتوصل التحليل التمييزي إلى الدالة التمييزية ومعنوية تأثير
متغيرين فقط وهما حجم األسرة وملكية السكن وعدم معنوية وجود طلبة يدرسون في الجامعة كما تبين ان
الشبكات العصبية أفضل من النموذج اللوجستي أفضل من التحليل التمييزي.
-9دراسة خوالدي (- :)2017
أوضحت الدراسة دور التحليل التمييزي في التنبؤ بالفشل المالي للمؤسسات االقتصادية الصغيرة
والمتوسطة لوالية أم البواقي باالستعانة بالنسب المالية المحسوبة من القوائم المالية باإلضافة إلى التواصل إلى
تمييز لوضعية المؤسسات سواء كانت ناجحة أو فاشلة وذلك من خالل اتباع خطوات التحليل
ًا أفضل النسب
التمييزي باستخدام برنامج ” “SPSSحيث تم استخدام عينة مكونة من 30مؤسسة منها 17مؤسسة ناجحة
و 13مؤسسة فاشلة واظهرت النتائج كفاءة النموذج المستخدم الذي ُيمكن من التنبؤ بالفشل المالي
للمؤسسات الصغيرة والمتوسطة والذي يتكون من نسبتين ماليتين (معدل دوران األصول المتداولة
ومعدل دوران إجمالي األصول) من اصل تسع نسب لهم القدرة على التمييز بين المؤسسات الناجحة
والمؤسسات الفاشلة.
دراسة النويري (- :)2018 -10
303
أوضحت الدراسة أهم العوامل التي لها دور في تمييز مرض السكري المصابين من غير
المصابين بالفشل الكلوي واستخدام التحليل التميزي للتوصل لنموذج رياضي ُي َم ِكن من تصنيف
مرض السكري المصابين وغير المصابين بالفشل الكلوي وذلك باالعتماد على متغيرات (نسبة السكر
العمر) لمرضى السكري لمعرفة مدى أهمية المتغيرات في التمييز
في الدم – اليوريا – الكرياتينين – ُ
وتم جمع عينة من 200مريض سكري منهم 100مصاب و 100غير مصاب بالفشل الكلوي
وباستخدام الدالة التمييزية تم التوصل إلى- :
هناك فروق معنوية بين متوسطات المتغيرات للمجموعتين باستخدام Fمما يعني قدرة الدالة
على التصنيف.
هناك متغيرات لها األثر األكبر في التمييز وهما اليوريا والكرياتينين.
النموذج التمييزي له دقة تصنيف عالية %91وخطأ .%9
-11دراسة ):Abdul Hussein (2019
سعت هذه الدراسة إلى التمييز بين مجموعتين (المصابين وغير المصابين) بمرض القلب
تلك اإلحصائية
باستخدام إحصائية ) Mahalnobis (Dواشتق الباحث قاعدة للتمييز مشتقة من َ
2
أسمها R D2وهي تتبع توزيع Fواستخدامها في بناء دالة التمييز الخطية وطبقت هذه الدراسة على
40مريض تم تقسيمهم إلى مجموعتين األولى وعددها 16مصاب والثانية وعددها 24من
األشخاص غير المصابين بمرض القلب وتوصلت الدراسة إلى أن إحصائية ُ Mahalnobisمهمة
إلنشاء قاعدة تمييز بين مجموعتين كذلك باالعتماد على هذه اإلحصائية أمكننا إيجاد متجه
معامالت التمايز بسهولة من ُمعامالت االنحدار.
-12دراسة بغرش (- :)2020
هدفت الدراسة إلى استخدام التحليل التمييزي كأسلوب ُيستخدم للتنبؤ بمتغيرات اسمية تابعة
بناء على عالقتها بمتغيرات كمية وتستخدم هذه الطريقة في البنوك لتصنيف المقرضين إلى جيدين
ً
أو سيئين بحسب االخالل بالسداد ،تم التطبيق من مجموعة من المشروعات التي استفاد أصحابها
من القروض من طرف الوكالة الوطنية لتسيير القرض المصغر خالل الفترة من 2004إلى
.2006
304
المبحث األول
التحليل التميزي The Discriminate ate analysis
مقدمة:
هاما في تحليل وتفسير الظواهر االجتماعية والطبيعية في المجتمع
دور ً
يلعب التحليل اإلحصائي ًا
ويعد التحليل اإلحصائي أحد طرق البحث العلمي الذي يستخدم عند دراسة المشاكل االجتماعية والصحية
ُ
واالقتصادية وتم تقسيم التحليل اإلحصائي إلى التحليل احادي وثنائي المتغيرات ويبنى على حزمة من
المتغيرات أو العوامل من األساليب اإلحصائية للتحليل متعدد المتغيرات هو أسلوب التحليل التمييزي والذي
يشاع استخدامه في المجاالت الطبية حيث يهتم التحليل التمييزي بكيفية التمييز بين مجموعتين أو أكثر من
االفراد أو األشياء وتصنيف المفردات الجديدة على المجموعات التي سبق تعريفها ويعتمد أسلوب تحليل
التمايز على الوصول إلى دالة تسمى دالة التمايز تعمل على زيادة الفروق بين متوسط المجموعات حيث
ُكلما كان ُهناك تباعد بين متوسط المجموعات كلما كان التمييز كفء وبالتالي يقل خطأ التصنيف ويعتبر
التحليل التميزي بين مجموعتين أو أكثر من األفراد أو األشياء وتصنيف المفردات الجديدة على المجموعات
استكشافيا بطبيعته حيث يكتشف أسباب االختالف المشاهدة
ً التي سبق تعريفها ويعتبر التحليل التمييزي
عندما ال تستطيع فهم العالقات السببية بدرجة كافية الدقة( .الجاعوني ،غانم)2007 :
أهمية التحليل التمييزي:
305
تعمل هذه الدوال على تعظيم الفروق بين المجموعات (فئات المتغير التابع). -
ترتيب المتغيرات التي تسهم بقدر كبير في التمييز أو توضيح االختالفات بين المجموعات (فئات -
المتغير التابع).
تصنيف المشاهدات الجديدة وتوزيعها على المجموعات (فئات المتغير التابع). -
الوصول إلى أقل نسبة خطأ للتوصيف – تقييم دقة التصنيف كنسبة مئوية. -
شروط التحليل التمييزي:
306
)𝑥̅1 (2
)𝑥̅2 (2
)𝑥̅𝑖 (2 = ⋮
⋮
] )[𝑥̅𝑘 (2
kعدد المتغيرات المستقلة
307
∝ معامالت الدالة التمييزية المعيارية.
̂
: v −1معكوس مصفوفة التباين والتغاير المشترك.
المتغيرات في كال المجموعتين.
𝑖𝑑 :مصفوفة المسافة بين متوسط ُ
(المتغيرات المستقلة)- :
األهمية النسبية للعوامل المؤثرة ُ
بعد قيام التحليل التمييزي بإنشاء وتكوين الدوال التمييزية تظهر له ميزة إضافية وهي تحديد
األهمية النسبية للمتغيرات المستقلة والمؤثرة في عملية التمييز والفصل بين المجموعات وترتيبها ويتم ذلك من
خالل استبعاد إشارات المعامالت المعيارية لدالة التمييز وصاحب أعلى قيمة هو األكثر أهمية أما عن نسبة
المساهمة في عملية التمييز تحدد من خالل ُمعامل االرتباط القانوني ”“Canonical correlation ُ
اختبارات الدالة التمييزية:
الختبار قدرة الدالة على التمييز والفصل بين المجموعات تستخدم االختبارات اآلتية- :
)(F test -1اختبار F
وذلك الختبار قدرة الدالة على التمييز وعن طريق الفرضية التي تنص على ان الدالة ليس لديها
القدرة على التمييز ) (H0ضد الدالة لديها القدرة على التمييز ) (H1ويعتمد هذا االختبار على قياس
االختالفات بين المجموعات وداخل المجموعات بين المفردات ويتم ذلك من خالل تكوين جدول تحليل التباين
التالي- :
Source SS Df 𝒔𝐌 F
بين المجموعات
SSB k-1 𝐵𝑆M 𝐵𝑆M
Between x’s
الخطأ
SSE n-k 𝐸𝑆M 𝐸𝑆M
Within x’s
الكلي
SST n-1
Total
308
ويتم االختيار كالتالي:
-1صياغة الفروض:
𝐻0 الدالة ليس لها قدرة على التمييز:
الدالة لها القدرة على التمييز𝐻1 :
-2القيمة المحسوبة:
𝐵𝑆𝑀
=𝐹
𝐸𝑆𝑀
-3القيمة الجدولية:
)𝑘 𝐹 (𝑘 − 1, 𝑛 −
-4القرار:
إذا كانت Fالمحسوبة أكبر من Fالجدولية نرفض الفرض العدمي ونقبل بالفرض البديل ويكون
للدالة قدرة عالية على التمييز والعكس صحيح.
-2اختبار ويلكس لمدا ):Wil’ks Lambda (A
تأخذ الفروض الشكل اآلتي:
الدالة ليس لها مقدرة على التمييز
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2 الدالة لها القدرة على التمييز
القيمة المحسوبة
𝑘
1
Λ = ∏.
𝑖⋋1+
𝑖=1
المتغيرات.
𝑖⋋ الجذر الكامن ) (eigenvaluesلكل ُ
المتغيرات
kعدد ُ
القرار :تنحصر قيمة
𝑜 ≤Λ≤1
إذا كان
Λ = 1معناها تساوي متوسطات المجموعتين وبالتالي عدم مقدره الدالة على التمييز والفصل.
Λ = 0معناها عدم تساوي متوسطات المجموعتين والدالة لها القدرة عالية على التمييز.
309
إذا اقتربت قيمة Λمن الواحد دليل على عدم مقدرة الدالة على التمييز وإذا اقتربت من الصفر دليل على قدرة
الدالة على التمييز.
وتستخدم إحصائية "ويلكس لمدا" الختبار معنوية المتغيرات الداخلة في النموذج حيث يتم اإلبقاء على
المتغيرات لها أدنى قيمة إلحصائية Wilk’s Lambdaوأعلى قيمة لـ .F
ُ
-3اختبار هوتلنج )Hotelling – Lawely test (T2
إحصاء هوتلنج تأخذ الشكل اآلتي- :
𝑠
𝑖⋋∑ = 𝑇 2
𝑖=1
حيث ان
للمتَغيرات
⋋𝑖 eigenvalues :الجذور المميزة ُ
: sعدد المتغيرات
وتعادل إحصائية هوتلنج قيمة Fمن جدول تحليل التباين ويمكن تحويله إلى قيمة لها توزيع Fتقريبي
صيغته كالتالي:
𝑛1 + 𝑛2 − 𝑘 − 1
=𝐹 ∗ 𝑇2
𝑘)(𝑛1 + 𝑛2 − 2
والقيمة الجدولية:
)𝐹∝ (𝑘 − 1, 𝑛1 + 𝑛2 − 𝑘 − 1
إذا كانت Fالمحسوبة أكبر من Fالجدولية رفض الفرض العدمي وقبول البديل بإن للدالة قدرة عالية على
التمييز.
نقطة الفصل (القطع) :Cut Of Point
بعد تكوين الدالة التمييزية واختبار قدرتها على التمييز والفصل بين المجموعتين يبدأ االستخدام
الثاني لها وهو كيفية تصنيف المشاهدة الجديدة إلى أي المجموعتين تنتمي ويتم ذلك من خالل الخطوات
اآلتية- :
-1تحديد نقطة الفصل وهي تمثل متوسط المتوسطين:
)𝐿̅(1) + 𝐿̅(2
= ̿𝐿
2
حيث ان
̿𝐿 :نقطة الفصل.
) 𝐿̅(1متوسط القيم التمييزية للمجموعة األولى.
) 𝐿̅(2متوسط القيم التمييزية للمجموعة الثانية.
قاعدة التصنيف :Classification Role
310
من خالل هذه القاعدة ُيمكن تصنيف أو التنبؤ بانتماء مفردة جديدة إلحدى المجموعتين بأقل خطأ
تصنيف على النحو التالي:
)1إذا كان )𝐿̅(1) > 𝐿̅(2
وإذا كانت القيمة التمييزية للمفردة الجديدة أكبر من نقطة الفصل تصنف ضمن المجموعة األولى
وإذا كانت القيمة التمييزية للمفردة الجديدة أقل من نقطة الفصل تصنف ضمن المجموعة الثانية وإذا ساوت
ائيا ضمن أي مجموعة من المجموعتين.
نقطة الفصل تصنف عشو ً
)2إذا كان )𝐿̅(1) < 𝐿̅(2
وإذا كانت القيمة التمييزية للمفردة الجديدة أعلى من نقطة الفصل تصنف ضمن المجموع الثانية
ائيا ضمن أي مجموعة في
وإذا كانت أقل تصنف ضمن المجموعة األولى وإذا تساوت معها تصنف عشو ً
المجموعتين.
أخطاء التصنيف:
يقصد بأخطاء التصنيف وضع المفردة في مجموعة غير مناسبة لها أي وضع مفردة في مجموعة ما ولكن
هي تنتمي لمجموعة أخرى ويعتبر خطأ التصنيف عامل ُمهم عند الحكم على كفاءة الدالة التمييزية.
هناك نوعان من أخطاء التصنيف ُهما:
-1خطأ التصنيف الظاهري.
ويحسب من جدول التصنيف التالي.
المجموعة تابع المجموعة األولى ()1 تابع المجموعة الثانية ()2 مجموع
األولى ()1 𝑛11 𝑛12 𝑛1
الثانية ()2 𝑛21 𝑛22 𝑛2
: n11عدد المفردات من المجموعة األولى والتي تم تصنيفها في نفس المجموعة وبالتالي هي صنفت بطريقة
صحيحة.
:n12عدد المفردات من المجموعة األولى والتي تم تصنيفها خطأ في المجموعة الثانية.
:n21عدد المفردات التي تنتمي باألصل إلى المجموعة الثانية وتم تصنيفها خطأ في المجموعة األولى.
: n22عدد المفردات في المجموعة الثانية التي تم تصنيفها في نفس المجموعة وبالتاي هي صنفت بطريقة
صحيحة.
ويحسب الخطأ الظاهري كما يلي:
ُ
𝑛12
𝑃12 =
𝑛1
P12نسبة المفردات التي تنتمي للمجموعة األولى وصنفت خطأ للثانية.
𝑛21
= 𝑃21
𝑛2
P21نسبة المفردات التي تنتمي للمجموعة الثانية وصنفت خطأ في األولى .ويمكن حساب معدل الخطأ
الظاهري باستخدام المعادلة
311
𝑛12 + 𝑛21
𝑛1 + 𝑛2
-2الخطأ الحقيقي :يمثل نسبة التصنيف الخاطئ في المجتمع:
− √𝐷2
[ 𝐹 = 𝑃12 = 𝑃21 ]
2
حيث Fدالة التوزيع الطبيعي المعياري D ،إحصائية .Mahalnobisتحسب القيمة بين القوسين
ويحسب االحتمال المقابل لها من جدول التوزيع الطبيعي المعياري وكلما اقترب االحتمال من الصفر دل
على صنف وانخفاض خطأ التوصيف وبالتالي قدرة الدالة على التمييز والتصنيف اما إذا كان االحتمال قريب
من الواحد يدل على ارتفاع خطأ التوصيف وانخفاض قدره الدالة على التمييز والتصنيف.
الدالة التمييزية بمعامالت غير معيارية- :
تأخذ الشكل التالي:
𝑘𝑥 𝑘𝑏 ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ ⋯ 𝑦 = 𝑏𝑜 + 𝑏1 𝑥1 + 𝑏2 𝑥2
:yالدالة التمييزية غير المعيارية.
:boثابت التمايز.
:bn’sمعامالت التمييز غير المعيارية.
:xn’sالمتغيرات غير المعيارية.
Canonical وللحكم على جودة النموذج التمييزي من خالل ُمعامل االرتباط القانوني
correlationحيث ان القيم المرتفعة لمعامل االرتباط القانوني تكون مؤشر لجودة التوفيق العالي للنموذج
التمييزي وبتربيع قيمة ُمعامل االرتباط القانوني تحصل على قيمة معامل التحديد ” “R2الذي يحدد نسبة
المتغيرات المستقلة في التمييز والتصنيف.
ُمساهمة ُ
312
المبحث الثاني
الجانب التطبيقي
تمهيد:
بالرغم من الدور الذي يلعبه التحليل احادي المتغير أو ثنائي المتغير في تفسير وتحليل كثير من الظواهر
المتغيرات فالبد من اللجوء إلى التحليل
أنه عندما يتعلق األمر بعدد كبير من ُ
االقتصادية واالجتماعية والطبية إال ُ
ُمتعدد المتغيرات ومن أهم أساليب التحليل متعدد المتغيرات والشائع استخدامه في المجاالت الطبية هو أسلوب التحليل
(مصاب أو غير ُمصاب) ي
التمييز والذي يقوم بدوره بالتمييز وفصل األشخاص إلى مجموعتين رئيسيتين ُهما أما ُ
بمرض السكري وذلك على عينة من 350شخص منهم 168مصاب و 182غر مصاب بهدف الوصول إلى دالة
بناء على فرضيات معينة.
تمييزية من خاللها يتم تصنيف األشخاص أو المشاهدات الجديدة على احدى المجموعتين ً
ُ -1متغيرات البحث:
ومصاب ( )1ومجموعة
تتمثل ُمتغيرات البحث في ُمتغير تابع نوعي ثنائي القيمة ) (yغير ُمصاب (ُ )0
(المتغيرات المستقلة) وهي.
من العوامل المؤثرة ُ
.1الوراثة ) 𝟏𝒙(تأخذ ( 0ال يوجد 1 ،يوجد).
.2الوزن(𝒙𝟐 ).
.3ضغط الدم ) 𝟑𝒙( تأخذ ( 0طبيعيُ 1 ،مرتفع).
العمر) 𝟒𝒙( .
ُ .4
.5النوع ) 𝟓𝒙( تأخذ ( 0أنثى 1 ،ذكر).
.6التدخين ) 𝟔𝒙( تأخذ ( 0ال ُيدخنُ 1 ،مدخن).
.7ممارسة الرياضة ) 𝟕𝒙( تأخذ ( 0ال ُيمارسُ ،يمارس رياضة).
.8مرض الُنقرس ) 𝟖𝒙( تأخذ ( 0ال يوجد 1 ،يوجد).
.9الكوليسترول ) 𝟗𝒙( تأخذ ( 0ال يوجد 1 ،يوجد).
.10الحالة االجتماعية ) 𝟎𝟏𝒙( تأخذ ( 0أعزب 1 ،متزوج).
.11أمراض القلب والكلى) 𝟏𝟏𝒙( تأخذ ( 0ال يوجد 1 ،يوجد).
والستخدام تحليل التمييزي مجموعة من االفتراضات البد من توافرها وهي:
-1اختبار التوزيع الطبيعي للبيانات- :
نظر ان حجم العينة يزيد عن ُ 30مفردة طبًقا لنظرية النهاية المركزية فإن البيانات تتبعًا
التوزيع الطبيعي وال داعي إلجراء اختبار الطبيعية.
-2اختبار تساوي متوسطي المجموعتين.
بالنظر إلى الجدول رقم ( )1التالي:
313
المجموعة
Sig الثاني (غير المصابين) ()1 األولى (المصابين) ()1 المتغير
المتوسط المتوسط
000 0.3352 0.7381 𝟏𝒙
000 73.7692 100.3274 𝟐𝒙
000 0.3187 0.7202 𝟑𝒙
000 38.2363 48.333 𝟒𝒙
0.014 0.5385 0.6667 𝟓𝒙
000 0.6154 0.3512 𝟔𝒙
000 0.6044 0.3512 𝟕𝒙
0.891 0.5549 0.5476 𝟖𝒙
000 0.4121 0.7143 𝟗𝒙
0.011 0.6099 0.7381 𝟎𝟏𝒙
000 0.2802 0.5179 𝟏𝟏𝒙
المالحظ من خالل جدول ( )1ان قيمة Sigأقل من 0.05وبالتالي معنوية الفرق بينمن ُ
المتغير الثامن.
المتغير التابع فيما عدا ُ
متوسطي كل متغير في المجموعتين أو خالل فئات ُ
كما ُنالحظ أن المتوسطات األعلى في المجموعة األولى للمصابين في كالً من ،x4 ،x2
العمر والوراثة والكوليسترول وضغط الدم وذلك أمر بديهي فإن المصابين وهما (الوزن و ُ
ُ x3 ،x9 ،x1
بمرض السكري نسبة الضغط العالي والوزن الزائد و ُ
العمر المتقدم أما المتوسطات األعلى في المجموعة
314
وباستخدام اختبار Box’s Mكانت النتائج كالتالي:
Log Determinants
Y Rank Log Determinant
N 8 1.230
Y 8 .976
Pooled within-groups 8 1.244
Test Results
Box's M 47.341
F Approx. 1.283
df1 36
df2 402161.071
Sig. 0.119
ومن المالحظ أن قيمة ) Sig (0.119أكبر من 0.05وبالتالي قبول الفرض العدمي بتساوي مصفوفة
التباين والتغاير للمجموعتين وبالتالي تحقق افتراض تجانس التباين بين المجموعتين.
(المتغيرات المستقلة) في النموذج التمييزي:
-4اختبار معنوية العوامل المؤثرة ُ
تم اختبار معنوية جميع العوامل المؤثرة في النموذج التمييزي لمعرفة أهمية كل ُمتغير ومدى إسهامه في عملية التمييز
Tests of Equality Group of Means والتصنيف وكانت كالتالي
Wilks' Lambda F df1 df2 Sig.
المتغيرات تتمتع بمعنوية عالية حيث ان ) Sig (000أقل من المالحظ أن جميع ُ ومن ُ
) (0.05لجميع المتغيرات ماعدا المتغير الثامن وذلك يدل على المتغيرات لها تأثير معنوي كبير في
عملية التمييز بين المجموعتين ومن ثم توصلنا إلى النموذج التحليل التميزي مناسب لبيانات مرضى
السكري.
)1تكوين الدالة التمييزية:
315
المتغيرات الداخلة في تكوين الدالة التمييزية حيث ان
ال ُإلنشاء الدالة التمييزية تحدد أو ً
المتغيرات في نموذج التمييز يفيد في قياس المتغيرات ذات العالقة المعنوية وذات
اختزال عدد ُ
الصلة األكبر بالموضوع محل الدراسة وللتعرف على المتغيرات ذات القوة التمييزية المعنوية والتي
وهناك عدة معايير إحصائية لإلدخال والحذف وهي
تغطي أقل خطأ تصنيف )ُ .(James, 1985
اإلبقاء على التمييز صاحب القيمة األكبر لـ Fوأقل قيمة إلحصائية ويلكس المدا Wilks’s
lambdaكما في الجدول اآلتي:
a,b,c,d
Variables Entered/Removed
Wilks' Lambda
Exact F
Step Entered Statistic df1 df2 df3 Statistic df1 df2 Sig.
1 x2 .477 1 1 348.000 381.840 1 348.000 .000
2 x4 .441 2 1 348.000 219.946 2 347.000 .000
3 x3 .417 3 1 348.000 160.993 3 346.000 .000
4 x1 .400 4 1 348.000 129.221 4 345.000 .000
5 x7 .390 5 1 348.000 107.676 5 344.000 .000
6 x5 .380 6 1 348.000 93.114 6 343.000 .000
7 x6 .370 7 1 348.000 83.038 7 342.000 .000
8 x9 .365 8 1 348.000 74.142 8 341.000 .000
أعلى في التمييز والفصل بين المجموعتين المصابين وغير المصابين والتي لها اعلى قيمة Fوأقل قيمة
316
0 𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥9
𝑥1 0.284 2.969 0.50 1.446 0.049 0 − 0.41 −0.41 0.57
𝑥2 2.969 337.465 3.136 62.014 0.293 0 − 1.640−1.528 2.410
𝑥3 0.050 3.136 0.251 0.960 −.007 −.047 −.024 0.035
V = 𝑥4 1.446 62.014 201.452 201.45 −.348 −1.571 −.814 0.916
𝑥5 0.049 0.293 −.007 −.348 0.241 0.053 −.013 −.014
𝑥6 −.041 −1.640 −.047 −1.571 0.053 0.251 0.016 −.041
𝑥7 −.041 −1.528 −.024 −.814 −.013 0.016 0.250 −.035
] 𝑥9 [ 0.057 2.410 0.035 0.914 −.014 −.041 −.035 0.247
حيث ان
𝑑 ̂ = 𝑣1
∝
0.160
0.797
0.267
∝− 0.295
̂
0.268
−0.203
−0.187
] [ 0.154
0.154 𝑥9
ولتحديد األهمية النسبية للعوامل المؤثرة ونسبة المساهمة في التمييز والتنبؤ في النموذج التمييزي:
ولمعرفة أهم العوامل المؤثرة تنظر لعمود المعامالت المعيارية ) 𝑖∝(حيث انه القيمة
المطلقة الكبيرة يقابلها العامل األكثر أهمية في التأثير على اإلصابة وتكون هذه األهمية موجبة أو
سالب.
317
أما األهمية النسبية فإن ) (x2الوزن يساهم بنسبة أكبر في عملية تمييز المجموعتين
العمر %28.9وكوليسترول %24.2والتدخين
%79.4يليه ضغط الدم %33.2والوراثة ُ %31
أخير النوع .%10
%20.8وممارسة الرياضية %19.8و ًا
والختبار قدرة الدالة على التمييز:
)1باستخدام جدول تحليل التباين واختبار .F
ومن خالل الفروض اآلتية:
الدالة ليس لها قدرة على التمييز H0
الدالة لها القدرة على التمييز H1
إيجاد قيمة مجموع ُمربعات األخطاء (داخل المجموعات).
SSE = D2 = ∝1 𝑑1 + ∝2 𝑑2 + ∝3 𝑑3 +∝4 𝑑4 + ∝5 𝑑5 + ∝6 𝑑6 + ∝7 𝑑7 + ∝9 𝑑9
]= [0.160 0.797 0.267 0.295 0.268 − 0.203 − 0187 0.154 0.4029
26.55
0.4015
10.09
0.1282
−0.2642
−0.2532
] [ 0.3022
SSE = 24.50
القيمة المحسوبة:
318
F = 300.5
القيمة الجدولية:
F0.05 (7, 342) = 1.40
Fالقيمة المحسوبة أكبر Fالجدولية ∴ رفض الفرص العدمي وقبول الفرض البديل فإن للدالة قدرة
عالية على التمييز والفعل بين المجموعتين.
أوالً :قيمة إحصائية ويلكس المدا 0.365وهي أقرب للصفر وذلك دليل على القدرة العالية للدالة
على التمييز .وكما ُنالحظ أن ) Sig (00أقل من 0.05وبالتالي رفض الفرض العدمي وقبول
الفرض البديل بإن للدالة قدرة على التمييز والفصل بين المجموعتين.
كما أن في جدول:
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
1 1.739a 100.0 100.0 .797
المفسر بين
المالحظ قيمة الجذر الكامن ⋋ = 1.739وتُشير إلى أن نسبة التباين ُ ومن ُ
مجموعتي المصابين وغير المصابين والتي تعود للفروق بينها في النموذج التمييزي الوحيد وجمع
قيمة ُمعامل االرتباط القانوني ُ 0.797معامل االرتباط بين مجموعة العوامل المؤثرة ونموذج التمييز الوحيد
وبتربيع هذه القيمة تحصل على %63.5وهذا يعني نسبة ُمساهمة العوامل المؤثرة في التباين واالختالف
في التمييز بين المجموعتين.
لالستخدام الثاني للنموذج التمييزي وهو التصنيف فكانت النتاج كالتالي:
غير ُمصاب ()0 مصاب ()1 مجموع
غير ُمصاب ()0 169 13 182
ُمصاب ()1 20 148 168
%90.60النسبة اإلجمالية.
319
حيث ان النموذج التمييزي الذي يتكون من ثمان ُمتغيرات ُهما ،x9 ،x7 ،x6 ،x5 ،x4 ،x3 ،x2 ،x1قام
المصابين بمرض السكري وتصنيف غير صحيح 13أي نسبة تصنيف بالتصنيف الصحيح 169مفردة من غير ُ
صحيح %92.9في الحاالت بشكل صحيح .أما بالنسبة للمصابين قام تصنيف الصحيح ُ 148مفردة وغير الصحيح
ُ 20مفردة بنسبة إجمالية صحيحة %88.1وإن الدقة اإلجمالية للتصنيف هي %90.6بخطأ .%8.4
نسبة الخطأ الظاهري:
للمجموعة األولى:
= 0.0714
𝑛12 13
= 𝑝12 =
𝑛1 182
للمجموعة الثانية:
= 0.119
𝑛21 20
= 𝑝21 =
𝑛1 168
بمعامالت غير معيارية- : ي
تقدير النموذج التمييز ُ
يتم تقدير النموذج التمييزي بمعامالت غير معيارية كما يلي:
المتغير
ُ b
x1 0.324
x2 0.063
x3 0.581
x4 0.022
x5 0.551
x6 -.420
x7 -.386
x9 0.325
)(Constant -6.974
𝑦̂ = −6.974 + 0.324 𝑥1 + 0.063 𝑥2 + 0.581 𝑥3 0.022 𝑥4
+0551 𝑥5 − 0420 𝑥6 − 0386 𝑥7 + 0.325 𝑥9
وهذا النموذج فعال وقادر على التصنيف الصحيح للمرضى بنسبة %90.6وأقل خطأ تصنيف .%9.4
المشاهدات الجديدة:
تصنيف ُ
𝒚 > 𝟏̅
𝒚 ∵ 𝟐̅
320
المفردة إلى المجموعة األولى وإذا كانت أقل في
المفردة الجديدة أكبر في النقطة الفاصلة تصنف ُ
إذا كانت ُ
فمثالً - :إذا كانت ُهناك سيدة ) (x5 = 0لديها مرض السكري وراثة ( )x1 = 1والوزن (x2 = 100و ُ
العمر
( )x4=70ولديها ضغط الدم ) (x3 = 1وال ُتدخن ) (x6 = 0وال ُتمارس رياضة ) (x7 = 0وليس لديها كوليسترول
).(x9 = 0
)𝟎( 𝟎𝟐𝟒 ̂ = −𝟔. 𝟗𝟕𝟒 + 𝟎. 𝟑𝟐𝟒 (𝟏) + 𝟎. 𝟎𝟔𝟑 (𝟏𝟎𝟎) + 𝟎. 𝟓𝟖𝟏 (𝟏) + 𝟎. 𝟎𝟐𝟐 (𝟕𝟎) + 𝟎. 𝟓𝟓𝟏 (𝟎) − 𝟎.
𝒚
𝟏𝟕𝟕 − 𝟎. 𝟑𝟖𝟔 (𝟎) + 𝟎. 𝟑𝟐𝟓 (𝟎) = 𝟏.
(المصابين)
للمشاهدة الجديدة أكبر من نقطة الفصل بالتالي تصنف ضمن المجموعة األولى ُ
∵ القيمة التمييزية ُ
السكري.
لمرض ُ
وإذا كان هناك رجل ) (x5 = 1ليس لديه مرض وراثي ) (x1 = 0وزنه ) (x2 = 65وضغط الدم عادي )(x3 = 0
وعمره )ُ (x4 = 60يدخن ) (x6 = 1وال ُيمارس رياضة ) (x7 = 0وكوليسترول عالي ) (x9 = 1القيمة التمييزية
ُ
له.
القيمة التمييزية للمشاهدة أقل من نقطة الفصل وبالتالي تصنف ضمن المجموعة الثانية (غير
المصابين) .وبالتالي فالنموذج التمييزي المقدر بنسبة ُمساهمة العوامل المؤثرة فيه %63.5وكفاءة النموذج في
ُ
النتائج والتوصيات:
يهدف البحث إلى استخدام التحليل التمييزي كأحد أساليب التحليل ُمتعدد الحدود لتحديد أهم العوامل
321
وتم التوصل إلى النتائج التالية:
-1بعد التأكد من توافر افتراضات أسلوب تحليل التمييزي وهي شرط طبيعة البيانات وشرط عدم تساوي متوسطات
المجموعتين وتساوي مصفوفة التباين والتغاير بين المجموعتين ومعنوية غالبية العوامل المؤثرة توصلت إلى
مالئمة أسلوب التحليل التمييزي لبيانات مرضى السكري أي ُيمكن استخدامه في تمييز وتصنيف المفردات
المستقلة.
وفقا لمجموعة العوامل ُ
الجديدة إلى مصابين أو غير ُمصابين ً
-2باختبار معنوية العوامل المؤثرة تم استبعاد ثالث ُمعامالت (متغيرات) هي أمراض النقرس ،الحالة االجتماعية
-3وبالتالي فإن الدالة التمييزية للفصل والتمييز بين المجموعتين بمعامالت معيارية هي.
𝟕𝒙 𝟕𝟖𝟏 𝑳̂ = 𝟎. 𝟏𝟔𝟎 𝒙𝟏 𝟎. 𝟕𝟗𝟕 𝒙𝟐 + 𝟎. 𝟐𝟔𝟕 𝒙𝟑 + 𝟎. 𝟐𝟗𝟓 𝒙𝟒 + 𝟎. 𝟐𝟔𝟖 𝒙𝟓 − 𝟎. 𝟐𝟎𝟑 𝒙𝟔 − 𝟎.
𝟗𝒙 𝟒𝟓𝟏 + 𝟎.
السكري هو الوزن ثم ُ
العمر ثم ضغط الدم ثم التدخين -4أكثر العوامل المؤثرة وأهمها على اإلصابة بمرض ُ
-5أكثر العوامل ُمساهمة في التمييز بين المجموعتين هو الوزن لنسبة ُمساهمة %79.4يليه ضغط الدم بنسبة %33.2
التوصيات:
322
السكري مع إضافة
-2استخدام التحليل التمييزي لتحديد العوامل المؤثرة في اإلصابة بمرض ُ
المبكر.
-3استخدام نموذج الدالة التمييزية في التشخيص ُ
المتعدد
-6استخدام أساليب تحليل ُمتعدد المعدات لوس كاالنحدار اللوجستي واالنحدار ُ
بالتحليل التمييزي.
323
المراجع العربية:
-1الجاعوني ،غانم (" )2007التحليل اإلحصائي ُمتعدد المتغيرات (التحليل التمييزي) في توصيف وتوزيع االسر
داخل الهيكل االقتصادي االجتماعي في المجتمع" ،ورقة بحثية منشورة ،مجلة جامعة دمشق للعلوم االقتصادية
التصنيف والتنبؤ" جامعة األزهر ،كلية االقتصاد والعلوم اإلدارية ،قسم اإلحصاء التطبيقي ،غزة.
-3الشمرانيُ ،محمد بن موسى الشمراني (" )2008دراسة ُمقارنة بين التحليل التمييزي وتحليل التباين في تحليل
المتغيرات" رسالة دكتوراه ،كلية التربية ،جامعة أم الُقرى ،المملكة العربية السعودية.
البيانات ُمتعددة ُ
-4النويري ،فريال محمد (" )2013استخدام الدالة التمييزية الخطية لتمييز مرضى السكري المصابين من غير
المصابين بالفشل الكلوي" رسالة ماجستير ،جامعة الجزيرة ،كلية االقتصاد والتنمية الريفية ،قسم اإلحصاء
التطبيقي .السودان.
-5بغرش ،سعيدة" )2020( ،استخدام التحليل التمييزي في تقدير خطر عدم تسديد القرض من طرق الوكالة
المجلد ( ،)4العدد ( )1الجزائر.
المصغر" مجلة نماء لالقتصاد والتجارة – ُ
الوطنية لتسيير القرض ُ
-6خوالدي ،سليمة (" )2017دور التحليل التمييزي في التنبؤ بالفشل المالي لعينة من المؤسسات الصغيرة
والمتوسطة بوالية أم البواقي لفترة ( ")2016-2014رسالة ماجستير غير منشورة جامعة العربي بن مهيدي،
-7سليمان ،على ابشر فضل (" )2015المقارنة بين التحليل التمييزي والنموذج اللوجستي ونماذج الشبكات
العصبية في تصنيف المشاهدات" رسالة دكتوراه غير منشورة ،جامعة السودان للعلوم والتكنولوجيا ،كلية
الدراسات العليا.
-8عبد الكريم ،أنوار ضياء (" )2006استخدام الطرائق ال تمييزية اإلحصائية لتشخيص بعض أمراض القلب "ورقة
بحثية منشورة ،مجلة جامعة كركوك – الدراسات العلمية ،مجلد ( )1العدد ( ،)2العراق.
-9هاشم ،غراء (" )2014استخدام التحليل التمييزي المتعدد لتصنيف مراحل اإلصابة بمرض الفشل الكلوي
ُ
المزمن" ،جامعة السودان للعلوم والتكنولوجيا – كلية العلوم ،قسم اإلحصاء التطبيقي
ُ -10
324
:المراجع األجنبية
1- Abdul Hussein, S. F., (2019), The use of mahalnobis statistic in the linear discriminant
analysis between two groups, Al – Mustans-yriah university, the journal of
administration and economics, vol-119, pp. 59-66.
2- Ahmed, M. S., (1998) “A Companion of The Discriminant and Logistic Regression
Approach” ph.p thesis, ISSR, Cairo University.
3- Anderson, T. W., (1984). An introduction to Multivariate statistical analysis. and
Edition, John and Sons, New York, USA.
4- Chandran, R.K., (2009). The Effectiveness of stepwise Discriminant Analysis.
Antimicrob Agents Chemother. 2009 July; 53 (7): 2887-2891.
5- Ferrer, A. J. A. and Wang, L. (1999). Comparing The Classification Accuracy among
Non-parametric, parametric at the Annual Meeting of the American Educational
Research Association (Montreal, Quebec, Canada, April 19-23, 1999).
6- Geofry J. M., (1992), Discriminant Analysi and statistical pattern Rocognitien The
university of Queen slan, Wiley.
7- Hosmer .D and Lemeshow S., (2000). Appleid Logestic Rogression. 2nd Edtion wiley:
New York. In CBSU Librany Athired edtion is due to be published in 2013.
8- Kandil, A, M, (1992) “Discriminant with mixture of continuous, discrete and nominal
variables”, The Egyptian Journal, ISSR, Cairo Univ, Vol36 No1, 102, 117.
9- Krznowski, W, T. (1995). “Multivariate statistics Classification covariance structure”,
John Wiley Stens, Inc, New York.
10- Pohar, M., and Blas, M., (2004), Comparison of logistic regression and Linear
discriminat analysis: Asimulation study, Metodoloski Zvzki, Vol-1, pp, 143-161.
11- Rausch, j.R., and Kelley, k. (2009). A Comparison of linear and mixture models for
discriminat analysis under Non normality, Behavior research methods, Vol.41, pp. 85-
98.
12- Wang .y., (2008). Comparing Linear Discriminainat Analysis With Classi fcatim trees
using forest Landwenr Survey Data a case study. M. S Thesis. The Universty of
tennesses. knoxville.
325