Professional Documents
Culture Documents
Subtitle
Subtitle
في هذا القسم ،سنناقش كيفية اختيار أفضل ترتيب متعدد الحدود
والمشكالت التي تنشأ عند اختيار متعدد الحدود بترتيب خاطئ .خذ بعين االعتبار الوظيفة التالية .نفترض أن نقاط التدريب تأتي من دالة
yمتعددة الحدود باإلضافة إلى بعض الضوضاء .الهدف من اختيار النموذج هو تحديد ترتيب متعدد الحدود لتوفير أفضل تقدير للدالة
إذا حاولنا مالءمة الوظيفة بدالة خطية ،فإن الخط ليس معقًدا بما يكفي ليناسب البيانات .ونتيجة لذلك ،هناك العديد من األخطاء(x). .
وهذا ما يسمى بالتركيب الناقص ،حيث يكون النموذج بسيًطا جًدا بحيث ال يتناسب مع البيانات .إذا قمنا بزيادة ترتيب متعدد الحدود ،فإن
النموذج يناسب بشكل أفضل .لكن النموذج ال يزال غير مرن بما فيه الكفاية ويظهر عدم مالءمته .هذا مثال على متعدد الحدود من
الرتبة الثامنة المستخدم لمالءمة البيانات .نرى أن النموذج يعمل جيًدا في مالءمة البيانات وتقدير الوظيفة حتى عند نقاط االنعطاف،
وزيادتها إلى متعدد الحدود من الدرجة السادسة عشرة ،ويعمل النموذج جيًدا للغاية في تتبع نقطة التدريب ،ولكنه يؤدي أداًء ضعيًفا في
تقدير الوظيفة .هذا واضح بشكل خاص عندما يكون هناك القليل من بيانات التدريب .تتأرجح الوظيفة المقدرة ،وال تتعقب الوظيفة .وهذا
ما يسمى بالتركيب الزائد ،حيث يكون النموذج مرًنا جًدا ويناسب الضوضاء بدًال من الوظيفة .لنلِق نظرة على مخطط متوسط الخطأ
التربيعي لمجموعة التدريب واالختبار المكونة من كثيرات الحدود ذات الترتيب المختلف .يمثل المحور األفقي ترتيب متعدد الحدود .المحور
الرأسي هو الخطأ المربع المتوسط .يتناقص خطأ التدريب بترتيب متعدد الحدود .يعد خطأ االختبار وسيلة أفضل لتقدير خطأ متعدد
الحدود .ينخفض الخطأ حتى يتم تحديد أفضل ترتيب لكثرة الحدود .ثم يبدأ الخطأ في الزيادة .نختار الترتيب الذي يقلل من خطأ
االختبار .في هذه الحالة ،كانت ثمانية .أي شيء على اليسار سيعتبر غير مناسب .أي شيء على اليمين مناسب .إذا اخترنا أفضل
ترتيب لكثرة الحدود ،فستظل لدينا بعض األخطاء .إذا كنت تتذكر التعبير األصلي لنقاط التدريب ،فإننا نرى مصطلح الضوضاء .هذا
المصطلح هو أحد أسباب الخطأ .هذا ألن الضوضاء عشوائية وال يمكننا التنبؤ بها .يشار إلى هذا أحياًنا على أنه خطأ غير قابل
لالختزال .هناك مصادر أخرى لألخطاء أيًض ا .على سبيل المثال ،قد يكون افتراضنا متعدد الحدود خاطًئا .قد تكون نقاط العينة الخاصة
بنا قد جاءت من وظيفة مختلفة .على سبيل المثال ،في هذا المخطط ،يتم إنشاء البيانات من موجة جيبية .ال تقوم الدالة متعددة الحدود
بعمل جيد في تركيب الموجة الجيبية .بالنسبة للبيانات الحقيقية ،قد يكون من الصعب جًدا مالءمة النموذج أو قد ال يكون لدينا النوع
الصحيح من البيانات لتقدير الوظيفة .دعونا نجرب معادالت متعددة الحدود مختلفة الترتيب على البيانات الحقيقية باستخدام القدرة الحصانية.
تمثل النقاط الحمراء بيانات التدريب ،وتمثل النقاط الخضراء بيانات االختبار .إذا استخدمنا فقط متوسط البيانات ،فإن نموذجنا ال يعمل بشكل
جيد .تتناسب الوظيفة الخطية مع البيانات بشكل أفضل .يبدو نموذج الدرجة الثانية مشابًها للدالة الخطية .يبدو أيًض ا أن وظيفة الترتيب
الثالث تزداد ،مثل الطلبين السابقين .هنا نرى متعدد الحدود من الدرجة الرابعة .عند حوالي 200حصان ،ينخفض السعر المتوقع فجأة.
يمثل المحور األفقي R^2.لمعرفة ما إذا كان افتراضنا صحيًح ا .فيما يلي رسم بياني لقيمة R ^ 2يبدو هذا خاطًئا .دعنا نستخدم
هو األمثل عندما يكون R ^ 2من واحد ،كلما كان النموذج أكثر دقة .هنا نرى أن R^2ترتيب النماذج متعددة الحدود .كلما اقترب
بشكل كبير عند زيادة الترتيب إلى أربعة ،مما يؤكد افتراضنا األولي .يمكننا حساب قيم R ^ 2ترتيب متعدد الحدود هو ثالثة .ينخفض
مختلفة على النحو التالي .أوًال ،نقوم بإنشاء قائمة فارغة لتخزين القيم .نقوم بإنشاء قائمة تحتوي على أوامر متعددة الحدود R ^ 2
مختلفة .ثم نقوم بالتكرار من خالل القائمة باستخدام حلقة .نقوم بإنشاء كائن ميزة متعدد الحدود بترتيب متعدد الحدود كمعامل .نقوم
بتحويل بيانات التدريب واالختبار إلى متعدد الحدود باستخدام طريقة التحويل المناسب .نحن نالئم نموذج االنحدار باستخدام بيانات التحويل.
.باستخدام بيانات االختبار وتخزينها في المصفوفة R ^ 2نقوم بعد ذلك بحساب