You are on page 1of 1

‫إذا كنت تتذكر‪ ،‬في الوحدة األخيرة‪ ،‬ناقشنا االنحدار متعدد الحدود‪ .

‬في هذا القسم‪ ،‬سنناقش كيفية اختيار أفضل ترتيب متعدد الحدود‬
‫والمشكالت التي تنشأ عند اختيار متعدد الحدود بترتيب خاطئ‪ .‬خذ بعين االعتبار الوظيفة التالية‪ .‬نفترض أن نقاط التدريب تأتي من دالة‬
‫‪ y‬متعددة الحدود باإلضافة إلى بعض الضوضاء‪ .‬الهدف من اختيار النموذج هو تحديد ترتيب متعدد الحدود لتوفير أفضل تقدير للدالة‬
‫إذا حاولنا مالءمة الوظيفة بدالة خطية‪ ،‬فإن الخط ليس معقًدا بما يكفي ليناسب البيانات‪ .‬ونتيجة لذلك‪ ،‬هناك العديد من األخطاء‪(x). .‬‬
‫وهذا ما يسمى بالتركيب الناقص‪ ،‬حيث يكون النموذج بسيًطا جًدا بحيث ال يتناسب مع البيانات‪ .‬إذا قمنا بزيادة ترتيب متعدد الحدود‪ ،‬فإن‬
‫النموذج يناسب بشكل أفضل‪ .‬لكن النموذج ال يزال غير مرن بما فيه الكفاية ويظهر عدم مالءمته‪ .‬هذا مثال على متعدد الحدود من‬
‫الرتبة الثامنة المستخدم لمالءمة البيانات‪ .‬نرى أن النموذج يعمل جيًدا في مالءمة البيانات وتقدير الوظيفة حتى عند نقاط االنعطاف‪،‬‬
‫وزيادتها إلى متعدد الحدود من الدرجة السادسة عشرة‪ ،‬ويعمل النموذج جيًدا للغاية في تتبع نقطة التدريب‪ ،‬ولكنه يؤدي أداًء ضعيًفا في‬
‫تقدير الوظيفة‪ .‬هذا واضح بشكل خاص عندما يكون هناك القليل من بيانات التدريب‪ .‬تتأرجح الوظيفة المقدرة‪ ،‬وال تتعقب الوظيفة‪ .‬وهذا‬
‫ما يسمى بالتركيب الزائد‪ ،‬حيث يكون النموذج مرًنا جًدا ويناسب الضوضاء بدًال من الوظيفة‪ .‬لنلِق نظرة على مخطط متوسط الخطأ‬
‫التربيعي لمجموعة التدريب واالختبار المكونة من كثيرات الحدود ذات الترتيب المختلف‪ .‬يمثل المحور األفقي ترتيب متعدد الحدود‪ .‬المحور‬
‫الرأسي هو الخطأ المربع المتوسط‪ .‬يتناقص خطأ التدريب بترتيب متعدد الحدود‪ .‬يعد خطأ االختبار وسيلة أفضل لتقدير خطأ متعدد‬
‫الحدود‪ .‬ينخفض الخطأ حتى يتم تحديد أفضل ترتيب لكثرة الحدود‪ .‬ثم يبدأ الخطأ في الزيادة‪ .‬نختار الترتيب الذي يقلل من خطأ‬
‫االختبار‪ .‬في هذه الحالة‪ ،‬كانت ثمانية‪ .‬أي شيء على اليسار سيعتبر غير مناسب‪ .‬أي شيء على اليمين مناسب‪ .‬إذا اخترنا أفضل‬
‫ترتيب لكثرة الحدود‪ ،‬فستظل لدينا بعض األخطاء‪ .‬إذا كنت تتذكر التعبير األصلي لنقاط التدريب‪ ،‬فإننا نرى مصطلح الضوضاء‪ .‬هذا‬
‫المصطلح هو أحد أسباب الخطأ‪ .‬هذا ألن الضوضاء عشوائية وال يمكننا التنبؤ بها‪ .‬يشار إلى هذا أحياًنا على أنه خطأ غير قابل‬
‫لالختزال‪ .‬هناك مصادر أخرى لألخطاء أيًض ا‪ .‬على سبيل المثال‪ ،‬قد يكون افتراضنا متعدد الحدود خاطًئا‪ .‬قد تكون نقاط العينة الخاصة‬
‫بنا قد جاءت من وظيفة مختلفة‪ .‬على سبيل المثال‪ ،‬في هذا المخطط‪ ،‬يتم إنشاء البيانات من موجة جيبية ‪ .‬ال تقوم الدالة متعددة الحدود‬
‫بعمل جيد في تركيب الموجة الجيبية‪ .‬بالنسبة للبيانات الحقيقية‪ ،‬قد يكون من الصعب جًدا مالءمة النموذج أو قد ال يكون لدينا النوع‬
‫الصحيح من البيانات لتقدير الوظيفة‪ .‬دعونا نجرب معادالت متعددة الحدود مختلفة الترتيب على البيانات الحقيقية باستخدام القدرة الحصانية‪.‬‬
‫تمثل النقاط الحمراء بيانات التدريب‪ ،‬وتمثل النقاط الخضراء بيانات االختبار‪ .‬إذا استخدمنا فقط متوسط البيانات‪ ،‬فإن نموذجنا ال يعمل بشكل‬
‫جيد‪ .‬تتناسب الوظيفة الخطية مع البيانات بشكل أفضل‪ .‬يبدو نموذج الدرجة الثانية مشابًها للدالة الخطية‪ .‬يبدو أيًض ا أن وظيفة الترتيب‬
‫الثالث تزداد‪ ،‬مثل الطلبين السابقين‪ .‬هنا نرى متعدد الحدود من الدرجة الرابعة‪ .‬عند حوالي ‪ 200‬حصان ‪ ،‬ينخفض السعر المتوقع فجأة‪.‬‬
‫يمثل المحور األفقي ‪ R^2.‬لمعرفة ما إذا كان افتراضنا صحيًح ا‪ .‬فيما يلي رسم بياني لقيمة ‪ R ^ 2‬يبدو هذا خاطًئا‪ .‬دعنا نستخدم‬
‫هو األمثل عندما يكون ‪ R ^ 2‬من واحد‪ ،‬كلما كان النموذج أكثر دقة‪ .‬هنا نرى أن ‪ R^2‬ترتيب النماذج متعددة الحدود‪ .‬كلما اقترب‬
‫بشكل كبير عند زيادة الترتيب إلى أربعة‪ ،‬مما يؤكد افتراضنا األولي‪ .‬يمكننا حساب قيم ‪ R ^ 2‬ترتيب متعدد الحدود هو ثالثة‪ .‬ينخفض‬
‫مختلفة على النحو التالي‪ .‬أوًال ‪ ،‬نقوم بإنشاء قائمة فارغة لتخزين القيم‪ .‬نقوم بإنشاء قائمة تحتوي على أوامر متعددة الحدود ‪R ^ 2‬‬
‫مختلفة‪ .‬ثم نقوم بالتكرار من خالل القائمة باستخدام حلقة‪ .‬نقوم بإنشاء كائن ميزة متعدد الحدود بترتيب متعدد الحدود كمعامل‪ .‬نقوم‬
‫بتحويل بيانات التدريب واالختبار إلى متعدد الحدود باستخدام طريقة التحويل المناسب‪ .‬نحن نالئم نموذج االنحدار باستخدام بيانات التحويل‪.‬‬
‫‪.‬باستخدام بيانات االختبار وتخزينها في المصفوفة ‪ R ^ 2‬نقوم بعد ذلك بحساب‬

You might also like