Professional Documents
Culture Documents
استخراج الأسئلة من النصوص - دراسة مرجعية
استخراج الأسئلة من النصوص - دراسة مرجعية
والتقييم
ملخص
ً
تعتبر عملية وضع األسئلة يدويا عملية مكلفة من حيث الجهد واملال والوقت ،وبالتالي فإن وجود نظام ذكي يقوم باستخراج األسئلة من النصوص يقلل تلك
ً ً ً
التكاليف ويعزز العملية التعليمية .وبالرغم من أن البحث في تطوير هذه األنظمة الذكية ليس جديدا ,إال أنه ال يزال مجاال نشطا .وفي هذا التقرير سنقوم
بعمل نظرة سريع على الدراسات املهمة في هذا املجال وسنقوم بشرح املخطط العام لعمل األنظمة الحالية باإلضافة إلى شرح طرق تقييم هذه األنظمة وبيان
صعوبات تطويرها بشكل عام.
جدول المحتويات
ملخص 1....................................................................................................................................................................................................................................................
مقدمة 1.....................................................................................................................................................................................................................................................
تعريفات 2............................................................................................................................................................................................................................................
استخراج األسئلة من النصوص 3............................................................................................................................................................................................................
املنهجية العامة لتطوير أنظمة استخراج األسئلة من النصوص 3...................................................................................................................................................
استخراج األسئلة متعددة الخيارات باستخدام األنطولوجيات 6......................................................................................................................... Ontologies
استخراج األسئلة باستخدام نماذج إحصائية 6...........................................................................................................................................................Neural QG
مجموعات البيانات 7......................................................................................................................................................................................................... Datasets
معايير التقييم 8..................................................................................................................................................................................................................................
التحديات 9..........................................................................................................................................................................................................................................
دراسة مرجعية 9....................................................................................................................................................................................................... Literature review
ً
استخراج األسئلة آليا في اللغة العربية 11 .........................................................................................................................................................................................
مناقشة 11 ................................................................................................................................................................................................................................................
خالصة 12 .................................................................................................................................................................................................................................................
املراجع 12 ..................................................................................................................................................................................................................................................
ملحق 14 ....................................................................................................................................................................................................................................................
مقدمة
ملحة لوجود كميات كبيرة من األسئلة املعدةمع ظهور تقنيات التعلم اإللكتروني ( )e-learning systemsوكورسات التعلم عن بعد ( )MOOCsأصبحت الحاجة ّ
لطرحها على آالف الطالب الذين يحضرون الدرس الواحد .وتعتبر عملية وضع األسئلة متنوعة الصعوبة والتي تختبر فهم الطالب للمادة العلمية عملية مكلفة
من حيث الوقت والجهد واملال ) .(Soni, Kumar, & Saha, 2019ومن أكبر فوائد وجود أنظمة ذكية تقوم باستخراج األسئلة من النصوص(Thalheimer, :
) .1 2003اختبار قدرة الطالب على استرجاع املعلومات التي تم تدرسيها في الصف .2إتاحة املعلومات الصحيحة للطالب فيما يتعلق باملفاهيم واألمور التي قد
1
يشكل على الطالب فهمها .3مساعدة الطالب على التركيز على املفاهيم املهمة .4مساعدة الطالب على فهم املوضوع من خالل طرح أسئلة متنوعة عن نفس
املوضوع .وتعتبر األسئلة من نوع (ملاذا ,أين ,ما ,متى ,من) مفيدة للطالب الستخراج املعلومات من النص (Ch & Saha, 2018) .ومع ذلك فإن توليد هذه األسئلة
ً
يتطلب مستو ًى عاليا من اإلدراك والتركيز ) .(Pan, Lei, Chua, & Kan, 2019وبحسب ) (Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019فإن أنظمة استخراج
األسئلة من النصوص ستساعد املدرس على توجيه طاقته واستثمار وقته في أنشطة أكثر أهمية من ّ
مجرد وضع األسئلة (مثل إغناء وتطوير املادة التعليمية),
ً
باإلضافة إلى إغناء العملية التعليمية وتوفير بنوك من األسئلة الختبار فهم الطالب للمادة العلمية .أيضا يمكن لهذه األنظمة أن تساعد في تطوير أنظمة ذكية
أخرى مثل أنظمة املحادثة اآللية (مثل )Chat botبهدف الحصول على معلومات دقيقة من الزبائن ) .(Pan, Lei, Chua, & Kan, 2019وفي هذا التقرير سنقوم
ً
بعمل نظرة عامة على املنهجيات الحالية املستخدمة في تطوير أنظمة استخراج األسئلة آليا ,وقد تم تقسيم بقية التقرير إلى الفقرات التالية :في البداية نقوم
ً ً
بتعريف املسألة وتعريف بعض املفاهيم املتعلقة بها ,ثم ننتقل للشرح عن املنهجية العامة لتطوير أنظمة استخراج األسئلة آليا ,ونتحدث أيضا عن طرق
تقييمها والصعوبات التي تواجهها.
تعريفات
ً
استخراج األسئلة آليا هي عملية وضع أسئلة ملختلف أنواع املدخالت النصية املهيكلة (تمثيالت داللية ,Semantic representationsأنطولوجيات
)Ontologiesأو غير املهيكلة (النصوص العادية) ) . (Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019) (Pan, Lei, Chua, & Kan, 2019ويعتبر البحث في هذه
ً ً
املسألة بحثا نشيطا ) .(Ch & Saha, 2018يتم تقسيم املسألة إلى مرحلتين :مرحلة تتعلق ب (ما هو محور السؤال) ومرحلة تتعلق ب (كيفية طرح السؤال) ,وفي
املرحلة األولى تنشط تقنيات فهم النصوص ,أما في املرحلة الثانية فتنشط تقنيات معالجة النصوص ) (Pan, Lei, Chua, & Kan, 2019وولكل مرحلة تحديات
ً
خاصة بها إال أن فهم النصوص يتطلب مستوى أعلى من املعالجة وتواجهه تحديات أكبر من تلك املتعلقة بمعالجة النصوص آليا .ومن الضروري التفريق بين
ً ً
مفهومين هما :نظام استخراج األسئلة آليا ( )Question Extractionونظام اإلجابة آليا ( .)Question Answeringفاألولى تهتم باستخراج السؤال من النص,
ً ً
بينما تهتم الثانية تهتم بإيجاد النص الذي يعد جوابا على السؤال .وتعتبر مسألة استخراج األسئلة رديفة ملسألة اإلجابة آليا على األسئلة ,فكالهما يتطلب
ً ً
مستوى عميقا من فهم النص املدخل ) . (Pan, Lei, Chua, & Kan, 2019عادة يكون نوع السؤال الذي يستخرجه النظام آليا من أحد األنواع التالية .1 -:أسئلة
ً تعتمد على الذاكرة ّ
(عرف ,صف ,أذكر مثاال .2 )..أسئلة (ما ,أين ,ملاذا ,متى ,من) .3أسئلة ملئ الفراغ واألسئلة متعددة الخيارات (Soni, Kumar, & Saha,
).2019
ً ً
يعتبر هرم بلوم مرجعا لتصنيف األهداف التعليمية وكذلك أنواع األسئلة ,وهو مقسم إلى 6مستويات تتدرج من األبسط إلى األكثر تعقيدا & (Soni, Kumar,
) Saha, 2019كما يلي:
ّ ّ
.1التذكر :عرف ,عدد..
ّ
.2الفهم :اشرح ,لخص ,قارن ,صنف.
.3التطبيق :استخدم ,نفذ ,أنجز ,استعرض.
ّ
.4التحليل :استكشف ,اختبر ,حلل.
.5التقييم :ماذا تتوقع/برأيك ,كيف تحكم/ترى.
طور ,اخترع ,أنش ئ ,ادمج.. صممّ ,
.6التأليف واالستنتاجّ :
2
شكل.1هرمية بلومBlooms taxonomy1
وبالتالي يمكن وصف نظام استخراج األسئلة باستخدام هرمية بلوم بحسب نوع ومستوى األسئلة التي يقوم النظام بطرحها .ويهدف البحث في هذا املجال إلى
ً
الحصول على نظام استخراج أسئلة يحاكي الذكاء البشري (يستهدف مستويات عليا من هرمية بلوم) ) .(Desai, Dakle, & Moldovan, 2018حاليا يتم توليد
ً ً
أسئلة عميقة باستخدام القوالب Templatesاملطورة يدويا ) (Pan, Lei, Chua, & Kan, 2019وسيأتي الحديث عنها الحقا.
فيما يلي أشهر املراحل التي يتكون منها نظام استخراج األسئلة التقليدي (شكل:)2
ُ َ
معالجة أولية للنص املدخل (:)Preprocessing .1
.aالتقطيع ( ,)Tokenizationالتجزئة ( ,)Segmentationفحص األخطاء اإلمالئية ( ,)Error checkingوسم الكلمات ( Part-Of-speech
,)taggingرد الضمائر إلى مسمياتها ( ,)Co-Reference Resolutionتمييز الكيانات االسمية ( ,)Named-Entity Recognitionاستخراج
العالقات ( ,)Relation Extractionإلخ..
.bاختيار الجملة ( :)Sentence Selectionفي هذه املرحلة يتم تحديد املعلومة التي سيتمحور حولها السؤال ,إذ ليست كل جملة في النص
يمكن وضع سؤال يخصها ) (Ch & Saha, 2018ويتم ذلك من خالل:
ً
.iاستخدام القوالب :Templatesفإذا تطابقت جملة من النص مع قالب مبني مسبقا فيتم اختيارها
.iiاستخدام خوارزميات تعلم اآللة (مثل )SVM, NN, Bayes
.iiiاستخدام تقنيات تلخيص النصوص ( :)Text summarizationوفيه يقوم نظام تلخيص النصوص بمهمة الغاء النصوص
يقدمها نظام تلخيص النصوصبناء على العبا ات التي ّ
الغير مهمة واإلبقاء على العبارات املهمة وبالتالي يمكن وضع األسئلة ً
ر
)(Pan, Lei, Chua, & Kan, 2019
.cتبسيط الجملة ( :)Sentence Simplificationفي هذه املرحلة يتم تحويل الجملة الطويلة أو املعقدة التي قد تحتوي على إشارات تدل
الطالب على أجابة السؤال الصحيحة إلى مجموعة من الجمل الببسيطة ) .(Ch & Saha, 2018وتستخدم لذلك تقنيات مثل:
.iتحليل العالقات باستخدام األشجار النحوية ()Parse-Trees dependencies
.iiقواعد يضعها الخبراء لتبسيط الجمل ()sentence simplification rules
1 https://technologyforlearners.com/wp-content/uploads/2019/07/Blooms.jpeg
3
.dتصنيف الجملة :يتم تصنيف الجملة إلى صنف Classمعين تترتب عليه نوعية السؤال الذي سيتم طرحه
.eاختيار املفتاح ( :)Key Selectionهنا يتم اختيار كلمة من الجملة التي تم اختيارها .هذه الكلمة املفتاحية سيتمحور حولها السؤال,
بناء عليها .ويتم ذلك باستخدام تقنيات مثلفليست كل الكلمات في الجملة قابلة لطرح األسئلة ً
ّ
.iتعلم اآللة .Machine learning
.iiمعلومات داللية Semantic Information
.iiiبعض األبحاث اعتبرت مسألة اختيار الكلمة املفتاحية مسألة بحثية مستقلة بحد ذاتها ).(Pan, Lei, Chua, & Kan, 2019
تكوين السؤال :2وفيه .2
.aاختيار اإلجابة الصحيحة
.bاختيار اإلجابات الخاطئة (.)Distractors
3
شكل . .2املخطط العام ألنظمة استخراج األسئلة من النصوص )(Ch & Saha, 2018
2البعض يتجاوز هذه الخطوة ويستبدل املفاتيح بفراغات مباشرة)(Ch & Saha, 2018
3حالة األسئلة متعددة الخيارات.
4
شكل .3تبسيط الجملة ,حذف اإلشارات التي قد تدل على الجواب.
توجد ثالث منهجيات رئيسية لتحويل العبارة إلى سؤال ).(Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019
.1املنهجية املعتمدة على القواعد:
ً
.aإذا كان املفتاح تاريخا ( )Key = Dateبالتالي فإن السؤال هو متى (.(Ch & Saha, 2018) )When
.bمن خالل معالجة شجرة القواعد (شكل (Soni, Kumar, & Saha, 2019) .)4
.cمن خالل معالجة داللية (شكل .)5
ً
.dمن خالل دمج املنهجية النحوية مع قوالب معدة مسبقا (Soni, Kumar, & Saha, 2019) Templates
.2املنهجية املعتمدة على القوالب :Template Approach
.aاستخدام قوالب تتألف من نصوص ثابتة وبعض الفراغات التي يتم ملؤها من كلمات النص املدخل
ً
.bتسمح هذه املنهجية بتوليد أسئلة أكثر عمقا من املنهجية القواعدية السابقة
.cعدد األسئلة محدود بسبب محدودية عدد القوالب
.dال يوجد تنوع في األسئلة التي ينتجها النظام املعتمد على القوالب
ً ً
.eإلى اآلن ال تزال الكثير من األنظمة واألبحاث تعتمد على هذه املنهجية خاصة فيما يتعلق باستخراج أسئلة تستهدف مجاال محددا (طبي,
سياس ي(Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019) ).. ,
.3املنهجية املعتمدة على النماذج اإلحصائية:)Neural Question Extraction( 4
.aيتم تحويل النص املدخل إلى سؤال باالعتماد على داتا تدريب كبيرة.
.bتختلف هذه املنهجية عن املنهجيات السابقة بأنها ال تتطلب معالجة يدوية لوضع القواعد أو القوالب.
ً ً
.cتختلف هذه املنهجية أيضا عن املنهجيات السابقة بأنها تقوم بنمذجة النص املدخل (تفهمه) رياضيا.
.dتكمن صعوبة هذه املنهجية بأنها تحتاج كميات كبيرة من أزواج األسئلة واإلجابات ليتم تدريب النموذج اإلحصائي
شكل .4استخراج األسئلة باستخدام أشجار النحو)(Ren, Kiros, & Zemel, 2015
تستخدم املنهجيات التقليدية مفسرات Parsersداللية ونحوية للحصول على تمثيل وسيط للنص املدخل ()intermediate symbolic representations
ومن ّثم تقوم بتحويل هذا التمثيل الوسيط إلى سؤال من خالل استخدام قواعد معينة (مثل إعادة هيكلة الشجرة النحوية أو استخدام قوالب األسئلة).
5
شكل.5استخراج أسئلة صعبة وعميقة يتطلب املزيد من املعالجة(Heilman, 2011).
تستخدم منهجيات استخراج األسئلة من خالل القواعد النحوية بكثرة عندما يتعلق األمر باألسئلة متعددة الخيارات ) .(Ch & Saha, 2018ويعتبر توليد
الخيارات الخاطئة ( )Distractor Generationمن أصعب التحديات التي تواجه أنظمة استخراج األسئلة متعددة الخيارات ,وتركز بعض الدراسات فقط على
مواضيع خاصة في هذا النوع من األسئلة مثل استخراج الخيارات الخاطئة أو استخراج نص السؤال فقط )(Kurdi, Leo, Parsia, Sattler, (Ch & Saha, 2018
) .& Al-Emari, 2019تستخدم األنطولوجيات بغرض استخراج الخيارات الخاطئة في األنظمة الخاصة باملجال (مجال طبي ،سياس ي ،الخ )..ففي (Leo, et al.,
) 2019تم استخدام أنطولوجي طبية لتوليد أسئلة متعددة الخيارات لالمتحانات الطبية .فعلى سبيل املثال يمكن استخدام أنطولوجي WordNetمع مقياس
تشابه بين املفاهيم بهدف اختيار مفاهيم قريبة من املفهوم الذي يدور حوله السؤال واستخدام هذه املفاهيم في تأليف الخيارات الخاطئة للسؤال.
6
ّ
ويتم دمج هذين القسمين في عنصر واحد في أنظمة التعلم العميق (Pan, Lei, Chua, & Kan, 2019) DeepLearningفتم الحصول على أنظمة استخراج
ً أسئلة ّ
تفوقت كثيرا على األنظمة التي كانت حاضرة بفوارق كبيرة ).(Chen, Wu, & Zaki, 2019
بالنسبة للتوصيف الرياض ي للمسألة بشكل عام فإن الجملة املدخلة هي عبارة عن سلسلة كلمات ) X = (x1, · · ·, xnباإلضافة إلى هدف ( Aجواب ُيطلب أن
ً
يوضع سؤال خاص به في نظام ,)Answer Aware 6ويطلب من النظام استخراج سلسلة كلمات ) Y = (y1, · · ·, ymتعتبر سؤاال للهدف ,Aأي :إيجاد أفضل
ً ً
سلسلة Yبحيث نحصل على أعلى قيمة احتمالية (بحسب النموذج االحتمالي املعتمد )Pعلما أن Xو Aموجودة مسبقا.
تتخلف نماذج استخراج األسئلة من خالل ):(Pan, Lei, Chua, & Kan, 2019
ً ً
.1معامالت factorsخاصة مثل( طريقة ترميز الجواب ,طريقة اختيار السؤال ,إمكانية معالجة السياق في حال كان الدخل نصا كبيرا ( Paragraph
.)level7
ّ
.2آلية صناعة السؤال (آلية ناسخة ,Copying mechanism8سمات لغوية ,التعلم املعزز )Reinforcement learning
يمكن استخدام أي مجموعة بيانات Datasetخاصة بأنظمة اإلجابة اآللية Question Answeringلتدريب وتطوير أنظمة استخراج األسئلة Question
ً
.(Pan, Lei, Chua, & Kan, 2019) Extractionوقد تم حديثا تطوير مجموعات بيانات خاصة بمسألة استخراج األسئلة .وفيما يلي نشير إلى أهم مجموعات
البيانات الخاصة بأنظمة استخراج األسئلة التي تم تطويرها في السنوات الثالث السابقة:
7بعض األعمال السابقة حاولت حل هذه املسألة من خالل بناء نماذج داللية عميقة لتمثيل كامل النص)(Pan, Lei, Chua, & Kan, 2019
8بعض أجزاء الخرج تتشابه مع بعض أجاء الدخل كما في مسألة التلخيص اآللي للنصوص .ومن هذه اآللية الناسخة يمكن أن تتواجد إشارات تدل الشخص الذي نقوم بطرح
السؤال عليه على الجواب الصحيح .وبالتالي على النظام أن يتعلم عدم اقحام مثل هذه الكلمات في جسم السؤال املستخرج.
9مجموعة البيانات والسورس كود على الرابط التالي https://github.com/AngusGLChen/LearningQ
7
ُ
وط َ
لب من املشاركين تطوير أنظمة تستخرج األسئلة من الجمل املفردة ( individual
)sentencesوأنظمة تستخرج األسئلة من فقرات كاملة (.)Paragraphs
تتألف مجموعة البيانات هذه من 7.1Kسؤال متعدد الخيارات تم جمعها من االنترنت )MCQL (Pho, et al., 2014 4
ً
ولكل سؤال حوالي 3خيارات وسطيا .تتنوع مجاالت األسئلة بين الفيزياء والكيمياء وعلم
األحياء وهي موجهة باألساس لطالب كامبريدج Cambridgeفي املستوى .O-level
تعتبر من أشهر مجموعات البيانات وقد تم تجميعها من مقاالت ويكيبيديا Wikipedia Stanford Question Answering Dataset 5
وفيها حوالي 150Kسؤال ,أكثر من ثلثي األسئلة وضعت على مستوى الفقرات & (SQuAD) (Rajpurkar, Zhang, Lopyrev,
الجمل ,Sentencesو نصف هذه األسئلة ال توجد أجوبتها في املقال Paragraphsوليس ُ )Liang, 2016
األصلية %20 .من األسئلة تحتاج إلى تحليل على مستوى الفقرات(Pan, Lei, Chua, & ,
) Kan, 2019وتستخدم معظم املجموعات البحثية مجموعة البيانات هذه كمجموعة
معيارية لقياس أداء نظام استخراج األسئلة املطور )(Pan, Lei, Chua, & Kan, 2019
ً
مجموعة بيانات شبيهة بمجموعة SQuADلكن األسئلة فيها أقل عمقا. )MS MARCO (Nguyen, et al., 2016 6
تحتوي على 30مليون سؤال باللغة اإلنكليزية مع جواب كل سؤال. 30M factoid question-answer corpus 7
)(Serban, et al., 2016
تحتوي على 13.7Kسؤال في علم األحياء والكيمياء واألرض والفيزياء ّ
تتدرج في صعوبتها من )SciQ15 (Welbl, Liu, & Gardner, 2017 8
املستوى املبتدئ إلى الخبير .وهي مجموعة بيانات مدفوعة ثمنها .$10.415
تتألف من 120kزوج سؤال-جواب تخص مقاالت مجلة .CNNاألسئلة من نوع ( WHملاذا, )NewsQA (Trischler, et al., 2016 9
متى ,أين ,كيف ,من).
ً
جدول . 1أشهر مجموعات البيانات املستخدمة في تطوير أنظمة استخراج األسئلة آليا.
معايير التقييم
10
ً ً
يعتبر التقييم اليدوي من أكثر معايير التقييم شيوعا ,وفيه يتم اختيار عينات عشوائية من األسئلة التي قام نظام استخراج األسئلة آليا بتأليفها ومنح هذه
األسئلة إلى خبير ُيطلب منه تقييم كل سؤال ومنحه عالمة على مقياس من (Pan, Lei, Chua, & Kan, 2019) 5-1تحتاج هذه الطريقة إلى تخصيص وقت طويل
ومال كثير .ولذلك يلجأ الباحثون إلى معايير تقييم آلية تشبه املعايير املوضوعة في مسائل تلخيص النصوص ( Text Summarizationمعيار روج )ROUGE
ً ً
وترجمة النصوص ( Text Translationمعيار بلو )BLEUوهي معايير تقوم بمقارنة نصوص بشرية موجودة مسبقا (األسئلة املوجودة مسبقا) بنصوص تم
استخراجها عن طريق نظام آلي (نظام الترجمة اآللية أو نظام التلخيص اآللي) .وبعض الدراسات تستخدم نماذج تقييم خاصة بها تقيس صحة القواعد وطالقة
ً
العبارة ومدى صلة السؤال بالنص األصلي وكون السؤال غير قابال للتمييز بأنه تم توليده عن طريق اآللة أو البشر ,وكذلك يتم قياس التداخل بين كلمات
السؤال املستخرج عن طريق اآللة والسؤال الذي يضعه الخبير .ويمكننا بحسب ) (Heilman, 2011تعريف عالقة قياس مقبولية السؤال xاملستخرج
ّ
حيث Fتابع يأخذ السؤال xويعيد شعاع عددي يمثل امليزات featuresاملوجودة في السؤال ,و wهو شعاع أوزان لتثقيل كل قيمة من قيم املميزات (فليست كل
ً
املميزات featuresلها نفس االعتبار) .وبحسب ) (Ch & Saha, 2018فإنه ال توجد طريقة تقييم معيارية ملسألة استخراج األسئلة آليا .ولذك يجب العمل على
تطوير معايير تقييم وتحسينها ).(Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019
10توجد دراسة من نوع Surveyملعايير التقييم املستخدمة بين عامي 2013و 2018في )(Amidei, Piwek, & Willis, 2018
8
التحديات
ً
آليا على ّ
عدة تحديات تخص معالجة اللغة الطبيعية ( NLPمثل أخطاء املفسرات )Parsersوتحديات تخص تنطوي مسألة استخراج األسئلة من النصوص
ي
فهم اللغة الطبيعية .NLUوباإلضافة إلى ذلك فإن مسألة استخراج األسئلة من النصوص تنضو على تحديات تخص توليد اللغة الطبيعية (Pan, Lei, NLG
).Chua, & Kan, 2019
وفيما يخص مسألة استخراج األسئلة بحد ذاتها فإن أشهر التحديات هي )1 :وضع الخيارات الخاطئة في أسئلة االختيار من متعدد )2 distractor generation
ّ
عدم وجود تقنيات تقييم معيارية )3عدم وجود مجموعة بيانات معيارية (بالنسبة لنماذج تعلم اآللة) )4فهم السياق )5 discourseومن الصعوبات الخاصة
ً
هي عندما تكون اإلجابة معطاة من ضمن الدخل inputفمن املحتمل حصول عدم تطابق بين السؤال املستخرج والجواب املطلوب وضع سؤال عليه (مثال
عندما ُيطلب وضع سؤال عن فترة زمنية whenفيقوم النظام بوضع سؤال عن مكان )6 .(Pan, Lei, Chua, & Kan, 2019) )whereعدم القدرة على التحكم
بصعوبة السؤال لكون السؤال املستخرج قد ال يرقى ملستوى الصعوبة املطلوبة ) .(Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019ومن األبحاث التي درست
التحكم بالصعوبة هي ).(Gao, Bing, Chen, Lyu, & King, 2018
مالحظة :مسألة استخراج االمتحان Exam Generationتعتبر مسألة مختلفة يجب أن تأخذ بعين االعتبار عدة أمور إضافية مثل )1 :وضع أسئلة بحيث تقوم
بتغطية املادة التعليمية (النص) بشكل كامل )2أال يتداخل السؤال مع غيره من األسئلة )3أن ال يحتوي السؤال على إجابة سؤال آخر .وبشكل عام يحتاج
العمل على توليد االختبارات الى تحليل أكثر لالختبارات الحقيقية وتوصيفها بشكل جيد ).(Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019
9
A novel multiple choice
question generation strategy:
alternative uses for controlled
vocabulary thesauri in
biomedical-sciences education
الرماز متاح (الكود Text النصوص التعلم العميق نموذج مشترك لطرح األسئلة (Wang, Yuan, & 4
)مفتوح املصدر Deep learning واإلجابة على األسئلة Trischler, 2017)
A joint model for question
answering and question
generation
ً
Multiple choice DBpedia Rule- قواعد توليد أسئلة االختبار آليا (Bongir, Attar, & 5
based Automated quiz generator Janardhanan, 2017)
Ontology أنطولوجي Template قوالب استخراج األسئلة متعددة (Leo, et al., 2019) 6
ً
الخيارات آليا باستخدام أنطولوجي
طبية
Ontology-based generation of
medical, multi-term MCQs
ً
State-of-the-art Text النصوص Deep تعلم عميق استخراج األسئلة آليا على مستوى (Zhao, Ni, Ding, & 7
learning الفقرة باستخدام شبكة عصبية Ke, 2018)
gated وmax out pointer بتقنية
.self-attention network
Paragraph-level neural
question generation with max
out pointer and gated self-
attention networks
ً
. أشهر األبحاث املتعلقة باستخراج األسئلة آليا.2جدول
10
)Figure 1. Active research groups in AQG. Screenshot from (Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019
مناقشة
ُ
معظم األبحاث اهتمت باستخراج كل األسئلة املمكنة من النص وتترك مهمة اختيار األسئلة املناسبة للخبير الذي هو بصدد وضع أسئلة االمتحان (Kurdi,
) .Leo, Parsia, Sattler, & Al-Emari, 2019ويعتبر استخراج األسئلة من أجل مجال محدد هو التوجه الشائع للباحثين (Kurdi, Leo, Parsia, Sattler, & Al-
11هذا البحث موجود على غوغل سكولر google scholarوال توجد أي إشارة مرجعية تشير عليه وباإلضافة لذلك لم يشر هذا البحث في قائمة املراجع املستخدمة فيه إلى أي
ً
بحث سابق عن استخراج األسئلة آليا في اللغة العربية.
11
وال بد من اإلشارة إلى أن استخراج. ويوجد توجه ال بأس به نحو تطوير أنظمة يمكن من خاللها التحكم بصعوبة السؤال الذي يتم استخراجه.Emari, 2019)
) وفرة أدوات2 ) وفرة الداتا بشكل عام عن اللغة1 :) لسببين.. , علوم, برمجة, تاريخ,األسئلة بشكل عام أسهل من استخراج األسئلة ملجال محدد (كيمياء
وبالنسبة ملسألة استخراج األسئلة متعددة الخيارات فإن معظم الصعوبة تكمن في استخراج. لفهم النص بشكل سطحيNLP معالجة اللغة الطبيعية
.(Kurdi, Leo, Parsia, Sattler, & Al-Emari, 2019) Distractor Generation )الخيارات الخاطئة (املشتتة
ً
خالصة
ويمكن من إغناء, ويعتبر استخراج األسئلة من النصوص بشكل آلي مهما ألنه يوفر الوقت والجهد واملال,يعتبر وضع أسئلة االختبار عملية مجهدة ومكلفة
ً ً
وفي هذا العمل قمنا. وقد بدأ العمل على تطوير أنظمة استخراج األسئلة آليا منذ التسعينات وال يزال العمل في هذا املجال نشيطا إلى اآلن.العملية التعليمية
باإلضافة إلى الحديث عن معايير التقييم, وقمنا بشرح آلية عمل األنظمة الحالية بشكل عام,بإجراء دراسة مرجعية حول أشهر األبحاث املتعلقة بهذا املجال
.والتحديات املتعلقة بهذا البحث
المراجع
A. Bongir ،V. Attar و،R Janardhanan .)2017( .Automated quiz generator .)188-174 (الصفحات.Springer, Cham.
A. Trischler ،T. Wang ،X. Yuan ،J. Harris ،A. Sordoni ،P. Bachman و،K Suleman .)2016( .Newsqa: A machine comprehension dataset .arXiv
preprint arXiv:1611.09830.
Abeer Saad ،Elsaeed Abdelrazek و،MohamedElbasyouni .)2014( .BUILDING A SYSTEM BASED ON NATURAL LANGUAGES PROCESSING
TO AUTOMATIC QUESTION GENERATION FROM ARABIC TEXTS .International Journal of Current Research.
B. Liu ،M. Zhao ،D. Niu ،K. Lai ،Y. He ،H. Wei و،Y Xu .)2019( .Learning to Generate Questions by LearningWhat not to Generate .The World
Wide Web Conference.)1118-1106 (الصفحات،
B. N. Patro و،V. P Namboodiri .)2019( .Deep Exemplar Networks for VQA and VQG .arXiv preprint arXiv:1912.09551.
B. Patro ،V. Kurmi ،S. Kumar و،V Namboodiri .)2020( .Deep Bayesian Network for Visual Question Generation .The IEEE Winter
Conference on Applications of Computer Vision.)1576-1566 (الصفحات،
B. S. Bloom ،D. R. Krathwohl و،B. B Masia .)1984( .Bloom taxonomy of educational objectives .Allyn and Bacon. Pearson Education.
D. R. Ch و،S. K Saha .)2018( .Automatic multiple choice question generation from text: A survey .IEEE Transactions on Learning
Technologies.
G. Chen ،J. Yang ،C. Hauff و،G. J Houben .)2018( .LearningQ: a large-scale dataset for educational question generation .In Twelfth
International AAAI Conference on Web and Social Media .
G. Kurdi ،J. Leo ،B. Parsia ،U. Sattler و،S Al-Emari .)2019( .A Systematic Review of Automatic Question Generation for Educational
Purposes .International Journal of Artificial Intelligence in Education.84-1 ،
G. Lai ،Q. Xie ،H. Liu ،Y. Yang و،E Hovy .)2017( .Race: Large-scale reading comprehension dataset from examinations .arXiv preprint.
H. De Vries ،F. Strub ،S. Chandar ،O. Pietquin ،H. Larochelle و،A. Courville .)2017( .Guesswhat?! visual object discovery through multi-
modal dialogue .the IEEE Conference on Computer Vision and Pattern Recognition.)5512-5503 (الصفحات،
I. V. Serban ،A. García-Durán ،C. Gulcehre ،S. Ahn ،S. Chandar ،A. Courville و،Y Bengio .)2016( .Generating factoid questions with
recurrent neural networks: The 30m factoid question-answer corpus .arXiv preprint arXiv:1603.06807.
J. Amidei ،P. Piwek و،A Willis .)2018( .Evaluation methodologies in automatic question generation 2013-2018.
J. Leo ،G. Kurdi ،N. Matentzoglu ،B. Parsia ،U. Sattler ،S. Forge و،W Dowling .)2019( .Ontology-based generation of medical, multi-term
MCQs .International Journal of Artificial Intelligence in Education.188-145 ،
J. Welbl ،N. F. Liu و،M Gardner .)2017( .Crowdsourcing multiple choice science questions .arXiv preprint arXiv:1707.06209 .
J. Zhang ،Q. Wu ،C. Shen ،J. Zhang ،J. Lu و،A. V. D Hengel .)2017( .Asking the difficult questions: Goal-oriented visual question generation
via intermediate rewards .arXiv preprint arXiv:1711.07614.
12
K. Uehara ،A. Tejero-De-Pablos ،Y. Ushiku و،T Harada .)2018( .Visual question generation for class acquisition of unknown objects .the
European Conference on Computer Vision (ECCV).)496-481 (الصفحات،
L. Pan ،W. Lei ،T. S. Chua و،M. Y Kan .)2019( .Recent Advances in Neural Question Generation .arXiv:1905.08949.
M Heilman .)2011( .Automatic factual question generation from text .Language Technologies Institute School of Computer Science
Carnegie Mellon University.
M Ren ،R Kiros و،R. S. Zemel .)2015( .Exploring Models and Data for Image Question Answering .arXiv:1505.02074v4.
M. A. Lopetegui ،B. A. Lara ،P. Y. Yen ،Ü. V. Çatalyürek و،P. R Payne .)2015( .A novel multiple choice question generation strategy:
alternative uses for controlled vocabulary thesauri in biomedical-sciences education .AMIA Annual Symposium .)861 (صفحة
American Medical Informatics Association.
N. Mostafazadeh ،I. Misra ،J. Devlin ،M. Mitchell ،X. He و،L Vanderwende .)2016( .Generating natural questions about an image .arXiv
preprint.
N. Mostafazadeh ،N. Chambers ،X. He ،D. Parikh ،D. Batra ،L. Vanderwende و،J Allen .)2016( .A corpus and evaluation framework for
deeper understanding of commonsense stories .arXiv preprint arXiv:1604.01696.
P. Rajpurkar ،J. Zhang ،K. Lopyrev و،P Liang .)2016( .Squad: 100,000+ questions for machine comprehension of text .arXiv preprint
arXiv:1606.05250.
R. Krishna ،M. Bernstein و،L Fei-Fei .)2019( .Information maximizing visual question generation .the IEEE Conference on Computer Vision
and Pattern Recognition.)2018-2008 (الصفحات،
S. Soni ،P. Kumar و،A Saha .)2019( .Automatic Question Generation: A Systematic Review .SSRN.
S. Zhang ،L. Qu ،S. You ،Z. Yang و،J Zhang .)2016( .Automatic generation of grounded visual questions .arXiv preprint.
T. Alsubait ،B. Parsia و،U Sattler .)2016( .Ontology-based multiple choice question generation .KI - Künstliche Intelligenz - Springer-183 ،
.188
T. Baghaee .)2017( .Automatic Neural Question Generation using Community-based Question Answering Systems .University of
Lethbridge.
T. Desai ،P. Dakle و،D Moldovan .)2018( .Generating Questions for Reading Comprehension using Coherence Relations .the 5th
Workshop on Natural Language Processing Techniques for Educational Applications.)10-1 (الصفحات،
T. Nguyen ،M. Rosenberg ،X. Song ،J. Gao ،S. Tiwary ،R. Majumder و،L Deng .)2016( .MS MARCO: a human-generated machine reading
comprehension dataset.
T. Wang ،X. Yuan و،A Trischler .)2017( .A joint model for question answering and question generation .arXiv preprint arXiv:1706.01450.
V Rus ،B Wyse ،P Piwek ،M Lintean ،S Stoyanchev و،C Moldovan .)2010( .The first question generation shared task evaluation challenge.
V. M. Pho ،T. André ،A. L. Ligozat ،B. Grau ،G. Illouz و،T François .)2014( .Multiple choice question corpus analysis for distractor
characterization.
W Thalheimer .)2003( .The learning benefits of questions .Tech. rep., Work Learning Research.
W. Wang ،T. Hao و،W Liu .)2007( .Automatic question generation for learning evaluation in medicine .International conference on web-
based learning .)251-242 (الصفحاتBerlin, Heidelberg: Springer.
Y. Chen ،L. Wu و،M. J Zaki .)2019( .Reinforcement learning based graph-to-sequence model for natural question generation .arXiv preprint.
Y. Gao ،L. Bing ،W. Chen ،M. R. Lyu و،I King .)2018( .Difficulty controllable generation of reading comprehension questions .arXiv preprint.
Y. Li ،N. Duan ،B. Zhou ،X. Chu ،W. Ouyang ،X. Wang و،M Zhou .)2018( .Visual question generation as dual task of visual question
answering .the IEEE Conference on Computer Vision and Pattern Recognition.)6124-6116 (الصفحات،
Y. Zhao ،X. Ni ،Y. Ding و،Q Ke .)2018( .Paragraph-level neural question generation with maxout pointer and gated self-attention
networks .the 2018 Conference on Empirical Methods in Natural Language Processing.)3910-3901 (الصفحات،
Z. Fan ،Z. Wei ،S. Wang ،Y. Liu و،X. J Huang .)2018( .A reinforcement learning framework for natural question generation using bi-
discriminators .the 27th International Conference on Computational Linguistics.)1774-1763 (الصفحات،
13
ملحق
ً
التحدي املشترك Shared Taskلتطوير أنظمة استخراج األسئلة آليا ) .(Rus, et al., 2010أقيم ألول مرة عام 2010ويتألف من مسألتين:
.1وضع األسئلة على مستوى الفقرة )Question Generation from Paragraphs (QGP
على املشتركين وضع 6أسئلة متعلقة بفقرة نصية مدخلة ويجب أن تتنوع صعوبة األسئلة ما بين عام يتعلق بكامل النص (سؤال
واحد) -وسط يتعلق ببعض الجمل في النص (سؤالين) –خاص ( 3أسئلة).
وضع األسئلة على مستوى الجملة )Question Generation from Sentences (QGS .2
على املشتركين وضع سؤال مناسب لكل جملة معطاة (ومع كل جملة ُيعطى نوع السؤال املطلوب استخراجه (متى ,أين ,كيف)..
وكانت مصادر النصوص بشكل رئيس ي من ويكيبيديا Wikipediaو OpenLearnو .Yahoo!Answers
14