You are on page 1of 153

‫ٌ‬

‫تطبيقــــات أساس َّيــة فــــي‬


‫المعا َلجة اآلل َّية ل ُّلغة العرب َّية‬
‫ُ‬

‫مباحث لغوية ‪٥٨‬‬

‫تحرير‬

‫السعيــد‬
‫عتز بالله َّ‬
‫الـم ّ‬
‫د‪ُ .‬‬ ‫د‪ُ .‬محســـــــــــن َرشـــــــــــوان‬

‫الباحثون‪:‬‬
‫ُحـــــمـــــــــد عفيـــــفـــــــي‬
‫َّ‬ ‫د‪ .‬مـ‬ ‫ُحمــــــــــــــــــــــد َعط َّيـــــــــــــــــة‬
‫د‪ .‬مـ َّ‬
‫د‪ .‬علي عــلـــي فهـــــــــمي‬ ‫د‪.‬شريــــف مهـــــــدي َعبــــده‬
‫مباحث لغوية ‪٥٨‬‬

‫المعا َلجة اآلل َّية‬ ‫ٌ‬


‫تطبيقات أساس َّية في ُ‬
‫ل ُّلغة العرب َّية‬
‫حترير‬
‫السعيــد‬
‫الـمعت ّز باهلل َّ‬
‫د‪ُ .‬‬ ‫د‪ُ .‬مســـن َرشـــــوان‬

‫الباحثون‪:‬‬
‫ُحمــــد عفيـــفي‬
‫د‪ .‬مـ َّ‬ ‫ُحمــــــد َعط َّيــة‬
‫د‪ .‬مـ َّ‬
‫د‪ .‬عيل عــيل فهــــــمي‬ ‫د‪.‬رشيف مهــدي َعبده‬

‫‪١٤41‬هـ ‪٢٠١٩ -‬م‬


‫تطبيقات أساس َّية في ال ُمعالَجة اآلل َّية‬
‫ٌ‬
‫للُّغة العرب َّية‬
‫الطبعة األوىل‬
‫‪ 1441‬هـ ‪ ٢٠١٩ -‬م‬
‫مجيع احلقوق حمفوظة‬
‫اململكة العربية السعودية ‪ -‬الرياض‬
‫ص‪.‬ب ‪ 12500‬الرياض ‪11473‬‬
‫هاتف‪00966112581082 - 00966112587268:‬‬
‫الربيد اإلليكرتوين‪nashr@kaica.org.sa :‬‬

‫مركز امللك عبداهلل بن عبدالعزيز الدويل خلدمة اللغة‬


‫العربية‪1٤٤1 ،‬هـ‪.‬‬
‫فهرسة مكتبة امللك فهد الوطنية أثناء النرش‬
‫رشوان‪ ،‬حمسن‬
‫التصميم واإلخراج‬ ‫تطبيقات أساسية يف املعاجلة اآللية للغة العربية‪ /.‬حمسن‬
‫رشوان؛ املعتز باهلل السعيد ‪-.‬الرياض‪1٤٤٠ ،‬هـ‬
‫‪..‬ص؛ ‪ ..‬سم‬
‫ردمك‪978- 603- 8221- ٥٣- ٢ :‬‬
‫‪ - 1‬اللغة العربية ‪ -‬معاجلة البيانات أ‪ .‬السعيد ‪ ،‬املعتز باهلل‬
‫(مؤلف مشارك) ب‪ .‬العنوان‬
‫ديوي ‪١٤٤٠/١٠١٦٧ ٤١٠,٢٨٥‬‬
‫رقم اإليداع‪١٤٤٠/١٠١٦٧ :‬‬
‫ردمك‪978- 603- 8221- ٥٣- ٢ :‬‬

‫اليسمح بإعادة إصدار هذا الكتاب‪ ،‬أو نقله يف أي شكل أو وسيلة‪،‬‬


‫سواء أكان إلكرتونية أم يدوية أم ميكانيكية‪ ،‬بام يف ذلك مجيع أنواع تصوير املستندات بالنسخ‪ ،‬أو‬
‫التسجيل أو التخزين‪ ،‬أو أنظمة االسرتجاع‪ ،‬دون إذن خطي من املركز بذلك‪.‬‬
-4-
‫الصفحة‬ ‫املوضوع‬
‫‪9‬‬ ‫كلمة املركز‬
‫‪11‬‬ ‫مقدمة‬
‫‪15‬‬ ‫العريب املكتوب‬
‫ّ‬ ‫الفصل األول‪ُ :‬م َ‬
‫عاجلة الن َّّص‬
‫‪17‬‬ ‫املبحث األول‪ :‬طبيعة رسم النص العريب ِ‬
‫(اخل َطا َطة)‬ ‫َّ‬
‫‪19‬‬ ‫ِ‬
‫‪ -1‬خلفية تارخيية لتطور اخلطاطة العربية‬
‫‪24‬‬ ‫اخلطاطة العربية‬‫‪ -2‬تاريخ حوسبة ِ‬

‫‪29‬‬ ‫‪ -3‬حتديات ِ‬
‫اخلطاطة العربية التي تواجه التعرف عليها آل ًّيا‬
‫‪33‬‬ ‫اآليل عىل الن َّّص ال َع َر ّيب املكتوب‬ ‫املبحث ال َّثاين‪ :‬أنواع الت ُّ‬
‫َّعرف ّ‬
‫‪35‬‬ ‫‪ -1‬تصنيف أنامط الكتابة ومتثيلها من منظور حاسويب‬
‫‪37‬‬ ‫‪ -2‬تطبيقات التعرف اآليل عىل النص العريب املكتوب‬
‫‪43‬‬ ‫العريب املكتوب‬
‫ّ‬ ‫اآليل عىل الن َّّص‬ ‫املبحث ال َّثالث‪ :‬أساليب الت ُّ‬
‫َّعرف ّ‬
‫‪45‬‬ ‫‪ -1‬التعرف عىل النص املكتوب كأحد أنظمة التعرف عىل األنامط‬
‫‪47‬‬ ‫‪ -2‬أساليب التعرف عىل الكتابة العربية بتعقب خط اليد‬

‫‪-5-‬‬
‫‪48‬‬ ‫‪ -3‬أساليب التعرف عىل الكتابة العربية املطبوعة‬
‫‪50‬‬ ‫‪ -4‬أساليب التعرف عىل الكتابة العربية املخطوطة يدو ًّيا‬
‫‪50‬‬ ‫ِ‬
‫املوارد اللغوية لتدريب وتقويم أنظمة التعرف عىل الكتابة العربية‬ ‫‪ -5‬بناء‬
‫‪57‬‬ ‫العريب املنطوق‬
‫ّ‬ ‫الفصل ال َّثاين‪ُ :‬م َ‬
‫عالة الن َّّص‬
‫‪59‬‬ ‫اآليل عىل الكالم‬
‫َّعرف ّ‬
‫األول‪ :‬الت ُّ‬
‫املبحث َّ‬
‫‪61‬‬ ‫‪ -1‬مقدمة‬
‫‪62‬‬ ‫‪ -2‬مكونات نظم التعرف عىل الكالم‬
‫‪70‬‬ ‫‪ -3‬ملخص لبناء نظام للتعرف عىل الكالم‬
‫‪71‬‬ ‫‪ -4‬التعرف عىل الكالم يف ال ُّلغة العرب َّية‬
‫‪75‬‬ ‫املبحث ال َّثاين‪ُ :‬ن ُظم حتويل الن َّّص إىل كالم‬
‫‪77‬‬ ‫‪ -1‬التوصيف اللغوي‬
‫‪78‬‬ ‫‪ -2‬إنتاج إشارات الكالم‬
‫‪83‬‬ ‫املبحث ال َّثالث‪ُ :‬ن ُظم ال َّت َع ُّرف عىل ال ُّلغة وامل َت َك ِّلم‬
‫‪85‬‬ ‫‪ -1‬نظم التعرف عىل ال ُّلغة‬
‫‪86‬‬ ‫‪ -2‬نظم التعرف عىل املتكلم‬
‫‪93‬‬ ‫الفصل ال َّثالث‪ :‬تطبيقات ُمعاجلة ال ُّلغة العرب َّية يف جمال التَّعلِيم‬
‫‪96‬‬ ‫‪ -1‬تقنيات معاجلة اللغات الطبيعية (‪)NLP‬‬
‫‪99‬‬ ‫‪ -2‬تعلم النطق باستخدام تقنية التعرف اآل ّيل عىل الكالم‬
‫‪108‬‬ ‫‪ -3‬تعلم الكتابة باستخدام تقنية التعرف اآل ّيل عىل الكتابة‬
‫‪114‬‬ ‫‪ -4‬مقرتحات َبحثِ َّية‬
‫‪119‬‬ ‫اآليل‬
‫الرابع‪ :‬التَّقييم ّ‬
‫الفصل َّ‬
‫‪121‬‬ ‫مقدمة‬
‫‪123‬‬ ‫‪ -1‬األسئلة املقالية وأنواعها‬

‫‪-6-‬‬
‫‪124‬‬ ‫‪ -2‬طرق تقييم املقال (املوضوعات التعبريية) آل ًّيا (‪)AES‬‬
‫‪132‬‬ ‫‪ -3‬تقييم اإلجابات القصرية‪.‬‬
‫‪135‬‬ ‫‪ -4‬تقييم درجات الكالم‬
‫‪139‬‬ ‫‪ -5‬أنظمة تقييم الرياضيات‬
‫‪ -6‬أنظمة الكشف عن الرسقات األدبية‬
‫‪140‬‬
‫(‪)Plagiarism Detection Systems‬‬
‫‪141‬‬ ‫‪ -7‬أنظمة التقييم اآليل ودعم اللغة العربية‬
‫‪142‬‬ ‫‪ -8‬اخلالصة‬
‫‪147‬‬ ‫الباحثون‬

‫‪-7-‬‬
-8-
‫كلمة املركز‬

‫يعمل املركز يف جمال البحث العلمي ونرش الكتب مستهدف ًا الرتكيز عىل املجاالت‬
‫البحثية التي ما زالت بحاجة إىل تسليط الضوء عليها‪ ،‬وتكثيف البحث فيها‪ ،‬ولفت أنظار‬
‫الباحثني واجلهات األكاديمية إىل أمهية استثامرها بمختلف وجوه االستثامر‪ ،‬وذلك مثل‬
‫جمال (التخطيط اللغوي) و (العربية يف العامل) و(األدلة واملعلومات) و (تعليم العربية‬
‫ألبنائها أو لغري الناطقني هبا) إىل غري ذلك من املجاالت‪ ،‬وإن من أهم جماالت البحث‬
‫املستقبلية يف اللغة العربية جمال (العربية واحلوسبة ‪ ،‬والذكاء االصطناعي) حيث إن‬
‫حياة اللغات ومستقبلها مرهونة بمدى جتاوهبا مع التطورات التقنية والعامل االفرتايض‪،‬‬
‫وكثافة املحتوى االلكرتوين املكتوب‪ ،‬وهو ما يشكّل حتديا حقيقيا أمام اللغات غري‬
‫املنتجة للمعرفة أو للتقنية‪.‬‬
‫وقد عمل املركز عىل تسليط الضوء عىل هذا املجال التخصيص؛ مستعينا بالكفاءات‬
‫القادرة من املهتمني بالتخصص البيني (بني اللغة واحلاسوب) مقدّ را جهودهم‪ ،‬وهادف ًا‬
‫إىل نرشها‪ ،‬وتعميم مبادئها‪ ،‬راغب ًا أن يكون هذا املسار العلمي مقررا يف اجلامعات يف‬
‫كلية العربية واحلاسوب‪ ،‬وجماال بحثيا يقصده الباحثون األكديميون‪ ،‬واجلهات البحثية‬
‫العربية‪.‬‬

‫‪-9-‬‬
‫‪          ‬وقد أصدر املركز سابقا ستة عرش كتاب ًا خمتصا يف (حوسبة العربية) ويف‬
‫اإلفادة من (املدونات اللغوية) يف األبحاث العربية‪ ،‬وحيتفل بإصدار سبعة كتب جديدة‬
‫خمتصة يف (حوسبة العربية والذكاء االصطناعي) ‪ ،‬ويقدمها للقارئ العريب‪ ،‬وللجهات‬
‫األكاديمية؛ لإلفادة منها يف مناهج التعليم والبناء عليه‪ ،‬وهذه الكتب السبعة هي‪:‬‬
‫االصطناعي‪ ،‬تطبيقات الذكاء االصطناعي يف خدمة اللغة العربية‪،‬‬
‫ّ‬ ‫(العرب َّية َّ‬
‫والذكاء‬
‫خوارزميات الذكاء‪ ‬االصطناعي يف حتليل النص العريب‪ ،‬مقدمة يف حوسبة اللغة‬
‫العربية‪ ،‬املوارد اللغوية احلاسوبية‪ ،‬املعاجلة اآللية للنصوص العربية‪ ،‬تطبيقات أساسية‬
‫يف املعاجلة اآللية للغة العربية)‪.‬‬
‫ويشكر املركز السادة مؤلفي الكتب‪ ،‬وحمررهيا‪ ،‬ملا تفضلوا به من عمل علمي‬
‫رصني‪ ،‬وأدعو الباحثني واملؤلفني إىل التواصل مع املركز الستكامل املسرية‪ ،‬وتفتيق‬
‫فضاءات املعرفة‪.‬‬
‫وفق اهلل اجلهود وسدد الرؤى‪.‬‬

‫األمني العام‬
‫أ‪ .‬د‪ .‬حممود إسامعيل صالح‬

‫‪-10-‬‬
‫مقدمة‬

‫بعضها من منطق ال ُّلغة‬ ‫ينطلق ُ‬ ‫ُ‬ ‫أساليب ُمب َتكَرة؛‬‫َ‬ ‫عال ُة ال ُّلغات ال َّطبيع َّية ُظ َ‬
‫هور‬ ‫تشهدُ ُم َ‬
‫اآلخ ُر من منطق‬ ‫بعضها َ‬ ‫وينطلق ُ‬ ‫ُ‬ ‫ِ‬
‫وقواعدها؛‬ ‫القائم عىل استيعاب قوانني هذه ال ُّلغات‬
‫األساليب واملناهج‬‫َ‬ ‫والواقع َّ‬
‫أن‬ ‫ُ‬ ‫الـمتعدِّ دة‪.‬‬ ‫اآللة القائم عىل نمذجة ال ُّلغة يف ُمستوياهتا ُ‬
‫بني‬
‫تسمح باجلمع َ‬ ‫ُ‬ ‫بقدر من املرونة ا َّلتي‬ ‫َّسم ٍ‬ ‫املستخدمة يف ُمعاجلة ال ُّلغات ال َّطبيع َّية تت ُ‬
‫عطيات ُلغو َّي ٍة وإحصائ َّية‪ ،‬عىل النَّحو ا َّلذي ُي َم ِّك ُن من الوصول إىل أفضل النَّتائج‬ ‫ٍ‬ ‫ُم‬
‫الـممكنة يف تطبيقات حوسبة ال ُّلغات ال َّطبيع َّية‪.‬‬ ‫ُ‬
‫تقييم‬ ‫عالة يستدعي‬ ‫للـم َ‬ ‫ِ‬ ‫َّ‬
‫ً‬ ‫الوقوف عىل نجاعة هذه األساليب وصالح َّيتها ُ‬ ‫َ‬ ‫إن‬
‫عميل‪ُ ،‬يساعدُ عىل‬ ‫تطبيقي‬
‫ٍّ‬ ‫ٍ‬
‫إطار‬ ‫االفرتايض إىل‬ ‫َّظري‬
‫اإلطار الن َّ‬
‫َ‬ ‫يتجاوز‬
‫ُ‬ ‫موضوع ًّيا‪،‬‬
‫ّ‬ ‫َّ‬
‫مثل‬ ‫ولعل َ‬
‫لتجاوزها‪َّ .‬‬ ‫حلول ف َّعال ًة‬ ‫ً‬ ‫باتا‪ ،‬و ُيقدِّ ُم‬ ‫عالة و َع َق ِ‬ ‫الـم َ‬
‫ُ‬ ‫استكشاف إشكاالت ُ‬
‫ُ‬
‫تتكامل‬ ‫أساليب ُمعاجلة ال ُّلغات ال َّطبيع َّية‬ ‫ٍ‬
‫يضع أيدينا عىل حقيقة‪ ،‬مفا ُدها َّ‬
‫أن‬
‫َ‬ ‫ذلك التَّقييم ُ‬
‫عو ُل عىل أخرى يف تطوير هذه‬ ‫ٍ‬ ‫ِ‬
‫فيام بينها؛ ف ُي َع َّو ُل عىل بعضها يف بناء تطبيقات ُم َع َّينة‪ ،‬و ُي َّ‬
‫التَّطبيقات‪.‬‬
‫ابع من سلسلة دراسات و ُب ُحوث‬ ‫الر َ‬
‫الكتاب َّ‬
‫َ‬ ‫الـمن َط َلق‪ ،‬نُقدِّ ُم للقارئ العر ّ‬
‫يب‬ ‫من هذا ُ‬
‫عالة اآلل َّية ل ُّلغة العرب َّية)؛‬ ‫وس َبة ال ُّلغة العرب َّية‪ ،‬ب ُعنوان (تطبيقات أساس َّية يف ُ‬
‫الـم َ‬ ‫يف َح َ‬
‫عالة ال ُّلغة العرب َّية‬
‫حول تقنيات ُم َ‬ ‫تطبيقي َ‬ ‫ذات ب ٍ‬ ‫ُحاول من خاللِ ِه أن‬
‫ون ُ‬
‫ّ‬ ‫عد‬ ‫نطرح ُرؤي ًة َ ُ‬
‫َ‬

‫‪-11-‬‬
‫أيضا إىل جوانب اإلفادة من تطبيقات‬ ‫ونعر ُج من َ‬
‫ذلك ً‬ ‫ورتَيها‪ :‬املكتوبة واملنطوقة‪ُ ،‬‬ ‫يف ُص َ‬
‫حوسبة ال ُّلغة العربية يف تعليمها من ناحية‪ ،‬وتقييم ُمرجات عملية التَّعليم من ناحيةٍ‬
‫َّ‬ ‫َ‬ ‫َّ‬ ‫َ َ‬
‫أخرى‪.‬‬
‫الكتاب إىل أربعة ُف ُص ٍ‬ ‫ِ‬
‫ول‪ ،‬عىل النَّحو‬ ‫َ‬ ‫ورغب ًة يف حتقيق أهدافنا املنشودة‪ ،‬فقد َّ‬
‫قسمنا‬
‫اآليت‪:‬‬
‫َّص‬ ‫َّعرف عىل الن ّ‬ ‫يب املكتوب؛ ُيعنى بتقنيات الت ُّ‬ ‫َّص العر ّ‬
‫عالة الن ّ‬ ‫األول‪ُ :‬م َ‬ ‫Ÿ Ÿالفصل َّ‬
‫األول‬ ‫يتناول يف املبحث َّ‬ ‫ُ‬ ‫حيث‬ ‫ُ‬ ‫ويشتمل عىل ثالثة مباحث؛‬ ‫ُ‬ ‫يب املكتوب‪،‬‬ ‫العر ّ‬
‫ِ‬
‫يب‪ ،‬و ُيقدِّ ُم لذلك بإرهاصات اخلطاطة العرب َّية وتاريخ‬ ‫َّص العر ّ‬ ‫طبيع َة رسم الن ّ‬
‫ِ‬
‫َّعرف اآل ّيل‬‫املبحث ال َّثاين بأنواع الت ُّ‬
‫ُ‬ ‫َّعرف عليها آل ًّيا؛ و ُيعنى‬ ‫حوس َبتها وحتدِّ يات الت ُّ‬ ‫َ‬
‫فيعرض ألساليب‬ ‫ُ‬ ‫املبحث ال َّث ُ‬
‫الث‬ ‫ُ‬ ‫يب املكتوب وتطبيقاته‪ .‬أ َّما‬ ‫َّص العر ّ‬ ‫عىل الن ّ‬
‫َ‬
‫كذلك‬ ‫ويعرض‬
‫ُ‬ ‫أكان مطبو ًعا أم خمطو ًطا؛‬ ‫يب‪ ،‬سوا ٌء َ‬ ‫َّص العر ّ‬ ‫َّعرف عىل الن ّ‬ ‫الت ُّ‬
‫يب‪.‬‬
‫َّص العر ّ‬ ‫َّعرف عىل الن ّ‬ ‫اللزمة لتدريب وتقويم أنظمة الت ُّ‬ ‫للموارد ال ُّلغو َّية َّ‬
‫َّعرف عىل الكالم‬‫يب املنطوق؛ ُيعنى بتقنيات الت ُّ‬ ‫َّص العر ّ‬ ‫Ÿ Ÿالفصل الثاين‪ُ :‬م َ‬
‫عالة الن ّ‬
‫األو ُل متهيدً ا َ‬
‫حول‬ ‫ُ‬
‫املبحث َّ‬ ‫حيث ُيقدِّ ُم‬‫ُ‬ ‫َ‬
‫مباحث؛‬ ‫ويشتمل عىل ثالثة‬ ‫ُ‬ ‫املنطوق؛‬
‫كونات ُن ُظ ِمه‪ ،‬مع العناية بتطبيق َ‬
‫ذلك يف ال ُّلغة‬ ‫َّعرف اآل ّيل عىل الكالم و ُم ِّ‬ ‫الت ُّ‬
‫َّص (املكتوب) إىل كال ٍم (منطوق)‪.‬‬ ‫املبحث ال َّثاين بنُ ُظم حتويل الن ّ‬
‫ُ‬ ‫العرب َّية‪ .‬و ُيعنى‬
‫والـمتك ِّلم‪.‬‬
‫ُ‬ ‫َّعرف عىل ال ُّلغة‬
‫الث لنُ ُظم الت ُّ‬‫املبحث ال َّث ُ‬
‫ُ‬ ‫ويعرض‬
‫ُ‬
‫وترتكز ما َّد ُة هذا‬
‫ُ‬ ‫عالة ال ُّلغة العرب َّية يف جمال التَّعليم؛‬ ‫Ÿ Ÿالفصل ال َّثالث‪ :‬تطبيقات ُم َ‬
‫حيث ُيقدِّ ُم متهيدً ا َ‬
‫حول‬ ‫الفصل عىل آل َّيات توظيف احلاسوب يف تعليم ال ُّلغات؛ ُ‬
‫ُ‬
‫الفصل تطبي ًقا‬ ‫عالة ال ُّلغات ال َّطبيع َّية وجدواها يف تع ُّلم ال ُّلغة؛ و ُيقدِّ ُم‬ ‫تقنيات ُم َ‬
‫َّعرف عىل الكالم املنطوق‪ ،‬وتطبي ًقا‬ ‫حول تع ُّلم النُّطق باستخدام تقنية الت ُّ‬ ‫عمل ًّيا َ‬
‫َّص املكتوب‪.‬‬ ‫َّعرف عىل الن ّ‬ ‫حول تع ُّلم الكتابة باستخدام تقنية الت ُّ‬ ‫آخر َ‬‫َ‬
‫باعتبار ِه أحدَ تطبيقات التَّنقيب‬ ‫ِ‬ ‫ُ‬
‫الفصل‬ ‫الرابع‪ :‬التَّقييم اآل ّيل؛ يتناو ُل ُه‬
‫Ÿ Ÿالفصل َّ‬
‫يعرض‬ ‫ُ‬ ‫حول األسئلة املقال َّية وأنواعها‪ُ ،‬ث َّم‬ ‫َ‬ ‫يف الن ُُّصوص‪ .‬و ُيقدِّ ُم متهيدً ا‬
‫ل ُط ُرق التَّقييم اآل ّيل للمقال‪ ،‬و ُط ُرق تقييم اإلجابات القصرية‪ ،‬وأنظمة تقييم‬

‫‪-12-‬‬
‫يعرض لواقع أنظمة‬
‫ُ‬ ‫السقات األدب َّية‪ .‬كام‬
‫الرياض َّيات‪ ،‬وأنظمة الكشف عن َّ‬ ‫ِّ‬
‫التَّقييم اآل ّيل يف العرب َّية‪.‬‬
‫أعمق لتقنيات ُمعاجلة ال ُّلغة‬
‫َ‬ ‫الكتاب عىل فه ٍم‬
‫ُ‬ ‫وبعدُ ؛ فإنَّنا نرجو أن ُيساعدَ هذا‬
‫للباحثني يف‬
‫َ‬ ‫مفتاحا‬
‫ً‬ ‫ِ‬
‫الكتاب‬ ‫َ‬
‫تكون ما َّد ُة هذا‬ ‫ونلتمس أن‬
‫ُ‬ ‫العرب َّية وتطبيقاهتا األساس َّية؛‬
‫َ‬
‫وسائل ُمب َتكَرة لبناء وتطوير تقنيات ُم َ‬
‫عالة العرب َّية‬ ‫ميادين حوسبة ال ُّلغة للبحث عن‬
‫الـمختلفة‪.‬‬
‫رب ُمستوياهتا ُ‬ ‫ع َ‬
‫ِ‬
‫واألجر اجلزيل‪ ،‬وأن جيع َله من‬ ‫حل َس ِن‬ ‫نسأل اهلل تعاىل أن يتق َّب َل هذا اجلهدَ ِّ‬
‫بالذكر ا َ‬ ‫ُ‬
‫ينفع أصحا َبه بعد مماهتم‪.‬‬‫العل ِم ا َّلذي ُ‬
‫وإليك ِ‬
‫املصري‪.‬‬ ‫َ‬ ‫َ‬
‫وإليك أنَبنا‬ ‫َ‬
‫عليك توكَّلنا‬ ‫ر َّبنا‬

‫حرران‬
‫الـم ِّ‬
‫ُ‬ ‫ ‬

‫‪-13-‬‬
-14-
‫الفصل األول‬
‫العربي املكتوب‬
‫ّ‬ ‫َّص‬ ‫ُمعا َ‬
‫جلة الن ّ‬

‫د‪ُ .‬م َّمد عط َّية‬

‫(اخلطاطة)‪.‬‬ ‫املبحث األول‪ :‬طبيعة رسم النَّص العريب ِ‬


‫ّ‬ ‫ّ‬ ‫َّ‬
‫يب املكتوب‪.‬‬
‫َّص ال َع َر ّ‬ ‫املبحث ال َّث ِان‪ :‬أنواع الت ُّ‬
‫َّعرف اآل ّيل عىل الن ّ‬
‫يب املكتوب‪.‬‬
‫َّص العر ّ‬ ‫املبحث ال َّثالث‪ :‬أساليب الت ُّ‬
‫َّعرف اآل ّيل عىل الن ّ‬

‫‪-15-‬‬
-16-
‫املبحث األ َّول‬
‫طبيعة رسم النص العربي‬
‫(اخل َط َ‬
‫اطة)‬ ‫ِ‬

‫‪ -1‬خلفية تارخيية لتطور ِ‬


‫اخلطاطة العربية‪.‬‬
‫‪ -2‬تاريخ حوسبة ِ‬
‫اخلطاطة العربية‪.‬‬
‫‪ -3‬حتديات ِ‬
‫اخلطاطة العربية التي تواجه التعرف عليها آل ًّيا‪.‬‬

‫‪-17-‬‬
-18-
‫‪ -1‬خلفية تارخيية لتطور ِ‬
‫اخلطاطة العربية‬
‫حافظت اللغة العربية عىل استمراريتها كلغة حمكية حمتفظة بكياهنا منذ ما يربو عىل‬
‫ألفي عام ‪ -‬عىل أقل تقدير‪ -‬إىل وقتنا هذا‪ ،‬مما يتوجها دون شك كأعرق اللغات احلية‬
‫الكربى املتداولة يف العامل املعارص‪ .‬وقد احتفظت هذه اللغة عىل مدى هذا التاريخ‬
‫الطويل بقدرهتا عىل االستجابة ملختلف االحتياجات احلضارية لألجيال املتتابعة‪،‬‬
‫كام استجابت باقتدار للتوسعات اجلغرافية والتمددات العرقية للمتحدثني هبا الذين‬
‫أساسا يف شبه اجلزيرة العربية قبيل ظهور اإلسالم حتى‬
‫تزايدوا من عدد حمدود حمصور ً‬
‫جتاوز عددهم عام ‪2011‬م الثالثمئة وستني مليونًا يتخذون من العربية لغتهم األم‬
‫ال عن عرشات املاليني اآلخرين الذين يتحدثوهنا ضمن ما يربو عىل مليار مسلم‬ ‫فض ً‬
‫غري عريب‪.‬‬
‫ورغم أن قواعد الصوتيات والرصف والنحو ‪ ...‬وغري ذلك من أركان اللغة‬
‫ودعائمها قد احتفظت بسامهتا املميزة عرب ذلك التاريخ املمتد والتوسع املستمر‪ ،‬فإن‬
‫هناك تطورات متتابعة كانت جتري عىل بعض املالمح األخرى لِ ُّلغة‪ .‬وتأيت ِ‬
‫اخلطاطة‬
‫العربية (التي حتدد طبيعة رسم النص العريب) ضمن املالمح التي جرت عليها مثل هذه‬
‫اخلطاطة املستخدمة لرسم النصوص يف عدد آخر من اللغات‬ ‫التطورات وهي نفس ِ‬
‫الرشقية املعارصة كاألُ ْر ِد َّية والفارسية والكردية‪ ،‬كام استخدمت لرسم اللغة الرتكية‬
‫حتى ثالثينات القرن العرشين امليالدي‪.‬‬
‫مل يكن الغالب عىل سكان شبه اجلزيرة العربية قبل اإلسالم تكوين دول ذات أنظمة‬
‫مستقرة ومعامالت معقدة‪ ،‬وإنام كانوا يف الغالب قبائل بدوية‪ ،‬ومل تكن الكتابة شائعة‬
‫أساسا يف تداول املعلومات‬
‫بينهم ‪ -‬حتى أهنم عرفوا وقتذاك باألميني ‪ -‬حيث اعتمدوا ً‬
‫واملعرفة عىل رواية وحفظ األقوال البليغة املخترصة من شعر ونثر‪ ،‬وهو ما متيزوا فيه‬
‫واشتهروا به‪ .‬أما القلة النادرة التي كانت تعرف الكتابة ‪ -‬ربام بسبب مزاولتها للتجارة‬
‫أو لوجودها عىل ختوم اجلزيرة واحتكاكها بكربى احلضارات املعارصة آنذاك ‪ -‬فقد‬
‫اكتفت بنظام كتابة يميل إىل البساطة‪.‬‬
‫كانت اخلطاطة يف ذلك الوقت الباكر متثل احلروف العربية الثامنية والعرشين‬
‫رمزا رسوم ًّيا «جرافيم» (‪ )grapheme‬ومن‬
‫(أو الثالثني) بخمسة عرش أو ستة عرش ً‬

‫‪-19-‬‬
‫النادرة اليت كانت تعرف الكتابة ‪ -‬رمبا بسبب مزاولتها للتجارة أو لوجودها على ختوم اجلزيرة‬
‫واحتكاكها بكربى احلضارات املعاصرة آنذاك ‪ -‬فقد اكتفت بنظام كتابة ُييل إىل البساطة‪.‬‬
‫كانت اخلطاطة يف ذلك الوقت الباكر متثل احلروف العربية الثمانية والعشرين (أو الثالثني)‬
‫رمزا رسوميًّا «جرافيم» (‪ )grapheme‬ومن الواضح أن ذلك يسبب‬ ‫خبمسة عشر أو ستة عشر ً‬
‫فإن النقاط مل‬ ‫املثال‬ ‫سبيل‬ ‫وعىل‬ ‫احلروف‪.‬‬ ‫متييز‬ ‫يف‬ ‫ا‬
‫احلروف‪ً .‬وعلى ًسبيل املثال فإن النقاط مل تكن قد ِ‬‫كبري‬ ‫ا‬‫التباس‬ ‫الواضح أن ذلك يسبب‬
‫أدخلت بعد يف‬ ‫كبريا ِيف متييز‬ ‫التباسا‬
‫ً‬
‫تكن قد ً‬
‫أدخلت بعد يف اخلطاطة العربية‪ ،‬ولذلك فقد كانت حروف احلاء واخلاء واجليم‬
‫اخلطاطة ُ َّالعربية‪ ،‬ولذلك فقد كانت حروف احلاء واخلاء واجليم كلها حمتثَّل بنفس الرمز الرسومي‪،‬‬
‫كلها تثل بنفس الرمز الرسومي‪ ،‬وكذلك كانت حروف الباء والتاء والثاء والنون والياء‬
‫إخل‪.‬‬ ‫ذلك‪،...‬‬
‫الزمن‬ ‫الرسومي‪،‬‬ ‫يكتبونالرمز‬
‫العربية يف‬ ‫ثل بنفس‬‫متكن َمتم ْن‬
‫الياء كلها‬
‫إلخ‪.‬ووقد‬
‫الرسومي‪،‬الثاء‪،...‬والنون‬
‫الرمزالباء والتاء و‬
‫حروف‬
‫كانتبنفس‬ ‫كذلك متثل‬
‫و كلها‬
‫ملكاهتم‬
‫بسبب بسبب‬
‫االلتباس كذلك‬ ‫اللغويةمع هذا‬
‫الرفيعة‪ ،‬وربام‬ ‫ملكاهتمالتعايش‬
‫بسببالزمن من‬ ‫االلتباسذلك‬
‫هذاالعربية يف‬ ‫يكتبون‬ ‫وقدمنمتكن َم ْن‬
‫التعايش مع‬
‫بينهم‪.‬النسبية للرسائل املتداولة بينهم‪.‬‬
‫البساطة‬ ‫املتداولة‬
‫للرسائلبسبب‬
‫النسبيةمبا كذلك‬ ‫البساطة‬
‫الرفيعة‪ ،‬ور‬ ‫اللغوية‬
‫أساسيةلتبادل‬
‫لتبادل‬ ‫وسيلةأساسية‬‫الرتمجةوسيلة‬
‫«الرتمجة‬ ‫العبارة اآلتية‬
‫اآلتية «‬ ‫ستبدو العبارة‬
‫كانت ستبدو‬
‫كيف كانت‬
‫التايلكيف‬
‫الشكلالتايل‬
‫ويبنيالشكل‬
‫ويبني‬
‫الباكرة‪.‬الباكرة‪.‬‬
‫املرحلةاملرحلة‬
‫تلكتلك‬‫طاطتها يف‬ ‫عند ِخ‬
‫طاطتها يف‬ ‫عند ِخ‬
‫العصور»‬ ‫عىل مر‬
‫العصور»‬ ‫الشعوب‬
‫على مر‬ ‫الشعوب‬‫بني بني‬
‫احلضارات‬
‫احلضارات‬

‫اإلسالم‪.‬‬
‫اإلسالم‪.‬‬ ‫القديمةما ماقبلقبل‬
‫العربيةالقدُية‬
‫ابخلطاطة العربية‬
‫مكتوبةبةباخلطاطة‬
‫عبارة مكتو‬ ‫‪:1:1-1‬مثالمثالعىلعلى‬
‫عبارة‬ ‫َّكل ‪-1‬‬
‫الشالش‬
‫كل‬ ‫َّ‬

‫عليه‪-‬‬
‫عليهاهللوسلم‬
‫حممد ‪-‬هللاصىل‬
‫الكريم صلى‬
‫الرسـولُممد ‪-‬‬‫امليالدي ُبالرِعس َثـول الكرمي‬
‫امليالدي بحعِ َ‬
‫ث‬ ‫السابـــــع‬‫القرنالساب ـ ــع‬
‫بداياتالقرن‬
‫ويفويفبداايت‬
‫الكرميوقد أمر‬
‫أصحابه‬ ‫الرسولمبني‬
‫أمر عريب‬
‫بلسان‬ ‫الكريموقد‬ ‫القرآن‬
‫عريب مبني‬ ‫الكرميمنهابلسان‬‫القلب‬ ‫منهاويف‬
‫القرآن‬ ‫اإلسالم‬
‫برسالة القلب‬
‫اإلسالم ويف‬ ‫وسلم ‪-‬‬‫برسالة‬
‫ثمرمجعه‬ ‫ذلكالقديمة‪،‬‬ ‫طاطة‬ ‫ِ‬ ‫ً‬
‫اشدون‬ ‫خلفاؤه ال‬ ‫مناخلبعد‬ ‫مجعهعرب‬
‫وكانُثذلك‬ ‫القدُية‪،‬‬ ‫طاطةبأول‬ ‫بتدوينهاخلِأوال‬
‫ذلك عرب‬ ‫أصحابه‬ ‫الكريموكان‬
‫الرسولالً أبول‬
‫بتدوينه أو‬
‫َ‬
‫من بعد ذلك خلفاؤه الراشدون ونرشوا ن َُسخه يف البالد التي وصل إليها اإلسالم يف‬
‫اإلسالم يفُ زمنهم واليت غطت مساحات شاسعة من‬ ‫ونشروا نح َس َخهح يف البالد اليت وصل إليها‬
‫والتي غطت مساحات شاسعة من األرض تسكنها أجناس شتى بألسنة شتى‬ ‫زمنهم‬
‫يتقنوا اللغة العربية بعد‬
‫ِ‬ ‫األرض تسكنها أجناس شىت أبلسنة شىت دخلوا يف دين اإلسالم وملا‬
‫دخلوا يف دين اإلسالم وملا يتقنوا اللغة العربية بعد (وهم من اص ُطلح عىل تسميتهم‬
‫هؤالء‬ ‫اترت أخطاء‬
‫األعاجم يف‬ ‫كثرت وتو‬
‫املسلمون‬ ‫هؤالء‬ ‫أخطاءفقد‬
‫وبطبيعة احلال‬
‫ابألعاجم)‪.‬وتواترت‬‫تسميتهمفقد كثرت‬ ‫وبطبيعة احلال‬ ‫باألعاجم)‪.‬طحلِح على‬
‫(وهم من اص‬
‫طاطة‬ ‫تسميته ابللَّحن) وكانت ِ‬
‫اخل من‬
‫اخلطاطة ْالقديمة للعربية‬ ‫وكانت ِ‬ ‫اصَّلطْححلِ َح‬
‫ن) على‬ ‫القرآنعىل(وهو ما‬
‫تسميته بال‬ ‫اص ُط ِل َح‬
‫(وهويفماقراءة‬‫األعاجم‬
‫املسلمونالقرآن‬
‫قراءة‬
‫احلروف‬
‫وتلتبساملتشاهبة‬
‫احلروف‬‫الصوتية‬ ‫احلركات‬
‫وتلتبس‬ ‫احلركاتتغيب‬
‫الصوتية‬ ‫حيث كانت‬ ‫لديهمتغيب‬ ‫حنكانت‬ ‫أسباب اللَّ ْ‬
‫حيث‬ ‫من لدهيم‬ ‫للعرال َّل‬
‫بية ْحن‬ ‫القدُية‬
‫أسباب‬
‫يف‬‫فأضيفت‬
‫التحريفمن التحر‬
‫من اإلسالم‬‫كتاب‬‫اإلسالم‬
‫كتاب على‬
‫خافعىلالعلماء‬ ‫ذلكالعلامء‬ ‫انتشرخاف‬ ‫انترشملاذلك‬‫بينها‪ .‬و‬‫بينها‪ .‬وملا‬
‫فيخلطون‬ ‫فيخلطون‬
‫املتشاهبة‬
‫النقاط للتمييز بني احلروف املتشاهبة لتمييزها بصورة حاسمة كام نعرفها اليوم‪ ،‬وينسب‬
‫ويبني الشكل رقم (‪ )2-1‬أدناه نفس العبارة‬
‫ذلك العمل إىل «نرص بن عاصم الليثي»‪19 ،‬‬
‫التي أوردناها كمثال يف شكل رقم (‪ )1-1‬أعاله لكنها خمطوطة بنقط احلروف‪.‬‬

‫‪-20-‬‬
‫فأضيفت النقاط للتمييز بني احلروف املتشاهبة لتمييزها بصورة حامسة كما نعرفها اليوم‪ ،‬وينسب‬
‫ذلك العمل إىل «نصر بن عاصم الليثي»‪ ،‬ويبني الشكل رقم (‪ )2-1‬أدانه نفس العبارة اليت‬
‫أوردانها كمثال يف شكل رقم (‪ )1-1‬أعاله لكنها ُمطوطة بنقط احلروف‪.‬‬

‫االلتباس‪.‬‬
‫لتقليلااللتباس‪.‬‬
‫بالنقاطلتقليل‬
‫خمطوطةابلنقاط‬
‫ولكنها ُمطوطة‬ ‫الشكلالسابق‪،‬‬
‫السابق‪ ،‬ولكنها‬ ‫العبارةيفيفالشكل‬
‫العبارة‬ ‫نفس‬
‫نفس‬ ‫‪:2-:2-1‬‬
‫كلَّكل ‪1‬‬ ‫َّ‬
‫الشالش‬
‫ويف حني أن نقاط «نرص بن عاصم» قد حسمت االلتباس بني رسم حروف اهلجاء‪،‬‬
‫ويف حني أن نقاط «نصر بن عاصم» قد حسمت االلتباس بني رسم حروف اهلجاء‪ ،‬فقد‬
‫لكل من هذه احلروف‪ ،‬وذلك ما‬ ‫فقد بقي اللحن نتيجة اخللط بني احلركات الصوتية ٍّ‬
‫لكل من هذه احلروف‪ ،‬وذلك ما أزاله اللغوي‬ ‫بقي اللحن نتيجة اخللط بني احلركات الصوتية ٍ‬
‫بحل ّناجع يتمثل يف وضع نقاط إضافية فوق‬ ‫أزاله اللغوي الشهري «أبو األسود الدُّ َؤ ِ ّل» ٍّ‬
‫الشهري «أبو األسود الد َِ‬
‫َبل انجع يتمثل يف وضع نقاط إضافية فوق أو حتت كل حرف‬
‫عىل احلركة الصوتية املصاحبة له وسمى تلك النقاط «نقاط‬ ‫للداللة ٍّ‬
‫يل»‬
‫ُّؤ ّ‬ ‫أو حتت كل حرف‬
‫الكلمةال‬
‫موقعراب هنا‬
‫إبانة(واإلع‬
‫مناب»‬‫اليوماإلعر‬
‫عليهنقاط‬
‫النقاط «‬
‫نصطلح‬ ‫ومسىماتلك‬
‫يقصد به‬ ‫املصاحبة له‬
‫الصوتية هنا ال‬ ‫اإلعراب»احلركة‬
‫(واإلعراب‬ ‫للداللة على‬
‫حرف)‪.‬به آنذاك إابنة‬
‫لكله قصد‬
‫املصاحبة ولكن‬
‫الصوتية النحوي‪،‬‬
‫موقع الكلمة‬
‫احلركة‬‫إبانةإابنة‬
‫آنذاكمن‬
‫عليهبه اليوم‬
‫قصد‬ ‫نصطلح‬
‫النحوي‪،‬ماولكنه‬
‫يقصد به‬
‫أستاذ أساتذة اللغة العربية يف عرصه «اخلليل بن أمحد‬ ‫حرف)‪.‬‬ ‫بعقود لكل‬
‫قليلة قام‬ ‫املصاحبة‬
‫ذلك‬‫الصوتية‬
‫احلركة وبعد‬
‫األسودراهيدي‬
‫«أبوأمحد الف‬ ‫وضعها‬
‫اخلليل بن‬ ‫اإلعراب» التي‬
‫عصره «‬ ‫أساتذة«نقاط‬
‫اللغة العربية يف‬ ‫أستاذ رسم‬
‫بتحسني‬ ‫البرصي»‬
‫قليلة(‪ )1‬قام‬ ‫الفراهيدي‬
‫ذلك بعقود‬ ‫وبعد‬
‫فتحةوأبدهلا‬ ‫اليوم من‬
‫الدؤيل»‬ ‫نعرفها‬
‫األسود‬ ‫التيأبو‬ ‫اليتالصويت‬
‫وضعها «‬ ‫الضبط)‬
‫(أوراب»‬
‫التشكيلاإلع‬
‫بعالمات «نقاط‬ ‫الدؤيل»‪)1‬وأبدهلا‬
‫بتحسني رسم‬ ‫(‬
‫البصري»‬
‫ال عن أنه أضاف عىل عمل «نرص بن عاصم» عالم ًة تدل‬ ‫وكرسة وضمة وسكون‪ ،‬فض ً‬
‫بعالمات التشكيل (أو الضبط) الصويت اليت نعرفها اليوم من فتحة وكسرة وضمة وسكون‪،‬‬
‫ور ْس َم اهلمزة‪.‬‬ ‫عىل تضعيف احلرف َّ‬
‫(الشدَّ ة) َ‬
‫فضالً عن أنه أضاف على عمل «نصر بن عاصم» عالمةً تدل على تضعيف احلرف (الشَّدَّة)‬
‫اخلطاطة العربية بعد إضافات «اخلليل ابن أمحد» النص العريب املكتوب‬ ‫وجعلت ِ‬
‫ور ْس َم اهلمزة‪.‬‬
‫َ‬
‫‪-‬وخصوصا القرآن الكريم‪ -‬يسري القراءة واستبعدت إىل حد بعيد حاالت االلتباس‬ ‫ً‬
‫والوصل‪-،‬‬
‫الوقف‪ ،‬املكتوب‬‫النص العريب‬ ‫»‬ ‫أمحد‬ ‫ابن‬ ‫اخلليل‬ ‫«‬ ‫إضافات‬ ‫بعد‬ ‫بية‬
‫ر‬ ‫الع‬ ‫طاطة‬ ‫وجعلت اخلِ‬
‫فيه‪ .‬واستمر تالمذة اخلليل يف إضافة حتسينات تكميلية (كعالمات‬
‫استمر‬
‫الضبط‬ ‫االلتباسكاملفيه‪ .‬و‬ ‫حاالت‬
‫ذروته يف‬ ‫بعيد بلغ‬
‫حدحتى‬ ‫استبعدت إىل‬
‫الكريم‬ ‫رسمو القرآن‬ ‫القراءة‬
‫يسريعىل‬
‫الكرمي‪-‬إلخ)‬ ‫وخصوصا القرآن‬
‫واإلدغام ‪...‬‬ ‫واملد‪ً،‬‬
‫بنهايات القرن الثالث اهلجري حني بدا املصحف الرشيف عىل اهليئة التي نألفها اليوم‬
‫(انظر شكل رقم ‪ 3-1‬أدناه) حيث تشتمل ِخطاطة النص القرآين يف املصحف (وهي ما‬
‫القرآنّي"‬
‫تالوةو"األَصمعِ‬
‫َْ‬ ‫منيبَـ َويْه"‬ ‫القارئ‬
‫ومنهم ِ‬
‫"س‬ ‫لتمكني‬
‫العربية‬ ‫الالزمةأساطني‬ ‫الرموز‬
‫املشاهري من‬ ‫عىل كل‬
‫يديه كبار‬ ‫العثامين)‬
‫تتلمذ على‬ ‫اليوم أنبالرسم‬
‫"اخلليل" قد‬ ‫نعرفها ابلذكر‬
‫(‪ )1‬جدير‬
‫الكريم حممد صىل اهلل عليه وسلم‪.‬‬ ‫الرسول‬
‫‪ ...‬وغريهم‪.‬‬ ‫عىلبن حُشيل"‬
‫أنزلَّضر‬
‫كام" و"الن‬
‫الكريمسائي‬
‫ِ‬
‫و"الك‬
‫َْ‬ ‫ْ‬ ‫ّ‬

‫‪20‬‬

‫«سي َب َو ْيه» و«األَ ْص َم ِع ّي»‬


‫‪ -1‬جدير بالذكر أن «اخلليل» قد تتلمذ عىل يديه كبار املشاهري من أساطني العربية ومنهم ِ‬
‫سائي» و«الن َّْض بن ُش َم ْيل» ‪ ...‬وغريهم‪.‬‬ ‫ِ‬
‫و«الك ّ‬

‫‪-21-‬‬
‫َّ‬
‫الشكل ‪ :3-1‬عينة من نص القرآن الكريم خمطوطة بالرسم العثامين‪.‬‬

‫ومع صعود احلضارة اإلسالمية وقيام دوهلا العظمى املتعاقبة من العباسيني إىل‬
‫مرورا بام بينهام‪ ،‬فإن النشاط اإلداري والسيايس وكذلك النهضة العلمية‬ ‫ً‬ ‫العثامنيني‬
‫قائم بذاته‪ ،‬وبالتايل فإن‬ ‫والثقافية جعلت مجيعها من التدوين والتوثيق نشا ًطا وفنًّا ً‬
‫كبريا ً‬
‫عظيم من االهتامم وظهر مفهوم «اخلطوط» (ال ُفونْتات‪/‬‬ ‫اخلطاطة العربية قد نالت ح ًّظا ً‬
‫اخلطاطة العربية العامة‬ ‫«خ ّط» نس ًقا مطردا يلتزم بقواعد ِ‬
‫األبناط ‪ )fonts‬حيث يمثل كل َ‬
‫ً‬
‫أغراضا معينة سواء كانت‬‫ً‬ ‫املت َفق عليها‪ ،‬ويتميز يف الوقت نفسه بجامليات خاصة به تفيد‬
‫الزخرفة والتشكيل (مثل ال ُّث ُلث والديواين؛ انظر الشكل رقم ‪ 4-1‬أدناه)‪ ،‬أو اإلحياء‬
‫بالعراقة واألصالة (مثل الكويف)‪ ،‬أو الرشاقة والوضوح واملعيارية (عائلة خطوط‬
‫النسخ؛ انظر الشكل ‪ 5-1‬أدناه)‪ ،‬أو السهولة والرسعة (خط الرقعة؛ انظر الشكل رقم‬
‫‪ 6-1‬أدناه) ‪ ...‬إلخ‪.‬‬

‫‪-22-‬‬
‫َّ‬
‫الشكل ‪ :4-1‬عينة زخرفية من اخلط الديواين‪.‬‬

‫َّ‬
‫الشكل ‪ :5-1‬عينة من خطوط النسخ‪.‬‬

‫‪-23-‬‬
‫َّ‬
‫الشكل ‪ :6-1‬عينة من خط الرقعة‪.‬‬

‫‪ -2‬تاريخ حوسبة ِ‬
‫اخلطاطة العربية‬
‫يمكن النظر حلوسبة ِخطاطة اللغة بصفة عامة عىل أهنا امتداد لسالفاهتا من التقنيات‬
‫األقدم يف هذا الصدد وهي اآلالت الكاتبة الكهربائية ومن قبلها امليكانيكية ومن قبلهام‬
‫تقنيات الطباعة بأجياهلا املتعاقبة‪ .‬ومنذ بداية رحلة العامل مع الطباعة مل تكن اللغة العربية‬
‫يف هذا الصدد متخلفة عن نظرياهتا من اللغات األوروبية‪ ،‬فقد أدخل العثامنيون آليات‬
‫مبكرا إىل حارضهتم املركزية «اآلستانة» يف النصف الثاين من القرن اخلامس‬ ‫ً‬ ‫الطباعة‬
‫عرش‪ ،‬وهناك خالف عام إذا كانوا سبقوا إليها بشكل مستقل أو نقلوها عن األوروبيني‬
‫«مينْز» عام ‪1448‬م)‪ ،‬وبغض‬ ‫األملان (حيث استطاع «جوتِن ِْبج» إنشاء أول مطبعة يف ِ‬
‫ْ‬
‫النظر عن ذلك فإن األمر املهم هو أن العثامنيني وقتذاك كانوا خيطون اللغة الرتكية (لغة‬
‫دولتهم املركزية الرسمية) باحلرف العريب (واستمر ذلك حتى ثالثينات القرن العرشين‬
‫امليالدي) كام أن اللغة العربية نفسها كانت لغة سائدة يف العلم والثقافة يتقنها ُج ُّل‬
‫املتعلمني األتراك‪.‬‬

‫‪-24-‬‬
‫ودخلت عملية الطباعة إىل العامل العريب مع بدايات القرن التاسع عرش امليالدي يف‬
‫مرص وبالد الشام‪ ،‬وأخذت من ذلك الوقت يف االنتشار والتوسع؛ ومن مظاهر ذلك‬
‫مث ً‬
‫ال إنشاء «حممد عيل باشا الكبري» للمطابع األمريية يف مرص‪ ،‬ثم تواصلت مواكبة نسخ‬
‫وطباعة اخلط العريب بعد ذلك لكل تطور يف هذا املجال حتى وصلنا لعرص احلاسبات‬
‫اخلطاطــة‬‫الرقمية يف النصــف الثاين من القرن العشــرين امليالدي حيث مل تكن ِ‬
‫العربيــة أقل استعــدا ًدا من أية لغة كربى أخرى للرقمنـة واحلوسبة‪ .‬وعىل الرغم‬
‫من ذلك فقد تأخرت حوسبة ِ‬
‫اخلطاطة العربية بشكــل مستقــر ومقبــول إىل هنايــة‬
‫ثامنينــات وبدايـة تسعينات القــرن العشــرين امليــالدي! ونـرى أنه مـن اهلام إفساح‬
‫املســاحة يف هذا املقــام إلزالة بعــض األوهام وااللتبـاسات التي شاعت بأن هذا‬
‫اخلطــاطة العربية أو بسبب تقــصري‬ ‫التأخر كان بسبــب قــصور وتعقــــيد يف ِ‬
‫وعجز علامء ومهنديس احلوسبة العرب‪.‬‬
‫ظهرت بواكري احلاسبات اإللكرتونية الرقمية يف أربعينات ومخسينات القرن‬
‫وقتئذ أجهزة باهظة‬ ‫ٍ‬ ‫العرشين امليالدي يف الواليات املتحدة األمريكية‪ ،‬وكانت‬
‫التكاليف هائلة احلجم (قد يشغل الواحد منها مبنى بأكمله) معقدة التشغيل ويف بعض‬
‫األحيان رسية التفاصيل‪ ،‬ومع ذلك فإن أرفعها أدا ًء كان ذا إمكانات حسابية أقل من‬
‫اآلالت احلاسبة يف أيامنا هذه! وكان تفاعل هذه األجهزة مع مشغليها من املهندسني‬
‫املتخصصني حمدو ًدا وكان من البدهيي أن يكون هذا التفاعل عرب اللغة اإلنجليزية‪ .‬ويف‬
‫العقدين التاليني أخذت إمكانات واعتامدية هذه األجهزة يف التصاعد بشكل ملحوظ‬
‫كثريا من أقل حاسب شخيص يف أيامنا هذه) بينام أخذ الطلب‬ ‫(وإن ظل أقواها أضعف ً‬
‫ال عن البحث العلمي يف الربوز‬ ‫عىل تطبيقاهتا يف جماالت اإلدارة واهلندسة والتنظيم فض ً‬
‫والتنامي‪ ،‬ومع ذلك ظلت ضخمة احلجم (يشغل الواحد منها قاعة كبرية ويستخدم‬
‫طاقة كهربية هائلة) باهظة التكلفة‪ ،‬وعىل ذلك رشعت رشكات ‪ -‬مثل «آي يب إم»‬
‫األمريكية ‪ -‬يف تصنيع أعداد حمدودة منها لبيعها بشكل جتاري إىل كربيات املؤسسات‬
‫املرصفية والصناعية واحلكومية والبحثية‪ ،‬وملا كان تشغيلها ما يزال حيتاج إىل خرباء‬
‫ذوي تأهيل هنديس متخصص ‪ -‬وهم يتقنون اإلنجليزية بطبيعة احلال ‪ -‬فإن انفراد‬
‫أمرا مقبوالً بعيدً ا‬
‫اللغة اإلنجليزية بواجهات استخدام برجميات تلك احلاسبات ظل ً‬
‫عن االنتقاد واجلدل‪.‬‬

‫‪-25-‬‬
‫تغيــر املشهد جذر ًّيا بعد تصنيع وشيوع املشغالت الدقيقة للحاسبات ِ‬
‫«املايك ُْرو‪-‬‬
‫نطاق واس ٍع مط َل َع الثامنينات حيث شاعت‬ ‫ٍ‬ ‫يسور» (‪ )Microprocessor‬عىل‬ ‫ِ‬
‫بروس ُ‬
‫حاسبات صغرية لأللعاب وللتطبيقات البسيطــة بني عمـــوم الناس وخاصة الشبـاب‬ ‫ٌ‬
‫ِ‬ ‫ِ‬
‫َاري»‪ ،‬ورشكة «سينْك ِلري»)‪،‬‬
‫(ومن أشهرها يف ذلك الوقت تلك التي أطلقتها رشكة « َأت ِ‬
‫ورغم أن تلك احلاسبات التي ارتكزت عىل األجيال األوىل من املشغــالت الدقيقــة‬
‫كانــت ذات إمكانات بدائية جدًّ ا مقــارنة باحلاسبـــات الشخصية يف أيامــنا هــذه‬
‫ال بني الشباب يف ذلك الوقــت حــيث كانــت مدخلهم‬ ‫فإهنا القــت رواجـــًا هائ ً‬
‫إىل عامل رقمي جديد ساحر باهر‪ .‬وعند هذه النقطة بدأ االلتفات إىل مسألة اللغة التي‬
‫تتفاعل هبا برجميات تلك احلاسبات مع مستخدميها الذين مل يكن مجيعهم بالرضورة‬
‫عندئذ الطلب عىل استخدام اللغات املحلية لألسواق التي‬ ‫ٍ‬ ‫يتقنون اإلنجليزية‪ ،‬ونشأ‬
‫تنترش هبا أعداد كبرية من مستخدمي تلك احلاسبات وكانت العربية من بني تلك‬
‫اللغات‪.‬‬
‫ما ع َّقد َّ‬
‫وأخر تلبية هذا الطلب هو األسباب الثالثة املرتابطة اآلتية‪:‬‬
‫ٍ‬
‫وقتئذ (تراوحت بني ثامنية‬ ‫‪1.1‬املحدودية الشديدة لقدرات ذاكرة تلك احلاسبات‬
‫آالف كلمة إىل مخسة وستني ألف كلمة كحد أقىص) مما يعني أن كل الربجميات‬
‫العاملة وبياناهتا يف آن واحد ال يمكن أن يتعدى حجمها هذه الذاكرة الضئيلة‪.‬‬
‫وكان حيز الكلامت الرقمية التي تستخدم لتمثيل عنارص املعلومات ‪ -‬ومنها‬
‫احلروف ‪ -‬ضيق ًة جدًّ ا؛ بدأت بأربعة أرقام ثنائية وهو ما يسمح فقط بستة‬
‫تال وصل حيز الكلمة‬ ‫رمزا خمتل ًفا (اثنني مرفوعة ألس أربعة) ويف وقت ٍ‬
‫عرش ً‬
‫رمزا (اثنني مرفوعة‬
‫الرقمية إىل ستة أرقام ثنائية مما يسمح فقط بأربعة وستني ً‬
‫ألس ستة)‪ ،‬وهذا بالكاد يستوعب الرموز املطلوبة للغة واحدة (كاإلنجليزية‬
‫مثالً) إضافة إىل رموز حتكم رضورية أخرى‪ ،‬مما يعني صعوبة استيعاب أكثر من‬
‫لغة م ًعا يف آن واحد‪.‬‬
‫(هارد‪-‬‬ ‫ِ‬
‫ت‪-‬وير) عضو ًّيا واعتامدها مبارش ًة عىل عتاد ْ‬ ‫(السو ْف‬
‫‪2.2‬ارتباط الربجميات ُّ‬
‫ِوير) تلك احلاسبات وتشكيلهام م ًعا ً‬
‫منتجا واحدً ا تقوم بتصنيعه نفس الرشكة‪،‬‬
‫وبالتايل فإن تغيري لغة تفاعل تلك الربجميات كان حيتاج إىل تعديل املنتج وخط‬

‫‪-26-‬‬
‫إنتاجه‪ .‬فإذا كان للرشكة املنتجة وقتها أن تدعم عدد س من اللغات فإنه كان‬
‫عليها أن تقيم وتدير س من خطوط اإلنتاج ملا تبنيه من حواسب بعتادها‬
‫وبرجمياهتا وهو أمر ليس باليسري‪.‬‬
‫‪3.3‬انغالق أنظمة هذه احلاسبات وبِنَاها أمام املطورين من خارج الرشكات املصنعة‬
‫هلا‪ ،‬مما جعل من العسري عليهم أن يعدلوا برجميات تلك احلاسبات‪.‬‬
‫مع بداية النصف الثاين من ثامنينات القرن العرشين امليالدي وقعت تطورات هامة يف‬
‫عامل احلاسبات الصغرية حيث صارت املشغالت الدقيقة بكلامت يبلغ حيزها ثامنية أرقام‬
‫ثنائية هي السائدة مقابل أسعار معتدلة(‪ .)1‬وبدأ خطان متوازيان يف صناعة احلاسبات‬
‫(‪)2‬‬ ‫ِ‬
‫«املاكينْتُوش»‬ ‫الصغرية؛ فنشأت رشكة «آبـِّل» (‪ )Apple‬األمريكية وصنعت حاسبات‬
‫«ماك‪-‬أو‪-‬إس» يفصل االرتباط العضوي بني العتاد‬ ‫ّ‬ ‫الصغرية بنظام تشغيل متامسك‬
‫ِ‬
‫وبني الربجميات‪ ،‬كام طورت الرشكة برجميات متيزت يف عامل الرسوميات «اجلرافيكْس»‬
‫ف وقتها باسم «النرش املكتبي»‪،‬‬ ‫وتنسيق املطبوعات وإعدادها للنرش والطباعة فيام ُع ِر َ‬
‫ونجحت يف نقل عامل نرش الصحف واملجالت من عرص امليكنة إىل عرص احلوسبة‪،‬‬
‫وأمكن االستجابة للطلب عىل إتاحة هذا النرش املكتبي بلغات العامل الكربى املختلفة‪،‬‬
‫متاحا بصورة جيدة عىل هذا النوع‬‫ويف أقل من سنتني كان النرش املكتبي باخلط العريب ً‬
‫من احلاسبات مدعو ًما بسوق الصحافة اخلليجية السخي‪ .‬أما عىل اخلط املوازي اآلخر‬
‫كثريا طرحت «آي‪-‬يب‪-‬إم» العمالق األمريكي يف‬ ‫ولكن عىل نطاق انتشار أوسع ً‬
‫الصغري حتت اسم «احلاسب الشخيص» (‪Personal‬‬ ‫َ‬ ‫عامل صناعة احلاسبات حاس َبها‬
‫‪ )Computer- PC‬بسعر جذاب(‪ )3‬وألقت وراءه ثقلها إدراكًا منها أن مستقبل سوق‬
‫احلاسبات سوف تسيطر عليه احلاسبات الصغرية وليست العمالقة‪ ،‬وحقق هذا النوع‬
‫من احلاسبات الذي كان يعمل عىل مشغالت دقيقة من رشكة «إنْتِل» بكلامت يبلغ‬

‫رقم ثنائ ًّيا لكنها باهظة الثمن كانت‬


‫أيضا يف ذلك الوقت مشغالت دقيقة بكلامت يبلغ حيزها ستة عرش ً‬
‫‪ -1‬كانت هناك ً‬
‫تبنى عليها حاسبات أرفع أدا ًء تستخدم يف تطبيقات متخصصة لكنها باهظة الثمن كانت يسمى كل منها "حمطة عمل‬
‫‪."Work Station‬‬
‫‪ -2‬املاكينتوش نوع من التفاح املنترش يف أمريكا الشاملية‪.‬‬
‫‪ -3‬كان يمكن رشاؤه بأقل من ألف ومخسمئة دوالر أمريكي يف حدود عام ‪1987‬م انخفضت ملا دون األلف دوالر‬
‫أمريكي بنهاية ذلك ِ‬
‫العقد‪.‬‬

‫‪-27-‬‬
‫ال وبيعت منه ماليني الوحدات‪ ،‬وكان من أسباب‬ ‫نجاحا هائ ً‬
‫ً‬ ‫حيزها ثامنية أرقام ثنائية‬
‫«مايكْروسوفت» حيث كان‬ ‫وس» (‪ )DOS‬من رشكة ِ‬ ‫نجاحه تزويده بنظام تشغيل « ُد ْ‬
‫مفتوحا كرس مبدأ الفصل بني تطوير الربجميات وبني تصنيع العتاد يف مثل ذلك‬ ‫ً‬ ‫نظا ًما‬
‫النوع من احلاسبات الصغرية فسمح بذلك للمطورين من خارج كلتا الرشكتني بتطوير‬
‫برجميات هلذه احلاسبات‪ .‬وضمن هذا املناخ رشعت رشكات عربية يف حماوالت إنتاج‬
‫برجميات عربية لتلك احلاسبات ورشعت أخرى يف حماولة تعريب بعض الربجميات‬
‫أمر ممكن‪.‬‬
‫نجاحا أثبت أن التعريب ٌ‬
‫ً‬ ‫الشهرية والقت تلك املحاوالت‬
‫ْروسو ْفت» نظام تشغيلها «ويندوز ‪ -‬اإلصدار‬ ‫وبعد عام ‪1990‬م حني طرحت ِ‬
‫«مايك ُ‬
‫‪ »3.1‬بواجهة تشغيل رسومية ارتفعت موجة انتشار احلاسبات الشخصية لتشمل كل‬
‫نواحي العامل تقري ًبا ولتحتكر «مايكروسوفت» سوق أنظمة التشغيل هلذا النوع من‬
‫كثريا مما دفع‬
‫احلاسبات الذي كانت إمكاناته احلاسوبية بحلول ذلك الوقت قد ارتقت ً‬
‫ْروسو ْفت» لطرح ملحقات لنظام تشغيلها تدعم لغات العامل املختلفة ومن بينها‬ ‫ِ‬
‫«مايك ُ‬
‫العربية سواء يف واجهة استخدام نظام التشغيل أو يف براجمها املكتبية ‪ -‬خاصة برناجمها‬
‫عرضا عىل الشاشة وطباع ًة عىل الورق‪.‬‬ ‫ورد» – ً‬ ‫«و ْ‬
‫األشهر لكتابة الوثائق وتنسيقها ُ‬
‫وبطبيعة احلال مل خيل األمر يف البداية من بعض املشكالت واملنغصات اهلامشية التي‬
‫أخذت تتالشى تدرجي ًّيا مع اإلصدارات التالية املتالحقة لنظام التشغيل «ويندوز»‪.‬‬
‫املو َّحد لشفرات احلُ ُروف» (‪ )Unicode‬ذي الستة‬ ‫واآلن‪ ،‬وبعد شيوع معيار «النِّظام َ‬
‫رقم ثنائ ًّيا لتمثيل النصوص والذي يتسع حلروف معظم لغات العامل املعارصة واسعة‬ ‫عرش ً‬
‫التداول (ومن بينها العربية بالطبع)‪ ،‬فإن احلرف العريب مدعوم بسالسة وبشكل تلقائي‬
‫– دون احلاجة لتنصيب ملحقات ‪ -‬عىل كافة أنواع احلاسبات تقري ًبا سوا ًء أكانت األجيال‬
‫املتقدمة من احلاسبات الشخصية وصوالً إىل احلواسب الكفية املدجمة مع األجيال احلديثة‬
‫من اهلواتف النقالة‪ ،‬وغري ذلك من األصناف املتعددة للحاسبات‪.‬‬
‫وجتب اإلشارة يف ختام هذا االستعراض التارخيي إىل أن ميكنة وحوسبة ِ‬
‫اخلطاطة‬
‫أساسا مع اخلطوط العربية‬ ‫العربية كانت كلتامها وما زالتا تتعامالن يف مسارمها الرئييس ً‬
‫املنتظمة‪ ،‬ونعني هبا تلك اخلطوط التي تنساب كتابتها يف اجتاه واحد؛ وهو االجتاه أفق ًّيا‬
‫من اليمني إىل اليسار‪ ،‬ويف نفس الوقت تسمح برسم أي نص عريب عرب انتقاء سلسلة‬

‫‪-28-‬‬
‫من الوحدات التي تنتمي إىل فئة مغلقة من الوحدات الرسومية «اجلرافيامت»‪ .‬ويف حني‬
‫أن هذا التعريف يستبعد اخلطوط الزخرفية‪ ،‬فإن إضافة الوضوح واملعيارية إليه جيعل‬
‫خطوط النسخ البسيطة (راجع الشكل رقم ‪ )5-1‬هي حمل الرتكيز األكرب هلذه الصناعة‪.‬‬

‫‪ -3‬حتديات ِ‬
‫اخلطاطة العربية التي تواجه التعرف عليها آل ًّيا‬
‫بعد االستعراض التارخيي لنشأة ِ‬
‫اخلطاطة العربية ثم ميكنتها وحوسبتها‪ ،‬نقوم فيام‬
‫اخلطاطة التي تشكل حتديات ينبغي عىل أي نظام‬ ‫ييل بالتدقيق يف بعض تفاصيل هذه ِ‬
‫ناجح للتعرف اآليل عىل النص العريب املكتوب أن يعاجلها بفعالية‪.‬‬
‫‪1.1‬اتصال احلروف‪ :‬يمكن كتابة اللغات األوروبية بحروف منفصلة (وهي السائدة‬
‫كثريا عند الكتابة‬
‫يف النسخ والطباعة لبساطتها) أو بحروف متصلة (وتستخدم ً‬
‫بخط اليد)‪ ،‬يف حني أن لغات أمم كربى يف أقىص رشق آسيا (كالصينية واليابانية‬
‫َط دائم باحلرف املنفصل‪ ،‬أما ِ‬
‫اخلطاطة العربية (ويشاركها يف ذلك‬ ‫والكورية) ُت ُّ ً‬
‫البنغالية واهلندية) ف ُت ْكتَب ً‬
‫دائم باحلرف املتصل‪.‬‬
‫ومن وجهة نظر أية آلية حاسوبية للتعرف عىل األنامط الرسومية‪ ،‬فإنه مع‬
‫تثبيت مجيع الظروف األخرى يكون التعرف عىل األنامط وهي منفصلة أيرس‬
‫من التعرف عليها وهي متصلة ببعضها البعض‪ ،‬حيث يتوجب يف حالة‬
‫االتصال حل مسألة تعيني حدود كل رمز رسومي «جرافيم» (وهو ما يطلق‬
‫عليه الباحثون يف هذا املجال اسم «التقطيع» (‪ ))segmentation‬إضاف ًة بالطبع‬
‫إىل مسألة «التعرف» (‪ )recognition‬عىل احلرف الذي يرمز إليه كل جرافيم‪.‬‬
‫وكام يمكن استشفافه من الشكل رقم (‪ )7-1‬أدناه‪ ،‬فإن التعرف الصحيح عىل‬
‫الرموز يتطلب تعيني حدودها بشكل سليم‪ ،‬ولكن تعيني هذه احلدود بدوره‬
‫يتطلب معرفة الرموز أوالً!‬
‫وهكذا‪ ،‬فإنه ال مفر من حل كلتا املسألتني («التعرف» و «التقطيع») آن ًّيا وهو‬
‫ما يضاعف التحدي‪ ،‬ويتناول أول أقسام املبحث الثالث من هذا الفصل املزيد‬
‫عن أساليب حتقيق ذلك‪ .‬بقي أن نؤكد ثاني ًة عىل أن اخلطوط العربية املنتظمة‬
‫حسب التعريف الذي أوردناه يف هناية القسم السابق هي تلك التي يمكن تعيني‬

‫‪-29-‬‬
‫حدود وفواصل واضحة بني جرافيامهتا بينام ال يمكن عمل ذلك مع اخلطوط‬
‫غري املنتظمة؛ مثل تلك الزخرفية (راجع شكل رقم ‪ 4-1‬أعاله)‪.‬‬

‫َّ‬
‫الشكل ‪ :7-1‬االتصال األفقي بني احلروف املتتالية يف خطوط النسخ وتعيني حدوده‪.‬‬

‫‪2.2‬التداخل بني حدود اجلرافميات‪ :‬مما يزيد من التحدي السالف عرضه يف‬
‫النقطة السابقة أننا نرى أحيانًا بعض التداخل (أو الرتاكب) الطفيف بني حدود‬
‫جرافيامت بعض اخلطوط العربية املنتظمة كام يمثل له الشكل رقم (‪ )8-1‬أدناه‪.‬‬

‫َّ‬
‫الشكل ‪ :8-1‬مثال عىل الرتاكب بني احلروف املتتالية‪.‬‬

‫‪3.3‬تغري رسم احلرف مع تغري موضعه يف الكلمة‪ :‬وهذا التغري هو بالطبع نتيجة‬
‫للكتابة متصلة احلروف‪ ،‬ويؤدي هذا التغري إىل زيادة كبرية عدد الرموز‬
‫الرسومية التي يتوجب أن يتعامل معها أي نظام للتعرف اآليل عىل النص‬
‫ال مع اللغات األوروبية التي ُتَط عند طباعتها عادة‬
‫العريب املكتوب باملقارنة مث ً‬
‫باحلرف املنفصل‪.‬‬
‫ومن وجهة نظر أية آلية حاسوبية للتعرف عىل األنامط الرسومية‪ ،‬فإنه مع تثبيت‬
‫مجيع الظروف األخرى يكون التعرف أكثر دقة كلام قلت عدد األنامط الرسومية‬
‫املختلفة والعكس بالعكس‪.‬‬

‫على ‪ ،‬العربية ‪ ،‬مع ‪ ،‬قطاع‬


‫َّ‬
‫الشكل ‪ :9-1‬مثال عىل اختالف رسم احلرف العريب مع اختالف موقعه من الكلمة‪.‬‬

‫‪-30-‬‬
‫‪4.4‬اجلرافيامت املركبة من أكثر من حرف واحد‪ :‬الكثري من خطوط النسخ‬
‫املستخدمة بكثافة يف ميكنة وحوسبة نسخ وطباعة الكتابة العربية (ومن بينها‬
‫ِ‬
‫اخلَ ُّط الذي كُت َ‬
‫ب به هذا الكتاب) حتتوي عىل العديد من اجلرافيامت املركبة من‬
‫حرفني أو ثالثة (والتي ال يمكن التعامل معها إال كوحدة رسومية واحدة)‪،‬‬
‫ويبني شكل رقم (‪ )10-1‬أدناه أمثلة عىل بعض هذه اجلرافميات املركبة‪.‬‬
‫وعالو ًة عىل ما أرشنا إليه يف النقطة السابقة‪ ،‬فإن هذه اجلرافيامت املركبة ترفع‬
‫عدد األنامط الرسومية التي يتوجب عىل أي نظام للتعرف عىل النص املكتوب‬
‫التعامل معها مما يرفع درجة الصعوبة‪ ،‬وإذا كانت ِ‬
‫اخلطاطة اإلنجليزية – عىل‬
‫جرافيم فإن العربية حتتاج‬
‫ً‬ ‫سبيل املثال ‪ -‬يف هذا الصدد قد تكتفي بحوايل ثامنني‬
‫إىل ما يزيد عىل مئة وتسعني‪.‬‬

‫َّ‬
‫الشكل ‪ :10-1‬أمثلة عىل جرافيامت مركبة من أكثر من حرف يف أحد خطوط النسخ‪.‬‬

‫‪5.5‬النَّ ْقط‪ :‬كلام كانت الفروق الشكلية بني األنامط الرسومية أكرب‪ ،‬فإنه مع تثبيت‬
‫مجيع الظروف األخرى ترتفع قدرة أي نظام للتعرف اآليل عليها‪ .‬وبام أن نسبة‬
‫كبرية من جرافيامت اخلطاطة العربية متشاهبة شكل ًّيا إىل حد بعيد وال تتاميز إال‬
‫بوجود أو غياب النقاط ‪ -‬أو اهلمزة يف بعض األحيان – فإن ذلك بالتأكيد يرفع‬
‫التحدي أمام أي نظام للتعرف اآليل عىل النص العريب املكتوب‪.‬‬

‫َّ‬
‫الشكل ‪ :11-1‬أمثلة عىل جمموعات احلروف العربية التي تتاميز بالنقاط‪.‬‬
‫‪6.6‬عالمات الضبط الصويت (التشكيل)‪ :‬تعترب عالمات التشكيل يف ِ‬
‫اخلطاطة‬
‫العربية تعقيدً ا إضاف ًّيا أمام أي نظام للتعرف اآليل عىل النص العريب املكتوب‬
‫وذلك ألهنا ال تقع يف سياق تسلسل أفقي مثل اجلرافيامت اهلجائية ولكنها يف‬
‫مواضع رأسية فوقها أو حتتها (كام يبني شكل رقم ‪ 12-1‬أدناه)‪.‬‬

‫‪-31-‬‬
‫ولذلك فإن مثل هذه األنظمة تتعامل مع عالمات التشكيل إما بمحاولة‬
‫مبكرا ثم حذفها قبل عملية التعرف عىل النص املكتوب‪ ،‬أو‬ ‫ً‬ ‫اكتشافها‬
‫نادرا ما تضاف إليها هذه‬
‫بتجاهلها عىل اعتبار أن الكتابة العربية املعارصة ً‬
‫العالمات إال ألغراض تعليمية أو عند اقتباس النصوص الدينية أو الرتاثية‪.‬‬

‫َّ‬
‫الشكل ‪ :12-1‬مثال عىل عبارة عربية بعالمات الضبط الصويت الكامل‪.‬‬

‫‪-32-‬‬
‫املبحث َّ‬
‫الثاني‬
‫اآللي‬
‫ّ‬ ‫عرف‬ ‫أنواع التَّ ُّ‬
‫بي املكتوب‬
‫َّص ال َع َر ّ‬‫على الن ّ‬

‫‪ -1‬تصنيف أنامط الكتابة ومتثيلها من منظور حاسويب‪.‬‬


‫‪ -2‬تطبيقات التعرف اآليل عىل النص العريب املكتوب‪.‬‬

‫‪-33-‬‬
-34-
‫‪ -1‬تصنيف أنامط الكتابة ومتثيلها من منظور حاسويب‬
‫ِ‬
‫ب ظروف‬ ‫«ر ْق َمن ُة(‪ )Digitization( »)1‬الكتابة ومن َث َّم متثي ُلها حاسوب ًّيا َح ْس َ‬
‫جتري َ‬
‫إنتاج الكتابة املستهدَ فة وذلك َو ْف َق املخ َّطط الذي يلخصه الشكل رقم (‪ )13-1‬أدناه‪:‬‬

‫َّ‬
‫الشكل ‪ :13-1‬تصنيف أنامط إنتاج الكتابة حسب التعامل معها حاسوب ًّيا‪.‬‬

‫تعقب حركة اليد أثنا َء مرور األصبع أو قلم خاص‬ ‫ُ‬ ‫فهناك الكتابة اليدوية حيث جيري‬
‫ٍ‬ ‫ٍ‬ ‫ِ‬
‫حلاسب َك ِّف ٍّي أم هات ًفا ذك ًّيا أم‬ ‫عىل لوح حساس ل َّل ْمس سواء أكان َ‬
‫لوح كتابة أم شاش ًة‬
‫حي ‪ ...‬إلخ‪ ،‬ويتم هذا التعقب عرب تعيني والتقاط املوضع النسبي لليد‬ ‫ٍ‬
‫حلاسب َل ْو ٍّ‬ ‫شاش ًة‬
‫تتابع هذه‬ ‫ِ‬
‫كل حلظة(‪ )2‬وإرسالا إىل ذاكرة احلاسب ويشكل ُ‬ ‫عىل اللوح احلساس لِ َّل ْمس َّ‬
‫الر ْق ِم َّي للكتابة اليدوية كام يبينه الشكل رقم (‪ )14-1‬أدناه‪ ،‬وهو ما‬ ‫َ‬
‫التمثيل َّ‬ ‫اللقطات‬
‫يسمح بتكوين «املنحنيات املناظرة ملسار الكتابة» (‪ )Writing Contours‬وهي املعلومة‬
‫األساسية يف عملية التعرف عىل هذه الكتابة‪.‬‬

‫‪ -1‬أي حتويلها من حالتها األصلية «التناظرية ‪ »Analog‬إىل احلالة «الرقمية ‪ »Digital‬من أجل إدخاهلا ومعاجلتها بواسطة‬
‫احلاسبات الرقمية‪.‬‬
‫ٍ‬ ‫ِ‬
‫‪ -2‬تستطيع التقني ُة احلالي ُة رصدَ عدة مئات من اللقطات ملوضع ال َّل ْمس عىل اللوح احلساس يف كل ثانية‪ ،‬وهو ما يضمن‬
‫ُ‬
‫تفاصيل حركة اليد‪.‬‬ ‫ال َس ِل ًسا للكتابة ال ُت ْف َقدُ فيه‬
‫متثي ً‬

‫‪-35-‬‬
‫الشكل ‪ :14-1‬مثال عىل رقمنة الكتابة اليدوية أثناء كتابة كلمة «العبارة»‬
‫َّ‬
‫ومتثل العقد الصغرية مواضع اليد عند اللحظات التي جرى تسجي ُلها‪.‬‬

‫ال بحروف متصلة كام يف الكتابة العادية‬ ‫وقد تكون الكتابة اليدوية تدوينًا مسرتس ً‬
‫احلرة (كام يف شكل رقم ‪ 14-1‬عالِ َيه) وهي احلالة األصعب يف التعرف عليها‪ ،‬أو تكون‬
‫ُ‬
‫ونتناول َب ْع َض‬ ‫جمرد حروف أو عالمات منفصلة وهي احلالة األيرس يف التعرف عليها‪،‬‬
‫التطبيقات املتصلة بكلتا احلالتني يف القسم التايل‪.‬‬
‫وعىل الناحية األخرى هناك الصفحات املحتوية عىل نصوص مكتوبة بالفعل‪،‬‬
‫حيث جيري حتويل ك ٍُّل من هذه الصفحات إىل «صورة رقمية» (‪ )Digital Image‬عرب‬
‫ؤخذ اآلن باملعيار األوسع َقبوالً‬ ‫جهاز «املاسح الضوئي» (‪ ،)Scanner‬ويف هذا الصدد ُي َ‬
‫لعملية املسح الضوئي بتباين أحادي اللون (باألبيض واألسود) وبتحليل طويل يساوي‬
‫(‪.)2‬‬
‫وصة املر َّبعة)‬
‫وصة(‪ )1‬طولية (أي ثالثمئة وستني ألف نقطة يف ال ُب َ‬
‫ستمئة نقطة يف كل ُب َ‬
‫وقد تكون الصفحة املمسوحة ضوئ ًّيا مكتوب ًة بخط اليد احلر سواء أكانت كتابة‬
‫مسرتسلة بحروف متصلة (كام يبني الشكل رقم ‪ 15-1‬أدناه مثاالً عىل ذلك) وهي‬
‫احلالة األصعب يف التعرف عليها‪ ،‬أو تكون جمرد حروف أو عالمات منفصلة وهي‬
‫األيرس يف التعرف عليها‪ ،‬ونأيت عىل ِذكْر بعض التطبيقات املتصلة بكلتا احلالتني يف‬
‫القسم التايل‪.‬‬

‫رتا تقري ًبا‪.‬‬


‫‪ -1‬البوصة تساوي ‪ 2.54‬سنتيم ً‬
‫‪ -2‬كان املعيار السابق هو ثالثمئة نقطة يف كل بوصة طولية (أي تسعني ألف نقطة يف البوصة املر َّبعة)‪.‬‬

‫‪-36-‬‬
‫َّ‬
‫الشكل ‪ :15-1‬مثال عىل الصورة الرقمية الناجتة عن املسح الضوئي لصفحة حتتوي عىل كتابة بخط‬
‫اليد‪ ،‬ومتثل حمتويات كل مربع صغري إحدى نقاط هذه الصورة الرقمية‬

‫وعىل الناحية األخرى قد يكون النص يف الصفحة املمسوحة ضوئيا مطبوعا (كام‬
‫يبني الشكل ‪ 16-1‬أدناه مثاالً عىل ذلك) ويتصاعد حتدي التعرف عىل النص عندما‬
‫تتعدد اخلطوط (األبناط) املستخدمة يف طباعته عام إذا كان مطبو ًعا بخط واحد فقط‪.‬‬

‫َّ‬
‫الشكل ‪ :16-1‬مثال عىل الصورة الرقمية الناجتة عن املسح الضوئي لصفحة حتتوي عىل نص‬
‫مطبوع‪ ،‬ومتثل حمتويات كل مربع صغري إحدى نقاط هذه الصورة الرقمية‬

‫كثريا من‬
‫وبصفة عامة فإن التعرف اآليل عىل النصوص املخطوطة يدو ًّيا أصعب ً‬
‫ُ‬
‫ونتناول َب ْع َض التطبيقات املتصلة بكلتا احلالتني‬ ‫التعرف عىل النصوص املطبوعة‪،‬‬
‫يف القسم التايل‪.‬‬

‫‪ -2‬تطبيقات التعرف اآليل عىل النص العريب املكتوب‬


‫تكتسب تقني ُة التعرف اآليل عىل النص عرب تع ُّقب حركة اليد أثناء الكتابة أمهي ًة‬
‫ُ‬
‫صناعي ًة جتاري ًة متعاظم ًة تتناسب مع االنتشار اهلائل لألجيال اجلديدة من اهلواتف‬
‫معظمها عىل شاشات حساسة لِ َّل ْمس وكذلك انتشار «احلاسبات‬ ‫ُ‬ ‫الذكية التي حيتوي‬
‫ال َّل ْوحية» (‪ )Tablet Computers‬ومجيعها ذات شاشات حساسة لِ َّل ْمس‪ ،‬وذلك‬
‫ال إىل استبعاد لوحة املفاتيح من تصميم هذه األجهزة واستخدام‬ ‫حيث أن هناك َم ْي ً‬
‫اللمس باألصابع أو بقلم خمصوص للتفاعل معها وإدخال البيانات إليها‪ .‬ويتفاوت‬
‫مرورا‬
‫ً‬ ‫التحدي يف التعرف عىل هذه البيانات بد ًءا من ملس أحد اخليارات املتعددة‪،‬‬
‫بكتابة جمرد عالمة أو حرف أو رقم منفصل‪ ،‬وصعو ًدا إىل الكتابة احلرة املسرتسلة‬
‫ويالحظ أن برجميات التعرف عىل هذه األنواع من البيانات غال ًبا‬ ‫َ‬ ‫بحروف متصلة‪.‬‬

‫‪-37-‬‬
‫دة للمستخدم متكنه من التحقق من صحة التعرف عىل‬ ‫مساع ٍ‬
‫ِ‬ ‫ٍ‬
‫أدوات‬ ‫ما حتتوي عىل‬
‫ما يكتبه والتدخل لتصويبه عند اللزوم‪ ،‬بل حتتوي نُوا ُة هذه الربجميات أحيانًا آلياتِ‬
‫َ‬
‫التعرف عليه من كتابة‬
‫ُ‬ ‫تدقيق إمالئي لتوجيه عملية التعرف أو لتصويب ما جرى‬ ‫ٍ‬
‫أدوات «لِلتَّك ُّيف» (‪)Adaptation‬‬
‫ٍ‬ ‫عربية مسرتسلة بحروف متصلة‪ ،‬كام أهنا تتضمن‬
‫بعض هذه األدوات لالرتقاء بأداء التعرف عىل‬ ‫كل أو ُ‬ ‫مع خط املستخدم‪ ،‬وتتعاضدُ ُّ‬
‫ِ‬
‫مستوى ُي ْرض املستخدم‪]8 ،7 ،4[ .‬‬ ‫هذا النوع من الكتابة إىل‬
‫ً‬
‫جتدر ‪ -‬إضاف ًة إىل ما سبق ‪ -‬اإلشار ُة إىل التطبيقات التعليمية والرتبوية هلذه‬ ‫ُ‬
‫و‬

‫الفئة من برجميات التعرف اآليل عىل النصوص حيث تُستخدَ م يف املساعدة عىل تع ُّلم‬
‫مثل هذه الربجميات‬ ‫كتابة اللغة للنشء أو للكبار أو عىل حتسني اخلط؛ حيث تعرض ُ‬
‫مسارات الكتابة اليدوية النموذجية ألمثلة من النصوص وتطلب من املستخدم أن‬
‫يتتبع هذه املسارات بقلم خمصوص يف يده عىل لوح حساس لِ َّل ْمس أثنا َء مرحلة‬
‫التدرب‪ ،‬كام ُي ْط َلب أثنا َء مرحلة تقويم األداء من املستخدم أن خيط عىل اللوح‬ ‫ُّ‬
‫بمقارنة مسارات الكتابة اليدوية‬‫َ‬ ‫الربجميات‬
‫ُ‬ ‫احلساس أمثل ًة نصي ًة‪ ،‬ومن َث َّم تقو ُم هذه‬
‫للمستخدم مع املسارات النموذجية لكتابة أمثلة التدريب أو تقويم األداء وبِنا ًء عىل‬
‫املقارنة ُيفا ُد املتعلم بالتصحيحات املطلوبة لتحسني أدائه [‪.]1‬‬ ‫َ‬ ‫نتيجة‬
‫أما عىل جانب تقنيات التعرف عىل الكتابة املسرتسلة يف الصفحات املمسوحة‬
‫ضوئ ًّيا سواء أكانت خمطوط ًة باليد أم مطبوعة‪ ،‬فإن التطبيق األسايس هلا هو العمل‬
‫عىل الرقمنة اآللية لرتاث البرشية الضخم من املواد النصية املوجودة بالفعل عىل‬
‫إنجاز تلك‬ ‫كثريا مما يستغرقه‬ ‫ٍ‬ ‫َ‬ ‫األوراق‬
‫ُ‬ ‫مقابل تكلفة مالية وزمنية وإدارية أقل ً‬
‫(‪)1‬‬

‫الرقمنة بأيادي جيوش من «الضاربني عىل لوحات املفاتيح» ( ‪ .)Typists‬وتوفر‬


‫رقمنة هذا الرتاث النيص مزايا كربى تتمثل يف‪:‬‬

‫ِ‬
‫«جوجل»؛ انظر‬ ‫‪ -1‬من أمثلة املرشوعات الكربى يف هذا الصدد «مرشوع رقمنة املليون كتاب» الذي تقوم عليه رشكة‬
‫املرجع رقم [‪ ]11‬من مراجع هذا املبحث‪.‬‬

‫‪-38-‬‬
‫باملقارنة مع تكلفة‬
‫َ‬ ‫‪1.1‬إمكانية املحافظة عىل الوثائق إلكرتون ًّيا بتكلفة ضئيلة جدًّ ا‬
‫حفظها ورق ًّيا(‪ ،)1‬وملدة أطول بكثري من عمر هذه الوثائق يف صورهتا الورقية‬
‫ٍ‬
‫ختزين‬ ‫ِ‬
‫وسيط‬ ‫يمكن أن تصل إىل ما شاء اهلل؛ حيث يمكن نقل الوثيقة من‬
‫إلكرتوين قدي ٍم إىل آخر جديد دون فقدان أي يشء من حمتوياهتا قبل انتهاء‬ ‫ٍّ‬
‫العمر االفرتايض للوسيط القديم‪ ،‬وباحتامالت ضياع متضائلة إىل ما شاء؛‬
‫حيث يمكن استنساخ الوثيقة إلكرتون ًّيا عد ًدا غري حمدود من املرات عىل وسائط‬
‫(‪.)2‬‬
‫ختزين متعددة ُ ْت َفظ يف أماكن خمتلفة‬
‫حتويل الوثائق إىل صور رقمية عرب مسحها ضوئ ًّيا ثم حتوي ُلها بعد‬
‫ُ‬ ‫‪2.2‬يؤدي‬
‫ذلك إىل نصوص رقمية عرب تقنيات التعرف اآليل عىل النصوص إىل إمكانية‬
‫وخصوصا‬
‫ً‬ ‫تشغيل تقنيات معاجلة النصوص عىل حمتويات هذه الوثائق‬
‫تلك التي تستخلص املعلومات وتستنبط املعرفة من األوعية النصية؛ ومن‬
‫«حمركات البحث النيص» (‪ )Text Search Engine‬و«اسرتجاع‬ ‫ِّ‬ ‫أمهها‬
‫ال عن «التنقيب املعلومايت‬ ‫البيانات» (‪ )Information Retrieval- IR‬فض ً‬
‫يف النصوص» (‪ )3()Text Mining‬وكذلك «تصنيف الوثائق» (‪Document‬‬
‫‪ )Classification‬و«تلخيصها» ‪ ،)Document) Summarization‬وقد‬

‫باي ْت حوايل مخسني‬ ‫‪ -1‬بأسعار هناية عام ‪1102‬م يتكلف القرص الصلب اخلارجي سعة ختزين واحد تِريا (مليون مليون) ِ‬
‫َ‬
‫يجا (مئة مليون) بايت لتخزينه بام فيه من صور‬ ‫ِ‬
‫دوالرا أمريك ًّيا وبافرتاض أن الكتاب متوسط احلجم حيتاج سعة مئة م َ‬
‫ً‬
‫بدرجة عالية اجلودة وبعمر افرتايض ال يقل عن مخس سنوات حتت ظروف قاسية‪ ،‬فإن هذا القرص يسع لتخزين‬
‫لعرشة آالف كتاب وهذا يعني أن الكتاب الواحد يتكلف نصف ِسنْت أمريكي‪ .‬وعىل اجلانب اآلخر فإن املرت املربع‬
‫دوالرا يف العام‬
‫ً‬ ‫السطحي يف غرفة مكتبة جمهزة عىل مستوى جيد يتكلف يف نفس التاريخ ما ال يقل عن مئتني ومخسني‬
‫ويسع ما ال يزيد عن ألف كتاب من نفس احلجم وهو ما يعني أن الكتاب الورقي يتكلف ختزينه ملدة مخس سنوات يف‬
‫حالة جيدة حوايل مئة ومخسة وعرشين سنتًا أمريك ًّيا أي مئتني ومخسني ضعف التكلفة اإللكرتونية‪ .‬هذا مع مالحظة‬
‫نظرا الحتياجها إىل جتهيزات خاصة حتافظ عىل مادهتا‬ ‫أن تكلفة احلفاظ عىل املخطوطات التارخيية تتجاوز ذلك بكثري ً‬
‫من البِ َل مع مرور الزمن‪.‬‬
‫‪ -2‬من اإلنصاف أن ننتب َه إىل قضية التحقق من «أصالة ‪ »Authenticity‬الوثائق الرقمية حيث ال توجد حتى اآلن ‪ -‬رغم‬
‫املرقمنة‬
‫َ‬ ‫األبحاث اجلارية عىل هذه املسألة ‪ -‬وسيل ٌة حاسمة للتأكد من عدم التالعب إلكرتون ًّيا بمحتويات الوثيقة‬
‫سوى املطا َبقة بجسم الوثيقة األصلية!‬
‫نصوصا أم سواها) إىل اكتشاف أنامط‬
‫ً‬ ‫‪ -3‬هتدف آليات التنقيب املعلومايت بصفة عامة يف أي وعاء للبيانات (سواء أكانت‬
‫التكرار واالرتباط السائدة بني مفردات هذه البيانات مما ينبئ عن احتامل قوي لوجود معلومة يعرب عنها هذا النمط أو‬
‫َب لذلك أدا ًة قوي ًة لتحويل البيانات (كامدة خام قليلة الفائدة) إىل معلومات (عالية القيمة)‪.‬‬
‫ذاك‪ ،‬وتُعت َ ُ‬

‫‪-39-‬‬
‫ُ ْت َمع ك ُُّل هذه التقنيات مع أدوات أخرى تقليدية إلدارة البيانات واملعلومات‬
‫ضمن أنظمة متكاملة ُيص َط َلح عىل تسميتها يف ْ‬
‫املج َمل « ُن ُظم إدارة الوثائق»‬
‫(‪.)Document Management Systems- DMS‬‬
‫بمكان فيام يتعلق برقمنة نصوص الوثائق أن نضع األداء البرشي‬ ‫ٍ‬ ‫‪3.3‬ومن األمهية‬
‫املقارنة بمستويات األداء الراهن لتقنيات التعرف اآليل عىل النصوص‬ ‫عىل حمك َ‬
‫العربية املكتوبة من الوثائق املمسوحة ضوئ ًّيا‪ .‬فالضارب املحرتف عىل لوحة‬
‫املفاتيح يستطيع يف املتوسط ن َْس َخ حوايل ستني كلمة عربية يف الدقيقة الواحدة‬
‫بمعدل خطأ للكلامت (‪ )Word Error Rate: WER‬ال يتجاوز الثالثة يف املئة‬
‫النزول بمعدل اخلطأ للكلامت إىل ما َ‬
‫دون‬ ‫ُ‬ ‫ٍ‬
‫يدوية‬ ‫ٍ‬
‫مراجعة‬ ‫كام ُي ْم ِك ُن من خالل‬
‫النصف يف املئة(‪ ،)1‬ومع متوسط أجور هلذا النوع من العاملة ‪ -‬بمعدالت هناية‬
‫والر ْين أمريكيني يف الساعة فإن التكلفة الزمنية‬ ‫عام ‪2011‬م ‪ -‬يبلغ نحو ُد َ‬
‫لرقمنة ألف كلمة بجودة عالية تكون يف حدود نصف ساعة عمل كام تكون‬
‫(‪.)2‬‬
‫دوالر ْين أمريكيني‬
‫َ‬ ‫التكلفة املالية لذلك يف حدود‬
‫أما تقنيات التعرف اآليل عىل النصوص؛ فإن التكلفة الزمنية ليست عائ ًقا‬
‫حيث يتكفل هبا ك ٌُّل من التسار ِع امل َّط ِرد لقدرات األجيال املتعاقبة من‬
‫«املعالات الدقيقة» (‪ )3()Microprocessors‬التي تُش ِّغل احلاسبات‬ ‫ِ‬
‫ِ‬
‫إمكانية َر ْفع رسعة التعرف عىل النصوص بالقدر املطلوب‬ ‫الرقمية‪ ،‬وكذلك‬
‫«املوزعة» (‪)Distributed Processing‬‬‫َّ‬ ‫أي من البِنَى املتعددة للحوسبة‬‫عرب ٍّ‬
‫«املتوازية» (‪ .)4()Parallel Processing‬كام أن التكلفة املالية كذلك‬ ‫ِ‬ ‫أو‬
‫ليست عائ ًقا حيث أنه مهام ارتفعت تكاليف البحث والتطوير والتشغيل‬

‫نسخها ‪ -‬سواء أكانت مطبوعة أم خمطوطة باليد ‪ -‬من التشوهات أو الشورشة‬ ‫‪ -1‬هذا بافرتاض ُخ ُل ِّو الوثيقة اجلاري ُ‬
‫البرصية العالية التي تؤدي إىل االلتباس يف قراءة املحتويات النصية هلا‪.‬‬
‫‪ -2‬هذا بافرتاض العمل عىل كميات ضخمة من النصوص ضمن خط إنتاج تتوازى فيه عمليتا النسخ واملراجعة‪.‬‬
‫ور ‪ »Moore’s Law‬وهو عبار ٌة عن استقراء عميل لواقع تطور احلواسيب مع الزمن‬ ‫‪ -3‬وذلك و ْف َق ما ُي ْع َرف «بقانون ُم ْ‬
‫معالة وختزين ‪ ...‬إلخ ‪ -‬مر ًة ك َُّل ثامنية عرش ً‬
‫شهرا تقري ًبا‪.‬‬ ‫َ‬ ‫وينص عىل تضاعف القدرات احلاسوبية ‪ -‬من‬
‫‪ -4‬وأ ًّيا كانت البِنْية املوزَّ عة أو املتوازية فإن املبدأ البسيط ورا َءها هو تشغيل حواسيب عديدة بدالً من حاسوب واحد فقط‬
‫من أجل االنتهاء من نفس املسألة يف زمن أقل‪..‬‬

‫‪-40-‬‬
‫ألي نظام ناجح للتعرف اآليل عىل النصوص‪ ،‬فإن تكلفة التعرف عىل كل‬
‫ألف كلمة تتضاءل باطراد يف تناسب عكيس مع إمجايل النصوص التي جرى‬
‫ال يف دقة التعرف هلذه النُّ ُظم؛‬
‫العائق احلقيقي متم ِّث ً‬
‫ُ‬ ‫ُ‬
‫التشغيل عليها‪ .‬ويبقى‬
‫ِ‬ ‫ِ‬
‫هوامش اخلطأ للكلامت املقيس َة‬
‫َ‬ ‫ُ‬
‫اجلـدول رقم (‪ )1-1‬أدناه‬ ‫حيث يعرض‬
‫تطويره من أنظمة التعرف اآليل عىل النصوص العربية‬ ‫ُ‬ ‫ألفضل ما جرى‬
‫ٍ‬
‫متدرجة من جودة الصورة املمسوحة ضوئ ًّيا‬ ‫ٍ‬
‫[‪ ]10 ،9 ،3‬يف ظل مستويات ِّ‬
‫ٍ‬
‫متدرجة من التنوع يف الوحدات الرسومية للكتابة‬ ‫ٍ‬
‫مستويات‬ ‫وكذلك يف ظل‬
‫«الرافِيامت»)؛ ومن الواضح أن هامش اخلطأ يتسع باطراد مع تصاعد‬ ‫(أي ِْ‬
‫مستوى «الشورشة» (‪ )Noise‬البرصية التي تشوب الصور كام يتسع هذا‬
‫اهلامش مع تزايد التنوع والتباين يف جرافيامت الكتابة‪.‬‬
‫‪4.4‬وتفيد الدراسات التي حللت أداء تقنيات استخالص املعلومات واستنباط‬
‫املعرفة ‪ -‬املشار إليها يف الفقرة ب عالِ َيه ‪ -‬عند تشغيلها عىل أوعية هبا «نصوص‬
‫معتبة من‬
‫َ‬ ‫متدهورة» (‪( )Degraded Text‬أي نصوص َم ِعيبة ذات نسبة‬
‫األخطاء) أن مردود هذه التقنيات يظل فعاالً إذا مل تتجاوز نسبة التدهور اخلمسة‬
‫عرش يف املئة [‪( ]5‬وترفع بعض الدراسات هذه النسب َة إىل عرشين يف املئة(‪ )1‬مع‬
‫مالحظة أنه بعد إجراء عملية استخالص املعلومات أو استنباط املعرفة التي‬ ‫َ‬
‫يطلبها املستخد ُم جيري عاد ًة َع ْر ُض الوثائق الواردة يف نتائج العملية املطلوبة عىل‬
‫هيئة الصورة الضوئية املمسوحة ‪-‬وت َُس َّمى نسخ ُة اال ِّطالع ‪ -‬وليس عىل هيئة‬
‫التعرف عليه آل ًّيا الحتوائه عىل نسب األخطاء يف‬
‫ُ‬ ‫النص الرقمي الذي جرى‬
‫الكلامت املشار إليها‪.‬‬
‫وعىل ذلك فإن احلاالت املظللة بالرمادي يف اجلدول هي فقط التي تصلح‬
‫لتطبيق تقنيات استخالص املعلومات واستنباط املعرفة عليها بفعالية‬
‫مقبولة‪.‬‬

‫مستويات خطأٍ عشوائية للكلامت‬


‫ِ‬ ‫بعض الباحثني أن أداء مثل تلك التقنيات قد ال ينهار بالكامل حتى‬
‫‪ -1‬يف حني يزعم ُ‬
‫تبلغ اخلمسني يف املئة!‬

‫‪-41-‬‬
‫نسخ ضوئي نسخ ضوئي مرتني‬ ‫صفحات‬ ‫طباعة ليزر أو‬
‫التنوع ‪ -‬اجلودة‬
‫ملرة واحدة أو صفحات جرائد‬ ‫ُكتُب‬ ‫وثيقة أصلية‬ ‫→‬ ‫↓‬
‫‪ó‬‬ ‫‪óó‬‬ ‫‪óóó‬‬ ‫‪óóóó‬‬
‫مطبوعة بخط واحد‬
‫حوايل ‪%15‬‬ ‫‪%8‬‬ ‫‪%3‬‬ ‫‪%2.5‬‬ ‫وحجم واحد‬
‫‪ó‬‬
‫مطبوعة بمختلف اخلطوط‬
‫أكرب من ‪%45‬‬ ‫‪%25‬‬ ‫‪%14‬‬ ‫‪%13‬‬ ‫واألحجام‬
‫‪óóó‬‬
‫بعد التدرب‬
‫عىل‬ ‫خمطوطة باليد «بعناية‬
‫أكرب من‬ ‫أكرب من‬
‫×‬ ‫ووضوح»‬
‫‪%75‬‬ ‫‪%50‬‬ ‫خط الكاتب‬
‫‪óóóóó‬‬
‫‪%25‬‬

‫اجلدول ‪ :1-1‬هوامش اخلطأ املقيسة يف أداء أفضل ما جرى تطويره ‪ -‬حتى هناية ‪2011‬م ‪ -‬من‬
‫أنظمة التعرف اآليل عىل النصوص املكتوبة يف صفحات ممسوحة ضوئ ًّيا‪ ،‬وذلك يف ظل ظروف‬
‫متدرجة من جودة الصور املمسوحة ضوئ ًّيا وكذلك التنوع يف جرافِيامت الكتابة‪.‬‬

‫جات التعرف اآليل عىل النصوص العربية املخطوطة باليد‬ ‫خمر ُ‬


‫‪5.5‬وبينام ال تزال َ‬
‫خارج إطار االستفادة من تقنيات استخالص املعلومات‬ ‫َ‬ ‫يف كل احلاالت‬
‫نظرا لالتساع الكبري يف هامش اخلطأ هبا‪ ،‬فإن تركيز األبحاث‬
‫واستنباط املعرفة ً‬
‫التطبيقية يف هذا الصدد يرتكز عىل إنجاز تطبيقات ضيقة النطاق؛ إما من جهة‬
‫البحث داخل ُن ُظم التعرف وتكفي‬
‫َ‬ ‫التقيد بحصيلة لغوية حمدودة جدًّ ا حترص‬
‫ملهام مثل التعرف عىل عناوين الربيد أو قوائم خمترصة بأصناف سلع ‪ ...‬إلخ‪،‬‬
‫أو من جهة التقيد بالرموز واألرقام والعالمات واحلروف املنفصلة يف مهام‬
‫مثل تصحيح االختبارات املوضوعية أو قيمة الصكوك النقدية (أي «الشيكات‬
‫‪ ... )»Checks/Cheques‬إلخ‪.‬‬

‫‪-42-‬‬
‫املبحث َّ‬
‫الثالث‬
‫َّص‬
‫اآللي على الن ّ‬
‫ّ‬ ‫أساليب التَّ ُّ‬
‫عرف‬
‫العربي املكتوب‬
‫ّ‬

‫‪ -1‬التعرف عىل النص املكتوب كأحد أنظمة التعرف عىل األنامط‪.‬‬


‫‪ -2‬أساليب التعرف عىل الكتابة العربية بتعقب خط اليد‪.‬‬
‫‪ -3‬أساليب التعرف عىل الكتابة العربية املطبوعة‪.‬‬
‫‪ -4‬أساليب التعرف عىل الكتابة العربية املخطوطة يدو ًّيا‪.‬‬
‫‪ -5‬بناء املوارد اللغوية لتدريب وتقويم أنظمة التعرف عىل الكتابة العربية‪.‬‬

‫‪-43-‬‬
-44-
‫‪ -1‬التعرف عىل النص املكتوب كأحد أنظمة التعرف عىل األنامط‬
‫تنتمي أنظمة التعرف اآليل عىل النص املكتوب إىل جمال أرحب من علوم احلاسبات‬
‫وضع‬
‫ُ‬ ‫التطبيقية أال وهو «التعرف اآليل عىل األنامط» (‪ ،)Pattern Recognition‬ويمكن‬
‫اهليكل الوظيفي هلذه النظم يف اإلطار العام املبني يف الشكل رقم (‪ )17-1‬أدناه [‪]6‬؛‬
‫حتويل «اإلشارات التناظرية» (‪ )Analog Signals‬املقابلة لألنامط املطلوب‬‫ُ‬ ‫حيث يتم‬
‫التعرف عليها (وهي النصوص املكتوبة‪/‬املخطوطة يف حالتنا هذه) إىل «إشارات‬
‫خالل القسم األول من املبحث السابق ‪ -‬ومن‬ ‫َ‬ ‫رقمية» (‪ - )Digital Signals‬كام ورد‬
‫«جتهيز ابتدائي» (‪ )Preprocessing‬هلذه اإلشارات‬‫ٌ‬ ‫َث َّم تزويدُ احلاسوب هبا‪ ،‬ثم جيري‬
‫مثل استبعاد بعض األنساق النمطية من الشورشة)‪ ،‬ثم يتم بعد ذلك‬ ‫الرقمية (وذلك ُ‬
‫استخالص بصامت هذه اإلشارات (أي جمموعة الصفات الرياضية املم ِّيزة هلا)‪.‬‬
‫ُ‬
‫ويمتاز بعد ذلك مسار التدريب حيث جيري بناء نامذج رياضية (إحصائية غال ًبا) من‬
‫بصامت اإلشارات املقابلة ألنامط عينات التدريب‪ ،‬ومن َث َّم جيري حفظ هذه النامذج‬
‫بكفاءة يف قاعدة بيانات الستدعائها يف إحدى آليات التصنيف التي تقرر أي األنامط‬
‫هي األقرب لإلشارات املقابلة لألنامط َ‬
‫املدخلة املراد التعرف عليها‪.‬‬
‫اإلطار نظرية «التعلم احلاسويب» (‪ )Machine Learning‬التي تُط َّبق‬
‫ُ‬ ‫ويعكس هذا‬
‫ُ‬
‫مقاربة املسائل التي ال ُي ْع َرف هلا أو حيث يتعذر احلصول‬
‫كأنسب ما يكون من أجل َ‬
‫«حلول بقواعد ُمْكَمة» (‪ ،)Closed-Form Solutions‬وتنبثق خمتلف أساليب‬ ‫ٍ‬ ‫هلا عىل‬
‫التعلم احلاسويب من مبدأ إمكانية التعلم عرب تكرار التعرض الغزير لكل من األمثلة‬
‫الصحيحة واألمثلة اخلاطئة أو عرب تكرار التعرض الغزير لألسئلة وأجوبتها حول‬
‫جزئيات املسألة املطلوب مقاربتُها؛ فالطفل مث ً‬
‫ال قد جييد قراءة النص املكتوب بلغته األم‬
‫قبل أن يتعلم أسس وقواعد اللغة وذلك عرب تقليد األكرب سنًّا وعرب حماوالت الصواب‬
‫وتكرارا‪.‬‬
‫ً‬ ‫مرارا‬
‫واخلطأ مع تصويب األخطاء حيث يتحسن األداء مع معاو َدة ذلك كله ً‬

‫‪-45-‬‬
‫َّ‬
‫الشكل ‪ :17-1‬اهليكل الوظيفي العام ألنظمة التعرف عىل األنامط وفق نظرية التعلم احلاسويب‪.‬‬

‫ويرتكز بصفة عامة تفعيل تلك األساليب رياض ًّيا وحاسوب ًّيا هلذا املبدأ عىل استقراء‬
‫السياق االحتاميل للكلامت وحروفها (املناظِرة لألنامط التي ندرسها يف هذا الفصل)‬
‫ف‬‫ِعو ًضا عن سياقها اللغوي ب ْغي َة الوصول إىل حساب االحتامل الريايض لوقوع كل تعر ٍ‬
‫ُّ‬ ‫ُ َ‬ ‫َ‬
‫ترجيح التعرف صاحب‬ ‫ِ‬ ‫ٍ‬ ‫ِ‬
‫ممكن للكلمة بني ما يسبقه وما يلحق به من كلامت ومن َث َّم‬
‫أعىل احتامل ريايض‪ ،‬وتستلزم عملية إجراء احلساب هذه تكوين نموذج احتامل ريايض‬
‫حياكي كل تتا ُبعات الوحدات اللغوية كام حتدث يف الواقع احلقيقي الستخدام اللغة‪.‬‬
‫وأ ًّيا ما كانت األساليب الرياضية واحلاسوبية املختارة لبناء مثل هذا النموذج‬
‫االحتاميل‪ ،‬فال ُبدَّ هلا من بيانات جتريبية غزيرة متأل وعا ًء واس ًعا من بصامت األنامط‬
‫(األسئلة) بالتوازي مع سالسل أكواد األنامط املقابلة هلذه البصامت (أجوبتها) وذلك‬
‫املوجه‪ ،‬و ُي ْط َلق عىل عملية تشغيل هذه األساليب الرياضية‬
‫مثلام يقتيض التعلم احلاسويب َّ‬
‫اس َم «التدريب» (‪)Training‬‬
‫عىل حمتويات هذا الوعاء من أجل بناء النموذج االحتاميل ْ‬
‫وي» (‪،)Language Resource‬‬ ‫كام ُي ْط َلق عىل حمتويات هذا الوعاء اسم « َم ْو ِرد ُل َغ ّ‬
‫وبطبيعة احلال فإن النموذج االحتاميل سوف حيمل اخلصائص اإلحصائية للمورد‬
‫اللغوي الذي َتك ََّو َن منه‪ ،‬والذي عليه بدوره أن حيمل اخلصائص اإلحصائية والسياقية‬
‫لألنامط الذي يعرب عنها كام سنتعرض إليه يف القسم اخلامس من هذا املبحث‪.‬‬
‫أي نظام ب َع ْينه للتعرف عىل األنامط عام سواه ضمن‬
‫املكونات الثالث التي متيز َّ‬
‫ِّ‬ ‫و ُت َعدُّ‬

‫‪-46-‬‬
‫هذا اإلطار هي تلك التي تقوم باستخالص بصمة اإلشارة‪ ،‬وببناء نامذج رياضية‬
‫لألنامط‪ ،‬وبالتصنيف اآليل للبصامت املستخلصة من أجل تقرير أقرب األنامط املقابلة‬
‫هلا‪.‬‬
‫املقاربات‬
‫َ‬ ‫وسوف ُي ْل ِمح ك ٌُّل من األقسام الثالثة التالية باختصار إىل أنجح‬
‫املستخدَ مة(‪ )1‬لتنفيذ ك ٍُّل من هذه املكونات الثالث يف كل حالة من احلاالت الثالث‬
‫الرئيسية لتقنيات التعرف عىل الكتابة كام صنفها القسم األول من املبحث السابق‪.‬‬

‫‪ -2‬أساليب التعرف عىل الكتابة العربية بتعقب خط اليد‬


‫العقدين املاضيني يف التعامل مع هذه املسألة عرب‬ ‫خالل ِ‬
‫َ‬ ‫ُ‬
‫أفضل النتائج‬ ‫حتققت‬
‫ِ‬
‫املعالات الرياضية وفق إحدى منهجيتني [‪]12 ،1‬؛ منهجية «نامذج ماركوف املخف َّية»‬ ‫َ‬
‫سنعرج عليه يف القسم التايل‪ ،‬وكذلك‬ ‫ِّ‬ ‫(‪ )Hidden Markov Models: HMM‬وهي ما‬
‫منهجية «الشبكات العصبية االصطناعية» (‪ )Artificial Neural Networks‬التي تستلهم‬
‫آليات عمل اخلاليا العصبية احلقيقية من حيث االستثارة واالستجابة وارتباطاهتا م ًعا يف‬
‫كل من هذه الشبكات العصبية االصطناعية بدور الدا َّلة (أي‬ ‫شبكات كثيفة حيث تقوم ٌّ‬
‫العالقة) الرياضية التقريبية التي تربط بني املدْ َخالت (وهي هنا احلروف) إىل الظاهرة‪/‬‬
‫النظام‪/‬العملية َق ْيدَ الدراسة (وهي هنا عملية الكتابة العربية بتعقب خط اليد) وبني‬
‫املرقمنة ‪ -‬كام ورد توصي ُفها يف‬
‫َ‬ ‫املالحظات املرصودة نتيج َة هذه العملية (وهي الكتابة‬
‫(‪.)2‬‬
‫كميات مشتق ٌة منها)‬
‫ٌ‬ ‫القسم األول من املبحث السابق ‪ -‬و‪/‬أو‬
‫و ُي ْع َرف العديدُ من أنواع هذه الشبكات العصبية االصطناعية التي تالئم ٌّ‬
‫كل منها طائف ًة‬
‫معينة من املسائل من تلك التي يتعــذر احلصول هلــا علــى «حلول رياضية بقــوانيـن‬

‫املقاربات ختصيص عرشات الصفحات لتفاصيل فنية يتطلب رشحها الكثري‬ ‫مقاربة من مثل تلك َ‬ ‫‪ -1‬يتطلب استيفاء كل َ‬
‫من الرياضيات املتقدمة‪ ،‬وهو ما ال يتسع له املجال يف هذا املقام‪ ،‬وسوف نحيل القارئ املهتم هبذه التفاصيل إىل املراجع‬
‫املختصة بذلك‪.‬‬
‫‪ -2‬نحيل القارئ املهتم بالتفاصيل الرياضية واهلندسية بمحاكاة الشبكات العصبية واستخداماهتا يف التعلم احلاسويب إىل‬
‫الورقة التعليمية اآلتية‪:‬‬
‫‪Jain, A.K., Jianchang Mao, Mohiuddin, K.M., Artificial Neural Networks: A Tutorial, IEEE‬‬
‫‪.Computer Magazine, pp. 31–44, Mar. 1996‬‬
‫‪http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=485891‬‬

‫‪-47-‬‬
‫ُمْكَمة» (‪ ،)Closed Form Solutions‬ويمكــن استخدا ُم هذه الشبكات للربط يف‬
‫كــال االجتــاهني بني املدخـــالت وما تــؤدي إليه من مالحظــات مرصــودة ‪ -‬أي‬
‫احلصــول عىل إحدى املجموعتني بمعلومية املجموعة األخرى ‪ -‬وبالطبع فإن الربط‬
‫العكيس هو األداة املستخدَ مة للتعرف عىل حروف الكتابة املقابلة ملا لدينا من منحن ٍ‬
‫َيات‬
‫مر ْق َم ٍنة مت ِّثل تعقب خط اليد أثناء الكتابة‪ .‬وبطبيعة احلال فإن ذلك كله يتطلب عملية‬
‫املدخالت بالتوازي مع ما يناظرها من‬ ‫تدريب للشبكة املستخدَ مة عىل كميات كبرية من َ‬
‫مالحظات مرصودة وهو ما سنعرض إليه يف القسم اخلامس من هذا املبحث‪.‬‬

‫‪ -3‬أساليب التعرف عىل الكتابة العربية املطبوعة‬


‫بتتبع األبحاث اجلادة التي جرت خالل العقدين املاضيني ‪ -‬العقد األخري من القرن‬
‫العرشين والعقد األول من القرن احلادي والعرشين ‪ -‬فإن تلك التي أثمرت أفضل‬
‫النتائج يف التعامل مع مسألة التعرف اآليل عىل الكتابة العربية املطبوعة [‪]11 ،7 ،5‬‬
‫ِ‬
‫املخف َّية»‬ ‫ُوف‬
‫مارك ْ‬ ‫َ‬
‫املعالات الرياضية القائمة عىل «نامذج ْ‬ ‫اشرتكت يف أهنا تستخدم‬
‫(‪ )Hidden Markov Models‬التي تسعى رغم اختالف تنويعاهتا إىل استنباط «تسلسل‬
‫املدخالت» (‪ )Inputs Sequence‬األرجح احتامل ًّيا (املجهولة لدينا) الذي يؤدي‬ ‫َ‬
‫عرب الظاهرة‪/‬النظام‪/‬العملية َق ْيدَ الدراسة (عملية طباعة الكتابة يف حالتنا هذه) إىل‬
‫(‪.)1‬‬
‫«تسلسل املالحظات» (‪( )Observations Sequence‬املعلومة لدينا)‬

‫َّ‬
‫الشكل ‪ :18-1‬النافذة املنزلقة يف اجتاه الكتابة عىل سطور الصورة املمسوحة ضوئ ًّيا‪.‬‬

‫‪ -1‬نحيل القارئ املهتم بالتفاصيل الرياضية واهلندسية لنامذج ماركوف ِ‬


‫املخف َّية إىل الورقة التعليمية اآلتية‪:‬‬
‫‪Rabiner, L.R., A Tutorial on Hidden Markov Models and Selected Applications in Speech‬‬
‫‪.Recognition, Proceedings of the IEEE, Volume 77 - No. 2, pp. 257–286,‬‬ ‫‪Feb. 1989‬‬

‫‪-48-‬‬
‫حروف الكلامت‬
‫َ‬ ‫ترميزات («أكواد»)‬‫ِ‬ ‫َ‬
‫املدخالت يف حالتنا هذه‬ ‫ُ‬
‫تسلسل‬ ‫ويناظر‬
‫ٍ‬ ‫ُ‬
‫تسلسل «مت ََّجهات»‬ ‫تسلسل املالحظات فهو‬ ‫ُ‬ ‫املطبوعة املراد التعرف عليها‪ ،‬أما‬
‫بعض خصائص املحتوى الرسومي داخل «نافذة‬ ‫(‪ )Vectors‬يصوغ ٌّ‬
‫كل منها رياض ًّيا َ‬
‫منزلقة» (‪ )Sliding Window‬عىل سطور الصورة املمسوحة ضوئ ًّيا واملر ْق َمنة اجلاري‬
‫التعرف عليها كام يف الشكل رقم (‪ )18-1‬أعاله‪.‬‬
‫املخف َّية بقدرهتا عىل َف ْصل‬ ‫ِ‬ ‫وبينام متتاز املعاجلات املرتكزة عىل نامذج ماركوف‬
‫جرافيامت الكتابة العربية املتصلة مع التعرف عىل هذه اجلرافيامت يف آن واحد‪ ،‬فإن‬
‫مفتوحا للباحثني تتفاوت‬ ‫ً‬ ‫تصميم متجه خصائص التعرف كان ‪-‬وال يزال‪ -‬اجتها ًدا‬
‫ُص َو ُر ُه بني تصميامت بسيطة مثل عدد ال ُب َقع املتصلة يف النافذة الرأسية املنزلقة فوق‬
‫«سطر الكتابة املعياري» (‪ )1( )Baseline‬مع عدد البقع املتصلة َ ْتتَه‪ ،‬وبني تصميامت‬
‫أعمق رياض ًّيا مثل حساب «ال ُع ُزوم القياسية الالمتغرية» (‪)Invariant Moments‬‬
‫التصميم املختار فإن هناك‬ ‫ُ‬ ‫للمحتوى الرسومي للنافذة‪ ]11 ،8 ،7 ،5[ .‬وأ ًّيا كان‬
‫معايري للحكم عىل مدى جودة خصائص التعرف عىل الكتابة ن ُْج ِملها فيام ييل‪:‬‬
‫‪1.1‬رضورة أن يكون عدد املركِّبات يف متجه خصائص التعرف حمدو ًدا‪.‬‬
‫‪2.2‬رضورة أن يكون هذا العدد املحدود من املركِّبات يف متجه خصائص التعرف‬
‫ثابتًا‪.‬‬
‫‪3.3‬احلرص عىل أن يكون عدد املركِّبات يف متجه خصائص التعرف أقل ما يمكن‪.‬‬
‫‪4.4‬احلرص عىل قابلية حساب ك ُِّل مركِّبات متجه خصائص التعرف بكفاءة‪.‬‬
‫‪5.5‬احلرص عىل أن تبقى تسلسالت متجهات خصائص التعرف املناظِرة لنفس‬
‫جرافيامت الكتابة ثابت ًة قدر اإلمكان برغم أي اختالفات يف أشكال هذه‬
‫اجلرافيامت من حيث األبناط واألحجام‪ ،‬أو بسبب بعض التشوهات األخرى‬
‫مثل امليل املحدود يف سطور الكتابة أثناء مسحها ضوئ ًّيا أو احتواء الكتابة عىل‬
‫بعض الشورشة املحدودة‪.‬‬

‫‪ -1‬وهو السطر األفقي الرمادي يف الشكل (‪ )81-1‬أعاله‪.‬‬

‫‪-49-‬‬
‫وبينام يؤدي الفشل يف حتقيق الرشطني األول والثاين مبارش ًة إىل تعذر تطبيق أية‬
‫املخف َّية ‪ -‬وكذلك أية أساليب أخرى للتعلم‬ ‫ِ‬ ‫معالات قائمة عىل نامذج ماركوف‬ ‫َ‬
‫احلاسويب عىل وجه العموم ‪ -‬فإن حتقق الرشطني الثالث والرابع رضوري إلنتاج‬
‫أنظمة واقعية للتعرف عىل الكتابة املطبوعة ذات تكلفة حاسوبية معقولة من حيث زمن‬
‫التشغيل ومساحات التخزين‪ ،‬أما حتقق الرشط اخلامس فهو مفتاح التمكن من التعرف‬
‫عىل الكتابة العربية املطبوعة رغم تعدد أبناط وأحجام الكتابة‪.‬‬

‫‪ -4‬أساليب التعرف عىل الكتابة العربية املخطوطة يدو ًّيا‬


‫باملقارنة مع‬
‫َ‬ ‫بسبب زيادة التنوع وعدم االنتظام يف رسم الكتابة املخطوطة يدو ًّيا‬
‫الكتابة املطبوعة‪ ،‬فإن هوامش اخلطأ يف أداء أنظمة التعرف عىل الكتابة العربية املخطوطة‬
‫مقارن ًة هبوامش اخلطأ يف أداء أنظمة التعرف عىل‬‫كثريا َ‬
‫رب ً‬ ‫يدو ًّيا هي بطبيعة احلال أك ُ‬
‫الكتابة العربية املطبوعة‪ .‬ومع ذلك‪ ،‬فإن أفضل املحاوالت التي جرت خالل العقدين‬
‫املاضيني للتعرف عىل الكتابة العربية املخطوطة يدو ًّيا اشرتكت يف ارتكازها عىل‬
‫عرض ُه‬ ‫ُوف ِ‬
‫املخف َّية بأسلوب مشابه ملا جرى ُ‬ ‫مارك ْ‬ ‫َ‬
‫املعالات الرياضية القائمة عىل نامذج ْ‬
‫يف القسم السابق‪.]14 ،13 ،10[ .‬‬

‫ِ‬
‫املوارد اللغوية لتدريب وتقويم أنظمة التعرف عىل الكتابة العربية‬ ‫‪ -5‬بناء‬
‫يتضح من األقسام السابقة يف هذا الفصل أن األساليب السائدة واألكثر نجاع ًة حتى‬
‫وقتنا هذا للتعامل مع مسائل التعرف اآليل عىل الكتابة العربية بتنويعاهتا املختلفة هي‬
‫أساليب التعلم احلاسويب بأصنافها املتعددة‪ ،‬وكام جاء يف ختام القسم الثامن من باب‬
‫«التحليل الرصيف اآليل ملفردات اللغة العربية» من هذا الكتاب فإن كل هذه األساليب‬
‫يستلزم تفعي ُلها تكوي َن نامذج احتاملية رياضية حتاكي كل تتابعات جرافيامت الكتابة‬
‫العربية كام حتدث يف الواقع احلقيقي لنصوص اللغة وذلك ُب ْغي َة املساعدة يف اختيار تتابع‬
‫اجلرافيامت الذي حيقق أعىل احتامل ريايض يف سياق التعرف عىل أشكاهلا املخطوطة أو‬
‫املطبوعة‪.‬‬

‫‪-50-‬‬
‫ومن أجل بناء تلك النامذج الرياضية فال ُبدَّ من مادة لغوية متأل وعا ًء واس ًعا من‬
‫األسئلة (وهي يف حالتنا هذه الكتاب ُة املر ْق َمنة مطبوع ًة كانت أم خمطوط ًة) بالتوازي مع‬
‫أجوبتها (النص العريب املناظِر هلذه الكتابة املرقمنة) لتغذية أساليب «التعلم احلاسويب‬
‫املوجه» (‪ ،)Supervised Machine Learning‬و ُي ْط َلق عىل عملية تشغيل هذه‬ ‫َّ‬
‫األساليب الرياضية عىل املادة اللغوية من أجل بناء النامذج االحتاملية الرياضية اسم‬
‫«التدريب» (‪ )Training‬كام ُي ْط َلق عىل الوعاء املمتلئ بتلك املادة اللغوية اسم «املورد‬
‫اللغوي» (‪ ،)Language Resource‬وبطبيعة احلال فإن النامذج االحتاملية سوف حتمل‬
‫اخلصائص اإلحصائية للمورد اللغوي الذي َتك ََّونَت منه‪ ،‬والذي عليه بدوره أن حيمل‬
‫خصائص النصوص العربية املكتوبة الذي يعرب عنها‪.‬‬
‫ُ‬
‫التمثيل‬ ‫ِ‬
‫املوارد اللغوية يشرتط إضاف ًة إىل الدقة العالية أن جيري‬ ‫ولذلك فإن بناء هذه‬
‫بصورة متوازنة ملختلف أبعاد التنوع يف الكتابة مثل؛ أبناط الطباعة وأحجامها‪ ،‬أو‬
‫اخلطوط اليدوية لل ُكتَّاب ‪ ...‬إلخ‪.‬‬
‫ففي حالة أنظمة التعرف عىل الكتابة العربية بتعقب خط اليد يتكون املورد اللغوي‬
‫من الكتابة العربية املر ْق َمنة ‪-‬كام جاء توصي ُفه يف القسم األول من هذا الفصل‪ -‬بالتوازي‬
‫مع النص العريب الصحيح املقابل له‪ ،‬وتكون املحاذاة بني هاتني املر ِّك َبت َْي عىل مستويني؛‬
‫تقسيم‬
‫ُ‬ ‫أوالمها عىل مستوى «الرضبات املتصلة بالقلم» (‪( )Strokes‬ويناظر ذلك‬
‫العبارة السابقة التي حتتها خط إىل‪ :‬ا ‪ ،‬لرض ‪ ،‬با ‪ ،‬ت ‪ ،‬ا ‪ ،‬ملتصلة ‪ ،‬با ‪ ،‬لقلم)‪ ،‬وثانيهام عىل‬
‫مستوى الكلامت العربية الكاملة‪.‬‬
‫أما يف حالة أنظمة التعرف عىل الكتابة العربية املطبوعة فإن املورد اللغوي يتكون من‬
‫َر ْقمنة صفحات الكتابة العربية املمسوحة ضوئ ًّيا ‪ -‬كام جاء توصي ُفه يف القسم األول من‬
‫هذا الفصل ‪ -‬بالتوازي مع النص العريب الصحيح املقابل له‪ ،‬وتكون املحاذاة بني هاتني‬
‫املر ِّك َبت َْي عىل مستوى الكلامت العربية الكاملة وكذلك عىل مستوى السطور يف كل‬
‫أدوات براجمي ٌة للتقسيم اآليل لكل صفحة مطبوعة‬ ‫ٌ‬ ‫َخدَ م‬‫صفحة‪ ،‬ولذلك الغرض ت ُْست ْ‬
‫املوضح أدناه‪ ،‬وعىل اللغويني القائمني عىل‬
‫إىل كلامت وسطور كام هو مبني يف الشكل َّ‬
‫التحقق من صحة هذا التقسيم اآليل وتصويبه عند اللزوم‪.‬‬ ‫ُ‬ ‫بناء هذه الذخرية اللغوية‬

‫‪-51-‬‬
‫نموذج عىل نواتج تعيني حدود الكلامت العربية الكاملة وحدود السطور بصورة آلية‬
‫ٌ‬ ‫َّ‬
‫الشكل ‪:19-1‬‬
‫اعتام ًدا عىل التوزيع التكراري لنقاط الصفحات املر ْق َمنة‪.‬‬

‫كثريا بنا ُء املوارد اللغوية ألنظمة التعرف عىل الكتابة العربية املخطوطة يدو ًّيا‬
‫ويتشابه ً‬
‫مع تلك املتعلقة بأنظمة التعرف عىل الكتابة العربية املطبوعة مع مالحظة أن عمليات‬
‫التقسيم اآليل للصفحات إىل كلامت وسطور ثم تصويب هذا التقسيم بل وتفسري‬
‫النصوص يف الصفحات املخطوطة يدو ًّيا تستغرق من اللغويني عم ً‬
‫ال ووقتًا أكرب‪.‬‬
‫ُيشكِّل بنا ُء ِ‬
‫املوارد اللغوية الالزمة لتدريب أنظمة التعرف عىل الكتابة العربية بأنواعها‬
‫الثالثة؛ «بتعقب خط اليد» و«املطبوعة» و«املخطوطة يدو ًّيا» نسب ًة كبري ًة من أنشطة‬
‫واستثامرات البحث والتطوير يف هذه التقنيات‪ُ ،‬يقدِّ ُرها بعضهم بحوايل مخسني يف‬
‫كل من هذه‬ ‫املئة‪ ،‬وبسبب ضخامة احلجم وارتفاع دقة العنونة املطلوبتني أثنا َء بناء ٍّ‬
‫املؤهلني حاسوب ًّيا‬
‫املوارد فإن هذا النشاط يستدعي توظيف عدد من اللغويني العرب َّ‬ ‫ِ‬
‫إلنجازه عىل نحو ُم ْر ٍ‬
‫ض مما َن ُعدُّ ه أحد األهداف التي نرجو أن حيققها تأليف هذا‬
‫الفصل من هذا الكتاب‪.‬‬

‫‪-52-‬‬
‫ببليوجرافيا مرجع َّية‬
‫األول‬
َّ ‫املبحث‬
.1982 ،‫ َب ْغداد‬،1‫ ط‬،‫ف؛ ِدراس ٌة ُل َغ ِو َّي ٌة تارخي َّي ٌة‬ ِ ‫ رسم املصح‬:)‫احلمد (غانِم َقدُّ وري‬1.1
َ ْ ُ ْ َ ّ ََ
‫‏‬.‫م‬1998 ،‫ ِم ْص‬،‫ْج ّي‬ ِ ‫ مكتبة اخلان‬،»‫«الكتابة ال َعرب َّية‬
َ َ
ِ ‫اخلطاطة‬ ِ :)‫الدَّ ايل (عبد العزيز‬2.2
ِ ِ ْ ‫ب؛ َم ْولِدُ ُه و َت َط ُّو ُر ُه َحتَّى ال َع‬
،‫احلاض‬ ‫ص‬ ّ ِ ‫ َف ُّن اخلَ ِّط ال َع َر‬:)‫ ُد ْرمان ( ُم ْص َط َفى َأ ْغ َور‬3.3
.‫م‬1990 ،‫ إستانبول‬،1‫ ط‬،‫داو ّي‬ ِ ‫ صالِح ِس ْع‬:‫ت َْر َجة‬
ِ ِ
ّ ‫َطور الكتابة اخلَ ِّط َّية ال َع َرب َّية و َد ْو ُرها ال َّث‬
‫قايف‬ ُّ ‫ ن َْشـأة وت‬:)‫زي سال‬ ّ ‫فيفي ( َف ْو‬
ّ ‫ َع‬4.4
.‫ الك َُو ْيت‬،‫ ِوكال ُة املطبوعات‬،1‫ ط‬،‫واالجتامعي‬ ّ
5. Attia, M., Arabic Orthography vs. Arabic OCR; Rich Heritage
Chal-lenging a Much Needed Technology: http://multilingual.com/
issueDetail.php?issue=68, Multilingual Computing & Technology
magazine: www.Multilingual.com, USA, Dec. 2004.
‫املبحث ال َّثاين‬
1. Abdou, S., Fahmy, A., Hosney, I., Mostafa, I., Artificial Tutor for
Arabic Handwriting Training, The Proceedings of the 2nd Interna-
tional Conference on Arabic Language Resources and Tools, ISBN:
2-9517408-5-9; http://www.medar.info/conference_all/2009/index.
php, Cairo-Egypt, Apr. 2009.
2. Al-Badr, B., Mahmoud, S.A., Survey and Bibliography of Arabic
Optical Text Recognition, Elsevier Science, Signal Processing 41,
pp. 49-77, 1995.
3. Attia, M., Rashwan, M., El-Mahallawy, M., Autonomously Nor-
malized Horizontal Differentials as Features for HMM-Based Omni
Font-Written OCR Systems for Cursively Scripted Languages,
on IEEE Xplore at http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?
arnumber=5478619: The Proceedings of the IEEE International
Conference on Signal and Image Processing Applications (ICSI-

-53-
PA09) http://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp? punum-
ber=5472904, pp. 185 to 190, Kuala Lumpur - Malaysia http://
www.SP.ieeeMalaysia.org/ICSIPA09, Nov. 2009.
4. Attia, M., Arabic Orthography vs. Arabic OCR; Rich Heritage Chal-
lenging a Much Needed Technology http://multilingual.com/ issue-
Detail.php?issue=68, Multilingual Computing & Technology mag-
azine: www.Multilingual.com, USA, Dec. 2004.
5. Callan, J., Kantor, P., Grossman, D., Information Retrieval and
OCR: from Converting Content to Grasping Meaning, SIGIR con-
ference, 2003.
6. Duda, R.O., Hart, P.E., Stork, D.G., Pattern Classification, 2nd edi-
tion, John Wiley & Sons Inc., 2001.
7. Gouda, A.M., Arabic Handwritten Connected Character Recogni-
tion, PhD thesis, Dept. of Electronics and Electrical Communica-
tions, Faculty of Engineering, Cairo University, Nov. 2004.
8. Govindan, V.K., Shivaprasad, A.P., Character Recognition; a Re-
view, Pattern Recognition, Vol. 23, No. 7, pp. 671–683, 1990.
9. Jumari, K., Ali, M.A., A Survey and Comparative Evaluation of
Selected Off-Line Arabic Handwritten Character Recognition Sys-
tems, Jurnal Teknologi - Universiti Teknologi - Malaysia, 36(E)
June 2002: 1–18.
10. Lorigo, L.M., Govindaraju, V., Offline Arabic Handwriting Recog-
nition: A Survey, IEEE Transactions on Pattern Analysis and Ma-
chine Intelligence, Vol. 28, No. 5, pp. 712 to 724, May 2008.
11. St. Clair, G., Million Book Project vs. Google™ Print, Journal of
Zhejiang University SCIENCE (JZUS) http://www.zju.edu.cn/
jzus-China, ISSN 1009-3095, 2005-6A(11): pp. 1195-1200.

-54-
‫املبحث ال َّثالث‬
12. Abdelazim, H. Y., Malek, M., System and Method for Onscreen
Text Recognition for Mobile Devices, US Patent and Trademark
Office, Application No. US 12/196925 filed on Aug. 22nd 2008,
Publication No. US 2009/0055778 A1 published on Feb. 26th 2009.
13. Al-Badr, B., Mahmoud, S.A., Survey and Bibliography of Arabic
Optical Text Recognition, Elsevier Science, Signal Processing 41,
pp. 49-77, 1995.
14. Al-Ma’adeed, S., Elliman, D., Higgins, C.A., A Data Base for Ara-
bic Handwritten Text Recognition Research, IEEE Proceedings of
Frontiers in Handwriting Recognition, Nov. 2002.
15. Al-Ohali, Y., Cheriet, M., Suen, C., Databases for Recognition of
Handwritten Arabic Cheques, In the Proceedings of the Seventh
International Workshop on Frontiers in Handwriting Recognition,
Amsterdam, pp. 601-606, 11-13 Sept. 2000.
16. Bazzi, I., Schwartz, R., Makhoul, J., An Omnifont Open-Vocabulary
OCR System for English and Arabic, IEEE Transactions on Pattern
Analysis and Machine Intelligence, Vol. 21, No. 6, June 1999.
17. Duda, R.O., Hart, P.E.; Stork, D.G., Pattern Classification, 2nd edi-
tion, John Wiley & Sons Inc., 2001.
18. El-Mahallawy, M.S.M., A Large Scale HMM-based Omni
Front-Written OCR System for Cursive Scripts, PhD thesis, Dept.
of Electronics and Electrical Communications, Faculty of Engineer-
ing, Cairo Univ., Apr. 2008.
19. Gouda, A.M., Arabic Handwritten Connected Character Recogni-
tion, PhD thesis, Dept. of Electronics and Electrical Communica-
tions, Faculty of Engineering, Cairo University, Nov. 2004.

-55-
20. Govindan, V.K., Shivaprasad, A.P., Character Recognition; a Re-
view, Pattern Recognition, Vol. 23, No. 7, pp. 671–683, 1990.
21. Jumari, K., Ali, M. A., A Survey and Comparative Evaluation of
Selected Off-Line Arabic Handwritten Character Recognition Sys-
tems, Jurnal Teknologi - Universiti Teknologi - Malaysia, 36(E)
June 2002: 1–18.
22. Khorsheed, M. S., Offline Recognition of Omnifont Arabic Text Us-
ing the HMM Tool Kit (HTK), Pattern Recognition Letters – Elsevi-
er, Vol. 28, pp. 1563 – 1571, 2007.
23. Korb, J., Survey of Existing OCR Practices and Recommendations
for More Efficient Work, TELplus EC funded project; download-
able at: https://www.zotero.org/mchristy/items/itemKey/S5VCT-
FRT, July 2008.
24. Lorigo, L.M., Govindaraju, V., Offline Arabic Handwriting Recog-
nition: A Survey, IEEE Transactions on Pattern Analysis and Ma-
chine Intelligence, Vol. 28, No. 5, pp. 712-724, May 2008.
25. Mohamed, M., Gader, P., Handwritten Word Recognition Us-
ing Segmentation-Free Hidden Markov Modeling and Segmen-
ta-tion-Based Dynamic Programming Techniques, IEEE Transac-
tions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 5,
pp.548–554, 1996.
26. Strassel, S.M., Linguistic Resources for Arabic Handwriting Rec-
ognition, The Proceedings of the 2nd International Conference on
Arabic Language Resources and Tools, ISBN: 2-9517408-5-9, Cai-
ro - Egypt http://www.medar.info/conference_all/2009/index.php,
Apr. 2009.

-56-
‫الفصل َّ‬
‫الثاني‬
‫العربي املنطوق‬
‫ّ‬ ‫َّص‬ ‫ُم َ‬
‫عالة الن ّ‬

‫د‪ُ .‬م َّمد عفيفي‬

‫َّعرف اآل ّيل عىل الكالم‪.‬‬


‫األول‪ :‬الت ُّ‬
‫املبحث َّ‬
‫املبحث ال َّث ِان‪ :‬نظم حتويل ّ‬
‫النص إىل كالم‪.‬‬
‫املبحث ال َّثالث‪ُ :‬ن ُظم ال َّت َع ُّرف عىل ال ُّلغة وامل َت َك ِّلم‪.‬‬

‫‪-57-‬‬
-58-
‫املبحث األ َّول‬
‫اآللي على الكالم‬
‫ّ‬ ‫التَّعرف‬
‫ُّ‬

‫‪ -1‬مقدمة‪.‬‬
‫‪ -2‬مكونات نظم التعرف عىل الكالم‪.‬‬
‫‪ -3‬ملخص لبناء نظام للتعرف عىل الكالم‪.‬‬
‫‪ -4‬التعرف عىل الكالم يف ال ُّلغة العرب َّية‪.‬‬

‫‪-59-‬‬
-60-
‫‪ -1‬مقدمة‬
‫نظم التعرف اآل ّيل عىل الكالم هلا الكثري من التطبيقات املهمة يف خمتلف املجاالت‪.‬‬
‫ومن املعروف أن هذه النظم ‪ -‬وخاصة املعارصة منها ‪ -‬تعتمد عىل جمموعة من النامذج‬
‫اإلحصائية التي تعرب عن األصوات املختلفة يف اللغة التي يراد التعرف عليها؛ وبام أن‬
‫الكالم ‪ -‬كام تبني من الفصول السابقة ‪ -‬له بناء زمني وطيفي‪ ،‬بمعنى أن كل صوت من‬
‫األصوات هو عبارة عن تسلسل زمني لبعض املتجهات الطيفية‪ ،‬فإن نامذج ماركوف‬
‫املخف َّية (‪ )Hidden Markov Models -HMM‬تعترب من أهم (إن مل يكن أهم) النامذج‬
‫التي تُستخدم لبناء نامذج األصوات يف نظم التعرف عىل الكالم املعارصة‪.‬‬
‫ِ‬
‫املخف َّية‬ ‫إن أسس نظم التعرف عىل الكالم املعارصة ‪ -‬والقائمة عىل نامذج ماركوف‬
‫‪ -‬ظهرت يف سبعين َّيات القرن املايض يف جامعة «كارنيجي ميلون» (‪ )CMU‬األمريكية‪،‬‬
‫وكذلك يف رشكة «آي يب إم» (‪)IBM‬؛ ويف هذه األثناء كانت النامذج قائمة عىل استخدام‬
‫نامذج الكثافة املتقطعة (‪ ،)discrete density‬والتي رسعان ما تطورت معامل «بيل»‬
‫عرف بـ «الكثافة املتصلة» (‪ .)continuous density‬وكانت‬ ‫(‪ )Bell labs‬إىل استخدام ما ُي َ‬
‫األبحاث يف هذا الوقت تنصب عىل النظم ذات الكلامت املنفصلة من متكلم واحد‪ ،‬أو‬
‫النظم التي تتعرف عىل عدد حمدود من الكلامت (األرقام عىل سبيل املثال)‪ .‬ومع تسعين َّيات‬
‫القرن بدأ االهتامم بنظم الكالم املتصل التي ال تعتمد عىل املتكلم‪ .‬وكان الدافع الرئييس‬
‫هلذه األبحاث سلسلة من الربامج التي كانت متوهلا وكالة مرشوعات األبحاث الدفاعية‬
‫املتقدمة (‪ ،Defense Advanced Research Projects Agency (DARPA‬والتي‬
‫عملت عىل حتسني نسبة التعرف بالنسبة ألنواع خمتلفة من الكالم املتدرجة الصعوبة‪.‬‬
‫ومن املناسب يف هذا السياق أن نذك َُر أن اهتامم هذه اهليئة بتمويل أبحاث اللغة العربية‬
‫بدأ يف خالل العام ‪2003‬م‪ ،‬واستمر يف عدة مرشوعات بحثية أدت إىل حتسن كبري يف دقة‬
‫وسنتعرض لبعض هذه األمثلة يف هذا املبحث‪.‬‬
‫َّ‬ ‫التعرف عىل اللغة العربية؛‬
‫وحتقي ًقا للغاية من هذا املبحث سنبدأ برشح املكونات األساسية لنظم التعرف عىل‬
‫الكالم القائمة عىل نامذج ماركوف ِ‬
‫املخف َّية ‪ -‬وبالتحديد سنقوم برشح النظم التي تعتمد‬
‫سنتطرق إىل كيفية حساب معامالت هذه النامذج‬
‫َّ‬ ‫عىل نامذج (جاوس) البسيطة؛ كام‬
‫آل ًّيا من خالل إشارات الكالم‪ .‬وجيدر القول يف هذا السياق أن إمكانية حساب هذه‬

‫‪-61-‬‬
‫مناذجعلى مناذج‬ ‫علىتعتمد‬ ‫تعتمداليت‬‫اليت النظم‬ ‫النظمبشرح‬ ‫سنقوم‬
‫وابلتحديدبشرح‬ ‫كوف– املخفيَّة –‬
‫وابلتحديد سنقوم‬ ‫مناذج مارِ‬
‫املخفيَّة‬ ‫ماركوف‬ ‫مناذجعلى‬ ‫القائمة ًعلىالقائمة‬
‫خالل‬ ‫خاللًّامنمنخالل‬ ‫مناذجي‬
‫النماذجآليًّاآل‬ ‫معامالتهذههذه‬ ‫حساب‬ ‫كيفية‬ ‫إىل‬‫سنتطرقإىل‬ ‫البسيطة؛ ِ‬
‫على‬
‫تعتمديًّا من‬
‫النماذج‬ ‫النماذج آل‬ ‫اليت‬
‫معامالت‬‫النظم‬ ‫حسابح‬
‫سنقوم بشر‬
‫معامالت هذه‬ ‫كيفية‬
‫حساب‬ ‫وابلتحديد‬ ‫كماإىل– َّ‬
‫سنتطرقَّ‬
‫كيفية‬ ‫كماة‬
‫املخفقيَّ‬
‫سنتطر‬
‫َّ‬
‫كوف‬
‫البسيطة؛‬ ‫كما‬
‫جاوس)‬
‫مار‬ ‫جاوس)على( (مناذج‬
‫البسيطة؛)‬
‫جاوس‬ ‫(القائمة‬
‫املعامالتآليًّاآليًّاتحـعتحـُّدَع ُّد‬ ‫حسابيًّاهذههذه‬ ‫إمكانية‬ ‫أن‬ ‫السياقأن‬ ‫كيفيةيفيفهذاهذا‬ ‫وجيدرإىل القول‬ ‫الكالم‪.‬‬ ‫البسيطة؛اتكما‬
‫إشار‬
‫َ‬ ‫خاللُّد‬
‫املعامالتمنآليًّا تحـ َع‬
‫املعامالت‬ ‫حساب آل‬‫النماذج‬
‫إمكانيةهذه‬‫هذه‬
‫حساب‬ ‫معامالت‬ ‫إمكانية‬‫السياق‬ ‫حساب‬
‫القولالسياق أن‬ ‫وجيدر هذا‬ ‫سنتطرقيف‬
‫القولَّ‬ ‫الكالم‪.‬‬‫وجيدر‬ ‫ات‬ ‫ات) إشار‬
‫الكالم‪.‬‬ ‫جاوس‬
‫(إشار‬
‫مناقشة‬ ‫إمكانية ِ‬
‫كوف ِ‬
‫مناقشةأتيتأتيتمناقشة‬ ‫املعامالتد‬
‫املعامالتَع ُّ‬ ‫حساب‬
‫املعامالتأتيتآليًّا تحـ‬
‫حساب‬
‫املعامالت‬
‫هذهق‬
‫ومعطحرطحقحر‬
‫حساب‬
‫ح‬
‫حساب‬
‫ومع‬ ‫ة‪.‬ة‪.‬‬
‫ق‬
‫املخفيَّ‬
‫ر‬ ‫ط‬
‫ح‬‫املخفيَّ‬
‫ومع‬ ‫مارأن‬
‫كوف‬
‫ة‪.‬‬ ‫ي‬
‫َّ‬ ‫مارِ‬‫لنماذج‬
‫السياق‬
‫املخف‬ ‫لنماذج‬
‫كوف‬‫هذا‬ ‫النجاح‬
‫مار‬ ‫لنماذجيف‬
‫النجاح‬ ‫أسرأساررار‬
‫القول‬ ‫النجاح‬
‫أحدأهمأهم‬
‫وجيدر‬ ‫الكالم‪.‬‬
‫أحداتأهم أسر‬
‫أحدار‬ ‫إشار‬
‫حساب‬ ‫يبق‬ ‫ومعرتد ُر‬
‫يبر‬ ‫ِ‬ ‫ح‬ ‫كوفأرسارِ‬
‫كما‬ ‫النماذج؛كما‬ ‫النماذج؛‬ ‫كما‬‫مناقشة‬ ‫طُ‬
‫النماذج؛‬ ‫أثناءتد‬
‫أتيت‬ ‫ة‪.‬‬ ‫املخف َّي‬
‫املعامالت‬
‫أثناء‬ ‫ماركوف‬
‫االستعانة هبا‬
‫االستعانة تدهباريب‬ ‫حساب‬
‫أثناء‬
‫لنامذجيتم‬
‫االستعانةق هبا‬
‫النجاح‬
‫اليتاليتطححريتم‬
‫ومع‬ ‫ة‪.‬‬
‫‪)Objective‬‬
‫يتم)‬ ‫املخفيَّ‬
‫‪Objective‬‬ ‫أهم‬ ‫مار‬‫لنماذجأحد‬
‫‪function‬‬
‫‪ )Objective‬اليت‬ ‫‪function‬‬ ‫اهلدفا( ُت( َعدُّ‬
‫النجاح ًّي‬
‫اهلدفآل‬
‫املعامالت‬
‫دالة‬
‫دالةار‬
‫أحد أهم أسر‬
‫دالة اهلدف (‪function‬‬
‫بية‪.‬بية‪.‬‬ ‫أثناءالعر‬ ‫ابللغهباة‬
‫ابللغةالعر‬ ‫كما‬ ‫االستعانة‬
‫النماذج؛عىن‬ ‫يبيتم‬
‫تلكلَّ الَّيت ت‬ ‫التي‬
‫وخصوصا‬‫‪)Objective‬‬ ‫النظم –‬ ‫اهلدف (يتم‬
‫العمليةهلذههلذه‬
‫‪function‬‬ ‫التطبيقات‬ ‫بعضدالة‬ ‫مناقشة‬
‫لشرحبعض‬ ‫تأيتح‬ ‫املعامالتح‬
‫ض‬ ‫سنتعر‬
‫عىنربية‪.‬‬ ‫يتةتح حالع‬
‫تلك اابللغ‬‫يتارتًحعىن‬ ‫تد‬
‫أثناء الَّ ً‬
‫وخصوص‬ ‫وخصوصهبا–ا تلك‬
‫ً‬
‫النظم‬‫االستعانة‬ ‫–‬ ‫العملية‬
‫النظم‬ ‫اليت‬
‫هلذه‬‫التطبيقات‬
‫‪)Objective‬‬
‫العملية‬ ‫التطبيقات‬ ‫بعضلشر‬
‫‪function‬‬ ‫ض‬
‫ح‬ ‫اهلدفلشر(حَّ‬
‫سنتعر َّ‬ ‫ض‬
‫ح‬ ‫سنتعر‬
‫َّ‬
‫دالة‬
‫وخصوصا‬
‫ً‬ ‫النظمالع–ربية‪.‬‬ ‫هلذهابللغة‬ ‫العمليةعىن‬ ‫سنتعر ُض لرشح بعض التطبيقات‬
‫وخصوصا تلك الَّيت تح‬
‫ً‬ ‫العملية هلذه النظم –‬ ‫التطبيقات َّ‬ ‫تدريب النامذج؛ كام‬
‫ض لشرح بعض‬ ‫سنتعر ح‬
‫َّ‬
‫الكالم‬
‫علىالكالم‬
‫على‬ ‫التعرف‬ ‫نظم‬
‫العربية‪.‬‬
‫التعرف‬ ‫مكوانتباللغة‬ ‫‪ -‬ا َّل‬
‫‪-‬تي تُعنى‬ ‫تلك‪2‬‬
‫الكالم‬ ‫نظم على‬
‫التعرف‬‫مكوانت‬
‫مكوانت نظم‬ ‫‪2 -2‬‬
‫الكالم‬
‫الداخلة إىل سلسلة من املتجهات األكوستيكية‪ ،‬يطلق عليها –‬ ‫إشارةعلى‬
‫الكالم‬ ‫التعرف‬
‫نظمحتويل‬
‫‪ -2‬مكوانت يتم‬
‫يطلق عليها –‬ ‫عليها –‬ ‫األكوستيكية‪،‬‬ ‫املتجهات املتجهات‬
‫األكوستيكية‪ ،‬يطلق‬ ‫سلسلة من‬ ‫سلسلةإىلمن‬
‫الكالم‬ ‫الداخلة‬ ‫الكالمإىل‬
‫التعرف عىل‬ ‫الداخلة‬ ‫إشارة‬
‫نظم‬ ‫مكونات‬
‫الكالم‬ ‫إشارةحتويل‬ ‫‪-2‬يتم‬ ‫يتم حتويل‬
‫استنباط‬ ‫«‬ ‫العملية‬
‫العملية–‬ ‫هذه‬
‫هذه «عليها‬
‫يطلق‬‫وتسمى‬ ‫؛‬
‫األكوستيكية‪،‬‬ ‫املتجهات‬ ‫سلسلة من‬ ‫»‬ ‫مات‬ ‫ِ‬
‫الس‬
‫إىل‬ ‫ِ‬ ‫َّجهات‬
‫الداخلة‬ ‫ت‬ ‫م‬ ‫«‬
‫الكالم‬ ‫–‬ ‫إشارة‬ ‫ة‬ ‫عاد‬
‫عاد ًة ً‬
‫حتويلحمت‬
‫عادةًيتم – «‬
‫استنباط‬ ‫استنباط «‬ ‫وتسمى‬ ‫)‬‫‪feature‬‬ ‫‪vectors‬‬ ‫(‬
‫يطلق‬ ‫األكوستيكية‪،‬‬ ‫العملية‬ ‫وتسمى؛ هذه‬
‫املتجهات‬ ‫‪)feature‬‬
‫سلسلة من‬ ‫‪vectors‬‬
‫الداخلة إىل‬
‫‪)feature‬؛‬ ‫مات»‬
‫‪(vectors‬‬ ‫الس ّ‬
‫الكالم‬
‫إشارة» (ّ‬ ‫َّجهات‬
‫مات‬ ‫الس‬
‫ّ‬
‫َّجهات« حمت‬
‫حتويل حِ‬ ‫يتم–‬
‫الكلمات‬ ‫سلسلة‬
‫استنباط‬ ‫إجياد‬
‫وتسمى«‬‫مبحالةولة‬
‫العملية‬ ‫البحث‬
‫هذه‬ ‫ُمرك‬ ‫يقوم‬ ‫‪ُ،)،feature‬ث ُث‬ ‫مات»( (ِ‬ ‫عادة – «مِت ِ‬
‫الس‬
‫وتسمىولة‬ ‫يقوم؛‬ ‫مات« ُم»ت‬
‫الس ‪-‬‬‫َّجهاتعاد ًة‬
‫الكلمات‬ ‫سلسلة‬ ‫‪extraction‬‬
‫إجياد هذه‬
‫الكلماتالعملية‬ ‫سلسلة‬ ‫مبحاو‬
‫)؛‬
‫إجياد‬‫البحث‬
‫‪feature‬‬ ‫ُمرك‬
‫‪vectors‬مبحا‬
‫البحث‬ ‫‪)feature‬‬
‫ُمرك (‬
‫يقوم)امت»‬ ‫‪vectors‬‬
‫الس‬ ‫‪،)(extraction‬‬
‫َّجهاتُث ِّ‬
‫‪feature‬‬ ‫‪feature‬‬ ‫‪ّextraction‬‬‫مات‪»-‬‬ ‫الس ّ‬
‫عليها‬‫السًمات» (حّ‬‫ِ‬
‫تكون‪:‬‬ ‫َبيث‬ ‫املناظرة‪،‬‬ ‫ّ‬ ‫ِ‬
‫البحث الكلمات‬
‫بمحاولة إجياد‬ ‫إجياد سلسلة‬‫يقوملة حمرك‬‫البحثثممبحاو‬ ‫يقوم ُمرك‬
‫‪،)feature‬‬ ‫‪ُ ،)feature‬ث‬
‫‪extraction‬‬ ‫تكون‪(:‬‬
‫امت»‬ ‫َبيث‬
‫الس‬ ‫املناظرة‪،‬‬
‫«استنباط‬
‫‪extraction‬‬
‫تكون‪ِّ :‬‬ ‫َبيث‬ ‫السمات» (‬‫ّ‬
‫املناظرة‪،‬‬
‫الكلامت املناظرة‪ ،‬بحيث تكون‪𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 :‬‬ ‫تكون‪:‬‬ ‫سلسلة‬ ‫املناظرة‪َ ،‬بيث‬
‫(‪)1)(1‬‬ ‫‪w‬‬
‫‪̂w‬‬ ‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 ==‬
‫̂‬ ‫)‪p p(𝑤𝑤|y‬‬
‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎‬
‫)‪(𝑤𝑤|y‬‬
‫(‪)1‬‬ ‫‪𝑤𝑤w‬‬‫)‪̂𝑤𝑤= 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 p (𝑤𝑤|y‬‬
‫(‪)1‬‬ ‫𝑤𝑤‬
‫‪Bayes‬إىل‪:‬إىل‪:‬‬ ‫‪w‬‬‫̂‬
‫قاعدة‬ ‫=‬ ‫ابستخدام‬ ‫)‪p (𝑤𝑤|y‬‬
‫قاعدة‬ ‫رقم‪𝑤𝑤 )1)(1‬‬
‫ابستخدام‬ ‫املعادلةرقم (‬ ‫مامايتميتم تبسيط‬
‫املعادلة‬
‫‪Bayes‬‬ ‫ابستخدام قاعدة ‪ Bayes‬إىل‪:‬‬ ‫تبسيطرقم (‪)1‬‬ ‫ما يتم تبسيط املعادلة‬
‫إىل‪ Bayes:‬إىل‪:‬‬ ‫قاعدة‬ ‫باستخدام‬
‫‪Bayes‬‬ ‫قاعدة‬ ‫(‪)1‬‬ ‫املعادلة رقم‬
‫ابستخدام‬ ‫)‬‫‪1‬‬ ‫(‬ ‫رقم‬ ‫تبسيط‬
‫املعادلة‬ ‫تبسيطيتم‬ ‫ما يتم ما‬
‫(‪)2)(2‬‬ ‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎‬
‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎‬
‫‪)2( w‬‬ ‫‪̂w‬‬ ‫𝑤𝑤 ==̂‬ ‫‪w‬‬
‫)‪pp(y|w‬‬‫)‪(y|w)ppp(y|w‬‬
‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎‬
‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 =𝑤𝑤̂‬
‫)‪(w‬‬
‫)‪(w) p (w‬‬
‫(‪)2‬‬ ‫𝑤𝑤‬
‫الكلمات‪.‬‬ ‫من‬ ‫سلسلة‬ ‫أية‬ ‫إىل‬ ‫‪w‬‬‫=̂‬
‫شري‬ ‫وت‬ ‫الكلمات‪،‬‬ ‫سلسلة‪p‬‬
‫)‪(y|w‬‬ ‫تشري)‪(w‬إىل‪p‬‬
‫الكلامت‪.‬‬
‫الكلمات‪ .‬الكلمات‪.‬‬ ‫من‬
‫سلسلة من‬
‫سلسلةأيةمنسلسلة‬ ‫‪w‬‬
‫ُشري‪ ww‬إىل‬
‫شري‬‫ح‬ ‫ت‬‫ح‬‫و‬
‫وت‬ ‫منمن 𝑤𝑤‬
‫الكلامت‪،‬‬
‫الكلمات‪،‬‬ ‫من‬ ‫سلسلة‬
‫سلسلة‬ ‫أفضل‬
‫أفضل‬
‫أفضل‬ ‫‪w‬إىل‬ ‫‪̂w‬‬ ‫ُشري ̂‬‫شري‬ ‫‪ w‬تتح‬
‫إىل ح‬
‫سلسلة من الكلمات‪ ،‬وتحشري ‪ w‬إىل أية‬ ‫أفضل‬ ‫تحشري ̂‬
‫ِ‬
‫الكميَّة‬ ‫‪HMM‬و)ِ‬
‫‪)HMM‬‬ ‫اإلحصائي ِ(‬‫الكلمات‪.‬‬
‫اإلحصائي (‬ ‫من‬
‫األكوستيكي‬ ‫سلسلة‬
‫األكوستيكي‬ ‫أية‬
‫النموذج‬ ‫إىل‬
‫النموذج‬ ‫‪w‬‬ ‫شري‬
‫استخدام‬
‫استخدام‬ ‫وت‬ ‫الكلمات‪،‬‬
‫)‪ p p(y|w‬ح‬ ‫من‬ ‫سلسلة‬
‫الكمية‬
‫الكمية‬ ‫أفضل‬
‫ونحسب‬
‫وُنسب‬ ‫إىل‬ ‫تحشري ̂‬
‫‪w‬‬
‫الكميَّةّ‬
‫ّ‬ ‫و‬ ‫)‬‫‪HMM‬‬
‫الكميَّة‬ ‫(‬ ‫اإلحصائي‬ ‫األكوستيكي‬ ‫النموذج‬ ‫استخدام‬ ‫)‪(y|w‬‬ ‫الكمية‬ ‫وُنسب‬
‫نظامةللتعرف‬ ‫للتعرفو ِّ‬
‫وُنسب الكمية )‪ p (y|w‬استخدام النموذج األكوستيكي اإلحصائي (‪)HMM‬‬
‫يبني‬ ‫(‪)1-2‬‬ ‫والشكل‬‫اإلحصائي‪)1-2.‬‬
‫اللغوي‪ .‬والشكل (‬ ‫النموذج‬
‫باستخدام اللغوي‬
‫الكميةة )‪p (y|w‬‬ ‫والكم َّي‬
‫على‬ ‫يبني نظام‬ ‫اإلحصائي‬ ‫ستخدام النموذج‬ ‫وُنسب اب ِّ‬‫)‪p (w‬‬
‫الكميَّ‬
‫استخداميلي‪:‬النموذج األكوستيكي اإلحصائي (‪ )HMM‬و ّ‬
‫‪6666‬‬ ‫الكالم‪ ،‬والذي سيتم تفصيله فيما‬
‫عىل الكالم‪ ،‬والذي سيتم تفصيله فيام ييل‪:‬‬
‫‪66‬‬
‫‪66‬‬
‫النماذج اللغوية اإلحصائيَّة‬

‫الكلمات اليت مت التعرف عليها‬ ‫ِّ‬


‫سمات‬
‫متجهات ال ّ‬
‫حمرك البحث‬

‫النماذج األكوستيكية اإلحصائيَّة‬

‫الكالم‪.‬الكالم‪.‬‬
‫التعرف عىل‬ ‫توضيحي لنظام‬
‫التعرف على‬ ‫رسمرسم‬
‫توضيحي لنظام‬ ‫‪:1-2‬‬
‫كل‪:1-‬‬ ‫الش َّ‬
‫الش ‪2‬‬
‫َّكل‬

‫النموذج األكوستيكي‪ :‬كما هو معروف فإن أصغر وحدة صوتية هي الفونيم‪ .‬فعلى سبيل‬
‫‪-62-‬انقشنا الوحدات الصوتية للغة العربية يف‬
‫ب تتكون كالتايل ‪ ./k/a/t/a/b/a/‬وقد‬
‫املثال‪ ،‬كلمة َكتَ َ‬
‫الفصول السابقة‪ .‬لذلك فإن أي كلمة ُيكن متثيلها عن طريق ربط الفونيمات املكونة هلا كما‬
‫النموذج األكوستيكي‪ :‬كام هو معروف فإن أصغر وحدة صوتية هي الفونيم‪ .‬فعىل‬
‫َب تتكون كالتايل ‪ ./k/a/t/a/b/a/‬وقد ناقشنا الوحدات‬ ‫سبيل املثال‪ ،‬كلمة َكت َ‬
‫الصوتية للغة العربية يف الفصول السابقة‪ .‬لذلك فإن أي كلمة يمكن متثيلها عن طريق‬
‫ربط الفونيامت املكونة هلا كام يف املعجم النطقي‪.‬‬
‫ويمكن اعتبار النموذج الناتج هو النموذج األكوستيكي هلذه الكلمة؛ ومن اجلدير‬
‫بالذكر أن معامالت نامذج الفون املكونة ألي كلمة يتم حساهبا باستخدام ما يسمى‬
‫«بيانات التدريب» والتي تتكون من إشارات الكالم والكلامت املناظرة‪ .‬ويتم هذا‬
‫(‪.)1‬‬
‫التدريب يف مرحلة بناء النظام‬
‫النموذج اللغوي‪ :‬تتكون النامذج اللغوية ‪ -‬غال ًبا ‪ -‬عن نامذج (‪ ،)N-gram‬وهذا‬
‫النموذج يعطي احتامل ظهور كلمة ما مرشو ًطا عىل الكلامت ‪ 1-N‬السابقة‪ .‬فعىل سبيل‬
‫املثال‪ :‬فإن نموذج (‪ )2-gram‬أو (‪ )bigram‬حيسب احتامل ظهور كلمة الولد بعد كتب‬
‫(الولد|كتب)‪ ،p‬وباستخدام هذه النامذج يمكن حساب احتامل أي مجلة من اجلمل من‬
‫الناحية اللغوية‪ ،‬وسيتم تفصيل هذه النامذج الح ًقا‪.‬‬
‫وبعد حساب النموذجني ‪-‬األكوستيكي واللغوي ‪ -‬فإن برنامج ّ‬
‫فاك َّ‬
‫الشفرة‬
‫(‪ )decoder‬يمكنه حساب أرجح سلسلة من الكلامت املناظرة إلشارات الكالم‪ .‬ومن‬
‫اجلدير بالذكر أنه يف نظم التعرف ذات العدد الكبري من الكلامت فإن عمليات البحث‬
‫تتطلب قدرات حسابية عالية‪ ،‬ولذلك يلزم تطوير حمركات بحث ذات كفاءة عالية؛‬
‫وعليه فإن إجراء البحث عىل عدة مراحل باستخدام «تشبيكة» (‪ )lattice‬يعترب من‬
‫الطرق الواسعة االنتشار‪ ،‬وسيتم احلديث عن ذلك الح ًقا‪.‬‬

‫السامت (‪)Feature extraction‬‬


‫‪ -1.2‬استنباط ِّ‬
‫السامت خطوة أساسية هتدف إىل استنتاج املعلومات املهمة يف‬
‫تعد خطوة استنباط ِّ‬
‫إشارات الكالم‪ ،‬ويف نفس الوقت تقلل من فقد املعلومات‪ .‬وباإلضافة إىل استنباط‬
‫السامت هتدف ‪ -‬كذلك ‪ -‬إىل‬ ‫صورة مبسطة إلشارات الكالم فإن خطوة استنباط ِّ‬

‫رجى مالحظة أنَّنا ‪ -‬يف هذا الفصل ‪ -‬نستخدم كلمتَي «فون» و «فونيم» بدون متييز؛ مع التأكيد عيل وجود بعض‬
‫‪ُ -1‬ي َ‬
‫الفروق التقنية بني الكلمتني‪.‬‬

‫‪-63-‬‬
‫احلصول عىل متجهات ِسامت تناسب إىل حد كبري فروض النامذج األكوستيك َّية‪ .‬ومن‬
‫السامت يتم استخالصها كل عرشة ِم ِّيل ثانية من نوافذ طوهلا‬ ‫املتعارف عليه أن متجهات ِّ‬
‫يل ثانية‪ .‬ومن أشهر الطرق املستخدمة‪ :‬املعامالت (‪MFCC - Mel frequency‬‬ ‫‪ِ 25‬م ِّ‬
‫‪ ،)cepstral coefficients‬ويتم حساب هذه املعامالت عن طريق تطبيق «حتويل جيب‬
‫التَّامم امل َت َق ِّطع» (‪ )Discrete cosine transform‬عىل اللوغاريتم الطيفي‪ ،‬ويتم االستعانة‬
‫بمقياس ‪ Mel‬الالخطي ملضاهاة ترددات األذن‪ .‬وباإلضافة إىل ‪ MFCC‬فإن معامالت‬
‫التنبؤ اخلطي اإلدراكية (‪ )Perceptual Linear Prediction - PLP‬تقوم بتحويل‬
‫ِ ِ‬
‫تم) بعد تطبيق التحويالت الالخطية‬ ‫معامالت التنبؤ اخلطي املعروفة إىل معامالت (كبِ ْس َ‬
‫املرتبطة باإلدراك‪ .‬ومن املعروف أن ُمعامالت ‪ MFCC‬و ُمعامالت ‪ PLP‬تُعطي نتائج‬
‫النسبي ملعامالت ‪ PLP‬يف أوساط‬ ‫ّ‬ ‫متقاربة يف نظم التعرف عىل الكالم‪ ،‬مع بعض التَّم ُّيز‬
‫الضوضاء‪ .‬وباإلضافة الستخدام املعامالت التي تعرب عن الطيف إلشارات الكالم فإنه‬
‫من املعروف أن إضافة املشتقة األوىل واملشتقة الثانية هلذه املعامالت يستخدم عىل نطاق‬
‫واسع يف نظم التعرف عىل الكالم‪ .‬فعىل سبيل املثال‪ ،‬إذا كان التمثيل الطيفي يتكون من‬
‫ال من معامالت ‪ MFCC‬فإن املتجه النهائي يضيف املشتقة األوىل والثانية هلذه‬ ‫‪ 13‬معام ً‬
‫املعامالت ليصبح طول املتجه هو ‪.39=13*3‬‬
‫‪ -2.2‬النامذج األكوستيكية ونامذج ماركوف ِ‬
‫املخف َّية‬
‫كام ُذ ِك َر يف املقدمة‪ ،‬فإنه يمكن متثيل الكلمة كسلسلة من الفونات وتسمى هذه‬
‫السلسلة بالتمثيل الصويت للكلمة ويمكن احلصول عليها باستخدام قاموس صويت ويف‬
‫العموم يمكن أن يكون للكلمة الواحدة متثيالت صوتية متعددة تناظر طرق نطقها‪.‬‬
‫وأبرز مثال عىل ذلك يف اللغة العربية هو الترصيفات املختلفة للكلمة‪ .‬فعىل سبيل‬
‫َب أو ُكتُب‪.‬‬
‫املثال‪ ،‬فإن كلمة كتب يمكن نطقها َكت َ‬
‫ويتكون كل متثيل صويت عن طريق ربط عدد من الفونيامت‪ .‬فعىل سبيل املثال فإن‬
‫َب للكلمة كتب يمكن تكوينه عن طريق ربط الفونيامت املكونة‬ ‫التمثيل الصويت َكت َ‬
‫للتمثيل الصويت ‪.ka-ta-ba‬‬

‫‪-64-‬‬
‫ويتم متثيل كل فونيم بام يسمى نامذج ماركوف املخفية كام هو موضح يف الشكل‬
‫(‪.)2-2‬‬

‫الشكل ‪ :2-2‬متثيل الفونيامت باستخدام نامذج ماركوف ِ‬


‫املخف َّية‪.‬‬ ‫َّ‬

‫ويتكون النموذج مما ييل‪:‬‬


‫Ÿ Ÿعدد من احلاالت (‪ ،)states‬ثالثة يف الشكل‪.‬‬
‫Ÿ Ÿعدد من االنتقاالت (‪ .)transitions‬ولكل انتقال ما يعرف باحتامل االنتقال‪.‬‬
‫فمثال املعامل ‪ a12‬يعرب عن احتامل االنتقاالت من احلالة رقم ‪ 1‬إىل احلالة رقم‬
‫‪ .2‬ويكون جمموع احتامالت االنتقاالت التي خترج من حالة ما مساويا لواحد‪.‬‬
‫و ُي َب ِّي الشكل (‪ )2-2‬نموذج ماركوف من اليسار إىل اليمني (‪)left-to- right‬‬
‫الواسع االنتشار يف نظم التعرف عىل الكالم‪.‬‬
‫Ÿ Ÿنامذج املخرجات (‪ )output distributions‬لنامذج (جاوس) البسيطة الواسعة‬
‫االنتشار يف نظم التعرف عىل الكالم‪ .‬ويف هذه احلالة تكون معامالت النموذج‬
‫هي متجه املتوسط (‪ )mean vector‬ومصفوفة التَّبا ُين (‪Covariance‬‬
‫‪.)Matrix‬‬
‫السامت املناظرة لنموذج‬
‫ودون الدخول يف تفاصيل أكثر‪ ،‬فإننا إذا أعطينا متجهات ِّ‬
‫ما فإنه يمكن حساب معامالت االنتقال ومعامالت نامذج املخرجات باستخدام ما‬
‫اخللفي (‪ .)forward-backward‬وكذلك إذا أعطينا نامذج‬ ‫ّ‬ ‫األمامي‬
‫ّ‬ ‫يسمى اخلوارزم‬
‫السامت‪ ،‬فإنه يمكن حساب احتامل حدوث هذه املتجهات‬ ‫ما وجمموعة من متجهات ِّ‬
‫من النامذج‪.‬‬

‫‪-65-‬‬
‫ومما سبق فإنه إذا أعطينا حزمة من مجل التدريب فإنه يمكن أوتوماتيكيا حساب‬
‫كبريا‬
‫تغريا ً‬
‫معامالت الفونيامت املكونة هلذه اجلمل‪.‬ومن املعروف أن الفونات تتغري ً‬
‫بتغري الفونات املجاورة‪ ،‬فعىل سبيل املثال‪ :‬الفون (‪ )K‬يف كتب خيتلف عن الفون (‪ )K‬يف‬
‫سمك‪ ،‬وللتغلب عىل هذه الصعوبة يمكن استخدام نموذج لكل فون ً‬
‫أخذا يف االعتبار‬
‫الفونات املجاورة من اليمني واليسار‪ ،‬وتسمى هذه النامذج «تراي فون» (‪.)Triphone‬‬
‫وعىل الرغم أن هذه النامذج تعرب بشكل أدق عن الفونات‪ ،‬فإن عددها يصبح كبريا‬
‫جدا‪ .‬فعىل سبيل املثال إذا كان يف لغة ما ‪ 40‬فون‪ ،‬فسينتج لدينا ‪ 40‬نموذج فوين أو‬
‫نموذجا ثالثي الفونية‪ .‬وينتج عن هذا العدد صعوبة يف‬
‫ً‬ ‫أحادي الفونية و ‪40×40×40‬‬
‫حساب معامالت النامذج‪ ،‬ولذلك فإنه يتم ربط معامالت النامذج‪ .‬ففي املثال السابق‬
‫إذا ُو ِجدَ لدينا ‪ 40×40×40‬نموذج ثالثي الفونية‪ ،‬أي حوايل ‪ 64000‬نموذج‪ .‬يمكن‬
‫ربط هذه النامذج لعدد أقل ‪ -‬عىل سبيل املثال ‪ 5000‬نموذج‪ .‬ومع أن الربط فكرة جيدة‬
‫وتعطي فرصة املوائمة بني عدد النامذج وحجم حزمة البيانات املتوفرة يف التدريب‪،‬‬
‫يبقى السؤال عن كيفية الربط أو املشاركة يف املعامالت؛ ويتم هذا يف أغلب األحيان‬
‫عن طريق شجرة القرار‪.‬‬

‫شجرة القرار (‪)Decision Tree‬‬


‫يتم ربط أو مشاركة النموذج عادة عىل مستوى احلالة وليس النموذج؛ وتستخدم‬
‫شجرة القرار لتحديد أي احلاالت يتم ربطها‪ .‬ولكل حالة من كل فون ‪ q‬تكون هناك‬
‫شجرة ثنائية‪ ،‬وحتتوي كل نواة يف هذه الشجرة عىل سؤال عن جريان الفون‪.‬‬
‫ولربط النامذج املرتبطة بحال ‪ i‬يف فون ‪ q‬فإن كل احلاالت يف النامذج املناظرة املشتقة‬
‫من ‪ q‬يتم جتميعها عند جذر الشجرة‪ .‬واعتام ًدا عىل اإلجابة عىل السؤال عند كل نواة يتم‬
‫تقسيم احلاالت إىل قسمني حتى الوصول إىل أوراق الشجرة‪.‬‬
‫وتتشارك كل احلاالت الكائنة يف ورقة من األوراق يف املعامالت‪ .‬ويتم اختيار‬
‫األسئلة عند كل نواة من جمموعة مسبقة من األسئلة‪ .‬وعادة تكون هذه األسئلة مرتبطة‬
‫بجريان الفون‪.‬‬
‫فعىل سبيل املثال‪ ،‬تستخدم أسئلة مثل‪ :‬هل عىل يمني الفون صوت متحرك؟‬

‫‪-66-‬‬
‫وهكذا يتم اختيار السؤال الذي يعطي أعىل زيادة يف االحتامالت عند االنقسام‪ .‬يف‬
‫حالة استخدام نامذج جاوس األحادية يمكن حساب الزيادة يف االحتاملية من األعداد‬
‫واملتوسطات دون احلاجة إىل البيانات األصلية‪ ،‬ولذلك فإن عملية بناء الشجرة تتم‬
‫بشكل رسيع‪.‬‬
‫ملخص تدريب نامذج ماركوف‪:‬‬
‫Ÿ Ÿيتم اختيار نامذج أحادية الفون ابتدائية‪.‬‬
‫Ÿ Ÿيتم تدريب النامذج بتطبيق اخلوازمية األمامية ‪ -‬اخللفية لعدد من املرات‪.‬‬
‫Ÿ Ÿيتم نسخ كل فون ‪ q‬إىل ثالثي ‪ -‬فون ‪ ،x - q + y‬والذي ظهرت باعتبارها‬
‫حزمة يف حزم التدريب‪ .‬فعىل سبيل املثال‪ :‬إذا ظهر الفون ‪ )1000( q‬مرة فسيتم‬
‫نسخه إىل ‪ 1000‬نموذج‪.‬‬
‫يتم تدريب نامذج ثالث َّية الفون باستخدام خطوة مشاهبة‪ ،‬ولكن املشكلة أن بعض‬
‫هذه النامذج تظهر لعدد صغري جدا من املرات‪.‬‬
‫Ÿ Ÿيتم تطبيق خوارزم شجرة القرار بمشاركة النسخ يف عدد حمدود من النامذج‪.‬‬
‫Ÿ Ÿيتم تدريب النامذج الناجتة بشكل مماثل‪.‬‬

‫‪ -3.2‬النامذج اللغوية للنَّحو اإلحصائي (‪)N-gram‬‬


‫ِ‬
‫اإلحصائ ّي‬ ‫يتم حساب احتامل سلسلة من الكلامت باستخدام نامذج النَّحو‬
‫‪ N-gram‬حيث تكون ‪ N‬عادة يف حدود ‪.4-2‬‬
‫فض ُل استخدام مثال‪ .‬فلنأخذ اجلملة «لقد قامت الثورة‬ ‫ولتوضيح هذه النامذج ُي َّ‬
‫املرصية يف اخلامس والعرشين من يناير»‪ .‬وإذا أخذنا نظرة احتاملية للغة بام قد ال يروق‬
‫لبعض اللغويني ‪ -‬ولكنَّه عىل أي حال ما نقوم به يف نظم التعرف عىل الكالم‪ -‬فإن‬
‫احتامل كلمة اخلامس يف اجلملة السابقة يكون‪:‬‬
‫)‬
‫لقد قامت الثورة يف املرصية│اخلامس ‪P‬‬ ‫(‬
‫ويبسط نموذج النَّحو اإلحصائي ‪ N-gram‬املثال السابق باعتبار الكلامت ‪N-1‬‬
‫التي سبقت الكلمة‪ .‬ففي اجلملة السابقة إذا اعتربنا نامذج النَّحو ال ُّث ّ‬
‫الثي ‪ ،3-gram‬فإننا‬

‫‪-67-‬‬
‫نكتب االحتامل كام ييل‪:‬‬
‫)‬ ‫(‬ ‫)‬
‫املرصية يف│ اخلامس ‪ P‬أو الثنائي جرام يف│اخلامس ‪P‬‬ ‫(‬
‫ومن الواضح أنَّه بزيادة قيمة ‪ N‬يتم حتسني القدرة التنبؤية للنموذج؛ ولكن عىل‬
‫حساب‪:‬‬
‫Ÿ Ÿالقدرة عىل حساب االحتامالت‪.‬‬
‫Ÿ Ÿالكفاءة احلسابية للنامذج‪.‬‬
‫ويتم حساب نامذج (‪ )N-gram‬ببساطة شديدة فعىل سبيل املثال فإنه احتامل (املرصية‬
‫يف│ اخلامس) ‪ P‬يتم حسابه ببساطة كعدد مرات حدوث «املرصية يف اخلامس» مقسوما‬
‫عىل عدد مرات حدوث «املرصية يف» يف مدونة كبريه من النصوص‪ .‬ورغم بساطة هذه‬
‫الطريقة فإن املشكلة الواضحة بإن كثري من االحتامالت ستكون صفرية لعدم مشاهدهتا‬
‫يف مدونة النص‪ .‬ويتم التغلب عىل هذه املشكلة بام يسمى أسلوب اخلَ ْصم (‪)discount‬‬
‫والرتاجع (‪ )back-off‬ومنها عىل سبيل املثال طريقة (‪.)Kneser-Ney‬‬

‫‪ -4.2‬حمركات البحث‬
‫كام ُذ ِك َر يف مقدمة هذا الفصل فإن سلسلة أكثر الكلامت احتامالً يمكن حساهبا من‬
‫السامت عن طريق البحث يف أرجح سلسلة من احلاالت التي يمكن أن تكون‬ ‫متجهات ِّ‬
‫السامت طب ًقا للمعادلة رقم ‪2‬؛ ويمكن حل هذه املعادلة‬
‫قد أنتجت سلسلة متجهات ِّ‬
‫بكفاءة عن طريق الربجمة الديناميكية أو ما يسمى «خوارزم» (‪)Viterbi‬؛ وعند هناية‬
‫اجلملة يمكن حساب أفضل احتامل‪ .‬وإذا سجلنا أفضل اختيار عن كل حلظة‪ ،‬فإن‬
‫بإمكاننا الرجوع واحلصول عىل أفضل سلسلة من الكلامت‪.‬‬
‫وعىل الرغم من كفاءهتا‪ ،‬فإن طريقة خوارزم (‪ )Viterbi‬ال يمكن تطبيقها مبارشة‬
‫يف حالة وجود عدد كبري جدًّ ا من الكلامت‪ ،‬وخاصة مع نامذج لغوية طويلة‪ .‬وحلل هذه‬
‫املشكلة واحلصول عىل حمرك للبحث كفء‪ ،‬فقد ظهرت طرق عديدة‪ ،‬وسوف نعرض‬
‫هلذه الطرق دون الدخول يف تفاصيلها‪ .‬ويمكن برجمة خوارزم (‪ )Viterbi‬بكفاءة عن‬
‫الرموز» (‪.)Token passing‬‬ ‫طريق تطبيق ما يسمى «التقليم» (‪ )Pruning‬و«مترير ُّ‬

‫‪-68-‬‬
‫وتقوم الفكرة األساسية عىل أالَّ يتم حساب مجيع احلاالت الواقعة يف فضاء البحث‪،‬‬
‫ولكن يتم الرتكيز عىل احلاالت التي تقع يف نطاق الشعاع (‪ )beam width‬من أرجح‬
‫الرموز يمكن أن يؤدي إىل تطبيق ج ِّيد‬‫احلاالت‪ .‬وعىل الرغم من أن التقليم ومترير ُّ‬
‫خلوارزم (‪( )Viterbi‬يف بعض األحيان يمكن احلصول عىل نفس النتيجة بزيادة ‪٪2‬‬
‫من احلاالت الواقعة يف فضاء البحث) فإن األنظمة ذات العدد الكبري جدا من الكلامت‬
‫قد حتتاج إىل طريق أكثر كفاءة‪ .‬ونذكر عىل سبيل املثال الطرق التالية بدون الدخول يف‬
‫تفاصيلها‪.‬‬
‫يمكن استخدام البحث عن طريق العمق أوال (‪ ،)Depth first‬وهذه الطريقة يمكن‬
‫أن تؤدي إىل كفاءة شديدة للبحث‪ ،‬ولكن يلزم مقارنة مسارات ذات أطوال خمتلفة مما‬
‫ُي َص ِّعب من التحكم يف البحث‪ .‬ويمكن استخدام طرق تعتمد عيل املحوالت حمدودة‬
‫احلالة «‪ ،»finite state transducers‬وهذه الطرق تعرب عن كل املعلومات املطلوبة‬
‫للبحث‪ ،‬مثل قاموس النطق والنامذج األكوستيك َّية والنامذج اللغوية يف صورة هذه‬
‫املحوالت‪ ،‬ثم يتم دجمها‪ ،‬ومن ثم تطبيق خوارزمات للتحديد (‪،)determinization‬‬
‫وضغط (‪ )minimization‬املحول الناتج للوصول إىل حمول يمكن البحث فيه بكفاءة‪.‬‬
‫ومع أن حمركات البحث مصممة يف األساس للحصول عىل أفضل مجلة‪ ،‬فباإلمكان‬
‫احلصول عىل عدد ميم (‪ )M‬من اجلمل مرتبة حسب احتامليتها بتعديالت بسيطة‪،‬‬
‫ويمكن ختزين اجلمل الناجتة بصورة أكثر كفاءة يف ما يسمى «التشبيكة» (‪.)lattice‬‬
‫ومن املتعارف عليه يف البحث حاليا أن يتم استخدام حمركات البحث متكررة‪-‬‬
‫املرور (‪ .)Multiple - pass‬ويف هذه املحركات يتم البحث عىل عدة مراحل؛ ففي‬
‫املرحلة األوىل يتم البحث باستخدام نامذج أكوستيكية ولغوية بسيطة نسب ًّيا (عىل سبيل‬
‫املثال ثنائي ‪-‬جرام وثالثي‪ -‬فونات غري عابرة للكلمة) للحصول عىل (التشبيكة) ثم يتم‬
‫إعادة تقييم (التشبيكة) باستخدام نامذج أكثر تعقيدا (مثال الرباعي ‪ -‬جرام وغريها)؛‬
‫وتعترب هذه الطريقة وسيلة معروفة للحصول عىل كفاءة عالية للبحث بدون التخيل عن‬
‫الدقة‪ .‬وباإلضافة إىل (التشبيكة) فإنه يمكن التعبري عن احللول املتعددة باستخدام ما‬
‫يسمى شبكة االختالط (‪)confusion network‬؛ وهذه يمكن اعتبارها أكثر كفاءة من‬
‫(التشبيكة)‪ ،‬ولكن املسارات املتوازية فيها ال تعرب عن نفس الفرتة الزمنية‪ .‬وتستخدم‬

‫‪-69-‬‬
‫شبكات االختالط يف تطبيقات متعددة؛ عىل سبيل املثال دمج نتائج عدد من نظم‬
‫التعرف عىل الكالم‪ .‬ويسمى ذلك طريقة االنتخاب‪.‬‬
‫وبعد عرض طرق التدريب والبحث لنظم التعرف عىل الكالم‪ ،‬فإننا سنعرض‬
‫فيام ييل طريقة التدريب والبحث لبناء نظام التعرف عىل الكالم‪ ،‬ثم نتحدث ببعض‬
‫اإلسهاب عن بناء أنظمة التعرف عىل الكالم يف ال ُّلغة العربية‪.‬‬

‫‪ -3‬ملخص لبناء نظام للتعرف عىل الكالم‬


‫لبناء نظام حديث للتعرف عىل الكالم فإنه يلزم اآليت‪:‬‬

‫‪ - 1.3‬البيانات األكوستيكية (‪)Acoustic data‬‬


‫وتتكون من ملفات الكالم والنص املصاحب هلا‪ ،‬وعادة تتكون هذه امللفات من‬
‫عدة آالف من الساعات للحصول عىل الدقة املطلوبة‪ .‬ويمكن استخدام عدة مئات‬
‫من الساعات يف البداية ثم استخدام النظام الناتج للحصول عىل النص املناظر لبقية‬
‫البيانات‪.‬‬
‫يتم احلصول عىل البيانات األكوستيكية عىل النَّحو الوارد فيام سبق‪ .‬ويتم بناء‬
‫نامذج الفون‪ ،‬وعادة تستخدم نامذج ثالثية ‪ -‬الفون إيل سباعية الفون العابرة للكلامت‬
‫(‪ ،)Cross-word‬كام يتم استخدام شجرة القرار لربطها عىل النَّحو ا َّلذي سبق تفصيله‪.‬‬
‫ويف املرحلة األوىل يتم احلصول عىل معامالت النامذج عن طريق تعظيم االحتاملية‬
‫(‪ )Maximize the probability‬ثم تأيت الطرق التمييزية‪ ،‬وهي واسعة االنتشار يف‬
‫نتعر َض هلا يف هذا الفصل‪ ،‬ويمكن الرجوع إىل بعض‬ ‫النظم عالية الدقة؛ ولكننا لن َّ‬
‫املدرجة يف هناية الكتاب إذا أراد القارئ التعرف عىل هذه الطرق‪ .‬وتعترب حزمة‬
‫املراجع َ‬
‫الربامج ‪ HTK‬من أهم األدوات يف هذا الصدد‪.‬‬

‫‪ - 2.3‬البيانات اللغوية‬
‫وتتكون هذه البيانات من النصوص‪ .‬ويفضل أن تكون النصوص املستخدمة قريبة‬
‫جلمل التي سيتم التعرف عليها الحقا‪ .‬فللتعرف عىل األخبار ُيفضل استخدام‬
‫من ا ُ‬
‫نصوص مستقاة من األخبار ‪ -‬كالصحف أو املدونات‪ .‬وتعترب نصوص «جيجا وورد»‬

‫‪-70-‬‬
‫(‪ )Giga word‬من أشهر هذه النصوص‪ .‬وتستخدم البيانات اللغوية لبناء النامذج‬
‫اللغوية كام تم تفصيله فيام سبق‪ .‬وتعترب حزمة برامج (‪ )SRI tool kit‬من أهم األدوات‬
‫لبناء النامذج اللغوية‪.‬‬

‫‪ - 3.3‬البحث‬
‫بعد بناء النامذج األكوستيكية واللغوية يتم دجمها مع قاموس النطق لبناء فضاء‬
‫البحث‪ .‬وعند التعرف عىل الكالم فإنه يتم استكشاف فضاء البحث للوصول إىل أفضل‬
‫سلسلة من الكلامت‪ .‬ويف هذا الصدد ‪ -‬وكام ذكرنا سابقا ‪ -‬يستخدم عادة أحد حمركات‬
‫البحث متكررة املرور للوصول إىل أفضل احللول بكفاءة‪ .‬ونُشري إىل املحركات القائمة‬
‫عىل املحوالت حمدودة احلالة‪ ،‬ويمكن استخدام حزمة الربامج من ‪ AT&T‬هلذا الغرض‪.‬‬
‫ولكن حمركات البحث يف العموم ‪ -‬وخاصة ذات الكفاءة العالية ‪ -‬ال تتواجد‬
‫بشكل مفتوح (‪ ،)Open source‬ولكن يمكن استخدام حمرك البحث املوجود مع‬
‫‪ HTK‬كبداية لدراسة اجلانب العميل لتطوير حمركات البحث ذات الكفاءة العالية‪.‬‬
‫وتكمن أمهية الطرق السابقة يف أهنا تعمل ألي لغة وبشكل آ ّيل‪ ،‬وال حتتاج عىل األقل‬
‫نظر ًّيا ألي دراية باللغة‪ ،‬وربام يكون املكون الذي حيتاج إىل دراية باللغة يف هذه النظم‬
‫هو القاموس الصويت‪.‬‬
‫وعىل الرغم من ذلك فإن الدراية بلغة ما واستخدامها بشكل أو بآخر يمكن أن‬
‫يؤدي إىل حتسني نتائج التعرف عىل الكالم بشكل كبري؛ وفيام ييل سنتحدث باستفاضة‬
‫عن التعرف عىل الكالم يف ال ُّلغة العربية‪.‬‬

‫‪ -4‬التعرف عىل الكالم يف ال ُّلغة العرب َّية‬


‫نتحدث يف هذا اجلزء عن التعرف عىل الكالم يف ال ُّلغة العربية‪ .‬ومن حسن احلظ أن‬
‫اللغة العربية كانت حتوز اهتامم جمتمع الباحثني يف التعرف عىل الكالم خالل الفرتة من‬
‫‪ 2004‬إىل ‪ .2010‬وكان هذا متزامنا مع برامج (‪ )DARPA‬هلذا الغرض‪ .‬وتم بناء أنظمة‬
‫للتعرف عىل األخبار واملحادثات التلفونية وكذلك بعض اللهجات املحلية مثل العراقية‬
‫كبريا‪.‬‬
‫تطورا ً‬
‫ً‬ ‫والشامية‪ .‬وأدى هذا االهتامم لتطور نظم التعرف عىل الكالم العربية‬

‫‪-71-‬‬
‫وسنعرض ‪ -‬فيام ييل ‪ -‬لبعض خصائص اللغة العربية التي متَّت معاجلتها أثناء‬
‫األبحاث السابقة‪.‬‬

‫‪ - 1.4‬غياب التشكيل من النصوص العربية‬


‫من املعروف أن النصوص العربية احلديثة تُكتب بدون تشكيل‪ .‬فعىل سبيل املثال‬
‫َب» أو « ُكتُب» أو غريها‪ .‬ويمكن للقارئ يف‬ ‫فإن الكلمة «كتب» يمكن أن تكون « َكت َ‬
‫أغلب األحوال أن يستنتج النطق الصحيح من السياق‪ .‬ورغم أن هذه الطريقة واسعة‬
‫االنتشار فإهنا تشكل حتد ًيا لنظم التعرف عىل الكالم لصعوبة – أو ربام استحالة – احلصول‬
‫عىل نطق الكلمة دون وجود التشكيل‪.‬‬
‫يب فقد تم استخدام حروف الكتابة‪.‬‬ ‫ومع بداية االهتامم بنظم التعرف عىل الكالم العر ّ‬
‫َب»؛ ومع أن هذه الطريقة التي تعتمد‬ ‫ففي املثال السابق يكون نُطق كلمة «كتب» هو « َكت َ‬
‫‪/‬اجلرافيمي) قد‬
‫ّ‬ ‫عىل اجلرافيامت (‪( )Graphemes‬اجلرافيم هو وحدة التَّحليل الكتا ّ‬
‫يب‬
‫ساعدت عىل رسعة تطوير النظم‪ ،‬وخاصة بالنسبة لغري الناطقني بالعربية‪ ،‬فمن الواضح‬
‫أن ذلك يتم عىل حساب الدقة‪ .‬فنامذج الصوامت‪ ،‬مثل «ت» متتص احلركات الصغرية‪.‬‬
‫حرف َمدّ )‬
‫َ‬ ‫الصوائت‪ ،‬مثل «و» ختلط بني «و» احلر (ا َّلذي ُي َم ِّث ُل‬ ‫وكذلك فإن نامذج َّ‬
‫حرف لِني) مثل «دواء»‪ .‬ولبناء نامذج فونية‬ ‫َ‬ ‫مثل «نور» و «و» شبه املتحرك (ا َّلذي ُي َم ِّث ُل‬
‫للغة العربية فإنه جيب إضافة احلركات القصرية‪ .‬ويعترب حملل (‪ )Backwalter‬الرصيف‬
‫من أهم األدوات للقيام بذلك‪ .‬فعند إدخال عدد من الكلامت إليه فإنه يعطي لكل كلمة‬
‫(باإلضافة إىل خمرجات أخرى) كل طرق النطق املختلفة‪ .‬وعىل الرغم من أنه ال يمكنه‬
‫حتديد طريقة واحدة لكل كلمة يف البيانات األكوستيكية‪ ،‬فإنه يمكن بناء قاموس صويت‬
‫بطرق نطق متعددة‪ .‬وباستخدام هذا القاموس يمكن بناء نامذج أكوستيكية فونية‪.‬‬
‫ويف مقارنة بني نامذج اجلرافيم والنامذج الفونية للغة العربية الفصحى املعارصة‪.‬‬
‫(‪ُ )Modern Standard Arabic MSA‬و ِجدَ أن النامذج الفونية تعطي «تفو ًقا نسب ًّيا»‬
‫‪( ٪10‬جيب التنويه أن التفوق النسبي ‪ ٪10‬يعني أنه إذا كانت نسب اخلطأ لنامذج‬
‫اجلرفيم هي ‪ ٪20‬فإن نسبة اخلطأ لنامذج الفون تكون ‪ ٪18‬وليس ‪ .)٪10‬ومن املفيد‬
‫التنويه أيضا أن القواميس الصوتية كثيفة النطق ‪ -‬كام يف حالة التشكيالت العربية (يف‬

‫‪-72-‬‬
‫املتوسط حملل ‪ - )Backwalter‬تعطي حوايل ‪ 6‬تشكيالت خمتلفة لكل كلمة)‪ ،‬وعندها‬
‫ُيفضل استخدام ما يسمى احتامالت النطق (‪ ،)Pronunciation Probabilities‬والتي‬
‫يمكن استنتاجها ببساطة أثناء تدريب النظام‪.‬‬
‫ومن املفيد أن نلفت النظر إىل أن أي حملل رصيف قد يفشل يف حل بعض الكلامت‪،‬‬
‫خاصة الكلامت ذات األصول األجنبية أو التي ال توجد يف قاعدة بياناته‪ .‬ويف هذه احلالة‬
‫جيب إجياد تشكيل هذه الكلامت بطريقة ما سواء يدويا أو آل ًّيا؛ ومن املدهش أن بعض‬
‫أكثر النظم نجاحا يقوم بمزج الفونات مع اجلرافيامت للكلامت التي ال يوجد هلا تشكيل‪.‬‬
‫وعىل الرغم من تفوق النامذج الفونية للعربية الفصحى فإن تطبيقها للتعرف عىل‬
‫اللهجات املحلية‪ ،‬مثل‪ :‬العراقية‪ ،‬مل حيالفه النجاح؛ ويرجع ذلك يف الغالب إىل أن‬
‫املحلالت الرصفية ‪ -‬مثل ‪ - Buckwalter‬مصممة للتعامل مع اللغة الفصحى؛ وعادة‬
‫ما تؤدي إىل تشكيل خاطئ للكلامت العامية‪ ،‬وخاصة الشائعة؛ وسنعود إىل هذه النقطة‬
‫عند مناقشة التعرف عىل ال َّلهجات العامية‪.‬‬

‫‪ - 2.4‬البناء الرصيف للغة العربية‬


‫من املعروف أن اللغة العربية غنية رصف ًّيا‪ ،‬مقارنة باللغات األوروب َّية كاإلنجليزية‪.‬‬
‫فبإضافة السوابق واللواحق يمكن حتويل أي كلمة إىل عدد كبري من الكلامت‬
‫ذات الدالالت املختلفـة؛ فكلمة «سيكتبه» ‪ -‬عىل سبيـل املثـال ‪ -‬تكافئ احلملة‬
‫اإلنجليــزية «‪»He will write it‬؛ وألن تعريف «الكلمة» يف نظم التعرف هو سلسلة‬
‫متصلة من احلروف‪ ،‬فإن استخدام السوابق واللواحق يــؤدي إىل ظهور عدد كبــري‬
‫قاموسا مكونًا من ‪ 64‬ألف كلمة‬‫ً‬ ‫جــدا من الكلامت املختلفة‪ .‬وعىل سبيل املثال فإن‬
‫يكفي لتغطية ‪ ٪99‬من نصوص األخبار يف اللغة اإلنجليزية‪ ،‬بينـام نحتاج إىل عرشة‬
‫أمثال هذا العدد أي حوايل ‪ 600‬ألف كلمة للوصول إىل نفس النسبة يف اللغة العربية‪.‬‬
‫ويف احلالة العامة ال يمثل ذلك مشكلة إذا توفرت األدوات املناسبة لبناء فضاء البحث‬
‫وكذلك حمرك بحث ذو كفاءة عالية جدا للتعامل مع هذا العدد الضخم من الكلامت‪.‬‬
‫ويمكن عن طريق التحليل الرصيف ‪ -‬أو حــتى بعض الطرق البسيطة ‪ -‬فصل السوابق‬
‫واللواحق أو حـتى بعضها‪ ،‬ويؤدي هذا بطبيعة احلال إىل تقليص عدد الكلامت‪ ،‬وبالتايل‬
‫حتسني التغطية للنصوص؛ ولكنــه ال يؤدي بالرضورة إىل حتسني نسب التعــرف عىل‬

‫‪-73-‬‬
‫الكلامت‪ .‬ويمكن تفسري ذلك بأن فصل السوابق واللواحق يؤدي إىل تقليــص القدرة‬
‫التنبؤية للنامذج اللغوية‪ ،‬ألن السابق أو الالحق يف حـالة فصله يعد ككلمة منفصلة‪ ،‬يف‬
‫حني أن قـــدرته التنبؤية تكون ضعيفة للغاية (فالسابق «ال» ‪ -‬عىل سبيل املثال ‪ -‬يمكن‬
‫أن يأيت بعده عدد كبري جدا من األسامء يف اللغة العربية)؛ كمــا أن بقاء الكلمة كوحدة‬
‫متصلة يؤدي إىل نامذج أكوستيكية أكثر استقرار يسهل متييزها عن بقية الكلامت‪ ،‬ولكن‬
‫هذا ال ينفي أن التحليل الرصيف قد يكون مفيدا يف بعض احلاالت مثل عدم وجود‬
‫أدوات للتعامل مع فضاء بحث كبري جدا أو الرغبة يف بناء قاموس صغري نسبيا أو حتى‬
‫عدم وجود نصوص كافية للحصول عىل عدد كبري جدا من الكلامت‪ .‬مما سبق يتضح أن‬
‫اختيار القاموس جيب أن حيتوي عىل ُبعد جديد‪ ،‬وهو التحليل الرصيف‪ .‬ويف هذا اإلطار‬
‫جيب اإلجابة عن أسئلة مثل‪ :‬أي الكلامت ستخضع للتحليل الرصيف؟ وما هي السوابق‬
‫واللواحق التي سيتم اختيارها؟ وكيف يمكن بناء النامذج اللغوية يف هذه احلالة؟؛‬
‫ونعتقد أن اإلجابة عن األسئلة السابقة تعتمد عىل كمية البيانات املتاحة‪ ،‬وكذلك طبيعة‬
‫النظام املستهدف؛ وجيب إجراء جتارب للوصول إىل أحسن تصميم للقاموس‪.‬‬

‫‪ - 3.4‬التعرف عىل اللهجات العامية‬


‫باإلضافة إىل اللغة الفصحى املعارصة التي تستخدم يف الكتب والصحف ووسائل‬
‫اإلعالم‪ ،‬فإن للغة العربية هلجات عامية ِ‬
‫(دارجة) خمتلفة‪ ،‬مثل‪ :‬الشامية واخلليجية‪.‬‬
‫ومع أن معظم اللغات هلا صبغة رسمية وأخرى عامية‪ ،‬فإن االختالف يف اللغة العربية‬
‫كبريا جدًّ ا‪.‬‬
‫يمكن اعتباره ً‬
‫ومع ال ُبعد عن املناقشة الفلسفية يف الفرق بني اللهجة واللغة‪ ،‬فإننا نجد االختالف‬
‫بني اللهجات العربية يتخ َّطى الكلامت إىل الفونات؛ فعىل سبيل املثال‪ ،‬ال توجد «اجليم‬
‫القاهرية» يف كثري من اللهجات األخرى‪ .‬وكذلك فإن الكثري من الكلامت الشائعة يف‬
‫هلجة ما ال توجد يف هلجات أخرى ‪.‬‬
‫ومما يزيد املشكلة تعقيدا أن اللهجات ال تكون مكتوبة‪ ،‬ولذلك ال توجد نصوص‬
‫كافية لبناء النامذج اللغوية‪ .‬وقد تم بناء نظم للتعرف عيل اللهجات العربية املختلفة مثل‬
‫املرصية والعراقية والشامية بنسبة خطأ ‪ ٪30‬ومما ال شك فيه أنَّه مازال يلزم الكثري من‬
‫العمل للحصول عيل نظم تعرف عيل اللهجات ذات دقة كبرية‪.‬‬

‫‪-74-‬‬
‫املبحث َّ‬
‫الثاني‬
‫ُن ُظم حتويل الن ّ‬
‫َّص إلى كالم‬

‫‪ -1‬التوصيف اللغوي‪.‬‬
‫‪ -2‬إنتاج إشارات الكالم‪.‬‬

‫‪-75-‬‬
-76-
‫ن ُُظم حتويل الن ّ‬
‫َّص إلى كالم‬
‫(‪)Text to Speech - TTS‬‬
‫إن نظم حتويل النص إىل كالم ‪ -‬كام يوحي اسمها ‪ -‬تقبل النص يف لغة ما وتنتج‬
‫ذبذبات الكالم املناظرة هلذا النص‪ .‬ويف أبسط صورها يمكن هلذه النظم تسجيل‬
‫اإلشارات املناظرة للنص املراد نطقه؛ ولكن هذه الطريقة تظل مرتبطة بنطق عدد حمدود‬
‫من اجلمل‪.‬‬
‫لذلك فإن الصورة العامة لنظم حتويل النص إىل كالم تعتمد عىل ختليق الكالم من‬
‫بعض الوحدات الصوتية؛ ولذلك فإن احلصول عىل هذه اإلشارات التخليقية بجودة‬
‫تقرتب من الكالم الطبيعي هو اهلدف األسايس هلذه النظم‪.‬‬
‫وعادة تنقسم نظم حتويل النص إىل كالم إىل جزأين أساسيني‪ ،‬يقوم اجلزء األول‬
‫اآلخر بتحويل التوصيف اللغوي‬ ‫بتحويل النص إىل «توصيف لغوي»‪ .‬ويقوم اجلزء َ‬
‫إيل إشارات الكالم؛ ويكون اجلزء األول معتمدا عىل اللغة وحيتاج إىل الكثري من اخلربة‬
‫اللغوية يف حني أن اجلزء َ‬
‫اآلخر ال يعتمد عىل اللغة‪ ،‬وإنَّام يعتمد يف األساس عىل البيانات‬
‫املسجلة (بالطبع فإن البيانات املسجلة جيب أن تكون من اللغة املراد نطقها)‪.‬‬
‫وسنقوم فيام ييل بعرض رسيع لتكوين التوصيف اللغوي دون الدخول يف تفاصيل‬
‫مع الرتكيز عىل اجلزء اآلخر‪ ،‬وهو املعنِ ّي بإنتاج إشارات الكالم من التوصيف اللغوي‪.‬‬
‫وإلنتاج الكالم تاريخ طويل يعود إىل نظم الـ (‪ )Formant‬والدايفونات‪.‬‬
‫فسوف نتناول الطرق الكثيفة االستخدام للبيانات؛ وهي طرق‬
‫َ‬ ‫أ َّما يف هذا الفصل‪،‬‬
‫ِ‬
‫املخف َّية‪ ،‬وهي‬ ‫اختيار الوحدات‪ ،‬والطرق اإلحصائية التي تستخدم نامذج ماركوف‬
‫واسعة االنتشار اآلن‪.‬‬
‫‪ -1‬التوصيف اللغوي‬
‫يتكون التوصيف اللغوي ‪ -‬يف أبسط صورة ‪ -‬من حتويل النص إىل سلسلة من‬
‫الفونيامت‪ .‬أي‪ :‬جيب أن تتوافر أداة لتحويل النص إىل فونيامت مما يسمى عادة بأدوات‬
‫اجلرافيم ‪ -‬إىل‪ -‬فونيم (‪ )Grapheme to phoneme‬وهذه األدوات تكون إما لغوية‬
‫باستخدام قاموس وبعض القواعد‪ ،‬أو إحصائية قائمة عىل التدريب باستخدام األمثلة؛‬

‫‪-77-‬‬
‫ويف بعض األحيان يتم املزج بني القواعد اللغوية واإلحصائية؛ ويف اللغة العربية ‪ -‬حيث‬
‫ُيكتب النص يف أغلب األحيان بدون التشكيل ‪ -‬فإن وجود أداة إلضافة التشكيل قبل‬
‫التحويل لفونيامت تعد أساسية للحصول عىل التوصيف اللغوي‪ .‬وعادة يتم معاجله النص‬
‫قبل تطبيق أدوات اجلرافيم ‪ -‬إىل ‪ -‬فونيم‪ .‬فعىل سبيل املثال يتم حتويل األرقام والتواريخ‬
‫وعالمات الرتقيم إىل نص؛ وباإلضافة إىل حتويل اجلرافيامت إىل الفونيامت فإن التوصيف‬
‫اللغوي حيتوي عىل معلومات عديدة من نفس الكلمة‪ ،‬مثل‪ :‬الفونيامت املجاورة وعدد‬
‫املقاطع يف الكلمة وموقع املقطع‪ ،‬وكذلك معلومات عن اجلملة‪ ،‬مثل‪ :‬موقع الكلمة يف‬
‫اجلملة وعالمات الرتقيم املستخدمة‪ .‬وباإلضافة إىل ذلك فإنه يتم استخدام معلومات‬
‫عن املتحدث ونوع األسلوب (خربي أو استفهامي) وحالة املتحدث‪.‬‬
‫وتتكامل هذه املعلومات مع سلسلة الفونيامت الختيار أكثر الوحدات مناسبة‬
‫لتخليق الكالم‪ .‬فعىل سبيل املثال‪ ،‬تُستخدم هذه املعلومات الستنتاج امتداد الوحدة‬
‫والرتدد األسايس هلا‪ .‬ومما سبق يتضح أن أدوات التوصيف اللغوي يمكن تقسيمها إىل‬
‫ما ييل‪ :‬أدوات ملعاجلة النص‪ ،‬مثل‪ :‬التشكيل اآليل‪ ،‬وأدوات لتحويل اجلرافيم إىل فونيم‪،‬‬
‫وأدوات للتعامل مع املعلومات عىل مستوى الكلمة واجلملة واملتحدث‪ .‬وترتبط هذه‬
‫األدوات ارتباطا وثيقا باللغة التي يتم التعامل معها‪ ،‬وتتطلب معرفة دقيقة بخصائصها‬
‫وكيفية توصيفها‪.‬‬
‫‪-‬وخلصوصية هذه القواعد واختالفها من لغة إىل أخرى فإننا لن نتطرق إليها بالتفصيل‪.‬‬

‫‪ -2‬إنتاج إشارات الكالم‬


‫يتم باستخدام إحدى َط ِري َقتَني؛‬
‫كام أرشنا سابقا‪ ،‬فإن إنتاج إشارات الكالم احلديثة ُّ‬
‫طريقة اختيار الوحدات والطريقة اإلحصائية؛ وسنتعرض لكلتا الطريقتني فيام ييل‪:‬‬

‫‪ -1.2‬طريقة اختيار الوحدات‬


‫تعتمد طريقة اختيار الوحدات ‪ -‬كام يوحي االسم ‪ -‬عىل تسجيل قاعدة بيانات‬
‫من متكلم واحد وتقسيمها إىل وحدات؛ ويتم إنتاج الكالم باختيار الوحدات املناسبة‪.‬‬
‫وسنفصل فيام ييل كيفية احلصول عىل الوحدات وكيفية اختيارها‪.‬‬

‫‪-78-‬‬
‫يتم تسجيل عدة ساعات‪ ،‬أي عدة آالف من اجلمل من متكلم واحد‪ ،‬و ُيراعى‬
‫احلصول عىل تسجيل نقي‪ ،‬كام ُيراعى اختيار اجلمل بحيث تناسب ما سيتم نطقه فيام‬
‫بعد‪ ،‬ثم ُت َق َّسم اجلمل إىل وحدات فونيمية؛ وعىل الرغم من أن وسيلة التقسيم ليست‬
‫ِ‬
‫املخف َّية تستخدم يف هذا السياق‪ .‬ونُشري إىل‬ ‫ذات أمهية كربى‪َّ ،‬‬
‫فإن نامذج ماركوف‬
‫أن استخدام نامذج ماركوف هنا فقط لتقسيم الكالم وليست إلنتاجه كام يف الطريقة‬
‫اإلحصائية التي سيتم تفصيلها الحقا‪.‬‬
‫يتم تسجيل عدة آالف من اجلمل من متحدث واحد‪ ،‬ويتم بناء النامذج الفونيمية‪.‬‬
‫أوردنا‬
‫يف حقيقة األمر يتم بناء نامذج تعتمد عىل السياق‪ ،‬مثل الرتاي فون أو غريه – كام َ‬
‫املعني بالتعرف عىل الكالم‪.‬‬
‫ّ‬ ‫يف املبحث‬
‫وللتذكرة فإن ناتج هذه النامذج يكون شجرة القرار لكل فونيم‪ ،‬والتي تعرب عن‬
‫هذا الفونيم يف السياقات املختلفة‪ ،‬حيث متثل كل ورقة فيها وحدات هذا الفونيم التي‬
‫ٍ‬
‫بعبارة أخرى ‪ -‬التي هلا سياقات متشاهبة؛ ويتم متثيل كل ورقة‬ ‫تتشارك يف السياق ‪ -‬أو‬
‫بخليط (جاوس) كام سبق أن فصلنا‪.‬‬
‫وبعد بناء هذه النامذج‪ ،‬يمكن استخدامها لتقسيم إشارات الكالم إىل فونيامت‪ ،‬أي‬
‫ف هذه العملية بـ «التقسيم»‬‫ُعر ُ‬
‫معرفة متى يبدأ وينتهي كل فونيم يف اإلشارة املعطاة‪ .‬وت َ‬
‫(‪ .)segmentation‬وبعد املرور عىل إشارات الكالم كلها يتم ربط عدد من املقاطع‬
‫بكل ورقة من أوراق شجرة القرار لكل فونيم‪ .‬فعىل سبيل املثال‪ ،‬بعد إجراء التقسيم‬
‫يتم جتميع كل املقاطع التي تنتمي إىل الفونيم ‪/‬ب‪ ./‬ولكل مقطع يتم املرور عىل شجرة‬
‫القرار املناظرة للوصول إىل الورقة املناسبة‪ .‬وللتذكرة فإن الوصول إىل الورقة يتم عن‬
‫طريق اإلجابة عن أسئلة خاصة بالسياق (الفونيامت املجاورة يف أغلب األحيان)‪ .‬وعىل‬
‫سبيل املثال‪ ،‬إذا اعتربنا الفونيم ‪/‬ب‪ /‬يف كلمة «كبري» فإنه يمكن الوصول إىل الورقة‬
‫املناسبة عن طريقة اإلجابة عن أسئلة السياق الفونيمي (الفتحة ‪/‬و ‪/‬ى‪ /‬يف هذه احلالة)‬
‫اختيار املقاطع (الوحدات) إلنتاج الكالم‬
‫سنفصل فيام ييل كيفية إنتاج كلمة «كبري» كام يف املثال السابق‪ .‬وسنفرتض أن لكل‬
‫فونيم شجره قرار واحدة‪ ،‬وليس لكل حالة من الفونيم للتسهيل‪ ،‬وألن ذلك أكثر‬
‫شيوعا يف نظم إنتاج الكالم‪.‬‬

‫‪-79-‬‬
‫إن كلمة «كبري» تتكون من السلسلة اآلتية من الفونيامت‪:‬‬
‫‪/k / / a / / b / / I / / r /‬‬

‫ويمكن كتابتها كرتيفونات كام ييل‪:‬‬


‫‪/#-k-a/ /k-a-b/ /a-b-I/ /b-I-r/ /I-r -#/‬‬

‫حيث ‪ #‬هو فونيم يعرب عن بداية وهناية الكلمة‪ ،‬وحيث َ‬


‫يؤخذ سياق الفونيم يف‬
‫االعتبار عند كتابة كل تريفون‪ .‬ويتم إضافة الفرتة (‪ ،)duration‬والنغمة (‪ )pitch‬لكل‬
‫تريفون‪ .‬ويمكن حساب الفرتة املستهدفة والنغمة املستهدفة باستخدام عوامل كثرية‬
‫اعتام ًدا عىل التوصيف اللغوي املصاحب وموقع الفونيم يف الكلمة واملوقع يف اجلملة‬
‫وعالمات الرتقيم وحالة املتحدث‪ .‬ولن نتطرق بالتفصيل هلذه النقطة لعدم وجود‬
‫دراسة قياسية شائعة االنتشار‪ ،‬باإلضافة إىل أن ذلك يعتمد بدرجة كبرية عىل اللغة‬
‫وعىل التوصيف اللغوي؛ كام أننا نعتقد أن اللغة العربية بحاجة لكثري من العمل يف هذا‬
‫املجال‪ .‬وبعد إضافة الفرتة والنغمة املستهدفة لكل تريفون يمكن املرور عيل شجرة‬
‫القرار املناسبة والوصول إىل الوحدات املرتبطة بالورقة املناسبة ‪.‬‬
‫ويتم اختيار الوحدات املناسبة إلنتاج الكالم عن طريق تقليص التكلفة‪ .‬ويتم‬
‫حساب التكلفة كاآليت‪:‬‬
‫التكلفة الكلية = تكلفة الفرتة ‪ +‬تكلفة النغمة ‪ +‬تكلفة اللصق‬
‫وحيث نحسب تكلفة الفرتة والنغمة حسب بعدمها عن الفرتة والنغمة املستهدفني؛‬
‫سلسا للكالم‪.‬‬
‫ونحسب تكلفة اللصق بحيث تتيح انتقاال ً‬
‫‪ -2.2‬الطريقة اإلحصائية‪ :‬نامذج ماركوف ِ‬
‫املخف َّية‬
‫ِ‬
‫املخف َّية يف جمال التعرف عىل الكالم؛ ولكن‬ ‫لقد عرضنا فيام سبق نامذج ماركوف‬
‫يمكن استخدامها أيضا يف إنتاج الكالم‪ .‬فعىل سبيل املثال نعترب الرتيفون ‪/k-a-b/‬‬
‫ثالثي احلالة وكذلك نامذج جاوس البسيطة‪ .‬إن استخدام هذا النموذج إلنتاج الكالم‬
‫يؤدي يف أبسط صورة الستخدام متجهات املتوسط احلسايب لكل حالة مكررة حسب‬
‫احتامالت االنتقال لكل حالة‪ .‬ولكن هذه الطريقة املبسطة تؤدي إىل جودة متدنية‬
‫للس َب َبني التَّاليني‪:‬‬
‫للكالم َّ‬

‫‪-80-‬‬
‫وكذلك مناذج جاوس البسيطة‪ .‬إن استخدام هذا النموذج إلنتاج الكالم يؤدي يف أبسط صورة‬
‫الستخدام متجهات املتوسط احلسايب لكل حالة مكررة حسب احتماالت االنتقال لكل‬
‫للسبَـبَني التَّاليني‪:‬‬
‫حالة‪ .‬ولكن هذه الطريقة املبسطة تؤدي إىل جودة متدنية للكالم َّ‬
‫▪ تكرار املتوسط احلسايب بدون أخذ السياق يف االعتبار‪.‬‬
‫Ÿ Ÿتكرار املتوسط احلسايب بدون أخذ السياق يف االعتبار‪.‬‬
‫▪ تكلفة عالية للصق لعدم اعتبار الوحدات اجملاورة‪.‬‬
‫Ÿ Ÿتكلفة عالية للصق لعدم اعتبار الوحدات املجاورة‪.‬‬
‫وللتغلب على هذا فقد مت استخدام احتماالت املشتقة األوىل والثانية يف إنتاج الكالم‪.‬‬
‫وللتغلب عىل هذا فقد تم استخدام احتامالت املشتقة األوىل والثانية يف إنتاج الكالم‪.‬‬
‫ومعامالت املشتقة واسعة االنتشار يف التعرف على الكالم هي عبارة عن مزج خطي بني‬
‫ومعامالت املشتقة واسعة االنتشار يف التعرف عىل الكالم هي عبارة عن مزج خطي بني‬
‫متجهات الطيف‪ .‬وعلى سبيل املثال فإن املشتقة األوىل عند الزمن (‪ )t‬للكبسرتم (‪ُ C(t‬يكن‬
‫متجهات الطيف‪ .‬وعىل سبيل املثال فإن املشتقة األوىل عند الزمن (‪ )t‬للكبسرتم (‪C(t‬‬
‫كتابتها كما يلي‪:‬‬
‫يمكن كتابتها كام ييل‪:‬‬
‫‪+2‬‬

‫)𝑘𝑘 ‪𝐷𝐷𝐷𝐷(𝑡𝑡) = ∑ 𝑘𝑘𝑘𝑘(𝑡𝑡 −‬‬


‫‪𝑘𝑘=−2‬‬

‫ضمنيا يف‬
‫املتجاورةاالعتبار‪.‬‬
‫والوحدات ضمنيا يف‬ ‫السياق‬
‫الوحدات املتجاورة‬ ‫أتخذتأخذ‬
‫السياق و‬ ‫املعامالت‬
‫هذهاملعامالت‬‫فإن هذه‬‫يتضح فإن‬ ‫وكام‬
‫كما يتضح‬ ‫و‬
‫املشتقات‬
‫باعتبارجمموعة‬
‫الكالم إىل حل‬ ‫ابعتبار إنتاج‬
‫املشتقات يؤول‬ ‫احلسابية فإن‬ ‫التفاصيل‬
‫إنتاج الكالم‬ ‫الدخول يف‬
‫احلسابية فإن‬ ‫ودونيف التفاصيل‬ ‫االعتبار‪.‬‬
‫الدخول‬ ‫ودون‬
‫ماركوف يتم‬ ‫فضاءنامذج‬
‫الكبسرتم أو أي‬ ‫تدريب‬ ‫وبام أن‬
‫عادة يف‬ ‫األوىل؛‬
‫كوف يتم‬ ‫الدرجة‬
‫مناذج مار‬ ‫منريب‬‫معادالتأن تد‬
‫جمموعةاألوىل؛ ومبا‬
‫حل الدرجة‬ ‫يؤول إىل‬
‫معادالت من‬
‫مشابه‪ ،‬وال يتم يف فضاء اإلشارة الزمنية‪ ،‬فإنه‬
‫‪87‬‬
‫عادة يف فضاء الكبسرتم أو أي فضاء آخر‬
‫مرشح إلنتاج إشارات الكالم بد ًء من املتجهات املنتجة‪ .‬ويمكن استخدام‬ ‫يلزم وجود ِّ‬
‫املرشحات املستخدمة يف حتليل الكالم هلذا الغرض‪.‬‬
‫فعىل سبيل املثال‪ ،‬بمعرفة معامالت التنبؤ اخلطي (‪linear prediction‬‬
‫‪ ،)Coefficients‬واالستثارة (‪ )excitation‬يمكن إنتاج الكالم باستخدام مرشح‬
‫التنبؤ اخلطي املعروف‪ .‬ويف أول أعامل إنتاج الكالم باستخدام النامذج اإلحصائية تم‬
‫استخدام مرشح قائم عىل معامالت (كبسرتم ميل) (‪ )MFCC‬املعروفة بجودهتا لبناء‬
‫نامذج (ماركوف)‪ .‬وكام ذكرنا يف سياق هذا الفصل‪ ،‬فإن إنتاج الكالم حيتاج إىل نامذج‬
‫للنغمة والفرتة‪ .‬وبام أن للنغمة طبيعة منفصلة‪ ،‬فإنه عند املزج بني معامالت الطيف‬
‫والنغمة يتم استخدام نامذج متزج بني التوزيعات املتصلة واملنفصلة‪ .‬إن نامذج ماركوف‬
‫تستخدم ضمنيا نامذج هندسية للفرتة؛ ومن املعروف أهنا غري دقيقة يف التنبؤ بفرتة‬
‫الوحدات؛ وبينام ال يمثل ذلك مشكلة كبرية للتعرف عىل الكالم فإنه من األفضل‬
‫استخدام نامذج أكثر دقة عند إنتاج الكالم‪ .‬لذلك يتم ‪ -‬يف بعض األحيان ‪ -‬استخدام‬
‫ما يسمى بنامذج شبه‪ -‬ماركوف ِ‬
‫املخف َّية (‪.)Hidden semi-Markov Models‬‬

‫‪-81-‬‬
‫ِ‬
‫املخف َّية‬ ‫ولتلخيص ذلك فإنه عند إنتاج الكالم يتم عادة بناء نامذج شبه‪ -‬ماركوف‬
‫واملزج بني التوزيعات املنفصلة ملعامالت النغمة املتصلة للطيف‪ ،‬ويتم استخدام‬
‫املشتقات لفرض االتصال حني إنتاج إشارات الكالم‪.‬‬
‫وفيام ييل سنبني كيفية إنتاج إشارات الكالم لكلمة «كبري»‪ .‬وكام سبق فإننا نقوم‬
‫بكتابة الرتاي فونات املناظرة‪.‬‬
‫‪/ # -k - a / / k - a - b / / a - b - I / / b - I - r / / I - r - # /‬‬

‫ولنأخذ الرتاي فون ‪ /a-b-I/‬كمثال‪ .‬لكل حالة من الرتاي فون يتم التنبؤ بعدد‬
‫السامت لكل من‬ ‫السامت حسب توزيع الفرتة للحالة‪ ،‬ويتم إنتاج متجهات ِّ‬ ‫متجهات ِّ‬
‫متجهات الطيف والنغمة باستخدام توزيعات الرتاي فون مع أخذ املشتقة األوىل والثانية‬
‫يف االعتبار باستخدام املتجهات والنغمة واملرشح املناسب‪ ،‬وعليه يتم إنتاج إشارات‬
‫الكالم‪ ،‬ويتم تكرار ذلك لكل تراي فون‪.‬‬
‫وكام ذكرنا سابقا‪ ،‬فإن طريقة اختيار الوحدات تؤدي إىل كالم عايل اجلودة إذا توفرت‬
‫قاعدة بيانات كافية لتغطية السياقات املختلفة‪ ،‬ولكنها تفتقد املرونة يف تغيري نوع الكالم‬
‫أو املتكلم‪.‬‬
‫وتقع الطريقة اإلحصائية عىل اجلانب اآلخر‪ ،‬فهي تتيح مرونة كبرية لتغيري املتكلم أو‬
‫نوع الكالم باستخدام التحويالت اخلطية واسعة االنتشار يف نظم التعرف عىل الكالم‪،‬‬
‫ولكنها يف نفس الوقت ‪ -‬ونتيجة ألخذ املتوسطات أثناء التدريب‪ -‬قد تؤدي إىل كالم‬
‫أقل جودة من أفضل نظم اختيار الوحدات؛ ولكنها تبقى طريقة ذات دقة مناسبة ومرنة‬
‫يف نفس الوقت‪.‬‬
‫ولتحسني جودة الطريقة اإلحصائية فقد تم دراسة بعض الطرق يف السنوات األخرية‪،‬‬
‫من أمهها‪:‬‬
‫Ÿ Ÿطريقة مصفوفة التباين العامة (‪ ،)Global Covariance Matrix‬وذلك لتاليف‬
‫تأثري املتوسطات يف إنتاج الكالم‪.‬‬
‫Ÿ Ÿتدريب النامذج باستخدام أقل خطأ يف التوليد‪.‬‬

‫‪-82-‬‬
‫املبحث ال َّثالث‬
‫ُن ُظم ال َّت َع ُّرف على ال ُّلغة وامل َت َك ِّلم‬

‫‪ -1‬نظم التعرف عىل ال ُّلغة‪.‬‬


‫‪ -2‬نظم التعرف عىل املتكلم‪.‬‬

‫‪-83-‬‬
-84-
‫املبحث الثَّالث‬
‫َّع ُّرف على اللُّغة واملتج جكلِّّم‬
‫نُظُم الت ج‬

‫املتكلم‪.‬‬
‫عىلوهلذه‬ ‫التعرف‬
‫املتكلم‪.‬‬ ‫نرشح نظم‬
‫التعرف على‬ ‫ثمح نظم‬
‫اللغةنشر‬ ‫علىعىل‬
‫اللغة ُث‬ ‫التعرف‬
‫نظمالتعرف‬
‫سنعرض نظم‬ ‫املبحث‬
‫املبحث سنعرض‬ ‫هذاهذا‬‫يف يف‬
‫اجملاالت‪.‬املجاالت‪.‬‬
‫يف خمتلف‬ ‫عديدة‬
‫ُمتلف‬ ‫تطبيقات‬
‫عديدة يف‬ ‫النظم‬
‫تطبيقات‬ ‫وهلذهالنظم‬

‫ُّ‬
‫‪ -1‬نظم التعرف عىل اللغة‬
‫‪ -1‬نظم التعرف على اللُّغة‬
‫لغة نُطِقت بمعرفة ذبذبات كال ٍم‬ ‫إن اهلدف يف نظم التعرف عىل اللغة هو معرفة أي‬
‫إن اهلدف يف نظم التعرف على اللغة هو معرفة أي لغة نح ِطقت مبعرفة ذبذابت كالٍم ما‪.‬‬
‫ما‪ .‬وتكون املدخالت للنظام هي عدة ثواين من ذبذبات الكالم‪ ،‬حيدد النظام عىل‬
‫وتكون املدخالت للنظام هي عدة ثواين من ذبذابت الكالم‪ ،‬حيدد النظام على أساسها اللغة‬
‫أساسها اللغة التي نطقت به من بني عدة لغات معروفة لديه‪ .‬ويف بعض األحيان تشمل‬
‫اليت نطقت به من بني عدة لغات معروفة لديه‪ .‬ويف بعض األحيان تشمل هذه النظم نظم‬
‫هذه النظم نظم التحقق من اللغة‪ ،‬بمعنى أن لدينا إشارة كالم ولغة ما ونريد التحقيق ممَّا‬
‫التحقق من اللغة‪ ،‬مبعىن أن لدينا إشارة كالم ولغة ما ونريد التحقيق ممَّا إذا كانت هذه‬
‫إذا كانت هذه الذبذبات تنتمي هلذه اللغة أم ال‪ .‬ولكن يف هذا الفصل سنكتفي بعرض‬
‫الذبذابت تنتمي هلذه اللغة أم ال‪ .‬ولكن يف هذا الفصل سنكتفي بعرض نظم التعرف على‬
‫املستخدمة‪ .‬الطرق املستخدمة‪.‬‬
‫الطرقاللغة لتشابه‬
‫لتشابهعىل‬
‫التعرف‬‫اللغة‬
‫نظم‬
‫فإنه‪X -‬‬
‫ُيكن فإنه‬ ‫املناظرة‬ ‫متجهات السامت‬ ‫باعتبار ذبذبات الكالم ‪ -‬أو لنكون أكثر دقة‬
‫السمات ِّاملناظرة – ‪X‬‬
‫ِ‬
‫ابعتبار ذبذابت الكالم – أو لنكون أكثر دقة متجهات ّ‬
‫يلي‪ :‬كام ييل‪:‬‬
‫كمااللغة‬
‫اللغةعىل‬
‫التعرف‬ ‫مسألةمسألة‬
‫التعرف على‬ ‫صياغة‬ ‫يمكن‬
‫صياغة‬
‫𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎‬
‫= ∗ 𝑙𝑙‬ ‫)𝑥𝑥|𝑙𝑙(𝑃𝑃‬
‫𝑙𝑙‬

‫تطبي ًلققاواعدبسي ًطا‬


‫بسيطًا‬ ‫تصبحتطبي ًقا‬
‫املسألة‬ ‫وهكذا املسألة‬
‫وهكذا تصبح‬ ‫للنظام‪.‬‬
‫للنظام‪.‬‬ ‫املعرفة َّ‬
‫املعرفة‬ ‫من اللغات‬
‫اللغات َّ‬ ‫جمموعة من‬
‫حيث‪L L‬جمموعة‬‫حيث‬
‫األمناط‪.‬األنامط‪.‬‬ ‫التعرف على‬
‫التعرف عىل‬ ‫لقواعد‬
‫اللغات‬
‫لغة من‬ ‫(جاوس)منلكل‬
‫جاوس) لكل لغة‬
‫خليط (خليط‬
‫مناذج نامذج‬ ‫استخدام‬
‫استخدام‬ ‫هذا اجملال‬
‫املجال‬ ‫يف هذا‬
‫الشائعة يف‬
‫النماذجالشائعة‬
‫ومنومنالنامذج‬
‫املراد التعرف عليها‪ ،‬ويتم تدريب هذا اخلليط من متجهات ِ‬
‫امتلغة‪.‬التي تنتمي‬
‫تنتميالسلكل‬ ‫السمات اليت‬
‫اللغات املراد التعرف عليها‪ ،‬ويتم تدريب هذا اخلليط ّمن متجهات ِّ‬
‫‪93‬‬ ‫لكل لغة‪.‬‬
‫ويمكن استخدام هذه النامذج حلساب االحتامالت يف املعادلة السابقة عند التعرف‬
‫عىل اللغة‪ ،‬ويسمى هذا األسلوب «األسلوب األكوستيكي» ألنه يستخدم اإلشارات‬
‫األكوستيكية بشكل مبارش‪ .‬ومن املعروف أن هذا األسلوب ال يعطي نتائج جيدة جدا‬
‫للتعرف عىل اللغة‪ ،‬وربام يعود ذلك لتداخل عوامل كثرية ‪ -‬باإلضافة إىل اللغة ‪ -‬يف‬
‫اإلشارة األكوستيكية‪ ،‬مثل‪ :‬املتكلم والتسجيل‪ .‬وبجانب األسلوب األكوستيكي‪،‬‬
‫فإن ما يسمى بـ «األسلوب الفونوتيكي» واسع االنتشار يف نظم التعرف عىل اللغة‪.‬‬

‫‪-85-‬‬
‫ويف األسلوب األخري يتم استخدام نظام للتعرف عىل الفونيامت‪ .‬ومن املدهش أن هذا‬
‫النظام ال ينتمي بالرضورة إىل أي من اللغات املراد التعرف عليها‪ .‬وبعد مترير اإلشارات‬
‫يف اللغات املراد التعرف عليها عىل نظام التعرف الفونيمي‪ ،‬فإنه يتم بناء نامذج النَّحو‬
‫اإلحصائي (‪ )N-gram‬لكل لغة عىل الفونيامت الناجتة‪ .‬والفكرة األساسية هنا أن‬
‫سالسل الفونيامت الناجتة تستطيع التمييز بني اللغات املراد متييزها‪.‬‬
‫ومن البدهيي أنه يمكن استخدام هذه الطريقة للتمييز بني أي عدد من اللغات‪ .‬ومن‬
‫املعروف أن الطريقة الفونيتيكية تؤدي إيل نتائج ممتازة يف التعرف عىل اللغة‪ ،‬ربام ألهنا‬
‫أقل تأثرا من الطريقة األكوستيكية باملتغريات‪ ،‬مثل املتحدث والتسجيل‪.‬‬
‫ويمكن تعميم وحتسني الطريقة الفونوتيكية باستخدام عدة نظم للتعرف الفونيمي‪،‬‬
‫وليس بالرضورة من اللغات التي يراد متييزها‪ ،‬ثم بناء نامذج (‪ )N-gram‬اللغوية لكل‬
‫لغة ونظام فونيمي‪.‬‬
‫فعىل سبيل املثال‪ ،‬للتمييز بني اللغة «أ» واللغة «ب» يمكن استخدام نظام فونيمي للغة‬
‫«ج» واللغة «د»؛ ومن ثم بناء نامذج لغوية «أ جـ» و «أ د» و «ب جـ» «ب د»‪ .‬ويسمى هذا‬
‫النظام «النظام الفونوتيكي املتوازي»‪ ،‬ويؤدي إىل نتائج أفضل من النظام الفونوتيكي‪،‬‬
‫ولكن بالطبع مع زيادة حجم النامذج والعمليات احلسابية املصاحبة‪.‬‬
‫وعىل الرغم من أن األسلوب الفونونيكي يبدو األفضل يف نظم التعرف عىل اللغة‪،‬‬
‫فإن مزج األسلوبني الفونومنيكي واألكوستيكي يؤدي يف أغلب األحيان إىل نتائج أفضل‪،‬‬
‫ويتم هذا املزج بطرق عديدة‪ .‬ففي أبسط صورة يمكن بناء نظامني منفصلني (أحدمها‬
‫فونونيكي واآلخر أكوستيكي) ومزج نتيجة النظامني للحصول عىل النتيجة النهائية‪.‬‬

‫‪ -2‬نظم التعرف عىل املتكلم‬


‫نظم التعرف عىل املتكلم ‪ -‬كام يوحي االسم‪ -‬إشارات الكالم للتعرف‬ ‫ِ‬
‫تَستَخد ُم ُ‬
‫عىل املتكلم‪ .‬وتنقسم هذه النظم إىل نوعني؛ يف النوع األول يكون لدينا جمموعة من‬
‫املتكلمني وهيدف النظام إىل معرفة إىل أي منهم تنتمي إشارة الكالم املدخلة‪ .‬أما يف‬
‫متكلم وهيدف النظام إىل معرفة إذا كانت‬
‫ً‬ ‫النوع َ‬
‫اآلخر‪ ،‬وهو التحقيق‪ ،‬فإنه يعطي لنا‬

‫‪-86-‬‬
‫إشارة الكالم املدخلة صدرت من هذا املتكلم أم ال‪ .‬وللنوع الثاين تطبيقات كثرية إذ‬
‫يمكن استخدامه للتحقق من البيانات مثل استخدام بصامت األصابع أو العني وكذلك‬
‫يمكن استخدامه بجانب كلمة الرس (‪ )password‬وتتشابه الطرق والنامذج املستخدمة‬
‫يف كال النوعني ولذلك أننا سنتطرق إىل الطرق املستخدمة يف التحقق من املتكلم‪.‬‬
‫وللتحقق من املتكلم ‪ S‬باستخدام إشارة الكالم ‪ X‬فإن اهلدف يكون التأكد بأن‬
‫‪ X‬تنتمي إىل ‪ S‬أم ال‪ .‬وهلذا يلزم وجود نموذج للمتكلم حلساب االحتامل (‪P(X│S‬‬
‫وكذلك نموذج للخلفية (‪ )background‬حلساب (‪ P(X│background‬أو للتسهيل‬
‫(‪P(X│S‬‬
‫(‪ P(X│b‬وعادة يتم احلكم بأن اإلشارة ‪ X‬تنتمي إىل ‪ S‬إذا كان ناتج القسمة‬
‫(‪P(X│b‬‬
‫أكرب من قيمة حمددة ‪ t‬تسمى العتبة (‪.)threshold‬‬
‫ولفرتة طويلة ظلت نامذج خليط (جاوس) تستخدم للتعبري عن املتكلم واخللفية‪.‬‬
‫السامت من املتكلم واستخدامها لبناء نموذج خليط‬
‫فيمكن جتميع عدد من متجهات ِّ‬
‫(جاوس) بالطرق التقليدية‪.‬‬
‫السامت من عدد كبري من املتكلمني واستخدامها‬ ‫وكذلك يمكن جتميع متجهات ِّ‬
‫لبناء نموذج اخللفية‪ .‬ولتقليل كمية الكالم املطلوب احلصول عليه من املتكلم لتسجيله‬
‫يف النظام فإنه يمكن بناء نموذج خلفية من عدد كبري من املتكلمني ثم باستخدام طرق‬
‫التكيف (‪ )adaptation‬للحصول عىل نامذج املتكلم‪ .‬ومن املدهش أن نفس متجهات‬
‫السامت املستخدمة يف التعرف عىل الكالم يتم استخدامها يف نظم التعرف أو التحقق‬ ‫ِّ‬
‫من املتكلم وهي معامالت الكبسرتم ومشتقاهتا‪ .‬وعىل الرغم من أن نظم التعرف عىل‬
‫الكالم هتدف إىل حتييد تأثري املتكلم فإن املتجهات املستخدمة فيها تؤيت نتائج طيبة جدا‬
‫عند استخدامها يف التعرف عىل املتكلم وتكون أفضل من اخلصائص املعروفة بارتباطها‬
‫ارتباطا وثيقا باملتكلم مثل النغمة‪ .‬ويمكن من الناحية اللغوية أو األكوستيكية دراسة‬
‫ِسامت تؤدي إىل حتسني نظم التعرف أو التحقق من املتكلم‪.‬‬
‫ويف اجليل األحدث من نظم التحقق من املتكلم يمكن النظر إىل املسألة عىل أهنا‬
‫مسألة تصنيف (‪ ،)classification‬ويمكن بناء مصنف لتحديد‪ :‬هل تنتمي إشارات‬
‫الكالم إىل متكلم معني أم ال‪.‬‬

‫‪-87-‬‬
‫وحدي ًثا تم استخدام آل َّيات املتَّجهات الدَّ اعمة (‪)Support Vector Machine‬‬
‫السامت التي متاثل تلك‬
‫هلذا الغرض‪ .‬ومن املمكن بناء املصنف باستخدام متجهات ِّ‬
‫املستخدمة يف نامذج جاوس ولكن يمكن أيضا املزج بني نامذج خليط (جاوس)‬
‫واملصنفات‪ .‬فيمكن بناء نامذج خليط (جاوس) كام سبق أن ناقشنا ثم ييل ذلك بناء‬
‫مصنفات يف فضاء مكون من التوزيعات االحتاملية لكل مكون من مكونات اخلليط‪.‬‬
‫وعادة تعطى الطريقة األخرية نتائج جيدة جدا للتحقق من املتكلم‪.‬‬
‫ولتقييم طرق التحقق من املتكلم فإنه يوجد نوعان من األخطاء؛ يف النوع األول يتم‬
‫قبول إشارة ما يف حني أهنا ال تنتمي إىل املتكلم املراد‪ ،‬ويسمى هذا النوع من األخطاء‪:‬‬
‫أخطاء التنبيه اخلاطئ (‪)false alarm‬؛ ويف النوع َ‬
‫اآلخر ال يتم قبول اإلشارة بالرغم من‬
‫أهنا تنتمي إىل املتكلم املراد‪ ،‬وتسمي هذه بأخطاء اإلخفاق (‪.)misrecognition error‬‬
‫ويتم تصميم النظام عند نقطة تناسب التطبيق املستخدم ألصله‪ .‬فمثال عند استخدام‬
‫النظام لوصول إىل احلساب البنكي فإن تكلفة التنبيه اخلاطئ تكون أكرب كثريا من تكلفة‬
‫اإلخفاق‪.‬‬

‫‪-88-‬‬
‫ببليوجرافيا مرجع َّية‬
‫األول‬
َّ ‫املبحث‬
1. AbuZeina, D.; Elshafei, M. (2011). Cross-Word Modeling for Ara-
bic Speech Recognition. Springer.
2. Afify, M.; Nguyen, L.; Xiang, B.; Abdou, S.; Makhoul, J. “Recent
progress in Arabic broadcast news transcription at BBN”, in Pro-
ceedings of Interspeech, Lisbon, Portugal, September 2005.
3. Ali, A.; Zhang, Y.; Cardinal, P.; Dahak, N.; Vogel, S.; Glass, J. “A
complete Kaldi recipe for building Arabic speech recognition sys-
tems”, Proc. icassp 2014.
4. Bailly, G.; Perrier, P.; Vatikiotis-Bateson, E. (2012). Audiovisual
Speech Processing. Cambridge University Press.
5. Chen S. F.; Goodman, J. (1999). “An empirical study of smooth-
ing techniques for language modeling”, Computer Speech and Lan-
guage, vol. 13, pp. 359-394.
6. Clark, A.; Fox, C.; Lappin, S. (2010). The Handbook of Com-puta-
tional Linguistics and Natural Language Processing. John Wiley &
Sons.
7. Cohen, I & Benesty, J.; Gannot, S. (2010). Speech Processing in
Modern Communication: Challenges and Perspectives. Springer.
8. Dahl, G.; Yu, D.; Li, D.; Acero, A. “Context-dependent pre-trained
deep neural networks for large vocabulary speech recognition”,
IEEE Transactions on Audio, speech and Language Processing”,
vol. 20, no. 1 , January 2012.
9. Elmahdy, M.; Gruhn, R.; Minker, W. (2012). Novel Techniques for
Dialectal Arabic Speech Recognition. Springer.
10. Eskenazi, M.; Levow, G.; Meng, H.; Parent, G.; Suendermann, D.
(2013). Crowdsourcing for Speech Processing: Applications to Data
Collection, Transcription and Assessment. Wiley.

-89-
11. Gales, M.; Young, S. (2007). “The application of hidden Markov
mod-els in speech recognition”, Foundations and Trends in Signal
Pro-cessing, vol. 1, no. 3, pp. 195-304.
12. Mariani, J. (2010). Language and Speech Processing. John Wiley
& Sons.
13. Mehler, A.; Romary, L. (2012). Handbook of Technical Communi-
cation. Walter de Gruyter.
14. Mohammed, A. K. (2012). Speech Recognition System: Speaker
De-pendent Recognizer for Sidama Language. Lambert Academic
Publishing.
15. Mohri, M.; Pereira, F.; Riley, M. (2002). “Weighted finite state
transducers in speech recognition”, Computer Speech and Lan-
guage, vol. 16, no. 1, pp. 69-88.
16. Ortmanns, S.; Ney, H.; Aubert, X. (1997). “A word graph algorithm
for large vocabulary continuous speech recognition”, Computer
Speech and Language, vol. 11, no. 1, pp. 43-72.
17. Pathak, M. A. (2013). Privacy-Preserving Machine Learning for
Speech Processing. Springer.
18. POvey, D.; Valtchev, V.; Woodland, P. C. (2006). The HTK Book
(for HTK Version 3.4). University of Cambridge, http://htk.eng.
cam.ac.uk, December 2006.
19. Rabiner, L. R. (1989). “A tutorial on hidden Markov models and
selected applications in speech recognition”, Proceedings of IEEE,
vol. 77, no. 2, pp. 257-286.
20. Russell, J.; Cohn, R. (2012). Speech Processing. Book on Demand.
21. Selouani, S. (2011). Speech Processing and Soft Computing. Spring-
er.
22. Suh, J. (2012). Effective Data Selection Technology for Robust
Speaker Recognition. University of Texas at Dallas. Graduate Pro-
gram in Electrical Engineering.

-90-
23. Vasquez, D.; Gruhn, R.; Minker, W. (2013). Hierarchical Neural
Network Structures for Phoneme Recognition. Springer.
24. Wang, J.; Furui, S.; Juang, B. (2012). Real World Speech Process-
ing. Springer.
25. Sak, H.; Senior, A.; Beaufays, F. (2014). “Long Short-Term Mem-
ory Based Recurrent Neural Network for Large Vocabulary Speech
Recognition” arXiv preprint, arXiv: 1402.1128, 2014.
26. Sundermeyer, M.; Schluter, R.; Ney, H. (2012). “LSTM Neural Net-
work Language Modelling” InterSpeech 2012.

‫املبحث ال َّثاين‬
1. Black, A. W.; Zen, H.; Tokuda, K. (2007). “Statistical parametric
speech synthesis”, Proc. of ICASSP, pp.1229-1232, Apr.
2. Gupta, S.; Bhatia, P. (2012). Text to Speech System: An Aid to Vis-
ually and Vocally Impaired. LAP Lambert Academic Publishing.
3. Hunt, A.; Black, A. (1996). “Unit selection in a concatenative speech
synthesis system using a large speech database”, Proceedings of
ICASSP 96, vol. 1, pp. 373-376, Atlanta, Georgia.
4. Rao, K. S. (2012). Predicting Prosody from Text for Text-to-Speech
Synthesis. Springer.
5. Rao, K. S.; Koolagudi, S. G. (2012). Emotion Recognition using
Speech Features. Springer.
6. Van den Oord, A.; Dieleman, S.; Zen, H. et al (2016). “Wavenet:
A Generative Model of Raw Audio”, arXiv:1690.03499, Septmber
2016.

-91-
‫املبحث ال َّثالث‬
1. Beigi, H. (2009). Fundamentals of Speaker Recognition. Springer.
2. Ghosh, D.; Debnath, D. (2012). Speaker Recognition: Real Time
Veri-fication of VLSI Architecture Based on MEL Frequency Ceps-
tral Co-efficients. Lambert Academic Publishing.
3. Hardcastle, W. J.; Laver, J.; Gibbon, F. E. (2012). The Handbook of
Phonetic Sciences. John Wiley & Sons.
4. Heigold G.; Moreno, I.; Bengio, S. (2016). “End-to-End Text-De-
pendent Speaker Verification” ICASSP 2016.
5. Neamat El, G.; Yee, S. (2018). Computational Linguistics, Speech
and Image Processing for Arabic Language. World Scientific.
6. Neustein, A. (2012). Forensic Speaker Recognition: Law Enforce-
ment and Counter-Terrorism. Springer.
7. Patil, H. A. (2012). Advances in Speaker Recognition. Springer.
8. Rao, R. R.; Prasad, V. K. (2012). Automatic Text Independent
Speaker Recognition Using Source Feature: Modeling Automation.
Lambert Academic Publishing.
9. Reynolds, D. A.; Campbell, W. (2007). Text-Independent Speaker
Recognition, Springer Handbook of Speech Processing and Com-
munication, Springer-Verlag GMBH, Heidelberg, Germany.
10. Schultz, T.; Kirchhoff, K. (2006). Multilingual Speech Processing.
Academic Press.

-92-
‫الفصل َّ‬
‫الثالث‬
‫تطبيقات ُمعاجلة ال ُّلغة العرب َّية يف مجال التَّ ِ‬
‫عليم‬

‫د‪ .‬رشيف مهدي َعبده‬

‫‪ -1‬تقنيات معاجلة اللغات الطبيعية‪.‬‬


‫‪ -2‬تعلم النطق باستخدام تقنية التعرف اآل ّيل عىل الكالم‪.‬‬
‫‪ -3‬تعلم الكتابة باستخدام تقنية التعرف اآل ّيل عىل الكتابة‪.‬‬
‫‪ -4‬مقرتحات َبحثِ َّية‪.‬‬

‫‪-93-‬‬
-94-
‫ُيستخدم احلاسوب يف تع ّلم اللغات بصورة خاصة؛ لتع ّلم مهارات اللغة‪ ،‬سواء‬
‫أكانت اللغة األم‪ ،‬أم اللغة األجنبية‪ ،‬أو ما يسمى باللغة الثانية‪ .‬وتُستخدم تكنولوجيا‬
‫احلاسب اآليل أداة تعليمية تساعد متعلمي اللغة لتطوير مهاراهتم اللغوية‪ ،‬ومت ّثل بذلك‬
‫ال باإلضافة إىل طرق تعليمية ُأخرى‪ ،‬مما يساعد عىل خلق بيئة تعليمية‬ ‫عنرصا مكم ً‬
‫ً‬
‫ُعرف موسوعة ويكيبيديا استخدام احلاسوب يف تع ّلم اللغات‬ ‫نشطة وغنية لغو ًّيا‪ .‬وت ّ‬
‫بأنّه استخدام تكنولوجيا احلاسب اآليل لتقديم وتعزيز وتقييم املادة املراد ْ‬
‫أن يتعلمها‬
‫الطالب‪ ،‬وذلك من خالل االستفادة من ميزات احلاسوب التفاعلية وأنامطه التعليمية‬
‫والتع ّلمية املختلفة واإلنرتنت‪.‬‬
‫وقد بدأ استخدام احلاسوب فعل ًّيا يف تع ّلم اللغات فـي الستين َّيات من القرن‬
‫العرشين [‪ .]35‬وتطـورت برامج تع ّلم اللغة اإلنجليزية بمساعدة احلاسوب مع‬
‫ِ‬
‫باعتباره مساعدً ا يف تعليم اللغات وتع ّلمها‬ ‫ومـر استخدام احلاسوب‬
‫بداية الثامنين َّيات‪َّ ،‬‬
‫بمراحل ثالث‪ ،‬إ ْذ بدأت املرحلة األوىل فكر ًة يف اخلمسين َّيات‪ ،‬و ُط ِّبقت يف الستين َّيات‪،‬‬
‫وقامت عىل أساس النظرية السلوكية التي عدّ ت احلاسوب أداة مثالية للتعليم‪ ،‬ألنَّه‬
‫يسمح بتكرار تع ّلم املادة مرات عديدة [‪.]36‬‬
‫أ ّما املرحلة الثانية فقد بدأت يف السبعين َّيات‪ ،‬واستمرت خالل الثامنين َّيات‪ ،‬وقامت‬
‫عىل مبادئ نظرية التواصل؛ وكان سبب انتشار هذه النظرية هو االنتقادات التي‬
‫أن الربامج التي تقوم عليها النظرية السلوكية‬ ‫تعرضت هلا النظرية السلوكية‪ ،‬ذلك ّ‬ ‫َّ‬
‫تعتمد عىل التكرار؛ وهي بذلك تفتقد عامل التواصل‪ ،‬حيث تقوم نظرية التواصل عىل‬
‫استخدام الطالب للغة يف أغراض واقعية؛ ويتم تقييم الطالب بنا ًء عىل إعطائه اإلجابة‪،‬‬
‫وليس من خالل األخطاء التي يرتكبها [‪ .]2‬وقد تم تطوير العديد من الربامج التـي‬
‫تعتمد عىل هذه النظرية يف التعليم‪ ،‬وهي تُعطـي شيئا من التحكّم واحلرية أثناء التع ّلم‪.‬‬
‫تعرضت الربامج التي تقوم عىل نظرية التواصل لالنتقاد بسبب عدم وجود‬ ‫و ّملا ّ‬
‫نظام واضح وفاعل الستخدام احلاسب اآليل يف تطوير برامج تعليمية حديثة معتمدة‬
‫حمل الربامج التقليدية ظهرت برامج تقوم عىل عنرص التفاعل بني الطالب‬ ‫أن حتل َّ‬
‫يمكن ْ‬
‫واملادة العلمية املربجمة عىل احلاسوب‪ ،‬وبدأ ظهور تطبيقات ذكية وتفاعلية لتعليم‬
‫اللغات توظف تقنيات املعاجلة اآللية للغات لتوفري بيئة تعليمية تفاعلية متاثل املعلم يف‬

‫‪-95-‬‬
‫الدرايس‪ .‬وبعض هذه التطبيقات الشهرية مثل املصحح اآل ّيل ألخطاء اإلمالء‬
‫ّ‬ ‫الفصل‬
‫اللغوي لألخطاء النحوية التي يستخدمها بالفعل كثري منَّا يف برامج الكتابة‬
‫ّ‬ ‫واملصحح‬
‫مثل برنامج (‪ )MS Word‬الشهري‪.‬‬
‫الدرايس‪.‬‬
‫ّ‬ ‫ال للمعلم يف الفصل‬ ‫هم ومكم ً‬‫عنرصا ُم ًّ‬
‫ً‬ ‫تُعت ََب برجميات تعليم اللغات‬
‫فالدارس يستطيع استخدام هذه الربجميات للتدريب عىل مهارات اللغة املختلفة لعدد‬
‫أي وقت ومكان مالئم له [‪ .]12 ،11‬وترتكز‬ ‫غري حمدود من ساعات التدريب يف ّ‬
‫استخدامات تقنيات اللغة يف التعليم يف ثالثة تطبيقات أساسية‪ ،‬هي‪ :‬استخدام‬
‫تقنيات معاجلة ال ُّلغات الطبيعية (‪ )Natural Language Processing‬يف تعليم‬
‫وتركيب املفردات واجلمل الصحيحة لغو ًّيا‪ ،‬واستخدام تقنية التعرف اآل ّيل عىل الكالم‬
‫(‪ )Automatic Speech Recognition‬يف تعليم مهارة النطق‪ ،‬واستخدام تقنية‬
‫التعرف اآل ّيل عىل الكتابة (‪ )Automatic Handwriting Recognition‬يف تعليم مهارة‬
‫الكتابة‪ .‬وفيام ييل نوضح كيفية توظيف هذه التقنيات يف جمال تعلم اللغة‪.‬‬

‫‪ -1‬تقنيات معاجلة اللغات الطبيعية (‪)NLP‬‬


‫تساعد تقنيات معاجلة اللغات الطبيعية يف جمال تعلم اللغة الطالب عىل التعرف عىل‬
‫الرتكيب الصحيح للمفردات اللغوية وقواعد بناء اجلمل يف تركيب سليم طب ًقا لقواعد‬
‫النحو والرصف‪.‬‬
‫ففي خطوات التعلم األولية ملفردات اللغة العربية يمكن استخدام املدقق اآل ّيل‬
‫ألخطاء اإلمالء الكتشاف أخطاء اإلمالء يف كتابة الطالب وتصحيحها‪ ،‬مثل‪:‬‬
‫والصواب‪ :‬مدرسة‬
‫َّ‬ ‫مدرسه‬
‫والصواب‪ :‬صوت‬
‫َّ‬ ‫صوط‬
‫والصواب‪ :‬إبراهيم‬
‫َّ‬ ‫أبراهيم‬
‫والصواب‪ :‬ذبابة‬
‫َّ‬ ‫زبابة‬

‫اإلمــالئي‪ ،‬أشهرها هو استخــدام قامــوس‬


‫ّ‬ ‫وهناك أساليب متعددة لبنــاء املدقق‬
‫مرجعي ملفــردات اللغة مع بناء نموذج لألخطاء املحتمــلـة‪.‬‬
‫ّ‬

‫‪-96-‬‬
‫الرصيف الغزير‪ ،‬يوجد يف هــذه اللغــة‬
‫ّ‬ ‫ونظرا لتميز اللغة العربية بخاصية االشتقاق‬
‫ً‬
‫عدد ضخم من املفردات ممـا يزيد من صعــوبة استيعـاب الطالب هلذا الكــم مــن‬
‫املفردات وخاصة يف املراحل األولية من تعلم اللغة‪ .‬لذلك يمكن استخدام تقنيــة‬
‫معالــج الرصف اآل ّيل ملساعدة الطالــب يف التــعرف علــى قواعـــد الرصف للغــة‬
‫أيضا استخدام معالج الصــرف‬ ‫العربيــة وتطبيقها عىل العديد من األمثلة‪ .‬ويمكن ً‬
‫اآللــي لتحليل املفردات التي يكتبها الطالب والتأكد من صحتها طب ًقا لقواعد اللغة‬
‫ّ‬
‫وتصحيح أخطائه وتدريبه عىل استخدام هذه القواعد الرصفية‪.‬‬
‫النحوي اآل ّيل لتحليــل البناء‬
‫ّ‬ ‫وعىل مستوى بناء اجلمل يمكن استخدام املحلل‬
‫النحوي للجمل التي ينشئها الطالب وحتكيم صحتها طب ًقا لقواعد النحو يف اللغة‬‫ّ‬
‫العربية وتصحيح األخطاء أو اقرتاح عدد من احللول يف حالة توفرها كام يف هذه األمثلة‪:‬‬
‫مجلة اسمية من مبتدأ وخرب‬ ‫احلديقة مجيلة‬
‫مجلة غري تامة صفة وموصوف‬ ‫احلديقة اجلميلة‬
‫مجلة فعلية من فعل وفاعل ومفعول به‪،‬‬
‫رضب حممد عل ًّيا‬
‫ويالحظ وجوب ظهور التنوين‬
‫والصواب‪ :‬مجيلة‬
‫عدم تطابق النوع‪َّ ،‬‬ ‫الشجرة مجيل‬
‫والصواب يلعبون‬
‫عدم تطابق العدد‪َّ ،‬‬ ‫األوالد يلعب‬
‫مجلة صحيحة‬ ‫يلعب األوالد‬

‫تتميز اللغة العربية بخاصية املرونة النحوية بفعل عمليات التقديم والتأخري واحلذف‬
‫واإلبدال واإلضامر مما يمثل حتد ًيا ملتعلمي قواعد النحو يف اللغة العربية‪ .‬ويوفر املحلل‬
‫النحوي اآل ّيل أداة تعليمية فعالة للمساعدة يف تعلم كيفية بناء اجلمل صحيحة طب ًقا‬
‫ّ‬
‫لقواعد النحو‪.‬‬
‫كثريا‪ ،‬حيث توفر بعض‬ ‫كام تساعد أدوات الرتمجة اآللية متعلمي اللغة الثانية ً‬
‫األدوات البسيطة ‪ -‬مثل ذاكرة الرتمجة ‪ -‬وسيلة فعالة ملعرفة املفردات والنصوص‬
‫اللغوية واملقابل هلا باللغة األخرى‪ .‬ومما ال شك فيه أن توفر خدمة الرتمجة اآللية‬
‫املجانية عىل بعض مواقع شبكة اإلنرتنت قد ساهم بدرجة كبرية يف انتشار تعلم اللغات‬
‫األجنبية عىل الرغم من تدين مستوى الدقة احلايل لربامج الرتمجة اآللية‪ ،‬ولكنها تتطور‬

‫‪-97-‬‬
‫برسعة كبرية مع توفر النصوص املرتمجة يدو ًّيا واستخدامها لتحسني نامذج الرتمجة يف‬
‫هذه الربامج‪.‬‬
‫توجد طريقتان أساسيتان الختبار املستخدم يف أنظمة تعليم اللغات باستخدام‬
‫احلاسب؛ الطريقة األوىل هي أسئلة االختيار من متعدد‪ ،‬والطريقة األخرى هي‬
‫األسئلة اإلنشائية حيث يرتك للمستخدم حرية استخدام مهاراته اللغوية يف كتابة‬
‫اإلجابة املطلوبة كام يف نظام (‪ )Arabic ICALL‬الذي تم تطويره يف كلية احلاسبات‬
‫جامعة القاهرة‪ ،‬حيث يوجه النظام املستخدم للتعرف عىل أخطائه والتوظيف اخلاطئ‬
‫للوحدات اللغوية‪ .‬ويساعد هذا النظام املستخدم عىل االستفادة من أخطائه وتعلم‬
‫كيفية إجراء التعديالت الالزمة لتصحيح أخطائه؛ ويف هذا النظام يتم استخدام حملل‬
‫نحوي للتعرف‬
‫ّ‬ ‫رصيف وحملل‬ ‫ّ‬ ‫أخطاء يستعني بأدوات معاجلة اللغة العربية‪ ،‬مثل حملل‬
‫عىل أخطاء املستخدم اللغوية وتتبع التصحيحات املطلوبة لألخطاء‪ .‬ويتبع النظام‬
‫التعليمي للغة العربية الذي يتم تدريسه يف املدارس املرصية يف املرحلة االبتدائية‪.‬‬
‫ّ‬ ‫املنهج‬
‫الشكل (‪ )1-3‬يوضح مكونات نظام (‪ ،)Arabic ICALL‬و ُي َم ِّثل واجهة املستخدم‬
‫التعليمي وحملل األخطاء اللغوية ووحدة تكوين ردود النظام‪.‬‬
‫ّ‬ ‫التفاعلية واملحتوى‬
‫الطالب‬

‫اإلجابات‬
‫التدريبات‬

‫واجهة‬
‫املحتوى التعليمي‬ ‫املستخدم‬ ‫الرسائل التوجيهية‬
‫التفاعلية‬

‫تصحيح اإلجابة‬
‫خبري لغوى‬

‫وحدة حتليل األخطاء‬ ‫وحدة تكوين الردود‬

‫َّ‬
‫الشكل ‪ :1-3‬الشكل التوضيحي ملكونات نظام (‪ )Arabic ICALL‬لتعليم قواعد اللغة العربية‪.‬‬

‫‪-98-‬‬
‫قائم عىل استخدام القواعد يف التعرف عىل‬
‫منهجا ً‬
‫ً‬ ‫ويتبنى نظام (‪)Arabic ICALL‬‬
‫األخطاء اللغوية؛ ويتميز هذا املنهج بقدرته عىل توفري حتليل تفصييل ألخطاء الطالب‬
‫اللغوي طب ًقا لنظم املعرفة اللغوية‪ ،‬وهذه‬
‫ّ‬ ‫اللغوية‪ ،‬حيث يستطيع متثيل قواعد البناء‬
‫وأيضا تكويد األخطاء‬
‫اللغوي السليم‪ً ،‬‬‫ّ‬ ‫القواعد تؤدي وظيفة مزدوجة لرتميز البناء‬
‫اللغوية املتوقعة عىل مستوى الرصف والنحو والداللة‪ ،‬وتكون مصاحبة بالردود‬
‫التعليمية املناسبة لكل خطأ‪ .‬هذا املنهج ال يضمن تغطية كل األخطاء املحتملة‪ ،‬ويمكن‬
‫تعليمي حمدد‪ ،‬ولكنه يتميز بعدم احتياجه إىل قواعد‬
‫ّ‬ ‫تاليف ذلك بالرتكيز عىل نطاق‬
‫اإلحصائي للتعرف عىل‬
‫ّ‬ ‫بيانات ضخمة لتدريبه مقارنة باألنظمة التي تتبنى املنهج‬
‫األخطاء اللغوية‪.‬‬

‫اآليل عىل الكالم‬


‫‪ -2‬تعلم النطق باستخدام تقنية التعرف ّ‬
‫مؤخرا‪ .‬وقد‬
‫ً‬ ‫حاز جمال تعليم النطق باستخدام احلاسب اآل ّيل عىل كثري من االهتامم‬
‫َ‬
‫تم إنجاز الكثري من األبحاث يف هذا املجال‪ ،‬السيام يف أنظمة تعليم اللغات األجنبية‬
‫باستخدام احلاسب اآل ّيل‪.‬‬
‫بالتدرب عىل قراءة حرف أو كلمة أو مجلة‬
‫ُّ‬ ‫يقوم الطالب ‪-‬يف هذه التدريبات‪-‬‬
‫معروضة أمامه عىل شاشة اجلهاز‪ .‬ويتم استخدام تقنية التعرف اآل ّيل عىل الكالم‬
‫لتحكيم قراءة الطالب وحتديد ما إذا كانت قراءته صحيحة أم خاطئة‪.‬‬
‫وتتكو ُن‬
‫َّ‬ ‫األكثر استخدا ًما يف ُن ُظم تعليم القراءة‪.‬‬ ‫َ‬ ‫و ُت َعدُّ تقنية نامذج ماركوف املخف َّية‬
‫كل منها وحد ًة من الوحدات الصوت َّية‪.‬‬ ‫نامذج ماركوف املخف َّية من عدد من النَّامذج؛ ُت ِّث ُل ٌّ‬
‫تم تسجي ُلها للمتع ِّلم باستخدام‬ ‫الصوت َّية ا َّلتي َّ‬ ‫وتقو ُم أنظم ُة تعليم القراءة بتقييم اجلُملة َّ‬
‫املدخل من املستخدم إىل املقاطع‬ ‫َ‬ ‫يت‬
‫هذه النَّامذج‪ ،‬حيث يتم تقطيع التسجيل الصو ّ‬
‫كل من‬ ‫الصوتية املختلفة طب ًقا للكتابة الصوتية للمثال املستخدم يف االختبار‪ .‬وتكون ٌّ‬
‫يت‬
‫إحصائي يمثل درجة متاثل هذا املقطع الصو ّ‬ ‫ّ‬ ‫هذه املقاطع الصوتية مصحوب ًة بتقييم‬
‫مع نامذج ماركوف اخلاصة بالوحدة الصوتية هلذا املقطع‪ .‬يتم تقييم قراءة املستخدم‬
‫عن طريق حساب متوسط تقييامت املقاطع الصوتية املختلفة يف العينة الصوتية حتت‬
‫االختبار؛ وإذا ختطت قيمة حمددة (‪ )threshold‬يتم اعتبار قراءة املستخدم قراءة‬

‫‪-99-‬‬
‫ويتم اختيار القيمة املحددة (‪ )threshold‬من التجارب املعيارية للنظام عىل‬
‫صحيحة‪ُّ .‬‬
‫عدد كبري من مستخدمي النظام‪.‬‬
‫ويوضح الشكل (‪ )2-3‬العنارص املكونة لنظام تعليم النطق‪.‬‬

‫الشكل ‪ :2-3‬نظام حتليل أخطاء النطق‪.‬‬


‫َّ‬

‫يتم استخدام نامذج ماركوف يف تطبيق تعليم القراءة والنطق بنفس طريقة توظيفها‬
‫ٍ‬
‫اختالف يتم َّث ُل يف أنَّنا يف هذا التطبيق ن ُع َل ِّم‬ ‫يف تطبيق التعرف اآل ّيل عىل الكالم‪ ،‬مع‬
‫مسب ًقا اجلملة التدريبية التي ينطقها املستخدم مما يساعد عىل حتديد نطاق البحث ملحرك‬
‫التعرف اآل ّيل؛ األمر ا َّلذي يساعد عىل حتسني دقة النتائج‪ .‬ويكون نطاق البحث فقط يف‬

‫‪-100-‬‬
‫الصور املختلفة ألخطاء النطق يف اجلملة التدريبية املستخدمة‪ ،‬كام هو موضح بالشكل‬
‫رقم (‪.)3-3‬‬

‫َّ‬
‫الشكل ‪ :3-3‬مثال ألخطاء النطق يف جزء من كلمة‪.‬‬

‫يعترب أسلوب تفاعل النظام مع املتعلم يف التطبيقات التعليمية من أهم العنارص‬


‫التي تؤثر يف درجة استفادة املتعلم‪ .‬لذلك يفضل ‪ -‬يف تطبيقات تعليم القراءة ‪ -‬توفر‬
‫درجة من الثقة يف تقييم النظام لقراءة املستخدم لتقليل احلاالت التي يصدر فيها تقييم‬
‫خاطئ لقراءة الطالب؛ ويمكن يف هذه التطبيقات حساب ُمعامل الثقة؛ ويستخدم هذا‬
‫املعامل يف اختيار الرسالة املناسبة لتحكيم قراءة مستخدم النظام‪ .‬هناك طرق متعددة‬
‫تم اقرتاحها حلساب هذا املعامل‪ ،‬من أفضلها معامل نسبة األرجح َّية (‪Likelihood‬‬
‫‪ )Ratio‬الذي يتم حسابه عن طريق ترتيب املقاطع الصوتية يف قراءة املستخدم بناء عىل‬
‫اإلحصائيالتالية‪:‬‬
‫املصاحب هلا؛ ثم يتم حساب معامل الثقة باملعادلة التالية‪:‬‬ ‫الثقة ابملعادلة‬ ‫معامل‬
‫التقييم‬
‫ّ‬
‫متوسط تقييم ارجح مسار يف مناذج ماركوف‬
‫معامل الثقة =‬
‫متوسط تقييم اثىن أرجح مسار يف مناذج ماركوف‬

‫ويعتمد هذا املعامل على قيمة االختالف بني أرجح تقييم من البدائل املتاحة لنطق الكلمة‬
‫موضع االختبار والتقييم التايل يف الرتتيب؛ فوجود اختالف كبري يدل على وجود درجة عالية‬
‫من الثقة يف حتكيم النظام لقراءة املستخدم‪-101-.‬‬
‫ويعتمد هذا املعامل عىل قيمة االختالف بني أرجح تقييم من البدائل املتاحة لنطق‬
‫الكلمة موضع االختبار والتقييم التايل يف الرتتيب؛ فوجود اختالف كبري يدل عىل‬
‫وجود درجة عالية من الثقة يف حتكيم النظام لقراءة املستخدم‪.‬‬
‫وتعتمد الرسائل التصحيحية يف هذا النظام عىل مدى ثقة النظام من النتائج (معامل‬
‫صغريا يسري النظام عىل إحدى هذه الطرق‪:‬‬
‫ً‬ ‫الثقة)؛ وإذا كان معامل الثقة‬
‫‪ -1‬إمهال اخلطأ متا ًما وعدم ظهور رسالة له (وهذا جيد للمبتدئني‪ ،‬ألن إظهار إنذار‬
‫خاطئ يثبط من عزم املتعلم)‪.‬‬
‫‪ -2‬طلب إعادة اجلملة من املستخدم ألهنا غري واضحة‪.‬‬
‫‪ -3‬إظهار رسالة توضح وجود خطأ غري حمدد‪ ،‬وطلب إعادة اجلملة‪.‬‬
‫‪ -4‬إظهار رسالة بأكثر األخطاء شيو ًعا يف هذا املوضع‪.‬‬
‫ويمكــن حتســني أداء أنظمــة تعليــم القــراءة بدرجةــ كبيــرة عن طريــق‬
‫تكييــف وحتويــل النامذج الصوتية (‪ )Models Adaptation‬لتشابه خصائص صوت‬
‫اخلطــي‪،‬‬
‫ّ‬ ‫املستخدم‪ .‬ومن أشهر طرق حتويل نمــاذج ماركــوف طــرق التحــويل‬
‫نظـرا لسهــولة تنفيــذها وفاعلية نتائجها‪ .‬ويف هذه العملية يتم جتميع عدد قليــل من‬
‫ً‬
‫اجلمل من املستخـــدم الختيــار أقرب حزمة صــوتية لصــوت املستخــدم؛ وهذه‬
‫احلــزمة تستخــدم كنموذج مرجعـي لصــوت املستخدم‪ .‬ثم ُيطلب من املستخدم‬
‫إدخال عدد من اجلمل يتم حتكيمــها باستخدام هذا النموذج املرجعي‪ .‬وإذا رأي‬
‫النظــام أن اجلمــلة خاليــة من أخطاء القراءة يقوم بوضعها يف املجموعة التي سيتم‬
‫استخدامها يف عملية حتويل النموذج الصويت‪ .‬تستمــر هذه العملــية حتى يتم جتميع‬
‫كمية كافيـــة من اجلمــل لبـــدء عملية حتويل النمـــاذج الصوتية باستخـــدام‬
‫اخلطــي إىل شكـــل حياكـــي صــوت املستخــدم‪.‬‬
‫ّ‬ ‫يت‬
‫مصفـــوفات التحويل الصو ّ‬
‫اخلطي يف نامذج‬
‫ّ‬ ‫رسم توضيح ًّيا لعملية التحـــويل‬
‫ويوضح الشكل رقم (‪ً )4-3‬‬
‫ماركوف‪.‬‬

‫‪-102-‬‬
‫عملية حتويل النم ــاذج الصوتية ابستخ ــدام مصف ــوفات التحويل الصويتّ اخلطـ ّـي إىل شك ــل‬
‫اخلطي‬
‫ّ‬ ‫حياك ــي صــوت املستخــدم‪ .‬ويوضح الشكل رقم (‪ )4-3‬رمسًا توضيحيًّا لعملية التح ــويل‬
‫يف مناذج ماركوف‪.‬‬

‫املعدلللمستخدم‬
‫للمستخدم‬ ‫النموذج املعدل‬
‫النموذج‬
‫‪µ2‬‬
‫‪s22‬‬
‫‪s1‬‬
‫‪1‬‬
‫‪α2‬‬

‫النموذج العام‬
‫النموذج العام‬

‫‪µµ11‬‬ ‫‪µµ2 2‬‬

‫الصوتية‪.‬‬
‫النامذجالصوتية‪.‬‬
‫حتويلالنماذج‬
‫عمليةحتويل‬
‫‪:4-3‬عملية‬ ‫الش َّ‬
‫َّكلكل‪:4-3‬‬
‫الش‬

‫احلاسبيف‬
‫اآليل‬
‫ّ‬
‫استخداماستخدام‬
‫احلاسب‬ ‫التحدي‪:‬‬ ‫عالية من‬
‫التحدي‪:‬‬ ‫درجةمن‬‫متثل عالية‬
‫التيدرجة‬
‫النطقمتثل‬ ‫تعليمتعليم‬
‫النطق اليت‬ ‫تطبيقات‬ ‫ومنومن‬
‫تطبيقات‬
‫اآليل يف تعليم قراءة وجتويد القرآن الكريم‪ .‬فباملقارنة مع تطبيق تعليم اللغات ‪ -‬حيث‬
‫تعليم ق ّراءة وجتويد القرآن الكرمي‪ .‬فباملقارنة مع تطبيق تعليم اللغات – حيث توجد فروق‬
‫توجد فروق واضحة بني النطق الصحيح واألخطاء ‪ -‬حتتاج بعض قواعد النطق يف‬
‫واضحة بني النطق الصحيح واألخطاء – حتتاج بعض قواعد النطق يف علم التجويد إىل درجة‬
‫علم التجويد إىل درجة عالية من احلساسية من أجل احلكم بصحة تطبيق القاعدة‬
‫استخدام‬ ‫درجةيتطلب‬
‫عالية جدًّ ا من‬ ‫ذي مما‬
‫التجويدية؛‬ ‫القاعدة‬
‫عىل الكالم‬ ‫للتعرف‬‫بصحةآيلتطبيق‬ ‫عالية من احلساسية من أجل احلكم‬
‫التجويدية؛ مما يتطلب استخدام معالج ّ‬
‫معاجلة‬ ‫التجويدية األكرب هو‬
‫والفونيامت فوق‬ ‫الدقة‪ .‬والتحدي‬ ‫التقنيات من‬
‫لألحكام‬ ‫درجةهذهعالية جدًّا‬ ‫هو ذي‬
‫معاجلة‬ ‫الكالم‬
‫والتحديعلىاألكرب‬
‫الدقة‪ .‬للتعرف‬
‫آيل‬
‫معاجل ّ‬
‫فوق املقطعية اليت ينبغي على دارس القرآن‬ ‫الفونيمات‬
‫تعلمها‪.‬‬ ‫دارس والقرآن‬
‫التجويدية‬
‫لألحكام عىل‬
‫التقنياتالتي ينبغي‬
‫هذهاملقطعية‬
‫تعلمها‪.‬ويوضح الشكل (‪ )5-3‬مثاالً لشاشة تطبيق تعليم التجويد حيث يستطيع املستخدم‬
‫بتوليــد‬
‫بدء‬ ‫الربنامــج‬
‫املستخدم‬ ‫فيقوميستطيع‬
‫عليه‪،‬حيث‬ ‫التــدرب‬
‫التجويد‬ ‫لشاشةيريــد‬
‫تطبيق تعليم‬ ‫الدرسالً الذي‬
‫باختيار‪ )5-‬مثا‬ ‫التدرب‬
‫الشكل (‪3‬‬ ‫بدء‬
‫ويوضح ُّ‬
‫خاصةقارئ‬
‫هلذا‬ ‫بصوت‬‫التدريباتـات‬
‫لتالوةــجهذهبتوليــد تدريبـ‬ ‫املستخدم‬
‫فيقوم الربانم‬ ‫فيستمععليه‪،‬‬
‫الدرس‪،‬التــدرب‬ ‫الدرسهلذا‬
‫الذي يريــد‬ ‫ابختيارخاصة‬
‫تدريبــات‬
‫التدرب‬
‫ُّ‬
‫قيايس ثم عليه أن يكررها‪ ،‬فيقوم الربنامج بتوليد تقرير مكتوب ومنطوق عن قراءة‬ ‫ّ‬
‫قياسي ُث عليه أن يكررها‪،‬‬
‫ّ‬ ‫الدرس‪ ،‬فيستمع املستخدم لتالوة هذه التدريبات بصوت قارئ‬
‫املستخدم يرشح له فيها أخطاءه التجويدية واللغوية كام هو موضح بالشكل‪ .‬ويظهر يف‬
‫املستخدم مـع تلويـن احلـرف أو احلروف التي فيها‬
‫‪113‬‬ ‫التقرير املكتوب املقطع الذي قرأه‬
‫اخلطأ باللون األمحر مع شـرح للخـطأ املر َتكَب؛ ويتم توليد التقرير املنطــوق بحــيث‬
‫يظن املستخدم أن احلاسوب يفهمه ويتفاعل معه‪ ،‬ألنه خيربه باخلطأ صــوت ًّيا‪.‬‬

‫‪-103-‬‬
‫يت مثاالً منطو ًقا عن احلكــم الذي كــان فيه اخلطأ من قبل‬
‫ويتضمن التقرير الصو ّ‬
‫املستخدم‪.‬‬

‫َّ‬
‫الشكل ‪ :5-3‬شاشة التدريبات يف برنامج تعلم التجويد‪.‬‬

‫ويوضح الشكل (‪ )6-3‬نظا َم بناء األخطاء التجويدية املستخدمة يف هذا التطبيق؛‬


‫وهو يستخدم جمموعة من القواعد تم تصميمها بصورة مرنة ت َُس ِّهل الت َ‬
‫َّعديل باإلضافة‬
‫أو احلذف لألخطاء التي ُيكِّمها النظام [‪.]4‬‬

‫‪-104-‬‬
‫النص القرآين‬

‫رموز كتابة النص‬ ‫ُمرك توليد اخلصائص‬

‫خصائص على كل حرف‬

‫ُمرك توليد الكتابة الصوتية‬

‫الكتابة الصوتية‬

‫مولد األشكال احملتملة‬

‫أشكال التجويد احملتملة‬

‫قواعد توليد شبكة األخطاء‬ ‫مولد شبكة األخطاء‬

‫شبكة قابلة للبحث‬

‫التجويد‪.‬‬ ‫ألحكام‬
‫التجويد‪.‬‬ ‫النطققاطب ًقا‬
‫ألحكام‬ ‫أخطاء‬
‫النطق طب‬ ‫شبكةأخطاء‬
‫توليدشبكة‬
‫حمركتوليد‬
‫‪ُ ::6-3‬مرك‬ ‫الشكل‬
‫الش‬
‫َّكل ‪6-3‬‬ ‫َّ‬
‫ً‬
‫‪115‬‬
‫‪-105-‬‬
‫يعتمد توليد شبكة األخطاء عىل حمرك توليد الكتابة الصوتية للقرآن الكريم الذي‬
‫يتكون من عدة طبقات؛ وهى حمرك األحداث الذي يبحث خالل الرسم العثامين للقرآن‬
‫ي حالة نطقه (منطوق أو‬ ‫خاصا و ُي َب ِّ ُ‬
‫الكريم عن خصائص كل حرف ويولد له كو ًدا ًّ‬
‫غري منطوق‪ ،‬مشدد أو غري مشدد‪ ،‬التشكيل اخلاص باحلرف ‪ )...‬وخصائصه الصوتية‬
‫(جمهور‪ ،‬مهموس‪ ،‬خمرج احلرف‪ .)... ،‬ويقوم حمرك توليد الكتابة الصوتية بتحليل هذه‬
‫الصحيحة طب ًقا ألحكام تالوة‬ ‫َّ‬
‫األكواد‪/‬الشفرات وخصائص توليد الكتابة الصوتية َّ‬
‫القرآن الكريم؛ ثم يقوم حمرك مقارنة النامذج (القواعد) بتجميع كل هذه املعلومات‬
‫وتوليد أخطاء التالوة املتوقعة‪.‬‬
‫والقاعدة اآلتية توضح طريقة توليد األخطاء االفرتاضية‪:‬‬
‫بافرتاض َّ‬
‫أن الوحدة احلالية‪:‬‬
‫فونيم= ‪ ،Phc‬نوع احلركة= ‪ ،Vc‬طول احلركة= ‪،Lc‬‬
‫مشدد= ‪ ،Sc‬منطوق= ‪ ،Pc‬إدغام= ‪Ec‬‬
‫والوحدة السابقة‪:‬‬
‫فونيم= ‪ ،Php‬نوع احلركة= ‪ ،Vp‬طول احلركة= ‪،Lp‬‬
‫مشدد= ‪ ،Sp‬منطوق= ‪±P‬‬
‫والوحدة التالية‪:‬‬
‫فونيم= ‪ ،Phn‬نوع احلركة= ‪ ،Vn‬طول احلركة= ‪،Ln‬‬
‫مشدد= ‪ ،Sn‬منطوق= ‪Pn‬‬
‫مسارا خلطأ التالوة باخلصائص التالية‪:‬‬
‫ً‬ ‫إ ًذا أضف‬
‫رقم اخلطأ=‪ ،C‬نوع اخلطأ=‪ ،T‬كلمة اخلطأ=‪ ،W‬مقدار شيوع اخلطأ=‪ ،F‬فونيم=‪ ،Ph‬نوع‬
‫احلركة=‪ ،V‬طول احلركة=‪ ،L‬مشدد=‪ ،S‬منطوق=‪ ،P‬مدغم=‪E‬‬

‫وتستخدم هذه النامذج (القواعد) بعد توليدها للمقارنة مع الكتابة الصوتية للقرآن‬
‫الكريم لتوليد شبكة مسارات األخطاء املتوقعة‪ .‬ويقوم مولد شبكة مسارات األخطاء‬
‫برتتيب النامذج (القواعد) التي تطابقت بشكل تنازيل حسب مدى تطابقها مع احلالة‬
‫احلالية ثم هيمل كل النامذج (القواعد) التي تولد نفس اخلطأ ما عدا أوهلا‪ ،‬ثم يف‬
‫النهاية تولد الشبكة بشكل يناسب نظام التعرف عىل الصوت‪ .‬والوحدة املستخدمة‬
‫يف بناء شبكة األخطاء يف هذا االخرتاع شبيهة بتلك التي تستعمل يف طرق تعليم تالوة‬

‫‪-106-‬‬
‫القرآن الكريم‪ ،‬حيث إن مفهوم الفونيم غري مالئم للمستخدم‪ .‬وتتكون الوحدات‬
‫يف هذا النظام من حرف‪+‬حركة قصرية‪ ،‬حرف‪+‬حركة طويلة‪ ،‬حرف ساكن‪ ،‬حرف‬
‫مشدد‪+‬حركة قصرية‪ ،‬حرف مشدد‪+‬حركة طويلة‪ ،‬حرف مشدد ساكن‪.‬‬
‫تعد اختبارات األداء العملية من أهم وسائل تقييم أنظمة تعلم القراءة لبيان دقتها‬
‫وأثرها عىل منحنى التعلم لدى املستخدم املبتدئ‪ .‬وأحد هذه االختبارات هو تقييم‬
‫برشي باستخدام نفس املعطيات‪ .‬ففي جتربة لقياس‬ ‫ّ‬ ‫أداء النظام باملقارنة مع أداء معلم‬
‫االختالف البرشي املسموح به يف تعليم التجويد عن طريق التحقق من نسبة االتفاق‬
‫واالختالف يف حتكيم الشيوخ املجازين لقراءة املتعلم العادي‪ ،‬تم تسجيل ثالثمئة‬
‫حماولة لنطق كلامت أو مجل حتتوي عىل أحكام جتويد حمددة من شخص عادي‪ ،‬ثم طلب‬
‫كل عىل حدة‪ ،‬ثم تم إدخال‬ ‫من أربعة شيوخ جمازين حتكيم هذه املحاوالت الثالثمئة‪ٍّ ،‬‬
‫نفس املحاوالت عىل برنامج تعليم التجويد لتحكيمها‪ .‬أظهرت النتائج أن‪ :‬متوسط‬
‫اتفاق حتكيم أي حمكم جماز مع أي حمكم جماز آخر يف حدود ‪ ،٪80‬وهي نفس نسبة‬
‫أي من الشيوخ املجازين‪ .‬والنسبة التي خالف فيها الربنامج إمجاعهم‬ ‫اتفاق الربنامج مع ٍّ‬
‫حوايل ‪ ٪4‬فقط‪ ،‬وهي نفس نسبة اختالف أي من الشيوخ مع إمجاع باقي الشيوخ‪.‬‬

‫َّ‬
‫الشكل ‪ :7-3‬توضيح ملدى اتفاق واختالف املشايخ مع بعضهم البعض ومع برنامج تعليم التجويد‪.‬‬

‫‪-107-‬‬
‫ويف اختبار آخر لقياس أثر برنامج تعليم التجويد عىل تعلم الفرد املبتدئ حلكم‬
‫أو أكثر من أحكام التجويد‪ ،‬متت االستعانة بمجموعة من األفراد العاديني الذين ال‬
‫جييدون أحكام قراءة القرآن الكريم‪ ،‬ثم إجراء اختبار قبيل ‪ -‬قبل استخدام التقنية ‪-‬‬
‫لتحديد مستوى املستخدم‪ ،‬ثم إتاحة الفرصة له للتعلم عىل احلكم أو القاعدة املطلوبة‬
‫مع سامع أمثلة ونامذج صوتية للحكم‪ ،‬وتم الرتكيز عىل قواعد ثالث‪ ،‬هي‪ :‬القلقلة‪،‬‬
‫وحكم إدغام النون الساكنة والتنوين بغنة‪ ،‬وحكم إقالب النون الساكنة والتنوين‪.‬‬
‫وتم اختبار املستخدم مرة أخرى بعد فرتة من التدريب ‪ -‬ساعة تقري ًبا ‪ -‬باستخدام‬
‫الربنامج‪ ،‬ثم مرة ثالثة بعد ساعة تدريب أخرى‪ .‬وأظهرت النتائج ارتفاع منحنى التعلم‬
‫ملجموعة املستخدمني بنسب كبرية حيث بدأ بنسب تقرتب من ‪ ٪40‬وارتفع إىل ما يزيد‬
‫عىل ‪ ٪70‬خالل بضع ساعات من التدريب باستخدام الربنامج ‪ .‬ويف هذا برهان عىل‬
‫فعالية التقنية وكفاءهتا‪ .‬ويوضح الشكل (‪ )8-3‬متوسط نتائج املشاهدات التي أثمرهتا‬
‫التجربة مع عرشة مستخدمني‪.‬‬

‫نسبة إتقان الحكم‬

‫ساعات التدريب‬
‫إقالب‬ ‫القلقلة‬ ‫إدغام‬
‫املبتدئني‪.‬املبتدئني‪.‬‬
‫التعلم لدى‬ ‫منحنى‬
‫التعلم لدى‬ ‫تطويرمنحىن‬
‫التجويديفيفتطوير‬ ‫تقنيةتقنيةتعليم‬
‫تعليم التجويد‬ ‫أثر أثر‬ ‫لقياس‬
‫لقياس‬ ‫شكل بياين‬
‫شكل بياين‬ ‫‪:8-3 :8-3‬‬ ‫َّ‬
‫الشكل الشَّكل‬

‫اآليل عىل الكتابة‬


‫‪ -3‬تعلم الكتابة باستخدام تقنية التعرف ّ‬
‫‪ -3‬تعلم الكتابة ابستخدام تقنية التعرف َّاآلل على الكتابة‬
‫مؤخرا ّتطوير تطبيقات الستخدامها يف تعليم‬ ‫مع توفر أجهزة الكمبيوتر اللوحية‪ ،‬تم‬
‫ً‬
‫األجهزة‬ ‫توفريفهذه‬
‫تعليم مهارة‬ ‫الكتابة‪ ،‬حيث‬
‫الستخدامها‬ ‫عىلتطبيقات‬
‫اآل ّيلتطوير‬ ‫التعرف َّ‬
‫مؤخًرا‬ ‫تقنيات‬
‫اللوحية‪ ،‬مت‬ ‫باستخدام‬
‫الكمبيوتر‬ ‫الكتابةأجهزة‬
‫مهارةمع توفر‬
‫كتابة‬
‫شاشات‬ ‫األجهزةجودة‬
‫بتحكيم درجة‬
‫التطبيقتوفر هذه‬ ‫سطحها‪ .‬ويقوم‬
‫الكتابة‪ ،‬حيث‬ ‫التعرفعىل ّ‬
‫اآليل على‬ ‫يمكنتالكتابة‬ ‫شاشات تفاعلية‬
‫ابستخدام تقنيا‬ ‫الكتابة‬
‫ويقوم التطبيق بتحكيم درجة جودة كتابة الطالب طب ًقا‬ ‫يب‪.‬‬
‫العر ّ‬ ‫كتابة اخلط‬
‫سطحها‪.‬‬ ‫لقواعد على‬ ‫تفاعلية طب ًقا‬
‫ُيكن الكتابة‬ ‫الطالب‬
‫العريب‪.‬‬
‫لقواعد كتابة اخلط ّ‬
‫‪-108-‬‬
‫َبثي يف كلية احلاسبات جبامعة القاهرة بتطوير تطبيق لتعليم كتابة اخلط‬ ‫ولقد قام فريق ٌّ‬
‫الطفل على حتسني جودة‬ ‫العريب لألطفال يف املراحل التعليمية األولية‪ .‬ويساعد هذا التطبيق ِ‬
‫بحثي يف كلية احلاسبات بجامعة القاهرة بتطوير تطبيق لتعليم كتابة‬ ‫ٌّ‬ ‫ولقد قام فريق‬
‫فل عىل‬‫التطبيق ال ِّط َ‬
‫ُ‬ ‫األول َّية‪ .‬ويساعدُ هذا‬
‫يب لألطفال يف املراحل التعليم َّية َّ‬
‫اخلط العر ّ‬
‫لتدرج تعليم‬ ‫ٍ‬
‫حتسني جودة خطه باستخدام مستويني من التَّدريبات بصورة مشاهبة ُّ‬
‫يب يف مناهج التعليم للمرحلة االبتدائية؛ املستوى األول‬ ‫اخلط العر ّ‬‫ّ‬ ‫الكتابة يف ُد ُروس‬
‫هو الكتابة املوجهة للدروس األولية لتعليم الكتابة باستخدام صور منقطة ألشكال‬
‫احلروف املختلفة؛ أ َّما املستوى الثاين فهو الكتابة احلرة‪ ،‬حيث يامرس الطالب التدريب‬
‫عىل الكتابة بصورة غري مقيدة‪.‬‬
‫بالتدرب عىل كتابة حرف أو كلمة أو‬‫ُّ‬ ‫يف تدريبات املستوى األول‪ ،‬يقوم الطالب‬
‫مجلة معروضة أمامه عىل شاشة اجلهاز‪ ،‬حيث يتم عرض صورة متحركة توضح طريقة‬
‫الكتابة املثالية للنموذج املوضح عىل الشاشة للمستخدم‪ ،‬ثم يتم عرض صورة هلذا‬
‫ب من املستخدم الكتابة عىل هذا النموذج‬ ‫النموذج عىل الشاشة بلون شفاف‪ .‬و ُيط َل ُ‬
‫عن طريق املرور فوقه بالقلم بنفس طريقة الكتابة املثالية السابق عرضها له؛ وحيتوي‬
‫هذا النموذج الشفاف عىل عدد من نقاط التحكيم غري املرئية للمستخدم كام هو موضح‬
‫بالشكل (‪ُ .)9-3‬ث َّم تُستَخد ُم هذه النِّقاط لتحكيم العنارص التالية يف كتابة املستخدم‪:‬‬
‫‪ -1‬درجة قرب كتابة املستخدم من موضع نقاط التحكيم‪.‬‬
‫‪ -2‬ترتيب مرور كتابة املستخدم عىل نقاط التحكيم‪.‬‬
‫‪ -3‬عدد الوقفات يف كتابة املستخدم‪.‬‬
‫يتم جتميع هذه التقييامت يف تقييم إمجا ّيل يستخدم إلنتاج رسائل تصحيحية مناسبة‬
‫لألخطاء املحددة‪ ،‬حيث تساعد هذه الرسائل يف إرشاد املستخدم لطريقة الكتابة السليمة‬
‫وتوجيه حركة اليد يف االجتاه الصحيح والتحكم يف القلم املستخدم‪ ،‬كام تساعده عىل‬
‫الكتابة بطريقة سهلة التعلم وواضحة‪.‬‬

‫املو َّجه‪.‬‬ ‫َّ‬


‫الشكل ‪ :9-3‬نموذج تعلم الكتابة َ‬

‫‪-109-‬‬
‫بعد أن جيتاز الطالب املستوى األول من التدريبات يمكن أن ينتقل إىل املستوى‬
‫ال َّثاين يف الكتابة احلرة‪ ،‬حيث يكون قد متكن من إتقان املهارات األساسية لكتابة‬
‫احلروف؛ لذلك يتم تدريب الطالب ‪ -‬يف املستوى الثاين ‪ -‬عىل الكتابة بدرجة أكرب من‬
‫توجيه الختبار مدى استيعاب اجلهاز احلركي عند الطالب ألشكال كتابة‬ ‫ٍ‬ ‫احلرية بدون‬
‫احلروف وختزينها يف الذاكرة الباطنية‪.‬‬
‫ويف تدريبات هذا املستوى يتم عرض صورة متحركة توضح طريقة الكتابة املثالية‬
‫ب من املستخدم كتابة النموذج بنفسه‬ ‫للنموذج املوضح عىل الشاشة للمستخدم‪ ،‬ثم ُيط َل ُ‬
‫ُعر ُض نتيجة تقييم هذه‬ ‫عىل مساحة بيضاء‪ .‬ويتم حتكيم جودة كتابة املستخدم‪ُ ،‬ث َّم ت َ‬
‫الكتابة مع توضيح نوعية اخلطأ وموضعه يف أي حرف من حروف النموذج املستخدم‪.‬‬
‫حيث يتم يف‬ ‫ُ‬ ‫ولعمل هذا التحكيم يتم تنفيذ مرحلتني من املعاجلة لكتابة املستخدم؛‬
‫املرحلة األوىل حتديد املقاطع احلرفية يف كتابة املستخدم وحدود البداية والنهاية لكل‬
‫حرف يف عينة الكتابة‪ ،‬وذلك باستخدام نامذج ماركوف املخفية ا َّلتي سبق رشحها يف‬
‫تطبيق تعليم القراءة‪.‬‬
‫نظرا للتطابق الكبري بني عمليتي النطق والكتابة؛ فاألوىل هي‬
‫وتُستَخدَ ُم هذه النامذج ً‬
‫تتابع من األصوات املنطوقة‪ ،‬والثانية هي تتابع من احلروف املكتوبة‪ ،‬مع اختالف بسيط‬
‫يف الثانية‪ ،‬إذ عادة تُضاف النقط والعالمات التشكيلية بعد إمتام كتابة الكلامت‪ .‬وهذا‬
‫التحرك اخللفي يف اجتاه الكتابة ُيسبب نو ًعا من التعارض مع الفرض األسايس لنامذج‬
‫ماركوف املخفية من نوع (‪)Ergodic HMM‬؛ وهو أهنا تستطيع عمل نمذجة للبيانات‬
‫املتتابعة يف اجتاه أمامي فقط‪.‬‬
‫أضي َفت مرحلة قبل املعاجلة إلعادة ترتيب تتابع‬ ‫وللتغلب عىل هذا التعارض‪ِ ،‬‬
‫الوحدات املكتوبة يف عينة الكتابة لتكون يف تسلسل أمامي‪ ،‬مما يسهل استخدام نامذج‬
‫ماركوف املخفية من نوع (‪ )Ergodic HMM‬لعمل نمذجة هلذه البيانات‪.‬‬
‫وبعد حتديد املقاطع احلرفية يف كتابة املستخدم‪ ،‬يتم حتليل جودة كتابة كل مقطع‬
‫وحتديد نوع اخلطأ يف شكل كتابة احلرف إن وجد‪ ،‬ويتم ذلك باستخدام عدد من‬
‫املصنفات الثنائية‪ ،‬يتخصص كل مصنف منها يف إعطاء قرار ثنائي عن وجود خطأ حمدَّ د‬
‫يف كتابة احلرف أو عدم وجوده‪.‬‬

‫‪-110-‬‬
‫يف الشكل (‪ )10-3‬يتم عرض ُم َ َّطط ملراحل حتكيم الكتابة احلرة للمستخدم‪ ،‬وكام‬
‫نرى يف مراحل حتكيم كلمة «حافظ» بعد املعاجلة املبدئية وإعادة ترتيب اجتاه الكتابة‬
‫يف الكلمة تم حتديد املقاطع احلرفية يف الكلمة‪ ،‬وهي هنا أربعة مقاطع؛ وتم حتكيم‬
‫جودة كتابة كل حرف واألخطاء امللحوظة فيه؛ مثل حرف األلف‪ ،‬وهي مكتوبة بشكل‬
‫مقوس يف هذه العينة‪.‬‬

‫كتابة املستخدم‬

‫املعاجلة املبدئية‬

‫الكتابة المرتبة‬

‫نماذج‬ ‫مرحلة التقطيع‬


‫التدريب‬

‫المقاطع الحرفية‬

‫مرحلة تصنيف‬
‫األخطاء‬

‫الرسائل التوضيحية‬ ‫ألف مقوسة‬

‫احلرة‪.‬احلرة‪.‬‬
‫الكتابة‬ ‫حتكيم‬
‫الكتابة‬ ‫مراحل‬
‫حتكيم‬ ‫‪:10-3‬راحل‬ ‫الش َّ‬
‫َّكلكل‪ :10-3‬م‬
‫الش‬

‫استخدامها‪.‬‬ ‫التي يمكن‬


‫استخدامها‪ .‬وتحـ َع ُّد‬ ‫اآلليةُيكن‬ ‫املصنفات‬
‫اآللية اليت‬ ‫العديد من‬
‫املصنفات‬ ‫هناك هناك‬
‫العديد من‬ ‫الكتابةالكتابة‬
‫أخطاءأخطاء‬
‫ولتصنيف‬ ‫ولتصنيف‬
‫تطبيقاتيف‬
‫أفضليفالوسائل‬ ‫أفضل من‬
‫الوسائل‬ ‫‪)support‬‬
‫‪ )vector‬من‬ ‫‪vector (machine‬‬
‫‪supportmachine‬‬ ‫َّجهات الدَّ اعمة‬
‫الدتَّاعمة (‬
‫ات امل‬ ‫آليَّاتو ُت َاملعتدُّ آل َّي‬
‫َّجهات‬
‫حرف‬
‫مكتوبكلابحتوائه‬ ‫حرفتصنيف‬ ‫حيث يتم‬ ‫تعليميتمالكتابة‪،‬‬
‫تصنيف كل‬ ‫تطبيقحيث‬ ‫تعليممثل‬
‫الكتابة‪،‬‬ ‫الثنائية‪،‬‬
‫التصنيفتطبيق‬ ‫تطبيقات‬
‫الثنائية‪ ،‬مثل‬ ‫التصنيف‬
‫أخطاء‬
‫عدد من‬ ‫لعدديف من‬ ‫أخطاءأمثلة‬
‫الكتابة‬ ‫منيوضح‬ ‫(‪)1-3‬‬
‫واجلدول لعدد‬ ‫حمدد‪1-‬أم) ال‪.‬‬
‫يوضح أمثلة‬ ‫خطأ (‪3‬‬
‫اجلدول‬ ‫عىل‬ ‫باحتوائه‬
‫ال‪ .‬و‬ ‫ُمدد أم‬ ‫مكتوب‬ ‫على خطأ‬
‫احلروف‪ ،‬حيث يتم بناء عدد من املصنفات الثنائية مساو لعدد األخطاء اليت مت حصرها لكل‬
‫‪ -111-‬من الكتابة املثالية وعينات من الكتابة‬
‫حرف‪ .‬ويتم تدريب هذه املصنفات ابستخدام عينات‬
‫ابخلطأ احملدد‪ .‬ويتم استخدام جزء من عينات الكتابة لتوليف أفضل اختيار لبارامرتات املصنف‪.‬‬
‫الكتابة يف عدد من احلروف‪ ،‬حيث يتم بناء عدد من املصنفات الثنائية مساو لعدد‬
‫األخطاء التي تم حرصها لكل حرف‪ .‬ويتم تدريب هذه املصنفات باستخدام عينات‬
‫من الكتابة املثالية وعينات من الكتابة باخلطأ املحدد‪ .‬ويتم استخدام جزء من عينات‬
‫الكتابة لتوليف أفضل اختيار لبارامرتات املصنف‪.‬‬
‫عينة جيدة‬ ‫نوع اخلطأ‬ ‫عينة خطأ‬

‫تدويرة حرف الواو صغرية‬

‫أربع نربات يف حرف السني‬

‫تدويرة حرف السني غري مكتملة‬

‫حرف الراء شبه الدال‬

‫ال يوجد انحناء يف رسم الراء‬

‫ال يوجد انحناء يف رسم احلاء‬

‫حرف الصاد بدون نربة‬

‫حرف العني ُيشبه رقم أربعة‬

‫ال يوجد عنق حلرف الفاء‬

‫تدويرة حرف اهلاء مفتوحة‬

‫اجلدول ‪ :1-3‬نامذج ألخطاء كتابة بعض احلروف‪.‬‬

‫تم اختبار هذا التطبيق عىل ُطالَّب عدد من مدارس املرحلة االبتدائية يف املرحلة‬
‫العمرية ‪ 11-6‬سنة‪ .‬تم تدريب عدد ‪ 50‬طالب عىل استخدام التطبيق‪ ،‬ثم استخدم‬
‫الطالب التطبيق للتدرب عىل كتابة األمثلة املتاحة‪ .‬بعد عدد قليل من احلصص التعليمية‬
‫متكنت نسبة كبرية من الطالب من حتسني كتابتهم؛ وقد متكن بعضهم من تقليد طريقة‬
‫وأشار حتليل نتائج التجربة إىل وجود تفاوت يف قدرة التطبيق‬
‫َ‬ ‫الكتابة املثالية لألمثلة‪.‬‬

‫‪-112-‬‬
‫عىل تتبع أخطاء الكتابة املختلفة كام هو موضح بالشكل (‪ )11-3‬حيث تراوحت الدقة‬
‫للحروف املختلفة ‪ ٪90 - ٪60‬طب ًقا لدرجة الصعوبة يف شكل احلرف ُّ‬
‫وتعرف التطبيق‬
‫عىل نوع اخلطأ يف كتابته‪ .‬وبصورة ما ُو ِجدَ أن درجة استفادة الطالب األصغر سنًّا من‬
‫النظام أكثر من ُق ِ‬
‫رنائهم األكرب سنًّا؛ وهذه نتيجة متوقعة إىل حد كبري بسبب مرونة‬
‫جهاز الكتابة عند الصغار‪ ،‬مما يسهل تعلم التغيري يف طريقة كتابة احلروف وتعديل هذه‬
‫األشكال يف العقل الباطن للطفل‪ ،‬مما يسهل عليه استخدامها بصورة آلية يف املستقبل‪.‬‬

‫َّ‬
‫الشكل ‪ :11-3‬نسبة الدقة يف التعرف عىل أخطاء كتابة احلروف املختلفة‪.‬‬

‫‪-113-‬‬
‫‪ -4‬مقرتحات َبحثِ َّية‬
‫ُت َعدُّ مشاركة الباحثني ال ُّلغويني يف تطوير استخدام تقنيات معاجلة اللغة العربية‬
‫املهمة‪ .‬فعىل سبيل املثال‪ ،‬لتصميم برامج فعالة لتعليم‬
‫يف تطبيقات التعليم من األمور َّ‬
‫النطق‪ ،‬ينبغي تو ُّفر حتليل لغوي دقيق ألنواع أخطاء النطق وأسباهبا وكيفية معاجلتها‪.‬‬
‫َ‬
‫أفضل َمن يؤ ِّدي هذه املهمة‪ .‬فجدير بالذكر أن علم الصوتيات‬ ‫و ُي َعدُّ الباحثون ال ُّلغو ُّيون‬
‫يف اللغة العربية ُي َعدُّ من أقدم العلوم مقارنة باللغات األخرى‪ ،‬حيث تم وضع أسسه‬
‫اهلجري‪ .‬وحتى اآلن‬ ‫الفراه ِ‬
‫يد ّي يف القرن الثاين‬ ‫ِ‬ ‫عىل يد العامل اجلليل اخلليل بن أمحد‬
‫ّ‬
‫تم إنتاج تراث ضخم من األبحاث يف اخلصائص الصوتية للغة العربية والدراسات‬
‫املقارنة مع اللغات األخرى‪ .‬وبدون شك فإن توظيف هذه األبحاث يف تطوير تقنيات‬
‫تطور هذه التقنيات واحلصول عىل‬ ‫تعلم النطق باستخدام احلاسب سوف ُيسهم يف ُّ‬
‫درجة عالية من الدقة تقارب املعلم احلقيقي‪.‬‬
‫اللغوي ألخطاء الكتابة وتصنيفها‬
‫ّ‬ ‫أيضا توفري التحليل‬‫وتستطيع األبحاث اللغوية ً‬
‫اللغوي يف اللغة العربية‪.‬‬
‫ّ‬ ‫وتعيني معدل تكرارها وحتديد مرجعيتها طب ًقا لقواعد البناء‬
‫فكل هذه اخلصائص تساعد عىل تصميم برامج تعليمية للغة العربية بصورة ميرسة‬
‫ومفيدة للدارسني حيث يتم الرتكيز فيها عىل العنارص الفعالة التي تقود املتعلم لفهم‬
‫واستيعاب قواعد اللغة من ناحية‪ ،‬وتوظيفها يف كتابة النصوص بلغة عربية سليمة من‬
‫ٍ‬
‫ناحية أخرى‪.‬‬
‫يب توفري قواعد تعليمية‬ ‫ٍ‬
‫ومن ناحية أخرى‪ ،‬يستطيع الباحثون املعن ُّيون باخلط العر ّ‬
‫لتحسني طرق الكتابة وإظهار مجاليات اخلط العريب‪ .‬ويمكن استنتاج هذه القواعد عن‬
‫طريق حتليل ُمشكالت الكتابة يف عينات من اخلط متثل نامذج الكتابة بدرجات إتقان‬
‫متفاوتة‪.‬‬

‫‪-114-‬‬
‫ببليوجرافيا مرجع َّية‬
.‫م‬1971 ،2‫ ط‬،‫ دار غريب‬،)‫ علم اللغة العام (األصوات‬:)‫برش (كامل حممد‬1.1
.‫م‬2002 ،1‫ ط‬،‫ مكتبة السنة‬،‫ أحكام قراءة القرآن الكريم‬:)‫احلرصي (حممود خليل‬2.2
‫ تنبيه الغافلني وإرشاد اجلاهلني‬:)‫الصفاقيس (أبو احلسن عيل بن حممد النوري‬3.3
‫ املطبعة الرسمية للجمهورية‬،‫عام يقع هلم من اخلطأ حال تالوهتم لكتاب اهلل املبني‬
.‫م‬1974 ،‫التونسية‬
4. Abdallah, M.; Al-Marri, M.; Abdou , S.; Rashwan, M.; El-Gamal,
M. (2015). “Improving Holy Qur’an recitation system using Hybrid
Deep Neural Network-Hidden Markov Model approach”, Third In-
ternational Conference on Islamic Applications in Computer Sci-
ence And Technology, 1-3, Turkey.
5. Abdou, S.; Elgammal, A.; Fahmy, A. (2010). “A Tool for Arabic
Handwriting Training”. The Fifth Conference of Learning Interna-
tional Networks Consortium (LINC), 23-26 May 2010, MIT, Cam-
bridge, Massachusetts, USA.
6. Abdou, S.; Hamid, S.; Rashwan, M.; Samir, A.; Abdel-Hamid, O.;
Shahin, M.; Nazih, W. (2006). “Computer Aided Pronunciation
Learning System Using Speech Recognition Techniques”, INTER-
SPEECH 2006 - ICSLP, Pittsburgh, PA, USA.
7. Abdou, S.; Rashwan, M.; Al-Barhamtoshy, H.; Jambi, K. and Al-Je-
daibi, W. (2014). “Speak Correct: A Computer Aided Pronunci-ation
Training System for Native Arabic Learners of English” Life Sci-
ence Journal 2014; 11(10) pp. 370-380.
8. Al-Barhamtoshy, H.; Abdou, S.; Rashwan, M. (2014). “Mobile
Technology for Illiterate Education”. Life Science Journal 2014;
11(9) pp. 242-248.
9. Al-Barhamtoshy, H.; Alwajih, F.; Abdou, S. (2012). “A Toolkit For
Teaching Arabic Handwriting”, International Journal of Computer
Applications, Vol. 49, No. 23.

-115-
10. Al-Marri, M., Raafat, H., Abdallah, M., Abdou, S., & Rashwan, M.
(2018). Computer Aided Qur’an Pronunciation using DNN. Journal
of Intelligent & Fuzzy Systems, vol. 34, no. 5, pp. 3257-3271, 2018
11. Bacha, K.; Jemni, M.; Zrigui, M. (2016). “Towards a Learning Sys-
tem Based on Arabic NLP Tools”. International Journal of Informa-
tion Retrieval Research (IJIRR) 6.4.
12. Bax, S. (2003). “CALL - past, present and future”, System 31, 1:
13-28.
13. Bax, S.; Chambers, A. (2006). “Making CALL work: towards
nor-malisation”, System 34, 4: 465-479.
14. Cushion, S.; Hémard, D. (2003). Designing a CALL Package for
Arabic While Learning the Language Ab Initio. Computer Assisted
Language Learning (CALL): An International Journal, Vol. 16, No.
2-3, 259-266, Belgium: SWETS & ZEITLINGER publisher.
15. Elaraby, Mohamed S., et al. “A Deep Neural Networks (DNN)
Based Models for a Computer Aided Pronunciation Learning Sys-
tem.” International Conference on Speech and Computer. Springer
International Publishing, 2016
16. El-Kasasy, M. S. (1992). “An Automatic Speech Verification Sys-
tem”, Ph.D. Thesis, Cairo University, Faculty of Engineering, De-
partment of Electronics and Communications, Egypt.
17. Franco, H. et al. (2000). “The SRI EduSpeak system: Recognition
and pronunciation scoring for language learning”, Proc. of InSTIL,
Scotland, 123-128.
18. Fuerstenberg, G. (1993). A la rencontre de Philippe: Videodisc,
Software, Teacher’s Manual and Student Activities Workbook: Yale
University Press [Online]: http://web.mit.edu/fll/www/projects/
Philippe.html
19. Hagen A.; Pellom, B. (2005). “Data driven sub-word unit modeling
for speech recognition and its application to interactive reading tu-
tors,” in Proc. European Conference on Speech Communication and
Technology, Lisbon, Portugal, Sept. 2005, pp. 2757–2760.

-116-
20. Hager Morsy, M. S., Aljohani, N., Shoman, M., & Abdou, S. (2018).
Automatic Speech Attribute Detection of Arabic Language. Interna-
tional Journal of Applied Engineering Research, 13(8), 5633-5639.
21. Hamid S.; Rashwan, M. (2004). “Automatic Generation of Hypoth-
eses for Automatic Diagnosis of Pronunciation Errors” Proceedings
of NEMLAR International Conference on Arabic Language Re-
sources and Tools, pp. 135-139, Cairo, Egypt.
22. Hamid, S. (2005). “Computer Aided Pronunciation Learning Sys-
tem using Statistical Based Automatic Speech Recognition”. PhD
thesis, Cairo University, Cairo, Egypt.
23. Hammadi, M.; Bezine, H.; Njah, S.; Alimi, A. M. (2012): “Towards
educational tool for Arabic Handwriting Learning”, International
Conference on Education and e-Learning Innovations.
24. Hosseny, I.; Abdou, S.; Fahmy, A. (2011). Using Advanced Hid-
den Markov Models for Online Arabic handwriting recognition”,
ACPR2011, Bekeen, China, 29-30.
25. Hubbard, P.; Levy, M. (2016). “Theory in computer-assisted lan-
guage learning research and practice”. The Routledge Handbook of
Language Learning and Technology (2016): 24.
26. Kosaka, T.; Sagayama, S. (1994). “Tree–structured speaker cluster-
ing for fast speaker adaptation”, proceedings of the 1994 IEEE In-
ternational Conference on Acoustics, Speech and Signal Processing
1, 245–248. IEEE, New York.
27. Magdy, M. Shalaan, K.; Fahmy, A. (2010). Morphological Analysis
of Ill-formed Arabic Verbs in Intelligent Language Tutoring Frame-
work. In FLAIRS-23, The 23rd International FLAIRS Conference,
Florida, USA
28. Mars, A.; Antoniadis, G. (2015). “Handwriting recognition system
for Arabic language learning”. Information Technology and Com-
puter Applications Congress (WCITCA), 2015 World Congress on.
IEEE.

-117-
29. Marse, J. F. et al, (1991). Handwriting Training: Computer-Aided
Tools for Premedial Teaching, Development of Graphic Skills. J.
Wann, A.M. Wing, N. Suvik, eds., pp. 249-258, Academic Press.
30. Mote, N.; Johnson, L.; Sethy, A.; Silva, J.; Narayanan, S. (2004).
Tactical Language Detection and Modeling of Learner Speech Er-
rors: The case of Arabic tactical language training for American
English speakers. In the Proceedings of InSTIL/ICALL2004 – NLP
and Speech Technologies in Advanced Language Learning Systems,
Venice. at http://sisley.cgm.unive.it/ICALL2004/link13.htm
31. Samir, A.; Abdou, S. M.; Khalil, A. H.; Rashwan, M. (2007).
“En-hancing usability of CAPL system for Qur’an recitation learn-
ing”, INTERSPEECH 2007 - ICSLP, Antwerp, Belgium.
32. Schneider, E.W.; Bennion, J.L. (1984). “Veni, vidi, vici, via video-
disc: a simulator for instructional courseware”. In Wyatt D.H. (ed.)
Computer-assisted language instruction, Oxford: Pergamon.
33. Underwood, J. (1984). Linguistics, computers and the language
teacher: a communicative approach, Rowley, Massachusetts: New-
bury House.
34. Warschauer, M. (1996). “Computer-assisted language learning: an
in-troduction”. In Fotos S. (ed.) Multimedia language teaching,
Tokyo: Logos International [Online]: http://www.ict4lt.org/en/war-
schauer.htm.
35. Warschauer, M. (2000). “CALL for the 21st Century”, IATEFL and
ESADE Conference, 2 July 2000, Barcelona, Spain.
36. Warschauer, M.; Healey, D. (1998). “Computers and language
learning: an overview”, Language Teaching 31: 57-71.
37. Waslylyk, T. M.; Barbe, W. B.; Lucas, V. H. (1994). “Basic Skills
for Effective ommunication. ”
38. Williams, D. A. (1999). “Knowing what you don’t know: roles for
confi-dence measures in automatic speech recognition”, Ph.D. the-
sis, De-partment of Computer Sciences, University of Sheffield,
Sheffield, United Kingdom.

-118-
‫الرابع‬
‫الفصل َّ‬
‫اآللي‬
‫ّ‬ ‫التَّقييم‬

‫د‪ .‬عيل عيل فهمي‬

‫‪ -1‬تقنيات األسئلة املقالية وأنواعها‪.‬‬


‫‪ -2‬طرق تقييم املقال (املوضوعات التعبريية) آل ًّيا‪.‬‬
‫‪ -3‬تقييم اإلجابات القصرية‪.‬‬
‫‪ -4‬تقييم درجات الكالم‪.‬‬
‫‪ -5‬أنظمة تقييم الرياضيات‪.‬‬
‫‪ -6‬أنظمة الكشف عن الرسقات األدبية‪.‬‬
‫‪ -7‬أنظمة التقييم اآليل ودعم اللغة العربية‪.‬‬
‫‪ -8‬اخلالصة‪.‬‬

‫‪-119-‬‬
-120-
‫التَّقييم اآللي‬
‫(‪)Automatic Scoring‬‬
‫مقدمة‬
‫تؤدى زيادة عدد الطالب واالختبارات إىل أن تصبح عملية تصحيح إجابات‬
‫يل (‪Automatic‬‬ ‫أمرا مزعجا‪ ،‬ويؤدي التَّقييم اآل ّ‬ ‫االختبارات بأنواعها وتقييم الطالب ً‬
‫‪ )Scoring -AS‬إىل اختصار الوقت واجلهد‪ ،‬وتوفري تناسق ومتانة التقييم‪ ،‬وتوحيد‬
‫املقاييس املعيارية لتقييم الطالب ورصد الدرجات؛ كام أن هذه النظم واسعة املجال بام‬
‫يكفي لتغطية مجيع أنواع إجابات الطالب املكتوبة واملنطوقة‪.‬‬
‫وتوفر أنظمة التقييم والتصحيح اآليل العديد من املزايا‪ ،‬مثل اتساق وعدالة التقييم‪،‬‬
‫وتقديم تقييامت لالمتحانات عالية املخاطر (‪ )high-stakes assessments‬والتي‬
‫والرفض «ناجح أو غري ناجح»‪« ،‬يقبل أو ال يقبل»‪« ،‬يصلح‬ ‫تتمثل يف احلدّ بني القبول َّ‬
‫أو ال يصلح» وهكذا‪ .‬وتعزز هذه النظم معنى «التوحيد القيايس» عن طريق تطبيق‬
‫نفس املعايري عىل مجيع اإلجابات‪ .‬بعبارة أخرى فإن التقييم اآليل ‪ AES‬يوفر الفوائد‬
‫لكافة مهام التقييم بام فيها من مكوناهتا األساسية‪ ،‬واملت ََم ِّثلة يف الطالب والقائمني‬
‫بالتقييم وعملية االختبار نفسها‪ .‬ويف الوقت احلايل يتم استخدام نظم التقييم اآليل يف‬
‫تصحيح كثري من اختبارات القبول للجامعات املشهورة مثل اختبارات‪:‬‬
‫‪The Test of English as a Foreign Language (TOEFL), the Graduate‬‬
‫‪.(Record Examinations (GRE) and the Scholastic Assessment Test (SAT‬‬
‫تتعامل أنظمة التقييم اآليل ‪ AS‬احلالية مع الطالب من خالل ثالث طرق‪:‬‬
‫الطريقة األوىل هي تقييم إجابات الطالب املكتوبة‪ ،‬وتشمل تقييم وتصحيح‬
‫املقاالت النصية (ومنها موضوعات التعبري واإلنشاء)‪ ،‬تصحيح اإلجابات القصرية‪.‬‬
‫و ُي َم ِّث ُل تصحيح املقاالت النصية حتدِّ ًيا أكرب من تصحيح اإلجابات القصرية‪ ،‬حيث‬
‫يتطلب تقييم أسلوب الطالب يف الكتابة ‪ style‬وحيتاج معاجلة لغوية عميقة‪.‬‬
‫الطريقة الثانية هي تقييم إجابات الطالب املنطوقة‪ ،‬وتنقسم إىل نوعني‪:‬‬

‫‪-121-‬‬
‫النوع األول‪ :‬وفيه ُيطلب من الطالب نطق مجلة مكتوبة‪ ،‬ويتم تقييم طريقة ودقة‬
‫اآلخر‪ :‬وفيه ي َّطلع الطالب عىل نص مكتوب‪ ،‬ويطلب منه التعبري بصورة‬
‫النطق‪ .‬والنوع َ‬
‫منطوقة عن مفهوم النص مستخدما قواعد النطق والقواعد النَّحوية الصحيحة لتكوين‬
‫اجلمل الصحيحة‪.‬‬
‫يطلق عىل النوع األول مصطلح «اإلجابات املنطوقة بفوىض منخفضة» (‪low‬‬
‫اآلخر مصطلح «اإلجابات املنطوقة‬
‫‪ )entropy spoken responses‬ويطلق عىل النوع َ‬
‫بفوىض مرتفعة» (‪.)high entropy spoken responses‬‬
‫أما الطريقة الثالثة للتعامل مع الطالب فهي تصحيح املسائل الرياضية‪ ،‬والتي‬
‫تتطلب من الطالب اإلجابة بمعادالت ونصوص وأرقام ورسومات بيانية‪.‬‬
‫ومع أن هدف أنظمة التقييم اآليل ‪ AS‬هو حتقيق عالقة توافق عالية بني الدرجات‬
‫التي يمنحها اإلنسان والدرجات التي متنحها اآللة‪ ،‬فإنه من املهم أن نعرف أن تقييم‬
‫درجات إجابات الطالب ختتلف يف أسلوهبا عند تقييمها بواسطة اآللة عنها عند تقييمها‬
‫بواسطة اإلنسان‪ .‬فبصفة عامة يوجد أسلوبني لتقييم درجات إجابات الطالب بطريقة‬
‫آلية‪ .‬يعتمد األسلوب األول عىل حتديد درجة التطابق التام بني إجابة الطالب واإلجابة‬
‫اآلخر ال يفرتض وجود إجابات‬ ‫الصحيحة النموذجية املحفوظة يف النظام‪ .‬األسلوب َ‬
‫نموذجية للمقارنة هبا‪ ،‬ولكنه يعتمد عىل حتليل واستخراج سامت خمتلفة من إجابات‬
‫الطالب لتحديد نتيجة درجات التقييم اآليل بنا ًء عىل التعلم من نتائج التقييم اليدوي‬
‫التي متت سابقا عىل عينة من املقاالت‪.‬‬
‫هنتم يف هذا الفصل بنظم التقييم اآليل لألسئلة املقالية واألسئلة التي تتطلب إجابات‬
‫قصرية‪ .‬أما بالنسبة ألنظمة تقويم األسئلة من نوعية تعدد اخليارات‪ ،‬أو اختيار اإلجابة‬
‫من بني اختيارات اخلطأ والصواب‪ ،‬أو التطابق‪ ،‬أو ملء الفراغ؛ فهي سهلة التنفيذ‬
‫والتطبيق ولن نتعرض هلا‪.‬‬
‫أم َك َن اإلفادة من تقنيات التقييم اآليل لألسئلة املقالية يف بناء أنظمة للكشف عن‬

‫‪-122-‬‬
‫الرسقات األدبية (‪ )Plagiarism detection‬حيث تنترش هذه الظاهرة ‪-‬لألسف ‪-‬‬
‫يف األوساط األكاديمية‪ ،‬إذ عاد ًة ما تكون يف وثائق املقاالت أو التقارير‪ .‬ومع ذلك‪،‬‬
‫يمكن وجود ظاهرة الرسقات األدبية يف أي جمال تقريبا‪ ،‬بام يف ذلك األوراق العلمية‪،‬‬
‫والتصميامت الفنية‪ ،‬وحتى يف برامج احلاسب‪.‬‬
‫يركز هذا الفصل عىل املنهجيات ونتائج التطبيقات بواسطة كربيات رشكات‬
‫التطوير يف جمال التقييم اآليل ‪ AS‬مثل‪ :‬رشكة خدمة االختبارات الرتبوية ‪ ،ETS‬ورشكة‬
‫معارف تكنولوجيا بريسون ‪ ،PKT‬ورشكة فانتيج لرينينج‪.‬‬
‫‪Educational testing Service (ETS), Pearson Knowledge technologies‬‬
‫‪(PKT) and Vantage Learning.‬‬

‫ويشتمل الفصل عىل عدَّ ة حماور رئيسية‪ :‬أنواع األسئلة املقالية ونظم تقييمها اآللية‬
‫(‪ ،)AES‬نظم تقييم اإلجابة القصرية‪ ،‬نظم تقييم الكالم (اإلجابات املنطوقة)‪ ،‬نظم‬
‫تقييم أسئلة الرياضيات‪ ،‬أنظمة الكشف عن الرسقات األدبية‪ ،‬وأخريا‪ ..‬موقف اللغة‬
‫املهم‪.‬‬
‫العربية من هذا املجال ّ‬
‫ ‬
‫‪ -1‬األسئلة املقالية وأنواعها‬
‫تنقسم األسئلة املقالية إىل أربعة أنواع رئيسية‪ ،‬يعكس كل منها هد ًفا تعليم ًّيا خمتل ًفا‪:‬‬
‫‪ -1‬أسئلة وصفية (‪:)Description‬‬
‫وتتطلب رسد النقاط الرئيسية يف املوضوع؛ وغالبا ما تبدأ باألفعال التالية‪:‬‬
‫حدِّ د‪ِ ،‬صف‪ ،‬خ ِّطط‪ ،‬ارشح‪ ،‬عَدِّ د‪ ،‬اذكر‪ ،‬خلص‪ ،‬قدِّ م‬
‫‪Define, describe, outline, explain, list, delineate, trace, state,‬‬
‫‪summarize, present‬‬

‫‪ -2‬أسئلة مناقشة (‪:)Discussion‬‬


‫وتتطلب مناقشة النقاط الرئيسية يف املوضوع؛ وغالبا ما تبدأ باألفعال التالية‪:‬‬
‫حلل‪ ،‬استكشف‪ ،‬ناقش‪ ،‬علق‪ ،‬وضح‪ ،‬فرس‪ ،‬استعرض‬
‫‪Analyse, explore, discuss, comment, illustrate, account for, interpret,‬‬
‫‪review, explain, consider, debate, show how and examine‬‬

‫‪-123-‬‬
‫‪ -3‬أسئلة تقييم (‪:)Evaluation‬‬
‫وتتطلب إيضاح اخلط الفكري أو احلجة خلف املوضوع؛ وغالبا ما تبدأ باألفعال‬
‫التالية‪:‬‬
‫انقد‪ ،‬ق ِّيم‪ِّ ،‬برر‪ ،‬ع ِّلق عىل‬
‫‪Criticize, evaluate, critically evaluate, justify, comment on, and interpret‬‬

‫‪ -4‬أسئلة مقارنة (‪:)Comparison‬‬


‫وتتطلب مناقشة نقاط التوافق واالختالف أو نقاط القوة والضعف؛ وغالبا ما تبدأ‬
‫باألفعال التالية‪:‬‬
‫وضح أوجه التَّباين‪َ ،‬فرق‪ ،‬ميز‪ِ ،‬‬
‫ناقش‬ ‫قارن‪ِّ ،‬‬
‫ِّ َ ِّ‬ ‫ُ‬
‫‪Compare, contrast, differentiate, distinguish, debate‬‬

‫‪ -2‬طرق تقييم املقال (املوضوعات التعبريية) آل ًّيا (‪)AES‬‬


‫احلاسوب َّية التي تقوم بتقييم ووضع درجات‬
‫ُ‬ ‫يعرف تقييم املقال آليا بأنه التِّقنية‬
‫لألعامل املكتوبة؛ ويعرف تقييم املقال أيضا بأنه تقدير وتقييم املقاالت آليا‪ ،‬ووضع‬
‫درجات املقاالت املكتوبة آليا‪.‬‬
‫معظم أعامل تقييم املقال آليا تتعامل مع اللغة اإلنجليزية‪ ،‬مع قليل من النظم ا َّلتي‬
‫صممت لدعم لغات أخرى‪ ،‬مثل‪ :‬العربية واليابانية ولغة املاليو «البهاسا»‪.‬‬
‫تقييم املقال (املوضوعات التعبريية) آليا ال يفرتض وجود إجابات نموذجية‬
‫للمقارنة هبا‪ ،‬ولكنها تعتمد عىل حتليل واستخراج سامت خمتلفة من إجابات الطالب‬
‫لتحديد نتيجة درجات التقييم اآليل بنا ًء عىل التعلم من نتائج التقييم اليدوي التي متت‬
‫سابقا عىل عينة من املقاالت‪.‬‬
‫يمر بناء معظم أنظمة التقييم اآليل للموضوعات التعبريية عرب نفس خطوات‬ ‫ُّ‬
‫بناء اخلوارزمات اإلرشافية (‪ )supervised algorithms‬التي تتطلب مرحلة التعلم‪.‬‬
‫فمراحل بناء نموذج التقييم اآليل ‪ AES‬مقنَّنة‪ ،‬وهي كالتايل‪:‬‬

‫‪-124-‬‬
‫مرحلة اإلعداد‪ ،‬وتشمل جتهيز عينة من املقاالت التعبريية التي تم تصحيحها‬
‫وتقييمها سابقا بطريقة يدوية مع حتديد واستخراج السامت التي سيتم تدريب النظام‬
‫عليها من املقال‪ .‬وتسمى هذه املجموعة‪ :‬عينة أو فئة التدريب‪ .‬يتم فحص عينة‬
‫التدريب هذه من قبل خرباء احلاسب (ويفضل التعاون مع اخلرباء يف املجال) لتحديد‬
‫واستخراج جمموعة من خصائص وسامت وأوزان تصف النص املقايل‪ .‬ففي مرحلة‬
‫استخراج السامت والتدريب يتم تصحيح وتقييم جمموعة من مئات املقاالت التعبريية‬
‫بواسطة اخلرباء (القائمني بالتقييم) وإعطاء كل مقالة درجة من ‪ 10‬مثال‪ ،‬وتستخدم‬
‫هذه السامت واألوزان إلنتاج نموذج رقمي للنص يمكن استخدامه للتنبؤ بدرجة‬
‫التقييم التي حيصل عليها املقال بواسطة اخلبري اإلنسان‪.‬‬
‫مرحلة بناء نموذج برنامج التصحيح والتدريب‪ ،‬حيث يتم استخدام إحدى‬
‫املوجهة (‪)Support Vector Machine‬‬ ‫خوارزمات تعلم اآللة‪ ،‬مثل خوارزم آلة الدعم َّ‬
‫أو اخلوارزمات اإلحصائية مثل خوارزم بايز (‪ )Bayes Algorithm‬بغرض تعلم‬
‫العالقة الكامنة بني السامت املستخرجة من املوضوع التعبريي وبني درجة التقييم التي‬
‫متت يدويا بواسطة اخلبري امل َق ِّيم للمقال‪ .‬ويتم التحقق من صحة هذا النموذج الرقمي‬
‫من خالل مقارنة النتائج ا َّلتي يتم احلصول عليها يدويا من قبل امل َق ِّيمني اخلرباء ودرجة‬
‫التقييم املستنتجة من هذا النموذج‪ ،‬ويتم تكرار هذه العملية حتى نتأكَّد من تطابق تقييم‬
‫احلاسب للمقال مع التقييم اليدوي بصورة ُمرضية‪.‬‬
‫وأخريا مرحلة االستخدام الفعيل للربنامج يف تصحيح مقاالت الطالب التعبريية‬
‫اجلديدة آليا‪ .‬حيث يتم تغذية الربنامج بالسامت املستخلصة من املقال املوضوعي املراد‬
‫تقييمه آليا‪.‬‬
‫واآلن‪ ،‬كيف يتم حتديد واختيار اخلصائص والسامت املعربة عن نمذجة املقال التعبريي؟‬
‫هناك طريقتان أو منهجيتان رئيستان إلنتاج نامذج التقييم اآليل ‪ ،AES‬إما باستخدام أساليب‬
‫«القوة احلاسوبية املحضة» (‪ )brute-force‬أو باستخدام الوسائل املختلطة (اهلجني)‪.‬‬
‫تستخدم املنهج َّية األوىل تشكيلة واسعة متنوعة من السامت واخلصائص اللغوية‬
‫للنص‪ ،‬والتي ليس هلا عالقة مبارشة بكيفية الكتابة اجليدة ملقال‪ ،‬مثل وجود أخطاء من‬
‫النحو اإلمالئي‪ ،‬ووجود أخطاء التنقيط‪ ،‬وهكذا‪.‬‬

‫‪-125-‬‬
‫بينام تكون النامذج القائمة عىل األساليب املهجنة ذات عالقة مبارشة مشتقة من‬
‫الناحية النظرية ملفهوم خصائص الكتابة اجليدة للمقال مثل مدى ارتباط تسلسل‬
‫الفقرات يف النص ‪ -‬وهو ما يطلق عليه مصطلح (‪ - )Lexical Chaining‬وأن الكلامت‬
‫املستخدمة هي املناسبة‪ ،‬ومدى استخدام اجلمل املوجزة‪ ،‬ومدى استخدام صيغ نائب‬
‫الفاعل يف املقال‪ ،‬واستخدام صيغ املايض‪ ،‬وهكذا‪.‬‬
‫وجدير بالذكر أن حتديد واستخراج سامت املقال املوضوعي املالئمة للتقييم هو‬
‫التحدي احلقيقي لنظم تقييم املقال‪.‬‬

‫‪ - 1.2‬نامذج من أنظمة التقييم اآليل ‪AES‬‬

‫§نظام «مرشوع تصحيح املقال» (‪)Project Essay Grade - PEG‬‬‫ ‬


‫وقد تم تطويره بجامعة «كونيتيكت» األمريكية منذ منتصف الستين َّيات‪ .‬هو نظام‬
‫رائد يف تقييم املقال آليا ‪ AES‬عرب تاريخ التقييم اآليل‪ .‬يعتمد هذا النظام عىل سامت‬
‫وقياسات متثل جودة املقاالت‪ .‬هذه القياسات تأخذ يف االعتبار بنية الكتابة مثل‬
‫متوسط طول الكلمة‪ ،‬ومتوسط طول اجلملة باملقال‪ ،‬إضافة إىل عدد من الوحدات‬
‫النصية األخرى‪.‬‬
‫يستخدم النظام إجرا ًء إحصائ ًّيا إلنتاج أوزان ترجيحية هلذه القياسات (باستخدام‬
‫ُأسلوب حتليل االنحدار (‪.))Regression Analysis‬‬
‫لقد متَّت إعادة تطوير وحتسني نظام ‪ PEG‬يف أواخر التسعين َّيات بإدراج أدوات‬
‫معاجلة اللغات الطبيعية (‪ ،)NLP‬مع األخذ يف االعتبار التحليل النحوي وعالمات‬
‫أجزاء الكالم (‪ )Parts of Speech tags‬للمقال ومدى التزام النص بقواعد النحو‪.‬‬
‫و ُيستخدم نظام ‪ PEG‬يف تصحيح برامج االختبارات تعليمية‪ ،‬مثل امتحان‬
‫(‪ )Scholastic Assessment Test- SAT‬الذي يستخدم كاختبار للقبول يف الكليات‬
‫األمريكية منذ عام ‪ ،2005‬وهو يقيس معلومات وقدرات الطالب يف الرياضيات‬
‫والقراءة النقدية والكتابة‪.‬‬

‫‪-126-‬‬
‫كي» (‪)Intelligent Essay Assessor – IEA‬‬ ‫ §نظام «مقيم املقالة َّ‬
‫الذ ّ‬
‫الذ ِك ّي ‪ IEA‬أصال يف جامعة كولورادو األمريكية يف عام‬ ‫لقد تم تطوير امل َق ِّيم َّ‬
‫‪ ،1997‬و ُي َس َّوق حاليا عن طريق رشكة (برسون نولدج تكنولوجي ‪ .)PKT‬هذا النظام‬
‫قادر عىل تقييم املقاالت بدرجة ثقة متاثل اخلربة البرشية املاهرة ‪.‬‬
‫الذكي ‪ IEA‬العديد من املزايا التي متيزه عن غريه من أنظمة تقييم‬
‫ّ‬ ‫يمتلك املقيم‬
‫درجات املقاالت‪ ،‬حيث يوفر تقديرا كليا وتغذية عكسية عن األخطاء اإلمالئية‬
‫والنحوية‪ .‬كام أنه حيتوي يف بنيته عىل كاشفات للمقاالت غري العادية‪ ،‬مثل مهارات‬
‫القيادة العسكرية‪ .‬وقد جرى استخدامه لرصد الدرجات والتقييم عىل مدى أكثر من‬
‫مليون مقالة‪ ،‬ترتاوح بني مقاالت املدارس املتوسطة ومقاالت ُطالَّب كليات الطب‪،‬‬
‫ويف جماالت متنوعة املحتوى‪.‬‬
‫ميزة هذا النظام أنه يركز عىل تقييم حمتوى املقالة يف املقام األول‪ ،‬ال عىل الرتكيب‬
‫الذكي ‪ IEA‬بتقييم‬
‫ّ‬ ‫البنائي هلا فقط كام هو احلال يف النظام السابق‪ .‬ويقوم مقيم املقالة‬
‫ووضع الدرجات باستخدام أسلوب حتليل الدالالت الكامنة (‪Latent Semantic‬‬
‫‪ ،)Analysis- LSA‬والذي ُي َم ِّثل طريقة حتليل داللة النص ا َّلتي يمكن تعريفها بأهنا‬
‫إحصائي من استخدام الكلمة ا َّلتي تسمح بمقارنات التشابه الدال ّيل بني قطع‬
‫ّ‬ ‫«نموذج‬
‫من املعلومات النصية‪ ،‬حيث تنتج جمموعة من املفاهيم املرتبطة بمحتوى النص»‪.‬‬
‫ويفرتض أسلوب ‪ LSA‬أن الكلامت القريبة يف املعنى غالبا ما تكون قريبة من بعضها‬
‫ُ‬
‫الذكـــي ‪ IEA‬طريقة التحليل الدال ّيل‬
‫ّ‬ ‫البعض يف داخل النص‪ .‬ويدمـــج نظام التقييم‬
‫‪ LSA‬جنــبا إىل جنـــب مـــــع قاعدة بيانات معلوماتية حتتوى عىل مادة الكتب‬
‫املدرسية وعينة مقاالت أو مصادر أخرى غنية يف الداللة لتدريب أجهزة احلاسب‪.‬‬
‫يؤدي هذا الدمج بني التحليل الداليل وقاعدة البيانات املعلوماتية إىل تقليل عدد‬
‫املقاالت التي تُستخدم يف تدريب النظام‪ ،‬والتي يتم تصحيحها وتقويمها يدويا نظرا‬
‫ألن رصد الدرجات يتم إنجازه اعتامدا عىل التحليل الدال ّيل بدال من بناء النامذج‬
‫اإلحصائية التقليدية للمقال‪.‬‬

‫‪-127-‬‬
‫§نظام إنتليمرتيك (‪)Intellimetric‬‬‫ ‬
‫وهو نظام تم تطويره اعتبارا من ‪ 1997‬بواسطة رشكة تكنولوجيا التعلم (‪Vantage‬‬
‫‪ .)Learning Technology‬ويعترب أول نظام لتقييم املقال آليا ‪ AES‬يستند عىل علوم‬
‫احلاسوب َّية؛ فهو جيمع بني أدوات معاجلة اللغات‬
‫ُ‬ ‫االصطناعي واللغويات‬
‫ّ‬ ‫الذكاء‬
‫الطبيعية (‪ )NLP‬والتقنيات اإلحصائية يف رصد درجات املقال‪ ،‬ويمكن اإلشارة إليه‬
‫كمحرك تعلم استوعب «احلكمة اجلمعية» (‪ )Pooled Wisdom‬أو «يستند عىل العقل»‬
‫خلرباء التقييم‪ .‬يستخدم إنتليميرتك (‪ )Intellimetric‬النموذج الذي حيتوى عىل أمثلة‬
‫جمموعة من معامالت التنبؤ واألوزان ا َّلتي تم تعريفها عن طريق استخراج أكثر من‬
‫‪ 400‬سمة من أجوبة الطالب‪ ،‬باإلضافة إىل جمموعة سامت تدريبية تتكون من السامت‬
‫ذات الطبيعة الداللية والنحوية واخلطابية‪.‬‬
‫يأخذ نظام (‪ )IntelliMetric‬يف االعتبار مخسة أبعاد أساسية كامنة‪ ،‬وذلك عند‬
‫تصحيح املقال ورصد الدرجات‪ ،‬وهى‪ :‬املحتوى‪ ،‬واإلبداع‪ ،‬واألسلوب‪ ،‬وامليكانيكية‪،‬‬
‫والتنظيم‪ .‬يستخدم (‪ )Intellimetric‬شبكات كلامت معجمية مبنية عىل اإلحصاء‬
‫يل الكامن (‪Latent‬‬
‫الداليل للمقالة‪ .‬هذا اإلحصاء الداليل يامثل أسلوب التحليل الدال ّ‬
‫‪ .)Semantic Analysis-LSA‬هذا التحليل الدال ّيل الكامن يمثل مخس فئات عامة‬
‫من السامت‪.‬‬
‫الفئة األوىل هتتم بالرتكيز عىل الوحدة والتامسك والتناسق يف الغرض واألفكار‬
‫الرئيسية يف املقالة‪.‬‬
‫الفئة الثانية ختتص بمدى اتساع نطاق املحتوى ودعم األفكار‪ ،‬وتُعنى بمدى‬
‫االختيار السليم للمفردات واملفاهيم‪.‬‬
‫الفئة الثالثة هتتم بمدى تنظيم وهيكلة املقالة من حيث منطق اخلطاب‪ ،‬بام يف ذلك‬
‫سيولة االنتقالية والعالقات بني أجزاء االستجابة‪.‬‬
‫الفئة الرابعة وختتص ببنية اجلملة والرتكيز عىل تعقيد اجلملة والتنوع‪ ،‬مثل‪ :‬التنوع‬
‫النحوي يف االستخدام‪ ،‬ومدى التعقيد يف اجلمل املستخدمة‪ .‬وأخريا‪..‬‬

‫‪-128-‬‬
‫الفئة اخلامسة تعكس آليات التحقق من التزام املقال بقواعد اللغة اإلنجليزية‪ ،‬مثل‪:‬‬
‫قواعد النحو واإلمالء‪ ،‬واحلروف الكبرية‪ ،‬واكتامل اجلملة‪ ،‬وعالمات الرتقيم‪ ،‬وغريها‪.‬‬
‫حاليا يستخدم نظام (‪ )Intellimetric‬يف كثري من املدارس األمريكية واإلنجليزية‬
‫للصفوف السادسة والسابعة والثامنة‪ ،‬وهو متاح لالستخدام للطالب عن طريق شبكة‬
‫اإلنرتنت‪.‬‬
‫‪http://www.vantagelearning.com/products/intellimetric/‬‬
‫‪demonstration/demonstration-american-english/‬‬

‫§نظام التصنيف (‪)E-rater‬‬‫ ‬


‫هو نظام تم تطويره بواسطة رشكة خدمة االختبارات الرتبوية (‪Educational‬‬
‫‪ .)Testing Service -ETS‬وهو معروف جيدا يف تنبؤ درجات تقييم املقال ويتفق‬
‫مع درجات التقييم اليدوية‪ ،‬باإلضافة إىل قدرة النظام عىل اكتشاف إجابات الطالب‬
‫اخلارجة عن املوضوع‪ .‬ويستخدم نظام املصنف ‪ E-rater‬حاليا من أجل ‪:‬‬
‫Ÿ Ÿتقييم درجات املقاالت املرسلة‪ ،‬وتطبيق تعليامت كتابة املقاالت يف نظام ‪.ETS‬‬
‫Ÿ Ÿتقييم اختبارات القبول لربامج الدراسات العليا يف اإلدارة (‪Graduate‬‬
‫‪ .)Management Admission Test- ®AWA GMAT‬ويقيس هذا االمتحان‬
‫مهارات الكتابة اللفظية والرياضية‪ ،‬ومهارات الكتابة التحليلية‪.‬‬
‫Ÿ Ÿتقديم خدمة تقييم املقال من خالل شبكة اإلنرتنت‪ .‬يف هذا التطبيق يقوم‬
‫املحرك برصد درجات املقال ببساطة عن طريق استخراج سامت مستندة عىل‬
‫لغوي من املقال ويستخدم النامذج اإلحصائية لربط هذه السامت مع‬ ‫ّ‬ ‫أساس‬
‫نوعية جودة الكتابة عموما‪ .‬يتم تقييم نتيجة املقال بدرجة من ‪ 1‬إىل ‪ 6‬حيث ‪1‬‬
‫هي أدنى درجة و ‪ 6‬هي أعىل الدرجات‪.‬‬
‫يطبق نظام (‪ )E-rater‬أسلوب االنحدار اخلطي املتدرج عىل عينة من املقاالت‬
‫التدريبية املكتوبة حول نفس املوضوع الذي تم تقييمه بواسطة جمموعة من املتخصصني‬
‫من أجل استخراج أكثر من ‪ 50‬سمة لغوية للمقال‪ ،‬والتي يمكن أن تكون عونا كبريا‬
‫يف التنبؤ بتقييامت املقاالت املامثلة يف نفس املوضوع‪.‬‬

‫‪-129-‬‬
‫يطبق نظام (‪ )E-rater‬املحدَّ ث جمموعة من السامت التي يستخلصها من املقال موزعة‬
‫إىل مخسة جماالت من التحليل؛ األول سامت خاصة باألخطاء النحوية وأخطاء االستخدام‪،‬‬
‫واألسلوب ‪ .Style‬الثاين هو تنظيم املقال‪ .‬الثالث هو تعقيد املعجم‪ .‬الرابع هو مدى‬
‫االستخدام الصحيح للمفردات‪ ،‬وأخريا طول املقال‪ .‬يتضمن نظام التصنيف (‪)E-rater‬‬
‫سامت تصنيف أخرى تتعلق باملفردات ومدى مالئمة املحتوى‪ ،‬والتنظيم‪ ،‬والتطوير‪.‬‬

‫§نظام التصنيف (™‪)C-rater‬‬‫ ‬


‫تم تطوير هذا النظام من قبل رشكة خدمة االختبارات الرتبوية (‪Educational‬‬
‫‪ )Testing Service -ETS‬أيضا‪ ،‬وهو معروف جيدا بالتقييم ذي الدِّ َّقة العالية‬
‫للمقاالت املكتوبة‪ ،‬وتم التحقق منه عىل مقاالت متعددة من برامج االختبار يف العديد‬
‫من جماالت املحتوى املختلفة‪ ،‬بام يف ذلك العلوم‪ ،‬والقراءة والفهم والتاريخ‪.‬‬
‫تستخدم تكنولوجيا نظام التصنيف (‪« )C-rater‬منهجية حقيبة الكلامت»‬
‫(‪ )Bag of words approach‬والتي تستخدم فيها املعاجلة الطبيعية العميقة للغة لتقييم‬
‫ما إذا كانت إجابة الطالب حتتوى عىل النص الذي يمكن اعتباره صياغة أخرى مماثلة‬
‫للمفاهيم الواردة يف رشح املوضوع (‪ .)item rubric‬خيتلف هذا املنهج عن األساليب‬
‫األخرى لتحليل إجابات الطالب (مثل حتليل الداللة الكامنة ‪.)LSA‬‬
‫إلجراء عملية التقويم يقوم نظام (‪ )C-rater‬بإجراء سلسلة من خطوات معاجلة‬
‫اللغات الطبيعية ‪ NLP‬ومنها ‪:‬‬
‫Ÿ Ÿتصحيح األخطاء اإلمالئية الطالب‪.‬‬
‫Ÿ Ÿحتديد بنية كل مجلة نحوية‪.‬‬
‫Ÿ Ÿحل مرجع الضمري‪.‬‬
‫Ÿ Ÿحتليل صياغة إجابات الطالب‪.‬‬
‫امليزة الرئيسية ملحركات (‪ )C-rater‬عن باقي حمركات ‪ AES‬األخرى هي التحليل‬
‫اللغوي العميق إلجابات الطالب‪ ،‬وهو ما يضمن أن عملية التقييم لن تنخدع‬
‫باإلجابات ا َّلتي تستخدم الكلامت الصحيحة يف سياق خاطئ‪.‬‬

‫‪-130-‬‬
‫‪ -2.2‬نتائج تطبيقات أنظمة التقييم اآليل ‪AES‬‬
‫تقاس نتائج التقييم اآليل بمدى تطابقها مع التقييم اليدوي‪ ،‬مع األخذ يف االعتبار‬
‫أنه نادرا يندر تطابق نتائج التقييم لشخصني خمتلفني‪.‬‬
‫ويمثل اجلدول التايل نتائج التطبيقات املحققة من حيث االختبار‪ ،‬وحجم عينة‬
‫مقالة التقييم‪ ،‬وارتباط اإلنسان باإلنسان وارتباط اإلنسان واحلاسب‪.‬‬
‫ارتباط اإلنسان‬ ‫ارتباط اإلنسان‬
‫النِّظام‬ ‫االختبار‬ ‫حجم العينة‬
‫واإلنسان‬ ‫واحلاسب‬
‫)‪PEG (1997‬‬ ‫‪GRE‬‬ ‫‪497‬‬ ‫‪0.75‬‬ ‫‪0.75 – 0.74‬‬
‫‪English place-‬‬
‫)‪PEG (2002‬‬
‫‪ment test‬‬
‫‪386‬‬ ‫‪0.71‬‬ ‫‪0.83‬‬
‫‪IntelliMetric‬‬ ‫‪k-12 norm-‬‬
‫)‪(2001‬‬ ‫‪referenced test‬‬
‫‪102‬‬ ‫‪0.84‬‬ ‫‪0.82‬‬

‫)‪IEA (1997‬‬ ‫‪GMAT‬‬ ‫‪188‬‬ ‫‪0.83‬‬ ‫‪0.80‬‬


‫)‪IEA (1999‬‬ ‫‪GMAT‬‬ ‫‪1363‬‬ ‫‪0.87 - 0.86‬‬ ‫‪0.86‬‬
‫‪High School‬‬
‫)‪IEA (2011‬‬
‫‪Writing‬‬
‫‪635‬‬ ‫‪0.91‬‬ ‫‪0.91‬‬

‫)‪e-rater (1998‬‬ ‫‪GMAT‬‬ ‫‪1000 - 500 0.89 - 0.82 0.87 - 0.79‬‬


‫– ‪GMAT‬‬
‫)‪e-rater (2006‬‬
‫‪TOEFL‬‬
‫‪7575‬‬ ‫‪0.93‬‬ ‫‪0.93‬‬

‫)‪e-rater (2011‬‬ ‫‪GRE- TOEFL‬‬ ‫‪< 5000‬‬ ‫‪0.95‬‬ ‫‪0.97‬‬


‫اجلدول ‪ :1-4‬نتائج تطبيقات أنظمة التقييم اآليل ‪AES‬‬

‫يتضح من اجلدول السابق أن أنظمة التقييم اآليل للمقاالت التعبريية املكتوبة باللغة‬
‫اإلنجليزية قد بلغت درجة عالية من النضج؛ فنتائجها ختتلف مع نتائج التقييم اليدوية‬
‫بنفس القدر (تقريبا) الذي ختتلف فيه نتائج التقييم من شخص إىل شخص آخر‪.‬‬

‫‪-131-‬‬
‫‪ -3‬تقييم اإلجابات القصرية‪.‬‬
‫إن نظم تصنيف درجات اإلجابة القصرية سهلة التنفيذ حيث أهنا هتدف إىل تقييم‬ ‫َّ‬
‫حمتوى املعارف واملهارات الطالب‪ ،‬يف مقابل نظام درجات املقال ا َّلتي تقوم بتقييم‬
‫قدرة الطالب عىل الكتابة وتتطلب إمكانيات متطورة لتحليل النص وفهمه‪ .‬نظم تقييم‬
‫اإلجابات القصرية تتطلب أن تكون إجابة الطالب قصرية عىل أن تبني مدى استيعابه‬
‫للمفاهيم الرئيسية يف جمال معني‪ .‬ويقوم نظام التقييم اآليل بمقارنة إجابة الطالب مع‬
‫واحد أو أكثر من األجوبة الصحيحة املخزنة لديه‪ .‬يف املايض القريب كانت معظم‬
‫أنظمة التقويم تتطلب جمهو ًدا إضاف ًّيا من املعلم حيث كان يتطلب منه إعداد أدلة‬
‫اإلجابات النموذجية بطريقة يدوية أو أن يوفر ُمدَ َّونة ُل َغ ِو َّية ُم َعنونة (‪Annotated‬‬
‫‪ )Corpus‬لتحديد أنامط اإلجابة بطريقة نصف آلية‪.‬‬
‫تعترب منهجية قياس تشابه النص (‪ )Text similarity approach‬هي أساس عمل‬
‫نظم تقييم اإلجابات القصرية‪ .‬ويوجد عدد كبري من خوارزمات التشابه بعضها يأخذ‬
‫يف االعتبار التحليل اللغوي العميق لكل من إجابة الطالب وإجابة املدرس والبعض‬
‫األخر يأخذ يف االعتبار العبارات القصرية املرشكة بني اإلجابتني‪.‬‬
‫يلعب التشابه الداليل بني كلمتني دورا كبريا يف الوصول إىل التشابه الداليل بني‬
‫مجلتني (غالبا ما يتم ذلك باستخدام تقنية املعلومات املتبادلة بني كلامت اجلملتني‬
‫‪ .)pointwise mutual information‬ولكن كيف يمكن حساب التشابه الداليل بني‬
‫كلمتني (مثل الكلمتني شجرة‪ ،‬نخلة أو كتاب وكراسة)؟‬
‫توجد طرق كثرية لذلك نذكر منها الطرق التالية‪:‬‬
‫‪ŸŸ Leacok & hodorow.‬‬
‫‪ŸŸ Lesk.‬‬
‫‪ŸŸ Wu& Palmer.‬‬
‫‪ŸŸ Resnik.‬‬
‫‪ŸŸ Lin.‬‬
‫‪ŸŸ Jiang & Conrath.‬‬
‫‪ŸŸ Hirst & St-Onge.‬‬

‫‪-132-‬‬
‫‪ŸŸ Corpus based Similarity combined with Explicit Semantic‬‬
‫‪Analysis (ESA).‬‬
‫‪ŸŸ Corpus based Similarity combined with Latent Semantic‬‬
‫‪Analysis (LSA).‬‬
‫فعىل سبيل املثال يقيس ‪ Lesk‬التشابه بني كلمتني عن طريق حساب نسبة التداخل‬
‫بني التعريف املناظر لكل كلمة عىل النحو املنصوص عليه من قبل القواميس الشهرية‪.‬‬
‫وأيضا حيدد (‪ )Wu& Palmer‬التشابه بني كلمتني عن طريق قياس مدى التباعد بني‬
‫موقع الكلمتني يف شبكة الكلامت املعجمية للغة اإلنجليزية (‪.)WordNet‬‬
‫وفيام ييل نامذج من أنظمة درجات اإلجابات القصرية‬

‫‪ -1.3‬نظام أكسفورد (‪)UCLES‬‬


‫يستخدم هذا النظام جمموعة من الكلامت واملرتادفات ونوافذ البحث واملطابقة مع‬
‫أنامط اإلجابة النموذجية‪ ،‬ويتم تعلم النظام باستخدام عدة أساليب لتعلم اآللة مثل‬
‫أسلوب شجرات القرار (‪ ،)Decision trees‬وتقنيات بايز (‪،)Bayesian Learning‬‬
‫وأساليب الربجمة املنطقية االستقرائية (‪.)Inductive Logic Programming‬‬
‫لتقييم مدى جودة نظام أكسفورد فقد تم جتربته عىل تقييم إجابات تسع أسئلة‬
‫من مقرر األحياء يف شهادة الثانوية العامة األمريكية (‪General Certificate of‬‬
‫‪ .)Secondary Education -GCSE‬تم جتميع ‪ 260‬إجابة جتريبية لكل سؤال من‬
‫األسئلة التسعة‪ .‬وتراوحت عالمات الدرجات هلذه األسئلة من ‪ 1‬إىل ‪.4‬‬
‫تم اختيار ‪ 200‬إجابة والدرجة املصححة لكل‬ ‫ومن بني ‪ 260‬إجابة لكل سؤال َّ‬
‫منها وذلك لتدريب نظام أكسفورد عىل كيفية اإلجابة (من خالل بناء نموذج لتعلم‬
‫اآللة) واستخدمت ‪ 60‬إجابة متبقية يف اختبار النظام‪ .‬أوضحت النتائج تطابق نتيجة‬
‫التصحيح بواسطة نظام أكسفورد مع نتائج التصحيح بواسطة مدريس املقرر بنسبة‬
‫‪.٪84‬‬

‫‪-133-‬‬
‫‪ -2.3‬نظام التقييم (‪)C-rater‬‬
‫باإلضافة إىل كون (‪ )C-rater‬يستخدم يف تقييم األسئلة املقالية‪ ،‬إال أنه يستخدم‬
‫أيضا يف تصحيح األجوبة القصرية‪ .‬وهو نظام وضع درجات آيل‪ ،‬يستخدم التحليل‬
‫الرصيف واملرتادفات‪ ،‬وهيكل اإلسناد والوسيط ومرجع الضمري لتقييم اإلجابات‬
‫القصرية املعتمدة عىل املحتوى‪.‬‬
‫تم تقييم كفاءة نظام التصنيف (‪ )C-rater‬من خالل برناجمني للتقييم واسعة النطاق‪.‬‬
‫كان الربنامج األول هو مرشوع التقييم الوطني للتقدم التعليمي بالواليات املتحدة يف‬
‫الرياضيات (‪ .)National Assessment of Educational Progress- NAEP‬وقد‬
‫استُخدم نظام التصنيف (‪ )C-rater‬لتقييم إجابات الطالب اخلاصة بتفسري احللول‬
‫اخلاصة لبعض مسائل الرياضيات‪ .‬حيث كان متوسط طول إجابات الطالب حوايل‬
‫‪ 1.2‬مجلة أو عدد ‪ 15‬كلمة‪.‬‬
‫اآلخر هو برنامج إدارة وتصحيح مقرر اإلنجليزية يف جامعة إنديانا‬ ‫الربنامج َ‬
‫األمريكية من خالل شبكة اإلنرتنت‪ .‬يف هذه احلالة‪ ،‬كان مطلوبا من برنامج (‪)C-rater‬‬
‫تقييم سبعة أسئلة لفهم املقروءات‪ ،‬حيث اإلجابات عىل هذه األسئلة أكثر انفتاحا من‬
‫إجابات األسئلة املتعلقة بفهم احللول الرياضية ‪.NAEP‬‬
‫تم اختيار وتقييم استجابات الطالب بني ‪ 245‬و ‪ 250‬عشوائيا من قبل اثنني من‬
‫املصححني البرش وبواسطة نظام التصنيف ‪ ،C‬وكان معدل اتفاق النظام مع املصحح‬
‫البرشي األول ‪ ٪84.4‬بينام كان معدل االتفاق بني النظام واملصحح البرشي الثاين‬
‫‪ .٪83.6‬وكان معدل االتفاق املتوسط بني االثنني من املصححني البرش ‪.٪90.8‬‬
‫وهذا يعني أن أداء نظام التصنيف ‪ C‬كان مشجعا يف حالة تقييم األسئلة املوضوعة‬
‫من قبل منظومة التقييم الوطني للتقدم التعليمي بالواليات املتحدة ‪.NAEP‬‬

‫‪ -3.3‬نظام تسجيل الدرجات آليا (‪)Automark‬‬


‫وهو نظام برجميات يستخدم تقنيات معاجلة اللغات الطبيعية ‪ NLP‬إلنجاز وضع‬
‫وسبة عىل إجابة نص حر عىل أسئلة مفتوحة‪ ،‬ويستخدم تقنيات استخراج‬
‫املح َ‬
‫الدرجات َ‬
‫املعلومات (‪ )Information Extraction‬الستخالص املفهوم الكامن أو املعنى وراء‬

‫‪-134-‬‬
‫النص احلر‪ .‬يستند وضع الدرجات فيه أساسا إىل حتليل املحتوى مع الوضع يف االعتبار‬
‫بعض سامت األسلوب ا َّلتي ينبغي النظر فيها‪ .‬متر عملية وضع الدرجات من خالل‬
‫أربع مراحل‪.‬‬
‫أوال‪ :‬تتم املعاجلة املسبقة إلجابة الطالب حتى تكون موحدة من حيث اإلمالء‬
‫وعالمات الرتقيم‪ ،‬والتأكد من أن النظام يتسامح مع أخطاء اإلمالء والكتابة‬
‫وبناء اجلملة‪.‬‬
‫ثانيا‪ :‬يقوم حملل اجلملة بالتعرف عىل املكونات النحوية الرئيسية للنص وكيفية‬
‫ارتباطها‪.‬‬
‫ثالثا‪ :‬ويقوم جزء برجمية تطابق األنامط بالبحث عن التطابقات بني قوالب نظام‬
‫وضع الدرجات واملكونات النحوية املكونة لنص الطالب‪.‬‬
‫رابعا‪ :‬ويف هناية املطاف تقوم وحدة «التعليق عىل إجابة الطالب» بمعاجلة نتيجة‬
‫تطابق اإلجابة مع النمط املخزن‪ ،‬ويكون التعليق عىل إجابة الطالب يف صورة‬
‫الدرجة ا َّلتي حيصل عليها‪ ،‬ومن املمكن أن تكون أكثر حتديدا‪.‬‬
‫تم اختبار التقييم اآليل (‪ )Automark‬لتقييم املناهج الوطنية األمريكية للعلوم‬
‫لتالمذة يف عمر اإلحدى عرشة سنة (‪National Curriculum Assessment of‬‬
‫‪ .)Science for eleven years old pupils‬وكان شكل إجابات الطالب ‪ :‬كلمة‬
‫واحدة‪ ،‬قيمة واحدة‪ ،‬وصف اجلملة التفسريية القصرية‪ ،‬أو وصف النمط املوجود‬
‫يف جمموعة من البيانات‪ .‬وتراوحت عالقة االرتباط املتحققة بني ‪ ٪93‬و ‪ ٪96‬مقارنة‬
‫بالتصحيح اليدوي‪.‬‬

‫‪ -4‬تقييم درجات الكالم‬


‫تقييم درجات الكالم آليا يشبه إىل حد كبري تقييم املقال املكتوب آليا‪.‬‬
‫أوال‪ ،‬يتم استخراج سامت اللغة ذات الصلة‪ ،‬ومن ثم يتم استخدام نموذج حلساب‬
‫الدرجات عىل أساس مزيج من هذه السامت‪ .‬خيتلف التقييم اآليل للمقال املكتوب‬
‫عن تقييم الكالم املنطوق يف نقطتني رئيسيتني النقطة األوىل‪ :‬أن تقييم الكالم املنطوق‬

‫‪-135-‬‬
‫يتطلب برجمة إضافية لتحويل الكالم إىل كتابة‪ .‬النقطة الثانية‪ :‬عادة ما يكون اختبارات‬
‫الكالم لغري ناطقي اللغة األصلية (‪.)Non native speakers‬‬
‫تصنف مهام رصد درجات الكالم يف فئتني أساسيتني ‪ :‬مهام فوىض منخفضة ومهام‬
‫فوىض ُقصوى‪.‬‬
‫تقوم مهام الفوىض املنخفضة برصد درجات االستجابات ا َّلتي يمكن التنبؤ هبا إىل‬
‫حد كبري مثل‪:‬‬
‫Ÿ Ÿالقراءة الشفوية من فقرات مكتوبة‪.‬‬
‫Ÿ Ÿطلب تكرار مجلة منطوقة مسجلة مسبقا عىل احلاسب‪.‬‬
‫Ÿ Ÿطلب إجابة منطوقة ألسئلة حمددة اإلجابة (‪.)Factual Questions‬‬
‫Ÿ Ÿطلب وصف صورة بسيطة‪.‬‬
‫يف املقابل فإن مهام الفوىض ال ُقصوى تقوم بالتعامل مع الكالم املتجدد ‪ -‬مقصو ًدا‬
‫كان أم ِ‬
‫عفو ًّيا‪.‬‬ ‫َ‬
‫وفيام ييل نامذج من أنظمة تقييم الكالم‪:‬‬

‫‪ -1.4‬حمرك أو آلة مصنف الكالم (‪)SpeechRater ETS Engine‬‬


‫يعترب ُم َ ِّرك (‪ )SpeechRater‬أحد تطبيقات رصد درجات االستجابة؛ حيث‬
‫يستخدم لتقدير درجات االستجابات العفوية‪ ،‬بام يف ذلك جمال االستجابات املمكنة‬
‫مفتوحة النهاية عىل النقيض من اإلجابات املقيدة‪.‬‬
‫وقد تم تقييم درجات املتقدمني الختبار االستعداد للحصول عىل اختبار تويفل عن‬
‫طريق تقدير الدرجات باستخدام آلة مصنف الكالم كجزء من اختبار ممارسة تويفل‬
‫‪ TOEFL‬من خالل اإلنرتنت منذ عام ‪ .2006‬تركز مسابقات تقييم أنظمة التعرف‬
‫عىل الكالم وتقييمه عىل اجلوانب ذات املستوى املنخفض من إنتاج الكالم مثل النطق‬
‫(‪ )pronunciation‬باستخدام مهام مقيدة من أجل زيادة املوثوقية يف النظام‪ .‬عىل‬
‫النقيض من ذلك فإن حمرك مصنف الكالم (‪ ،)The SpeechRater‬يعتمد عىل مفهوم‬
‫واسع لبناء إجادة احلديث باإلنجليزية‪ ،‬ويشمل جوانب التوصيل اجليد للكالم (مثل‬

‫‪-136-‬‬
‫الطالقة يف احلديث ودقة النطق)‪ ،‬وتسهيالت قواعد اللغة والقدرات رفيعة املستوى‬
‫املوضعي وتطور األفكار‪.‬‬
‫ّ‬ ‫التي تتعلق بالتامسك‬
‫يعالج حمرك مصنف الكالم (‪ )SpeechRater engine‬كل استجابة مع نظام التعرف‬
‫اآليل عىل الكالم املكيف خصوصا لالستخدام مع اإلنجليزية العامية‪ .‬واستنادا إىل ُمرج‬
‫هذا النظام‪ ،‬يتم استخدام معاجلة اللغات الطبيعية حلساب جمموعة من السامت التي متيز‬
‫«صورة» من الكالم بناء عىل عدد من األبعاد اللغوية‪ ،‬بام يف ذلك الطالقة‪ ،‬واستخدام‬
‫هنائي‬
‫ّ‬ ‫املفردات‪ ،‬والنطق واللحن يف الكالم‪ .‬تستخدم هذه من أجل تعيني درجة تقييم‬
‫إلجابة الطالب‪ .‬بينام يتم تشييد بنية هذا النموذج من التقييم من قبل خرباء املحتوى‪،‬‬
‫فإنه أيضا يتم التدريب عىل قاعدة بيانات من نتائج تقييم إجابات سابقة بواسطة خرباء‬
‫يف املجال وذلك من أجل ضامن أن حيقق حمرك مصنف الكالم حماكاة عالية لتقييم‬
‫اإلنسان بقدر اإلمكان‪ .‬عالوة عىل ذلك‪ ،‬إذا اكتشف النظام عدم قدرته عيل تقييم إجابة‬
‫الطالب املنطوقة نتيجة ُمشكالت جودة الصوت أو أ َّية ُمشكالت أخرى‪ ،‬فإن حمرك‬
‫تصنيف الكالم يمكنه وضعها جانبا للمعاجلة اخلاصة‪.‬‬
‫وتسعى رشكة (‪ )Educational Testing Service -ETS‬صاحبة نظام‬
‫‪ SpeechRater‬إىل تطوير العديد من خصائص املعاجلة الطبيعية للغة (‪ )NLP‬لتمثيل‬
‫التعبريات النحوية واكتشاف مالمح هيكل استجابة الردود املنطوقة‪ .‬كام تسعى إىل‬
‫زيادة قدرة النظام لالستخدام عىل نطاق واسع من املستخدمة يف عمليات تقييم كفاءة‬
‫الكالم باللغة اإلنجليزية‪ ،‬بام يف ذلك جمموعة من اخليارات املقيدة جد ًا (مثل قراءة‬
‫فقرات مكتوبة بصوت عال)‪ ،‬مرورا بالبنود األقل تقييدا (مثل مهام تلخيص وقراءة‬
‫نص مكتوب)‪ ،‬إىل اخليارات املفتوحة بشكل كامل‪.‬‬

‫‪ -2.4‬حمرك أو آلة مصنف الكالم فرسانت (‪)PKT Versant‬‬


‫تطبيق فرسانت (‪ )PKT Versant‬هو اختبار آيل للغة املنطوقة‪ ،‬والذي يمكن تنفيذه‬
‫بسهولة عرب اهلاتف أو جهاز احلاسب من قبل جمموعات كبرية من املرشحني‪ .‬ويتم‬
‫رصد درجات االختبارات آليا يف غضون دقائق تلقائيا‪ ،‬ويتمكن هذا التطبيق من‬
‫تنفيذ كل من‪ :‬تقديم نتيجة الرصد عموما‪ ،‬باإلضافة إىل رصد درجات املهارة األعىل‪.‬‬
‫وقد ساعدت اختبارات التطبيق كال من الرشكات والوكاالت احلكومية واجلامعات‬

‫‪-137-‬‬
‫واملدارس يف القياس الدقيق والرسيع ملهارات التحدث باإلنجليزية‪ ،‬أو باإلسبانية‪،‬‬
‫أو بالعربية يف أكثر من ‪ 100‬دولة حول أنحاء العامل من أجل أغراض االختبارات‬
‫والتدريب‪.‬‬
‫يقوم نظام اختبار فرسانت (‪ )Versant‬آليا بتقييم ردود االستجابات للعديد من‬
‫املهام املختلفة‪ .‬تتضمن اختبارات نظام فرسانت‪ :‬القراءة بصوت عال‪ ،‬وتكرار اجلمل‪،‬‬
‫وبناء اجلمل‪ ،‬وإعطاء األجوبة عىل أسئلة قصرية‪ ،‬رواية قصص قصرية‪ ،‬واختيار‬
‫االستجابة‪ ،‬واملحادثة‪ ،‬وطريقة القراءة والفهم‪ .‬يف اختبار الكتابة هلذا التطبيق فإن بند‬
‫املهام يتضمن‪ :‬الكتابة‪ ،‬وإكامل اجلمل‪ ،‬واإلمالء‪ ،‬وإعادة البناء‪ ،‬وكتابة رسائل الربيد‬
‫اإللكرتوين‪ .‬بالنسبة لبعض املهام‪ ،‬مثل القراءة والتكرار فهناك سلسلة واحدة من تتابع‬
‫الكلامت هي بالضبط الصحيحة املتوقعة لكل استجابة‪ .‬يف مهام أخرى‪ ،‬يمكن أن تكون‬
‫العنارص متعددة األجوبة الصحيحة‪ .‬متر كافة عنارص االختبار بإجراء اختبار مسبق‬
‫عايل الكثافة عىل عينات خمتلفة متنوعة من الناطقني وغري الناطقني باللغة يف طائفة‬
‫واسعة النطاق من جمال مستوى القدرة‪.‬‬

‫‪ -3.4‬حمرك أو آلة مصنف الكالم إديو سبيك (‪)EduSpeak‬‬


‫نظام إديو سبيك (‪ )EduSpeak‬من ‪ SRI‬الدولية نظام جمموعة أدوات تطوير‬
‫برجميات متكن مطورو الربجميات من تعليم اللغة تفاعليا باستخدام أحدث نظم‬
‫تكنولوجيا التعرف عىل الكالم والنطق وتسجيل الدرجات‪.‬‬
‫يسمح رصد درجات النطق اآليل للحاسب بتقديم مالحظات التغذية العكسية‬
‫(‪ )Feedback‬عىل اجلودة النوعية الشاملة للنطق لإلشارة إىل ُمشكالت التوليد‬
‫يسمح بمعاينة املنهج يف رصد درجات النطق‪ ،‬حيث إن اهلدف هو تقدير‬ ‫ُ‬ ‫املحددة‪ .‬كام‬
‫درجة التقييم لنوعية نطق فقرة أو مجلة يسعى اخلبري البرشي إىل تعيينها‪ .‬وتدعم أدوات‬
‫إديوسبيك (‪ )EduSpeak‬وظيفة استشعار خطأ النطق عىل مستوى اهلاتف باستخدام‬
‫إن بعض‬ ‫حيث َّ‬
‫ُ‬ ‫قواعد البيانات من الكالم وتقييامت اإلنسان عىل مستوى اجلملة‪،‬‬
‫املقاطع عرب اهلاتف تفتقر إىل جودة النطق‪ ،‬ومن املمكن تزويد الطالب بالتغذية العكسية‬
‫ومالحظات حول عن أخطاء نطق حمددة‪.‬‬

‫‪-138-‬‬
‫جرى تقييم قدرة النظام عىل الكشف عن أخطاء النطق (‪ )mispronunciation‬يف‬
‫قاعدة بيانات صوتية من ‪ 130‬ألف هاتف جلمل حديث متصل قاهلا ‪ 206‬شخص من‬
‫غري الناطقني باللغة األم وتم حتويلها إىل نصوص مكتوبة‪ .‬أظهرت النتائج أن نسبة اخلطأ‬
‫أعىل قليال من اخلطإ البرشي‪.‬‬

‫‪ -5‬أنظمة تقييم الرياضيات‬


‫يف جمال الرياضيات‪ ،‬فإن أداء نظم رصد الدرجات آليا قوية عندما يتم تقييد شكل‬
‫االستجابة‪ .‬تتعامل نظم تقييم الرياضيات مع بنود الرياضيات التي تتضمن املعادالت‬
‫أو التعبريات الرياضية‪ ،‬واألشكال اهلندسية ثنائية األبعاد واخلطوط املتصلة وغري‬
‫املتصلة أو اخلط املنحنى والرسوم البيانية واألرشطة‪ ،‬و ُمدخالت األرقام‪.‬‬
‫يشهد املجال حاليا ارتفا ًعا يف جودة هذه األنظمة‪ ،‬ومن املتوقع أن تنجز هذه النظم‬
‫مهامها بدقة عالية دون احلاجة ملراجعة املصحح البرشي‪.‬‬
‫وفيام ييل نموذج إلحدى األسئلة االختبارات وتتطلب إجاباهتا رسو ًما بيانية تقوم‬
‫نظم التقييم اآللية بتصحيحها ومنحها درجة تقييم‪:‬‬
‫«عائلة تسافر برسعة ثابتة خالل رحلة الطريق‪ .‬بعد ‪ 3‬ساعات من السري توقف‬
‫ملدة ساعتني لتناول الطعام والراحة‪ .‬ثم استأنفت السفر ملدة ‪ 4‬ساعات أخرى‬
‫بنفس الرسعة‪ .‬ارسم رسم بياين متثل به هذا الوضع»‪.‬‬
‫وهذا نموذج آخر ألسئـلة تتطلب صياغة اإلجابة يف صورة تعبري ومعادالت‬
‫رياضية‪:‬‬
‫«يف يوم واحد‪ ،‬باع أحد املتاجر عدد ‪ 300‬قميص بتخفيض قيمته ‪ ٪25‬من‬
‫السعر العادي وهو س للقميص الواحد‪.‬‬
‫عرب بصورة رياضية عن إمجايل املبلغ الذي حصل عليه املتجر يف ذلك اليوم»‪.‬‬
‫وفيام ييل نامذج من أنظمة تقييم الكالم‪:‬‬

‫‪-139-‬‬
‫‪ -1.5‬نظم تقييم الرياضيات (‪)m-rater‬‬
‫نظام حمرك مصنف درجات الرياضيات من رشكة (‪ )ETS’s m-rater‬وهو حمرك‬
‫يستعمل يف رصد الدرجات لالستجابات الرياضية مفتوحة النهاية‪ ،‬مثل تلك التي تأخذ‬
‫شكل تعبريات أو معادالت رياضية‪ ،‬أو رسوم بيانية‪ .‬منذ أواخر تسعين َّيات القرن العرشين‬
‫‪.1990‬‬

‫‪ -2.5‬نظم تقييم الرياضيات (‪)MathQuery‬‬


‫حمرك ماث كويرى (‪ )MathQuery‬من رشكة بريسون (‪ )Pearson‬يعمل يف بيئة‬
‫اإلنرتنت ويقوم بتقييم مهارات التفكري احلرجة يف الرياضيات حيث يتعامل مع مسائل العامل‬
‫احلقيقي التي يمكن حلها بأكثر من طريقة واحدة والتي يمكن أن تكون هلا حلول صحيحة‬
‫متعددة وليس بالرضورة أن تكون هذه احللول متكافئة‪.‬‬
‫يقوم املحرك (‪ )MathQuery‬بتحليل سلسلة اخلطوات أو املسار إىل احلل‪ .‬وبالنسبة‬
‫للتعبريات الرياضية‪ ،‬يقدم املحرك حمرر لكتابة املعادالت يمكن ختصيصه ملختلف مستويات‬
‫الدراسة وموضوعات املحتوى ومزود برموز اجلرب والرموز الالزمة حلساب التفاضل‬
‫والتكامل وغريها من املقررات الرياضية‪.‬‬

‫‪ -6‬أنظمة الكشف عن الرسقات األدبية (‪)Plagiarism Detection Systems‬‬


‫تستخدم هذه األنظمة يف الكشف عن الرسقات األدبية التي تتم يف املقاالت العلمية‬
‫واألدبية‪ .‬وتعتمد هذه األنظمة يف تقنياهتا عىل التشابه بني نص ما وبني النص األصيل‬
‫الذي سبق نرشه يف تاريخ سابق‪ .‬يتم فحص التشابه عىل نطاقني‪ :‬النطاق األول عىل‬
‫مستوى النص ككل مثل أسلوب الكتابة (‪ ،)Stylometry‬والنطاق الثاين عىل مستوى‬
‫الفقرات وهو ما يطلق عليه املستوى املحيل‪.‬‬
‫وتقنية بصمة النص (‪ )Fingerprint‬عىل مستوى النص ككل هي األكثر انتشارا‪.‬‬
‫تقوم أنظمة الكشف عن الرسقات األدبية ببناء قواعد بيانات لبصمة النص لعدد ضخم‬
‫من املقاالت املنشورة‪ .‬ويف حالة فحص مقالة أو نص جديد يتم مقارنة بصمتها مع‬
‫قاعدة البيانات‪ .‬يف حالة الكشف اإلجيايب يتم الفحص التفصييل بني هذا النص وبني‬

‫‪-140-‬‬
‫مؤرشا‬
‫ً‬ ‫النصوص املكتشفة‪ ،‬فإذا كانت نسبة التشابه أعىل من قيمة معينة فيعترب ذلك‬
‫قو ًّيا عىل وجود رسقة أدبية‪.‬‬
‫و الرسقات األدبية تنقسم إىل األنواع التالية‪:‬‬
‫‪ -1‬نسخ ولصق (‪.)Copy and Paste Plagiarism‬‬
‫‪ -2‬االحتيال املتنكر (‪.)Disguised Plagiarism‬‬
‫‪ -3‬االحتيال عن طريق إعادة الصياغة (‪.)Paraphrase Plagiarism‬‬
‫‪ -4‬االحتيال عن طريق الرتمجة (‪.)Translation Plagiarism‬‬
‫‪ -5‬رسقة األفكار (‪.)Idea Plagiarism‬‬
‫تتجه البحوث حاليا إىل الكشف عن الرسقات األدبية عن طريق الرتمجة‪ ،‬وهو ما‬
‫يطلق عليه (‪.)Cross Lingual Plagiarism Detection -CLPD‬‬
‫وفيام ييل قائمة ببعض األنظمة املستخدمة للكشف عن الرسقات األدبية‪:‬‬
‫أنظمة متاحة للجمهور‬ ‫أنظمة جتارية‬
‫‪Chimpsky‬‬ ‫‪Attributor‬‬
‫‪CitePlag‬‬ ‫‪Copyscape‬‬
‫‪CopyTracker‬‬ ‫‪Iparadigms: Ithenticate, Turnitin‬‬
‫‪eTBLAST‬‬ ‫‪Plagiarismdetect‬‬
‫‪Plagium‬‬ ‫‪PlagScan‬‬
‫‪SeeSources‬‬ ‫‪Urkund‬‬
‫‪The Plagiarism Checker‬‬ ‫‪Veriguide‬‬

‫‪ -7‬أنظمة التقييم اآليل ودعم اللغة العربية‬


‫توجد جهود بحثية قليلة جدا يف هذا املجال رغم أمهيته التعليمية وترجع صعوبة‬
‫تنفيذ أنظمة التقييم اآليل التي تدعم اللغة العربية إىل أهنا تتطلب معاجلات لغوية عميقة‬
‫وهي غري متوفرة حتى يومنا هذا بصورة مرضية‪.‬‬

‫‪-141-‬‬
‫ولكن هذا ال يمنع من البدء يف بناء أنظمة تقييم األجوبة القصرية وهي ال تتطلب‬
‫العمق التحلييل اللغوي كام هو احلال بالنسبة لألسئلة املقالية‪ .‬ولكنها تتطلب وجود ما‬
‫هو مماثل لشبكة الكلامت للغة اإلنجليزية (‪ )WordNet‬وشبكة الكلامت الداللية للغة‬
‫اإلنجليزية (‪.)SentiWordNet‬‬

‫‪ -8‬اخلالصة‬
‫تتنوع جماالت التَّصحيح اآل ّيل لالمتحانات‪ .‬وقد تم تقديم خمتلف النظم اآللية يف‬
‫هذا الفصل يف مجيع جماالت التقييم ورصد الدرجات‪َّ .‬‬
‫إن دقة النظم هي عالقة ارتباط‬
‫بني رصد الدرجات برشيا ورصد الدرجات بواسطة النظام‪ .‬أصبحت نظم رصد‬
‫البرشي ورصد الدرجات‬
‫ّ‬ ‫الدرجات آليا واقعا‪ ،‬وطاملا هناك فرق بني رصد درجات‬
‫اآليل فإن موضوع الدقة هي نقطة جيدة للبحث‪.‬‬
‫تم تعريب أدوات ونظم وتطبيقات وحزم الربجميات اجلاهزة من خالل تزويدها‬
‫باحلروف املطبعية (‪ )Fonts‬اخلاصة باللغة العربية والقدرة عىل تداول احلروف العربية جنبا‬
‫إىل جنب مع احلروف الالتينية مع األخذ يف االعتبار خصائص كتابة اللغة العربية من حيث‬
‫(أ) اجتاه الكتابة (من اليمني إىل اليسار)‪( ،‬ب) ومن تغري شكل احلروف طبقا ملوقعه يف‬
‫الكلمة‪( ،‬ج) ومن حيث ترتيب شفرة احلروف (يأيت حرف السني قبل حرف الشني مثال)‪.‬‬
‫يف نظام تشغيل احلاسب ‪ -‬مثل‪ :‬نظام ويندوز ميكروسوفت ‪ُ -‬ي َو ِّفر نظام التشغيل‬
‫اخلصائص السابقة ملعظم الربجميات والتطبيقات ا َّلتي تعمل حتت مظلته‪ ،‬إال أن‬
‫التطبيقات احلديثة‪ ،‬مثل ‪ :‬إدارة املعرفة‪ ،‬آالت البحث الذكية‪ ،‬حتويل النصوص املكتوبة‬
‫إىل نصوص منطوقة‪ ،‬وتصحيح درجات الطالب‪ ..‬ال تكتفي بالتعامل مع النصوص‬
‫عىل مستوى احلرف والكلمة لكنها تتعامل مع اجلملة شكال ومعنى‪.‬‬
‫ال يصلح مع التطبيقات احلديثة أسلوب التعريب عىل مستوى احلرف للتعامل مع‬
‫حيث يستدعي تعريب هذه التطبيقات أخذ شكل ومعنى‬ ‫اللغة األم وهى اللغة العربية‪ُ ،‬‬
‫الكلمة واجلملة العربية يف االعتبار‪ ،‬كام أن االكتفاء باملعاجلة عىل مستوى احلرف غري‬
‫كاف يف التطبيقات الذكية واملستقبلية‪ ،‬وهناك قصور شديد يف تعريب هذه التطبيقات‬
‫جيب تداركه يف املستقبل القريب بقدر اجلهد واالستطاعة‪.‬‬

‫‪-142-‬‬
‫ببليوجرافيا مرجع َّية‬
1. Bennett, R. E. (2011). Automated Scoring of Constructed-Response
Literacy and Mathematics Items, White Paper, Publisher: Arabella
Philanthropic Advisors.
2. Bernstein, J.; Suzuki, M.; Cheng, J.; Pado, U. (2009). Evaluating
diglossic aspects of an automated test of spoken modern standard
Arabic. ISCA International Workshop on Speech and Language
Technology in Education (SLaTE 2009).
3. Bernstein, J.; van Moere, A.; Cheng, J. (2010). Validating automat-
ed speaking tests. Language Testing.
4. Blokdyk, G. (2018). Text Mining Complete Self-Assessment Guide.
Emereo Pty Limited.
5. Burstein, J.; Chodorow, M. (2010). Progress and new directions in
technology for automated essay evaluation. In R. Kaplan (Ed.). The
Oxford Handbook of Applied Linguistics (2nd Ed., pp. 487–497).
New York: Oxford University Press.
6. Chen, L.; Tetreault, J.; Xi, X. (2010). Towards Using Structural
Events to Assess Non-Native Speech, NAACL-HLT 2010: Pro-
ceedings of the 5th Workshop on Building Educational Applications
(BEA-5) Association for Computational Linguistics.
7. Dikli, S. (2006). An Overview of Automated Scoring of Essays, The
Journal of Technology, Learning, and Assessment, Volume 5, Num-
ber 1.
8. Feldman, R.; Sanger, J. (2006): The Text Mining Handbook: Ad-
vanced Approaches in Analyzing Unstructured Data. Cambridge
University Press.
9. Franco, H.; Bratt, H.; Rossier, R.; Gadde, V. R.; Shriberg, E.; Abrash,
V.; Precoda, K. (2010). “EduSpeak: a speech recognition and pro-
nunciation scoring toolkit for computer-aided language learning ap-
plications,” Language Testing, vol. 27, no. 3, p. 401.

-143-
10. Gomaa, W.; Fahmy, A. (2013): A Survey of Text Similarity Approach-
es. International Journal of Computer Applications 68(13):13-18.
11. Gomma, W.; Fahmy, A. (2011). Tapping Into the Power of Auto-
mated Essay Scoring, 11th Conference on Language Engineering,
ESOLE.
12. Gomma, W.; Fahmy, A. (2014). Arabic Short Answer Scoring with
Ef-fective Feedback for Students. International Journal of Comput-
er Ap-plications 86 (2):13-18.
13. Hui, E. (2018). Learn R for Applied Statistics: With Data Visualiza-
tions, Regressions, and Statistics. Apress.
14. Jo, T. (2018). Text Mining: Concepts, Implementation, and Big Data
Challenge. Springer.
15. Kim, J. (2019). Genome Data Analysis. Springer Singapore.
16. Konchady, M. (2006). Text Mining Application Programming
(Pro-gramming Series). Charles River Media.
17. Mohler, M.; Mihalcea, R. (2009). Text-to-text Semantic Similari-
ty for Automatic Short Answer Grading, EACL ‘09 Proceedings of
the 12th Conference of the European Chapter of the Association for
Computational Linguistics
18. Shermis, M. D.; Burstein, J.; Higgins, D.; Zechner, K. (2009). Au-
tomated Essay Scoring: Writing Assessment and Instruction (2010
Elsevier Ltd).
19. Stein, B.; Sven, M.; Potthast, M. (2007). “Strategies for Retriev-
ing Plagiarized Documents”, Proceedings 30th Annual International
ACM SIGIR Conference, ACM.
20. Warschauer, M., & Ware, P. (2006). Automated writing evaluation:
Defining the classroom research agenda. Language Teaching Re-
search, 10(2), 157–180.
21. Zechner, K.; Higgins, D.; Xi, X.; Williamson, D. (2009). Automat-
ic Scoring of Non-Native Spontaneous Speech in Tests of Spoken

-144-
English, Speech Communication, Educational Testing Service, Au-
tomated Scoring and NLP, Rosedale Road, MS 11-R, Princeton, NJ
08541, USA 2009 , Vol. 51, No. 10, pp. 883–895.
22. Zizka, J.; Darena, F.; Svoboda, A. (2019). Text Mining with Ma-
chine Learning. Taylor & Francis Group.

-145-
-146-
‫الباحثون‬

‫‪-147-‬‬
-148-
‫الرازق عيل رشوان‬ ‫ِ‬
‫الدكتور‪ُ /‬مسن عبد َّ‬
‫أستاذ بقسم اإللكرتونيات واالتصاالت‬ ‫ٍ‬ ‫يشغل منصب‬
‫ختر َج عام ‪1977‬‬‫الكهربائية يف ُك ِّل َّية اهلندسة ‪ -‬جامعة القاهرة‪َّ .‬‬
‫وحصل عىل ثالتة ماجستريات‪ ،‬ثم‬ ‫َ‬ ‫وكان األول عىل دفعته‪،‬‬
‫عىل الدُّ كتوراه من جامعة كوين بكندا؛ أرشف عىل أكثر من مائة‬
‫املتخ ِّصصة‬ ‫الشكة اهلندسية لتطوير النُّ ُظم الر ِ‬
‫قم َّية ‪َ RDI‬‬ ‫رسالة ماجستري ودكتوراه‪ .‬يدير َّ‬
‫َّ‬ ‫َّ‬
‫يف جمال تقنيات ال ُّلغة العرب َّية‪.‬‬

‫الدكتور‪ /‬ا ُملعت ّز باهلل َّ‬


‫السعيد طه‬
‫الـمساعد بجامعة القاهرة‪ ،‬وأستاذ‬ ‫أستاذ الدِّ راسات ال ُّلغو َّية ُ‬
‫ال ِّلسان َّيات احلاسوب َّية املـُشارك بمعهد الدَّ وحة للدِّ راسات ال ُعليا‪،‬‬
‫الـمعجم َّية بمرشوع ُمعجم الدَّ وحة‪.‬‬ ‫نسق َوحدة املوارد ُ‬ ‫و ُم ِّ‬
‫عدد من الكتب‬ ‫ٍ‬ ‫ثالثني ورقة علم َّي ٍة‪ ،‬باإلضافة إىل‬ ‫نحو‬
‫َ‬ ‫َش َ‬ ‫نََ‬
‫وأسهم يف أكثر من عرشة‬ ‫عاصة‪،‬‬ ‫يف الـمعج ِمية العربِية والدِّ راسات ال ُّل َغ ِوية الـم ِ‬
‫َ‬ ‫ُ‬ ‫َّ‬ ‫ُ َ َّ َ َ َّ‬
‫عدد من اجلوائز‬ ‫حصل عىل ٍ‬ ‫َ‬ ‫وعات بحث َّي ٍة دول َّي ٍة يف ميادين ُم َ‬
‫عالة ال ُّلغات ال َّطبيع َّية‪.‬‬ ‫ٍ‬ ‫مرش‬
‫ُ‬
‫ختصصه‪ ،‬منها‪ :‬جائزة (ألكسو ‪ )ALECSO‬لإلبداع واالبتكار يف «املـَع ُلومات َّية‬ ‫يف َميدان ُّ‬
‫حيد لل ُع ُلوم وال َّثقافة‪.‬‬ ‫عالة اآلل َّية ل ُّلغة العرب َّية»‪ ،‬وجائزة راشد بن ُ َ‬
‫والـم َ‬
‫ُ‬

‫الدكتور‪ُ /‬م َّمد َعطِ َّية ُم َّمد ال َع َر ّيب‬


‫حصل من جامعة القاهرة عىل بكالوريوس هندسة‬
‫االتصاالت الكهربائية واإللكرتونيات عام ‪1995‬م‪ ،‬وعىل‬
‫املاجستري يف هندسة احلاسبات عام ‪2000‬م‪ ،‬ثم عىل درجة‬
‫الدكتوراه يف هندسة االتصاالت الكهربائية واإللكرتونيات‬
‫بالشكة اهلندسية لتطوير النُّ ُظم الر ِ‬
‫قم َّية ‪ RDI‬منذ يوليو ‪1995‬م‬ ‫عام ‪2005‬م‪َ .‬ع ِم َل َّ‬
‫َّ‬ ‫َّ‬
‫وبني عا َم ْي ‪2007‬م و ‪2010‬م أستا ًذا ً‬
‫زائرا يف كلية احلاسبات‬ ‫إىل هناية ‪2010‬م‪َ ،‬‬
‫وتقنيات املعلومات باألكاديمية البحرية للعلوم والتكنولوجيا والنقل البحري ‪ -‬فرع‬

‫‪-149-‬‬
‫ِ‬
‫القاهرة‪ ،‬وخم ِّط ًطا للربجميات برشكة «لوكسور تكنولوجي» الكندية ( ُأوكْف ْيل‪ُ /‬أون ْ‬
‫ْتار ُيو)‬
‫وخبريا للغويات احلاسوبية والربجميات ملرشوع «معجم الدوحة‬ ‫ً‬ ‫منذ ‪2009‬م إىل اآلن‪،‬‬
‫التارخيي» بني عا َم ْي ‪2014‬م و ‪2016‬م‪.‬‬

‫م َّمد عبد املنعم َع ِف ِيفي‬


‫الدكتور‪َ ُ /‬‬
‫حصل من جامعة القاهرة عىل درجة الدكتوراه يف هندسة‬
‫الصوت‬ ‫ِ‬
‫احلاسبات‪َ .‬يعمل ‪ -‬يف الوقت احلايل ‪ُ -‬مد ًيرا ألبحاث َّ‬
‫عمل باح ًثا يف معمل‬ ‫بمعامل رشكة مايكروسوفت ‪ -‬القاهرة‪َ .‬‬ ‫ِ‬
‫عمل أستا ًذا ُمشاركًا ب ُك ِّل َّية‬
‫‪ Bell‬ورشكة ‪ BBN‬ورشكة ‪ IBM‬كام َ‬
‫القاهرة‪ .‬ن ََش ما يربو عىل ‪ 40‬ورقة بحثِية يف دوري ٍ‬
‫ات‬ ‫احلاسبات واملعلومات يف جامعة ِ‬
‫َّ‬ ‫َ َّ‬ ‫َ‬
‫ؤمترات دول َّي ٍة ُمت َ‬
‫َخ ِّصصة‪ .‬‬ ‫ٍ‬ ‫علم َّي ٍة و ُم‬

‫الدكتور‪ /‬رشيف مهدي عبده‬


‫حصل عىل درجة الدكتوراه يف هندسة احلاسبات عام ‪2003‬م‬
‫من جامعة ميامى بالواليات املتحدة األمريكية‪ .‬يعمل حاليا أستا ًذا‬
‫ورئيسا لقسم تكنولوجيا املعلومات ب ُك ِّل َّية احلاسبات واملعلومات‬ ‫ً‬
‫عالة‬ ‫ِ‬ ‫ِ‬
‫يف جامعة القاهرة؛ باإلضافة إىل عمله استشار ًّيا لتقنيات ُم َ‬
‫لفرتة ‪ -‬باح ًثا‬‫ٍ‬ ‫عمل ‪-‬‬ ‫ال ُّلغة ال َع َربِ َّية ىف عدد من املراكز البحثية‪َ .‬‬
‫عالة ال ُّلغات ‪Bell‬‬ ‫تدريبات عمل َّية يف معامل ُم َ‬‫ٍ‬ ‫ِ‬
‫األمريك َّية‪ ،‬وقد تل َّقى‬ ‫برشكة ‪BBN‬‬
‫ِ‬
‫‪ Labs‬برشكة «لوسنت» ومركز أبحاث ال ُّلغات يف جامعة كولورادو األمريك َّية‪ .‬ن َ َ‬
‫َش ما‬
‫حصل عىل‬‫َ‬ ‫ؤمترات دول َّي ٍة ُمت َ‬
‫َخ ِّصصة؛ كام‬ ‫ٍ‬ ‫ات علم َّي ٍة و ُم‬
‫يربو عىل ‪ 80‬ورقة بحثِية يف دوري ٍ‬
‫َّ‬ ‫َ َّ‬
‫براءة اخرتا ٍع عن تقنية (حفص®)‪.‬‬

‫‪-150-‬‬
‫الدكتور‪ /‬عيل عيل فهمي‬
‫السابق ل ُك ِّل َّية احلاسبات واملعلومات يف جامعة‬ ‫ِ‬
‫هو ال َعميدُ َّ‬
‫االصطناعي‬
‫ّ‬ ‫القاهرة؛ يعمل ‪ -‬يف الوقت احلا ّيل ‪ -‬أستا ًذا يف َّ‬
‫الذكاء‬
‫ديرا ملركز‬
‫عمل خالل الفرتة من ‪ 2005‬إىل ‪ُ 2010‬م ً‬ ‫وتعلم اآللة‪َ .‬‬
‫ونمذجة ال ُّلغة ‪ DMCM‬يف ِمرص‪،‬‬ ‫َ‬ ‫التميز يف التَّنقيب يف البيانات‬
‫ِ‬
‫إسهامات بحث َّي ٌة بارز ٌة يف تقنيات ال ُّلغة ال َع َربِ َّية وتطبيقاتا‪.‬‬
‫ٌ‬ ‫وله‬

‫‪-151-‬‬
‫مباحث لغوية ‪٥٨‬‬
‫ٌ‬
‫تطبيقــــات أساس َّيــة فــــي‬
‫المعا َلجة اآلل َّية ل ُّلغة العرب َّية‬
‫ُ‬
‫يُصدِ ر مركز امللك عبداهلل بن عبدالعزيز الدولي خلدمة اللغة العربية هذا الكتاب ضمن سلسلة‬
‫(مباحث لغوية)‪ ،‬وذلك وفق خطة عمل مقسمة إلى مراحل‪ ،‬ملوضوعات علمية رأى املركز حاجة املكتبة‬
‫اللغوية العربية إليها‪ ،‬أو إلى بدء النشاط البحثي فيها‪ ،‬واجتهد يف استكتاب نخبة من احملررين واملؤلفني‬
‫للنهوض بعنوانات هذه السلسلة على أكمل وجه‪.‬‬
‫ويهدف املركز من وراء ذلك إلى تنشيط العمل يف املجاالت التي تُـنَـ ّبه إليها هذه السلسلة‪ ،‬سواء أكان‬
‫العمل علميا بحثيا‪ ،‬أم عمليا تنفيذيا‪ ،‬ويدعو املركز الباحثني كافة من أنحاء العالم إلى املساهمة يف هذه‬
‫السلسلة‪.‬‬
‫وجهد ُمح ِّر َري الكتاب‪ ،‬على ما تفضلوا به من رؤى‬
‫وتو ّد األمانة العامة أن تشيد بجهد السادة املؤلفني‪ُ ،‬‬
‫وأفكار خلدمة العربية يف هذا السياق البحثي‪.‬‬
‫والشكر والتقدير الوافر ملعالي وزير التعليم املشرف العام على املركز‪ ،‬الذي يحث على كل ما من‬
‫شأنه تثبيت الهوية اللغوية العربية‪ ،‬ومتتينها‪ ،‬وفق رؤية استشرافية محققة لتوجيهات قيادتنا احلكيمة‪.‬‬
‫موجهة إلى جميع املختصني واملهتمني للتواصل مع املركز؛ لبناء املشروعات العلمية‪ ،‬وتكثيف‬
‫والدعوة ّ‬
‫اجلهود‪ ،‬والتكامل نحو متكني لغتنا العربية‪ ،‬وحتقيق وجودها السامي يف مجاالت احلياة‪.‬‬

‫األمني العام للمركز‬


‫أ‪ .‬د‪ .‬محمود إسماعيل صالح‬

You might also like