Professional Documents
Culture Documents
Ep 178
Ep 178
تحرير
السعيــد
عتز بالله َّ
الـم ّ
دُ . دُ .محســـــــــــن َرشـــــــــــوان
الباحثون:
ُحـــــمـــــــــد عفيـــــفـــــــي
َّ د .مـ ُحمــــــــــــــــــــــد َعط َّيـــــــــــــــــة
د .مـ َّ
د .علي عــلـــي فهـــــــــمي د.شريــــف مهـــــــدي َعبــــده
مباحث لغوية ٥٨
الباحثون:
ُحمــــد عفيـــفي
د .مـ َّ ُحمــــــد َعط َّيــة
د .مـ َّ
د .عيل عــيل فهــــــمي د.رشيف مهــدي َعبده
29 -3حتديات ِ
اخلطاطة العربية التي تواجه التعرف عليها آل ًّيا
33 اآليل عىل الن َّّص ال َع َر ّيب املكتوب املبحث ال َّثاين :أنواع الت ُّ
َّعرف ّ
35 -1تصنيف أنامط الكتابة ومتثيلها من منظور حاسويب
37 -2تطبيقات التعرف اآليل عىل النص العريب املكتوب
43 العريب املكتوب
ّ اآليل عىل الن َّّص املبحث ال َّثالث :أساليب الت ُّ
َّعرف ّ
45 -1التعرف عىل النص املكتوب كأحد أنظمة التعرف عىل األنامط
47 -2أساليب التعرف عىل الكتابة العربية بتعقب خط اليد
-5-
48 -3أساليب التعرف عىل الكتابة العربية املطبوعة
50 -4أساليب التعرف عىل الكتابة العربية املخطوطة يدو ًّيا
50 ِ
املوارد اللغوية لتدريب وتقويم أنظمة التعرف عىل الكتابة العربية -5بناء
57 العريب املنطوق
ّ الفصل ال َّثاينُ :م َ
عالة الن َّّص
59 اآليل عىل الكالم
َّعرف ّ
األول :الت ُّ
املبحث َّ
61 -1مقدمة
62 -2مكونات نظم التعرف عىل الكالم
70 -3ملخص لبناء نظام للتعرف عىل الكالم
71 -4التعرف عىل الكالم يف ال ُّلغة العرب َّية
75 املبحث ال َّثاينُ :ن ُظم حتويل الن َّّص إىل كالم
77 -1التوصيف اللغوي
78 -2إنتاج إشارات الكالم
83 املبحث ال َّثالثُ :ن ُظم ال َّت َع ُّرف عىل ال ُّلغة وامل َت َك ِّلم
85 -1نظم التعرف عىل ال ُّلغة
86 -2نظم التعرف عىل املتكلم
93 الفصل ال َّثالث :تطبيقات ُمعاجلة ال ُّلغة العرب َّية يف جمال التَّعلِيم
96 -1تقنيات معاجلة اللغات الطبيعية ()NLP
99 -2تعلم النطق باستخدام تقنية التعرف اآل ّيل عىل الكالم
108 -3تعلم الكتابة باستخدام تقنية التعرف اآل ّيل عىل الكتابة
114 -4مقرتحات َبحثِ َّية
119 اآليل
الرابع :التَّقييم ّ
الفصل َّ
121 مقدمة
123 -1األسئلة املقالية وأنواعها
-6-
124 -2طرق تقييم املقال (املوضوعات التعبريية) آل ًّيا ()AES
132 -3تقييم اإلجابات القصرية.
135 -4تقييم درجات الكالم
139 -5أنظمة تقييم الرياضيات
-6أنظمة الكشف عن الرسقات األدبية
140
()Plagiarism Detection Systems
141 -7أنظمة التقييم اآليل ودعم اللغة العربية
142 -8اخلالصة
147 الباحثون
-7-
-8-
كلمة املركز
يعمل املركز يف جمال البحث العلمي ونرش الكتب مستهدف ًا الرتكيز عىل املجاالت
البحثية التي ما زالت بحاجة إىل تسليط الضوء عليها ،وتكثيف البحث فيها ،ولفت أنظار
الباحثني واجلهات األكاديمية إىل أمهية استثامرها بمختلف وجوه االستثامر ،وذلك مثل
جمال (التخطيط اللغوي) و (العربية يف العامل) و(األدلة واملعلومات) و (تعليم العربية
ألبنائها أو لغري الناطقني هبا) إىل غري ذلك من املجاالت ،وإن من أهم جماالت البحث
املستقبلية يف اللغة العربية جمال (العربية واحلوسبة ،والذكاء االصطناعي) حيث إن
حياة اللغات ومستقبلها مرهونة بمدى جتاوهبا مع التطورات التقنية والعامل االفرتايض،
وكثافة املحتوى االلكرتوين املكتوب ،وهو ما يشكّل حتديا حقيقيا أمام اللغات غري
املنتجة للمعرفة أو للتقنية.
وقد عمل املركز عىل تسليط الضوء عىل هذا املجال التخصيص؛ مستعينا بالكفاءات
القادرة من املهتمني بالتخصص البيني (بني اللغة واحلاسوب) مقدّ را جهودهم ،وهادف ًا
إىل نرشها ،وتعميم مبادئها ،راغب ًا أن يكون هذا املسار العلمي مقررا يف اجلامعات يف
كلية العربية واحلاسوب ،وجماال بحثيا يقصده الباحثون األكديميون ،واجلهات البحثية
العربية.
-9-
وقد أصدر املركز سابقا ستة عرش كتاب ًا خمتصا يف (حوسبة العربية) ويف
اإلفادة من (املدونات اللغوية) يف األبحاث العربية ،وحيتفل بإصدار سبعة كتب جديدة
خمتصة يف (حوسبة العربية والذكاء االصطناعي) ،ويقدمها للقارئ العريب ،وللجهات
األكاديمية؛ لإلفادة منها يف مناهج التعليم والبناء عليه ،وهذه الكتب السبعة هي:
االصطناعي ،تطبيقات الذكاء االصطناعي يف خدمة اللغة العربية،
ّ (العرب َّية َّ
والذكاء
خوارزميات الذكاء االصطناعي يف حتليل النص العريب ،مقدمة يف حوسبة اللغة
العربية ،املوارد اللغوية احلاسوبية ،املعاجلة اآللية للنصوص العربية ،تطبيقات أساسية
يف املعاجلة اآللية للغة العربية).
ويشكر املركز السادة مؤلفي الكتب ،وحمررهيا ،ملا تفضلوا به من عمل علمي
رصني ،وأدعو الباحثني واملؤلفني إىل التواصل مع املركز الستكامل املسرية ،وتفتيق
فضاءات املعرفة.
وفق اهلل اجلهود وسدد الرؤى.
األمني العام
أ .د .حممود إسامعيل صالح
-10-
مقدمة
بعضها من منطق ال ُّلغة ينطلق ُ ُ أساليب ُمب َتكَرة؛َ عال ُة ال ُّلغات ال َّطبيع َّية ُظ َ
هور تشهدُ ُم َ
اآلخ ُر من منطق بعضها َ وينطلق ُ ُ ِ
وقواعدها؛ القائم عىل استيعاب قوانني هذه ال ُّلغات
األساليب واملناهجَ والواقع َّ
أن ُ الـمتعدِّ دة. اآللة القائم عىل نمذجة ال ُّلغة يف ُمستوياهتا ُ
بني
تسمح باجلمع َ ُ بقدر من املرونة ا َّلتي َّسم ٍ املستخدمة يف ُمعاجلة ال ُّلغات ال َّطبيع َّية تت ُ
عطيات ُلغو َّي ٍة وإحصائ َّية ،عىل النَّحو ا َّلذي ُي َم ِّك ُن من الوصول إىل أفضل النَّتائج ٍ ُم
الـممكنة يف تطبيقات حوسبة ال ُّلغات ال َّطبيع َّية. ُ
تقييم عالة يستدعي للـم َ ِ َّ
ً الوقوف عىل نجاعة هذه األساليب وصالح َّيتها ُ َ إن
عميلُ ،يساعدُ عىل تطبيقي
ٍّ ٍ
إطار االفرتايض إىل َّظري
اإلطار الن َّ
َ يتجاوز
ُ موضوع ًّيا،
ّ َّ
مثل ولعل َ
لتجاوزهاَّ . حلول ف َّعال ًة ً باتا ،و ُيقدِّ ُم عالة و َع َق ِ الـم َ
ُ استكشاف إشكاالت ُ
ُ
تتكامل أساليب ُمعاجلة ال ُّلغات ال َّطبيع َّية ٍ
يضع أيدينا عىل حقيقة ،مفا ُدها َّ
أن
َ ذلك التَّقييم ُ
عو ُل عىل أخرى يف تطوير هذه ٍ ِ
فيام بينها؛ ف ُي َع َّو ُل عىل بعضها يف بناء تطبيقات ُم َع َّينة ،و ُي َّ
التَّطبيقات.
ابع من سلسلة دراسات و ُب ُحوث الر َ
الكتاب َّ
َ الـمن َط َلق ،نُقدِّ ُم للقارئ العر ّ
يب من هذا ُ
عالة اآلل َّية ل ُّلغة العرب َّية)؛ وس َبة ال ُّلغة العرب َّية ،ب ُعنوان (تطبيقات أساس َّية يف ُ
الـم َ يف َح َ
عالة ال ُّلغة العرب َّية
حول تقنيات ُم َ تطبيقي َ ذات ب ٍ ُحاول من خاللِ ِه أن
ون ُ
ّ عد نطرح ُرؤي ًة َ ُ
َ
-11-
أيضا إىل جوانب اإلفادة من تطبيقات ونعر ُج من َ
ذلك ً ورتَيها :املكتوبة واملنطوقةُ ، يف ُص َ
حوسبة ال ُّلغة العربية يف تعليمها من ناحية ،وتقييم ُمرجات عملية التَّعليم من ناحيةٍ
َّ َ َّ َ َ
أخرى.
الكتاب إىل أربعة ُف ُص ٍ ِ
ول ،عىل النَّحو َ ورغب ًة يف حتقيق أهدافنا املنشودة ،فقد َّ
قسمنا
اآليت:
َّص َّعرف عىل الن ّ يب املكتوب؛ ُيعنى بتقنيات الت ُّ َّص العر ّ
عالة الن ّ األولُ :م َ الفصل َّ
األول يتناول يف املبحث َّ ُ حيث ُ ويشتمل عىل ثالثة مباحث؛ ُ يب املكتوب، العر ّ
ِ
يب ،و ُيقدِّ ُم لذلك بإرهاصات اخلطاطة العرب َّية وتاريخ َّص العر ّ طبيع َة رسم الن ّ
ِ
َّعرف اآل ّيلاملبحث ال َّثاين بأنواع الت ُّ
ُ َّعرف عليها آل ًّيا؛ و ُيعنى حوس َبتها وحتدِّ يات الت ُّ َ
فيعرض ألساليب ُ املبحث ال َّث ُ
الث ُ يب املكتوب وتطبيقاته .أ َّما َّص العر ّ عىل الن ّ
َ
كذلك ويعرض
ُ أكان مطبو ًعا أم خمطو ًطا؛ يب ،سوا ٌء َ َّص العر ّ َّعرف عىل الن ّ الت ُّ
يب.
َّص العر ّ َّعرف عىل الن ّ اللزمة لتدريب وتقويم أنظمة الت ُّ للموارد ال ُّلغو َّية َّ
َّعرف عىل الكالميب املنطوق؛ ُيعنى بتقنيات الت ُّ َّص العر ّ الفصل الثاينُ :م َ
عالة الن ّ
األو ُل متهيدً ا َ
حول ُ
املبحث َّ حيث ُيقدِّ ُمُ َ
مباحث؛ ويشتمل عىل ثالثة ُ املنطوق؛
كونات ُن ُظ ِمه ،مع العناية بتطبيق َ
ذلك يف ال ُّلغة َّعرف اآل ّيل عىل الكالم و ُم ِّ الت ُّ
َّص (املكتوب) إىل كال ٍم (منطوق). املبحث ال َّثاين بنُ ُظم حتويل الن ّ
ُ العرب َّية .و ُيعنى
والـمتك ِّلم.
ُ َّعرف عىل ال ُّلغة
الث لنُ ُظم الت ُّاملبحث ال َّث ُ
ُ ويعرض
ُ
وترتكز ما َّد ُة هذا
ُ عالة ال ُّلغة العرب َّية يف جمال التَّعليم؛ الفصل ال َّثالث :تطبيقات ُم َ
حيث ُيقدِّ ُم متهيدً ا َ
حول الفصل عىل آل َّيات توظيف احلاسوب يف تعليم ال ُّلغات؛ ُ
ُ
الفصل تطبي ًقا عالة ال ُّلغات ال َّطبيع َّية وجدواها يف تع ُّلم ال ُّلغة؛ و ُيقدِّ ُم تقنيات ُم َ
َّعرف عىل الكالم املنطوق ،وتطبي ًقا حول تع ُّلم النُّطق باستخدام تقنية الت ُّ عمل ًّيا َ
َّص املكتوب. َّعرف عىل الن ّ حول تع ُّلم الكتابة باستخدام تقنية الت ُّ آخر ََ
باعتبار ِه أحدَ تطبيقات التَّنقيب ِ ُ
الفصل الرابع :التَّقييم اآل ّيل؛ يتناو ُل ُه
الفصل َّ
يعرض ُ حول األسئلة املقال َّية وأنواعهاُ ،ث َّم َ يف الن ُُّصوص .و ُيقدِّ ُم متهيدً ا
ل ُط ُرق التَّقييم اآل ّيل للمقال ،و ُط ُرق تقييم اإلجابات القصرية ،وأنظمة تقييم
-12-
يعرض لواقع أنظمة
ُ السقات األدب َّية .كام
الرياض َّيات ،وأنظمة الكشف عن َّ ِّ
التَّقييم اآل ّيل يف العرب َّية.
أعمق لتقنيات ُمعاجلة ال ُّلغة
َ الكتاب عىل فه ٍم
ُ وبعدُ ؛ فإنَّنا نرجو أن ُيساعدَ هذا
للباحثني يف
َ مفتاحا
ً ِ
الكتاب َ
تكون ما َّد ُة هذا ونلتمس أن
ُ العرب َّية وتطبيقاهتا األساس َّية؛
َ
وسائل ُمب َتكَرة لبناء وتطوير تقنيات ُم َ
عالة العرب َّية ميادين حوسبة ال ُّلغة للبحث عن
الـمختلفة.
رب ُمستوياهتا ُ ع َ
ِ
واألجر اجلزيل ،وأن جيع َله من حل َس ِن نسأل اهلل تعاىل أن يتق َّب َل هذا اجلهدَ ِّ
بالذكر ا َ ُ
ينفع أصحا َبه بعد مماهتم.العل ِم ا َّلذي ُ
وإليك ِ
املصري. َ َ
وإليك أنَبنا َ
عليك توكَّلنا ر َّبنا
حرران
الـم ِّ
ُ
-13-
-14-
الفصل األول
العربي املكتوب
ّ َّص ُمعا َ
جلة الن ّ
-15-
-16-
املبحث األ َّول
طبيعة رسم النص العربي
(اخل َط َ
اطة) ِ
-17-
-18-
-1خلفية تارخيية لتطور ِ
اخلطاطة العربية
حافظت اللغة العربية عىل استمراريتها كلغة حمكية حمتفظة بكياهنا منذ ما يربو عىل
ألفي عام -عىل أقل تقدير -إىل وقتنا هذا ،مما يتوجها دون شك كأعرق اللغات احلية
الكربى املتداولة يف العامل املعارص .وقد احتفظت هذه اللغة عىل مدى هذا التاريخ
الطويل بقدرهتا عىل االستجابة ملختلف االحتياجات احلضارية لألجيال املتتابعة،
كام استجابت باقتدار للتوسعات اجلغرافية والتمددات العرقية للمتحدثني هبا الذين
أساسا يف شبه اجلزيرة العربية قبيل ظهور اإلسالم حتى
تزايدوا من عدد حمدود حمصور ً
جتاوز عددهم عام 2011م الثالثمئة وستني مليونًا يتخذون من العربية لغتهم األم
ال عن عرشات املاليني اآلخرين الذين يتحدثوهنا ضمن ما يربو عىل مليار مسلم فض ً
غري عريب.
ورغم أن قواعد الصوتيات والرصف والنحو ...وغري ذلك من أركان اللغة
ودعائمها قد احتفظت بسامهتا املميزة عرب ذلك التاريخ املمتد والتوسع املستمر ،فإن
هناك تطورات متتابعة كانت جتري عىل بعض املالمح األخرى لِ ُّلغة .وتأيت ِ
اخلطاطة
العربية (التي حتدد طبيعة رسم النص العريب) ضمن املالمح التي جرت عليها مثل هذه
اخلطاطة املستخدمة لرسم النصوص يف عدد آخر من اللغات التطورات وهي نفس ِ
الرشقية املعارصة كاألُ ْر ِد َّية والفارسية والكردية ،كام استخدمت لرسم اللغة الرتكية
حتى ثالثينات القرن العرشين امليالدي.
مل يكن الغالب عىل سكان شبه اجلزيرة العربية قبل اإلسالم تكوين دول ذات أنظمة
مستقرة ومعامالت معقدة ،وإنام كانوا يف الغالب قبائل بدوية ،ومل تكن الكتابة شائعة
أساسا يف تداول املعلومات
بينهم -حتى أهنم عرفوا وقتذاك باألميني -حيث اعتمدوا ً
واملعرفة عىل رواية وحفظ األقوال البليغة املخترصة من شعر ونثر ،وهو ما متيزوا فيه
واشتهروا به .أما القلة النادرة التي كانت تعرف الكتابة -ربام بسبب مزاولتها للتجارة
أو لوجودها عىل ختوم اجلزيرة واحتكاكها بكربى احلضارات املعارصة آنذاك -فقد
اكتفت بنظام كتابة يميل إىل البساطة.
كانت اخلطاطة يف ذلك الوقت الباكر متثل احلروف العربية الثامنية والعرشين
رمزا رسوم ًّيا «جرافيم» ( )graphemeومن
(أو الثالثني) بخمسة عرش أو ستة عرش ً
-19-
النادرة اليت كانت تعرف الكتابة -رمبا بسبب مزاولتها للتجارة أو لوجودها على ختوم اجلزيرة
واحتكاكها بكربى احلضارات املعاصرة آنذاك -فقد اكتفت بنظام كتابة ُييل إىل البساطة.
كانت اخلطاطة يف ذلك الوقت الباكر متثل احلروف العربية الثمانية والعشرين (أو الثالثني)
رمزا رسوميًّا «جرافيم» ( )graphemeومن الواضح أن ذلك يسبب خبمسة عشر أو ستة عشر ً
فإن النقاط مل املثال سبيل وعىل احلروف. متييز يف ا
احلروفً .وعلى ًسبيل املثال فإن النقاط مل تكن قد ِكبري االتباس الواضح أن ذلك يسبب
أدخلت بعد يف كبريا ِيف متييز التباسا
ً
تكن قد ً
أدخلت بعد يف اخلطاطة العربية ،ولذلك فقد كانت حروف احلاء واخلاء واجليم
اخلطاطة ُ َّالعربية ،ولذلك فقد كانت حروف احلاء واخلاء واجليم كلها حمتثَّل بنفس الرمز الرسومي،
كلها تثل بنفس الرمز الرسومي ،وكذلك كانت حروف الباء والتاء والثاء والنون والياء
إخل. ذلك،...
الزمن الرسومي، يكتبونالرمز
العربية يف ثل بنفسمتكن َمتم ْن
الياء كلها
إلخ.ووقد
الرسومي،الثاء،...والنون
الرمزالباء والتاء و
حروف
كانتبنفس كذلك متثل
و كلها
ملكاهتم
بسبب بسبب
االلتباس كذلك اللغويةمع هذا
الرفيعة ،وربام ملكاهتمالتعايش
بسببالزمن من االلتباسذلك
هذاالعربية يف يكتبون وقدمنمتكن َم ْن
التعايش مع
بينهم.النسبية للرسائل املتداولة بينهم.
البساطة املتداولة
للرسائلبسبب
النسبيةمبا كذلك البساطة
الرفيعة ،ور اللغوية
أساسيةلتبادل
لتبادل وسيلةأساسيةالرتمجةوسيلة
«الرتمجة العبارة اآلتية
اآلتية « ستبدو العبارة
كانت ستبدو
كيف كانت
التايلكيف
الشكلالتايل
ويبنيالشكل
ويبني
الباكرة.الباكرة.
املرحلةاملرحلة
تلكتلكطاطتها يف عند ِخ
طاطتها يف عند ِخ
العصور» عىل مر
العصور» الشعوب
على مر الشعوببني بني
احلضارات
احلضارات
اإلسالم.
اإلسالم. القديمةما ماقبلقبل
العربيةالقدُية
ابخلطاطة العربية
مكتوبةبةباخلطاطة
عبارة مكتو :1:1-1مثالمثالعىلعلى
عبارة َّكل -1
الشالش
كل َّ
عليه-
عليهاهللوسلم
حممد -هللاصىل
الكريم صلى
الرسـولُممد -امليالدي ُبالرِعس َثـول الكرمي
امليالدي بحعِ َ
ث السابـــــعالقرنالساب ـ ــع
بداياتالقرن
ويفويفبداايت
الكرميوقد أمر
أصحابه الرسولمبني
أمر عريب
بلسان الكريموقد القرآن
عريب مبني الكرميمنهابلسانالقلب منهاويف
القرآن اإلسالم
برسالة القلب
اإلسالم ويف وسلم -برسالة
ثمرمجعه ذلكالقديمة، طاطة ِ ً
اشدون خلفاؤه ال مناخلبعد مجعهعرب
وكانُثذلك القدُية، طاطةبأول بتدوينهاخلِأوال
ذلك عرب أصحابه الكريموكان
الرسولالً أبول
بتدوينه أو
َ
من بعد ذلك خلفاؤه الراشدون ونرشوا ن َُسخه يف البالد التي وصل إليها اإلسالم يف
اإلسالم يفُ زمنهم واليت غطت مساحات شاسعة من ونشروا نح َس َخهح يف البالد اليت وصل إليها
والتي غطت مساحات شاسعة من األرض تسكنها أجناس شتى بألسنة شتى زمنهم
يتقنوا اللغة العربية بعد
ِ األرض تسكنها أجناس شىت أبلسنة شىت دخلوا يف دين اإلسالم وملا
دخلوا يف دين اإلسالم وملا يتقنوا اللغة العربية بعد (وهم من اص ُطلح عىل تسميتهم
هؤالء اترت أخطاء
األعاجم يف كثرت وتو
املسلمون هؤالء أخطاءفقد
وبطبيعة احلال
ابألعاجم).وتواترتتسميتهمفقد كثرت وبطبيعة احلال باألعاجم).طحلِح على
(وهم من اص
طاطة تسميته ابللَّحن) وكانت ِ
اخل من
اخلطاطة ْالقديمة للعربية وكانت ِ اصَّلطْححلِ َح
ن) على القرآنعىل(وهو ما
تسميته بال اص ُط ِل َح
(وهويفماقراءةاألعاجم
املسلمونالقرآن
قراءة
احلروف
وتلتبساملتشاهبة
احلروفالصوتية احلركات
وتلتبس احلركاتتغيب
الصوتية حيث كانت لديهمتغيب حنكانت أسباب اللَّ ْ
حيث من لدهيم للعرال َّل
بية ْحن القدُية
أسباب
يففأضيفت
التحريفمن التحر
من اإلسالمكتاباإلسالم
كتاب على
خافعىلالعلماء ذلكالعلامء انتشرخاف انترشملاذلكبينها .وبينها .وملا
فيخلطون فيخلطون
املتشاهبة
النقاط للتمييز بني احلروف املتشاهبة لتمييزها بصورة حاسمة كام نعرفها اليوم ،وينسب
ويبني الشكل رقم ( )2-1أدناه نفس العبارة
ذلك العمل إىل «نرص بن عاصم الليثي»19 ،
التي أوردناها كمثال يف شكل رقم ( )1-1أعاله لكنها خمطوطة بنقط احلروف.
-20-
فأضيفت النقاط للتمييز بني احلروف املتشاهبة لتمييزها بصورة حامسة كما نعرفها اليوم ،وينسب
ذلك العمل إىل «نصر بن عاصم الليثي» ،ويبني الشكل رقم ( )2-1أدانه نفس العبارة اليت
أوردانها كمثال يف شكل رقم ( )1-1أعاله لكنها ُمطوطة بنقط احلروف.
االلتباس.
لتقليلااللتباس.
بالنقاطلتقليل
خمطوطةابلنقاط
ولكنها ُمطوطة الشكلالسابق،
السابق ،ولكنها العبارةيفيفالشكل
العبارة نفس
نفس :2-:2-1
كلَّكل 1 َّ
الشالش
ويف حني أن نقاط «نرص بن عاصم» قد حسمت االلتباس بني رسم حروف اهلجاء،
ويف حني أن نقاط «نصر بن عاصم» قد حسمت االلتباس بني رسم حروف اهلجاء ،فقد
لكل من هذه احلروف ،وذلك ما فقد بقي اللحن نتيجة اخللط بني احلركات الصوتية ٍّ
لكل من هذه احلروف ،وذلك ما أزاله اللغوي بقي اللحن نتيجة اخللط بني احلركات الصوتية ٍ
بحل ّناجع يتمثل يف وضع نقاط إضافية فوق أزاله اللغوي الشهري «أبو األسود الدُّ َؤ ِ ّل» ٍّ
الشهري «أبو األسود الد َِ
َبل انجع يتمثل يف وضع نقاط إضافية فوق أو حتت كل حرف
عىل احلركة الصوتية املصاحبة له وسمى تلك النقاط «نقاط للداللة ٍّ
يل»
ُّؤ ّ أو حتت كل حرف
الكلمةال
موقعراب هنا
إبانة(واإلع
مناب»اليوماإلعر
عليهنقاط
النقاط «
نصطلح ومسىماتلك
يقصد به املصاحبة له
الصوتية هنا ال اإلعراب»احلركة
(واإلعراب للداللة على
حرف).به آنذاك إابنة
لكله قصد
املصاحبة ولكن
الصوتية النحوي،
موقع الكلمة
احلركةإبانةإابنة
آنذاكمن
عليهبه اليوم
قصد نصطلح
النحوي،ماولكنه
يقصد به
أستاذ أساتذة اللغة العربية يف عرصه «اخلليل بن أمحد حرف). بعقود لكل
قليلة قام املصاحبة
ذلكالصوتية
احلركة وبعد
األسودراهيدي
«أبوأمحد الف وضعها
اخلليل بن اإلعراب» التي
عصره « أساتذة«نقاط
اللغة العربية يف أستاذ رسم
بتحسني البرصي»
قليلة( )1قام الفراهيدي
ذلك بعقود وبعد
فتحةوأبدهلا اليوم من
الدؤيل» نعرفها
األسود التيأبو اليتالصويت
وضعها « الضبط)
(أوراب»
التشكيلاإلع
بعالمات «نقاط الدؤيل»)1وأبدهلا
بتحسني رسم (
البصري»
ال عن أنه أضاف عىل عمل «نرص بن عاصم» عالم ًة تدل وكرسة وضمة وسكون ،فض ً
بعالمات التشكيل (أو الضبط) الصويت اليت نعرفها اليوم من فتحة وكسرة وضمة وسكون،
ور ْس َم اهلمزة. عىل تضعيف احلرف َّ
(الشدَّ ة) َ
فضالً عن أنه أضاف على عمل «نصر بن عاصم» عالمةً تدل على تضعيف احلرف (الشَّدَّة)
اخلطاطة العربية بعد إضافات «اخلليل ابن أمحد» النص العريب املكتوب وجعلت ِ
ور ْس َم اهلمزة.
َ
-وخصوصا القرآن الكريم -يسري القراءة واستبعدت إىل حد بعيد حاالت االلتباس ً
والوصل-،
الوقف ،املكتوبالنص العريب » أمحد ابن اخلليل « إضافات بعد بية
ر الع طاطة وجعلت اخلِ
فيه .واستمر تالمذة اخلليل يف إضافة حتسينات تكميلية (كعالمات
استمر
الضبط االلتباسكاملفيه .و حاالت
ذروته يف بعيد بلغ
حدحتى استبعدت إىل
الكريم رسمو القرآن القراءة
يسريعىل
الكرمي-إلخ) وخصوصا القرآن
واإلدغام ... واملدً،
بنهايات القرن الثالث اهلجري حني بدا املصحف الرشيف عىل اهليئة التي نألفها اليوم
(انظر شكل رقم 3-1أدناه) حيث تشتمل ِخطاطة النص القرآين يف املصحف (وهي ما
القرآنّي"
تالوةو"األَصمعِ
َْ منيبَـ َويْه" القارئ
ومنهم ِ
"س لتمكني
العربية الالزمةأساطني الرموز
املشاهري من عىل كل
يديه كبار العثامين)
تتلمذ على اليوم أنبالرسم
"اخلليل" قد نعرفها ابلذكر
( )1جدير
الكريم حممد صىل اهلل عليه وسلم. الرسول
...وغريهم. عىلبن حُشيل"
أنزلَّضر
كام" و"الن
الكريمسائي
ِ
و"الك
َْ ْ ّ
20
-21-
َّ
الشكل :3-1عينة من نص القرآن الكريم خمطوطة بالرسم العثامين.
ومع صعود احلضارة اإلسالمية وقيام دوهلا العظمى املتعاقبة من العباسيني إىل
مرورا بام بينهام ،فإن النشاط اإلداري والسيايس وكذلك النهضة العلمية ً العثامنيني
قائم بذاته ،وبالتايل فإن والثقافية جعلت مجيعها من التدوين والتوثيق نشا ًطا وفنًّا ً
كبريا ً
عظيم من االهتامم وظهر مفهوم «اخلطوط» (ال ُفونْتات/ اخلطاطة العربية قد نالت ح ًّظا ً
اخلطاطة العربية العامة «خ ّط» نس ًقا مطردا يلتزم بقواعد ِ
األبناط )fontsحيث يمثل كل َ
ً
أغراضا معينة سواء كانتً املت َفق عليها ،ويتميز يف الوقت نفسه بجامليات خاصة به تفيد
الزخرفة والتشكيل (مثل ال ُّث ُلث والديواين؛ انظر الشكل رقم 4-1أدناه) ،أو اإلحياء
بالعراقة واألصالة (مثل الكويف) ،أو الرشاقة والوضوح واملعيارية (عائلة خطوط
النسخ؛ انظر الشكل 5-1أدناه) ،أو السهولة والرسعة (خط الرقعة؛ انظر الشكل رقم
6-1أدناه) ...إلخ.
-22-
َّ
الشكل :4-1عينة زخرفية من اخلط الديواين.
َّ
الشكل :5-1عينة من خطوط النسخ.
-23-
َّ
الشكل :6-1عينة من خط الرقعة.
-2تاريخ حوسبة ِ
اخلطاطة العربية
يمكن النظر حلوسبة ِخطاطة اللغة بصفة عامة عىل أهنا امتداد لسالفاهتا من التقنيات
األقدم يف هذا الصدد وهي اآلالت الكاتبة الكهربائية ومن قبلها امليكانيكية ومن قبلهام
تقنيات الطباعة بأجياهلا املتعاقبة .ومنذ بداية رحلة العامل مع الطباعة مل تكن اللغة العربية
يف هذا الصدد متخلفة عن نظرياهتا من اللغات األوروبية ،فقد أدخل العثامنيون آليات
مبكرا إىل حارضهتم املركزية «اآلستانة» يف النصف الثاين من القرن اخلامس ً الطباعة
عرش ،وهناك خالف عام إذا كانوا سبقوا إليها بشكل مستقل أو نقلوها عن األوروبيني
«مينْز» عام 1448م) ،وبغض األملان (حيث استطاع «جوتِن ِْبج» إنشاء أول مطبعة يف ِ
ْ
النظر عن ذلك فإن األمر املهم هو أن العثامنيني وقتذاك كانوا خيطون اللغة الرتكية (لغة
دولتهم املركزية الرسمية) باحلرف العريب (واستمر ذلك حتى ثالثينات القرن العرشين
امليالدي) كام أن اللغة العربية نفسها كانت لغة سائدة يف العلم والثقافة يتقنها ُج ُّل
املتعلمني األتراك.
-24-
ودخلت عملية الطباعة إىل العامل العريب مع بدايات القرن التاسع عرش امليالدي يف
مرص وبالد الشام ،وأخذت من ذلك الوقت يف االنتشار والتوسع؛ ومن مظاهر ذلك
مث ً
ال إنشاء «حممد عيل باشا الكبري» للمطابع األمريية يف مرص ،ثم تواصلت مواكبة نسخ
وطباعة اخلط العريب بعد ذلك لكل تطور يف هذا املجال حتى وصلنا لعرص احلاسبات
اخلطاطــةالرقمية يف النصــف الثاين من القرن العشــرين امليالدي حيث مل تكن ِ
العربيــة أقل استعــدا ًدا من أية لغة كربى أخرى للرقمنـة واحلوسبة .وعىل الرغم
من ذلك فقد تأخرت حوسبة ِ
اخلطاطة العربية بشكــل مستقــر ومقبــول إىل هنايــة
ثامنينــات وبدايـة تسعينات القــرن العشــرين امليــالدي! ونـرى أنه مـن اهلام إفساح
املســاحة يف هذا املقــام إلزالة بعــض األوهام وااللتبـاسات التي شاعت بأن هذا
اخلطــاطة العربية أو بسبب تقــصري التأخر كان بسبــب قــصور وتعقــــيد يف ِ
وعجز علامء ومهنديس احلوسبة العرب.
ظهرت بواكري احلاسبات اإللكرتونية الرقمية يف أربعينات ومخسينات القرن
وقتئذ أجهزة باهظة ٍ العرشين امليالدي يف الواليات املتحدة األمريكية ،وكانت
التكاليف هائلة احلجم (قد يشغل الواحد منها مبنى بأكمله) معقدة التشغيل ويف بعض
األحيان رسية التفاصيل ،ومع ذلك فإن أرفعها أدا ًء كان ذا إمكانات حسابية أقل من
اآلالت احلاسبة يف أيامنا هذه! وكان تفاعل هذه األجهزة مع مشغليها من املهندسني
املتخصصني حمدو ًدا وكان من البدهيي أن يكون هذا التفاعل عرب اللغة اإلنجليزية .ويف
العقدين التاليني أخذت إمكانات واعتامدية هذه األجهزة يف التصاعد بشكل ملحوظ
كثريا من أقل حاسب شخيص يف أيامنا هذه) بينام أخذ الطلب (وإن ظل أقواها أضعف ً
ال عن البحث العلمي يف الربوز عىل تطبيقاهتا يف جماالت اإلدارة واهلندسة والتنظيم فض ً
والتنامي ،ومع ذلك ظلت ضخمة احلجم (يشغل الواحد منها قاعة كبرية ويستخدم
طاقة كهربية هائلة) باهظة التكلفة ،وعىل ذلك رشعت رشكات -مثل «آي يب إم»
األمريكية -يف تصنيع أعداد حمدودة منها لبيعها بشكل جتاري إىل كربيات املؤسسات
املرصفية والصناعية واحلكومية والبحثية ،وملا كان تشغيلها ما يزال حيتاج إىل خرباء
ذوي تأهيل هنديس متخصص -وهم يتقنون اإلنجليزية بطبيعة احلال -فإن انفراد
أمرا مقبوالً بعيدً ا
اللغة اإلنجليزية بواجهات استخدام برجميات تلك احلاسبات ظل ً
عن االنتقاد واجلدل.
-25-
تغيــر املشهد جذر ًّيا بعد تصنيع وشيوع املشغالت الدقيقة للحاسبات ِ
«املايك ُْرو-
نطاق واس ٍع مط َل َع الثامنينات حيث شاعت ٍ يسور» ( )Microprocessorعىل ِ
بروس ُ
حاسبات صغرية لأللعاب وللتطبيقات البسيطــة بني عمـــوم الناس وخاصة الشبـاب ٌ
ِ ِ
َاري» ،ورشكة «سينْك ِلري»)،
(ومن أشهرها يف ذلك الوقت تلك التي أطلقتها رشكة « َأت ِ
ورغم أن تلك احلاسبات التي ارتكزت عىل األجيال األوىل من املشغــالت الدقيقــة
كانــت ذات إمكانات بدائية جدًّ ا مقــارنة باحلاسبـــات الشخصية يف أيامــنا هــذه
ال بني الشباب يف ذلك الوقــت حــيث كانــت مدخلهم فإهنا القــت رواجـــًا هائ ً
إىل عامل رقمي جديد ساحر باهر .وعند هذه النقطة بدأ االلتفات إىل مسألة اللغة التي
تتفاعل هبا برجميات تلك احلاسبات مع مستخدميها الذين مل يكن مجيعهم بالرضورة
عندئذ الطلب عىل استخدام اللغات املحلية لألسواق التي ٍ يتقنون اإلنجليزية ،ونشأ
تنترش هبا أعداد كبرية من مستخدمي تلك احلاسبات وكانت العربية من بني تلك
اللغات.
ما ع َّقد َّ
وأخر تلبية هذا الطلب هو األسباب الثالثة املرتابطة اآلتية:
ٍ
وقتئذ (تراوحت بني ثامنية 1.1املحدودية الشديدة لقدرات ذاكرة تلك احلاسبات
آالف كلمة إىل مخسة وستني ألف كلمة كحد أقىص) مما يعني أن كل الربجميات
العاملة وبياناهتا يف آن واحد ال يمكن أن يتعدى حجمها هذه الذاكرة الضئيلة.
وكان حيز الكلامت الرقمية التي تستخدم لتمثيل عنارص املعلومات -ومنها
احلروف -ضيق ًة جدًّ ا؛ بدأت بأربعة أرقام ثنائية وهو ما يسمح فقط بستة
تال وصل حيز الكلمة رمزا خمتل ًفا (اثنني مرفوعة ألس أربعة) ويف وقت ٍ
عرش ً
رمزا (اثنني مرفوعة
الرقمية إىل ستة أرقام ثنائية مما يسمح فقط بأربعة وستني ً
ألس ستة) ،وهذا بالكاد يستوعب الرموز املطلوبة للغة واحدة (كاإلنجليزية
مثالً) إضافة إىل رموز حتكم رضورية أخرى ،مما يعني صعوبة استيعاب أكثر من
لغة م ًعا يف آن واحد.
(هارد- ِ
ت-وير) عضو ًّيا واعتامدها مبارش ًة عىل عتاد ْ (السو ْف
2.2ارتباط الربجميات ُّ
ِوير) تلك احلاسبات وتشكيلهام م ًعا ً
منتجا واحدً ا تقوم بتصنيعه نفس الرشكة،
وبالتايل فإن تغيري لغة تفاعل تلك الربجميات كان حيتاج إىل تعديل املنتج وخط
-26-
إنتاجه .فإذا كان للرشكة املنتجة وقتها أن تدعم عدد س من اللغات فإنه كان
عليها أن تقيم وتدير س من خطوط اإلنتاج ملا تبنيه من حواسب بعتادها
وبرجمياهتا وهو أمر ليس باليسري.
3.3انغالق أنظمة هذه احلاسبات وبِنَاها أمام املطورين من خارج الرشكات املصنعة
هلا ،مما جعل من العسري عليهم أن يعدلوا برجميات تلك احلاسبات.
مع بداية النصف الثاين من ثامنينات القرن العرشين امليالدي وقعت تطورات هامة يف
عامل احلاسبات الصغرية حيث صارت املشغالت الدقيقة بكلامت يبلغ حيزها ثامنية أرقام
ثنائية هي السائدة مقابل أسعار معتدلة( .)1وبدأ خطان متوازيان يف صناعة احلاسبات
()2 ِ
«املاكينْتُوش» الصغرية؛ فنشأت رشكة «آبـِّل» ( )Appleاألمريكية وصنعت حاسبات
«ماك-أو-إس» يفصل االرتباط العضوي بني العتاد ّ الصغرية بنظام تشغيل متامسك
ِ
وبني الربجميات ،كام طورت الرشكة برجميات متيزت يف عامل الرسوميات «اجلرافيكْس»
ف وقتها باسم «النرش املكتبي»، وتنسيق املطبوعات وإعدادها للنرش والطباعة فيام ُع ِر َ
ونجحت يف نقل عامل نرش الصحف واملجالت من عرص امليكنة إىل عرص احلوسبة،
وأمكن االستجابة للطلب عىل إتاحة هذا النرش املكتبي بلغات العامل الكربى املختلفة،
متاحا بصورة جيدة عىل هذا النوعويف أقل من سنتني كان النرش املكتبي باخلط العريب ً
من احلاسبات مدعو ًما بسوق الصحافة اخلليجية السخي .أما عىل اخلط املوازي اآلخر
كثريا طرحت «آي-يب-إم» العمالق األمريكي يف ولكن عىل نطاق انتشار أوسع ً
الصغري حتت اسم «احلاسب الشخيص» (Personal َ عامل صناعة احلاسبات حاس َبها
)Computer- PCبسعر جذاب( )3وألقت وراءه ثقلها إدراكًا منها أن مستقبل سوق
احلاسبات سوف تسيطر عليه احلاسبات الصغرية وليست العمالقة ،وحقق هذا النوع
من احلاسبات الذي كان يعمل عىل مشغالت دقيقة من رشكة «إنْتِل» بكلامت يبلغ
-27-
ال وبيعت منه ماليني الوحدات ،وكان من أسباب نجاحا هائ ً
ً حيزها ثامنية أرقام ثنائية
«مايكْروسوفت» حيث كان وس» ( )DOSمن رشكة ِ نجاحه تزويده بنظام تشغيل « ُد ْ
مفتوحا كرس مبدأ الفصل بني تطوير الربجميات وبني تصنيع العتاد يف مثل ذلك ً نظا ًما
النوع من احلاسبات الصغرية فسمح بذلك للمطورين من خارج كلتا الرشكتني بتطوير
برجميات هلذه احلاسبات .وضمن هذا املناخ رشعت رشكات عربية يف حماوالت إنتاج
برجميات عربية لتلك احلاسبات ورشعت أخرى يف حماولة تعريب بعض الربجميات
أمر ممكن.
نجاحا أثبت أن التعريب ٌ
ً الشهرية والقت تلك املحاوالت
ْروسو ْفت» نظام تشغيلها «ويندوز -اإلصدار وبعد عام 1990م حني طرحت ِ
«مايك ُ
»3.1بواجهة تشغيل رسومية ارتفعت موجة انتشار احلاسبات الشخصية لتشمل كل
نواحي العامل تقري ًبا ولتحتكر «مايكروسوفت» سوق أنظمة التشغيل هلذا النوع من
كثريا مما دفع
احلاسبات الذي كانت إمكاناته احلاسوبية بحلول ذلك الوقت قد ارتقت ً
ْروسو ْفت» لطرح ملحقات لنظام تشغيلها تدعم لغات العامل املختلفة ومن بينها ِ
«مايك ُ
العربية سواء يف واجهة استخدام نظام التشغيل أو يف براجمها املكتبية -خاصة برناجمها
عرضا عىل الشاشة وطباع ًة عىل الورق. ورد» – ً «و ْ
األشهر لكتابة الوثائق وتنسيقها ُ
وبطبيعة احلال مل خيل األمر يف البداية من بعض املشكالت واملنغصات اهلامشية التي
أخذت تتالشى تدرجي ًّيا مع اإلصدارات التالية املتالحقة لنظام التشغيل «ويندوز».
املو َّحد لشفرات احلُ ُروف» ( )Unicodeذي الستة واآلن ،وبعد شيوع معيار «النِّظام َ
رقم ثنائ ًّيا لتمثيل النصوص والذي يتسع حلروف معظم لغات العامل املعارصة واسعة عرش ً
التداول (ومن بينها العربية بالطبع) ،فإن احلرف العريب مدعوم بسالسة وبشكل تلقائي
– دون احلاجة لتنصيب ملحقات -عىل كافة أنواع احلاسبات تقري ًبا سوا ًء أكانت األجيال
املتقدمة من احلاسبات الشخصية وصوالً إىل احلواسب الكفية املدجمة مع األجيال احلديثة
من اهلواتف النقالة ،وغري ذلك من األصناف املتعددة للحاسبات.
وجتب اإلشارة يف ختام هذا االستعراض التارخيي إىل أن ميكنة وحوسبة ِ
اخلطاطة
أساسا مع اخلطوط العربية العربية كانت كلتامها وما زالتا تتعامالن يف مسارمها الرئييس ً
املنتظمة ،ونعني هبا تلك اخلطوط التي تنساب كتابتها يف اجتاه واحد؛ وهو االجتاه أفق ًّيا
من اليمني إىل اليسار ،ويف نفس الوقت تسمح برسم أي نص عريب عرب انتقاء سلسلة
-28-
من الوحدات التي تنتمي إىل فئة مغلقة من الوحدات الرسومية «اجلرافيامت» .ويف حني
أن هذا التعريف يستبعد اخلطوط الزخرفية ،فإن إضافة الوضوح واملعيارية إليه جيعل
خطوط النسخ البسيطة (راجع الشكل رقم )5-1هي حمل الرتكيز األكرب هلذه الصناعة.
-3حتديات ِ
اخلطاطة العربية التي تواجه التعرف عليها آل ًّيا
بعد االستعراض التارخيي لنشأة ِ
اخلطاطة العربية ثم ميكنتها وحوسبتها ،نقوم فيام
اخلطاطة التي تشكل حتديات ينبغي عىل أي نظام ييل بالتدقيق يف بعض تفاصيل هذه ِ
ناجح للتعرف اآليل عىل النص العريب املكتوب أن يعاجلها بفعالية.
1.1اتصال احلروف :يمكن كتابة اللغات األوروبية بحروف منفصلة (وهي السائدة
كثريا عند الكتابة
يف النسخ والطباعة لبساطتها) أو بحروف متصلة (وتستخدم ً
بخط اليد) ،يف حني أن لغات أمم كربى يف أقىص رشق آسيا (كالصينية واليابانية
َط دائم باحلرف املنفصل ،أما ِ
اخلطاطة العربية (ويشاركها يف ذلك والكورية) ُت ُّ ً
البنغالية واهلندية) ف ُت ْكتَب ً
دائم باحلرف املتصل.
ومن وجهة نظر أية آلية حاسوبية للتعرف عىل األنامط الرسومية ،فإنه مع
تثبيت مجيع الظروف األخرى يكون التعرف عىل األنامط وهي منفصلة أيرس
من التعرف عليها وهي متصلة ببعضها البعض ،حيث يتوجب يف حالة
االتصال حل مسألة تعيني حدود كل رمز رسومي «جرافيم» (وهو ما يطلق
عليه الباحثون يف هذا املجال اسم «التقطيع» ( ))segmentationإضاف ًة بالطبع
إىل مسألة «التعرف» ( )recognitionعىل احلرف الذي يرمز إليه كل جرافيم.
وكام يمكن استشفافه من الشكل رقم ( )7-1أدناه ،فإن التعرف الصحيح عىل
الرموز يتطلب تعيني حدودها بشكل سليم ،ولكن تعيني هذه احلدود بدوره
يتطلب معرفة الرموز أوالً!
وهكذا ،فإنه ال مفر من حل كلتا املسألتني («التعرف» و «التقطيع») آن ًّيا وهو
ما يضاعف التحدي ،ويتناول أول أقسام املبحث الثالث من هذا الفصل املزيد
عن أساليب حتقيق ذلك .بقي أن نؤكد ثاني ًة عىل أن اخلطوط العربية املنتظمة
حسب التعريف الذي أوردناه يف هناية القسم السابق هي تلك التي يمكن تعيني
-29-
حدود وفواصل واضحة بني جرافيامهتا بينام ال يمكن عمل ذلك مع اخلطوط
غري املنتظمة؛ مثل تلك الزخرفية (راجع شكل رقم 4-1أعاله).
َّ
الشكل :7-1االتصال األفقي بني احلروف املتتالية يف خطوط النسخ وتعيني حدوده.
2.2التداخل بني حدود اجلرافميات :مما يزيد من التحدي السالف عرضه يف
النقطة السابقة أننا نرى أحيانًا بعض التداخل (أو الرتاكب) الطفيف بني حدود
جرافيامت بعض اخلطوط العربية املنتظمة كام يمثل له الشكل رقم ( )8-1أدناه.
َّ
الشكل :8-1مثال عىل الرتاكب بني احلروف املتتالية.
3.3تغري رسم احلرف مع تغري موضعه يف الكلمة :وهذا التغري هو بالطبع نتيجة
للكتابة متصلة احلروف ،ويؤدي هذا التغري إىل زيادة كبرية عدد الرموز
الرسومية التي يتوجب أن يتعامل معها أي نظام للتعرف اآليل عىل النص
ال مع اللغات األوروبية التي ُتَط عند طباعتها عادة
العريب املكتوب باملقارنة مث ً
باحلرف املنفصل.
ومن وجهة نظر أية آلية حاسوبية للتعرف عىل األنامط الرسومية ،فإنه مع تثبيت
مجيع الظروف األخرى يكون التعرف أكثر دقة كلام قلت عدد األنامط الرسومية
املختلفة والعكس بالعكس.
-30-
4.4اجلرافيامت املركبة من أكثر من حرف واحد :الكثري من خطوط النسخ
املستخدمة بكثافة يف ميكنة وحوسبة نسخ وطباعة الكتابة العربية (ومن بينها
ِ
اخلَ ُّط الذي كُت َ
ب به هذا الكتاب) حتتوي عىل العديد من اجلرافيامت املركبة من
حرفني أو ثالثة (والتي ال يمكن التعامل معها إال كوحدة رسومية واحدة)،
ويبني شكل رقم ( )10-1أدناه أمثلة عىل بعض هذه اجلرافميات املركبة.
وعالو ًة عىل ما أرشنا إليه يف النقطة السابقة ،فإن هذه اجلرافيامت املركبة ترفع
عدد األنامط الرسومية التي يتوجب عىل أي نظام للتعرف عىل النص املكتوب
التعامل معها مما يرفع درجة الصعوبة ،وإذا كانت ِ
اخلطاطة اإلنجليزية – عىل
جرافيم فإن العربية حتتاج
ً سبيل املثال -يف هذا الصدد قد تكتفي بحوايل ثامنني
إىل ما يزيد عىل مئة وتسعني.
َّ
الشكل :10-1أمثلة عىل جرافيامت مركبة من أكثر من حرف يف أحد خطوط النسخ.
5.5النَّ ْقط :كلام كانت الفروق الشكلية بني األنامط الرسومية أكرب ،فإنه مع تثبيت
مجيع الظروف األخرى ترتفع قدرة أي نظام للتعرف اآليل عليها .وبام أن نسبة
كبرية من جرافيامت اخلطاطة العربية متشاهبة شكل ًّيا إىل حد بعيد وال تتاميز إال
بوجود أو غياب النقاط -أو اهلمزة يف بعض األحيان – فإن ذلك بالتأكيد يرفع
التحدي أمام أي نظام للتعرف اآليل عىل النص العريب املكتوب.
َّ
الشكل :11-1أمثلة عىل جمموعات احلروف العربية التي تتاميز بالنقاط.
6.6عالمات الضبط الصويت (التشكيل) :تعترب عالمات التشكيل يف ِ
اخلطاطة
العربية تعقيدً ا إضاف ًّيا أمام أي نظام للتعرف اآليل عىل النص العريب املكتوب
وذلك ألهنا ال تقع يف سياق تسلسل أفقي مثل اجلرافيامت اهلجائية ولكنها يف
مواضع رأسية فوقها أو حتتها (كام يبني شكل رقم 12-1أدناه).
-31-
ولذلك فإن مثل هذه األنظمة تتعامل مع عالمات التشكيل إما بمحاولة
مبكرا ثم حذفها قبل عملية التعرف عىل النص املكتوب ،أو ً اكتشافها
نادرا ما تضاف إليها هذه
بتجاهلها عىل اعتبار أن الكتابة العربية املعارصة ً
العالمات إال ألغراض تعليمية أو عند اقتباس النصوص الدينية أو الرتاثية.
َّ
الشكل :12-1مثال عىل عبارة عربية بعالمات الضبط الصويت الكامل.
-32-
املبحث َّ
الثاني
اآللي
ّ عرف أنواع التَّ ُّ
بي املكتوب
َّص ال َع َر ّعلى الن ّ
-33-
-34-
-1تصنيف أنامط الكتابة ومتثيلها من منظور حاسويب
ِ
ب ظروف «ر ْق َمن ُة( )Digitization( »)1الكتابة ومن َث َّم متثي ُلها حاسوب ًّيا َح ْس َ
جتري َ
إنتاج الكتابة املستهدَ فة وذلك َو ْف َق املخ َّطط الذي يلخصه الشكل رقم ( )13-1أدناه:
َّ
الشكل :13-1تصنيف أنامط إنتاج الكتابة حسب التعامل معها حاسوب ًّيا.
تعقب حركة اليد أثنا َء مرور األصبع أو قلم خاص ُ فهناك الكتابة اليدوية حيث جيري
ٍ ٍ ِ
حلاسب َك ِّف ٍّي أم هات ًفا ذك ًّيا أم عىل لوح حساس ل َّل ْمس سواء أكان َ
لوح كتابة أم شاش ًة
حي ...إلخ ،ويتم هذا التعقب عرب تعيني والتقاط املوضع النسبي لليد ٍ
حلاسب َل ْو ٍّ شاش ًة
تتابع هذه ِ
كل حلظة( )2وإرسالا إىل ذاكرة احلاسب ويشكل ُ عىل اللوح احلساس لِ َّل ْمس َّ
الر ْق ِم َّي للكتابة اليدوية كام يبينه الشكل رقم ( )14-1أدناه ،وهو ما َ
التمثيل َّ اللقطات
يسمح بتكوين «املنحنيات املناظرة ملسار الكتابة» ( )Writing Contoursوهي املعلومة
األساسية يف عملية التعرف عىل هذه الكتابة.
-1أي حتويلها من حالتها األصلية «التناظرية »Analogإىل احلالة «الرقمية »Digitalمن أجل إدخاهلا ومعاجلتها بواسطة
احلاسبات الرقمية.
ٍ ِ
-2تستطيع التقني ُة احلالي ُة رصدَ عدة مئات من اللقطات ملوضع ال َّل ْمس عىل اللوح احلساس يف كل ثانية ،وهو ما يضمن
ُ
تفاصيل حركة اليد. ال َس ِل ًسا للكتابة ال ُت ْف َقدُ فيه
متثي ً
-35-
الشكل :14-1مثال عىل رقمنة الكتابة اليدوية أثناء كتابة كلمة «العبارة»
َّ
ومتثل العقد الصغرية مواضع اليد عند اللحظات التي جرى تسجي ُلها.
ال بحروف متصلة كام يف الكتابة العادية وقد تكون الكتابة اليدوية تدوينًا مسرتس ً
احلرة (كام يف شكل رقم 14-1عالِ َيه) وهي احلالة األصعب يف التعرف عليها ،أو تكون
ُ
ونتناول َب ْع َض جمرد حروف أو عالمات منفصلة وهي احلالة األيرس يف التعرف عليها،
التطبيقات املتصلة بكلتا احلالتني يف القسم التايل.
وعىل الناحية األخرى هناك الصفحات املحتوية عىل نصوص مكتوبة بالفعل،
حيث جيري حتويل ك ٍُّل من هذه الصفحات إىل «صورة رقمية» ( )Digital Imageعرب
ؤخذ اآلن باملعيار األوسع َقبوالً جهاز «املاسح الضوئي» ( ،)Scannerويف هذا الصدد ُي َ
لعملية املسح الضوئي بتباين أحادي اللون (باألبيض واألسود) وبتحليل طويل يساوي
(.)2
وصة املر َّبعة)
وصة( )1طولية (أي ثالثمئة وستني ألف نقطة يف ال ُب َ
ستمئة نقطة يف كل ُب َ
وقد تكون الصفحة املمسوحة ضوئ ًّيا مكتوب ًة بخط اليد احلر سواء أكانت كتابة
مسرتسلة بحروف متصلة (كام يبني الشكل رقم 15-1أدناه مثاالً عىل ذلك) وهي
احلالة األصعب يف التعرف عليها ،أو تكون جمرد حروف أو عالمات منفصلة وهي
األيرس يف التعرف عليها ،ونأيت عىل ِذكْر بعض التطبيقات املتصلة بكلتا احلالتني يف
القسم التايل.
-36-
َّ
الشكل :15-1مثال عىل الصورة الرقمية الناجتة عن املسح الضوئي لصفحة حتتوي عىل كتابة بخط
اليد ،ومتثل حمتويات كل مربع صغري إحدى نقاط هذه الصورة الرقمية
وعىل الناحية األخرى قد يكون النص يف الصفحة املمسوحة ضوئيا مطبوعا (كام
يبني الشكل 16-1أدناه مثاالً عىل ذلك) ويتصاعد حتدي التعرف عىل النص عندما
تتعدد اخلطوط (األبناط) املستخدمة يف طباعته عام إذا كان مطبو ًعا بخط واحد فقط.
َّ
الشكل :16-1مثال عىل الصورة الرقمية الناجتة عن املسح الضوئي لصفحة حتتوي عىل نص
مطبوع ،ومتثل حمتويات كل مربع صغري إحدى نقاط هذه الصورة الرقمية
كثريا من
وبصفة عامة فإن التعرف اآليل عىل النصوص املخطوطة يدو ًّيا أصعب ً
ُ
ونتناول َب ْع َض التطبيقات املتصلة بكلتا احلالتني التعرف عىل النصوص املطبوعة،
يف القسم التايل.
-37-
دة للمستخدم متكنه من التحقق من صحة التعرف عىل مساع ٍ
ِ ٍ
أدوات ما حتتوي عىل
ما يكتبه والتدخل لتصويبه عند اللزوم ،بل حتتوي نُوا ُة هذه الربجميات أحيانًا آلياتِ
َ
التعرف عليه من كتابة
ُ تدقيق إمالئي لتوجيه عملية التعرف أو لتصويب ما جرى ٍ
أدوات «لِلتَّك ُّيف» ()Adaptation
ٍ عربية مسرتسلة بحروف متصلة ،كام أهنا تتضمن
بعض هذه األدوات لالرتقاء بأداء التعرف عىل كل أو ُ مع خط املستخدم ،وتتعاضدُ ُّ
ِ
مستوى ُي ْرض املستخدم]8 ،7 ،4[ . هذا النوع من الكتابة إىل
ً
جتدر -إضاف ًة إىل ما سبق -اإلشار ُة إىل التطبيقات التعليمية والرتبوية هلذه ُ
و
الفئة من برجميات التعرف اآليل عىل النصوص حيث تُستخدَ م يف املساعدة عىل تع ُّلم
مثل هذه الربجميات كتابة اللغة للنشء أو للكبار أو عىل حتسني اخلط؛ حيث تعرض ُ
مسارات الكتابة اليدوية النموذجية ألمثلة من النصوص وتطلب من املستخدم أن
يتتبع هذه املسارات بقلم خمصوص يف يده عىل لوح حساس لِ َّل ْمس أثنا َء مرحلة
التدرب ،كام ُي ْط َلب أثنا َء مرحلة تقويم األداء من املستخدم أن خيط عىل اللوح ُّ
بمقارنة مسارات الكتابة اليدويةَ الربجميات
ُ احلساس أمثل ًة نصي ًة ،ومن َث َّم تقو ُم هذه
للمستخدم مع املسارات النموذجية لكتابة أمثلة التدريب أو تقويم األداء وبِنا ًء عىل
املقارنة ُيفا ُد املتعلم بالتصحيحات املطلوبة لتحسني أدائه [.]1 َ نتيجة
أما عىل جانب تقنيات التعرف عىل الكتابة املسرتسلة يف الصفحات املمسوحة
ضوئ ًّيا سواء أكانت خمطوط ًة باليد أم مطبوعة ،فإن التطبيق األسايس هلا هو العمل
عىل الرقمنة اآللية لرتاث البرشية الضخم من املواد النصية املوجودة بالفعل عىل
إنجاز تلك كثريا مما يستغرقه ٍ َ األوراق
ُ مقابل تكلفة مالية وزمنية وإدارية أقل ً
()1
ِ
«جوجل»؛ انظر -1من أمثلة املرشوعات الكربى يف هذا الصدد «مرشوع رقمنة املليون كتاب» الذي تقوم عليه رشكة
املرجع رقم [ ]11من مراجع هذا املبحث.
-38-
باملقارنة مع تكلفة
َ 1.1إمكانية املحافظة عىل الوثائق إلكرتون ًّيا بتكلفة ضئيلة جدًّ ا
حفظها ورق ًّيا( ،)1وملدة أطول بكثري من عمر هذه الوثائق يف صورهتا الورقية
ٍ
ختزين ِ
وسيط يمكن أن تصل إىل ما شاء اهلل؛ حيث يمكن نقل الوثيقة من
إلكرتوين قدي ٍم إىل آخر جديد دون فقدان أي يشء من حمتوياهتا قبل انتهاء ٍّ
العمر االفرتايض للوسيط القديم ،وباحتامالت ضياع متضائلة إىل ما شاء؛
حيث يمكن استنساخ الوثيقة إلكرتون ًّيا عد ًدا غري حمدود من املرات عىل وسائط
(.)2
ختزين متعددة ُ ْت َفظ يف أماكن خمتلفة
حتويل الوثائق إىل صور رقمية عرب مسحها ضوئ ًّيا ثم حتوي ُلها بعد
ُ 2.2يؤدي
ذلك إىل نصوص رقمية عرب تقنيات التعرف اآليل عىل النصوص إىل إمكانية
وخصوصا
ً تشغيل تقنيات معاجلة النصوص عىل حمتويات هذه الوثائق
تلك التي تستخلص املعلومات وتستنبط املعرفة من األوعية النصية؛ ومن
«حمركات البحث النيص» ( )Text Search Engineو«اسرتجاع ِّ أمهها
ال عن «التنقيب املعلومايت البيانات» ( )Information Retrieval- IRفض ً
يف النصوص» ( )3()Text Miningوكذلك «تصنيف الوثائق» (Document
)Classificationو«تلخيصها» ،)Document) Summarizationوقد
باي ْت حوايل مخسني -1بأسعار هناية عام 1102م يتكلف القرص الصلب اخلارجي سعة ختزين واحد تِريا (مليون مليون) ِ
َ
يجا (مئة مليون) بايت لتخزينه بام فيه من صور ِ
دوالرا أمريك ًّيا وبافرتاض أن الكتاب متوسط احلجم حيتاج سعة مئة م َ
ً
بدرجة عالية اجلودة وبعمر افرتايض ال يقل عن مخس سنوات حتت ظروف قاسية ،فإن هذا القرص يسع لتخزين
لعرشة آالف كتاب وهذا يعني أن الكتاب الواحد يتكلف نصف ِسنْت أمريكي .وعىل اجلانب اآلخر فإن املرت املربع
دوالرا يف العام
ً السطحي يف غرفة مكتبة جمهزة عىل مستوى جيد يتكلف يف نفس التاريخ ما ال يقل عن مئتني ومخسني
ويسع ما ال يزيد عن ألف كتاب من نفس احلجم وهو ما يعني أن الكتاب الورقي يتكلف ختزينه ملدة مخس سنوات يف
حالة جيدة حوايل مئة ومخسة وعرشين سنتًا أمريك ًّيا أي مئتني ومخسني ضعف التكلفة اإللكرتونية .هذا مع مالحظة
نظرا الحتياجها إىل جتهيزات خاصة حتافظ عىل مادهتا أن تكلفة احلفاظ عىل املخطوطات التارخيية تتجاوز ذلك بكثري ً
من البِ َل مع مرور الزمن.
-2من اإلنصاف أن ننتب َه إىل قضية التحقق من «أصالة »Authenticityالوثائق الرقمية حيث ال توجد حتى اآلن -رغم
املرقمنة
َ األبحاث اجلارية عىل هذه املسألة -وسيل ٌة حاسمة للتأكد من عدم التالعب إلكرتون ًّيا بمحتويات الوثيقة
سوى املطا َبقة بجسم الوثيقة األصلية!
نصوصا أم سواها) إىل اكتشاف أنامط
ً -3هتدف آليات التنقيب املعلومايت بصفة عامة يف أي وعاء للبيانات (سواء أكانت
التكرار واالرتباط السائدة بني مفردات هذه البيانات مما ينبئ عن احتامل قوي لوجود معلومة يعرب عنها هذا النمط أو
َب لذلك أدا ًة قوي ًة لتحويل البيانات (كامدة خام قليلة الفائدة) إىل معلومات (عالية القيمة).
ذاك ،وتُعت َ ُ
-39-
ُ ْت َمع ك ُُّل هذه التقنيات مع أدوات أخرى تقليدية إلدارة البيانات واملعلومات
ضمن أنظمة متكاملة ُيص َط َلح عىل تسميتها يف ْ
املج َمل « ُن ُظم إدارة الوثائق»
(.)Document Management Systems- DMS
بمكان فيام يتعلق برقمنة نصوص الوثائق أن نضع األداء البرشي ٍ 3.3ومن األمهية
املقارنة بمستويات األداء الراهن لتقنيات التعرف اآليل عىل النصوص عىل حمك َ
العربية املكتوبة من الوثائق املمسوحة ضوئ ًّيا .فالضارب املحرتف عىل لوحة
املفاتيح يستطيع يف املتوسط ن َْس َخ حوايل ستني كلمة عربية يف الدقيقة الواحدة
بمعدل خطأ للكلامت ( )Word Error Rate: WERال يتجاوز الثالثة يف املئة
النزول بمعدل اخلطأ للكلامت إىل ما َ
دون ُ ٍ
يدوية ٍ
مراجعة كام ُي ْم ِك ُن من خالل
النصف يف املئة( ،)1ومع متوسط أجور هلذا النوع من العاملة -بمعدالت هناية
والر ْين أمريكيني يف الساعة فإن التكلفة الزمنية عام 2011م -يبلغ نحو ُد َ
لرقمنة ألف كلمة بجودة عالية تكون يف حدود نصف ساعة عمل كام تكون
(.)2
دوالر ْين أمريكيني
َ التكلفة املالية لذلك يف حدود
أما تقنيات التعرف اآليل عىل النصوص؛ فإن التكلفة الزمنية ليست عائ ًقا
حيث يتكفل هبا ك ٌُّل من التسار ِع امل َّط ِرد لقدرات األجيال املتعاقبة من
«املعالات الدقيقة» ( )3()Microprocessorsالتي تُش ِّغل احلاسبات ِ
ِ
إمكانية َر ْفع رسعة التعرف عىل النصوص بالقدر املطلوب الرقمية ،وكذلك
«املوزعة» ()Distributed Processingَّ أي من البِنَى املتعددة للحوسبةعرب ٍّ
«املتوازية» ( .)4()Parallel Processingكام أن التكلفة املالية كذلك ِ أو
ليست عائ ًقا حيث أنه مهام ارتفعت تكاليف البحث والتطوير والتشغيل
نسخها -سواء أكانت مطبوعة أم خمطوطة باليد -من التشوهات أو الشورشة -1هذا بافرتاض ُخ ُل ِّو الوثيقة اجلاري ُ
البرصية العالية التي تؤدي إىل االلتباس يف قراءة املحتويات النصية هلا.
-2هذا بافرتاض العمل عىل كميات ضخمة من النصوص ضمن خط إنتاج تتوازى فيه عمليتا النسخ واملراجعة.
ور »Moore’s Lawوهو عبار ٌة عن استقراء عميل لواقع تطور احلواسيب مع الزمن -3وذلك و ْف َق ما ُي ْع َرف «بقانون ُم ْ
معالة وختزين ...إلخ -مر ًة ك َُّل ثامنية عرش ً
شهرا تقري ًبا. َ وينص عىل تضاعف القدرات احلاسوبية -من
-4وأ ًّيا كانت البِنْية املوزَّ عة أو املتوازية فإن املبدأ البسيط ورا َءها هو تشغيل حواسيب عديدة بدالً من حاسوب واحد فقط
من أجل االنتهاء من نفس املسألة يف زمن أقل..
-40-
ألي نظام ناجح للتعرف اآليل عىل النصوص ،فإن تكلفة التعرف عىل كل
ألف كلمة تتضاءل باطراد يف تناسب عكيس مع إمجايل النصوص التي جرى
ال يف دقة التعرف هلذه النُّ ُظم؛
العائق احلقيقي متم ِّث ً
ُ ُ
التشغيل عليها .ويبقى
ِ ِ
هوامش اخلطأ للكلامت املقيس َة
َ ُ
اجلـدول رقم ( )1-1أدناه حيث يعرض
تطويره من أنظمة التعرف اآليل عىل النصوص العربية ُ ألفضل ما جرى
ٍ
متدرجة من جودة الصورة املمسوحة ضوئ ًّيا ٍ
[ ]10 ،9 ،3يف ظل مستويات ِّ
ٍ
متدرجة من التنوع يف الوحدات الرسومية للكتابة ٍ
مستويات وكذلك يف ظل
«الرافِيامت»)؛ ومن الواضح أن هامش اخلطأ يتسع باطراد مع تصاعد (أي ِْ
مستوى «الشورشة» ( )Noiseالبرصية التي تشوب الصور كام يتسع هذا
اهلامش مع تزايد التنوع والتباين يف جرافيامت الكتابة.
4.4وتفيد الدراسات التي حللت أداء تقنيات استخالص املعلومات واستنباط
املعرفة -املشار إليها يف الفقرة ب عالِ َيه -عند تشغيلها عىل أوعية هبا «نصوص
معتبة من
َ متدهورة» (( )Degraded Textأي نصوص َم ِعيبة ذات نسبة
األخطاء) أن مردود هذه التقنيات يظل فعاالً إذا مل تتجاوز نسبة التدهور اخلمسة
عرش يف املئة [( ]5وترفع بعض الدراسات هذه النسب َة إىل عرشين يف املئة( )1مع
مالحظة أنه بعد إجراء عملية استخالص املعلومات أو استنباط املعرفة التي َ
يطلبها املستخد ُم جيري عاد ًة َع ْر ُض الوثائق الواردة يف نتائج العملية املطلوبة عىل
هيئة الصورة الضوئية املمسوحة -وت َُس َّمى نسخ ُة اال ِّطالع -وليس عىل هيئة
التعرف عليه آل ًّيا الحتوائه عىل نسب األخطاء يف
ُ النص الرقمي الذي جرى
الكلامت املشار إليها.
وعىل ذلك فإن احلاالت املظللة بالرمادي يف اجلدول هي فقط التي تصلح
لتطبيق تقنيات استخالص املعلومات واستنباط املعرفة عليها بفعالية
مقبولة.
-41-
نسخ ضوئي نسخ ضوئي مرتني صفحات طباعة ليزر أو
التنوع -اجلودة
ملرة واحدة أو صفحات جرائد ُكتُب وثيقة أصلية → ↓
ó óó óóó óóóó
مطبوعة بخط واحد
حوايل %15 %8 %3 %2.5 وحجم واحد
ó
مطبوعة بمختلف اخلطوط
أكرب من %45 %25 %14 %13 واألحجام
óóó
بعد التدرب
عىل خمطوطة باليد «بعناية
أكرب من أكرب من
× ووضوح»
%75 %50 خط الكاتب
óóóóó
%25
اجلدول :1-1هوامش اخلطأ املقيسة يف أداء أفضل ما جرى تطويره -حتى هناية 2011م -من
أنظمة التعرف اآليل عىل النصوص املكتوبة يف صفحات ممسوحة ضوئ ًّيا ،وذلك يف ظل ظروف
متدرجة من جودة الصور املمسوحة ضوئ ًّيا وكذلك التنوع يف جرافِيامت الكتابة.
-42-
املبحث َّ
الثالث
َّص
اآللي على الن ّ
ّ أساليب التَّ ُّ
عرف
العربي املكتوب
ّ
-43-
-44-
-1التعرف عىل النص املكتوب كأحد أنظمة التعرف عىل األنامط
تنتمي أنظمة التعرف اآليل عىل النص املكتوب إىل جمال أرحب من علوم احلاسبات
وضع
ُ التطبيقية أال وهو «التعرف اآليل عىل األنامط» ( ،)Pattern Recognitionويمكن
اهليكل الوظيفي هلذه النظم يف اإلطار العام املبني يف الشكل رقم ( )17-1أدناه []6؛
حتويل «اإلشارات التناظرية» ( )Analog Signalsاملقابلة لألنامط املطلوبُ حيث يتم
التعرف عليها (وهي النصوص املكتوبة/املخطوطة يف حالتنا هذه) إىل «إشارات
خالل القسم األول من املبحث السابق -ومن َ رقمية» ( - )Digital Signalsكام ورد
«جتهيز ابتدائي» ( )Preprocessingهلذه اإلشاراتٌ َث َّم تزويدُ احلاسوب هبا ،ثم جيري
مثل استبعاد بعض األنساق النمطية من الشورشة) ،ثم يتم بعد ذلك الرقمية (وذلك ُ
استخالص بصامت هذه اإلشارات (أي جمموعة الصفات الرياضية املم ِّيزة هلا).
ُ
ويمتاز بعد ذلك مسار التدريب حيث جيري بناء نامذج رياضية (إحصائية غال ًبا) من
بصامت اإلشارات املقابلة ألنامط عينات التدريب ،ومن َث َّم جيري حفظ هذه النامذج
بكفاءة يف قاعدة بيانات الستدعائها يف إحدى آليات التصنيف التي تقرر أي األنامط
هي األقرب لإلشارات املقابلة لألنامط َ
املدخلة املراد التعرف عليها.
اإلطار نظرية «التعلم احلاسويب» ( )Machine Learningالتي تُط َّبق
ُ ويعكس هذا
ُ
مقاربة املسائل التي ال ُي ْع َرف هلا أو حيث يتعذر احلصول
كأنسب ما يكون من أجل َ
«حلول بقواعد ُمْكَمة» ( ،)Closed-Form Solutionsوتنبثق خمتلف أساليب ٍ هلا عىل
التعلم احلاسويب من مبدأ إمكانية التعلم عرب تكرار التعرض الغزير لكل من األمثلة
الصحيحة واألمثلة اخلاطئة أو عرب تكرار التعرض الغزير لألسئلة وأجوبتها حول
جزئيات املسألة املطلوب مقاربتُها؛ فالطفل مث ً
ال قد جييد قراءة النص املكتوب بلغته األم
قبل أن يتعلم أسس وقواعد اللغة وذلك عرب تقليد األكرب سنًّا وعرب حماوالت الصواب
وتكرارا.
ً مرارا
واخلطأ مع تصويب األخطاء حيث يتحسن األداء مع معاو َدة ذلك كله ً
-45-
َّ
الشكل :17-1اهليكل الوظيفي العام ألنظمة التعرف عىل األنامط وفق نظرية التعلم احلاسويب.
ويرتكز بصفة عامة تفعيل تلك األساليب رياض ًّيا وحاسوب ًّيا هلذا املبدأ عىل استقراء
السياق االحتاميل للكلامت وحروفها (املناظِرة لألنامط التي ندرسها يف هذا الفصل)
فِعو ًضا عن سياقها اللغوي ب ْغي َة الوصول إىل حساب االحتامل الريايض لوقوع كل تعر ٍ
ُّ ُ َ َ
ترجيح التعرف صاحب ِ ٍ ِ
ممكن للكلمة بني ما يسبقه وما يلحق به من كلامت ومن َث َّم
أعىل احتامل ريايض ،وتستلزم عملية إجراء احلساب هذه تكوين نموذج احتامل ريايض
حياكي كل تتا ُبعات الوحدات اللغوية كام حتدث يف الواقع احلقيقي الستخدام اللغة.
وأ ًّيا ما كانت األساليب الرياضية واحلاسوبية املختارة لبناء مثل هذا النموذج
االحتاميل ،فال ُبدَّ هلا من بيانات جتريبية غزيرة متأل وعا ًء واس ًعا من بصامت األنامط
(األسئلة) بالتوازي مع سالسل أكواد األنامط املقابلة هلذه البصامت (أجوبتها) وذلك
املوجه ،و ُي ْط َلق عىل عملية تشغيل هذه األساليب الرياضية
مثلام يقتيض التعلم احلاسويب َّ
اس َم «التدريب» ()Training
عىل حمتويات هذا الوعاء من أجل بناء النموذج االحتاميل ْ
وي» (،)Language Resource كام ُي ْط َلق عىل حمتويات هذا الوعاء اسم « َم ْو ِرد ُل َغ ّ
وبطبيعة احلال فإن النموذج االحتاميل سوف حيمل اخلصائص اإلحصائية للمورد
اللغوي الذي َتك ََّو َن منه ،والذي عليه بدوره أن حيمل اخلصائص اإلحصائية والسياقية
لألنامط الذي يعرب عنها كام سنتعرض إليه يف القسم اخلامس من هذا املبحث.
أي نظام ب َع ْينه للتعرف عىل األنامط عام سواه ضمن
املكونات الثالث التي متيز َّ
ِّ و ُت َعدُّ
-46-
هذا اإلطار هي تلك التي تقوم باستخالص بصمة اإلشارة ،وببناء نامذج رياضية
لألنامط ،وبالتصنيف اآليل للبصامت املستخلصة من أجل تقرير أقرب األنامط املقابلة
هلا.
املقاربات
َ وسوف ُي ْل ِمح ك ٌُّل من األقسام الثالثة التالية باختصار إىل أنجح
املستخدَ مة( )1لتنفيذ ك ٍُّل من هذه املكونات الثالث يف كل حالة من احلاالت الثالث
الرئيسية لتقنيات التعرف عىل الكتابة كام صنفها القسم األول من املبحث السابق.
املقاربات ختصيص عرشات الصفحات لتفاصيل فنية يتطلب رشحها الكثري مقاربة من مثل تلك َ -1يتطلب استيفاء كل َ
من الرياضيات املتقدمة ،وهو ما ال يتسع له املجال يف هذا املقام ،وسوف نحيل القارئ املهتم هبذه التفاصيل إىل املراجع
املختصة بذلك.
-2نحيل القارئ املهتم بالتفاصيل الرياضية واهلندسية بمحاكاة الشبكات العصبية واستخداماهتا يف التعلم احلاسويب إىل
الورقة التعليمية اآلتية:
Jain, A.K., Jianchang Mao, Mohiuddin, K.M., Artificial Neural Networks: A Tutorial, IEEE
.Computer Magazine, pp. 31–44, Mar. 1996
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=485891
-47-
ُمْكَمة» ( ،)Closed Form Solutionsويمكــن استخدا ُم هذه الشبكات للربط يف
كــال االجتــاهني بني املدخـــالت وما تــؤدي إليه من مالحظــات مرصــودة -أي
احلصــول عىل إحدى املجموعتني بمعلومية املجموعة األخرى -وبالطبع فإن الربط
العكيس هو األداة املستخدَ مة للتعرف عىل حروف الكتابة املقابلة ملا لدينا من منحن ٍ
َيات
مر ْق َم ٍنة مت ِّثل تعقب خط اليد أثناء الكتابة .وبطبيعة احلال فإن ذلك كله يتطلب عملية
املدخالت بالتوازي مع ما يناظرها من تدريب للشبكة املستخدَ مة عىل كميات كبرية من َ
مالحظات مرصودة وهو ما سنعرض إليه يف القسم اخلامس من هذا املبحث.
َّ
الشكل :18-1النافذة املنزلقة يف اجتاه الكتابة عىل سطور الصورة املمسوحة ضوئ ًّيا.
-48-
حروف الكلامت
َ ترميزات («أكواد»)ِ َ
املدخالت يف حالتنا هذه ُ
تسلسل ويناظر
ٍ ُ
تسلسل «مت ََّجهات» تسلسل املالحظات فهو ُ املطبوعة املراد التعرف عليها ،أما
بعض خصائص املحتوى الرسومي داخل «نافذة ( )Vectorsيصوغ ٌّ
كل منها رياض ًّيا َ
منزلقة» ( )Sliding Windowعىل سطور الصورة املمسوحة ضوئ ًّيا واملر ْق َمنة اجلاري
التعرف عليها كام يف الشكل رقم ( )18-1أعاله.
املخف َّية بقدرهتا عىل َف ْصل ِ وبينام متتاز املعاجلات املرتكزة عىل نامذج ماركوف
جرافيامت الكتابة العربية املتصلة مع التعرف عىل هذه اجلرافيامت يف آن واحد ،فإن
مفتوحا للباحثني تتفاوت ً تصميم متجه خصائص التعرف كان -وال يزال -اجتها ًدا
ُص َو ُر ُه بني تصميامت بسيطة مثل عدد ال ُب َقع املتصلة يف النافذة الرأسية املنزلقة فوق
«سطر الكتابة املعياري» ( )1( )Baselineمع عدد البقع املتصلة َ ْتتَه ،وبني تصميامت
أعمق رياض ًّيا مثل حساب «ال ُع ُزوم القياسية الالمتغرية» ()Invariant Moments
التصميم املختار فإن هناك ُ للمحتوى الرسومي للنافذة ]11 ،8 ،7 ،5[ .وأ ًّيا كان
معايري للحكم عىل مدى جودة خصائص التعرف عىل الكتابة ن ُْج ِملها فيام ييل:
1.1رضورة أن يكون عدد املركِّبات يف متجه خصائص التعرف حمدو ًدا.
2.2رضورة أن يكون هذا العدد املحدود من املركِّبات يف متجه خصائص التعرف
ثابتًا.
3.3احلرص عىل أن يكون عدد املركِّبات يف متجه خصائص التعرف أقل ما يمكن.
4.4احلرص عىل قابلية حساب ك ُِّل مركِّبات متجه خصائص التعرف بكفاءة.
5.5احلرص عىل أن تبقى تسلسالت متجهات خصائص التعرف املناظِرة لنفس
جرافيامت الكتابة ثابت ًة قدر اإلمكان برغم أي اختالفات يف أشكال هذه
اجلرافيامت من حيث األبناط واألحجام ،أو بسبب بعض التشوهات األخرى
مثل امليل املحدود يف سطور الكتابة أثناء مسحها ضوئ ًّيا أو احتواء الكتابة عىل
بعض الشورشة املحدودة.
-49-
وبينام يؤدي الفشل يف حتقيق الرشطني األول والثاين مبارش ًة إىل تعذر تطبيق أية
املخف َّية -وكذلك أية أساليب أخرى للتعلم ِ معالات قائمة عىل نامذج ماركوف َ
احلاسويب عىل وجه العموم -فإن حتقق الرشطني الثالث والرابع رضوري إلنتاج
أنظمة واقعية للتعرف عىل الكتابة املطبوعة ذات تكلفة حاسوبية معقولة من حيث زمن
التشغيل ومساحات التخزين ،أما حتقق الرشط اخلامس فهو مفتاح التمكن من التعرف
عىل الكتابة العربية املطبوعة رغم تعدد أبناط وأحجام الكتابة.
ِ
املوارد اللغوية لتدريب وتقويم أنظمة التعرف عىل الكتابة العربية -5بناء
يتضح من األقسام السابقة يف هذا الفصل أن األساليب السائدة واألكثر نجاع ًة حتى
وقتنا هذا للتعامل مع مسائل التعرف اآليل عىل الكتابة العربية بتنويعاهتا املختلفة هي
أساليب التعلم احلاسويب بأصنافها املتعددة ،وكام جاء يف ختام القسم الثامن من باب
«التحليل الرصيف اآليل ملفردات اللغة العربية» من هذا الكتاب فإن كل هذه األساليب
يستلزم تفعي ُلها تكوي َن نامذج احتاملية رياضية حتاكي كل تتابعات جرافيامت الكتابة
العربية كام حتدث يف الواقع احلقيقي لنصوص اللغة وذلك ُب ْغي َة املساعدة يف اختيار تتابع
اجلرافيامت الذي حيقق أعىل احتامل ريايض يف سياق التعرف عىل أشكاهلا املخطوطة أو
املطبوعة.
-50-
ومن أجل بناء تلك النامذج الرياضية فال ُبدَّ من مادة لغوية متأل وعا ًء واس ًعا من
األسئلة (وهي يف حالتنا هذه الكتاب ُة املر ْق َمنة مطبوع ًة كانت أم خمطوط ًة) بالتوازي مع
أجوبتها (النص العريب املناظِر هلذه الكتابة املرقمنة) لتغذية أساليب «التعلم احلاسويب
املوجه» ( ،)Supervised Machine Learningو ُي ْط َلق عىل عملية تشغيل هذه َّ
األساليب الرياضية عىل املادة اللغوية من أجل بناء النامذج االحتاملية الرياضية اسم
«التدريب» ( )Trainingكام ُي ْط َلق عىل الوعاء املمتلئ بتلك املادة اللغوية اسم «املورد
اللغوي» ( ،)Language Resourceوبطبيعة احلال فإن النامذج االحتاملية سوف حتمل
اخلصائص اإلحصائية للمورد اللغوي الذي َتك ََّونَت منه ،والذي عليه بدوره أن حيمل
خصائص النصوص العربية املكتوبة الذي يعرب عنها.
ُ
التمثيل ِ
املوارد اللغوية يشرتط إضاف ًة إىل الدقة العالية أن جيري ولذلك فإن بناء هذه
بصورة متوازنة ملختلف أبعاد التنوع يف الكتابة مثل؛ أبناط الطباعة وأحجامها ،أو
اخلطوط اليدوية لل ُكتَّاب ...إلخ.
ففي حالة أنظمة التعرف عىل الكتابة العربية بتعقب خط اليد يتكون املورد اللغوي
من الكتابة العربية املر ْق َمنة -كام جاء توصي ُفه يف القسم األول من هذا الفصل -بالتوازي
مع النص العريب الصحيح املقابل له ،وتكون املحاذاة بني هاتني املر ِّك َبت َْي عىل مستويني؛
تقسيم
ُ أوالمها عىل مستوى «الرضبات املتصلة بالقلم» (( )Strokesويناظر ذلك
العبارة السابقة التي حتتها خط إىل :ا ،لرض ،با ،ت ،ا ،ملتصلة ،با ،لقلم) ،وثانيهام عىل
مستوى الكلامت العربية الكاملة.
أما يف حالة أنظمة التعرف عىل الكتابة العربية املطبوعة فإن املورد اللغوي يتكون من
َر ْقمنة صفحات الكتابة العربية املمسوحة ضوئ ًّيا -كام جاء توصي ُفه يف القسم األول من
هذا الفصل -بالتوازي مع النص العريب الصحيح املقابل له ،وتكون املحاذاة بني هاتني
املر ِّك َبت َْي عىل مستوى الكلامت العربية الكاملة وكذلك عىل مستوى السطور يف كل
أدوات براجمي ٌة للتقسيم اآليل لكل صفحة مطبوعة ٌ َخدَ مصفحة ،ولذلك الغرض ت ُْست ْ
املوضح أدناه ،وعىل اللغويني القائمني عىل
إىل كلامت وسطور كام هو مبني يف الشكل َّ
التحقق من صحة هذا التقسيم اآليل وتصويبه عند اللزوم. ُ بناء هذه الذخرية اللغوية
-51-
نموذج عىل نواتج تعيني حدود الكلامت العربية الكاملة وحدود السطور بصورة آلية
ٌ َّ
الشكل :19-1
اعتام ًدا عىل التوزيع التكراري لنقاط الصفحات املر ْق َمنة.
كثريا بنا ُء املوارد اللغوية ألنظمة التعرف عىل الكتابة العربية املخطوطة يدو ًّيا
ويتشابه ً
مع تلك املتعلقة بأنظمة التعرف عىل الكتابة العربية املطبوعة مع مالحظة أن عمليات
التقسيم اآليل للصفحات إىل كلامت وسطور ثم تصويب هذا التقسيم بل وتفسري
النصوص يف الصفحات املخطوطة يدو ًّيا تستغرق من اللغويني عم ً
ال ووقتًا أكرب.
ُيشكِّل بنا ُء ِ
املوارد اللغوية الالزمة لتدريب أنظمة التعرف عىل الكتابة العربية بأنواعها
الثالثة؛ «بتعقب خط اليد» و«املطبوعة» و«املخطوطة يدو ًّيا» نسب ًة كبري ًة من أنشطة
واستثامرات البحث والتطوير يف هذه التقنياتُ ،يقدِّ ُرها بعضهم بحوايل مخسني يف
كل من هذه املئة ،وبسبب ضخامة احلجم وارتفاع دقة العنونة املطلوبتني أثنا َء بناء ٍّ
املؤهلني حاسوب ًّيا
املوارد فإن هذا النشاط يستدعي توظيف عدد من اللغويني العرب َّ ِ
إلنجازه عىل نحو ُم ْر ٍ
ض مما َن ُعدُّ ه أحد األهداف التي نرجو أن حيققها تأليف هذا
الفصل من هذا الكتاب.
-52-
ببليوجرافيا مرجع َّية
األول
َّ املبحث
.1982 ، َب ْغداد،1 ط،ف؛ ِدراس ٌة ُل َغ ِو َّي ٌة تارخي َّي ٌة ِ رسم املصح:)احلمد (غانِم َقدُّ وري1.1
َ ْ ُ ْ َ ّ ََ
.م1998 ، ِم ْص،ْج ّي ِ مكتبة اخلان،»«الكتابة ال َعرب َّية
َ َ
ِ اخلطاطة ِ :)الدَّ ايل (عبد العزيز2.2
ِ ِ ْ ب؛ َم ْولِدُ ُه و َت َط ُّو ُر ُه َحتَّى ال َع
،احلاض ص ّ ِ َف ُّن اخلَ ِّط ال َع َر:) ُد ْرمان ( ُم ْص َط َفى َأ ْغ َور3.3
.م1990 ، إستانبول،1 ط،داو ّي ِ صالِح ِس ْع:ت َْر َجة
ِ ِ
ّ َطور الكتابة اخلَ ِّط َّية ال َع َرب َّية و َد ْو ُرها ال َّث
قايف ُّ ن َْشـأة وت:)زي سال ّ فيفي ( َف ْو
ّ َع4.4
. الك َُو ْيت، ِوكال ُة املطبوعات،1 ط،واالجتامعي ّ
5. Attia, M., Arabic Orthography vs. Arabic OCR; Rich Heritage
Chal-lenging a Much Needed Technology: http://multilingual.com/
issueDetail.php?issue=68, Multilingual Computing & Technology
magazine: www.Multilingual.com, USA, Dec. 2004.
املبحث ال َّثاين
1. Abdou, S., Fahmy, A., Hosney, I., Mostafa, I., Artificial Tutor for
Arabic Handwriting Training, The Proceedings of the 2nd Interna-
tional Conference on Arabic Language Resources and Tools, ISBN:
2-9517408-5-9; http://www.medar.info/conference_all/2009/index.
php, Cairo-Egypt, Apr. 2009.
2. Al-Badr, B., Mahmoud, S.A., Survey and Bibliography of Arabic
Optical Text Recognition, Elsevier Science, Signal Processing 41,
pp. 49-77, 1995.
3. Attia, M., Rashwan, M., El-Mahallawy, M., Autonomously Nor-
malized Horizontal Differentials as Features for HMM-Based Omni
Font-Written OCR Systems for Cursively Scripted Languages,
on IEEE Xplore at http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?
arnumber=5478619: The Proceedings of the IEEE International
Conference on Signal and Image Processing Applications (ICSI-
-53-
PA09) http://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp? punum-
ber=5472904, pp. 185 to 190, Kuala Lumpur - Malaysia http://
www.SP.ieeeMalaysia.org/ICSIPA09, Nov. 2009.
4. Attia, M., Arabic Orthography vs. Arabic OCR; Rich Heritage Chal-
lenging a Much Needed Technology http://multilingual.com/ issue-
Detail.php?issue=68, Multilingual Computing & Technology mag-
azine: www.Multilingual.com, USA, Dec. 2004.
5. Callan, J., Kantor, P., Grossman, D., Information Retrieval and
OCR: from Converting Content to Grasping Meaning, SIGIR con-
ference, 2003.
6. Duda, R.O., Hart, P.E., Stork, D.G., Pattern Classification, 2nd edi-
tion, John Wiley & Sons Inc., 2001.
7. Gouda, A.M., Arabic Handwritten Connected Character Recogni-
tion, PhD thesis, Dept. of Electronics and Electrical Communica-
tions, Faculty of Engineering, Cairo University, Nov. 2004.
8. Govindan, V.K., Shivaprasad, A.P., Character Recognition; a Re-
view, Pattern Recognition, Vol. 23, No. 7, pp. 671–683, 1990.
9. Jumari, K., Ali, M.A., A Survey and Comparative Evaluation of
Selected Off-Line Arabic Handwritten Character Recognition Sys-
tems, Jurnal Teknologi - Universiti Teknologi - Malaysia, 36(E)
June 2002: 1–18.
10. Lorigo, L.M., Govindaraju, V., Offline Arabic Handwriting Recog-
nition: A Survey, IEEE Transactions on Pattern Analysis and Ma-
chine Intelligence, Vol. 28, No. 5, pp. 712 to 724, May 2008.
11. St. Clair, G., Million Book Project vs. Google™ Print, Journal of
Zhejiang University SCIENCE (JZUS) http://www.zju.edu.cn/
jzus-China, ISSN 1009-3095, 2005-6A(11): pp. 1195-1200.
-54-
املبحث ال َّثالث
12. Abdelazim, H. Y., Malek, M., System and Method for Onscreen
Text Recognition for Mobile Devices, US Patent and Trademark
Office, Application No. US 12/196925 filed on Aug. 22nd 2008,
Publication No. US 2009/0055778 A1 published on Feb. 26th 2009.
13. Al-Badr, B., Mahmoud, S.A., Survey and Bibliography of Arabic
Optical Text Recognition, Elsevier Science, Signal Processing 41,
pp. 49-77, 1995.
14. Al-Ma’adeed, S., Elliman, D., Higgins, C.A., A Data Base for Ara-
bic Handwritten Text Recognition Research, IEEE Proceedings of
Frontiers in Handwriting Recognition, Nov. 2002.
15. Al-Ohali, Y., Cheriet, M., Suen, C., Databases for Recognition of
Handwritten Arabic Cheques, In the Proceedings of the Seventh
International Workshop on Frontiers in Handwriting Recognition,
Amsterdam, pp. 601-606, 11-13 Sept. 2000.
16. Bazzi, I., Schwartz, R., Makhoul, J., An Omnifont Open-Vocabulary
OCR System for English and Arabic, IEEE Transactions on Pattern
Analysis and Machine Intelligence, Vol. 21, No. 6, June 1999.
17. Duda, R.O., Hart, P.E.; Stork, D.G., Pattern Classification, 2nd edi-
tion, John Wiley & Sons Inc., 2001.
18. El-Mahallawy, M.S.M., A Large Scale HMM-based Omni
Front-Written OCR System for Cursive Scripts, PhD thesis, Dept.
of Electronics and Electrical Communications, Faculty of Engineer-
ing, Cairo Univ., Apr. 2008.
19. Gouda, A.M., Arabic Handwritten Connected Character Recogni-
tion, PhD thesis, Dept. of Electronics and Electrical Communica-
tions, Faculty of Engineering, Cairo University, Nov. 2004.
-55-
20. Govindan, V.K., Shivaprasad, A.P., Character Recognition; a Re-
view, Pattern Recognition, Vol. 23, No. 7, pp. 671–683, 1990.
21. Jumari, K., Ali, M. A., A Survey and Comparative Evaluation of
Selected Off-Line Arabic Handwritten Character Recognition Sys-
tems, Jurnal Teknologi - Universiti Teknologi - Malaysia, 36(E)
June 2002: 1–18.
22. Khorsheed, M. S., Offline Recognition of Omnifont Arabic Text Us-
ing the HMM Tool Kit (HTK), Pattern Recognition Letters – Elsevi-
er, Vol. 28, pp. 1563 – 1571, 2007.
23. Korb, J., Survey of Existing OCR Practices and Recommendations
for More Efficient Work, TELplus EC funded project; download-
able at: https://www.zotero.org/mchristy/items/itemKey/S5VCT-
FRT, July 2008.
24. Lorigo, L.M., Govindaraju, V., Offline Arabic Handwriting Recog-
nition: A Survey, IEEE Transactions on Pattern Analysis and Ma-
chine Intelligence, Vol. 28, No. 5, pp. 712-724, May 2008.
25. Mohamed, M., Gader, P., Handwritten Word Recognition Us-
ing Segmentation-Free Hidden Markov Modeling and Segmen-
ta-tion-Based Dynamic Programming Techniques, IEEE Transac-
tions on Pattern Analysis and Machine Intelligence, Vol. 18, No. 5,
pp.548–554, 1996.
26. Strassel, S.M., Linguistic Resources for Arabic Handwriting Rec-
ognition, The Proceedings of the 2nd International Conference on
Arabic Language Resources and Tools, ISBN: 2-9517408-5-9, Cai-
ro - Egypt http://www.medar.info/conference_all/2009/index.php,
Apr. 2009.
-56-
الفصل َّ
الثاني
العربي املنطوق
ّ َّص ُم َ
عالة الن ّ
-57-
-58-
املبحث األ َّول
اآللي على الكالم
ّ التَّعرف
ُّ
-1مقدمة.
-2مكونات نظم التعرف عىل الكالم.
-3ملخص لبناء نظام للتعرف عىل الكالم.
-4التعرف عىل الكالم يف ال ُّلغة العرب َّية.
-59-
-60-
-1مقدمة
نظم التعرف اآل ّيل عىل الكالم هلا الكثري من التطبيقات املهمة يف خمتلف املجاالت.
ومن املعروف أن هذه النظم -وخاصة املعارصة منها -تعتمد عىل جمموعة من النامذج
اإلحصائية التي تعرب عن األصوات املختلفة يف اللغة التي يراد التعرف عليها؛ وبام أن
الكالم -كام تبني من الفصول السابقة -له بناء زمني وطيفي ،بمعنى أن كل صوت من
األصوات هو عبارة عن تسلسل زمني لبعض املتجهات الطيفية ،فإن نامذج ماركوف
املخف َّية ( )Hidden Markov Models -HMMتعترب من أهم (إن مل يكن أهم) النامذج
التي تُستخدم لبناء نامذج األصوات يف نظم التعرف عىل الكالم املعارصة.
ِ
املخف َّية إن أسس نظم التعرف عىل الكالم املعارصة -والقائمة عىل نامذج ماركوف
-ظهرت يف سبعين َّيات القرن املايض يف جامعة «كارنيجي ميلون» ( )CMUاألمريكية،
وكذلك يف رشكة «آي يب إم» ()IBM؛ ويف هذه األثناء كانت النامذج قائمة عىل استخدام
نامذج الكثافة املتقطعة ( ،)discrete densityوالتي رسعان ما تطورت معامل «بيل»
عرف بـ «الكثافة املتصلة» ( .)continuous densityوكانت ( )Bell labsإىل استخدام ما ُي َ
األبحاث يف هذا الوقت تنصب عىل النظم ذات الكلامت املنفصلة من متكلم واحد ،أو
النظم التي تتعرف عىل عدد حمدود من الكلامت (األرقام عىل سبيل املثال) .ومع تسعين َّيات
القرن بدأ االهتامم بنظم الكالم املتصل التي ال تعتمد عىل املتكلم .وكان الدافع الرئييس
هلذه األبحاث سلسلة من الربامج التي كانت متوهلا وكالة مرشوعات األبحاث الدفاعية
املتقدمة ( ،Defense Advanced Research Projects Agency (DARPAوالتي
عملت عىل حتسني نسبة التعرف بالنسبة ألنواع خمتلفة من الكالم املتدرجة الصعوبة.
ومن املناسب يف هذا السياق أن نذك َُر أن اهتامم هذه اهليئة بتمويل أبحاث اللغة العربية
بدأ يف خالل العام 2003م ،واستمر يف عدة مرشوعات بحثية أدت إىل حتسن كبري يف دقة
وسنتعرض لبعض هذه األمثلة يف هذا املبحث.
َّ التعرف عىل اللغة العربية؛
وحتقي ًقا للغاية من هذا املبحث سنبدأ برشح املكونات األساسية لنظم التعرف عىل
الكالم القائمة عىل نامذج ماركوف ِ
املخف َّية -وبالتحديد سنقوم برشح النظم التي تعتمد
سنتطرق إىل كيفية حساب معامالت هذه النامذج
َّ عىل نامذج (جاوس) البسيطة؛ كام
آل ًّيا من خالل إشارات الكالم .وجيدر القول يف هذا السياق أن إمكانية حساب هذه
-61-
مناذجعلى مناذج علىتعتمد تعتمداليتاليت النظم النظمبشرح سنقوم
وابلتحديدبشرح كوف– املخفيَّة –
وابلتحديد سنقوم مناذج مارِ
املخفيَّة ماركوف مناذجعلى القائمة ًعلىالقائمة
خالل خاللًّامنمنخالل مناذجي
النماذجآليًّاآل معامالتهذههذه حساب كيفية إىلسنتطرقإىل البسيطة؛ ِ
على
تعتمديًّا من
النماذج النماذج آل اليت
معامالتالنظم حسابح
سنقوم بشر
معامالت هذه كيفية
حساب وابلتحديد كماإىل– َّ
سنتطرقَّ
كيفية كماة
املخفقيَّ
سنتطر
َّ
كوف
البسيطة؛ كما
جاوس)
مار جاوس)على( (مناذج
البسيطة؛)
جاوس (القائمة
املعامالتآليًّاآليًّاتحـعتحـُّدَع ُّد حسابيًّاهذههذه إمكانية أن السياقأن كيفيةيفيفهذاهذا وجيدرإىل القول الكالم. البسيطة؛اتكما
إشار
َ خاللُّد
املعامالتمنآليًّا تحـ َع
املعامالت حساب آلالنماذج
إمكانيةهذههذه
حساب معامالت إمكانيةالسياق حساب
القولالسياق أن وجيدر هذا سنتطرقيف
القولَّ الكالم.وجيدر ات ات) إشار
الكالم. جاوس
(إشار
مناقشة إمكانية ِ
كوف ِ
مناقشةأتيتأتيتمناقشة املعامالتد
املعامالتَع ُّ حساب
املعامالتأتيتآليًّا تحـ
حساب
املعامالت
هذهق
ومعطحرطحقحر
حساب
ح
حساب
ومع ة.ة.
ق
املخفيَّ
ر ط
حاملخفيَّ
ومع مارأن
كوف
ة. ي
َّ مارِلنماذج
السياق
املخف لنماذج
كوفهذا النجاح
مار لنماذجيف
النجاح أسرأساررار
القول النجاح
أحدأهمأهم
وجيدر الكالم.
أحداتأهم أسر
أحدار إشار
حساب يبق ومعرتد ُر
يبر ِ ح كوفأرسارِ
كما النماذج؛كما النماذج؛ كمامناقشة طُ
النماذج؛ أثناءتد
أتيت ة. املخف َّي
املعامالت
أثناء ماركوف
االستعانة هبا
االستعانة تدهباريب حساب
أثناء
لنامذجيتم
االستعانةق هبا
النجاح
اليتاليتطححريتم
ومع ة.
)Objective
يتم) املخفيَّ
Objective أهم مارلنماذجأحد
function
)Objectiveاليت function اهلدفا( ُت( َعدُّ
النجاح ًّي
اهلدفآل
املعامالت
دالة
دالةار
أحد أهم أسر
دالة اهلدف (function
بية.بية. أثناءالعر ابللغهباة
ابللغةالعر كما االستعانة
النماذج؛عىن يبيتم
تلكلَّ الَّيت ت التي
وخصوصا)Objective النظم – اهلدف (يتم
العمليةهلذههلذه
function التطبيقات بعضدالة مناقشة
لشرحبعض تأيتح املعامالتح
ض سنتعر
عىنربية. يتةتح حالع
تلك اابللغيتارتًحعىن تد
أثناء الَّ ً
وخصوص وخصوصهبا–ا تلك
ً
النظماالستعانة – العملية
النظم اليت
هلذهالتطبيقات
)Objective
العملية التطبيقات بعضلشر
function ض
ح اهلدفلشر(حَّ
سنتعر َّ ض
ح سنتعر
َّ
دالة
وخصوصا
ً النظمالع–ربية. هلذهابللغة العمليةعىن سنتعر ُض لرشح بعض التطبيقات
وخصوصا تلك الَّيت تح
ً العملية هلذه النظم – التطبيقات َّ تدريب النامذج؛ كام
ض لشرح بعض سنتعر ح
َّ
الكالم
علىالكالم
على التعرف نظم
العربية.
التعرف مكوانتباللغة -ا َّل
-تي تُعنى تلك2
الكالم نظم على
التعرفمكوانت
مكوانت نظم 2 -2
الكالم
الداخلة إىل سلسلة من املتجهات األكوستيكية ،يطلق عليها – إشارةعلى
الكالم التعرف
نظمحتويل
-2مكوانت يتم
يطلق عليها – عليها – األكوستيكية، املتجهات املتجهات
األكوستيكية ،يطلق سلسلة من سلسلةإىلمن
الكالم الداخلة الكالمإىل
التعرف عىل الداخلة إشارة
نظم مكونات
الكالم إشارةحتويل -2يتم يتم حتويل
استنباط « العملية
العملية– هذه
هذه «عليها
يطلقوتسمى ؛
األكوستيكية، املتجهات سلسلة من » مات ِ
الس
إىل ِ َّجهات
الداخلة ت م «
الكالم – إشارة ة عاد
عاد ًة ً
حتويلحمت
عادةًيتم – «
استنباط استنباط « وتسمى )feature vectors (
يطلق األكوستيكية، العملية وتسمى؛ هذه
املتجهات )feature
سلسلة من vectors
الداخلة إىل
)feature؛ مات»
(vectors الس ّ
الكالم
إشارة» (ّ َّجهات
مات الس
ّ
َّجهات« حمت
حتويل حِ يتم–
الكلمات سلسلة
استنباط إجياد
وتسمى«مبحالةولة
العملية البحث
هذه ُمرك يقوم ُ،)،featureث ُث مات»( (ِ عادة – «مِت ِ
الس
وتسمىولة يقوم؛ مات« ُم»ت
الس -َّجهاتعاد ًة
الكلمات سلسلة extraction
إجياد هذه
الكلماتالعملية سلسلة مبحاو
)؛
إجيادالبحث
feature ُمرك
vectorsمبحا
البحث )feature
ُمرك (
يقوم)امت» vectors
الس ،)(extraction
َّجهاتُث ِّ
feature feature ّextractionمات»- الس ّ
عليهاالسًمات» (حِّ
تكون: َبيث املناظرة، ّ ِ
البحث الكلمات
بمحاولة إجياد إجياد سلسلةيقوملة حمركالبحثثممبحاو يقوم ُمرك
،)feature ُ ،)featureث
extraction تكون(:
امت» َبيث
الس املناظرة،
«استنباط
extraction
تكونِّ : َبيث السمات» (ّ
املناظرة،
الكلامت املناظرة ،بحيث تكون𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 : تكون: سلسلة املناظرةَ ،بيث
()1)(1 w
̂w 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 ==
̂ )p p(𝑤𝑤|y
𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
)(𝑤𝑤|y
()1 𝑤𝑤w)̂𝑤𝑤= 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 p (𝑤𝑤|y
()1 𝑤𝑤
Bayesإىل:إىل: ŵ
قاعدة = ابستخدام )p (𝑤𝑤|y
قاعدة رقم𝑤𝑤 )1)(1
ابستخدام املعادلةرقم ( مامايتميتم تبسيط
املعادلة
Bayes ابستخدام قاعدة Bayesإىل: تبسيطرقم ()1 ما يتم تبسيط املعادلة
إىل Bayes:إىل: قاعدة باستخدام
Bayes قاعدة ()1 املعادلة رقم
ابستخدام )1 ( رقم تبسيط
املعادلة تبسيطيتم ما يتم ما
()2)(2 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
)2( w ̂w 𝑤𝑤 ==̂ w
)pp(y|w)(y|w)ppp(y|w
𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 =𝑤𝑤̂
)(w
)(w) p (w
()2 𝑤𝑤
الكلمات. من سلسلة أية إىل w=̂
شري وت الكلمات، سلسلةp
)(y|w تشري)(wإىلp
الكلامت.
الكلمات .الكلمات. من
سلسلة من
سلسلةأيةمنسلسلة w
ُشري wwإىل
شريح تحو
وت منمن 𝑤𝑤
الكلامت،
الكلمات، من سلسلة
سلسلة أفضل
أفضل
أفضل wإىل ̂w ُشري ̂شري wتتح
إىل ح
سلسلة من الكلمات ،وتحشري wإىل أية أفضل تحشري ̂
ِ
الكميَّة HMMو)ِ
)HMM اإلحصائي ِ(الكلمات.
اإلحصائي ( من
األكوستيكي سلسلة
األكوستيكي أية
النموذج إىل
النموذج w شري
استخدام
استخدام وت الكلمات،
) p p(y|wح من سلسلة
الكمية
الكمية أفضل
ونحسب
وُنسب إىل تحشري ̂
w
الكميَّةّ
ّ و )HMM
الكميَّة ( اإلحصائي األكوستيكي النموذج استخدام )(y|w الكمية وُنسب
نظامةللتعرف للتعرفو ِّ
وُنسب الكمية ) p (y|wاستخدام النموذج األكوستيكي اإلحصائي ()HMM
يبني ()1-2 والشكلاإلحصائي)1-2.
اللغوي .والشكل ( النموذج
باستخدام اللغوي
الكميةة )p (y|w والكم َّي
على يبني نظام اإلحصائي ستخدام النموذج وُنسب اب ِّ)p (w
الكميَّ
استخداميلي:النموذج األكوستيكي اإلحصائي ( )HMMو ّ
6666 الكالم ،والذي سيتم تفصيله فيما
عىل الكالم ،والذي سيتم تفصيله فيام ييل:
66
66
النماذج اللغوية اإلحصائيَّة
الكالم.الكالم.
التعرف عىل توضيحي لنظام
التعرف على رسمرسم
توضيحي لنظام :1-2
كل:1- الش َّ
الش 2
َّكل
النموذج األكوستيكي :كما هو معروف فإن أصغر وحدة صوتية هي الفونيم .فعلى سبيل
-62-انقشنا الوحدات الصوتية للغة العربية يف
ب تتكون كالتايل ./k/a/t/a/b/a/وقد
املثال ،كلمة َكتَ َ
الفصول السابقة .لذلك فإن أي كلمة ُيكن متثيلها عن طريق ربط الفونيمات املكونة هلا كما
النموذج األكوستيكي :كام هو معروف فإن أصغر وحدة صوتية هي الفونيم .فعىل
َب تتكون كالتايل ./k/a/t/a/b/a/وقد ناقشنا الوحدات سبيل املثال ،كلمة َكت َ
الصوتية للغة العربية يف الفصول السابقة .لذلك فإن أي كلمة يمكن متثيلها عن طريق
ربط الفونيامت املكونة هلا كام يف املعجم النطقي.
ويمكن اعتبار النموذج الناتج هو النموذج األكوستيكي هلذه الكلمة؛ ومن اجلدير
بالذكر أن معامالت نامذج الفون املكونة ألي كلمة يتم حساهبا باستخدام ما يسمى
«بيانات التدريب» والتي تتكون من إشارات الكالم والكلامت املناظرة .ويتم هذا
(.)1
التدريب يف مرحلة بناء النظام
النموذج اللغوي :تتكون النامذج اللغوية -غال ًبا -عن نامذج ( ،)N-gramوهذا
النموذج يعطي احتامل ظهور كلمة ما مرشو ًطا عىل الكلامت 1-Nالسابقة .فعىل سبيل
املثال :فإن نموذج ( )2-gramأو ( )bigramحيسب احتامل ظهور كلمة الولد بعد كتب
(الولد|كتب) ،pوباستخدام هذه النامذج يمكن حساب احتامل أي مجلة من اجلمل من
الناحية اللغوية ،وسيتم تفصيل هذه النامذج الح ًقا.
وبعد حساب النموذجني -األكوستيكي واللغوي -فإن برنامج ّ
فاك َّ
الشفرة
( )decoderيمكنه حساب أرجح سلسلة من الكلامت املناظرة إلشارات الكالم .ومن
اجلدير بالذكر أنه يف نظم التعرف ذات العدد الكبري من الكلامت فإن عمليات البحث
تتطلب قدرات حسابية عالية ،ولذلك يلزم تطوير حمركات بحث ذات كفاءة عالية؛
وعليه فإن إجراء البحث عىل عدة مراحل باستخدام «تشبيكة» ( )latticeيعترب من
الطرق الواسعة االنتشار ،وسيتم احلديث عن ذلك الح ًقا.
رجى مالحظة أنَّنا -يف هذا الفصل -نستخدم كلمتَي «فون» و «فونيم» بدون متييز؛ مع التأكيد عيل وجود بعض
ُ -1ي َ
الفروق التقنية بني الكلمتني.
-63-
احلصول عىل متجهات ِسامت تناسب إىل حد كبري فروض النامذج األكوستيك َّية .ومن
السامت يتم استخالصها كل عرشة ِم ِّيل ثانية من نوافذ طوهلا املتعارف عليه أن متجهات ِّ
يل ثانية .ومن أشهر الطرق املستخدمة :املعامالت (MFCC - Mel frequency ِ 25م ِّ
،)cepstral coefficientsويتم حساب هذه املعامالت عن طريق تطبيق «حتويل جيب
التَّامم امل َت َق ِّطع» ( )Discrete cosine transformعىل اللوغاريتم الطيفي ،ويتم االستعانة
بمقياس Melالالخطي ملضاهاة ترددات األذن .وباإلضافة إىل MFCCفإن معامالت
التنبؤ اخلطي اإلدراكية ( )Perceptual Linear Prediction - PLPتقوم بتحويل
ِ ِ
تم) بعد تطبيق التحويالت الالخطية معامالت التنبؤ اخلطي املعروفة إىل معامالت (كبِ ْس َ
املرتبطة باإلدراك .ومن املعروف أن ُمعامالت MFCCو ُمعامالت PLPتُعطي نتائج
النسبي ملعامالت PLPيف أوساط ّ متقاربة يف نظم التعرف عىل الكالم ،مع بعض التَّم ُّيز
الضوضاء .وباإلضافة الستخدام املعامالت التي تعرب عن الطيف إلشارات الكالم فإنه
من املعروف أن إضافة املشتقة األوىل واملشتقة الثانية هلذه املعامالت يستخدم عىل نطاق
واسع يف نظم التعرف عىل الكالم .فعىل سبيل املثال ،إذا كان التمثيل الطيفي يتكون من
ال من معامالت MFCCفإن املتجه النهائي يضيف املشتقة األوىل والثانية هلذه 13معام ً
املعامالت ليصبح طول املتجه هو .39=13*3
-2.2النامذج األكوستيكية ونامذج ماركوف ِ
املخف َّية
كام ُذ ِك َر يف املقدمة ،فإنه يمكن متثيل الكلمة كسلسلة من الفونات وتسمى هذه
السلسلة بالتمثيل الصويت للكلمة ويمكن احلصول عليها باستخدام قاموس صويت ويف
العموم يمكن أن يكون للكلمة الواحدة متثيالت صوتية متعددة تناظر طرق نطقها.
وأبرز مثال عىل ذلك يف اللغة العربية هو الترصيفات املختلفة للكلمة .فعىل سبيل
َب أو ُكتُب.
املثال ،فإن كلمة كتب يمكن نطقها َكت َ
ويتكون كل متثيل صويت عن طريق ربط عدد من الفونيامت .فعىل سبيل املثال فإن
َب للكلمة كتب يمكن تكوينه عن طريق ربط الفونيامت املكونة التمثيل الصويت َكت َ
للتمثيل الصويت .ka-ta-ba
-64-
ويتم متثيل كل فونيم بام يسمى نامذج ماركوف املخفية كام هو موضح يف الشكل
(.)2-2
-65-
ومما سبق فإنه إذا أعطينا حزمة من مجل التدريب فإنه يمكن أوتوماتيكيا حساب
كبريا
تغريا ً
معامالت الفونيامت املكونة هلذه اجلمل.ومن املعروف أن الفونات تتغري ً
بتغري الفونات املجاورة ،فعىل سبيل املثال :الفون ( )Kيف كتب خيتلف عن الفون ( )Kيف
سمك ،وللتغلب عىل هذه الصعوبة يمكن استخدام نموذج لكل فون ً
أخذا يف االعتبار
الفونات املجاورة من اليمني واليسار ،وتسمى هذه النامذج «تراي فون» (.)Triphone
وعىل الرغم أن هذه النامذج تعرب بشكل أدق عن الفونات ،فإن عددها يصبح كبريا
جدا .فعىل سبيل املثال إذا كان يف لغة ما 40فون ،فسينتج لدينا 40نموذج فوين أو
نموذجا ثالثي الفونية .وينتج عن هذا العدد صعوبة يف
ً أحادي الفونية و 40×40×40
حساب معامالت النامذج ،ولذلك فإنه يتم ربط معامالت النامذج .ففي املثال السابق
إذا ُو ِجدَ لدينا 40×40×40نموذج ثالثي الفونية ،أي حوايل 64000نموذج .يمكن
ربط هذه النامذج لعدد أقل -عىل سبيل املثال 5000نموذج .ومع أن الربط فكرة جيدة
وتعطي فرصة املوائمة بني عدد النامذج وحجم حزمة البيانات املتوفرة يف التدريب،
يبقى السؤال عن كيفية الربط أو املشاركة يف املعامالت؛ ويتم هذا يف أغلب األحيان
عن طريق شجرة القرار.
-66-
وهكذا يتم اختيار السؤال الذي يعطي أعىل زيادة يف االحتامالت عند االنقسام .يف
حالة استخدام نامذج جاوس األحادية يمكن حساب الزيادة يف االحتاملية من األعداد
واملتوسطات دون احلاجة إىل البيانات األصلية ،ولذلك فإن عملية بناء الشجرة تتم
بشكل رسيع.
ملخص تدريب نامذج ماركوف:
يتم اختيار نامذج أحادية الفون ابتدائية.
يتم تدريب النامذج بتطبيق اخلوازمية األمامية -اخللفية لعدد من املرات.
يتم نسخ كل فون qإىل ثالثي -فون ،x - q + yوالذي ظهرت باعتبارها
حزمة يف حزم التدريب .فعىل سبيل املثال :إذا ظهر الفون )1000( qمرة فسيتم
نسخه إىل 1000نموذج.
يتم تدريب نامذج ثالث َّية الفون باستخدام خطوة مشاهبة ،ولكن املشكلة أن بعض
هذه النامذج تظهر لعدد صغري جدا من املرات.
يتم تطبيق خوارزم شجرة القرار بمشاركة النسخ يف عدد حمدود من النامذج.
يتم تدريب النامذج الناجتة بشكل مماثل.
-67-
نكتب االحتامل كام ييل:
) ( )
املرصية يف│ اخلامس Pأو الثنائي جرام يف│اخلامس P (
ومن الواضح أنَّه بزيادة قيمة Nيتم حتسني القدرة التنبؤية للنموذج؛ ولكن عىل
حساب:
القدرة عىل حساب االحتامالت.
الكفاءة احلسابية للنامذج.
ويتم حساب نامذج ( )N-gramببساطة شديدة فعىل سبيل املثال فإنه احتامل (املرصية
يف│ اخلامس) Pيتم حسابه ببساطة كعدد مرات حدوث «املرصية يف اخلامس» مقسوما
عىل عدد مرات حدوث «املرصية يف» يف مدونة كبريه من النصوص .ورغم بساطة هذه
الطريقة فإن املشكلة الواضحة بإن كثري من االحتامالت ستكون صفرية لعدم مشاهدهتا
يف مدونة النص .ويتم التغلب عىل هذه املشكلة بام يسمى أسلوب اخلَ ْصم ()discount
والرتاجع ( )back-offومنها عىل سبيل املثال طريقة (.)Kneser-Ney
-4.2حمركات البحث
كام ُذ ِك َر يف مقدمة هذا الفصل فإن سلسلة أكثر الكلامت احتامالً يمكن حساهبا من
السامت عن طريق البحث يف أرجح سلسلة من احلاالت التي يمكن أن تكون متجهات ِّ
السامت طب ًقا للمعادلة رقم 2؛ ويمكن حل هذه املعادلة
قد أنتجت سلسلة متجهات ِّ
بكفاءة عن طريق الربجمة الديناميكية أو ما يسمى «خوارزم» ()Viterbi؛ وعند هناية
اجلملة يمكن حساب أفضل احتامل .وإذا سجلنا أفضل اختيار عن كل حلظة ،فإن
بإمكاننا الرجوع واحلصول عىل أفضل سلسلة من الكلامت.
وعىل الرغم من كفاءهتا ،فإن طريقة خوارزم ( )Viterbiال يمكن تطبيقها مبارشة
يف حالة وجود عدد كبري جدًّ ا من الكلامت ،وخاصة مع نامذج لغوية طويلة .وحلل هذه
املشكلة واحلصول عىل حمرك للبحث كفء ،فقد ظهرت طرق عديدة ،وسوف نعرض
هلذه الطرق دون الدخول يف تفاصيلها .ويمكن برجمة خوارزم ( )Viterbiبكفاءة عن
الرموز» (.)Token passing طريق تطبيق ما يسمى «التقليم» ( )Pruningو«مترير ُّ
-68-
وتقوم الفكرة األساسية عىل أالَّ يتم حساب مجيع احلاالت الواقعة يف فضاء البحث،
ولكن يتم الرتكيز عىل احلاالت التي تقع يف نطاق الشعاع ( )beam widthمن أرجح
الرموز يمكن أن يؤدي إىل تطبيق ج ِّيداحلاالت .وعىل الرغم من أن التقليم ومترير ُّ
خلوارزم (( )Viterbiيف بعض األحيان يمكن احلصول عىل نفس النتيجة بزيادة ٪2
من احلاالت الواقعة يف فضاء البحث) فإن األنظمة ذات العدد الكبري جدا من الكلامت
قد حتتاج إىل طريق أكثر كفاءة .ونذكر عىل سبيل املثال الطرق التالية بدون الدخول يف
تفاصيلها.
يمكن استخدام البحث عن طريق العمق أوال ( ،)Depth firstوهذه الطريقة يمكن
أن تؤدي إىل كفاءة شديدة للبحث ،ولكن يلزم مقارنة مسارات ذات أطوال خمتلفة مما
ُي َص ِّعب من التحكم يف البحث .ويمكن استخدام طرق تعتمد عيل املحوالت حمدودة
احلالة « ،»finite state transducersوهذه الطرق تعرب عن كل املعلومات املطلوبة
للبحث ،مثل قاموس النطق والنامذج األكوستيك َّية والنامذج اللغوية يف صورة هذه
املحوالت ،ثم يتم دجمها ،ومن ثم تطبيق خوارزمات للتحديد (،)determinization
وضغط ( )minimizationاملحول الناتج للوصول إىل حمول يمكن البحث فيه بكفاءة.
ومع أن حمركات البحث مصممة يف األساس للحصول عىل أفضل مجلة ،فباإلمكان
احلصول عىل عدد ميم ( )Mمن اجلمل مرتبة حسب احتامليتها بتعديالت بسيطة،
ويمكن ختزين اجلمل الناجتة بصورة أكثر كفاءة يف ما يسمى «التشبيكة» (.)lattice
ومن املتعارف عليه يف البحث حاليا أن يتم استخدام حمركات البحث متكررة-
املرور ( .)Multiple - passويف هذه املحركات يتم البحث عىل عدة مراحل؛ ففي
املرحلة األوىل يتم البحث باستخدام نامذج أكوستيكية ولغوية بسيطة نسب ًّيا (عىل سبيل
املثال ثنائي -جرام وثالثي -فونات غري عابرة للكلمة) للحصول عىل (التشبيكة) ثم يتم
إعادة تقييم (التشبيكة) باستخدام نامذج أكثر تعقيدا (مثال الرباعي -جرام وغريها)؛
وتعترب هذه الطريقة وسيلة معروفة للحصول عىل كفاءة عالية للبحث بدون التخيل عن
الدقة .وباإلضافة إىل (التشبيكة) فإنه يمكن التعبري عن احللول املتعددة باستخدام ما
يسمى شبكة االختالط ()confusion network؛ وهذه يمكن اعتبارها أكثر كفاءة من
(التشبيكة) ،ولكن املسارات املتوازية فيها ال تعرب عن نفس الفرتة الزمنية .وتستخدم
-69-
شبكات االختالط يف تطبيقات متعددة؛ عىل سبيل املثال دمج نتائج عدد من نظم
التعرف عىل الكالم .ويسمى ذلك طريقة االنتخاب.
وبعد عرض طرق التدريب والبحث لنظم التعرف عىل الكالم ،فإننا سنعرض
فيام ييل طريقة التدريب والبحث لبناء نظام التعرف عىل الكالم ،ثم نتحدث ببعض
اإلسهاب عن بناء أنظمة التعرف عىل الكالم يف ال ُّلغة العربية.
- 2.3البيانات اللغوية
وتتكون هذه البيانات من النصوص .ويفضل أن تكون النصوص املستخدمة قريبة
جلمل التي سيتم التعرف عليها الحقا .فللتعرف عىل األخبار ُيفضل استخدام
من ا ُ
نصوص مستقاة من األخبار -كالصحف أو املدونات .وتعترب نصوص «جيجا وورد»
-70-
( )Giga wordمن أشهر هذه النصوص .وتستخدم البيانات اللغوية لبناء النامذج
اللغوية كام تم تفصيله فيام سبق .وتعترب حزمة برامج ( )SRI tool kitمن أهم األدوات
لبناء النامذج اللغوية.
- 3.3البحث
بعد بناء النامذج األكوستيكية واللغوية يتم دجمها مع قاموس النطق لبناء فضاء
البحث .وعند التعرف عىل الكالم فإنه يتم استكشاف فضاء البحث للوصول إىل أفضل
سلسلة من الكلامت .ويف هذا الصدد -وكام ذكرنا سابقا -يستخدم عادة أحد حمركات
البحث متكررة املرور للوصول إىل أفضل احللول بكفاءة .ونُشري إىل املحركات القائمة
عىل املحوالت حمدودة احلالة ،ويمكن استخدام حزمة الربامج من AT&Tهلذا الغرض.
ولكن حمركات البحث يف العموم -وخاصة ذات الكفاءة العالية -ال تتواجد
بشكل مفتوح ( ،)Open sourceولكن يمكن استخدام حمرك البحث املوجود مع
HTKكبداية لدراسة اجلانب العميل لتطوير حمركات البحث ذات الكفاءة العالية.
وتكمن أمهية الطرق السابقة يف أهنا تعمل ألي لغة وبشكل آ ّيل ،وال حتتاج عىل األقل
نظر ًّيا ألي دراية باللغة ،وربام يكون املكون الذي حيتاج إىل دراية باللغة يف هذه النظم
هو القاموس الصويت.
وعىل الرغم من ذلك فإن الدراية بلغة ما واستخدامها بشكل أو بآخر يمكن أن
يؤدي إىل حتسني نتائج التعرف عىل الكالم بشكل كبري؛ وفيام ييل سنتحدث باستفاضة
عن التعرف عىل الكالم يف ال ُّلغة العربية.
-71-
وسنعرض -فيام ييل -لبعض خصائص اللغة العربية التي متَّت معاجلتها أثناء
األبحاث السابقة.
-72-
املتوسط حملل - )Backwalterتعطي حوايل 6تشكيالت خمتلفة لكل كلمة) ،وعندها
ُيفضل استخدام ما يسمى احتامالت النطق ( ،)Pronunciation Probabilitiesوالتي
يمكن استنتاجها ببساطة أثناء تدريب النظام.
ومن املفيد أن نلفت النظر إىل أن أي حملل رصيف قد يفشل يف حل بعض الكلامت،
خاصة الكلامت ذات األصول األجنبية أو التي ال توجد يف قاعدة بياناته .ويف هذه احلالة
جيب إجياد تشكيل هذه الكلامت بطريقة ما سواء يدويا أو آل ًّيا؛ ومن املدهش أن بعض
أكثر النظم نجاحا يقوم بمزج الفونات مع اجلرافيامت للكلامت التي ال يوجد هلا تشكيل.
وعىل الرغم من تفوق النامذج الفونية للعربية الفصحى فإن تطبيقها للتعرف عىل
اللهجات املحلية ،مثل :العراقية ،مل حيالفه النجاح؛ ويرجع ذلك يف الغالب إىل أن
املحلالت الرصفية -مثل - Buckwalterمصممة للتعامل مع اللغة الفصحى؛ وعادة
ما تؤدي إىل تشكيل خاطئ للكلامت العامية ،وخاصة الشائعة؛ وسنعود إىل هذه النقطة
عند مناقشة التعرف عىل ال َّلهجات العامية.
-73-
الكلامت .ويمكن تفسري ذلك بأن فصل السوابق واللواحق يؤدي إىل تقليــص القدرة
التنبؤية للنامذج اللغوية ،ألن السابق أو الالحق يف حـالة فصله يعد ككلمة منفصلة ،يف
حني أن قـــدرته التنبؤية تكون ضعيفة للغاية (فالسابق «ال» -عىل سبيل املثال -يمكن
أن يأيت بعده عدد كبري جدا من األسامء يف اللغة العربية)؛ كمــا أن بقاء الكلمة كوحدة
متصلة يؤدي إىل نامذج أكوستيكية أكثر استقرار يسهل متييزها عن بقية الكلامت ،ولكن
هذا ال ينفي أن التحليل الرصيف قد يكون مفيدا يف بعض احلاالت مثل عدم وجود
أدوات للتعامل مع فضاء بحث كبري جدا أو الرغبة يف بناء قاموس صغري نسبيا أو حتى
عدم وجود نصوص كافية للحصول عىل عدد كبري جدا من الكلامت .مما سبق يتضح أن
اختيار القاموس جيب أن حيتوي عىل ُبعد جديد ،وهو التحليل الرصيف .ويف هذا اإلطار
جيب اإلجابة عن أسئلة مثل :أي الكلامت ستخضع للتحليل الرصيف؟ وما هي السوابق
واللواحق التي سيتم اختيارها؟ وكيف يمكن بناء النامذج اللغوية يف هذه احلالة؟؛
ونعتقد أن اإلجابة عن األسئلة السابقة تعتمد عىل كمية البيانات املتاحة ،وكذلك طبيعة
النظام املستهدف؛ وجيب إجراء جتارب للوصول إىل أحسن تصميم للقاموس.
-74-
املبحث َّ
الثاني
ُن ُظم حتويل الن ّ
َّص إلى كالم
-1التوصيف اللغوي.
-2إنتاج إشارات الكالم.
-75-
-76-
ن ُُظم حتويل الن ّ
َّص إلى كالم
()Text to Speech - TTS
إن نظم حتويل النص إىل كالم -كام يوحي اسمها -تقبل النص يف لغة ما وتنتج
ذبذبات الكالم املناظرة هلذا النص .ويف أبسط صورها يمكن هلذه النظم تسجيل
اإلشارات املناظرة للنص املراد نطقه؛ ولكن هذه الطريقة تظل مرتبطة بنطق عدد حمدود
من اجلمل.
لذلك فإن الصورة العامة لنظم حتويل النص إىل كالم تعتمد عىل ختليق الكالم من
بعض الوحدات الصوتية؛ ولذلك فإن احلصول عىل هذه اإلشارات التخليقية بجودة
تقرتب من الكالم الطبيعي هو اهلدف األسايس هلذه النظم.
وعادة تنقسم نظم حتويل النص إىل كالم إىل جزأين أساسيني ،يقوم اجلزء األول
اآلخر بتحويل التوصيف اللغوي بتحويل النص إىل «توصيف لغوي» .ويقوم اجلزء َ
إيل إشارات الكالم؛ ويكون اجلزء األول معتمدا عىل اللغة وحيتاج إىل الكثري من اخلربة
اللغوية يف حني أن اجلزء َ
اآلخر ال يعتمد عىل اللغة ،وإنَّام يعتمد يف األساس عىل البيانات
املسجلة (بالطبع فإن البيانات املسجلة جيب أن تكون من اللغة املراد نطقها).
وسنقوم فيام ييل بعرض رسيع لتكوين التوصيف اللغوي دون الدخول يف تفاصيل
مع الرتكيز عىل اجلزء اآلخر ،وهو املعنِ ّي بإنتاج إشارات الكالم من التوصيف اللغوي.
وإلنتاج الكالم تاريخ طويل يعود إىل نظم الـ ( )Formantوالدايفونات.
فسوف نتناول الطرق الكثيفة االستخدام للبيانات؛ وهي طرق
َ أ َّما يف هذا الفصل،
ِ
املخف َّية ،وهي اختيار الوحدات ،والطرق اإلحصائية التي تستخدم نامذج ماركوف
واسعة االنتشار اآلن.
-1التوصيف اللغوي
يتكون التوصيف اللغوي -يف أبسط صورة -من حتويل النص إىل سلسلة من
الفونيامت .أي :جيب أن تتوافر أداة لتحويل النص إىل فونيامت مما يسمى عادة بأدوات
اجلرافيم -إىل -فونيم ( )Grapheme to phonemeوهذه األدوات تكون إما لغوية
باستخدام قاموس وبعض القواعد ،أو إحصائية قائمة عىل التدريب باستخدام األمثلة؛
-77-
ويف بعض األحيان يتم املزج بني القواعد اللغوية واإلحصائية؛ ويف اللغة العربية -حيث
ُيكتب النص يف أغلب األحيان بدون التشكيل -فإن وجود أداة إلضافة التشكيل قبل
التحويل لفونيامت تعد أساسية للحصول عىل التوصيف اللغوي .وعادة يتم معاجله النص
قبل تطبيق أدوات اجلرافيم -إىل -فونيم .فعىل سبيل املثال يتم حتويل األرقام والتواريخ
وعالمات الرتقيم إىل نص؛ وباإلضافة إىل حتويل اجلرافيامت إىل الفونيامت فإن التوصيف
اللغوي حيتوي عىل معلومات عديدة من نفس الكلمة ،مثل :الفونيامت املجاورة وعدد
املقاطع يف الكلمة وموقع املقطع ،وكذلك معلومات عن اجلملة ،مثل :موقع الكلمة يف
اجلملة وعالمات الرتقيم املستخدمة .وباإلضافة إىل ذلك فإنه يتم استخدام معلومات
عن املتحدث ونوع األسلوب (خربي أو استفهامي) وحالة املتحدث.
وتتكامل هذه املعلومات مع سلسلة الفونيامت الختيار أكثر الوحدات مناسبة
لتخليق الكالم .فعىل سبيل املثال ،تُستخدم هذه املعلومات الستنتاج امتداد الوحدة
والرتدد األسايس هلا .ومما سبق يتضح أن أدوات التوصيف اللغوي يمكن تقسيمها إىل
ما ييل :أدوات ملعاجلة النص ،مثل :التشكيل اآليل ،وأدوات لتحويل اجلرافيم إىل فونيم،
وأدوات للتعامل مع املعلومات عىل مستوى الكلمة واجلملة واملتحدث .وترتبط هذه
األدوات ارتباطا وثيقا باللغة التي يتم التعامل معها ،وتتطلب معرفة دقيقة بخصائصها
وكيفية توصيفها.
-وخلصوصية هذه القواعد واختالفها من لغة إىل أخرى فإننا لن نتطرق إليها بالتفصيل.
-78-
يتم تسجيل عدة ساعات ،أي عدة آالف من اجلمل من متكلم واحد ،و ُيراعى
احلصول عىل تسجيل نقي ،كام ُيراعى اختيار اجلمل بحيث تناسب ما سيتم نطقه فيام
بعد ،ثم ُت َق َّسم اجلمل إىل وحدات فونيمية؛ وعىل الرغم من أن وسيلة التقسيم ليست
ِ
املخف َّية تستخدم يف هذا السياق .ونُشري إىل ذات أمهية كربىَّ ،
فإن نامذج ماركوف
أن استخدام نامذج ماركوف هنا فقط لتقسيم الكالم وليست إلنتاجه كام يف الطريقة
اإلحصائية التي سيتم تفصيلها الحقا.
يتم تسجيل عدة آالف من اجلمل من متحدث واحد ،ويتم بناء النامذج الفونيمية.
أوردنا
يف حقيقة األمر يتم بناء نامذج تعتمد عىل السياق ،مثل الرتاي فون أو غريه – كام َ
املعني بالتعرف عىل الكالم.
ّ يف املبحث
وللتذكرة فإن ناتج هذه النامذج يكون شجرة القرار لكل فونيم ،والتي تعرب عن
هذا الفونيم يف السياقات املختلفة ،حيث متثل كل ورقة فيها وحدات هذا الفونيم التي
ٍ
بعبارة أخرى -التي هلا سياقات متشاهبة؛ ويتم متثيل كل ورقة تتشارك يف السياق -أو
بخليط (جاوس) كام سبق أن فصلنا.
وبعد بناء هذه النامذج ،يمكن استخدامها لتقسيم إشارات الكالم إىل فونيامت ،أي
ف هذه العملية بـ «التقسيم»ُعر ُ
معرفة متى يبدأ وينتهي كل فونيم يف اإلشارة املعطاة .وت َ
( .)segmentationوبعد املرور عىل إشارات الكالم كلها يتم ربط عدد من املقاطع
بكل ورقة من أوراق شجرة القرار لكل فونيم .فعىل سبيل املثال ،بعد إجراء التقسيم
يتم جتميع كل املقاطع التي تنتمي إىل الفونيم /ب ./ولكل مقطع يتم املرور عىل شجرة
القرار املناظرة للوصول إىل الورقة املناسبة .وللتذكرة فإن الوصول إىل الورقة يتم عن
طريق اإلجابة عن أسئلة خاصة بالسياق (الفونيامت املجاورة يف أغلب األحيان) .وعىل
سبيل املثال ،إذا اعتربنا الفونيم /ب /يف كلمة «كبري» فإنه يمكن الوصول إىل الورقة
املناسبة عن طريقة اإلجابة عن أسئلة السياق الفونيمي (الفتحة /و /ى /يف هذه احلالة)
اختيار املقاطع (الوحدات) إلنتاج الكالم
سنفصل فيام ييل كيفية إنتاج كلمة «كبري» كام يف املثال السابق .وسنفرتض أن لكل
فونيم شجره قرار واحدة ،وليس لكل حالة من الفونيم للتسهيل ،وألن ذلك أكثر
شيوعا يف نظم إنتاج الكالم.
-79-
إن كلمة «كبري» تتكون من السلسلة اآلتية من الفونيامت:
/k / / a / / b / / I / / r /
-80-
وكذلك مناذج جاوس البسيطة .إن استخدام هذا النموذج إلنتاج الكالم يؤدي يف أبسط صورة
الستخدام متجهات املتوسط احلسايب لكل حالة مكررة حسب احتماالت االنتقال لكل
للسبَـبَني التَّاليني:
حالة .ولكن هذه الطريقة املبسطة تؤدي إىل جودة متدنية للكالم َّ
▪ تكرار املتوسط احلسايب بدون أخذ السياق يف االعتبار.
تكرار املتوسط احلسايب بدون أخذ السياق يف االعتبار.
▪ تكلفة عالية للصق لعدم اعتبار الوحدات اجملاورة.
تكلفة عالية للصق لعدم اعتبار الوحدات املجاورة.
وللتغلب على هذا فقد مت استخدام احتماالت املشتقة األوىل والثانية يف إنتاج الكالم.
وللتغلب عىل هذا فقد تم استخدام احتامالت املشتقة األوىل والثانية يف إنتاج الكالم.
ومعامالت املشتقة واسعة االنتشار يف التعرف على الكالم هي عبارة عن مزج خطي بني
ومعامالت املشتقة واسعة االنتشار يف التعرف عىل الكالم هي عبارة عن مزج خطي بني
متجهات الطيف .وعلى سبيل املثال فإن املشتقة األوىل عند الزمن ( )tللكبسرتم (ُ C(tيكن
متجهات الطيف .وعىل سبيل املثال فإن املشتقة األوىل عند الزمن ( )tللكبسرتم (C(t
كتابتها كما يلي:
يمكن كتابتها كام ييل:
+2
ضمنيا يف
املتجاورةاالعتبار.
والوحدات ضمنيا يف السياق
الوحدات املتجاورة أتخذتأخذ
السياق و املعامالت
هذهاملعامالتفإن هذهيتضح فإن وكام
كما يتضح و
املشتقات
باعتبارجمموعة
الكالم إىل حل ابعتبار إنتاج
املشتقات يؤول احلسابية فإن التفاصيل
إنتاج الكالم الدخول يف
احلسابية فإن ودونيف التفاصيل االعتبار.
الدخول ودون
ماركوف يتم فضاءنامذج
الكبسرتم أو أي تدريب وبام أن
عادة يف األوىل؛
كوف يتم الدرجة
مناذج مار منريبمعادالتأن تد
جمموعةاألوىل؛ ومبا
حل الدرجة يؤول إىل
معادالت من
مشابه ،وال يتم يف فضاء اإلشارة الزمنية ،فإنه
87
عادة يف فضاء الكبسرتم أو أي فضاء آخر
مرشح إلنتاج إشارات الكالم بد ًء من املتجهات املنتجة .ويمكن استخدام يلزم وجود ِّ
املرشحات املستخدمة يف حتليل الكالم هلذا الغرض.
فعىل سبيل املثال ،بمعرفة معامالت التنبؤ اخلطي (linear prediction
،)Coefficientsواالستثارة ( )excitationيمكن إنتاج الكالم باستخدام مرشح
التنبؤ اخلطي املعروف .ويف أول أعامل إنتاج الكالم باستخدام النامذج اإلحصائية تم
استخدام مرشح قائم عىل معامالت (كبسرتم ميل) ( )MFCCاملعروفة بجودهتا لبناء
نامذج (ماركوف) .وكام ذكرنا يف سياق هذا الفصل ،فإن إنتاج الكالم حيتاج إىل نامذج
للنغمة والفرتة .وبام أن للنغمة طبيعة منفصلة ،فإنه عند املزج بني معامالت الطيف
والنغمة يتم استخدام نامذج متزج بني التوزيعات املتصلة واملنفصلة .إن نامذج ماركوف
تستخدم ضمنيا نامذج هندسية للفرتة؛ ومن املعروف أهنا غري دقيقة يف التنبؤ بفرتة
الوحدات؛ وبينام ال يمثل ذلك مشكلة كبرية للتعرف عىل الكالم فإنه من األفضل
استخدام نامذج أكثر دقة عند إنتاج الكالم .لذلك يتم -يف بعض األحيان -استخدام
ما يسمى بنامذج شبه -ماركوف ِ
املخف َّية (.)Hidden semi-Markov Models
-81-
ِ
املخف َّية ولتلخيص ذلك فإنه عند إنتاج الكالم يتم عادة بناء نامذج شبه -ماركوف
واملزج بني التوزيعات املنفصلة ملعامالت النغمة املتصلة للطيف ،ويتم استخدام
املشتقات لفرض االتصال حني إنتاج إشارات الكالم.
وفيام ييل سنبني كيفية إنتاج إشارات الكالم لكلمة «كبري» .وكام سبق فإننا نقوم
بكتابة الرتاي فونات املناظرة.
/ # -k - a / / k - a - b / / a - b - I / / b - I - r / / I - r - # /
ولنأخذ الرتاي فون /a-b-I/كمثال .لكل حالة من الرتاي فون يتم التنبؤ بعدد
السامت لكل من السامت حسب توزيع الفرتة للحالة ،ويتم إنتاج متجهات ِّ متجهات ِّ
متجهات الطيف والنغمة باستخدام توزيعات الرتاي فون مع أخذ املشتقة األوىل والثانية
يف االعتبار باستخدام املتجهات والنغمة واملرشح املناسب ،وعليه يتم إنتاج إشارات
الكالم ،ويتم تكرار ذلك لكل تراي فون.
وكام ذكرنا سابقا ،فإن طريقة اختيار الوحدات تؤدي إىل كالم عايل اجلودة إذا توفرت
قاعدة بيانات كافية لتغطية السياقات املختلفة ،ولكنها تفتقد املرونة يف تغيري نوع الكالم
أو املتكلم.
وتقع الطريقة اإلحصائية عىل اجلانب اآلخر ،فهي تتيح مرونة كبرية لتغيري املتكلم أو
نوع الكالم باستخدام التحويالت اخلطية واسعة االنتشار يف نظم التعرف عىل الكالم،
ولكنها يف نفس الوقت -ونتيجة ألخذ املتوسطات أثناء التدريب -قد تؤدي إىل كالم
أقل جودة من أفضل نظم اختيار الوحدات؛ ولكنها تبقى طريقة ذات دقة مناسبة ومرنة
يف نفس الوقت.
ولتحسني جودة الطريقة اإلحصائية فقد تم دراسة بعض الطرق يف السنوات األخرية،
من أمهها:
طريقة مصفوفة التباين العامة ( ،)Global Covariance Matrixوذلك لتاليف
تأثري املتوسطات يف إنتاج الكالم.
تدريب النامذج باستخدام أقل خطأ يف التوليد.
-82-
املبحث ال َّثالث
ُن ُظم ال َّت َع ُّرف على ال ُّلغة وامل َت َك ِّلم
-83-
-84-
املبحث الثَّالث
َّع ُّرف على اللُّغة واملتج جكلِّّم
نُظُم الت ج
املتكلم.
عىلوهلذه التعرف
املتكلم. نرشح نظم
التعرف على ثمح نظم
اللغةنشر علىعىل
اللغة ُث التعرف
نظمالتعرف
سنعرض نظم املبحث
املبحث سنعرض هذاهذايف يف
اجملاالت.املجاالت.
يف خمتلف عديدة
ُمتلف تطبيقات
عديدة يف النظم
تطبيقات وهلذهالنظم
ُّ
-1نظم التعرف عىل اللغة
-1نظم التعرف على اللُّغة
لغة نُطِقت بمعرفة ذبذبات كال ٍم إن اهلدف يف نظم التعرف عىل اللغة هو معرفة أي
إن اهلدف يف نظم التعرف على اللغة هو معرفة أي لغة نح ِطقت مبعرفة ذبذابت كالٍم ما.
ما .وتكون املدخالت للنظام هي عدة ثواين من ذبذبات الكالم ،حيدد النظام عىل
وتكون املدخالت للنظام هي عدة ثواين من ذبذابت الكالم ،حيدد النظام على أساسها اللغة
أساسها اللغة التي نطقت به من بني عدة لغات معروفة لديه .ويف بعض األحيان تشمل
اليت نطقت به من بني عدة لغات معروفة لديه .ويف بعض األحيان تشمل هذه النظم نظم
هذه النظم نظم التحقق من اللغة ،بمعنى أن لدينا إشارة كالم ولغة ما ونريد التحقيق ممَّا
التحقق من اللغة ،مبعىن أن لدينا إشارة كالم ولغة ما ونريد التحقيق ممَّا إذا كانت هذه
إذا كانت هذه الذبذبات تنتمي هلذه اللغة أم ال .ولكن يف هذا الفصل سنكتفي بعرض
الذبذابت تنتمي هلذه اللغة أم ال .ولكن يف هذا الفصل سنكتفي بعرض نظم التعرف على
املستخدمة .الطرق املستخدمة.
الطرقاللغة لتشابه
لتشابهعىل
التعرفاللغة
نظم
فإنهX -
ُيكن فإنه املناظرة متجهات السامت باعتبار ذبذبات الكالم -أو لنكون أكثر دقة
السمات ِّاملناظرة – X
ِ
ابعتبار ذبذابت الكالم – أو لنكون أكثر دقة متجهات ّ
يلي :كام ييل:
كمااللغة
اللغةعىل
التعرف مسألةمسألة
التعرف على صياغة يمكن
صياغة
𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
= ∗ 𝑙𝑙 )𝑥𝑥|𝑙𝑙(𝑃𝑃
𝑙𝑙
-85-
ويف األسلوب األخري يتم استخدام نظام للتعرف عىل الفونيامت .ومن املدهش أن هذا
النظام ال ينتمي بالرضورة إىل أي من اللغات املراد التعرف عليها .وبعد مترير اإلشارات
يف اللغات املراد التعرف عليها عىل نظام التعرف الفونيمي ،فإنه يتم بناء نامذج النَّحو
اإلحصائي ( )N-gramلكل لغة عىل الفونيامت الناجتة .والفكرة األساسية هنا أن
سالسل الفونيامت الناجتة تستطيع التمييز بني اللغات املراد متييزها.
ومن البدهيي أنه يمكن استخدام هذه الطريقة للتمييز بني أي عدد من اللغات .ومن
املعروف أن الطريقة الفونيتيكية تؤدي إيل نتائج ممتازة يف التعرف عىل اللغة ،ربام ألهنا
أقل تأثرا من الطريقة األكوستيكية باملتغريات ،مثل املتحدث والتسجيل.
ويمكن تعميم وحتسني الطريقة الفونوتيكية باستخدام عدة نظم للتعرف الفونيمي،
وليس بالرضورة من اللغات التي يراد متييزها ،ثم بناء نامذج ( )N-gramاللغوية لكل
لغة ونظام فونيمي.
فعىل سبيل املثال ،للتمييز بني اللغة «أ» واللغة «ب» يمكن استخدام نظام فونيمي للغة
«ج» واللغة «د»؛ ومن ثم بناء نامذج لغوية «أ جـ» و «أ د» و «ب جـ» «ب د» .ويسمى هذا
النظام «النظام الفونوتيكي املتوازي» ،ويؤدي إىل نتائج أفضل من النظام الفونوتيكي،
ولكن بالطبع مع زيادة حجم النامذج والعمليات احلسابية املصاحبة.
وعىل الرغم من أن األسلوب الفونونيكي يبدو األفضل يف نظم التعرف عىل اللغة،
فإن مزج األسلوبني الفونومنيكي واألكوستيكي يؤدي يف أغلب األحيان إىل نتائج أفضل،
ويتم هذا املزج بطرق عديدة .ففي أبسط صورة يمكن بناء نظامني منفصلني (أحدمها
فونونيكي واآلخر أكوستيكي) ومزج نتيجة النظامني للحصول عىل النتيجة النهائية.
-86-
إشارة الكالم املدخلة صدرت من هذا املتكلم أم ال .وللنوع الثاين تطبيقات كثرية إذ
يمكن استخدامه للتحقق من البيانات مثل استخدام بصامت األصابع أو العني وكذلك
يمكن استخدامه بجانب كلمة الرس ( )passwordوتتشابه الطرق والنامذج املستخدمة
يف كال النوعني ولذلك أننا سنتطرق إىل الطرق املستخدمة يف التحقق من املتكلم.
وللتحقق من املتكلم Sباستخدام إشارة الكالم Xفإن اهلدف يكون التأكد بأن
Xتنتمي إىل Sأم ال .وهلذا يلزم وجود نموذج للمتكلم حلساب االحتامل (P(X│S
وكذلك نموذج للخلفية ( )backgroundحلساب ( P(X│backgroundأو للتسهيل
(P(X│S
( P(X│bوعادة يتم احلكم بأن اإلشارة Xتنتمي إىل Sإذا كان ناتج القسمة
(P(X│b
أكرب من قيمة حمددة tتسمى العتبة (.)threshold
ولفرتة طويلة ظلت نامذج خليط (جاوس) تستخدم للتعبري عن املتكلم واخللفية.
السامت من املتكلم واستخدامها لبناء نموذج خليط
فيمكن جتميع عدد من متجهات ِّ
(جاوس) بالطرق التقليدية.
السامت من عدد كبري من املتكلمني واستخدامها وكذلك يمكن جتميع متجهات ِّ
لبناء نموذج اخللفية .ولتقليل كمية الكالم املطلوب احلصول عليه من املتكلم لتسجيله
يف النظام فإنه يمكن بناء نموذج خلفية من عدد كبري من املتكلمني ثم باستخدام طرق
التكيف ( )adaptationللحصول عىل نامذج املتكلم .ومن املدهش أن نفس متجهات
السامت املستخدمة يف التعرف عىل الكالم يتم استخدامها يف نظم التعرف أو التحقق ِّ
من املتكلم وهي معامالت الكبسرتم ومشتقاهتا .وعىل الرغم من أن نظم التعرف عىل
الكالم هتدف إىل حتييد تأثري املتكلم فإن املتجهات املستخدمة فيها تؤيت نتائج طيبة جدا
عند استخدامها يف التعرف عىل املتكلم وتكون أفضل من اخلصائص املعروفة بارتباطها
ارتباطا وثيقا باملتكلم مثل النغمة .ويمكن من الناحية اللغوية أو األكوستيكية دراسة
ِسامت تؤدي إىل حتسني نظم التعرف أو التحقق من املتكلم.
ويف اجليل األحدث من نظم التحقق من املتكلم يمكن النظر إىل املسألة عىل أهنا
مسألة تصنيف ( ،)classificationويمكن بناء مصنف لتحديد :هل تنتمي إشارات
الكالم إىل متكلم معني أم ال.
-87-
وحدي ًثا تم استخدام آل َّيات املتَّجهات الدَّ اعمة ()Support Vector Machine
السامت التي متاثل تلك
هلذا الغرض .ومن املمكن بناء املصنف باستخدام متجهات ِّ
املستخدمة يف نامذج جاوس ولكن يمكن أيضا املزج بني نامذج خليط (جاوس)
واملصنفات .فيمكن بناء نامذج خليط (جاوس) كام سبق أن ناقشنا ثم ييل ذلك بناء
مصنفات يف فضاء مكون من التوزيعات االحتاملية لكل مكون من مكونات اخلليط.
وعادة تعطى الطريقة األخرية نتائج جيدة جدا للتحقق من املتكلم.
ولتقييم طرق التحقق من املتكلم فإنه يوجد نوعان من األخطاء؛ يف النوع األول يتم
قبول إشارة ما يف حني أهنا ال تنتمي إىل املتكلم املراد ،ويسمى هذا النوع من األخطاء:
أخطاء التنبيه اخلاطئ ()false alarm؛ ويف النوع َ
اآلخر ال يتم قبول اإلشارة بالرغم من
أهنا تنتمي إىل املتكلم املراد ،وتسمي هذه بأخطاء اإلخفاق (.)misrecognition error
ويتم تصميم النظام عند نقطة تناسب التطبيق املستخدم ألصله .فمثال عند استخدام
النظام لوصول إىل احلساب البنكي فإن تكلفة التنبيه اخلاطئ تكون أكرب كثريا من تكلفة
اإلخفاق.
-88-
ببليوجرافيا مرجع َّية
األول
َّ املبحث
1. AbuZeina, D.; Elshafei, M. (2011). Cross-Word Modeling for Ara-
bic Speech Recognition. Springer.
2. Afify, M.; Nguyen, L.; Xiang, B.; Abdou, S.; Makhoul, J. “Recent
progress in Arabic broadcast news transcription at BBN”, in Pro-
ceedings of Interspeech, Lisbon, Portugal, September 2005.
3. Ali, A.; Zhang, Y.; Cardinal, P.; Dahak, N.; Vogel, S.; Glass, J. “A
complete Kaldi recipe for building Arabic speech recognition sys-
tems”, Proc. icassp 2014.
4. Bailly, G.; Perrier, P.; Vatikiotis-Bateson, E. (2012). Audiovisual
Speech Processing. Cambridge University Press.
5. Chen S. F.; Goodman, J. (1999). “An empirical study of smooth-
ing techniques for language modeling”, Computer Speech and Lan-
guage, vol. 13, pp. 359-394.
6. Clark, A.; Fox, C.; Lappin, S. (2010). The Handbook of Com-puta-
tional Linguistics and Natural Language Processing. John Wiley &
Sons.
7. Cohen, I & Benesty, J.; Gannot, S. (2010). Speech Processing in
Modern Communication: Challenges and Perspectives. Springer.
8. Dahl, G.; Yu, D.; Li, D.; Acero, A. “Context-dependent pre-trained
deep neural networks for large vocabulary speech recognition”,
IEEE Transactions on Audio, speech and Language Processing”,
vol. 20, no. 1 , January 2012.
9. Elmahdy, M.; Gruhn, R.; Minker, W. (2012). Novel Techniques for
Dialectal Arabic Speech Recognition. Springer.
10. Eskenazi, M.; Levow, G.; Meng, H.; Parent, G.; Suendermann, D.
(2013). Crowdsourcing for Speech Processing: Applications to Data
Collection, Transcription and Assessment. Wiley.
-89-
11. Gales, M.; Young, S. (2007). “The application of hidden Markov
mod-els in speech recognition”, Foundations and Trends in Signal
Pro-cessing, vol. 1, no. 3, pp. 195-304.
12. Mariani, J. (2010). Language and Speech Processing. John Wiley
& Sons.
13. Mehler, A.; Romary, L. (2012). Handbook of Technical Communi-
cation. Walter de Gruyter.
14. Mohammed, A. K. (2012). Speech Recognition System: Speaker
De-pendent Recognizer for Sidama Language. Lambert Academic
Publishing.
15. Mohri, M.; Pereira, F.; Riley, M. (2002). “Weighted finite state
transducers in speech recognition”, Computer Speech and Lan-
guage, vol. 16, no. 1, pp. 69-88.
16. Ortmanns, S.; Ney, H.; Aubert, X. (1997). “A word graph algorithm
for large vocabulary continuous speech recognition”, Computer
Speech and Language, vol. 11, no. 1, pp. 43-72.
17. Pathak, M. A. (2013). Privacy-Preserving Machine Learning for
Speech Processing. Springer.
18. POvey, D.; Valtchev, V.; Woodland, P. C. (2006). The HTK Book
(for HTK Version 3.4). University of Cambridge, http://htk.eng.
cam.ac.uk, December 2006.
19. Rabiner, L. R. (1989). “A tutorial on hidden Markov models and
selected applications in speech recognition”, Proceedings of IEEE,
vol. 77, no. 2, pp. 257-286.
20. Russell, J.; Cohn, R. (2012). Speech Processing. Book on Demand.
21. Selouani, S. (2011). Speech Processing and Soft Computing. Spring-
er.
22. Suh, J. (2012). Effective Data Selection Technology for Robust
Speaker Recognition. University of Texas at Dallas. Graduate Pro-
gram in Electrical Engineering.
-90-
23. Vasquez, D.; Gruhn, R.; Minker, W. (2013). Hierarchical Neural
Network Structures for Phoneme Recognition. Springer.
24. Wang, J.; Furui, S.; Juang, B. (2012). Real World Speech Process-
ing. Springer.
25. Sak, H.; Senior, A.; Beaufays, F. (2014). “Long Short-Term Mem-
ory Based Recurrent Neural Network for Large Vocabulary Speech
Recognition” arXiv preprint, arXiv: 1402.1128, 2014.
26. Sundermeyer, M.; Schluter, R.; Ney, H. (2012). “LSTM Neural Net-
work Language Modelling” InterSpeech 2012.
املبحث ال َّثاين
1. Black, A. W.; Zen, H.; Tokuda, K. (2007). “Statistical parametric
speech synthesis”, Proc. of ICASSP, pp.1229-1232, Apr.
2. Gupta, S.; Bhatia, P. (2012). Text to Speech System: An Aid to Vis-
ually and Vocally Impaired. LAP Lambert Academic Publishing.
3. Hunt, A.; Black, A. (1996). “Unit selection in a concatenative speech
synthesis system using a large speech database”, Proceedings of
ICASSP 96, vol. 1, pp. 373-376, Atlanta, Georgia.
4. Rao, K. S. (2012). Predicting Prosody from Text for Text-to-Speech
Synthesis. Springer.
5. Rao, K. S.; Koolagudi, S. G. (2012). Emotion Recognition using
Speech Features. Springer.
6. Van den Oord, A.; Dieleman, S.; Zen, H. et al (2016). “Wavenet:
A Generative Model of Raw Audio”, arXiv:1690.03499, Septmber
2016.
-91-
املبحث ال َّثالث
1. Beigi, H. (2009). Fundamentals of Speaker Recognition. Springer.
2. Ghosh, D.; Debnath, D. (2012). Speaker Recognition: Real Time
Veri-fication of VLSI Architecture Based on MEL Frequency Ceps-
tral Co-efficients. Lambert Academic Publishing.
3. Hardcastle, W. J.; Laver, J.; Gibbon, F. E. (2012). The Handbook of
Phonetic Sciences. John Wiley & Sons.
4. Heigold G.; Moreno, I.; Bengio, S. (2016). “End-to-End Text-De-
pendent Speaker Verification” ICASSP 2016.
5. Neamat El, G.; Yee, S. (2018). Computational Linguistics, Speech
and Image Processing for Arabic Language. World Scientific.
6. Neustein, A. (2012). Forensic Speaker Recognition: Law Enforce-
ment and Counter-Terrorism. Springer.
7. Patil, H. A. (2012). Advances in Speaker Recognition. Springer.
8. Rao, R. R.; Prasad, V. K. (2012). Automatic Text Independent
Speaker Recognition Using Source Feature: Modeling Automation.
Lambert Academic Publishing.
9. Reynolds, D. A.; Campbell, W. (2007). Text-Independent Speaker
Recognition, Springer Handbook of Speech Processing and Com-
munication, Springer-Verlag GMBH, Heidelberg, Germany.
10. Schultz, T.; Kirchhoff, K. (2006). Multilingual Speech Processing.
Academic Press.
-92-
الفصل َّ
الثالث
تطبيقات ُمعاجلة ال ُّلغة العرب َّية يف مجال التَّ ِ
عليم
-93-
-94-
ُيستخدم احلاسوب يف تع ّلم اللغات بصورة خاصة؛ لتع ّلم مهارات اللغة ،سواء
أكانت اللغة األم ،أم اللغة األجنبية ،أو ما يسمى باللغة الثانية .وتُستخدم تكنولوجيا
احلاسب اآليل أداة تعليمية تساعد متعلمي اللغة لتطوير مهاراهتم اللغوية ،ومت ّثل بذلك
ال باإلضافة إىل طرق تعليمية ُأخرى ،مما يساعد عىل خلق بيئة تعليمية عنرصا مكم ً
ً
ُعرف موسوعة ويكيبيديا استخدام احلاسوب يف تع ّلم اللغات نشطة وغنية لغو ًّيا .وت ّ
بأنّه استخدام تكنولوجيا احلاسب اآليل لتقديم وتعزيز وتقييم املادة املراد ْ
أن يتعلمها
الطالب ،وذلك من خالل االستفادة من ميزات احلاسوب التفاعلية وأنامطه التعليمية
والتع ّلمية املختلفة واإلنرتنت.
وقد بدأ استخدام احلاسوب فعل ًّيا يف تع ّلم اللغات فـي الستين َّيات من القرن
العرشين [ .]35وتطـورت برامج تع ّلم اللغة اإلنجليزية بمساعدة احلاسوب مع
ِ
باعتباره مساعدً ا يف تعليم اللغات وتع ّلمها ومـر استخدام احلاسوب
بداية الثامنين َّياتَّ ،
بمراحل ثالث ،إ ْذ بدأت املرحلة األوىل فكر ًة يف اخلمسين َّيات ،و ُط ِّبقت يف الستين َّيات،
وقامت عىل أساس النظرية السلوكية التي عدّ ت احلاسوب أداة مثالية للتعليم ،ألنَّه
يسمح بتكرار تع ّلم املادة مرات عديدة [.]36
أ ّما املرحلة الثانية فقد بدأت يف السبعين َّيات ،واستمرت خالل الثامنين َّيات ،وقامت
عىل مبادئ نظرية التواصل؛ وكان سبب انتشار هذه النظرية هو االنتقادات التي
أن الربامج التي تقوم عليها النظرية السلوكية تعرضت هلا النظرية السلوكية ،ذلك ّ َّ
تعتمد عىل التكرار؛ وهي بذلك تفتقد عامل التواصل ،حيث تقوم نظرية التواصل عىل
استخدام الطالب للغة يف أغراض واقعية؛ ويتم تقييم الطالب بنا ًء عىل إعطائه اإلجابة،
وليس من خالل األخطاء التي يرتكبها [ .]2وقد تم تطوير العديد من الربامج التـي
تعتمد عىل هذه النظرية يف التعليم ،وهي تُعطـي شيئا من التحكّم واحلرية أثناء التع ّلم.
تعرضت الربامج التي تقوم عىل نظرية التواصل لالنتقاد بسبب عدم وجود و ّملا ّ
نظام واضح وفاعل الستخدام احلاسب اآليل يف تطوير برامج تعليمية حديثة معتمدة
حمل الربامج التقليدية ظهرت برامج تقوم عىل عنرص التفاعل بني الطالب أن حتل َّ
يمكن ْ
واملادة العلمية املربجمة عىل احلاسوب ،وبدأ ظهور تطبيقات ذكية وتفاعلية لتعليم
اللغات توظف تقنيات املعاجلة اآللية للغات لتوفري بيئة تعليمية تفاعلية متاثل املعلم يف
-95-
الدرايس .وبعض هذه التطبيقات الشهرية مثل املصحح اآل ّيل ألخطاء اإلمالء
ّ الفصل
اللغوي لألخطاء النحوية التي يستخدمها بالفعل كثري منَّا يف برامج الكتابة
ّ واملصحح
مثل برنامج ( )MS Wordالشهري.
الدرايس.
ّ ال للمعلم يف الفصل هم ومكم ًعنرصا ُم ًّ
ً تُعت ََب برجميات تعليم اللغات
فالدارس يستطيع استخدام هذه الربجميات للتدريب عىل مهارات اللغة املختلفة لعدد
أي وقت ومكان مالئم له [ .]12 ،11وترتكز غري حمدود من ساعات التدريب يف ّ
استخدامات تقنيات اللغة يف التعليم يف ثالثة تطبيقات أساسية ،هي :استخدام
تقنيات معاجلة ال ُّلغات الطبيعية ( )Natural Language Processingيف تعليم
وتركيب املفردات واجلمل الصحيحة لغو ًّيا ،واستخدام تقنية التعرف اآل ّيل عىل الكالم
( )Automatic Speech Recognitionيف تعليم مهارة النطق ،واستخدام تقنية
التعرف اآل ّيل عىل الكتابة ( )Automatic Handwriting Recognitionيف تعليم مهارة
الكتابة .وفيام ييل نوضح كيفية توظيف هذه التقنيات يف جمال تعلم اللغة.
-96-
الرصيف الغزير ،يوجد يف هــذه اللغــة
ّ ونظرا لتميز اللغة العربية بخاصية االشتقاق
ً
عدد ضخم من املفردات ممـا يزيد من صعــوبة استيعـاب الطالب هلذا الكــم مــن
املفردات وخاصة يف املراحل األولية من تعلم اللغة .لذلك يمكن استخدام تقنيــة
معالــج الرصف اآل ّيل ملساعدة الطالــب يف التــعرف علــى قواعـــد الرصف للغــة
أيضا استخدام معالج الصــرف العربيــة وتطبيقها عىل العديد من األمثلة .ويمكن ً
اآللــي لتحليل املفردات التي يكتبها الطالب والتأكد من صحتها طب ًقا لقواعد اللغة
ّ
وتصحيح أخطائه وتدريبه عىل استخدام هذه القواعد الرصفية.
النحوي اآل ّيل لتحليــل البناء
ّ وعىل مستوى بناء اجلمل يمكن استخدام املحلل
النحوي للجمل التي ينشئها الطالب وحتكيم صحتها طب ًقا لقواعد النحو يف اللغةّ
العربية وتصحيح األخطاء أو اقرتاح عدد من احللول يف حالة توفرها كام يف هذه األمثلة:
مجلة اسمية من مبتدأ وخرب احلديقة مجيلة
مجلة غري تامة صفة وموصوف احلديقة اجلميلة
مجلة فعلية من فعل وفاعل ومفعول به،
رضب حممد عل ًّيا
ويالحظ وجوب ظهور التنوين
والصواب :مجيلة
عدم تطابق النوعَّ ، الشجرة مجيل
والصواب يلعبون
عدم تطابق العددَّ ، األوالد يلعب
مجلة صحيحة يلعب األوالد
تتميز اللغة العربية بخاصية املرونة النحوية بفعل عمليات التقديم والتأخري واحلذف
واإلبدال واإلضامر مما يمثل حتد ًيا ملتعلمي قواعد النحو يف اللغة العربية .ويوفر املحلل
النحوي اآل ّيل أداة تعليمية فعالة للمساعدة يف تعلم كيفية بناء اجلمل صحيحة طب ًقا
ّ
لقواعد النحو.
كثريا ،حيث توفر بعض كام تساعد أدوات الرتمجة اآللية متعلمي اللغة الثانية ً
األدوات البسيطة -مثل ذاكرة الرتمجة -وسيلة فعالة ملعرفة املفردات والنصوص
اللغوية واملقابل هلا باللغة األخرى .ومما ال شك فيه أن توفر خدمة الرتمجة اآللية
املجانية عىل بعض مواقع شبكة اإلنرتنت قد ساهم بدرجة كبرية يف انتشار تعلم اللغات
األجنبية عىل الرغم من تدين مستوى الدقة احلايل لربامج الرتمجة اآللية ،ولكنها تتطور
-97-
برسعة كبرية مع توفر النصوص املرتمجة يدو ًّيا واستخدامها لتحسني نامذج الرتمجة يف
هذه الربامج.
توجد طريقتان أساسيتان الختبار املستخدم يف أنظمة تعليم اللغات باستخدام
احلاسب؛ الطريقة األوىل هي أسئلة االختيار من متعدد ،والطريقة األخرى هي
األسئلة اإلنشائية حيث يرتك للمستخدم حرية استخدام مهاراته اللغوية يف كتابة
اإلجابة املطلوبة كام يف نظام ( )Arabic ICALLالذي تم تطويره يف كلية احلاسبات
جامعة القاهرة ،حيث يوجه النظام املستخدم للتعرف عىل أخطائه والتوظيف اخلاطئ
للوحدات اللغوية .ويساعد هذا النظام املستخدم عىل االستفادة من أخطائه وتعلم
كيفية إجراء التعديالت الالزمة لتصحيح أخطائه؛ ويف هذا النظام يتم استخدام حملل
نحوي للتعرف
ّ رصيف وحملل ّ أخطاء يستعني بأدوات معاجلة اللغة العربية ،مثل حملل
عىل أخطاء املستخدم اللغوية وتتبع التصحيحات املطلوبة لألخطاء .ويتبع النظام
التعليمي للغة العربية الذي يتم تدريسه يف املدارس املرصية يف املرحلة االبتدائية.
ّ املنهج
الشكل ( )1-3يوضح مكونات نظام ( ،)Arabic ICALLو ُي َم ِّثل واجهة املستخدم
التعليمي وحملل األخطاء اللغوية ووحدة تكوين ردود النظام.
ّ التفاعلية واملحتوى
الطالب
اإلجابات
التدريبات
واجهة
املحتوى التعليمي املستخدم الرسائل التوجيهية
التفاعلية
تصحيح اإلجابة
خبري لغوى
َّ
الشكل :1-3الشكل التوضيحي ملكونات نظام ( )Arabic ICALLلتعليم قواعد اللغة العربية.
-98-
قائم عىل استخدام القواعد يف التعرف عىل
منهجا ً
ً ويتبنى نظام ()Arabic ICALL
األخطاء اللغوية؛ ويتميز هذا املنهج بقدرته عىل توفري حتليل تفصييل ألخطاء الطالب
اللغوي طب ًقا لنظم املعرفة اللغوية ،وهذه
ّ اللغوية ،حيث يستطيع متثيل قواعد البناء
وأيضا تكويد األخطاء
اللغوي السليمً ،ّ القواعد تؤدي وظيفة مزدوجة لرتميز البناء
اللغوية املتوقعة عىل مستوى الرصف والنحو والداللة ،وتكون مصاحبة بالردود
التعليمية املناسبة لكل خطأ .هذا املنهج ال يضمن تغطية كل األخطاء املحتملة ،ويمكن
تعليمي حمدد ،ولكنه يتميز بعدم احتياجه إىل قواعد
ّ تاليف ذلك بالرتكيز عىل نطاق
اإلحصائي للتعرف عىل
ّ بيانات ضخمة لتدريبه مقارنة باألنظمة التي تتبنى املنهج
األخطاء اللغوية.
-99-
ويتم اختيار القيمة املحددة ( )thresholdمن التجارب املعيارية للنظام عىل
صحيحةُّ .
عدد كبري من مستخدمي النظام.
ويوضح الشكل ( )2-3العنارص املكونة لنظام تعليم النطق.
يتم استخدام نامذج ماركوف يف تطبيق تعليم القراءة والنطق بنفس طريقة توظيفها
ٍ
اختالف يتم َّث ُل يف أنَّنا يف هذا التطبيق ن ُع َل ِّم يف تطبيق التعرف اآل ّيل عىل الكالم ،مع
مسب ًقا اجلملة التدريبية التي ينطقها املستخدم مما يساعد عىل حتديد نطاق البحث ملحرك
التعرف اآل ّيل؛ األمر ا َّلذي يساعد عىل حتسني دقة النتائج .ويكون نطاق البحث فقط يف
-100-
الصور املختلفة ألخطاء النطق يف اجلملة التدريبية املستخدمة ،كام هو موضح بالشكل
رقم (.)3-3
َّ
الشكل :3-3مثال ألخطاء النطق يف جزء من كلمة.
ويعتمد هذا املعامل على قيمة االختالف بني أرجح تقييم من البدائل املتاحة لنطق الكلمة
موضع االختبار والتقييم التايل يف الرتتيب؛ فوجود اختالف كبري يدل على وجود درجة عالية
من الثقة يف حتكيم النظام لقراءة املستخدم-101-.
ويعتمد هذا املعامل عىل قيمة االختالف بني أرجح تقييم من البدائل املتاحة لنطق
الكلمة موضع االختبار والتقييم التايل يف الرتتيب؛ فوجود اختالف كبري يدل عىل
وجود درجة عالية من الثقة يف حتكيم النظام لقراءة املستخدم.
وتعتمد الرسائل التصحيحية يف هذا النظام عىل مدى ثقة النظام من النتائج (معامل
صغريا يسري النظام عىل إحدى هذه الطرق:
ً الثقة)؛ وإذا كان معامل الثقة
-1إمهال اخلطأ متا ًما وعدم ظهور رسالة له (وهذا جيد للمبتدئني ،ألن إظهار إنذار
خاطئ يثبط من عزم املتعلم).
-2طلب إعادة اجلملة من املستخدم ألهنا غري واضحة.
-3إظهار رسالة توضح وجود خطأ غري حمدد ،وطلب إعادة اجلملة.
-4إظهار رسالة بأكثر األخطاء شيو ًعا يف هذا املوضع.
ويمكــن حتســني أداء أنظمــة تعليــم القــراءة بدرجةــ كبيــرة عن طريــق
تكييــف وحتويــل النامذج الصوتية ( )Models Adaptationلتشابه خصائص صوت
اخلطــي،
ّ املستخدم .ومن أشهر طرق حتويل نمــاذج ماركــوف طــرق التحــويل
نظـرا لسهــولة تنفيــذها وفاعلية نتائجها .ويف هذه العملية يتم جتميع عدد قليــل من
ً
اجلمل من املستخـــدم الختيــار أقرب حزمة صــوتية لصــوت املستخــدم؛ وهذه
احلــزمة تستخــدم كنموذج مرجعـي لصــوت املستخدم .ثم ُيطلب من املستخدم
إدخال عدد من اجلمل يتم حتكيمــها باستخدام هذا النموذج املرجعي .وإذا رأي
النظــام أن اجلمــلة خاليــة من أخطاء القراءة يقوم بوضعها يف املجموعة التي سيتم
استخدامها يف عملية حتويل النموذج الصويت .تستمــر هذه العملــية حتى يتم جتميع
كمية كافيـــة من اجلمــل لبـــدء عملية حتويل النمـــاذج الصوتية باستخـــدام
اخلطــي إىل شكـــل حياكـــي صــوت املستخــدم.
ّ يت
مصفـــوفات التحويل الصو ّ
اخلطي يف نامذج
ّ رسم توضيح ًّيا لعملية التحـــويل
ويوضح الشكل رقم (ً )4-3
ماركوف.
-102-
عملية حتويل النم ــاذج الصوتية ابستخ ــدام مصف ــوفات التحويل الصويتّ اخلطـ ّـي إىل شك ــل
اخلطي
ّ حياك ــي صــوت املستخــدم .ويوضح الشكل رقم ( )4-3رمسًا توضيحيًّا لعملية التح ــويل
يف مناذج ماركوف.
املعدلللمستخدم
للمستخدم النموذج املعدل
النموذج
µ2
s22
s1
1
α2
النموذج العام
النموذج العام
الصوتية.
النامذجالصوتية.
حتويلالنماذج
عمليةحتويل
:4-3عملية الش َّ
َّكلكل:4-3
الش
احلاسبيف
اآليل
ّ
استخداماستخدام
احلاسب التحدي: عالية من
التحدي: درجةمنمتثل عالية
التيدرجة
النطقمتثل تعليمتعليم
النطق اليت تطبيقات ومنومن
تطبيقات
اآليل يف تعليم قراءة وجتويد القرآن الكريم .فباملقارنة مع تطبيق تعليم اللغات -حيث
تعليم ق ّراءة وجتويد القرآن الكرمي .فباملقارنة مع تطبيق تعليم اللغات – حيث توجد فروق
توجد فروق واضحة بني النطق الصحيح واألخطاء -حتتاج بعض قواعد النطق يف
واضحة بني النطق الصحيح واألخطاء – حتتاج بعض قواعد النطق يف علم التجويد إىل درجة
علم التجويد إىل درجة عالية من احلساسية من أجل احلكم بصحة تطبيق القاعدة
استخدام درجةيتطلب
عالية جدًّ ا من ذي مما
التجويدية؛ القاعدة
عىل الكالم للتعرفبصحةآيلتطبيق عالية من احلساسية من أجل احلكم
التجويدية؛ مما يتطلب استخدام معالج ّ
معاجلة التجويدية األكرب هو
والفونيامت فوق الدقة .والتحدي التقنيات من
لألحكام درجةهذهعالية جدًّا هو ذي
معاجلة الكالم
والتحديعلىاألكرب
الدقة .للتعرف
آيل
معاجل ّ
فوق املقطعية اليت ينبغي على دارس القرآن الفونيمات
تعلمها. دارس والقرآن
التجويدية
لألحكام عىل
التقنياتالتي ينبغي
هذهاملقطعية
تعلمها.ويوضح الشكل ( )5-3مثاالً لشاشة تطبيق تعليم التجويد حيث يستطيع املستخدم
بتوليــد
بدء الربنامــج
املستخدم فيقوميستطيع
عليه،حيث التــدرب
التجويد لشاشةيريــد
تطبيق تعليم الدرسالً الذي
باختيار )5-مثا التدرب
الشكل (3 بدء
ويوضح ُّ
خاصةقارئ
هلذا بصوتالتدريباتـات
لتالوةــجهذهبتوليــد تدريبـ املستخدم
فيقوم الربانم فيستمععليه،
الدرس،التــدرب الدرسهلذا
الذي يريــد ابختيارخاصة
تدريبــات
التدرب
ُّ
قيايس ثم عليه أن يكررها ،فيقوم الربنامج بتوليد تقرير مكتوب ومنطوق عن قراءة ّ
قياسي ُث عليه أن يكررها،
ّ الدرس ،فيستمع املستخدم لتالوة هذه التدريبات بصوت قارئ
املستخدم يرشح له فيها أخطاءه التجويدية واللغوية كام هو موضح بالشكل .ويظهر يف
املستخدم مـع تلويـن احلـرف أو احلروف التي فيها
113 التقرير املكتوب املقطع الذي قرأه
اخلطأ باللون األمحر مع شـرح للخـطأ املر َتكَب؛ ويتم توليد التقرير املنطــوق بحــيث
يظن املستخدم أن احلاسوب يفهمه ويتفاعل معه ،ألنه خيربه باخلطأ صــوت ًّيا.
-103-
يت مثاالً منطو ًقا عن احلكــم الذي كــان فيه اخلطأ من قبل
ويتضمن التقرير الصو ّ
املستخدم.
َّ
الشكل :5-3شاشة التدريبات يف برنامج تعلم التجويد.
-104-
النص القرآين
الكتابة الصوتية
التجويد. ألحكام
التجويد. النطققاطب ًقا
ألحكام أخطاء
النطق طب شبكةأخطاء
توليدشبكة
حمركتوليد
ُ ::6-3مرك الشكل
الش
َّكل 6-3 َّ
ً
115
-105-
يعتمد توليد شبكة األخطاء عىل حمرك توليد الكتابة الصوتية للقرآن الكريم الذي
يتكون من عدة طبقات؛ وهى حمرك األحداث الذي يبحث خالل الرسم العثامين للقرآن
ي حالة نطقه (منطوق أو خاصا و ُي َب ِّ ُ
الكريم عن خصائص كل حرف ويولد له كو ًدا ًّ
غري منطوق ،مشدد أو غري مشدد ،التشكيل اخلاص باحلرف )...وخصائصه الصوتية
(جمهور ،مهموس ،خمرج احلرف .)... ،ويقوم حمرك توليد الكتابة الصوتية بتحليل هذه
الصحيحة طب ًقا ألحكام تالوة َّ
األكواد/الشفرات وخصائص توليد الكتابة الصوتية َّ
القرآن الكريم؛ ثم يقوم حمرك مقارنة النامذج (القواعد) بتجميع كل هذه املعلومات
وتوليد أخطاء التالوة املتوقعة.
والقاعدة اآلتية توضح طريقة توليد األخطاء االفرتاضية:
بافرتاض َّ
أن الوحدة احلالية:
فونيم= ،Phcنوع احلركة= ،Vcطول احلركة= ،Lc
مشدد= ،Scمنطوق= ،Pcإدغام= Ec
والوحدة السابقة:
فونيم= ،Phpنوع احلركة= ،Vpطول احلركة= ،Lp
مشدد= ،Spمنطوق= ±P
والوحدة التالية:
فونيم= ،Phnنوع احلركة= ،Vnطول احلركة= ،Ln
مشدد= ،Snمنطوق= Pn
مسارا خلطأ التالوة باخلصائص التالية:
ً إ ًذا أضف
رقم اخلطأ= ،Cنوع اخلطأ= ،Tكلمة اخلطأ= ،Wمقدار شيوع اخلطأ= ،Fفونيم= ،Phنوع
احلركة= ،Vطول احلركة= ،Lمشدد= ،Sمنطوق= ،Pمدغم=E
وتستخدم هذه النامذج (القواعد) بعد توليدها للمقارنة مع الكتابة الصوتية للقرآن
الكريم لتوليد شبكة مسارات األخطاء املتوقعة .ويقوم مولد شبكة مسارات األخطاء
برتتيب النامذج (القواعد) التي تطابقت بشكل تنازيل حسب مدى تطابقها مع احلالة
احلالية ثم هيمل كل النامذج (القواعد) التي تولد نفس اخلطأ ما عدا أوهلا ،ثم يف
النهاية تولد الشبكة بشكل يناسب نظام التعرف عىل الصوت .والوحدة املستخدمة
يف بناء شبكة األخطاء يف هذا االخرتاع شبيهة بتلك التي تستعمل يف طرق تعليم تالوة
-106-
القرآن الكريم ،حيث إن مفهوم الفونيم غري مالئم للمستخدم .وتتكون الوحدات
يف هذا النظام من حرف+حركة قصرية ،حرف+حركة طويلة ،حرف ساكن ،حرف
مشدد+حركة قصرية ،حرف مشدد+حركة طويلة ،حرف مشدد ساكن.
تعد اختبارات األداء العملية من أهم وسائل تقييم أنظمة تعلم القراءة لبيان دقتها
وأثرها عىل منحنى التعلم لدى املستخدم املبتدئ .وأحد هذه االختبارات هو تقييم
برشي باستخدام نفس املعطيات .ففي جتربة لقياس ّ أداء النظام باملقارنة مع أداء معلم
االختالف البرشي املسموح به يف تعليم التجويد عن طريق التحقق من نسبة االتفاق
واالختالف يف حتكيم الشيوخ املجازين لقراءة املتعلم العادي ،تم تسجيل ثالثمئة
حماولة لنطق كلامت أو مجل حتتوي عىل أحكام جتويد حمددة من شخص عادي ،ثم طلب
كل عىل حدة ،ثم تم إدخال من أربعة شيوخ جمازين حتكيم هذه املحاوالت الثالثمئةٍّ ،
نفس املحاوالت عىل برنامج تعليم التجويد لتحكيمها .أظهرت النتائج أن :متوسط
اتفاق حتكيم أي حمكم جماز مع أي حمكم جماز آخر يف حدود ،٪80وهي نفس نسبة
أي من الشيوخ املجازين .والنسبة التي خالف فيها الربنامج إمجاعهم اتفاق الربنامج مع ٍّ
حوايل ٪4فقط ،وهي نفس نسبة اختالف أي من الشيوخ مع إمجاع باقي الشيوخ.
َّ
الشكل :7-3توضيح ملدى اتفاق واختالف املشايخ مع بعضهم البعض ومع برنامج تعليم التجويد.
-107-
ويف اختبار آخر لقياس أثر برنامج تعليم التجويد عىل تعلم الفرد املبتدئ حلكم
أو أكثر من أحكام التجويد ،متت االستعانة بمجموعة من األفراد العاديني الذين ال
جييدون أحكام قراءة القرآن الكريم ،ثم إجراء اختبار قبيل -قبل استخدام التقنية -
لتحديد مستوى املستخدم ،ثم إتاحة الفرصة له للتعلم عىل احلكم أو القاعدة املطلوبة
مع سامع أمثلة ونامذج صوتية للحكم ،وتم الرتكيز عىل قواعد ثالث ،هي :القلقلة،
وحكم إدغام النون الساكنة والتنوين بغنة ،وحكم إقالب النون الساكنة والتنوين.
وتم اختبار املستخدم مرة أخرى بعد فرتة من التدريب -ساعة تقري ًبا -باستخدام
الربنامج ،ثم مرة ثالثة بعد ساعة تدريب أخرى .وأظهرت النتائج ارتفاع منحنى التعلم
ملجموعة املستخدمني بنسب كبرية حيث بدأ بنسب تقرتب من ٪40وارتفع إىل ما يزيد
عىل ٪70خالل بضع ساعات من التدريب باستخدام الربنامج .ويف هذا برهان عىل
فعالية التقنية وكفاءهتا .ويوضح الشكل ( )8-3متوسط نتائج املشاهدات التي أثمرهتا
التجربة مع عرشة مستخدمني.
ساعات التدريب
إقالب القلقلة إدغام
املبتدئني.املبتدئني.
التعلم لدى منحنى
التعلم لدى تطويرمنحىن
التجويديفيفتطوير تقنيةتقنيةتعليم
تعليم التجويد أثر أثر لقياس
لقياس شكل بياين
شكل بياين :8-3 :8-3 َّ
الشكل الشَّكل
-109-
بعد أن جيتاز الطالب املستوى األول من التدريبات يمكن أن ينتقل إىل املستوى
ال َّثاين يف الكتابة احلرة ،حيث يكون قد متكن من إتقان املهارات األساسية لكتابة
احلروف؛ لذلك يتم تدريب الطالب -يف املستوى الثاين -عىل الكتابة بدرجة أكرب من
توجيه الختبار مدى استيعاب اجلهاز احلركي عند الطالب ألشكال كتابة ٍ احلرية بدون
احلروف وختزينها يف الذاكرة الباطنية.
ويف تدريبات هذا املستوى يتم عرض صورة متحركة توضح طريقة الكتابة املثالية
ب من املستخدم كتابة النموذج بنفسه للنموذج املوضح عىل الشاشة للمستخدم ،ثم ُيط َل ُ
ُعر ُض نتيجة تقييم هذه عىل مساحة بيضاء .ويتم حتكيم جودة كتابة املستخدمُ ،ث َّم ت َ
الكتابة مع توضيح نوعية اخلطأ وموضعه يف أي حرف من حروف النموذج املستخدم.
حيث يتم يف ُ ولعمل هذا التحكيم يتم تنفيذ مرحلتني من املعاجلة لكتابة املستخدم؛
املرحلة األوىل حتديد املقاطع احلرفية يف كتابة املستخدم وحدود البداية والنهاية لكل
حرف يف عينة الكتابة ،وذلك باستخدام نامذج ماركوف املخفية ا َّلتي سبق رشحها يف
تطبيق تعليم القراءة.
نظرا للتطابق الكبري بني عمليتي النطق والكتابة؛ فاألوىل هي
وتُستَخدَ ُم هذه النامذج ً
تتابع من األصوات املنطوقة ،والثانية هي تتابع من احلروف املكتوبة ،مع اختالف بسيط
يف الثانية ،إذ عادة تُضاف النقط والعالمات التشكيلية بعد إمتام كتابة الكلامت .وهذا
التحرك اخللفي يف اجتاه الكتابة ُيسبب نو ًعا من التعارض مع الفرض األسايس لنامذج
ماركوف املخفية من نوع ()Ergodic HMM؛ وهو أهنا تستطيع عمل نمذجة للبيانات
املتتابعة يف اجتاه أمامي فقط.
أضي َفت مرحلة قبل املعاجلة إلعادة ترتيب تتابع وللتغلب عىل هذا التعارضِ ،
الوحدات املكتوبة يف عينة الكتابة لتكون يف تسلسل أمامي ،مما يسهل استخدام نامذج
ماركوف املخفية من نوع ( )Ergodic HMMلعمل نمذجة هلذه البيانات.
وبعد حتديد املقاطع احلرفية يف كتابة املستخدم ،يتم حتليل جودة كتابة كل مقطع
وحتديد نوع اخلطأ يف شكل كتابة احلرف إن وجد ،ويتم ذلك باستخدام عدد من
املصنفات الثنائية ،يتخصص كل مصنف منها يف إعطاء قرار ثنائي عن وجود خطأ حمدَّ د
يف كتابة احلرف أو عدم وجوده.
-110-
يف الشكل ( )10-3يتم عرض ُم َ َّطط ملراحل حتكيم الكتابة احلرة للمستخدم ،وكام
نرى يف مراحل حتكيم كلمة «حافظ» بعد املعاجلة املبدئية وإعادة ترتيب اجتاه الكتابة
يف الكلمة تم حتديد املقاطع احلرفية يف الكلمة ،وهي هنا أربعة مقاطع؛ وتم حتكيم
جودة كتابة كل حرف واألخطاء امللحوظة فيه؛ مثل حرف األلف ،وهي مكتوبة بشكل
مقوس يف هذه العينة.
كتابة املستخدم
املعاجلة املبدئية
الكتابة المرتبة
المقاطع الحرفية
مرحلة تصنيف
األخطاء
احلرة.احلرة.
الكتابة حتكيم
الكتابة مراحل
حتكيم :10-3راحل الش َّ
َّكلكل :10-3م
الش
تم اختبار هذا التطبيق عىل ُطالَّب عدد من مدارس املرحلة االبتدائية يف املرحلة
العمرية 11-6سنة .تم تدريب عدد 50طالب عىل استخدام التطبيق ،ثم استخدم
الطالب التطبيق للتدرب عىل كتابة األمثلة املتاحة .بعد عدد قليل من احلصص التعليمية
متكنت نسبة كبرية من الطالب من حتسني كتابتهم؛ وقد متكن بعضهم من تقليد طريقة
وأشار حتليل نتائج التجربة إىل وجود تفاوت يف قدرة التطبيق
َ الكتابة املثالية لألمثلة.
-112-
عىل تتبع أخطاء الكتابة املختلفة كام هو موضح بالشكل ( )11-3حيث تراوحت الدقة
للحروف املختلفة ٪90 - ٪60طب ًقا لدرجة الصعوبة يف شكل احلرف ُّ
وتعرف التطبيق
عىل نوع اخلطأ يف كتابته .وبصورة ما ُو ِجدَ أن درجة استفادة الطالب األصغر سنًّا من
النظام أكثر من ُق ِ
رنائهم األكرب سنًّا؛ وهذه نتيجة متوقعة إىل حد كبري بسبب مرونة
جهاز الكتابة عند الصغار ،مما يسهل تعلم التغيري يف طريقة كتابة احلروف وتعديل هذه
األشكال يف العقل الباطن للطفل ،مما يسهل عليه استخدامها بصورة آلية يف املستقبل.
َّ
الشكل :11-3نسبة الدقة يف التعرف عىل أخطاء كتابة احلروف املختلفة.
-113-
-4مقرتحات َبحثِ َّية
ُت َعدُّ مشاركة الباحثني ال ُّلغويني يف تطوير استخدام تقنيات معاجلة اللغة العربية
املهمة .فعىل سبيل املثال ،لتصميم برامج فعالة لتعليم
يف تطبيقات التعليم من األمور َّ
النطق ،ينبغي تو ُّفر حتليل لغوي دقيق ألنواع أخطاء النطق وأسباهبا وكيفية معاجلتها.
َ
أفضل َمن يؤ ِّدي هذه املهمة .فجدير بالذكر أن علم الصوتيات و ُي َعدُّ الباحثون ال ُّلغو ُّيون
يف اللغة العربية ُي َعدُّ من أقدم العلوم مقارنة باللغات األخرى ،حيث تم وضع أسسه
اهلجري .وحتى اآلن الفراه ِ
يد ّي يف القرن الثاين ِ عىل يد العامل اجلليل اخلليل بن أمحد
ّ
تم إنتاج تراث ضخم من األبحاث يف اخلصائص الصوتية للغة العربية والدراسات
املقارنة مع اللغات األخرى .وبدون شك فإن توظيف هذه األبحاث يف تطوير تقنيات
تطور هذه التقنيات واحلصول عىل تعلم النطق باستخدام احلاسب سوف ُيسهم يف ُّ
درجة عالية من الدقة تقارب املعلم احلقيقي.
اللغوي ألخطاء الكتابة وتصنيفها
ّ أيضا توفري التحليلوتستطيع األبحاث اللغوية ً
اللغوي يف اللغة العربية.
ّ وتعيني معدل تكرارها وحتديد مرجعيتها طب ًقا لقواعد البناء
فكل هذه اخلصائص تساعد عىل تصميم برامج تعليمية للغة العربية بصورة ميرسة
ومفيدة للدارسني حيث يتم الرتكيز فيها عىل العنارص الفعالة التي تقود املتعلم لفهم
واستيعاب قواعد اللغة من ناحية ،وتوظيفها يف كتابة النصوص بلغة عربية سليمة من
ٍ
ناحية أخرى.
يب توفري قواعد تعليمية ٍ
ومن ناحية أخرى ،يستطيع الباحثون املعن ُّيون باخلط العر ّ
لتحسني طرق الكتابة وإظهار مجاليات اخلط العريب .ويمكن استنتاج هذه القواعد عن
طريق حتليل ُمشكالت الكتابة يف عينات من اخلط متثل نامذج الكتابة بدرجات إتقان
متفاوتة.
-114-
ببليوجرافيا مرجع َّية
.م1971 ،2 ط، دار غريب،) علم اللغة العام (األصوات:)برش (كامل حممد1.1
.م2002 ،1 ط، مكتبة السنة، أحكام قراءة القرآن الكريم:)احلرصي (حممود خليل2.2
تنبيه الغافلني وإرشاد اجلاهلني:)الصفاقيس (أبو احلسن عيل بن حممد النوري3.3
املطبعة الرسمية للجمهورية،عام يقع هلم من اخلطأ حال تالوهتم لكتاب اهلل املبني
.م1974 ،التونسية
4. Abdallah, M.; Al-Marri, M.; Abdou , S.; Rashwan, M.; El-Gamal,
M. (2015). “Improving Holy Qur’an recitation system using Hybrid
Deep Neural Network-Hidden Markov Model approach”, Third In-
ternational Conference on Islamic Applications in Computer Sci-
ence And Technology, 1-3, Turkey.
5. Abdou, S.; Elgammal, A.; Fahmy, A. (2010). “A Tool for Arabic
Handwriting Training”. The Fifth Conference of Learning Interna-
tional Networks Consortium (LINC), 23-26 May 2010, MIT, Cam-
bridge, Massachusetts, USA.
6. Abdou, S.; Hamid, S.; Rashwan, M.; Samir, A.; Abdel-Hamid, O.;
Shahin, M.; Nazih, W. (2006). “Computer Aided Pronunciation
Learning System Using Speech Recognition Techniques”, INTER-
SPEECH 2006 - ICSLP, Pittsburgh, PA, USA.
7. Abdou, S.; Rashwan, M.; Al-Barhamtoshy, H.; Jambi, K. and Al-Je-
daibi, W. (2014). “Speak Correct: A Computer Aided Pronunci-ation
Training System for Native Arabic Learners of English” Life Sci-
ence Journal 2014; 11(10) pp. 370-380.
8. Al-Barhamtoshy, H.; Abdou, S.; Rashwan, M. (2014). “Mobile
Technology for Illiterate Education”. Life Science Journal 2014;
11(9) pp. 242-248.
9. Al-Barhamtoshy, H.; Alwajih, F.; Abdou, S. (2012). “A Toolkit For
Teaching Arabic Handwriting”, International Journal of Computer
Applications, Vol. 49, No. 23.
-115-
10. Al-Marri, M., Raafat, H., Abdallah, M., Abdou, S., & Rashwan, M.
(2018). Computer Aided Qur’an Pronunciation using DNN. Journal
of Intelligent & Fuzzy Systems, vol. 34, no. 5, pp. 3257-3271, 2018
11. Bacha, K.; Jemni, M.; Zrigui, M. (2016). “Towards a Learning Sys-
tem Based on Arabic NLP Tools”. International Journal of Informa-
tion Retrieval Research (IJIRR) 6.4.
12. Bax, S. (2003). “CALL - past, present and future”, System 31, 1:
13-28.
13. Bax, S.; Chambers, A. (2006). “Making CALL work: towards
nor-malisation”, System 34, 4: 465-479.
14. Cushion, S.; Hémard, D. (2003). Designing a CALL Package for
Arabic While Learning the Language Ab Initio. Computer Assisted
Language Learning (CALL): An International Journal, Vol. 16, No.
2-3, 259-266, Belgium: SWETS & ZEITLINGER publisher.
15. Elaraby, Mohamed S., et al. “A Deep Neural Networks (DNN)
Based Models for a Computer Aided Pronunciation Learning Sys-
tem.” International Conference on Speech and Computer. Springer
International Publishing, 2016
16. El-Kasasy, M. S. (1992). “An Automatic Speech Verification Sys-
tem”, Ph.D. Thesis, Cairo University, Faculty of Engineering, De-
partment of Electronics and Communications, Egypt.
17. Franco, H. et al. (2000). “The SRI EduSpeak system: Recognition
and pronunciation scoring for language learning”, Proc. of InSTIL,
Scotland, 123-128.
18. Fuerstenberg, G. (1993). A la rencontre de Philippe: Videodisc,
Software, Teacher’s Manual and Student Activities Workbook: Yale
University Press [Online]: http://web.mit.edu/fll/www/projects/
Philippe.html
19. Hagen A.; Pellom, B. (2005). “Data driven sub-word unit modeling
for speech recognition and its application to interactive reading tu-
tors,” in Proc. European Conference on Speech Communication and
Technology, Lisbon, Portugal, Sept. 2005, pp. 2757–2760.
-116-
20. Hager Morsy, M. S., Aljohani, N., Shoman, M., & Abdou, S. (2018).
Automatic Speech Attribute Detection of Arabic Language. Interna-
tional Journal of Applied Engineering Research, 13(8), 5633-5639.
21. Hamid S.; Rashwan, M. (2004). “Automatic Generation of Hypoth-
eses for Automatic Diagnosis of Pronunciation Errors” Proceedings
of NEMLAR International Conference on Arabic Language Re-
sources and Tools, pp. 135-139, Cairo, Egypt.
22. Hamid, S. (2005). “Computer Aided Pronunciation Learning Sys-
tem using Statistical Based Automatic Speech Recognition”. PhD
thesis, Cairo University, Cairo, Egypt.
23. Hammadi, M.; Bezine, H.; Njah, S.; Alimi, A. M. (2012): “Towards
educational tool for Arabic Handwriting Learning”, International
Conference on Education and e-Learning Innovations.
24. Hosseny, I.; Abdou, S.; Fahmy, A. (2011). Using Advanced Hid-
den Markov Models for Online Arabic handwriting recognition”,
ACPR2011, Bekeen, China, 29-30.
25. Hubbard, P.; Levy, M. (2016). “Theory in computer-assisted lan-
guage learning research and practice”. The Routledge Handbook of
Language Learning and Technology (2016): 24.
26. Kosaka, T.; Sagayama, S. (1994). “Tree–structured speaker cluster-
ing for fast speaker adaptation”, proceedings of the 1994 IEEE In-
ternational Conference on Acoustics, Speech and Signal Processing
1, 245–248. IEEE, New York.
27. Magdy, M. Shalaan, K.; Fahmy, A. (2010). Morphological Analysis
of Ill-formed Arabic Verbs in Intelligent Language Tutoring Frame-
work. In FLAIRS-23, The 23rd International FLAIRS Conference,
Florida, USA
28. Mars, A.; Antoniadis, G. (2015). “Handwriting recognition system
for Arabic language learning”. Information Technology and Com-
puter Applications Congress (WCITCA), 2015 World Congress on.
IEEE.
-117-
29. Marse, J. F. et al, (1991). Handwriting Training: Computer-Aided
Tools for Premedial Teaching, Development of Graphic Skills. J.
Wann, A.M. Wing, N. Suvik, eds., pp. 249-258, Academic Press.
30. Mote, N.; Johnson, L.; Sethy, A.; Silva, J.; Narayanan, S. (2004).
Tactical Language Detection and Modeling of Learner Speech Er-
rors: The case of Arabic tactical language training for American
English speakers. In the Proceedings of InSTIL/ICALL2004 – NLP
and Speech Technologies in Advanced Language Learning Systems,
Venice. at http://sisley.cgm.unive.it/ICALL2004/link13.htm
31. Samir, A.; Abdou, S. M.; Khalil, A. H.; Rashwan, M. (2007).
“En-hancing usability of CAPL system for Qur’an recitation learn-
ing”, INTERSPEECH 2007 - ICSLP, Antwerp, Belgium.
32. Schneider, E.W.; Bennion, J.L. (1984). “Veni, vidi, vici, via video-
disc: a simulator for instructional courseware”. In Wyatt D.H. (ed.)
Computer-assisted language instruction, Oxford: Pergamon.
33. Underwood, J. (1984). Linguistics, computers and the language
teacher: a communicative approach, Rowley, Massachusetts: New-
bury House.
34. Warschauer, M. (1996). “Computer-assisted language learning: an
in-troduction”. In Fotos S. (ed.) Multimedia language teaching,
Tokyo: Logos International [Online]: http://www.ict4lt.org/en/war-
schauer.htm.
35. Warschauer, M. (2000). “CALL for the 21st Century”, IATEFL and
ESADE Conference, 2 July 2000, Barcelona, Spain.
36. Warschauer, M.; Healey, D. (1998). “Computers and language
learning: an overview”, Language Teaching 31: 57-71.
37. Waslylyk, T. M.; Barbe, W. B.; Lucas, V. H. (1994). “Basic Skills
for Effective ommunication. ”
38. Williams, D. A. (1999). “Knowing what you don’t know: roles for
confi-dence measures in automatic speech recognition”, Ph.D. the-
sis, De-partment of Computer Sciences, University of Sheffield,
Sheffield, United Kingdom.
-118-
الرابع
الفصل َّ
اآللي
ّ التَّقييم
-119-
-120-
التَّقييم اآللي
()Automatic Scoring
مقدمة
تؤدى زيادة عدد الطالب واالختبارات إىل أن تصبح عملية تصحيح إجابات
يل (Automatic أمرا مزعجا ،ويؤدي التَّقييم اآل ّ االختبارات بأنواعها وتقييم الطالب ً
)Scoring -ASإىل اختصار الوقت واجلهد ،وتوفري تناسق ومتانة التقييم ،وتوحيد
املقاييس املعيارية لتقييم الطالب ورصد الدرجات؛ كام أن هذه النظم واسعة املجال بام
يكفي لتغطية مجيع أنواع إجابات الطالب املكتوبة واملنطوقة.
وتوفر أنظمة التقييم والتصحيح اآليل العديد من املزايا ،مثل اتساق وعدالة التقييم،
وتقديم تقييامت لالمتحانات عالية املخاطر ( )high-stakes assessmentsوالتي
والرفض «ناجح أو غري ناجح»« ،يقبل أو ال يقبل»« ،يصلح تتمثل يف احلدّ بني القبول َّ
أو ال يصلح» وهكذا .وتعزز هذه النظم معنى «التوحيد القيايس» عن طريق تطبيق
نفس املعايري عىل مجيع اإلجابات .بعبارة أخرى فإن التقييم اآليل AESيوفر الفوائد
لكافة مهام التقييم بام فيها من مكوناهتا األساسية ،واملت ََم ِّثلة يف الطالب والقائمني
بالتقييم وعملية االختبار نفسها .ويف الوقت احلايل يتم استخدام نظم التقييم اآليل يف
تصحيح كثري من اختبارات القبول للجامعات املشهورة مثل اختبارات:
The Test of English as a Foreign Language (TOEFL), the Graduate
.(Record Examinations (GRE) and the Scholastic Assessment Test (SAT
تتعامل أنظمة التقييم اآليل ASاحلالية مع الطالب من خالل ثالث طرق:
الطريقة األوىل هي تقييم إجابات الطالب املكتوبة ،وتشمل تقييم وتصحيح
املقاالت النصية (ومنها موضوعات التعبري واإلنشاء) ،تصحيح اإلجابات القصرية.
و ُي َم ِّث ُل تصحيح املقاالت النصية حتدِّ ًيا أكرب من تصحيح اإلجابات القصرية ،حيث
يتطلب تقييم أسلوب الطالب يف الكتابة styleوحيتاج معاجلة لغوية عميقة.
الطريقة الثانية هي تقييم إجابات الطالب املنطوقة ،وتنقسم إىل نوعني:
-121-
النوع األول :وفيه ُيطلب من الطالب نطق مجلة مكتوبة ،ويتم تقييم طريقة ودقة
اآلخر :وفيه ي َّطلع الطالب عىل نص مكتوب ،ويطلب منه التعبري بصورة
النطق .والنوع َ
منطوقة عن مفهوم النص مستخدما قواعد النطق والقواعد النَّحوية الصحيحة لتكوين
اجلمل الصحيحة.
يطلق عىل النوع األول مصطلح «اإلجابات املنطوقة بفوىض منخفضة» (low
اآلخر مصطلح «اإلجابات املنطوقة
)entropy spoken responsesويطلق عىل النوع َ
بفوىض مرتفعة» (.)high entropy spoken responses
أما الطريقة الثالثة للتعامل مع الطالب فهي تصحيح املسائل الرياضية ،والتي
تتطلب من الطالب اإلجابة بمعادالت ونصوص وأرقام ورسومات بيانية.
ومع أن هدف أنظمة التقييم اآليل ASهو حتقيق عالقة توافق عالية بني الدرجات
التي يمنحها اإلنسان والدرجات التي متنحها اآللة ،فإنه من املهم أن نعرف أن تقييم
درجات إجابات الطالب ختتلف يف أسلوهبا عند تقييمها بواسطة اآللة عنها عند تقييمها
بواسطة اإلنسان .فبصفة عامة يوجد أسلوبني لتقييم درجات إجابات الطالب بطريقة
آلية .يعتمد األسلوب األول عىل حتديد درجة التطابق التام بني إجابة الطالب واإلجابة
اآلخر ال يفرتض وجود إجابات الصحيحة النموذجية املحفوظة يف النظام .األسلوب َ
نموذجية للمقارنة هبا ،ولكنه يعتمد عىل حتليل واستخراج سامت خمتلفة من إجابات
الطالب لتحديد نتيجة درجات التقييم اآليل بنا ًء عىل التعلم من نتائج التقييم اليدوي
التي متت سابقا عىل عينة من املقاالت.
هنتم يف هذا الفصل بنظم التقييم اآليل لألسئلة املقالية واألسئلة التي تتطلب إجابات
قصرية .أما بالنسبة ألنظمة تقويم األسئلة من نوعية تعدد اخليارات ،أو اختيار اإلجابة
من بني اختيارات اخلطأ والصواب ،أو التطابق ،أو ملء الفراغ؛ فهي سهلة التنفيذ
والتطبيق ولن نتعرض هلا.
أم َك َن اإلفادة من تقنيات التقييم اآليل لألسئلة املقالية يف بناء أنظمة للكشف عن
-122-
الرسقات األدبية ( )Plagiarism detectionحيث تنترش هذه الظاهرة -لألسف -
يف األوساط األكاديمية ،إذ عاد ًة ما تكون يف وثائق املقاالت أو التقارير .ومع ذلك،
يمكن وجود ظاهرة الرسقات األدبية يف أي جمال تقريبا ،بام يف ذلك األوراق العلمية،
والتصميامت الفنية ،وحتى يف برامج احلاسب.
يركز هذا الفصل عىل املنهجيات ونتائج التطبيقات بواسطة كربيات رشكات
التطوير يف جمال التقييم اآليل ASمثل :رشكة خدمة االختبارات الرتبوية ،ETSورشكة
معارف تكنولوجيا بريسون ،PKTورشكة فانتيج لرينينج.
Educational testing Service (ETS), Pearson Knowledge technologies
(PKT) and Vantage Learning.
ويشتمل الفصل عىل عدَّ ة حماور رئيسية :أنواع األسئلة املقالية ونظم تقييمها اآللية
( ،)AESنظم تقييم اإلجابة القصرية ،نظم تقييم الكالم (اإلجابات املنطوقة) ،نظم
تقييم أسئلة الرياضيات ،أنظمة الكشف عن الرسقات األدبية ،وأخريا ..موقف اللغة
املهم.
العربية من هذا املجال ّ
-1األسئلة املقالية وأنواعها
تنقسم األسئلة املقالية إىل أربعة أنواع رئيسية ،يعكس كل منها هد ًفا تعليم ًّيا خمتل ًفا:
-1أسئلة وصفية (:)Description
وتتطلب رسد النقاط الرئيسية يف املوضوع؛ وغالبا ما تبدأ باألفعال التالية:
حدِّ دِ ،صف ،خ ِّطط ،ارشح ،عَدِّ د ،اذكر ،خلص ،قدِّ م
Define, describe, outline, explain, list, delineate, trace, state,
summarize, present
-123-
-3أسئلة تقييم (:)Evaluation
وتتطلب إيضاح اخلط الفكري أو احلجة خلف املوضوع؛ وغالبا ما تبدأ باألفعال
التالية:
انقد ،ق ِّيمِّ ،برر ،ع ِّلق عىل
Criticize, evaluate, critically evaluate, justify, comment on, and interpret
-124-
مرحلة اإلعداد ،وتشمل جتهيز عينة من املقاالت التعبريية التي تم تصحيحها
وتقييمها سابقا بطريقة يدوية مع حتديد واستخراج السامت التي سيتم تدريب النظام
عليها من املقال .وتسمى هذه املجموعة :عينة أو فئة التدريب .يتم فحص عينة
التدريب هذه من قبل خرباء احلاسب (ويفضل التعاون مع اخلرباء يف املجال) لتحديد
واستخراج جمموعة من خصائص وسامت وأوزان تصف النص املقايل .ففي مرحلة
استخراج السامت والتدريب يتم تصحيح وتقييم جمموعة من مئات املقاالت التعبريية
بواسطة اخلرباء (القائمني بالتقييم) وإعطاء كل مقالة درجة من 10مثال ،وتستخدم
هذه السامت واألوزان إلنتاج نموذج رقمي للنص يمكن استخدامه للتنبؤ بدرجة
التقييم التي حيصل عليها املقال بواسطة اخلبري اإلنسان.
مرحلة بناء نموذج برنامج التصحيح والتدريب ،حيث يتم استخدام إحدى
املوجهة ()Support Vector Machine خوارزمات تعلم اآللة ،مثل خوارزم آلة الدعم َّ
أو اخلوارزمات اإلحصائية مثل خوارزم بايز ( )Bayes Algorithmبغرض تعلم
العالقة الكامنة بني السامت املستخرجة من املوضوع التعبريي وبني درجة التقييم التي
متت يدويا بواسطة اخلبري امل َق ِّيم للمقال .ويتم التحقق من صحة هذا النموذج الرقمي
من خالل مقارنة النتائج ا َّلتي يتم احلصول عليها يدويا من قبل امل َق ِّيمني اخلرباء ودرجة
التقييم املستنتجة من هذا النموذج ،ويتم تكرار هذه العملية حتى نتأكَّد من تطابق تقييم
احلاسب للمقال مع التقييم اليدوي بصورة ُمرضية.
وأخريا مرحلة االستخدام الفعيل للربنامج يف تصحيح مقاالت الطالب التعبريية
اجلديدة آليا .حيث يتم تغذية الربنامج بالسامت املستخلصة من املقال املوضوعي املراد
تقييمه آليا.
واآلن ،كيف يتم حتديد واختيار اخلصائص والسامت املعربة عن نمذجة املقال التعبريي؟
هناك طريقتان أو منهجيتان رئيستان إلنتاج نامذج التقييم اآليل ،AESإما باستخدام أساليب
«القوة احلاسوبية املحضة» ( )brute-forceأو باستخدام الوسائل املختلطة (اهلجني).
تستخدم املنهج َّية األوىل تشكيلة واسعة متنوعة من السامت واخلصائص اللغوية
للنص ،والتي ليس هلا عالقة مبارشة بكيفية الكتابة اجليدة ملقال ،مثل وجود أخطاء من
النحو اإلمالئي ،ووجود أخطاء التنقيط ،وهكذا.
-125-
بينام تكون النامذج القائمة عىل األساليب املهجنة ذات عالقة مبارشة مشتقة من
الناحية النظرية ملفهوم خصائص الكتابة اجليدة للمقال مثل مدى ارتباط تسلسل
الفقرات يف النص -وهو ما يطلق عليه مصطلح ( - )Lexical Chainingوأن الكلامت
املستخدمة هي املناسبة ،ومدى استخدام اجلمل املوجزة ،ومدى استخدام صيغ نائب
الفاعل يف املقال ،واستخدام صيغ املايض ،وهكذا.
وجدير بالذكر أن حتديد واستخراج سامت املقال املوضوعي املالئمة للتقييم هو
التحدي احلقيقي لنظم تقييم املقال.
-126-
كي» ()Intelligent Essay Assessor – IEA §نظام «مقيم املقالة َّ
الذ ّ
الذ ِك ّي IEAأصال يف جامعة كولورادو األمريكية يف عام لقد تم تطوير امل َق ِّيم َّ
،1997و ُي َس َّوق حاليا عن طريق رشكة (برسون نولدج تكنولوجي .)PKTهذا النظام
قادر عىل تقييم املقاالت بدرجة ثقة متاثل اخلربة البرشية املاهرة .
الذكي IEAالعديد من املزايا التي متيزه عن غريه من أنظمة تقييم
ّ يمتلك املقيم
درجات املقاالت ،حيث يوفر تقديرا كليا وتغذية عكسية عن األخطاء اإلمالئية
والنحوية .كام أنه حيتوي يف بنيته عىل كاشفات للمقاالت غري العادية ،مثل مهارات
القيادة العسكرية .وقد جرى استخدامه لرصد الدرجات والتقييم عىل مدى أكثر من
مليون مقالة ،ترتاوح بني مقاالت املدارس املتوسطة ومقاالت ُطالَّب كليات الطب،
ويف جماالت متنوعة املحتوى.
ميزة هذا النظام أنه يركز عىل تقييم حمتوى املقالة يف املقام األول ،ال عىل الرتكيب
الذكي IEAبتقييم
ّ البنائي هلا فقط كام هو احلال يف النظام السابق .ويقوم مقيم املقالة
ووضع الدرجات باستخدام أسلوب حتليل الدالالت الكامنة (Latent Semantic
،)Analysis- LSAوالذي ُي َم ِّثل طريقة حتليل داللة النص ا َّلتي يمكن تعريفها بأهنا
إحصائي من استخدام الكلمة ا َّلتي تسمح بمقارنات التشابه الدال ّيل بني قطع
ّ «نموذج
من املعلومات النصية ،حيث تنتج جمموعة من املفاهيم املرتبطة بمحتوى النص».
ويفرتض أسلوب LSAأن الكلامت القريبة يف املعنى غالبا ما تكون قريبة من بعضها
ُ
الذكـــي IEAطريقة التحليل الدال ّيل
ّ البعض يف داخل النص .ويدمـــج نظام التقييم
LSAجنــبا إىل جنـــب مـــــع قاعدة بيانات معلوماتية حتتوى عىل مادة الكتب
املدرسية وعينة مقاالت أو مصادر أخرى غنية يف الداللة لتدريب أجهزة احلاسب.
يؤدي هذا الدمج بني التحليل الداليل وقاعدة البيانات املعلوماتية إىل تقليل عدد
املقاالت التي تُستخدم يف تدريب النظام ،والتي يتم تصحيحها وتقويمها يدويا نظرا
ألن رصد الدرجات يتم إنجازه اعتامدا عىل التحليل الدال ّيل بدال من بناء النامذج
اإلحصائية التقليدية للمقال.
-127-
§نظام إنتليمرتيك ()Intellimetric
وهو نظام تم تطويره اعتبارا من 1997بواسطة رشكة تكنولوجيا التعلم (Vantage
.)Learning Technologyويعترب أول نظام لتقييم املقال آليا AESيستند عىل علوم
احلاسوب َّية؛ فهو جيمع بني أدوات معاجلة اللغات
ُ االصطناعي واللغويات
ّ الذكاء
الطبيعية ( )NLPوالتقنيات اإلحصائية يف رصد درجات املقال ،ويمكن اإلشارة إليه
كمحرك تعلم استوعب «احلكمة اجلمعية» ( )Pooled Wisdomأو «يستند عىل العقل»
خلرباء التقييم .يستخدم إنتليميرتك ( )Intellimetricالنموذج الذي حيتوى عىل أمثلة
جمموعة من معامالت التنبؤ واألوزان ا َّلتي تم تعريفها عن طريق استخراج أكثر من
400سمة من أجوبة الطالب ،باإلضافة إىل جمموعة سامت تدريبية تتكون من السامت
ذات الطبيعة الداللية والنحوية واخلطابية.
يأخذ نظام ( )IntelliMetricيف االعتبار مخسة أبعاد أساسية كامنة ،وذلك عند
تصحيح املقال ورصد الدرجات ،وهى :املحتوى ،واإلبداع ،واألسلوب ،وامليكانيكية،
والتنظيم .يستخدم ( )Intellimetricشبكات كلامت معجمية مبنية عىل اإلحصاء
يل الكامن (Latent
الداليل للمقالة .هذا اإلحصاء الداليل يامثل أسلوب التحليل الدال ّ
.)Semantic Analysis-LSAهذا التحليل الدال ّيل الكامن يمثل مخس فئات عامة
من السامت.
الفئة األوىل هتتم بالرتكيز عىل الوحدة والتامسك والتناسق يف الغرض واألفكار
الرئيسية يف املقالة.
الفئة الثانية ختتص بمدى اتساع نطاق املحتوى ودعم األفكار ،وتُعنى بمدى
االختيار السليم للمفردات واملفاهيم.
الفئة الثالثة هتتم بمدى تنظيم وهيكلة املقالة من حيث منطق اخلطاب ،بام يف ذلك
سيولة االنتقالية والعالقات بني أجزاء االستجابة.
الفئة الرابعة وختتص ببنية اجلملة والرتكيز عىل تعقيد اجلملة والتنوع ،مثل :التنوع
النحوي يف االستخدام ،ومدى التعقيد يف اجلمل املستخدمة .وأخريا..
-128-
الفئة اخلامسة تعكس آليات التحقق من التزام املقال بقواعد اللغة اإلنجليزية ،مثل:
قواعد النحو واإلمالء ،واحلروف الكبرية ،واكتامل اجلملة ،وعالمات الرتقيم ،وغريها.
حاليا يستخدم نظام ( )Intellimetricيف كثري من املدارس األمريكية واإلنجليزية
للصفوف السادسة والسابعة والثامنة ،وهو متاح لالستخدام للطالب عن طريق شبكة
اإلنرتنت.
http://www.vantagelearning.com/products/intellimetric/
demonstration/demonstration-american-english/
-129-
يطبق نظام ( )E-raterاملحدَّ ث جمموعة من السامت التي يستخلصها من املقال موزعة
إىل مخسة جماالت من التحليل؛ األول سامت خاصة باألخطاء النحوية وأخطاء االستخدام،
واألسلوب .Styleالثاين هو تنظيم املقال .الثالث هو تعقيد املعجم .الرابع هو مدى
االستخدام الصحيح للمفردات ،وأخريا طول املقال .يتضمن نظام التصنيف ()E-rater
سامت تصنيف أخرى تتعلق باملفردات ومدى مالئمة املحتوى ،والتنظيم ،والتطوير.
-130-
-2.2نتائج تطبيقات أنظمة التقييم اآليل AES
تقاس نتائج التقييم اآليل بمدى تطابقها مع التقييم اليدوي ،مع األخذ يف االعتبار
أنه نادرا يندر تطابق نتائج التقييم لشخصني خمتلفني.
ويمثل اجلدول التايل نتائج التطبيقات املحققة من حيث االختبار ،وحجم عينة
مقالة التقييم ،وارتباط اإلنسان باإلنسان وارتباط اإلنسان واحلاسب.
ارتباط اإلنسان ارتباط اإلنسان
النِّظام االختبار حجم العينة
واإلنسان واحلاسب
)PEG (1997 GRE 497 0.75 0.75 – 0.74
English place-
)PEG (2002
ment test
386 0.71 0.83
IntelliMetric k-12 norm-
)(2001 referenced test
102 0.84 0.82
يتضح من اجلدول السابق أن أنظمة التقييم اآليل للمقاالت التعبريية املكتوبة باللغة
اإلنجليزية قد بلغت درجة عالية من النضج؛ فنتائجها ختتلف مع نتائج التقييم اليدوية
بنفس القدر (تقريبا) الذي ختتلف فيه نتائج التقييم من شخص إىل شخص آخر.
-131-
-3تقييم اإلجابات القصرية.
إن نظم تصنيف درجات اإلجابة القصرية سهلة التنفيذ حيث أهنا هتدف إىل تقييم َّ
حمتوى املعارف واملهارات الطالب ،يف مقابل نظام درجات املقال ا َّلتي تقوم بتقييم
قدرة الطالب عىل الكتابة وتتطلب إمكانيات متطورة لتحليل النص وفهمه .نظم تقييم
اإلجابات القصرية تتطلب أن تكون إجابة الطالب قصرية عىل أن تبني مدى استيعابه
للمفاهيم الرئيسية يف جمال معني .ويقوم نظام التقييم اآليل بمقارنة إجابة الطالب مع
واحد أو أكثر من األجوبة الصحيحة املخزنة لديه .يف املايض القريب كانت معظم
أنظمة التقويم تتطلب جمهو ًدا إضاف ًّيا من املعلم حيث كان يتطلب منه إعداد أدلة
اإلجابات النموذجية بطريقة يدوية أو أن يوفر ُمدَ َّونة ُل َغ ِو َّية ُم َعنونة (Annotated
)Corpusلتحديد أنامط اإلجابة بطريقة نصف آلية.
تعترب منهجية قياس تشابه النص ( )Text similarity approachهي أساس عمل
نظم تقييم اإلجابات القصرية .ويوجد عدد كبري من خوارزمات التشابه بعضها يأخذ
يف االعتبار التحليل اللغوي العميق لكل من إجابة الطالب وإجابة املدرس والبعض
األخر يأخذ يف االعتبار العبارات القصرية املرشكة بني اإلجابتني.
يلعب التشابه الداليل بني كلمتني دورا كبريا يف الوصول إىل التشابه الداليل بني
مجلتني (غالبا ما يتم ذلك باستخدام تقنية املعلومات املتبادلة بني كلامت اجلملتني
.)pointwise mutual informationولكن كيف يمكن حساب التشابه الداليل بني
كلمتني (مثل الكلمتني شجرة ،نخلة أو كتاب وكراسة)؟
توجد طرق كثرية لذلك نذكر منها الطرق التالية:
Leacok & hodorow.
Lesk.
Wu& Palmer.
Resnik.
Lin.
Jiang & Conrath.
Hirst & St-Onge.
-132-
Corpus based Similarity combined with Explicit Semantic
Analysis (ESA).
Corpus based Similarity combined with Latent Semantic
Analysis (LSA).
فعىل سبيل املثال يقيس Leskالتشابه بني كلمتني عن طريق حساب نسبة التداخل
بني التعريف املناظر لكل كلمة عىل النحو املنصوص عليه من قبل القواميس الشهرية.
وأيضا حيدد ( )Wu& Palmerالتشابه بني كلمتني عن طريق قياس مدى التباعد بني
موقع الكلمتني يف شبكة الكلامت املعجمية للغة اإلنجليزية (.)WordNet
وفيام ييل نامذج من أنظمة درجات اإلجابات القصرية
-133-
-2.3نظام التقييم ()C-rater
باإلضافة إىل كون ( )C-raterيستخدم يف تقييم األسئلة املقالية ،إال أنه يستخدم
أيضا يف تصحيح األجوبة القصرية .وهو نظام وضع درجات آيل ،يستخدم التحليل
الرصيف واملرتادفات ،وهيكل اإلسناد والوسيط ومرجع الضمري لتقييم اإلجابات
القصرية املعتمدة عىل املحتوى.
تم تقييم كفاءة نظام التصنيف ( )C-raterمن خالل برناجمني للتقييم واسعة النطاق.
كان الربنامج األول هو مرشوع التقييم الوطني للتقدم التعليمي بالواليات املتحدة يف
الرياضيات ( .)National Assessment of Educational Progress- NAEPوقد
استُخدم نظام التصنيف ( )C-raterلتقييم إجابات الطالب اخلاصة بتفسري احللول
اخلاصة لبعض مسائل الرياضيات .حيث كان متوسط طول إجابات الطالب حوايل
1.2مجلة أو عدد 15كلمة.
اآلخر هو برنامج إدارة وتصحيح مقرر اإلنجليزية يف جامعة إنديانا الربنامج َ
األمريكية من خالل شبكة اإلنرتنت .يف هذه احلالة ،كان مطلوبا من برنامج ()C-rater
تقييم سبعة أسئلة لفهم املقروءات ،حيث اإلجابات عىل هذه األسئلة أكثر انفتاحا من
إجابات األسئلة املتعلقة بفهم احللول الرياضية .NAEP
تم اختيار وتقييم استجابات الطالب بني 245و 250عشوائيا من قبل اثنني من
املصححني البرش وبواسطة نظام التصنيف ،Cوكان معدل اتفاق النظام مع املصحح
البرشي األول ٪84.4بينام كان معدل االتفاق بني النظام واملصحح البرشي الثاين
.٪83.6وكان معدل االتفاق املتوسط بني االثنني من املصححني البرش .٪90.8
وهذا يعني أن أداء نظام التصنيف Cكان مشجعا يف حالة تقييم األسئلة املوضوعة
من قبل منظومة التقييم الوطني للتقدم التعليمي بالواليات املتحدة .NAEP
-134-
النص احلر .يستند وضع الدرجات فيه أساسا إىل حتليل املحتوى مع الوضع يف االعتبار
بعض سامت األسلوب ا َّلتي ينبغي النظر فيها .متر عملية وضع الدرجات من خالل
أربع مراحل.
أوال :تتم املعاجلة املسبقة إلجابة الطالب حتى تكون موحدة من حيث اإلمالء
وعالمات الرتقيم ،والتأكد من أن النظام يتسامح مع أخطاء اإلمالء والكتابة
وبناء اجلملة.
ثانيا :يقوم حملل اجلملة بالتعرف عىل املكونات النحوية الرئيسية للنص وكيفية
ارتباطها.
ثالثا :ويقوم جزء برجمية تطابق األنامط بالبحث عن التطابقات بني قوالب نظام
وضع الدرجات واملكونات النحوية املكونة لنص الطالب.
رابعا :ويف هناية املطاف تقوم وحدة «التعليق عىل إجابة الطالب» بمعاجلة نتيجة
تطابق اإلجابة مع النمط املخزن ،ويكون التعليق عىل إجابة الطالب يف صورة
الدرجة ا َّلتي حيصل عليها ،ومن املمكن أن تكون أكثر حتديدا.
تم اختبار التقييم اآليل ( )Automarkلتقييم املناهج الوطنية األمريكية للعلوم
لتالمذة يف عمر اإلحدى عرشة سنة (National Curriculum Assessment of
.)Science for eleven years old pupilsوكان شكل إجابات الطالب :كلمة
واحدة ،قيمة واحدة ،وصف اجلملة التفسريية القصرية ،أو وصف النمط املوجود
يف جمموعة من البيانات .وتراوحت عالقة االرتباط املتحققة بني ٪93و ٪96مقارنة
بالتصحيح اليدوي.
-135-
يتطلب برجمة إضافية لتحويل الكالم إىل كتابة .النقطة الثانية :عادة ما يكون اختبارات
الكالم لغري ناطقي اللغة األصلية (.)Non native speakers
تصنف مهام رصد درجات الكالم يف فئتني أساسيتني :مهام فوىض منخفضة ومهام
فوىض ُقصوى.
تقوم مهام الفوىض املنخفضة برصد درجات االستجابات ا َّلتي يمكن التنبؤ هبا إىل
حد كبري مثل:
القراءة الشفوية من فقرات مكتوبة.
طلب تكرار مجلة منطوقة مسجلة مسبقا عىل احلاسب.
طلب إجابة منطوقة ألسئلة حمددة اإلجابة (.)Factual Questions
طلب وصف صورة بسيطة.
يف املقابل فإن مهام الفوىض ال ُقصوى تقوم بالتعامل مع الكالم املتجدد -مقصو ًدا
كان أم ِ
عفو ًّيا. َ
وفيام ييل نامذج من أنظمة تقييم الكالم:
-136-
الطالقة يف احلديث ودقة النطق) ،وتسهيالت قواعد اللغة والقدرات رفيعة املستوى
املوضعي وتطور األفكار.
ّ التي تتعلق بالتامسك
يعالج حمرك مصنف الكالم ( )SpeechRater engineكل استجابة مع نظام التعرف
اآليل عىل الكالم املكيف خصوصا لالستخدام مع اإلنجليزية العامية .واستنادا إىل ُمرج
هذا النظام ،يتم استخدام معاجلة اللغات الطبيعية حلساب جمموعة من السامت التي متيز
«صورة» من الكالم بناء عىل عدد من األبعاد اللغوية ،بام يف ذلك الطالقة ،واستخدام
هنائي
ّ املفردات ،والنطق واللحن يف الكالم .تستخدم هذه من أجل تعيني درجة تقييم
إلجابة الطالب .بينام يتم تشييد بنية هذا النموذج من التقييم من قبل خرباء املحتوى،
فإنه أيضا يتم التدريب عىل قاعدة بيانات من نتائج تقييم إجابات سابقة بواسطة خرباء
يف املجال وذلك من أجل ضامن أن حيقق حمرك مصنف الكالم حماكاة عالية لتقييم
اإلنسان بقدر اإلمكان .عالوة عىل ذلك ،إذا اكتشف النظام عدم قدرته عيل تقييم إجابة
الطالب املنطوقة نتيجة ُمشكالت جودة الصوت أو أ َّية ُمشكالت أخرى ،فإن حمرك
تصنيف الكالم يمكنه وضعها جانبا للمعاجلة اخلاصة.
وتسعى رشكة ( )Educational Testing Service -ETSصاحبة نظام
SpeechRaterإىل تطوير العديد من خصائص املعاجلة الطبيعية للغة ( )NLPلتمثيل
التعبريات النحوية واكتشاف مالمح هيكل استجابة الردود املنطوقة .كام تسعى إىل
زيادة قدرة النظام لالستخدام عىل نطاق واسع من املستخدمة يف عمليات تقييم كفاءة
الكالم باللغة اإلنجليزية ،بام يف ذلك جمموعة من اخليارات املقيدة جد ًا (مثل قراءة
فقرات مكتوبة بصوت عال) ،مرورا بالبنود األقل تقييدا (مثل مهام تلخيص وقراءة
نص مكتوب) ،إىل اخليارات املفتوحة بشكل كامل.
-137-
واملدارس يف القياس الدقيق والرسيع ملهارات التحدث باإلنجليزية ،أو باإلسبانية،
أو بالعربية يف أكثر من 100دولة حول أنحاء العامل من أجل أغراض االختبارات
والتدريب.
يقوم نظام اختبار فرسانت ( )Versantآليا بتقييم ردود االستجابات للعديد من
املهام املختلفة .تتضمن اختبارات نظام فرسانت :القراءة بصوت عال ،وتكرار اجلمل،
وبناء اجلمل ،وإعطاء األجوبة عىل أسئلة قصرية ،رواية قصص قصرية ،واختيار
االستجابة ،واملحادثة ،وطريقة القراءة والفهم .يف اختبار الكتابة هلذا التطبيق فإن بند
املهام يتضمن :الكتابة ،وإكامل اجلمل ،واإلمالء ،وإعادة البناء ،وكتابة رسائل الربيد
اإللكرتوين .بالنسبة لبعض املهام ،مثل القراءة والتكرار فهناك سلسلة واحدة من تتابع
الكلامت هي بالضبط الصحيحة املتوقعة لكل استجابة .يف مهام أخرى ،يمكن أن تكون
العنارص متعددة األجوبة الصحيحة .متر كافة عنارص االختبار بإجراء اختبار مسبق
عايل الكثافة عىل عينات خمتلفة متنوعة من الناطقني وغري الناطقني باللغة يف طائفة
واسعة النطاق من جمال مستوى القدرة.
-138-
جرى تقييم قدرة النظام عىل الكشف عن أخطاء النطق ( )mispronunciationيف
قاعدة بيانات صوتية من 130ألف هاتف جلمل حديث متصل قاهلا 206شخص من
غري الناطقني باللغة األم وتم حتويلها إىل نصوص مكتوبة .أظهرت النتائج أن نسبة اخلطأ
أعىل قليال من اخلطإ البرشي.
-139-
-1.5نظم تقييم الرياضيات ()m-rater
نظام حمرك مصنف درجات الرياضيات من رشكة ( )ETS’s m-raterوهو حمرك
يستعمل يف رصد الدرجات لالستجابات الرياضية مفتوحة النهاية ،مثل تلك التي تأخذ
شكل تعبريات أو معادالت رياضية ،أو رسوم بيانية .منذ أواخر تسعين َّيات القرن العرشين
.1990
-140-
مؤرشا
ً النصوص املكتشفة ،فإذا كانت نسبة التشابه أعىل من قيمة معينة فيعترب ذلك
قو ًّيا عىل وجود رسقة أدبية.
و الرسقات األدبية تنقسم إىل األنواع التالية:
-1نسخ ولصق (.)Copy and Paste Plagiarism
-2االحتيال املتنكر (.)Disguised Plagiarism
-3االحتيال عن طريق إعادة الصياغة (.)Paraphrase Plagiarism
-4االحتيال عن طريق الرتمجة (.)Translation Plagiarism
-5رسقة األفكار (.)Idea Plagiarism
تتجه البحوث حاليا إىل الكشف عن الرسقات األدبية عن طريق الرتمجة ،وهو ما
يطلق عليه (.)Cross Lingual Plagiarism Detection -CLPD
وفيام ييل قائمة ببعض األنظمة املستخدمة للكشف عن الرسقات األدبية:
أنظمة متاحة للجمهور أنظمة جتارية
Chimpsky Attributor
CitePlag Copyscape
CopyTracker Iparadigms: Ithenticate, Turnitin
eTBLAST Plagiarismdetect
Plagium PlagScan
SeeSources Urkund
The Plagiarism Checker Veriguide
-141-
ولكن هذا ال يمنع من البدء يف بناء أنظمة تقييم األجوبة القصرية وهي ال تتطلب
العمق التحلييل اللغوي كام هو احلال بالنسبة لألسئلة املقالية .ولكنها تتطلب وجود ما
هو مماثل لشبكة الكلامت للغة اإلنجليزية ( )WordNetوشبكة الكلامت الداللية للغة
اإلنجليزية (.)SentiWordNet
-8اخلالصة
تتنوع جماالت التَّصحيح اآل ّيل لالمتحانات .وقد تم تقديم خمتلف النظم اآللية يف
هذا الفصل يف مجيع جماالت التقييم ورصد الدرجاتَّ .
إن دقة النظم هي عالقة ارتباط
بني رصد الدرجات برشيا ورصد الدرجات بواسطة النظام .أصبحت نظم رصد
البرشي ورصد الدرجات
ّ الدرجات آليا واقعا ،وطاملا هناك فرق بني رصد درجات
اآليل فإن موضوع الدقة هي نقطة جيدة للبحث.
تم تعريب أدوات ونظم وتطبيقات وحزم الربجميات اجلاهزة من خالل تزويدها
باحلروف املطبعية ( )Fontsاخلاصة باللغة العربية والقدرة عىل تداول احلروف العربية جنبا
إىل جنب مع احلروف الالتينية مع األخذ يف االعتبار خصائص كتابة اللغة العربية من حيث
(أ) اجتاه الكتابة (من اليمني إىل اليسار)( ،ب) ومن تغري شكل احلروف طبقا ملوقعه يف
الكلمة( ،ج) ومن حيث ترتيب شفرة احلروف (يأيت حرف السني قبل حرف الشني مثال).
يف نظام تشغيل احلاسب -مثل :نظام ويندوز ميكروسوفت ُ -ي َو ِّفر نظام التشغيل
اخلصائص السابقة ملعظم الربجميات والتطبيقات ا َّلتي تعمل حتت مظلته ،إال أن
التطبيقات احلديثة ،مثل :إدارة املعرفة ،آالت البحث الذكية ،حتويل النصوص املكتوبة
إىل نصوص منطوقة ،وتصحيح درجات الطالب ..ال تكتفي بالتعامل مع النصوص
عىل مستوى احلرف والكلمة لكنها تتعامل مع اجلملة شكال ومعنى.
ال يصلح مع التطبيقات احلديثة أسلوب التعريب عىل مستوى احلرف للتعامل مع
حيث يستدعي تعريب هذه التطبيقات أخذ شكل ومعنى اللغة األم وهى اللغة العربيةُ ،
الكلمة واجلملة العربية يف االعتبار ،كام أن االكتفاء باملعاجلة عىل مستوى احلرف غري
كاف يف التطبيقات الذكية واملستقبلية ،وهناك قصور شديد يف تعريب هذه التطبيقات
جيب تداركه يف املستقبل القريب بقدر اجلهد واالستطاعة.
-142-
ببليوجرافيا مرجع َّية
1. Bennett, R. E. (2011). Automated Scoring of Constructed-Response
Literacy and Mathematics Items, White Paper, Publisher: Arabella
Philanthropic Advisors.
2. Bernstein, J.; Suzuki, M.; Cheng, J.; Pado, U. (2009). Evaluating
diglossic aspects of an automated test of spoken modern standard
Arabic. ISCA International Workshop on Speech and Language
Technology in Education (SLaTE 2009).
3. Bernstein, J.; van Moere, A.; Cheng, J. (2010). Validating automat-
ed speaking tests. Language Testing.
4. Blokdyk, G. (2018). Text Mining Complete Self-Assessment Guide.
Emereo Pty Limited.
5. Burstein, J.; Chodorow, M. (2010). Progress and new directions in
technology for automated essay evaluation. In R. Kaplan (Ed.). The
Oxford Handbook of Applied Linguistics (2nd Ed., pp. 487–497).
New York: Oxford University Press.
6. Chen, L.; Tetreault, J.; Xi, X. (2010). Towards Using Structural
Events to Assess Non-Native Speech, NAACL-HLT 2010: Pro-
ceedings of the 5th Workshop on Building Educational Applications
(BEA-5) Association for Computational Linguistics.
7. Dikli, S. (2006). An Overview of Automated Scoring of Essays, The
Journal of Technology, Learning, and Assessment, Volume 5, Num-
ber 1.
8. Feldman, R.; Sanger, J. (2006): The Text Mining Handbook: Ad-
vanced Approaches in Analyzing Unstructured Data. Cambridge
University Press.
9. Franco, H.; Bratt, H.; Rossier, R.; Gadde, V. R.; Shriberg, E.; Abrash,
V.; Precoda, K. (2010). “EduSpeak: a speech recognition and pro-
nunciation scoring toolkit for computer-aided language learning ap-
plications,” Language Testing, vol. 27, no. 3, p. 401.
-143-
10. Gomaa, W.; Fahmy, A. (2013): A Survey of Text Similarity Approach-
es. International Journal of Computer Applications 68(13):13-18.
11. Gomma, W.; Fahmy, A. (2011). Tapping Into the Power of Auto-
mated Essay Scoring, 11th Conference on Language Engineering,
ESOLE.
12. Gomma, W.; Fahmy, A. (2014). Arabic Short Answer Scoring with
Ef-fective Feedback for Students. International Journal of Comput-
er Ap-plications 86 (2):13-18.
13. Hui, E. (2018). Learn R for Applied Statistics: With Data Visualiza-
tions, Regressions, and Statistics. Apress.
14. Jo, T. (2018). Text Mining: Concepts, Implementation, and Big Data
Challenge. Springer.
15. Kim, J. (2019). Genome Data Analysis. Springer Singapore.
16. Konchady, M. (2006). Text Mining Application Programming
(Pro-gramming Series). Charles River Media.
17. Mohler, M.; Mihalcea, R. (2009). Text-to-text Semantic Similari-
ty for Automatic Short Answer Grading, EACL ‘09 Proceedings of
the 12th Conference of the European Chapter of the Association for
Computational Linguistics
18. Shermis, M. D.; Burstein, J.; Higgins, D.; Zechner, K. (2009). Au-
tomated Essay Scoring: Writing Assessment and Instruction (2010
Elsevier Ltd).
19. Stein, B.; Sven, M.; Potthast, M. (2007). “Strategies for Retriev-
ing Plagiarized Documents”, Proceedings 30th Annual International
ACM SIGIR Conference, ACM.
20. Warschauer, M., & Ware, P. (2006). Automated writing evaluation:
Defining the classroom research agenda. Language Teaching Re-
search, 10(2), 157–180.
21. Zechner, K.; Higgins, D.; Xi, X.; Williamson, D. (2009). Automat-
ic Scoring of Non-Native Spontaneous Speech in Tests of Spoken
-144-
English, Speech Communication, Educational Testing Service, Au-
tomated Scoring and NLP, Rosedale Road, MS 11-R, Princeton, NJ
08541, USA 2009 , Vol. 51, No. 10, pp. 883–895.
22. Zizka, J.; Darena, F.; Svoboda, A. (2019). Text Mining with Ma-
chine Learning. Taylor & Francis Group.
-145-
-146-
الباحثون
-147-
-148-
الرازق عيل رشوان ِ
الدكتورُ /مسن عبد َّ
أستاذ بقسم اإللكرتونيات واالتصاالت ٍ يشغل منصب
ختر َج عام 1977الكهربائية يف ُك ِّل َّية اهلندسة -جامعة القاهرةَّ .
وحصل عىل ثالتة ماجستريات ،ثم َ وكان األول عىل دفعته،
عىل الدُّ كتوراه من جامعة كوين بكندا؛ أرشف عىل أكثر من مائة
املتخ ِّصصة الشكة اهلندسية لتطوير النُّ ُظم الر ِ
قم َّية َ RDI رسالة ماجستري ودكتوراه .يدير َّ
َّ َّ
يف جمال تقنيات ال ُّلغة العرب َّية.
-149-
ِ
القاهرة ،وخم ِّط ًطا للربجميات برشكة «لوكسور تكنولوجي» الكندية ( ُأوكْف ْيلُ /أون ْ
ْتار ُيو)
وخبريا للغويات احلاسوبية والربجميات ملرشوع «معجم الدوحة ً منذ 2009م إىل اآلن،
التارخيي» بني عا َم ْي 2014م و 2016م.
-150-
الدكتور /عيل عيل فهمي
السابق ل ُك ِّل َّية احلاسبات واملعلومات يف جامعة ِ
هو ال َعميدُ َّ
االصطناعي
ّ القاهرة؛ يعمل -يف الوقت احلا ّيل -أستا ًذا يف َّ
الذكاء
ديرا ملركز
عمل خالل الفرتة من 2005إىل ُ 2010م ً وتعلم اآللةَ .
ونمذجة ال ُّلغة DMCMيف ِمرص، َ التميز يف التَّنقيب يف البيانات
ِ
إسهامات بحث َّي ٌة بارز ٌة يف تقنيات ال ُّلغة ال َع َربِ َّية وتطبيقاتا.
ٌ وله
-151-
مباحث لغوية ٥٨
ٌ
تطبيقــــات أساس َّيــة فــــي
المعا َلجة اآلل َّية ل ُّلغة العرب َّية
ُ
يُصدِ ر مركز امللك عبداهلل بن عبدالعزيز الدولي خلدمة اللغة العربية هذا الكتاب ضمن سلسلة
(مباحث لغوية) ،وذلك وفق خطة عمل مقسمة إلى مراحل ،ملوضوعات علمية رأى املركز حاجة املكتبة
اللغوية العربية إليها ،أو إلى بدء النشاط البحثي فيها ،واجتهد يف استكتاب نخبة من احملررين واملؤلفني
للنهوض بعنوانات هذه السلسلة على أكمل وجه.
ويهدف املركز من وراء ذلك إلى تنشيط العمل يف املجاالت التي تُـنَـ ّبه إليها هذه السلسلة ،سواء أكان
العمل علميا بحثيا ،أم عمليا تنفيذيا ،ويدعو املركز الباحثني كافة من أنحاء العالم إلى املساهمة يف هذه
السلسلة.
وجهد ُمح ِّر َري الكتاب ،على ما تفضلوا به من رؤى
وتو ّد األمانة العامة أن تشيد بجهد السادة املؤلفنيُ ،
وأفكار خلدمة العربية يف هذا السياق البحثي.
والشكر والتقدير الوافر ملعالي وزير التعليم املشرف العام على املركز ،الذي يحث على كل ما من
شأنه تثبيت الهوية اللغوية العربية ،ومتتينها ،وفق رؤية استشرافية محققة لتوجيهات قيادتنا احلكيمة.
موجهة إلى جميع املختصني واملهتمني للتواصل مع املركز؛ لبناء املشروعات العلمية ،وتكثيف
والدعوة ّ
اجلهود ،والتكامل نحو متكني لغتنا العربية ،وحتقيق وجودها السامي يف مجاالت احلياة.