You are on page 1of 194

‫الموارد ال ُّلغو َّية الحاسوب َّية‬

‫مباحث لغوية ‪٥٦‬‬

‫تحرير‬

‫السعيــد‬
‫عتز بالله َّ‬
‫الـم ّ‬
‫د‪ُ .‬‬ ‫د‪ُ .‬محســـــــــــن َرشـــــــــــوان‬

‫الباحثون‪:‬‬
‫السعيــــــد‬
‫عــــــتز بالله َّ‬
‫ّ‬ ‫الـم‬
‫د‪ُ .‬‬ ‫هــــواري‬
‫َّ‬ ‫د‪ .‬عبـــد العــــاطي‬
‫د‪ُ .‬محســــــــــــــــــــن َرشـــــــــــــوان‬ ‫د‪ .‬ســامِ ــــح األنصــــــــــــــــــــــاري‬
‫مباحث لغوية ‪٥٦‬‬

‫الموارد ال ُّلغو َّية الحاسوب َّية‬

‫حترير‬
‫السعيــد‬
‫الـمعت ّز باهلل َّ‬
‫د‪ُ .‬‬ ‫د‪ُ .‬مســـن َرشـــــوان‬

‫الباحثون‪:‬‬
‫السعيـــد‬
‫الـمعت ّز باهلل َّ‬
‫د‪ُ .‬‬ ‫هواري‬
‫د‪ .‬عبد العــاطي َّ‬
‫د‪ُ .‬مســـن َرشــــــوان‬ ‫د‪ِ .‬‬
‫سامح األنصـــــاري‬

‫‪١٤41‬هـ ‪٢٠١٩ -‬م‬


‫الموارد اللُّغو َّية الحاسوب َّية‬
‫الطبعة األوىل‬
‫‪ 1441‬هـ ‪ ٢٠١٩ -‬م‬
‫مجيع احلقوق حمفوظة‬
‫اململكة العربية السعودية ‪ -‬الرياض‬
‫ص‪.‬ب ‪ 12500‬الرياض ‪11473‬‬
‫هاتف‪00966112581082 - 00966112587268:‬‬
‫الربيد اإلليكرتوين‪nashr@kaica.org.sa :‬‬

‫مركز امللك عبداهلل بن عبدالعزيز الدويل خلدمة اللغة‬


‫العربية‪1٤٤1 ،‬هـ‪.‬‬
‫فهرسة مكتبة امللك فهد الوطنية أثناء النرش‬
‫رشوان‪ ،‬حمسن‬
‫التصميم واإلخراج‬ ‫املوارد اللغوية احلاسوبية‪ /.‬حمسن رشوان؛ املعتز باهلل السعيد‬
‫‪-.‬الرياض‪1٤٤٠ ،‬هـ‬
‫‪..‬ص؛ ‪ ..‬سم‬
‫ردمك‪978- 603- 8221- ٥٤- ٩ :‬‬
‫‪ - 1‬اللغة العربية ‪ -‬معاجلة البيانات أ‪ .‬السعيد ‪ ،‬املعتز باهلل‬
‫(مؤلف مشارك) ب‪ .‬العنوان‬
‫ديوي ‪١٤٤٠/١٠١٦٩ ٤١٠,٢٨٥‬‬
‫رقم اإليداع‪١٤٤٠/١٠١٦٩ :‬‬
‫ردمك‪978- 603- 8221- ٥٤- ٩ :‬‬

‫اليسمح بإعادة إصدار هذا الكتاب‪ ،‬أو نقله يف أي شكل أو وسيلة‪،‬‬


‫سواء أكان إلكرتونية أم يدوية أم ميكانيكية‪ ،‬بام يف ذلك مجيع أنواع تصوير املستندات بالنسخ‪ ،‬أو‬
‫التسجيل أو التخزين‪ ،‬أو أنظمة االسرتجاع‪ ،‬دون إذن خطي من املركز بذلك‪.‬‬
-4-
‫الصفحة‬ ‫املوضوع‬
‫‪7‬‬ ‫كلمة املركز‬
‫‪9‬‬ ‫مقدمة‬
‫‪11‬‬ ‫احلاسوب َّية‬
‫ُ‬ ‫املعج ِم َّية ال َع َربِ َّية‬ ‫ِ‬
‫املوارد َ‬ ‫الفصل األول ‪:‬‬
‫‪13‬‬ ‫احلاسوب َّية‬
‫ُ‬ ‫املعج ِم َّية ال َع َربِ َّية‬ ‫ِ‬
‫املوارد َ‬ ‫‪ -1‬مدخل إىل‬
‫‪13‬‬ ‫املعج ِم َّية احلاسوبية‬ ‫ِ‬
‫باملوارد َ‬ ‫‪ -2‬يف التعريف‬
‫‪22‬‬ ‫املعج ِم َّية ومعاجلة اللغات الطبيعية‬ ‫ِ‬
‫املوارد َ‬ ‫‪-3‬‬
‫‪26‬‬ ‫‪ -4‬الصناعة املعجمية احلاسوبية‬
‫‪37‬‬ ‫املعج ِم َّية العربية احلاسوبية‬ ‫املوارد َ‬‫ِ‬ ‫‪-5‬‬
‫‪42‬‬ ‫‪ -6‬األفكار البحثية املقرتحة يف إطار العمل املعجمي احلاسويب العريب‬
‫‪51‬‬ ‫الفصل ال َّثاين‪ :‬املدَ َّونات ال ُّلغ َِو َّية‬
‫‪53‬‬ ‫‪ -1‬يف مفهوم ا ُملدَ َّونات ال ُّل َغ ِو َّية‬
‫‪55‬‬ ‫‪ -2‬إرهاصات املنهج‪ ،‬وت َط ُّور دراسة املدَ َّونات ال ُّل َغ ِو َّية‬
‫‪58‬‬ ‫‪ -3‬ا ُملدَ َّونات ال ُّل َغ ِو َّية العرب َّية‬
‫‪61‬‬ ‫‪ -4‬أنواع ا ُملدَ َّونات ال ُّل َغ ِو َّية‬
‫‪66‬‬ ‫‪ -5‬عنونة‪/‬تذييل املدَ َّونات ال ُّل َغ ِو َّية‬

‫‪-5-‬‬
‫‪74‬‬ ‫‪ -6‬ا ُملدَ َّونات ال ُّل َغ ِو َّية وآل َّية فهرسة الن ُُّصوص‬
‫‪77‬‬ ‫‪ -7‬جماالت اإلفادة من املدَ َّونات ال ُّل َغ ِو َّية‬
‫‪83‬‬ ‫وحات علم َّي ٍة ُمستَقبل َّية‬ ‫ٍ‬ ‫ألطر‬
‫أفكار بحث َّية ُ‬
‫ٌ‬ ‫‪-8‬‬
‫‪88‬‬ ‫‪ِ -9‬من املواقع اإللكرتون َّية التَّعليم َّية واإلرشاد َّية‬
‫‪93‬‬ ‫الفصل ال َّثالث‪َّ :‬‬
‫الشبكات الدِّ الل َّية‬
‫‪95‬‬ ‫‪ -1‬التحليل الداليل للجملة‪ :‬ملحة تارخيية‬
‫‪97‬‬ ‫‪ -2‬لغة الشبكات الداللية احلاسوبية العاملية‬
‫‪99‬‬ ‫‪ -3‬املكونات اللغوية للغة الشبكات الداللية احلاسوبية العاملية‬
‫‪106‬‬ ‫‪ -4‬موارد وأدوات لغة الشبكات الداللية احلاسوبية العاملية‬
‫‪ -5‬تطبيقات املعاجلة اآللية للداللة باستخدام لغة الشبكات الداللية‬
‫‪124‬‬
‫احلاسوبية العاملية‬
‫‪128‬‬ ‫‪ -6‬دعوة للمشاركة‬
‫‪135‬‬ ‫الفصل الرابع‪ :‬موارد التَّع ُّلم اآليل (مدخل إىل التَّع ُّلم ّ‬
‫اآليل)‬
‫‪137‬‬ ‫‪ -1‬شجرة القرار‬
‫‪138‬‬ ‫‪ -2‬مصنِّف بايز املبسط‬
‫‪140‬‬ ‫‪ -3‬الشبكات العصبية‬
‫‪145‬‬ ‫‪ -4‬آل َّيات املتجهات الداعمة (‪)Support Vector Machines -SVM‬‬
‫‪148‬‬ ‫‪ -5‬نامذج ماركوف ا ُمل َ‬
‫خ َّبأة (‪)Hidden Markov Models - HMMs‬‬
‫‪165‬‬ ‫الفصل اخلامس‪َ :‬‬
‫نمذجة ال ُّلغـة‬
‫‪168‬‬ ‫العددي (‪)N-gram‬‬
‫ّ‬ ‫‪ -1‬النحو‬
‫‪175‬‬ ‫‪ -2‬التنعيم (‪)Smoothing‬‬
‫‪182‬‬ ‫العددي‬
‫ّ‬ ‫‪ -3‬موضوعات تساعد عىل حتسني النَّحو‬
‫‪183‬‬ ‫‪ -4‬تقويم قوة النَّحو ال َعدَ ِد ّي‬
‫‪185‬‬ ‫‪ -5‬أمثلة عىل جماالت اإلفادة من النَّحو ال َعدَ ِد ّي‬
‫‪185‬‬ ‫وحات علم َّي ٍة ُمستَقبل َّية‬
‫ٍ‬ ‫ألطر‬
‫أفكار بحث َّية ُ‬
‫ٌ‬ ‫‪-6‬‬
‫‪189‬‬ ‫الباحثون‬

‫‪-6-‬‬
‫كلمة املركز‬

‫يعمل املركز يف جمال البحث العلمي ونرش الكتب مستهدف ًا الرتكيز عىل املجاالت‬
‫البحثية التي ما زالت بحاجة إىل تسليط الضوء عليها‪ ،‬وتكثيف البحث فيها‪ ،‬ولفت أنظار‬
‫الباحثني واجلهات األكاديمية إىل أمهية استثامرها بمختلف وجوه االستثامر‪ ،‬وذلك مثل‬
‫جمال (التخطيط اللغوي) و (العربية يف العامل) و(األدلة واملعلومات) و (تعليم العربية‬
‫ألبنائها أو لغري الناطقني هبا) إىل غري ذلك من املجاالت‪ ،‬وإن من أهم جماالت البحث‬
‫املستقبلية يف اللغة العربية جمال (العربية واحلوسبة ‪ ،‬والذكاء االصطناعي) حيث إن‬
‫حياة اللغات ومستقبلها مرهونة بمدى جتاوهبا مع التطورات التقنية والعامل االفرتايض‪،‬‬
‫وكثافة املحتوى االلكرتوين املكتوب‪ ،‬وهو ما يشكّل حتديا حقيقيا أمام اللغات غري‬
‫املنتجة للمعرفة أو للتقنية‪.‬‬
‫وقد عمل املركز عىل تسليط الضوء عىل هذا املجال التخصيص؛ مستعينا بالكفاءات‬
‫القادرة من املهتمني بالتخصص البيني (بني اللغة واحلاسوب) مقدّ را جهودهم‪ ،‬وهادف ًا‬
‫إىل نرشها‪ ،‬وتعميم مبادئها‪ ،‬راغب ًا أن يكون هذا املسار العلمي مقررا يف اجلامعات يف‬
‫كلية العربية واحلاسوب‪ ،‬وجماال بحثيا يقصده الباحثون األكديميون‪ ،‬واجلهات البحثية‬
‫العربية‪.‬‬

‫‪-7-‬‬
‫وقد أصدر املركز سابقا ستة عرش كتاب ًا خمتصا يف (حوسبة العربية) ويف اإلفادة من‬
‫(املدونات اللغوية) يف األبحاث العربية‪ ،‬وحيتفل بإصدار سبعة كتب جديدة خمتصة يف‬
‫(حوسبة العربية والذكاء االصطناعي) ‪ ،‬ويقدمها للقارئ العريب‪ ،‬وللجهات األكاديمية؛‬
‫لإلفادة منها يف مناهج التعليم والبناء عليه‪ ،‬وهذه الكتب السبعة هي‪( :‬العرب َّية َّ‬
‫والذكاء‬
‫االصطناعي‪ ،‬تطبيقات الذكاء االصطناعي يف خدمة اللغة العربية‪ ،‬خوارزميات الذكاء‬
‫ّ‬
‫االصطناعي يف حتليل النص العريب‪ ،‬مقدمة يف حوسبة اللغة العربية‪ ،‬املوارد اللغوية‬
‫احلاسوبية‪ ،‬املعاجلة اآللية للنصوص العربية‪ ،‬تطبيقات أساسية يف املعاجلة اآللية للغة‬
‫العربية)‪.‬‬
‫ويشكر املركز السادة مؤلفي الكتب‪ ،‬وحمررهيا‪ ،‬ملا تفضلوا به من عمل علمي‬
‫رصني‪ ،‬وأدعو الباحثني واملؤلفني إىل التواصل مع املركز الستكامل املسرية‪ ،‬وتفتيق‬
‫فضاءات املعرفة‪.‬‬
‫وفق اهلل اجلهود وسدد الرؤى‪.‬‬

‫األمني العام‬
‫أ‪ .‬د‪ .‬حممود إسامعيل صالح‬

‫‪-8-‬‬
‫مقدمة‬

‫عالة االل َّية ل ُّلغات‬ ‫ُت َعدُّ املوار ُد ال ُّلغو َّي ُة ركيز ًة أساس َّية لبناء وتطوير أدوات ُ‬
‫الـم َ‬
‫ِ‬
‫ستوياتا‬ ‫حيث ُت ِّث ُل ضاب ًطا معيار ًّيا ُيمك ُن االسرتشا ُد به يف وصف واقع ال ُّلغة ُ‬
‫بم‬ ‫ال َّطبيع َّية؛ ُ‬
‫ُعالة اآلل َّية ل ُّلغات‪.‬‬
‫أيضا وسيل ٌة لتقويم أدوات املـ َ‬ ‫الزمان واملكان؛ وهي ً‬ ‫رب َّ‬‫الـمتعدِّ دة ع َ‬
‫ُ‬
‫ِ‬
‫الـمعجم َّية وتطوير أدوات تعليم‬ ‫الصناعة ُ‬ ‫توظيف املوارد ال ُّلغو َّي َة يف ِّ‬
‫َ‬ ‫ذلك َّ‬
‫أن‬ ‫أضف إىل َ‬
‫بني ال ُّلغة املوصوفة و ُمستعمليها؛ كام م َّك َن‬ ‫ٍ‬ ‫ٍ‬
‫الـموائمة َ‬ ‫ال ُّلغة قد ساعدَ بصورة كبرية يف ُ‬
‫الوقوف عىل إشكاالت ال ُّلغات ال َّطبيع َّية والتَّفكري يف الوسائل‬ ‫ستعملني من ُ‬
‫َ‬ ‫الـم‬
‫هؤالء ُ‬
‫عالتِها‪.‬‬
‫لـم َ‬‫النَّاجعة ُ‬
‫ٍ‬
‫سلسلة من ال ُكتُب ا َّلتي‬ ‫يب كتاب (املوارد ال ُّلغو َّية احلاسوب َّية) ِضم َن‬ ‫إنَّنا نُقدِّ ُم للقارئ العر ّ‬
‫ٍ‬
‫داعمة‬ ‫بمصادر‬ ‫السلسل ُة يف إثراء املكتبة العرب َّية‬ ‫بحوسبة ال ُّلغة‪،‬‬
‫َ‬ ‫ُسهم هذه ِّ‬ ‫آملني أن ت َ‬‫َ‬ ‫َ‬ ‫تُعنى‬
‫وموج ٍ‬
‫والصناعة والتَّدريس‪ ،‬وأن‬ ‫عالة ال ُّلغات ال َّطبيع َّية يف ميادين البحث ِّ‬ ‫بم َ‬
‫ني ُ‬‫هة للمعن ِّي َ‬ ‫ُ ِّ‬
‫الر ْحب‪.‬‬ ‫العلمي َّ‬
‫ّ‬ ‫لسالسل أخرى يف ذلك احلقل‬ ‫َ‬ ‫السلسلة باكُور ًة‬ ‫تكون هذه ِّ‬‫َ‬

‫احلاسوب َّية‬
‫ُ‬ ‫يب إىل املوارد ال ُّلغو َّية‬
‫اهلدف من هذا الكتاب توجي َه القارئ العر ّ‬‫ُ‬ ‫وملا َ‬
‫كان‬
‫ا َّلتي ُت ِّكنُ ُه من استيعاب منطق اآللة يف التَّعاطي مع البيانات ال ُّلغو َّية كبرية احلجم نسب ًّيا‪،‬‬
‫الـمعاجلة اآلل َّية ل ُّلغة ال َّطبيع َّية‪ ،‬فقد‬
‫اللزمة لبناء وتطوير أدوات ُ‬ ‫والوقوف عىل املوارد َّ‬
‫ُ‬
‫ٍ‬
‫جا َء يف مخسة ُف ُصول‪ ،‬عىل النَّحو اآليت‪:‬‬

‫‪-9-‬‬
‫احلاسوبِ َّية؛ ُيعنى بالتَّعريف هبذه املوارد‬ ‫ُ‬ ‫املوارد املعجم َّية العرب َّية‬ ‫ِ‬ ‫األول‪:‬‬
‫Ÿ Ÿالفصل َّ‬
‫كذلك ُرؤي ًة منهج َّي ًة‬
‫َ‬ ‫الـمحتوى‪ .‬و ُيقدِّ ُم‬ ‫الشكل وطبيعة ُ‬ ‫حيث َّ‬ ‫ُ‬ ‫وتصنيفها من‬
‫الـمعجم َّية احلاسوب َّية‪ ،‬ال س َّيام املوارد العرب َّية‪ ،‬يف‬ ‫آلل َّيات اإلفادة من املوارد ُ‬
‫يب‪.‬‬‫الـمعجم العر ّ‬ ‫ُمعاجلة ال ُّلغات ال َّطبيع َّية وتطوير صناعة ُ‬
‫دونات ال ُّلغو َّية‬‫الـم َّ‬
‫الفصل ملفهوم ُ‬ ‫ُ‬ ‫عر ُض هذا‬ ‫Ÿ Ÿالفصل الثاين‪ :‬املدَ َّونات ال ُّل َغ ِو َّية؛ و َي ِ‬
‫ُ‬
‫تشمل‬ ‫عالتِها آل ًّيا‪ ،‬وجماالت اإلفادة منها يف ميادي َن عديدة‪،‬‬ ‫ِ‬
‫وأساليب بنائها و ُم َ َ‬
‫والصناع َة املـُعجم َّية‪ ،‬وميادي َن أخرى‪.‬‬ ‫غوي و ُمعاجلة ال ُّلغات ال َّطبيع َّية ِّ‬ ‫البحث ال ُّل َّ‬
‫َ‬
‫الشبكات الدِّ الل َّية؛ ُيقدِّ ُم هذا الفصل ملح ًة عن التَّحليل الدِّ ال ّيل‬ ‫Ÿ Ÿالفصل ال َّثالث‪َّ :‬‬
‫للشبكات الدِّ الل َّية ا َّلتي ُت َعدُّ مور ًدا أساس ًّيا للتَّحليل الدِّ ال ّيل‬ ‫للجملة‪ُ ،‬ث َّم ً‬
‫عرضا َّ‬ ‫ُ‬
‫الفصل بالوقوف عىل آل َّيات توظيف‬ ‫ُ‬ ‫العميق يف ال ُّلغات ال َّطبيع َّية‪ .‬و ُيعنى هذا‬
‫عالة اآلل َّية للدِّ اللة‪.‬‬ ‫الـم َ‬ ‫َّ‬
‫الشبكات الدِّ الل َّية يف ُ‬
‫يعرض‬
‫ُ‬ ‫ُ‬
‫حيث‬ ‫تطبيقي؛‬
‫ٌّ‬ ‫الرابع‪ :‬موارد التَّع ُّلم اآل ّيل؛ وهلذا الفصل ُبعدٌ‬ ‫Ÿ Ÿالفصل َّ‬
‫خلمسة موار َد أساس َّية للتَّع ُّلم اآل ّيل‪ ،‬هي‪ :‬شجرة القرار‪ ،‬و ُم َصنَّف بايز ُ‬
‫الـم َب َّسط‪،‬‬
‫الـم َخ َّبأة‪.‬‬
‫الـمتَّجهات الدَّ اعمة‪ ،‬ونامذج ماركوف ُ‬ ‫والشبكات العصب َّية‪ ،‬وآل َّيات ُ‬ ‫َّ‬
‫الفصل جلوانب اإلفادة من هذه املوارد يف توجيه اآللة إىل ُماكاة ذكاء‬ ‫ُ‬ ‫ويعرض‬
‫ُ‬
‫ِ‬ ‫اإلنسان يف فهم ال ُّلغة و ُم َ‬
‫عالة بياناتا‪.‬‬
‫ُ‬
‫حيث ُيعنى‬ ‫أيضا؛‬
‫تطبيقي ً‬
‫ٌّ‬ ‫Ÿ Ÿالفصل اخلامس‪ :‬نمذجة ال ُّلغة؛ وهلذا الفصل ُبعدٌ‬
‫أساليب إحصائ َّية‪ ،‬مثل‪:‬‬
‫َ‬ ‫بتوظيف املوارد ال ُّلغو َّية يف بناء النَّامذج ال ُّلغو َّية‪ ،‬ع َ‬
‫رب‬
‫الفصل أمثل ًة عىل جماالت اإلفادة من بعض‬ ‫ُ‬ ‫العددي‪ ،‬والتَّنعيم‪ .‬و ُيقدِّ ُم‬
‫ّ‬ ‫النَّحو‬
‫عالة ال ُّلغات ال َّطبيع َّية‪.‬‬‫هذه األساليب يف ُم َ‬
‫بني َجنَبات هذا الكتاب ويف ثنايا ُف ُصوله؛‬ ‫تنو ًعا وثرا ًء َ‬
‫الكريم ُّ‬
‫ُ‬ ‫القارئ‬
‫ُ‬ ‫إنَّنا نأمل أن جيدَ‬
‫بني اخلربة األكاديم َّية واخلربة‬
‫ون َ‬ ‫ِ‬ ‫ِ‬
‫تشاركَت يف تأليفه نخب ٌة من املؤ ِّلفني ا َّلذي َن جيم ُع َ‬ ‫ُ‬
‫حيث َ‬
‫احلاسوب َّية‪.‬‬
‫ُ‬ ‫العمل َّية يف ميادين صناعة املوارد ال ُّلغو َّية‬
‫ِ‬
‫واألجر اجلزيل‪ ،‬وأن جيع َله من‬ ‫حل َس ِن‬ ‫نسأل اهلل تعاىل أن يتق َّب َل هذا اجلهدَ ِّ‬
‫بالذكر ا َ‬ ‫ُ‬
‫ينفع أصحا َبه بعد مماهتم‪.‬‬‫العل ِم ا َّلذي ُ‬
‫حرران‬
‫الـم ِّ‬
‫ُ‬ ‫ ‬

‫‪-10-‬‬
‫الفصل األول‬
‫احلاسوب َّية‬
‫ُ‬ ‫املعج ِم َّية ال َع َر ِب َّية‬
‫َ‬ ‫املوارد‬
‫ِ‬

‫هواري‬
‫د‪ .‬عبد العاطي َّ‬

‫احلاسوب َّية‪.‬‬
‫ُ‬ ‫املعج ِم َّية ال َع َربِ َّية‬ ‫ِ‬
‫املوارد َ‬ ‫‪ -1‬مدخل إىل‬
‫املعج ِم َّية احلاسوبية‪.‬‬ ‫ِ‬
‫باملوارد َ‬ ‫‪ -2‬يف التعريف‬
‫املعج ِم َّية ومعاجلة اللغات الطبيعية‪.‬‬ ‫ِ‬
‫املوارد َ‬ ‫‪-3‬‬
‫‪ -4‬الصناعة املعجمية احلاسوبية‪.‬‬
‫املعج ِم َّية العربية احلاسوبية‪.‬‬ ‫ِ‬
‫املوارد َ‬ ‫‪-5‬‬
‫‪ -6‬األفكار البحثية املقرتحة يف إطار العمل املعجمي احلاسويب العريب‪.‬‬

‫‪-11-‬‬
-12-
‫احلاسوب َّية‬
‫ُ‬ ‫املعج ِم َّية ال َع َربِ َّية‬ ‫ِ‬
‫املوارد َ‬ ‫‪ -1‬مدخل إىل‬
‫يتم التمييز‪ ،‬يف إطار الدرس املعجمي (ابن مراد‪( ، )1998 ،‬الفهري‪،)1999 ،‬‬
‫(الفهري‪ ،)1997 ،‬بني ثالثة جماالت ختص ثالثة مستويات بحثية معجمية متاميزة؛‬
‫األول‪ :‬املعجم الذهني (‪ ،)Mental Lexicon‬وخيتص بدراسة اجلانب الذهني من‬
‫وتعرفها وطريقة تنظيمها يف الذهن‪ ،‬وآليات توليدها‬ ‫املعجم؛ كاكتساب الثروة اللفظية ُّ‬
‫واستعامهلا‪ .‬والثاين هو املعجم اللغوي (‪ )Lexicon‬ويقصد به جمموع الثروة اللفظية؛‬
‫الكلامت والتعابري االصطالحية (‪ )Idioms‬املوجودة لدي جمموع املتحدثني بلغة ما‪.‬‬
‫املدون (‪ ،)Dictionary‬ويكون حماولة لتمثيل املعجم‬ ‫والثالث هو املعجم املصنوع أو َّ‬
‫مورد معجمي وهو بذلك عمل ينتمي إىل الصناعة املعجمية‬ ‫اللغوي للغة ما يف صورة ِ‬
‫(‪.)1( )Lexicography‬‬
‫املعج ِم َّية‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫ويندرج موضوع هذا الفصل حتت إطار املستوى الثالث فيتناول‬
‫احلاسوبية؛ مفهومها‪ ،‬وطبيعتها‪ ،‬وأشكاهلا‪ ،‬وعالقتها بمعاجلة اللغات الطبيعية‪ .‬بالرتكيز‬
‫املعج ِم َّية العربية احلاسوبية‪ ،‬واقعها الراهن‪ ،‬واقرتاح تصور آلفاق العمل‬ ‫َ‬ ‫ِ‬
‫املوارد‬ ‫عىل‬
‫املعجمي العريب احلاسويب صناع ًة وبحثا‪.‬‬

‫املعج ِم َّية احلاسوبية‬ ‫ِ‬


‫باملوارد َ‬ ‫‪ -2‬يف التعريف‬
‫املعجمي ‪-‬صناع ًة وبح ًثا‪ -‬ثور ًة شاملة‬
‫ّ‬ ‫جمال العمل‬ ‫ِ‬
‫احلاسوب َ‬ ‫ُ‬
‫دخول‬ ‫َ‬
‫أحدث‬
‫يف تقنيات الصناعة املعجمية‪ ،‬أعقبتها ثورة مماثلة يف املفاهيم واملعتقدات والتقاليد‬
‫ً‬
‫وتنفيذا‬ ‫املعجمية‪ .‬فحدثت تبدُّ الت كبرية يف أولويات العمل يف هذا املجال ختطي ًطا‬
‫وحتدي ًثا‪ .‬عالوة عىل اختالف غري قليل يف األهداف الصناعية والبحثية‪ .‬ويمكن أن‬
‫نتصور آثار هذه الثورة يف مستويات متعددة(‪)2‬؛ يف تقنيات العمل املعجمي التقليدي‪:‬‬
‫عج ِم َّية جديدة‪.‬‬ ‫ٍ‬
‫أشكال ملعاجم أو ِ‬
‫موارد ُم َ‬ ‫منهجياته وإجراءاته وأدواته وبنائه‪ .‬ويف إجياد‬
‫وأيضا يف ظهـور جماالت بحثيــة‬ ‫ويف طرائق التعامل معها واستعامهلا ويف توظيفها‪ً .‬‬

‫‪ -1‬عىل أن هناك من ُي َس ِّوى بني املصطلحني (‪ Lexicon‬و ‪ )Dictionary‬يف العمل املعجمي الغريب أيضا‪ ،‬فيستخدمهام مرتادفني‪.‬‬
‫‪ -2‬عالوة عىل َبدَ هيات جدوى استعامل احلاسوب يف معاجلة أي مادة يف أي جمال معريف؛ من رسعة وإنجازيه عالية ودقة‬
‫وسعة ختزينية فائقة وإمكانية متابعة التحديث‪ ،‬إضافة إىل طريقة تقديم املادة واستدعائها‪.‬‬

‫‪-13-‬‬
‫املعجمي ومنطلقاته وغاياته(‪.)1‬‬
‫ّ‬ ‫معجمية جديدة‪ ،‬واقرتاح إجراءات جديدة للبحث‬
‫ويذهب بعض الباحثني إىل أن ثورة احلاسوب مل تغري يف الطريقة التي ُي َرى هبا البحث‬
‫أيضا فتحت آفا ًقا حلقول بحثية جديدة هتدف إىل فهم للعقل البرشى‬ ‫فحسب‪ ،‬بل إهنا ً‬
‫عىل ضخامتــه وتعقيد‪.‬‬
‫املوارد املعجمية احلاسوبية‪ :‬األول‪ِ :‬‬
‫موارد معجمية‬ ‫ِ‬ ‫وينبغي التمييز بني نمطني من‬
‫للمستعمل البرشي تكون تطبيقا حاسوب ًّيا قائام بذاته‪ ،‬مثل املعاجم اإللكرتونية‪،‬‬
‫تعرض مادهتا يف صورة واجهة عىل شاشة احلاسب‪ ،‬ت َُس ِّهل عملي َة البحث عن الكلمة‬
‫موارد معجمية ُتعل ألنظمة احلاسوب الداعمة ملعاجلة‬ ‫واآلخر‪ِ :‬‬
‫َ‬ ‫ومعلوماهتا اللغوية؛‬
‫اللغات الطبيعية‪ ،‬فمستعملو هذه األنظمة احلاسوبية ال يتعاملون مبارشة مع ِ‬
‫املورد‬
‫ِ‬
‫املوارد ويكون جز ًء من نظام‬ ‫املعجمــي‪ ،‬بــل يتعاملون مع التطبيقات املبنية عىل هذه‬
‫أكرب كام يف املدقق اهلجائي اخلاص بمعالج الكلامت أو يف املعجم املصطلحي لنظم‬
‫مساعدة املرتمجني‪.‬‬

‫املعج ِم َّية احلاسوبية‬ ‫ِ‬


‫املوارد َ‬ ‫‪ -1.2‬أشكال‬
‫املعج ِم َّية احلاسوبية فتشمل أشكاال متباينة طبيعة‪ ،‬وحجام‪ ،‬وغاية‪،‬‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫تتنوع‬
‫ِ‬
‫املعجم َّية من خالل تصنيفها‬ ‫ِ‬
‫املوارد َ‬ ‫وشكال هنائ ًّيا تتجىل فيه‪ .‬ويمكن استعراض أشكال‬
‫من حيث شكلها احلاسويب الذي تتجىل فيه‪ ،‬ومن حيث طبيعة املحتوى املعجمي الداليل‬
‫الذي تقدمه‪ ،‬ومن حيث غاياهتا‪.‬‬

‫املعج ِم َّية احلاسوبية من حيث الشكل‬ ‫ِ‬


‫املوارد َ‬ ‫§ §أشكال‬
‫Ÿ Ÿاملعجم املقروء آل ًّيا‬
‫املعجم املقرو ُء آل ًّيا(‪ )2‬نسخ ًة حاسوبي ًة من طبعته الورقية‪ ،‬أو متثي ً‬
‫ال حاسوب ًّيا‬ ‫ُ‬ ‫ُيعدُّ‬
‫للمعجم الورقي‪/‬التقليدي يظهر يف هيئة إلكرتونية تسمح لآللة‪/‬احلاسوب بالقيام‬

‫بج ّل َمن تصدَّ ى للتأريخ للمعجم بأن يقسم عمله إىل قسمني‪ :‬ما قبل احلاسوب (ويروق لكثري من‬
‫‪ -1‬وقد حدا كل ذلك ُ‬
‫الباحثني تسميتها املعجمية التقليدية)‪ ،‬وما بعد احلاسوب (وتسمى املعجمية احلاسوبية)‪.‬‬
‫‪ -2‬حيرتز البعض عىل عبارة «املقروء آليا» بقوهلم إنه ليس املقصود أن احلاسوب يقرأ املعجم بل فقط أن املعجم يف هيئة‬
‫الكرتونية تسمح لآللة ‪ /‬احلاسوب أن يقوم بمعاجلات عليها )‪.(Litkowski, 2005‬‬

‫‪-14-‬‬
‫ٍ‬
‫معلومات‬ ‫بمعاجلات عليها‪ .‬وإىل جانب متثيله للمعجم املطبوع فإنه خيتلف عنه باحتوائه‬
‫لغوية ال تظهر يف املعجم املطبوع نظرا الختالف طبيعة اآللة عن املستخدم البرشي‪.‬‬
‫املعج ِم َّية احلاسوبية باملعجمية احلاسوبية قدر‬ ‫ِ‬
‫املوارد َ‬ ‫نوع من أنواع‬ ‫وتارخي ًّيا مل يرتبط ٌ‬
‫نفسه قد ظهر أول‬‫ارتباط املعجم املقروء آليا هبا‪ .‬حتى أن مصطلح املعجمية احلاسوبية ِ‬
‫َ‬ ‫ًّ‬
‫ظهر عىل يد «أمسلر»(‪ )Amsler‬من خالل دراسته عن بنية معجم ويبسرت السابع‪،‬‬ ‫ما َ‬
‫وكان يعني دارسة املعجم املقروء آل ًّيا‪ .‬وقد بدأ املعجم املقروء آل ًّيا يف الظهور يف منتصف‬
‫أشهر‬
‫َ‬ ‫الستينيات وازداد االهتامم به مع بداية التسعينات من القرن العرشين‪ .‬ولعل‬
‫نامذجه معجم لونجامن لإلنجليزية املعارصة(‪. LDOCE )1‬‬ ‫ِ‬
‫و ُين َظر للمعاجم املقروءة آل ًّيا باعتبارها ِ‬
‫مور ًدا ق ِّي ًم للمعلومات اللغوية املستخدمة يف‬
‫جمال معاجلة اللغات الطبيعية‪ ،‬وذلك الحتوائها ُج ّل املعارف اللغوية والداللي ة (�‪Puste‬‬
‫ِ‬
‫املعلومات‬ ‫َخ ِرج اللسانيون احلاسوبيون‬ ‫‪ . )jovsky & Boguraev, 1993‬فمن مادته َي ْست ْ‬
‫اللغوية داللي ًة وتركيبي ًة ورصفي ًة‪ ،‬يتم توظيفها يف جمال معاجلة اللغات الطبيعية‪ ،‬كام أن‬
‫هذه املعارف اللسانية املوجودة يف املعجم املقروء آليا تعد مادة مالئمة الشتقاق قواعد‬
‫للمعارف منها‪ .‬فلقد كانت نتائج األبحاث املبكرة يف جمال املعجم املقروء آليا مبرشة‬
‫فقادت كثريين إىل الشعور بأن قواعد معارف ضخمة يمكن أن تشتق بسهولة اشتقاقا‬
‫آل ًّيا من املعاجم املقروءة آل ًّيا (‪.)Ide & Véronis,1994‬‬
‫املعجم‬ ‫ِ‬
‫احلاسوبية واملعجميون احلاسوبيون أن‬ ‫ِ‬
‫املعجمية‬ ‫ولقد وجد مطورو النظ ِم‬
‫َ‬
‫املقرو َء آل ًّيا ال يفي بمطالب استخالص املعلومات بالشكل الذي يرضونه فأخذوا يف‬
‫ابتكار األدوات الربجمية لتحويله إىل معاجم قابلة للتوسيع آل ًّيا لتصبح يف صورة صاحلة‬
‫ملعاجلة اللغة الطبيعية مبارشة‪ ،‬وتستخدم يف ذلك أدوات إحصائية للمفردات وعالقاهتا‬
‫يف ‪ MRD‬للخروج بشبكة داللية حتكم بنيتها‪ ،‬أو بتحليل كلامت التعريفات املعجمية‬
‫للوصول إىل املعاين النووية التي حتكم بنية املعجم‪ ،‬أو بتحليل التعريفات نفسها وهي‬
‫اإلجراءات التي طبقها فريق عمل عىل معجم لونجامن املقروء آل ًّيا لتحويله ملعجم قابل‬
‫للتوسيع آل ًّيا صالح لتطبيقات معاجلة اللغة (‪.)Svensén, 1993‬‬

‫‪1- http://www.pearsonlongman.com/ldoce/.‬‬

‫‪-15-‬‬
‫Ÿ Ÿقاعدة البيانات املعجمية‬
‫هي صياغة للامدة املعجمية (املداخل املعجمية واملعارف اللغوية املتعلقة هبا) يف‬
‫صورة قاعدة بيانات‪ ،‬بام لقواعد البيانات من إمكانات يف التخزين‪ ،‬والضبط‪ ،‬والربط‬
‫البعض‬
‫ُ‬ ‫العالئقي‪ ،‬وإمكانات البحث‪ ،‬والفهرسة‪ ،‬واالستخالص‪ ،‬واإلحصاء‪ .‬و َي ُعدُّ‬
‫قاعدة البيانات املعجمية نسخة من املعجم املقروء آل ًّيا‪ ،‬غري أهنا نسخة معدلة األخطاء‬
‫تتجاوز التضاربات الداخلية التي قد تكون موجودة يف املعجم املقروء آل ًّيا‪ .‬غري أن‬
‫الفروق بينهام عىل املستوى التنظيمي املعجمي ليس بالقليل ويربر احلديث املستقل عن‬
‫كل منهام‪.‬‬
‫ويمكن النظر إىل قواعد بيانات معجمية بوصفها خمزنا هائال للثروة اللفظية؛ ألفاظا‬
‫ومعلومات متعلقة هبا‪ ،‬مصوغة يف صورة منظومية‪ ،‬يمكن توظيف حمتواها يف بناء ِ‬
‫موارد‬
‫عج ِم َّية أخرى أو برجميات حاسوبية فيام خيص معاجلة اللغات الطبيعية‪.‬‬
‫ُم َ‬
‫وتعد قاعدة بيانات املعجم اإليطايل من األعامل األكثر شهرة يف سياق احلديث عن‬
‫قواعد البيانات املعجمية؛ فلقد قامت منهجية متثيل املحتوى املعجمي الداليل لقاعدة‬
‫البيانات املعجمية اإليطالية عىل مقوالت التوجه العالئقي (‪)Relational Approach‬‬
‫يف متثيل املعنى‪ .‬فقد زخرت قاعدة بيانات املعجم اإليطايل بالعالقات عىل أشكاهلا‬
‫املختلفة‪ ،‬وهو األمر الذي مل يكن معهودا يف معاجم التعريفات‪ ،‬للدرجة التي جعلت‬
‫بعض الباحثني يشري إىل إمكانية دمج املعجم واملكنز‪.‬‬

‫املعج ِم َّية من حيث طبيعة املحتوى املعجمي ومنهجية متثيله‬ ‫ِ‬


‫املوارد َ‬ ‫§ §أشكال‬
‫املعج ِم َّية من حيث طبيعة املحتوى املعجمي الداليل ومنهجية‬ ‫ِ‬
‫املوارد َ‬ ‫يمكن تصنيف‬
‫املوارد التي تركز عىل جوانب املعنى‬ ‫ِ‬ ‫للموارد املعجمية‪ ،‬وهي‬ ‫ِ‬ ‫متثيله إىل قسمني‪ :‬األول‬
‫املعج ِم َّية‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫املعج ِم َّية الداللية ويقصد هبا‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫واالستعامل؛ والقسم َ‬
‫اآلخر هو‬
‫التي يركز حمتواها عىل اجلوانب املتعلقة بتمثيل األبنية الرتكيبية للوحدات املعجمية‬
‫وتنميط سلوكها الرتكيبي‪.‬‬

‫‪-16-‬‬
‫Ÿ Ÿاملوارد املعجمية‬
‫املعج ِم َّية عىل متثيل املعنى من خالل إحدى منهجيتني‪:‬‬ ‫ِ‬
‫املوارد َ‬ ‫تركز‬
‫املعج ِم َّية التعريفية‪ )Dictionary( :‬وهي التي تعتمد منهجية التعريف‬
‫َ‬ ‫ ‪ِ -‬‬
‫املوارد‬
‫املعجمي (‪ )Lexical Definition‬يف متثيل املعلومات واملعارف اللغوية‪.‬‬
‫ويمكن هنا أن نرضب مثاال عىل هذا النوع بمعجم لونجامن لإلنجليزية‬
‫املعارصة (‪ :)Longman Dictionary Of Contemporary English‬وهو‬
‫معجم قد أخذ اعتنا ًء من قبل اللسانيني واللسانيني احلاسوبيني(‪ .)1‬فاحلديث‬
‫ٌ‬
‫عن معجم لونجامن ال يعد حديثا عن جتربة معجم بقدر ما هو مراجعة لسلسلة‬
‫من الدراسات املعجمية الداللية لفريق عمل متكامل من املتخصصني‪.‬‬
‫وقد أقام املعجم منهجيته يف حتليل املحتوى املعجمي الداليل ومتثيله عىل فكرة‬
‫أساسية‪ ،‬هي استعامل قائمة كلامت حمددة(‪ )2‬بمعان حمددة‪ ،‬يتم تعريف بقية‬
‫مداخل املعجم هبا‪ ،‬وقوائم من التصنيفات الرتكيبية والداللية‪ ،‬وهو ما جعله‬
‫نموذجا مميزا للتطبيقات احلاسوبية يف جمال معاجلة اللغات الطبيعية من خالل‬
‫املعلومات التي يقدمها مثل عمله تراتبية لألسامء‪ ،‬والتصنيف االستعاميل‪ ،‬وبيان‬
‫حقول االستعامل‪ ،‬وتوضيح القيود االنتقائية للوحدات املعجمية امل َع َّر َفة‪.‬‬
‫وال خيفى عمق التحليل املعجمي الداليل الذي وقف وراء هذا العمل‪ ،‬وفاعلية‬
‫لغة التعريف بالتحكم يف مفرداهتا وأبنيتها‪ .‬غري أن كل هذه املزايا التي وجدها‬
‫الدارسون يف معجم لونجامن مل ُت ْع ِف ِه من نقد توجه إىل منهجيته النظرية وتطبيقاته‪.‬‬
‫عج ِم َّية عالئقية شبكية‪ :‬وهي يف فلسفة بنائها ومتثيلها للمعنى أقرب‬ ‫ ‪ِ -‬‬
‫موارد ُم َ‬
‫إىل املكانز اللغوية التي تعتمد يف بنائها عىل مقاربة العالقات الداللية القارة‬
‫يف املعجم اللغوي‪ ،‬غري أهنا توظف تقنيات العمل احلاسويب يف توثيق ُع َرى‬
‫العالقات بني مفردات وعبارات املعجم‪.‬‬

‫‪ -1‬أصبح من املعتاد يف جمال معاجلة اللغة اإلنجليزية آل ًّيا االعتامد عىل مادة معجم لونجامن يف نسخته االلكرتونية‪ .‬ومما‬
‫ينبغي إيراده هنا أن للمعجم نسختني‪ :‬األوىل ورقية‪ ،‬والثانية حاسوبية يف صورة معجم مقروء آل ًّيا وأن بني النسختني‬
‫كثريا من االختالفات‪.‬‬
‫‪ -2‬تتكون هذه القائمة من ‪ 2300‬كلمة‪ ،‬إضافة إىل ‪ 3000‬مشتق من مشتقاهتا‪.‬‬

‫‪-17-‬‬
‫املوارد بشبكة الكلامت ‪ ،)1( WordNet‬وهي‬‫ويمكن أن نمثل عىل هذا النوع من ِ‬
‫تقوم عىل أسس نفسية لسانية باألساس وتعتمد يف تنظيمها عىل فكــرة املكنز‪،‬‬
‫ال يشابه طريقة تنظيم العقل‬‫وحتاول شبكة الكلامت متثيل املـادة املعجمية متثي ً‬
‫البرشي للام َّدة املعجميـة «فالبنية اهلرمية التي تطور عن طريق نظريات تنظيم‬
‫ّ‬
‫املعرفة البرشية تقدم مادة مفيدة ملرشوعات أبحاث الذكاء االصطناعي‪.‬‬
‫ورغم كل ما يف شبكة الكلامت من مزايا وطاقات ت َِعدُ بتطبيقات يف جمال معاجلة‬
‫اللغات الطبيعية؛ فإهنا ال تعدم من يرى فيها نقائص مثل صعوبة الربط القائم بني أقسام‬
‫الكالم املختلفة‪ ،‬وقلة التَّعبريات االصطالحية املدرجة‪ ،‬ناهيك عن أن تصنيفها مل خيطط‬
‫بشكل شامل وحمكم‪.‬‬

‫عجم َّية داللية (‪)Lexical Semantic Resources‬‬ ‫Ÿ ِ‬ ‫ِ‬


‫موارد ُم َ‬ ‫Ÿ‬
‫ِ‬
‫املعجم َّية الداللية من نظريات معجمية داللية‪ ،‬فتطبق بعضا من فروضها‬ ‫تنطلق ِ‬
‫املوارد َ‬
‫النظرية عىل معاجم اللغة‪ ،‬فتقدم متثيال دالليا وتركيبيا للوحدات املعجمية‪ .‬وهي ِ‬
‫موارد‬
‫عج ِم َّية داللية هتدف إىل متثيل األبنية الرتكيبية والسلوك الرتكيبي للوحدات املعجمية‬
‫ُم َ‬
‫إىل جانب متثيل املحتوى الداليل هلذه الوحدات املعجمية‪ ،‬خصوصا األفعال واملشتقات‬
‫وتقوم بتصنيفها تصنيفا تركيبيا ودالليا يف آن‪ .‬وهذه ِ‬
‫املوارد هلا أمهيتها الكبرية يف تطبيقات‬
‫معاجلة اللغات الطبيعية إ ْذ إهنا أعمق حتليال وألصق بالسياقات الرتكيبية املحتملة للكلمة‪.‬‬
‫ومن أمثلة ذلك‪ :‬شبكة األطر (‪ )FrameNet‬وشبكة األفعال (‪ )VerbNet‬وبنك األبنية‬
‫احلملية (‪.)PropBank‬‬
‫وسنمثل الثنتني منهام فيام ييل‪.‬‬
‫شبكة األُ ُطر‬
‫املعج ِم َّية‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫تعد شبكة األ ُطر(‪ )2‬املعجمية الداللية من أهم األعامل يف جمال بناء‬
‫الداللية عىل مستوى التأسيس النظري خصوصا؛ إذ قد تم بناؤها عىل هدى من نظرية‬

‫‪ -1‬رابط املرشوع لالطالع‪.http://wordnet.princeton.edu :‬‬


‫‪ -2‬عنوان مرشوع ‪ FrameNet‬ورابطه عىل شبكة اإلنرتنت هو‪ http://framenet.icsi.berkeley.edu :‬ويغطي‬
‫املرشوع عدة لغات إىل جانب اإلنجليزية وهي األملانية واليابانية واألسبانية‪.‬‬

‫‪-18-‬‬
‫فيلمور (‪ )Fillmore‬عن نحو احلالة (‪ )Case Grammar‬واألدوار الداللية‪/‬املحورية؛‬
‫فاألدوار الداللية (‪ )Semantic Roles‬تلعب دورا مهام يف هذا العمل‪ .‬وتعد شبكة‬
‫األطر ِ‬
‫مور ًدا معجميا دالليا غايته باألساس تنظيم املعارف املعجمية عىل أسس تركيبية‬
‫وداللية لتحقيق أغراض املعاجلة اآللية للغات الطبيعية‪ ،‬إضافة إىل اجلوانب النظرية‬
‫املتمثلة يف التحليالت املعمقة للبنية املعجمية الداللية للمعجم‪.‬‬
‫واإلطار الداليل عبارة عن بنية عامة تتكون من جمموعة من العنارص؛ تبدأ بتعريف‬
‫عبارة عن توصيف للمفهوم أو املعنى‪ ،‬ثم جمموعة من العنارص (ويمكن النظر إليها‬
‫باعتبارها حتقي ًقا لفكرة األدوار الداللية كام يف نظرية نحو احلالة لفيلمور) هذه العنارص‬
‫منها ما هو أسايس ومنها ما هو غري أسايس‪ .‬ويكون دور ال َعنونة الداللية هو ربط كل‬
‫قراءة داللية لوحدة معجمية باإلطار املناسب له من األطر املحددة سلفا‪ ،‬إضافة إىل‬
‫حتديد العنارص األساسية والعنارص غري األساسية لكل كلمة‪ .‬ويتأسس املرشوع عىل ما‬
‫يقرب من ‪ 800‬إطار معجمي داليل يتم تصنيف الوحدات املعجمية من خالهلا‪.‬‬

‫بنك األبنية احلملية (‪)PropBank‬‬

‫يتوجه مرشوع بروب‪-‬بانك إىل حتليل البنية احلملية (‪)Argument Structure‬‬


‫للفعل واملشتقات يف عدد من اللغات (اإلنجليزية والعربية والصينية واهلندية‪( .‬وغايته‬
‫توصيف السلوك الرتكيبي مربوطا بالداللة‪/‬املعنى لكل فعل أو مشتق‪ ،‬ومن جهة‬
‫أخرى إنجاز تصنيف معجمي داليل وتركيبي ملعجم كل لغة‪.‬‬
‫ويتم التحليل (‪ )Palmer, 2005‬بالبدء بتحليل الدالالت املمكنة لكل فعل أو‬
‫مشتق من خالل أمثلة حمللة تركيبيا حتليال شجريا وتقديم تعريف مبسط له وحتديد‬
‫البنية احلملية املمكنة مع كل داللة وتوضيح املكمالت اجلملية املمكنة مع ربط اجلمل‪/‬‬
‫العبارات املوجودة يف املدونة بالتحليل‪ ،‬فتصبح املخرجات النهائية عبارة عن حتليل‬
‫معجمي داليل ألفعال ومشتقات املدونة يقدم توصيفا للسلوك الرتكيبي للفعل أو‬
‫مشتقاته وفصل متعدد املعنى عىل أسس تركيبية وداللية‪.‬‬

‫‪-19-‬‬
‫‪ -2.2‬روافد تطوير العمل املعجمي احلاسويب‬
‫املعج ِم َّية احلاسوبية رافدين يتشاركان يف تطويره؛ األول رافد‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫تسرتفد‬
‫لساين والثاين رافد حاسويب‪ .‬وهيمنا يف هذا السياق أن نتناول الرافد اللساين للتطوير‪.‬‬
‫فالعمل املعجمي احلاسويب يرتبط يف عمق حتليله بالتأسيس النظري اللساين وهو ما‬
‫يمكن مالحظته‪ ،‬عىل سبيل املثال‪ ،‬يف تأثري أعامل بيث ليفني ‪ Levin‬املتعلقة بالتصنيف‬
‫املعج ِم َّية احلاسوبية ويف تنظيم‬ ‫ِ‬
‫املوارد َ‬ ‫املعجمي الداليل لألفعال (‪ )1993,Levin‬يف بناء‬
‫حمتواها الداليل والرتكيبي‪.‬‬
‫ويف هذا السياق نعرض لنموذجني فيام يتعلق بالتنظري اللساين للتطوير يف جمال بناء‬
‫املعج ِم َّية احلاسوبية؛ مها نموذج معجم ميلتشوك‪ ،‬والثاين نموذج نظرية املعجم‬
‫َ‬ ‫ِ‬
‫املوارد‬
‫التوليدي لبوسطيوفسكي((‪.1‬‬

‫§نموذج معجم ميلتشوك (‪)Explanatory Combinatorial Dictionary‬‬ ‫§‬


‫يمكن النظر إىل تصور ميلتشوك للمعجم باعتباره أحد أنضج املنهجيات التي‬
‫قدمت يف العرص احلديث فيام خيص متثيل البنية الداللية ملعجم؛ وذلك الرتكازها عىل‬
‫تصورات لسانية نظرية معمقة‪ ،‬دون جتاهل ملا تقدمه نتائج حتليل املدونة النصية‪.‬‬
‫وتركز منهجية معجم ميلتشوك عىل جوانب املحتوى‪ :‬فهو معجم لتمثيل املعنى‬
‫وتوضيح آليات تآلف الوحدات املعجمية‪ .‬ويقوم متثيل معنى الكلمة يف املعجم عىل‬
‫حمورين يسميهام الوظائف املعجمية؛ مها العالقات الرأسية( (�‪Paradigmatic Func‬‬
‫‪( )tionss‬أي العالقات الداللية بني الوحدات املعجمية) والعالقات األفقية (�‪Syntag‬‬
‫‪( )matic Functions‬تآلف الكلمة مع جاراهتا يف العبارة أو اجلملة) وذلك بغرض‬
‫تتميم التوصيف الداليل للكلمة املدخل‪.‬‬
‫وتتكون بنية تعريف الوحدة املعجمية يف تصور ميلتشوك من جمموعة من القوالب‬
‫الفرعية (‪ ،)Mel’ˇcuk, 1988 & 1995‬هي‪ :‬املكونات النموذجية للتعريف‪ .‬وهي‬
‫عبارة عن قالب ثابت يتم االلتزام به يف أي تعريف‪ .‬واملكونات العامة‪ ،‬وهي التي حتدد‬

‫‪ -1‬ينبغي اإلشارة إىل أن نموذج ميلتشوك قد صار بالفعل تطبيقيا واقعيا متحققا‪ ،‬غري أن نظرية بوسطيوفسكي ظلت ‪-‬‬
‫حتى اآلن ‪ -‬قيد التحقيق‪ْ ،‬‬
‫وإن تم اإلفادة منها يف جماالت خمتلفة يف حتليل اللغة وتطبيقات معاجلة اللغات الطبيعية‪.‬‬

‫‪-20-‬‬
‫الفئة الرتكيبية التي تنتمي إليها الوحدة املعجمي‪ .‬واملكونات الضعيفة‪ ،‬وهي أجزاء من‬
‫التعريف يمكن االستغناء عنها يف بعض السياقات الداللية‪ .‬واملكونات االختيارية‬
‫للتعريف وهي التي يمكن حتييدها يف التعريف‪ ،‬وإنام يؤتى هبا فقط لتسييق الكلمة‪.‬‬
‫والقيود‪ ،‬وهي السامت التي متيز بني تعريفات الكلامت‪ .‬واملكونات اجلاهزة‪ ،‬ويقصد هبا‬
‫السامت املصوغة قبال بحيث تضاف للتعريف بوصفها وحدات تعريفية سابقة التجهيز‪.‬‬
‫وتأيت أمهية هذا العمل من كونه تطبيقا لنظرية لسانية داللية من جهة‪ ،‬ومن كونه‬
‫تأسيسا نظر ًّيا لبنية‬
‫ً‬ ‫يتوجه إىل تطبيقات معاجلة اللغة آل ًّيا من جهة أخرى‪ .‬كام أنه قد قدم‬
‫املعجم يقوم عىل أسس داللية‪ ،‬إضافة إىل ما قدمه يف جمال الوحدات املعجمية متعددة‬
‫الكلامت‪.‬‬

‫§نموذج املعجم التوليدي لبوسطيوفسكي (‪)Generative Lexicon‬‬ ‫§‬


‫تصنَّف نظرية بوسطيوفسكي بوصفها نظرية يف الداللة املعجمية احلاسوبية للكلمة‪،‬‬
‫وهي حماولة القت قبوال واستحسانا يف األوساط اللسانية احلاسوبية باعتبارها نظرية‬
‫جتاوز املنجز يف التصورات السابقة‪ ،‬مفيدة من النظريات‬
‫َ‬ ‫لتمثيل املعرفة املعجمية‪ُ ،‬تاول‬
‫السابقة‪.‬‬
‫ينطلق بوسطيوفسكي (‪ )Pustejovsky,1995‬من نقد سكونية (استاتيك َّية)‬
‫املقرتحات السابقة يف معاجلة املعجم‪ ،‬فقد رأى أن األفكار التي بنيت عليها املعاجم‬
‫أفكار سكونية يف متثيلها املحتوى املعجمي الداليل‪ ،‬يتم رسد الدالالت فيها دون روابط‬
‫قوية ودون الرتكيز عىل الطاقة التوليدية الكامنة يف الكلامت‪ .‬فكان التفكري يف أن جيعل‬
‫املعاجلة تفاعلية متكن من التعامل مع الكلامت يف سياقات جديدة أو خمتلفة عام هو وارد‬
‫يف املعجم‪ ،‬ويف املقابل يقرتح تصورا حركيا تفاعليا يمكن أن يسهم يف جماهبة االستعامل‬
‫اإلبداعي‪/‬املتجدد للكلمة يف نصوص جديدة وفك االلتباس‪ .‬فالكلمة يتحدد معناها‬
‫حسب السياق‪ ،‬والسياقات التي (قد) ترد فيها الكلمة سياقات ال هنائية‪ ،‬فال يمكن‬
‫حمارصهتا مهام أمكننا السيطرة عىل املدونة من حيث ضخامة احلجم‪ ،‬والتحديث الدائم‪،‬‬
‫ولكن يمكن السيطرة عىل آلية توليد داللة الكلمة يف السياقات ‪ /‬أنامط السياقات‪.‬‬

‫‪-21-‬‬
‫ويفرتض بوسطيوفسكي‪ ،‬يف سبيل متثيل الطاقة التوليدية للكلمة‪ ،‬أربعة أبنية لتمثيل‬
‫الوحدة املعجمية‪:‬‬
‫Ÿ Ÿالبنية احلملية (‪ )Argument Structure‬وهي تتعلق بالتحقق الرتكيبي للكلمة‬
‫(عدد املحموالت وأنامطها التي تتحقق معها يف املستوى الرتكيبي)‪.‬‬
‫Ÿ Ÿالبنية احلدثية (‪ )Event structure‬تعني نمط احلدث يف الفعل‪ ،‬وهو يعد بمثابة‬
‫تصنيف لطبيعة الفعل أو املشتقات الفعلية لتقديم خصائصها اجلهية‪.‬‬
‫Ÿ Ÿبنية السامت (الكواليا) (‪ )Qualia structure‬تقدم السامت األساسية للوحدة‬
‫املعجمية التي تتحكم يف آليا تراكبها مع الوحدات املعجمية األخرى‪.‬‬
‫Ÿ Ÿبنية التوارث (‪ )Lexical inheritance‬وتتعلق بالبنية الكلية ملعجم لغة‪ ،‬فتحدد‬
‫الطرائق التي ترتابط هبا الكلامت دالليا واشتقاقيا فيام بينها يف داخل املعجم‪.‬‬
‫ويمكن النظر إىل تصور بوسطيوفسكي باعتبارها التصور األوجه‪ ،‬حاليا‪ ،‬يف جمال‬
‫متثيل املعارف املعجمية الداللية بغرض االستخدام يف جمال معاجلة اللغات الطبيعية‬
‫لكونه تصور ديناميكي للمعجم يتصدى للمعاين أو االستعامالت اجلديدة للكلمة‪،‬‬
‫فلقد أصبح الرتكيز موجها إىل الطاقة التوليدية للوحدة املعجمية وكيفية تآلفها أو تراكبها‬
‫مع وحدات معجمية أخرى‪ ،‬ال إىل جمرد رسد املعاين املختلفة للكلمة‪ ،‬والتفسري التوليدي‬
‫للتآلف املمكن بني املركبات االسمية‪.‬‬

‫املعج ِم َّية ومعاجلة اللغات الطبيعية‬ ‫ِ‬


‫املوارد َ‬ ‫‪-3‬‬
‫املعج ِم َّية ملجال العمل يف معاجلة اللغات الطبيعية‪ ،‬أبحاثا‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫ترجع أمهية‬
‫ِ‬
‫واملوارد املعجمية‬ ‫وتطبيقات‪ ،‬إىل طبيعة املعلومات التي يشتمل عليها ِ‬
‫املورد املعجمي‪.‬‬
‫رغم احتوائها أنامطا خمتلفة من املعلومات التوصيفية ملفردات وتعبريات؛ ال يزال‬
‫قارصا عن تلبية متطلبات معاجلات اللغة الطبيعية‪ ،‬لذا فإننا نجد كثريا من األدبيات‬
‫التي تصدت للحديث عن املعجم يف عالقته بمعاجلة اللغات الطبيعية تتصدرها مجلة‬
‫مثل إن املعجم ليعد عنق الزجاجة بالنسبة ملعاجلة اللغات الطبيعية والذكاء االصطناعي‬
‫(‪.)Zernik, 1991‬‬

‫‪-22-‬‬
‫‪ -1.3‬أنواع املعارف اللغوية التي تت َط َّل ُبها معاجلة اللغات الطبيعية‬
‫املعج ِم َّية يف العمل اللساين احلاسويب‪،‬‬ ‫يقر ُج ُّل اللسانيني احلاسوبيني بمركزية ِ‬
‫املوارد َ‬
‫بحثا وتطبيقات‪ ،‬ويرون أن املعاجم املقروءة آل ًّيا قد غدت ِ‬
‫مور ًدا مالئام للمعلومات‬
‫املستخدمة يف معاجلة اللغات الطبيعية الحتوائها عىل كمية ضخمة من املعارف املعجمية‬
‫والداللية املجموعة عرب سنوات من اجلهد املعجمي (‪.)Ide & Véronis,1994‬‬
‫وتتنوع املعارف اللغوية التي تطلبها أنظمة معاجلة اللغات الطبيعية يف الطبيعة ويف‬
‫العمق(‪ )1‬وهذه املعارف يقوم املعجميون بجمعها وحتليلها‪ ،‬ومتثيلها يف رسد معجمي‪،‬‬
‫يتعرف‬
‫َ‬ ‫وإدراجها يف بِنَى مداخل املعجم بطرائق منظومية منضبطة يمكن للحاسوب أن‬
‫عليها‪ ،‬إضافة إىل تصنيف الوحدات املعجمية عيل أساسها لتوظيفها يف أنظمة معاجلة‬
‫اللغة الطبيعية‪.‬‬

‫املعج ِم َّية‬ ‫ِ‬


‫املوارد َ‬ ‫‪ -2.3‬متطلبات معاجلة اللغات الطبيعية يف‬
‫َث َّم َة ُم َت َط َّلبات ألنظمة معاجلة اللغات الطبيعية‪ ،‬ينبغــي أن تتوافــر كلهــا أو‬
‫املعج ِم َّية حتـــى يمكـــن اإلفـادة منها آل ًّيا‪ .‬ويمكـــن تصنيف‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫بعضــها يف‬
‫هـــذه املتطلبـــات يف جمموعتني؛ األولـــى هي متطلبات لسانيـــة وتتعلق بطبيعــة‬
‫املعــارف اللسانيــة املقدمـــة وعمق حتليلها ودقة لغة متثيلها‪ .‬والثانية هي متطلبات‬
‫حاسوبية وتتعلق بالشكل الذي تعرض عليه املعارف اللسانية بام يسهل إجراءات‬
‫إمكانية استخالصها واكتساهبا آل ًّيا‪.‬‬

‫§ §املتطلبات اللسانية‬
‫معجمي َ‬
‫أمثل للغة‪،‬‬ ‫ٍ‬ ‫ٍ‬
‫حتليل‬ ‫كلام كان املحتوى اللساين معمقا ودقيقا ساعد ذلك يف‬
‫أكثر دق ًة وفاعلي ًة‪ .‬وحيكم درجة عمق هذا املحتوى‬ ‫وتطبيقات معجمية حاسوبية َ‬
‫اللساين مقدار التحليل املعجمي الداليل للبنية الداللية للمعجم‪ ،‬ودقة املنهج وقدرته‬
‫عىل متثيل اللغة‪ .‬واملتطلبات اللسانية التي يرنو إليها العمل اللساين احلاسويب هي تلك‬
‫املعلومات التي متكن من إنجاز املهام اآلتية آليا‪:‬‬

‫‪ -1‬حيدد بوجريف ‪ Bran Boguraev‬وتيد بريسكو ‪ Ted Briscoe‬املعارف الالزمة ألنظمة معاجلة اللغات الطبيعية‬
‫بأهنا‪ :‬املعارف النطقية (الفونولوجية) والرصفية والرتكيبية والداللية والربمجاتِ َّية‪.‬‬

‫‪-23-‬‬
‫Ÿ Ÿحتليل اللغة واكتساهبا آل ًّيا‪ :‬بام تتيحـه الربامج احلاسوبية من أدوات حتلل الصوت‬
‫املعج ِمــ َّية‬ ‫ِ‬
‫املـــوارد َ‬ ‫واحلرف والكلمة واجلملة والنص‪ .‬وال خيفــى هنا أمهيــة‬
‫يف إنجاز حتليل اجلوانب املرتبطة بالداللة ابتداء بالكلمة ثم اجلملة فالنص‪.‬‬
‫Ÿ Ÿتوليد اللغة‪ :‬ويقصد به متكني الربنامج احلاسويب من توليد اللغة؛ كلامت ومجال‬
‫وعبارات حتمل داللة‪.‬‬
‫Ÿ Ÿفهم اللغة‪ :‬وهو موضوع أ ْد ِخل إىل اللسانيات احلاسوبية عن طريق ازدياد‬
‫االهتامم به يف جمال الذكاء االصطناعي‪.‬‬
‫املعج ِم َّية يف التطبيقات احلاسوبية‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫ ‪-‬ويمكن هنا أن نمثل عىل توظيف‬
‫ِ‬
‫املوارد‬ ‫بقاعدة املعارف املعجمية‪ .‬إذ ُت َعدُّ إحدى التطبيقات التي توظف‬
‫تطورا وأعقدها بنية فمتطلبات بنائها املعجمية‬ ‫ً‬ ‫املعج ِم َّية وأكثرها‬
‫َ‬
‫واحلاسوبية‪ -‬خصوصا املعجمية ‪ -‬أكرب من تلك املتطلبات التي حيتاجها‬
‫مهم من ِ‬
‫موارد‬ ‫املعج ِم َّية األخرى البسيطة(‪ .)1‬كام تعد ِ‬
‫مور ًدا ًّ‬ ‫َ‬ ‫ِ‬
‫املوارد‬ ‫أي من‬
‫وموارد معاجلة اللغات‪ .‬فيحتاج بنا ُء قاعدة معارف إىل‬‫ِ‬ ‫املعلوماتية احلديثة‬
‫كمية كلامت وتعبريات ضخمة منظمة ومصنفة تصنيفا ُمكام‪ ،‬يقوم عىل جتلية‬
‫املعج ِم َّية األخرى‬ ‫أبنيتها الداللية والرتكيبية‪ ،‬هذا التصنيف يوجد يف ِ‬
‫املوارد َ‬
‫رصحيا أو ضمن ًّيا يف بنية التعريف املعجمي‪ ،‬كام «حتتاج إىل بيان لنسب تردد‬
‫االستعامالت اخلاصة بكل كلمة‪ ،‬وبيان الروابط اجللية بني الدالالت‪:‬‬
‫معاين ومفاهيم ومرتادفات وفروقا لغوية‪ ،‬وتبيان الروابط بني أقسام الكالم‬
‫والتعريفات‪ ،‬والتصنيفات الفرعية (‪.)Jarmasz & Szpakowicz, 2001‬‬
‫وهناك أنواع من املعلومات جيب أن تتضمنها قاعدة املعارف وقد ال تضمن‬
‫يف املعجم املقروء آل ًّيا‪ ،‬وهي اجلوانب السياقية للوحدات املعجمية مقدمة‬
‫بشكل موسع‪ ،‬واملعارف املوسوعية (غري اللغوية) (‪.)Véronis, 1991‬‬

‫وال شك أن طبيعة املعلومات ومنهجية تقديمها هلام األمهية الكربى يف هذا السياق‪،‬‬
‫تطويرا ملجال العمل اللساين احلاسويب كله‪.‬‬
‫ً‬ ‫املعج ِم َّية‬ ‫لذا يعد تطوير منهجيات بناء ِ‬
‫املوارد َ‬

‫املعج ِم َّية‪.‬‬ ‫ِ‬


‫املوارد َ‬ ‫‪ -1‬يعد البعض قواعد املعارف املعجمية أحد أشكال‬

‫‪-24-‬‬
‫§ §املتطلبات احلاسوبية‬
‫أما املتطلبات املتعلقة بالشكل (اللغوي احلاسويب) فتتوقف عليها درجة صالحية‬
‫تعرفا واستخالصا‪ .‬فكلام كان الشكل املقدم‬ ‫النصوص املعجمية للمعاجلة احلاسوبية ُّ‬
‫من خالله هذه املعلومات مطردا ومنتظام سهل ذلك يف التناول احلاسويب هلذه املادة‬
‫وتوظيفها يف العمل اللساين احلاسويب‪.‬‬
‫املعج ِم َّية نفسها كأن‬ ‫ومن هذه املتطلبات ما هو حاسويب كالشكل الذي ختزن فيه ِ‬
‫املوارد َ‬
‫يتخذ ِ‬
‫املورد املعجمي شكل املعجم املقروء آل ًّيا‪ ،‬أو قاعدة بيانات معجمية أو غري ذلك‪.‬‬
‫إضافة إىل طريقة متثيلها يف صورة نص معجمي تقليدي أو شبكات داللية‪.‬‬
‫مي كي‬
‫املعج ّ‬ ‫عىل أنه يمكن عرض جانب من السامت التي ينبغي أن تتوافر يف ِ‬
‫املورد َ‬
‫يكون أكثر صالحية وفاعلية لدى املعاجلة احلاسوبية‪ ،‬ويمكن اعتداد هذه السامت من‬
‫عج ِم ّي للمعاجلة احلاسوبية‪:‬‬ ‫معايري احلكم عىل درجة صالحية ِ‬
‫مورد ُم َ‬
‫Ÿ Ÿالتحليلية‪ :‬أي قابلية مادة ِ‬
‫املورد املعجمي للخضوع للتحليل سواء التحليل عىل‬
‫جلملة‪ ،‬وهو ما يعني وجود قواعد‬
‫ُمستوى الكلمة أم التحليل عىل ُمستوى ا ُ‬
‫تركيبية مسبقة للتحرير حتكم عمل حمرريه‪.‬‬
‫Ÿ Ÿالتوليدية أو الرتكيبية (القابلية للتوليد)‪ :‬بأن يبنى التمثيل املعجمي يف ِ‬
‫املورد‬
‫املعجمي من وحدات ذرية (‪ )Atomic units‬متثل الوحدات الصغرى يف البنية‬
‫املعجمية الداللية‪ ،‬بحيث متكن من تعرف وتوليد اجلوانب املطردة داخل البنية‬
‫الداللية املعجم‪ .‬ومثال ذلك معجم لونجامن الذي اقترصت تعريفاته عىل‬
‫استخدام أل َف ْي كلمة تم اختيارها عىل أساس الشهرة والبساطة‪ .‬وهو املعيار‬
‫الذي تفضل معظم التطبيقات يف جمال اللسانيات احلاسوبية وأنظمة معاجلة اللغة‬
‫مور َدها املعجمي‪ .‬وذلك لعدة أسباب‬ ‫اإلنجليزية آليا؛ أن تعتمد عليه وتتخذه ِ‬
‫أمهها التزامه بقائمة كلامت ال يتجاوزها يف التعريف‪ .‬وهو أمر ذو جدوى كبرية‬
‫يف تطبيقات معاجلة اللغات الطبيعية‪ ،‬ألن قائمة الكلامت التعريفية جتعل من‬
‫املمكن التعامل حاسوبيا مع النصوص التعريفية من خالل التحليل‪ ،‬والتوليد‪،‬‬
‫والفهم‪ :‬فالفكر املعتمد عىل تذرية املكونات أكثر اتساقا والفكر احلاسويب‪.‬‬

‫‪-25-‬‬
‫Ÿ Ÿالنظامية (‪ :)Systematic‬وتعني هنا عرض املادة يف اتساق‪ ،‬ال تضارب بني‬
‫«فاملوارد املعجمية مصدر ثري للمعلومات الداللية املفصلة‪،‬‬ ‫ِ‬ ‫مكوناهتا اجلزئية‬
‫تنظيم نسق ًّيا )‪.(Litkowski, 2005‬‬ ‫ً‬ ‫غري أن معلوماهتا الداللية جيب أن ُتنَ َّظم‬
‫وتتجىل النظامية أو النسقية أيضا يف الصياغة البنيوية للمعجم‪ :‬وتعني الصياغة‬
‫البنيوية للمعجم صياغ ًة جتيل االطرادات املعجمية الداللية‪ ،‬و ُت ْظ ِهر العالقات‬
‫بني الكيانات الداللية يف املعجم‪ .‬وتعد (النظامية أو النسقية) أهم متطلبات‬
‫املعاجلة احلاسوبية ملحتوى املعجم‪.‬‬

‫املعج ِم َّية يف جمال معاجلة اللغات الطبيعية‬ ‫ِ‬


‫املوارد َ‬ ‫‪ -3.3‬توظيف‬
‫املعج ِم َّية لدى احلديث عام ينتج من تطبيقات معجمية يف جمال‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫وتظهر أمهية‬
‫تطبيقات معاجلة اللغة الطبيعية‪ ،‬مثل الربامج املكتبية (كمعالج الكلامت) وحتليل‬
‫الكالم‪ ،‬وتركيبه‪ ،‬والتلخيص اآليل‪ ،‬والفهرسة‪ ،‬واستخالص املعلومات‪ ،‬والرتمجة‬
‫جل َميل وغريها‪ ،‬إضافة إىل العون الذي يمكن أن تقدمه‬ ‫اآللية‪ ،‬والتحليل الرتكيبي ا ُ‬
‫املعجمية احلاسوبية يف جمال تعليم اللغات (يف اختيار املادة املقدمة‪ ،‬وطرائق تقديمها‬
‫بتقنيات تفاعلية)‪ ،‬ويف جمال العمل املصطلحي‪ ،‬كإنشاء بنوك املصطلحات‪ ،‬واملولدات‬
‫اآللية للمصطلحات‪ ،‬واألنظمة اخلبرية‪ .‬ولقد تعددت التطبيقات للمعجمية احلاسوبية‬
‫واملعارف املختلفة‪.‬‬
‫َ‬ ‫ِ‬
‫الفلسفات والعلو َم‬ ‫حتى غزت ‪ -‬أيضا ‪-‬‬

‫‪ -4‬الصناعة املعجمية احلاسوبية‬


‫ينبغي هنا أن نميز بني مفهومني يف إطار العالقة بني املعجم والتقنيات احلاسوبية‪:‬‬
‫األول‪ :‬هو املعجمية احلاسوبية؛ ويقصد هبا صناعة املعاجم باستخدام تقنيات‬
‫احلاسوب وقدراته يف التخزين والتحليل واالستفسار‪ ،‬ابتداء من االعتامد عىل املدونات‬
‫املحوسبة واألشكال احلاسوبية للتخزين مثل قواعد البيانات‪.‬‬
‫الثاين‪ :‬هو املعجم احلاسويب؛ ويقصد به املعجم املبني عىل أسس مفاهيمية حاسوبية‬
‫تتعدى جمرد استخدام األدوات احلاسوبية يف التحليل أو التخزين أو تيسري االستدعاء‪.‬‬
‫فنقل معاجم تقليدية وختزينها حاسوبيا ال ينتج معجام حاسوب ًّيا حقيق ًّيا‪ ،‬ولكنه ينتج‬
‫يب‪.‬‬
‫الثوب احلاسو ّ‬
‫َ‬ ‫معجم تقليد ًّيا ُمرتد ًيا‬
‫ً‬

‫‪-26-‬‬
‫ويمكن تقديم ملحة عن املسامهات احلاسوبية يف بناء معجم فيام ييل‪:‬‬
‫يوظف املعجميون احلاسوبيون الربامج واألدوات احلاسوبية يف إجراء عمليات‬
‫املعجمي‬
‫ّ‬ ‫اجلمع واالكتساب واإلحصاء والفهرسة والتحليل والتصنيف‪ .‬ثم يأيت دور‬
‫الذي يقوم بعمليات حتليل النصوص أو السياقات التي وردت فيها الكلمة أو التعبري‬
‫للتوصل إىل الدالالت‪ ،‬ثم تصنيفها إىل دالالت مركزية ودالالت هامشية ودالالت‬
‫جمازية‪ ،‬ثم يقوم بال َعنونة‪.‬‬
‫تنظيم املادة وختزينها حاسوبيا‪ :‬فتحول املادة املعاجلة إىل صورة قاعدة بيانات‬
‫معجمية متهيدً ا الستخالص مادة ِ‬
‫املورد‪/‬املوارد املعجمية منها‪ ،‬وللحاسوب الدور‬
‫األعظم يف تنسيق وتنظيم املادة‪ .‬ويذكر فريق عمل معجم «كوبيلد» )‪(COBUILD‬‬
‫للحاسوب‪ ،‬يف هذا اجلانب من تقنيات العمل‪ ،‬أنه قد قام بفرز الكلامت بطرائق متنوعة‬
‫لتصل املعلومات اخلاصة بكل كلمة إىل فريق من املحررين واملؤلفني الذين يقومون‬
‫بدورهم بدراسة هذه الكلامت إلنشاء ملف مفصل ملعانيها واستخداماهتا يف قاعدة‬
‫بيانات معجمية لتصبح بالتايل املصدر األوىل لعائلة من الكتب‪ .‬إضافة إىل وجوب ربط‬
‫معلومات قاعدة البيانات بنصوص من املدونة (‪.)Sinclair, 1996‬‬
‫وتستعمل قواعد البيانات يف توحيد املعلومات بإيكال توليد املعلومات املتشاهبة إىل‬
‫أوكل إىل احلاسوب توليد «املطلع‬‫احلاسوب وهو ما قد التزمه مرشوع معجم كوبيلد إ ْذ ِ‬
‫التعريفي» لكل معرف من املعرفات وهو ما أدى إىل إحكام لغة الرشح وضبط حمتواه‬
‫بناء عىل منهجية معتمدة يف معاجلة الرشوح (‪ .)Sinclair, 1996‬كام يوكَل إىل احلاسوب‬
‫أيضا مهمة إجراء اختبارات لضبط اإلحاالت )‪ (Cross Reference‬وضبط ما التزم‬ ‫ً‬
‫يط باحلاسوب ضبط‬ ‫ِ‬
‫به صانعو املعجم كام حدث يف مرشوع معجم لونجامن حيث ُأن َ‬
‫كلامت التعريف بحيث ال خترج كلامت التعريف عن القائمة املعتمدة‪.‬‬
‫‪ -1.4‬مراحل بناء املعجم احلاسويب‬
‫§ §التصميم‬
‫تعد مرحلة تصميم ِ‬
‫املورد املعجمي املرحلة األوىل يف صناعة العمل املعجمي‪ ،‬فيها‬
‫موردهم املعجمي وأهدافه؛ أهو معجم يستهدف املستعمل‬ ‫حيدد املعجميون طبيعة ِ‬
‫البرشي أم معجم معد ألنظمة معاجلة اللغات الطبيعية‪ .‬ومنهج بنائه حتليال ومتثيال‬
‫ملادته‪ ،‬إضافة إىل الشكل النهائي احلاسويب الذين ينوون له أن خيرج فيه‪.‬‬

‫‪-27-‬‬
‫§ §التحليل املعجمي الداليل‬
‫Ÿ Ÿالتحليل الرصيف‬
‫يمكن النظر إىل التحليل الرصيف يف العمل املعجمي باعتباره مستويني‪:‬‬
‫األول‪ :‬هو مستوى التحليل الشكيل ويقصد به التحليل إىل جذر وساق‪ ،‬وإىل جمرد‬
‫ومزيد‪ .‬وهذا النوع من التحليل مهم يف حتليل بنية املدونة النصية بغرض ختطيط اهليكلية‬
‫العامة للعمل املعجمي املزمع إنتاجه‪.‬‬
‫الثاين‪ :‬هو مستوى التحليل املعجمي الداليل للكلمة؛ ويقصد به من وجهة نظر‬
‫املعجمي جتلية عالقاهتا االشتقاقية الداللية ببقية أفراد أرسهتا الداللية بام حيقق متثيل‬
‫البنية املعجمية الداللية يف أول مستوياهتا؛ املستوى الرصيف‪ .‬وتتجىل أمهية املستوى‬
‫الرصيف يف حتليل املحتوى املعجمي الداليل للوحدة املعجمية فيام ييل‪:‬‬
‫ ‪-‬ضبط املحتوى الرصيف للوحدات املعجمية االشتقاقية وتعميقه‪ ،‬وبالتايل ضبط‬
‫املعرفات من‬
‫طريقة متثيلها يف صورة تعريفات معجمية‪ ،‬عن طريق تنميط ّ‬
‫الوجهة الرصفية‪ ،‬وهو أول خطوات ضبط لغة التعريف‪.‬‬
‫ ‪-‬تدقيق تذرية املحتوى الداليل وترشيح طبقات املعنى‪ ،‬باعتبار الرصف هو الطبقة األوىل‬
‫من طبقات الداللة‪ ،‬وهو األمر الذي سيكون له تأثريه يف تعديد املعنى وتتبع تدرجه‪.‬‬
‫ ‪-‬ضبط العالقات االشتقاقية ببيان األصل والفرع‪ ،‬وآليات االشتقاق الداليل‪،‬‬
‫وبالتايل ضبط العالقات الداللية املوازية‪ .‬وكل ذلك يؤدي إىل تعميق صياغة‬
‫البنية الداللية للمعجم وجتليتها من خالل التمثيل الداليل؛ بضبط االطرادات‬
‫الرصفية الداللية يف املعجم لتحقيق الكفاية التفسريية [‪.]33‬‬
‫ ‪-‬بناء قائمة املعجم البنية الكربى (‪ ،)Macrostructure‬وبناء املدخل البنية‬
‫الصغرى (‪ )Microstructure‬وتنظيم معلوماته‪ ،‬وتوظيف العالقات االشتقاقية‬
‫يف جتيل البنية املعجمية‪ ،‬الداللية‪.‬‬
‫ ‪-‬يعد اجلانب الرصيف أحد معايري فصل املشرتكات اللفظية (‪ )Homonyms‬عن‬
‫الوحدات املعجمية متعددة املعنى (‪ .)polysemous‬وبالتايل فإنه يوفر مادة‬
‫تسهم يف فك اللبس الداليل آل ًّيا‪.‬‬

‫‪-28-‬‬
‫Ÿ Ÿالتحليل املعجمي‬
‫ٍ‬
‫وحدات معجمي ًة تبني‬ ‫ويقصد بالتحليل املعجمي حتليل الثروة اللفظية باعتبارها‬
‫املورد املعجمي؛ ويكون ذلك بتحديد طبيعتها وكيفية إدراجها يف ِ‬
‫املورد‬ ‫قائمة مداخل ِ‬
‫املعجمي ومتطلبات معاجلة حمتواها املعجمي الداليل‪ .‬فالوحدات املعجمية متفاوتة من‬
‫حيث طبيعتها وطبيعة حمتواها املعجمي الداليل‪ .‬ومن مهام التحليل املعجمي تعيني‬
‫الصيغة املعتمدة لكل جمموعة تنوعات صيغ (‪ )Paradigms‬وهو ما يعرف بالتَّفريع‬
‫أو حتديد رأس ملجموعة تنوعات شكلية لكلمة واحدة من أجل حتديد القائمة املعتمدة‬
‫املعجمي‪.‬‬
‫ّ‬ ‫لكلامت أو مداخل ِ‬
‫املورد‬
‫وتتعاون مستويات التحليل (الرصفية والداللية والرتكيبية) يف فحص جوانب‬
‫الوحدات املعجمية‪ ،‬شكال وحمتوى معجميا دالليا‪ .‬ويمكن توظيف نتائج التحليل يف‬
‫تنميط املعرفات كام ييل‪:‬‬
‫Ÿ Ÿأنامط املعرفات حسب املقولة املعجمية للوحدة املعجمية‪ :‬وهو التصنيف املبني‬
‫عىل التحليل املعجمي الذي يميز صنفني أساسني من الوحدات املعجمية‪،‬‬
‫الوحدات املعجمية املفردة‪ ،‬والوحدات املعجمية متعددة الكلامت‪ .‬وت ِ‬
‫ُظهر‬
‫نتائج مرحلة التحليل املعجمي أنامط الوحدات املعجمية التالية‪:‬‬
‫Ÿ Ÿوحدة معجمية مفردة‪ ،‬وتشمل‪:‬‬
‫ ‪-‬الكلمة البسيطة‪ :‬وهي وحدة معجمية تامة ال يدخل يف تكوينها وحدات‬
‫أخرى‪.‬‬
‫ ‪-‬الكلمة املركبة أو املنحوتة‪ :‬وهي الوحدة املعجمية املصوغة ‪ -‬رصفيا ‪ -‬من‬
‫أكثر من كلمة عىل سبيل النحت أو الرتكيب‪ ،‬ولكنها تعامل معاملة الكلمة‬
‫عىل املستوى الشكيل (هجاء ونطقا)‪ ،‬وعىل املستوى الرتكيبي (فيكون هلا‬
‫قسم كالمي‪ ،‬وتأخذ مواقع تركيبية‪ ،‬وتكتسب حاالت إعرابية)‪ ،‬والداليل‪.‬‬
‫ومن أمثلتها‪ :‬بسمل‪« :‬قال بسم اهلل الرمحن الرحيم»‪ ،‬درعمي‪« :‬منسوب‬
‫إىل دار العلوم»‪.‬‬

‫‪-29-‬‬
‫ ‪-‬خمترص‪ :‬وهو وحدة معجمية‪ ،‬يتم يف االستعامل اللغوي االجتزاء بجزء منها‬
‫املعج ِم َّية معاملة املدخل املعجمي‪ ،‬وتدرجها يف قائمة‬ ‫ِ‬
‫املوارد َ‬ ‫عنها فتعاملها‬
‫مداخلها‪ .‬مثل‪ :‬ا هـ بمعنى انتهى‪ ،‬ت بمعنى تليفون‪ .‬‬
‫ ‪-‬االصطالح (‪ :)Idiom‬وهو التعبري الذي َي ْظهر يف االستعامل اللغوي مرتبط‬
‫األجزاء باعتباره من املسكوكات اللغوية‪ ،‬ولكن دالالته ال يمكن توقعها‬
‫من خالل معاين مفرداته؛ لكونه تركيبا سامعيا ال يمكن التعامل معه‬
‫بتحليل مكوناته‪ .‬ويمثل التعبري االصطالحي نمطا معجم ًّيا متم ِّي ًزا بسبب‬
‫هذه اخلصائص املعجمية الداللية‪.‬‬
‫ ‪-‬االسم املركب‪ :‬وهو عبارة عن تركيب من أكثر من كلمة عىل مستوى‬
‫الشكل‪ ،‬يشري إىل مفهوم أو يشء مفرد من حيث املحتوى‪ .‬وهو تركيب‬
‫تتمتع مفرداته باستقاللية رصفية وتركيبية‪ ،‬ولكنه عىل املستوى الداليل‬
‫ُينْظر إليه باعتباره وحدة مستقلة‪ .‬ويعد هذا الصنف نم ًطا معجم ًّيا متميزا‬
‫لطبيعة املحتوى التي تشبه طبيعة حمتوى الوحدة املعجمية املفردة‪ ،‬وطبيعة‬
‫الشكل الذي يشبه الرتكيب‪.‬‬
‫Ÿ Ÿوأما التصنيف بحسب املحتوى فباعتبار أن الوحدة املعجمية إما أن تكون‬
‫وحدة معجمية لغوية‪ ،‬أو مصطلحية‪ ،‬أو موسوعية (‪.)Encyclopedic Unit‬‬
‫وبالتمييز بني أنامط الوحدات املعجمية باعتبارها مداخل‪ ،‬يصبح املعجم جمموعة‬
‫من القوائم املنمطة التي يمكن التعامل معها‪ -‬حاسوبيا ‪-‬باعتبارها ملفات‪ ،‬لكل منها‬
‫متطلبات لتمثيل حمتواه املعجمي‪ ،‬وطريقة لتمثيله‪ .‬وتظهر آثار التنميط يف متثيل املحتوى‬
‫ٌ‬
‫املعجمي الداليل يف اجلوانب اآلتية‪:‬‬
‫Ÿ Ÿتسهيل التعامل احلاسويب مع املعارف اللغوية املتضمنة يف ِ‬
‫املورد املعجمي؛ ألن‬
‫التعامل مع أنامط حمددة‪ ،‬يسهل من حتليل النص املعجمي‪ .‬كام يسهل عمليات‬
‫تعبريا عن الظواهر‬
‫ً‬ ‫اإلحصاء املعجمي اآليل‪ ،‬وجعل نتائجها أدق وأصدق‬
‫املعجمية‪.‬‬

‫‪-30-‬‬
‫Ÿ Ÿتنظيم العمل عند التحرير‪ ،‬وحتقيق االقتصـاد أثناء عمليـــة التحرير‪ ،‬فالنمط‬
‫الواحد من املعرفات يتم التعامل معه بطرق حمددة يستعملها املحرر جاهزة‪.‬‬
‫Ÿ Ÿيؤدي إحكام النتائج يف هذه املرحلة إىل ضبط تصميم قاعدة البيانات املعجمية؛‬
‫لكون التنميط أحد متطلبات إنشاء قاعدة البيانات املعجمية‪ ،‬التي يتم تصميم‬
‫جداوهلا عىل أساس خمرجات هذه املرحلة من التحليل‪ ،‬وحتقيق متثيل البنية‬
‫ومادة املعجم‪.‬‬

‫Ÿ Ÿالتحليل الرتكيبي‬
‫ويشمل التحليل الرتكيبي عدة أمور‪:‬‬
‫Ÿ Ÿحتديد أقسام الكالم‪ :‬وهو تصنيف مبني عىل أسس تركيبية‪ ،‬إذ يعتمد مقوالت‬
‫معيارا للتقسيم؛ نظرا لالرتباط الوثيق بني املحتوى الداليل‬
‫ً‬ ‫أقسام الكالم‬
‫واملحتوى الرتكيبي‪ ،‬مما جيعل من كل قسم من أقسام الكالم نمطا متميزا من‬
‫الوحدات املعجمية الختالف املعاجلة الداللية ومتطلباهتا بني أقسام الكالم‬
‫املختلفة‪.‬‬
‫وتعد املقولة الرتكيبية أقدم املعايري التي تؤثر يف تقنية التمثيل املختارة ملعاجلة‬
‫وحدات املعجم‪.‬‬
‫Ÿ Ÿحتليل البنية احلملية (‪ )Argument Structure‬للوحدة املعجمية التي تظهر‬
‫السلوك الرتكيبي املحتمل للوحدة املعجمية يف االستعامل اللغوي‪.‬‬
‫Ÿ Ÿحتليل بنية احلدث (‪ِ )1‬‬
‫اجل ِه َّية (‪ )Aspectual Event Structure‬وهو جانب مهم‬
‫يف توصيف البنية الرتكيبية للفعل ومشتقاته‪ .‬وهتتم التصورات النظرية املعجمية‬

‫‪ -1‬ولعل أشهر تصنيفات بنية احلدث للفعل هي‪:‬‬


‫‪ -‬احلالة وتكون يف الفعل الذي يعرب عن صفة الزمة لصاحبها‪ ،‬مثل‪َ :‬ج ُب َن‪َ ،‬ج ِحدَ ‪ :‬قل خريه‪ .‬و تعرب املعاجم العربية‬
‫عن أفعال احلالة بعبارات منها‪ :‬ما كان‪.‬‬
‫العظم‪ :‬أصلحه‪.‬‬
‫َ‬ ‫جب‬
‫َ‬ ‫جذره‪،‬‬ ‫أخرج‬ ‫‪:‬‬ ‫د‬
‫َ‬ ‫العد‬ ‫ر‬ ‫َّ‬
‫ذ‬
‫َ َ‬ ‫ج‬ ‫مثل‪:‬‬ ‫جرب جتريبا‪ .‬معاجلة‪:‬‬ ‫‪ -‬نشاط مثل‪ :‬مجع‪َّ ،‬‬
‫‪ -‬العمل مثل جلس‪ ،‬قام‪.‬‬
‫‪َ -‬ت َُّو ٌل‪ :‬ويكون يف الفعل الذي يعرب عن انتقال الفاعل من حالة إىل حالة‪ ،‬مثل‪ :‬أجدب املكان‪ :‬صار جمدبا‪َ ،‬جت َّب َن‬
‫اللبن‪ :‬صار جبنا‪.‬‬
‫َ‬
‫‪ -‬التحويل‪ :‬مثل‪َ :‬ج َع َل‪ ،‬أ ْجل َس‪ .‬و تعرب املعاجم العربية عن أفعال التحويل بعبارات منها‪ :‬جعله‪ ،‬صريه‪.‬‬
‫َ‬

‫‪-31-‬‬
‫الداللية بتوضيح بنية احلدث اجلهية باعتبار بنية احلدث بنية مركبة‪ ،‬تتكون من‬
‫أحداث فرعية‪ ،‬وأن التوصل إىل هذه األبنية الفرعية يساعد يف توصيف الوحدة‬
‫املعجمية دالليا من جهة‪ ،‬كام يساعد يف توصيفها تركيبيا بام حيدد سلوكها‬
‫الرتكيبي من جهة أخرى‪.‬‬
‫وإذا كانت املعاجم التي تتوجه إىل املستعمل البرشي ال هتتم بتوضيح نمط بنية‬
‫احلدث فإن ذلك يعود إىل أن هذه املعاجم مقدمة للمستعمل البرشي الذي يمكنه‪-‬‬
‫بالسليقة‪ -‬تركيب املفردات تركيبا متناغام دون تنافر داليل تركيبي‪ ،‬لألنامط التي تأتلف‬
‫واألنامط التي ال تأتلف‪ .‬أما املعاجم احلاسوبية التي جتعل من بني أهدافها أن تكون‬
‫ِ‬
‫مور ًدا للمعلومات املعجمية الداللية للتطبيقات احلاسوبية فينبغي أن ُت َف َّصل أنامط أبنية‬
‫تفصل يف ذلك التفصيل املوجود يف التحليل املوجود يف الدِّ الالت‬ ‫احلدث‪ ،‬عىل أهنا ال ّ‬
‫املعج ِم َّية ولكن فقط يشار إىل احلدث األبرز يف بنية احلدث‪ .‬ويتوقف اعتامد ِ‬
‫املورد‬ ‫َ‬
‫ِ‬
‫املعجمي عىل أنامط دون غريها عىل طبيعة مقاربته وأهداف مورده املعجمي؛ وذلك كله‬
‫يف إطار التصور النظري احلاكم للعمل واملوجه له‪.‬‬

‫Ÿ Ÿالتحليل الداليل‬
‫يف مرحلة التحليل الداليل يتم التعامل مع ظاهرة تعدد املعنى وما تستدعيه من‬
‫قضايا أخرى مثل املجاز واالستعارة‪ ،‬ومتييز املشرتك اللفظي عن متعدد املعنى‪ .‬كام‬
‫يشمل التحليل الداليل اجلوانب التالية‪ :‬تصنيف الكلمة حسب حقلها الداليل الذي‬
‫تنتمي إليه‪ .‬واكتشاف العالقات الداللية التي تقع الكلمة طرفا فيها‪.‬‬
‫إضافة إىل تعيني قيود االنتقاء (‪ )Selection Restrictions‬للكلامت‪ .‬إذ متثل القيود‬
‫االنتقائية أمهية كبرية ألنظمة معاجلة اللغات الطبيعية إذ حياول املعجمي فيها حماكاة‬
‫تعرف الرتاكيب مقبــولة التأليــف‬ ‫العقل البرشي يف قدرته الرتكيبية‪ ،‬التي متكّنه من ُّ‬
‫ِ‬
‫املعجم َّية التي تستهدف أنظمة‬ ‫ِ‬
‫املوارد‬ ‫من تلك التي تعد غري مقبولة التأليف؛ لذا فإن‬
‫َ‬
‫معاجلـــة اللغات الطبيعية تعتني اعتناء كبريا بتوضيح أنامط القيود االنتقائية للوحدات‬
‫املعجمية‪.‬‬

‫‪-32-‬‬
‫§ §التمثيل املعجمي‬
‫التحقق الفعيل للمنهجية املعتمدة عىل ِ‬
‫املورد املعجمي‪ ،‬كام أنه يعد‬ ‫َ‬ ‫ُي َعدُّ التمثيل‬
‫َّ‬
‫الصياغة الرسمية ملخرجات مرحلة حتليل املدونة النصية‪ .‬ويظل التعريف‪ -‬حتى‬
‫اآلن‪ -‬أهم أشكال متثيل املحتوى املعجمي الداليل‪ ،‬وأهم مصادر املعارف املعجمية‬
‫عىل مستوى املستعمل البرشي والتوظيف احلاسويب‪.‬‬
‫وخيتلف التمثيل للمستعمل البرشي عن التمثيل لآللة‪ :‬فالثاين أكثر عمقا وتفصيال‪،‬‬
‫ٍ‬
‫تصور َيرنُو إىل‬ ‫أي‬
‫وابتعادا عن اجلوانب الضمنية التي ترتك لسليقة املستعمل‪ .‬وهيدف ُّ‬
‫تقديم منهجية لتمثيل املحتوى املعجمي الداليل ألنظمة معاجلة اللغات الطبيعية إىل‬
‫حتقيق جمموعة األهداف التالية‪:‬‬
‫Ÿ Ÿالتعميق املعجمي الداليل للمحتوى‪ ،‬بحيث يقدم املعارف اللغوية الالزمة‬
‫للتطبيقات احلاسوبية بصورة جلية‪.‬‬
‫Ÿ Ÿ الصياغة املنضبطة للغة التمثيل املعجمي‪ ،‬ومتثيل البنية املعجمية الداللية‬
‫بالتوصل إىل البنية الذرية جلميع املستويات بام يتالءم مع املقاربات احلاسوبية‪.‬‬
‫Ÿ Ÿالتامسك واالتساق بني إجراءات التحرير فيام بينها من جهة‪ ،‬وبني املنطلقات‬
‫النظرية للتصور النظري التي يتبناها ِ‬
‫املورد املعجمي‪.‬‬
‫Ÿ Ÿاإلسهام يف فك اللبس‪ ،‬بتجميع األشكال املمكنة للمفردة الواحدة‪ ،‬وترصيفاهتا‪،‬‬
‫وفصل املشرتكات اللفظية‪ ،‬وفصل املعاين ومتييزها‪ ،‬وتوضيح القيود السياقية‬
‫والقيود الرتكيبية‪ ،‬وتصنيف الوحدة املعجمية بحسب احلقل الداليل‪ ،‬وجتلية‬
‫العالقات الداللية‪ ،‬والسامت الداللية‪.‬‬
‫ولعل أهــم اإلشكاالت التي ينبغي أن يؤسس هلا نظريا يف مرحلة التمثيل‪ ،‬لدى‬
‫أي حماولة لبناء ِ‬
‫مورد معجمي هي منهجية متثيل متعدد املعنى ومنهجية متثيل البنية‬
‫املعجمية‪.‬‬

‫‪-33-‬‬
‫Ÿ Ÿمتثيل الوحدة املعجمية متعددة املعنى‬
‫من القرارات األولية ذات األمهية اختاذ موقف يف طريقة التعامل مع متعدد املعنى‪،‬‬
‫وتقنيات متييز هذه املعاين املتعددة (‪ .)1‬وطريقة تنظيم املعاين يف متن املعجم أو قاعدة‬
‫املعج ِم َّية يف منهجيات متثيل املحتوى املعجمي الداليل‪،‬‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫البيانات‪ ،‬فكام تتباين‬
‫تتفاوت يف وسائل متييز معاين الوحدة املعجمية الواحدة متعددة املعنى‪ .‬وتعد وسائل‬
‫التمييز بني املعاين من أهم مالمح منهج التمثيل ألي ِ‬
‫مورد معجمي؛ ملا هلا من تأثري يف‬
‫التطبيقات التي تقصد إىل فك االلتباس الدِّ ال ّيل‪.‬‬
‫وترتكز اإلشكاليات التي يوليها املعجميون االهتامم‪ ،‬لدى معاجلة متعدد املعنى‪ ،‬يف‬
‫مستوى التمثيل املعجمي يف جانبني‪:‬‬
‫Ÿ Ÿتقنيات التمييز بني املعاين‪ :‬ويقصد هبا متييز املعجميني املعاين املتعددة للوحدة‬
‫املعجمية‪ .‬وتعود أمهية ذلك بالنسبة للعمل احلاسويب إىل كوهنا من أكثر أسباب‬
‫وقوع اللبس عىل املستوى الداليل‪ .‬حتى إنه مل يعد مقبوال من أي نظرية تتصدى‬
‫للداللة املعجمية عموما والداللة املعجمية احلاسوبية عىل وجه اخلصوص أال‬
‫تُقدِّ َم تصوراهتا النظرية وإجراءاهتا العملية ملجاهبة تعدد املعنى حتليال ومتييزا‪،‬‬
‫بحيث يكون ذا خطوة واسعة يف سبيل فك لبس الوحدة املعجمية يف السياقات‬
‫املختلفة التي من املمكن أن تقع فيها‪.‬‬
‫Ÿ Ÿمتثيل املعاين املتعددة وحتديد الروابط بينها‪ :‬واملشكلة الثانية التي تفرض نفسها‬
‫يف مسألة متثيل املعاين املتعددة هي مسألة تنظيم هذه املعاين وحتديد الروابط‬
‫ُسد املعاين‬
‫الداللية فيام بينها‪ .‬وهي قضية قديمة قدم الصناعة املعجمية‪ ،‬فهل ت ْ َ‬
‫بال أساس أم يعتمد أساس للرتتيب وتوضيح العالئق البينية هلذه الدالالت‪.‬‬
‫ويف ترتيب الدالالت تعددت اإلسرتاتيجيات املقرتحة واملنجزة يف هذا املجال‪،‬‬
‫حيكم اختيارها طبيعة املعجم وغايته‪ ،‬فتشمل هذه اإلسرتاتيجيات التنظيم‬
‫التارخيي‪ ،‬واملنطقي‪ ،‬واإلحصائي الوصفي‪ ،‬والتفسريي‪ .‬ومن اإلشكاالت‬

‫املعج ِم َّية‪ ،‬وهي‪ :‬معايري‬ ‫ِ‬


‫املوارد َ‬ ‫‪ -1‬قدم بو سفينسني ‪ Bo Svensén‬جمموعة من حمددات املعنى التي يتم تداوهلا يف حترير‬
‫ِ‬
‫رصفية‪ ،‬ومعايري سياقية ‪ Syntagmatic‬تركيبية‪ ،‬ومعايري استبدالية رأسية ‪ ،Paradigmatic‬ومعايري برمجات َّية‬
‫‪Pragmatic. (Spohr, 2012).‬‬

‫‪-34-‬‬
‫املتعلقة بمعاجلة متعددة املعنى كيفية متثيل املجاز واملجاز املرسل‪ :‬أباعتباره‬
‫داللة للوحدة املعجمية‪ ،‬أم باعتباره داللة هلا خصوصية‪ ،‬ينبغي التعامل معها‬
‫بطريقة خمتلفة عن بقية الدالالت التي تعد املعاين احلقيقية‪.‬‬

‫Ÿ Ÿمتثيل البنية املعجمية الداللية‬


‫ٍ‬
‫مقومات‬ ‫البنية املعجمية الداللية هي رؤية للمعجم ترى يف جوانبه املعجمية الداللية‬
‫ُت َ ِّك ُن من صياغتها صياغ ًة ُ َتيل أنام َطها والعالقات التي تربط بينها‪ ،‬بحيث يتجىل املعجم‬
‫يف صورة منظومية‪ .‬ولقد ازداد االهتامم بالبحث يف بنية املعجم بدخوله يف السياق‬
‫احلاسويب إذ أصبح حتقيق البنية املعجمية مطلبا تقليديا أو أوليا من مطالب احلوسبة‬
‫املعجمية‪ .‬للدرجة التي دفعت بعض من يؤرخون لظهور مصطلح املعجمية احلاسوبية‬
‫بظهور أطروحة آمسلر (‪ )Amsler‬التي كان موضوعها فحص بنية تعريفات معجم‬
‫ويبسرت للجيب (‪.)Amsler, 1980‬‬
‫أما البنية املعجمية يف السياق احلاسويب فقد فرضت عىل كل من تصدى القرتاح‬
‫منهجية شاملة ملعجم أن يقدم تصورا متكامال آلليات هذه املنهجية وإجراءاهتا إلظهار‬
‫بنية املعجم حموسب ًة‪ .‬فقواعد البيانات املعجمية واألعامل الشبكية فرضت مفاهيمها‬
‫املعج ِم َّية فيام بينها يف طريقة صياغة‬ ‫البنائية النسقية عىل العمل املعجمي‪ .‬وختتلف ِ‬
‫املوارد َ‬
‫بنية معجمية داللية للمعجم‪ ،‬فاملكانز املعجمية واألعامل الشبكية مثل‪ :‬شبكة الكلامت‬
‫وشبكة األطر والشبكة الذهنية هلي أكثر إحكاما يف صياغة البنية املعجمية الداللية من‬
‫نظرا لطبيعة التمثيل املعجمي الداليل الذي تقوم عليه‪،‬‬‫املعاجم املقروءة آليا؛ وذلك ً‬
‫فتشييدها يقوم باألساس عىل متثيل العالقات املعجمية الداللية بني وحدات املعجم‪.‬‬
‫عتمد عليها يف‬
‫ويعد متثيل النظريات املعجمية بنية املعجم الداللية أحد املعايري التي ُي َ‬
‫تقييم كفاية نظرية‪ ،‬وتفضيل تصور نظري عىل آخر منافس له‪ .‬فالبنية املعجمية الداللية‬
‫ليست ترفا علميا بل مطلبا رضوريا ألية نظرية تتصدى إلنجاز متثيل للمعجم‪.‬‬

‫‪ -2.4‬التقييس املعجمي‬
‫يقصد بالتقييس املعجمي وضع مواصفات ينبغي حتقيقها يف النص املعجمي عىل‬
‫مستوى بنيته الكربى وبنيته الصغرى‪ ،‬شكال وحمتوى‪ ،‬وذلك لتنميط لغة التمثيل‬

‫‪-35-‬‬
‫املعجمي بحيث يسهل التعامل معها حاسوبيا عند إرادة معاجلة اللغة آل ًّيا‪ .‬ومن‬
‫عج ِم َّية هو مرشوع تقييس املحتوى املعجمي وطريقة‬ ‫املرشوعات التي تبنتها ِ‬
‫موارد ُم َ‬
‫املوارد احلاسوبية‪ .‬ولعل مرشوع (‪Lexical Markup Frame work -‬‬ ‫ِ‬ ‫تقديمه يف‬
‫ِ‬
‫املوارد املعجم َّية‪ .‬وهيدف املرشوع إىل االتفاق‬ ‫‪ )1( )LMF‬هو النموذج األشهر لتقييس‬
‫املوسع عىل طريقة يف متثيل املحتوى املعجمي الداليل‪ ،‬حتى يتسنى اإلفادة منها خصوصا‬
‫يف جمال معاجلة اللغات الطبيعية‪.‬‬

‫‪ -3.4‬التقويم املعجمي‬
‫ِ‬
‫للموارد املعجمية‪ ،‬وهو أمر له أمهيته يف تطوير العمل املعجمي عن طريق نقده‬ ‫التقويم‬
‫وتقييمه باعتامد معايري للتقييم واملفاضلة بني املرشوعات املختلفة‪ .‬ومثل أي تصور ينبغي‬
‫قياس درجة كفايته مقارنا بالتصورات املقرتحة املنافسة (السابقة)‪ .‬والكفاية تعني مدى‬
‫ما حيققه التصور النظري من دقة يف متثيل الظواهر اللغوية‪ :‬مالحظة ووصفا وتفسريا‪.‬‬
‫وقد تعددت معايري اختبار الفرضيات اللغوية لتغطي كل جماالت الظواهر املدروسة‪.‬‬
‫فقد أعاد جاكندوف توظيف مقرتح تشومسكي بخصوص مستويات الكفاية اللسانية‬
‫للنظرية النحوية يف جمال النظرية املعجمية‪ ،‬فاقرتح جاكندوف ‪))Jackendoff, 1975‬‬
‫صد َّية (‪ )Observational Adequacy‬بأن يكون‬ ‫املستويات الثالثة التالية‪ :‬الكفاية الر ِ‬
‫َّ‬
‫ٍ‬ ‫ٍ‬
‫املورد املعجمي ممثال لبنية معجم اللغة التي يمثلها؛ وحدات معجمي ًة واستعامالت‪.‬‬ ‫ِ‬
‫والكفاية الوصفية (‪ )Descriptive Adequacy‬بأن تستطيع قائمة الوحدات املعجمية‬
‫توصيف‪/‬متثيل البنية املعجمية الداللية للمعجم‪ :‬كيانات وعالقات‪ ،‬ومتثيل مقوالت‬
‫التحليل املعجمي الداليل‪ ،‬وأنامطه التي تم التوصل إليها‪ .‬والكفاية التفسريية( (�‪Explan‬‬
‫‪ )atory Adequacy‬وتعني القدرة عىل متثيل البنية املعجمية متثيال يوضح العالقات‪،‬‬
‫واالطرادات‪ ،‬واالختالفات‪ ،‬والفروق الداللية‪ .‬وأن تكون مصوغة صياغة بنيوية‪.‬‬
‫وقد تعرضت هذه األفكار للمراجعة والتطوير‪ .‬ومما ينبغي ذكره يف هذا السياق إضافة‬
‫بوسطيوفسكي( (‪ )Pustejovsky,1995‬مستوى آخر‪ ،‬هو الكفاية التَّجريب َّية (�‪Empir‬‬
‫‪ )ical Adequacy‬وتعني الصمود أمام حتقيق القدر األكرب من النجاح يف االختبارات‬

‫‪ -1‬رابط املرشوع هو‪.http://www.lexicalmarkupframework.org :‬‬

‫‪-36-‬‬
‫الذي تتعرض له مادة ِ‬
‫املورد املعجمي أثناء التعامل معها حاسوبيا عن طريق التطبيقات‬
‫احلاسوبية (‪.)Ide & Romary, 2002‬‬
‫وبصورة أكثر عملية يمكن تطوير جمموعتني من املعايري لقياس الكفاية اللسانية‬
‫ِ‬
‫للمورد املعجمي‪:‬‬ ‫احلاسوبية‬
‫Ÿ Ÿجمموعة املعايري التي تتوجه إىل طبيعة املحتوى املعجمي‪ :‬وتشمل درجة‬
‫استيعاب الوحدات املعجمية واملعاين‪/‬الدالالت‪ ،‬ودرجة عمق التحليل‬
‫اللساين للمعلومات املقدمة وجدواها يف تطبيقات معاجلة اللغات الطبيعية‪.‬‬
‫Ÿ Ÿجمموعة املعايري التــي تتوجـــه إىل لغة متثيل املحتـوى املعجمي‪ :‬وتتمثـل يف‬
‫َّحــو ّي الستخـــالص‬ ‫حتليلية التمثيل؛ أي قابلية ِ‬
‫املورد املعجمي للتحليل الن ِ‬
‫املعلومات واألنمـــاط اللغوية من ِ‬
‫املورد املعجمي‪ ،‬وفاعليـــة متثيــل البنية‬
‫املعجمية‪.‬‬

‫املعج ِم َّية العربية احلاسوبية‬ ‫ِ‬


‫املوارد َ‬ ‫‪-5‬‬
‫املعج ِم َّية التقليدية‪/‬غري احلاسوبية‪ ،‬تتنوع ماد ًة‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫للغة العربية ثروة كبرية من‬
‫ومنهجا وحجام‪ ،‬كام أن هلا ثروة معجمية حاسوبية آخذة يف النمو والتطور ويف الوقت‬
‫موار ِده‬
‫املعج ِم َّية الورقية يف بناء ِ‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫ذاته استعان العمل املعجمي احلاسويب بامدة‬
‫املعجمية‪.‬‬

‫املعج ِم َّية العربية يف عالقتها بالعمل احلاسويب‬ ‫ِ‬


‫املوارد َ‬ ‫‪ -1.5‬أنامط‬
‫املعج ِم َّية العربية احلاسوبية عىل اختالف يف طبيعتها وغايتها‬ ‫تم تطوير عدد من ِ‬
‫املوارد َ‬
‫املعج ِم َّية العربية يف عالقتها بالعمل‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫ودرجة كفايتها‪ .‬ويف ما ييل رصد ألنامط‬
‫اللساين احلاسويب‪:‬‬
‫مورد معجمي تقليدي إىل الشكل احلاسويب‪ ،‬باعتباره نصا‪ .‬ويكون‬ ‫Ÿ Ÿويكون بنقل ِ‬
‫ِ‬
‫املورد املعجمي يف هذه احلالة مقروءا للمستخدم البرشي باعتباره نسخة مرقمنة‬
‫من معجم تقليدي‪ ،‬ويمكن للربنامج احلاسويب التعامل معها باعتباره نصا‪.‬‬
‫املعج ِم َّية‪.‬‬ ‫ِ‬
‫املوارد َ‬ ‫وهذا املستوى هو أبسط أنامط التعامل احلاسويب مع‬

‫‪-37-‬‬
‫املعج ِم َّية التقليدية‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫Ÿ Ÿاملعاجم التقليدية املحوسبة‪ .‬ويكون بتخزين مادة‬
‫يف أشكال حاسوبية كقواعد البيانات؛ بام ييرس طريقة التعامل معها سواء‬
‫املعج ِم َّية هي‪ ،‬يف‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫للمستعمل البرشي أو الربامج احلاسوبية‪ .‬وهذه‬
‫عج ِم َّية تقليدية ُألبِست ثوبا حاسوبيا بإدخاهلا ‪ -‬عرب لوحة‬ ‫ِ‬
‫موارد ُم َ‬ ‫احلقيقة‪،‬‬
‫املفاتيح ‪ -‬كام هي ودون تغيري كبري يف طبيعة املعاجلة‪ ،‬باستثناء ما فرضته طبيعة‬
‫الشكل احلاسويب تنظيام للامدة وطريقة العرض واالستعالم‪ ،‬وجتعل هذه األعامل‬
‫عيل أسطوانة أو أتيحت للبحث عيل شبكة املعلومات الدولية( (�‪On-line Dic‬‬
‫املعج ِم َّية يمكن اعتباره معجام تقليديا رغم‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫‪ .)tionary‬وهذا النمط من‬
‫اعتامده عىل احلاسوب يف أحد جوانبه‪ ،‬ملا فيه من احتفاظ بكل خصائص املعجم‬
‫التقليدي‪ .‬ومن ذلك معجم الغني‪ ،‬واملعجم العريب الشامل‪ ،‬واملعجم الوسيط‬
‫يف نسخته املحوسبة وغريها‪.‬‬
‫عج ِم َّية تقليدية استعانت يف تنظيم مادهتا وإحصائها وإخراجها‬ ‫ŸŸ ِ‬
‫موارد ُم َ‬
‫باحلاسوب‪ .‬فعىل مستوى الصناعة املعجمية بدأ توظيف احلاسوب يف بناء عدد‬
‫املعج ِم َّية مثل معجم اللغة العربية املعارصة‪.‬‬ ‫ِ‬
‫املوارد َ‬ ‫من‬
‫املورد املعجمي احلاسويب‪ :‬ويقصد به بناء ِ‬
‫املورد املعجمي عىل أسس من املفاهيم‬ ‫ŸŸ ِ‬
‫احلاسوبية خصوصا يف مراحل متثيل املعلومات املعجمية‪ ،‬باالعتامد عىل تصور‬
‫نظري؛ بام حيقق متطلبات املقاربة احلاسوبية للامدة املعجمية‪.‬‬
‫املعج ِم َّية العربية القائمة ما ييل‪:‬‬ ‫ِ‬
‫املوارد َ‬ ‫ومن أمثلة‬
‫Ÿ Ÿشبكة الكلامت العربية‬
‫شبكة الكلامت العربية هو مرشوع منبثق عن املرشوع املركزي( (�‪Global Word‬‬
‫‪ ،)Net‬ويقوم التصور األسايس يف هذا العمل عىل االعتامد عىل املرشوع األسايس باللغة‬
‫اإلنجليزية وسحبه إىل العربية عرب معجم ثنائي اللغة‪ :‬إنجليزي‪/‬عريب‪ .‬ويتبنى هذا‬
‫العمل جل التصورات النظرية واألدوات التطبيقية ملرشوع شبكة الكلامت اإلنجليزية‪،‬‬
‫بل إنه ينطلق من اإلنجليزية متبنيا افرتاضا يرى أن تلك املنهجية هو الطريقة املثىل لبناء‬
‫مورد معجمي عريب حاسويب يف أرسع وقت لتحقيق أكرب قدر ممكن من اإلفادة يف‬ ‫ِ‬
‫تطبيقات معاجلة اللغة الطبيعية‪ .‬ويمكن النظر إىل هذا املرشوع باعتباره مور ًدا معجميا‬

‫‪-38-‬‬
‫ثنائي اللغة ال يغني بحال عن النهوض بمرشوع لشبكة لفظية عربية تنطلق أساسا من‬
‫املعجم العريب‪ ،‬ومن طبيعته الرصفية والرتكيبية والداللية‪.‬‬

‫Ÿ Ÿمرشوع املعجم العريب التفاعيل‬


‫هيدف مرشوع املعجم العريب التفاعيل إىل بناء معجم عريب حاسويب (تفاعيل) ولعل‬
‫هذا املرشوع أكرب املرشوعات املعجمية العربية ملا توفر له من إمكانات فنية ومالية‬
‫وسياسية وإعالمية‪ ،‬باعتباره مرشوعا عربيا قوميا بات من رضورات العرص املعلومايت‪.‬‬
‫وقد دعا القائمون عىل املرشوع عددا كبريا من املختصني يف هذا املجال الستقصاء‬
‫اجلوانب الفنية واألفكار العلمية التي يمكن أن يفاد منها يف بناء هذا ِ‬
‫املورد املعجمي‪.‬‬
‫وقدم هذا احلشد من (خرباء املعجم) عددا من األوراق البحثية تكاد تغطي معظم‬
‫عج ِم ّي حاسويب‪ .‬ولكن يالحظ يف هذا السياق هو عدم تغطية‬ ‫جوانب بناء ِ‬
‫مورد ُم َ‬
‫األوراق (ومن ثم التوصيات النهائية) أهم جوانب العمل املعجمي احلاسويب وهو‬
‫جانب متثيل املحتوى املعجمي الداليل‪ .‬الذي مل تفرد له ورقة بحثية واحدة‪ ،‬ومن ثم‬
‫اكتفي بالعمل باالعتامد عىل املعاجم التقليدية يف ذلك‪.‬‬
‫ِ‬
‫للموارد العربية املعجمية‬ ‫‪ -2.5‬مراجعة نقدية‬
‫حقق العمل املعجمي العريب احلاسويب نتائج طيبة عىل املستويني؛ البحثي والتطبيقي‪،‬‬
‫فعىل املستوى البحثي يوجد عدد من الدراسات التي ترتكز عىل العمل املعجمي‬
‫احلاسويب من منطلقات لغوية أو من منطلقات حاسوبية‪ .‬وعىل املستوى التطبيقي تم‬
‫املعج ِم َّية العربية منها ما كان مبنيا عىل أسس معجمية داللية مثل‬ ‫ِ‬
‫املوارد َ‬ ‫تطوير عدد من‬
‫مرشوع بروب‪-‬بنك العربية (‪ )Arabic PropBank‬التي بنيت بالتوازي مع جمموعة‬
‫املعج ِم َّية للغات أخرى أمهها بروب‪-‬بنك اإلنجليزية‪ ،‬واختذت مدونتها من‬ ‫ِ‬
‫املوارد َ‬ ‫من‬
‫أعداد من جريدة النهار اللبنانية‪ .‬وقد أخذت بعض املرشوعات العربية تفيد من النظرية‬
‫الداللية‪ ،‬مثل بناء‪ :‬قاعدة للدالالت املعجمية العربية مؤسسة عىل نظرية احلقول‬
‫عج ِم ّي داليل تقوم‬ ‫الداللية‪ ،‬إذ تم فيها توظيف نظرية احلقول الداللية يف بناء ِ‬
‫مورد ُم َ‬
‫مي‬
‫املعج ّ‬
‫املورد َ‬‫بنيته عىل توظيف ‪ 20‬نمطا من أنامط العالقات الداللية‪ ،‬واعتمدت هذا ِ‬
‫يف مادته األساسية عىل املكنز الكبري‪.‬‬

‫‪-39-‬‬
‫وبالرغم من النشاط الواضح يف جمال العمل املعجمي العريب احلاسويب فإن هناك ما‬
‫يشبه االتفاق بني العاملني يف املجال املعجمي وجمال اللسانيات احلاسوبية عىل أن ِ‬
‫املوارد‬
‫املعج ِم َّية العربية يعوزها الكثري من التطوير بحثيا وتطبيقيا لتواكب التطور احلادث هلذا‬
‫َ‬
‫املجال يف السياق العاملي من جهة وليحقق متطلبات جمال اللسانيات احلاسوبية‪ .‬ويمكن‬
‫إيراد بعض املالحظات عىل واقع العمل املعجمي العريب احلاسويب كام ييل‪:‬‬
‫Ÿ Ÿمشكالت يف التأسيس النظري‪ :‬إذ تعتمد معظم قواعد البيانات العربية عىل‬
‫املعج ِم َّية التقليدية إىل جداول قاعدة‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫مفهوم للحوسبة‪ ،‬يرى يف نقل‬
‫البيانات‪ ،‬حوسبة تامة للمعجم‪ ،‬غري أن العمل احلاسويب يقتيض القيام عىل‬
‫مي‪،‬‬
‫املعج ّ‬
‫املورد َ‬‫أفكار حاسوبية‪ ،‬ابتداء من تصور الغايات التي من أجلها ُيبنى ِ‬
‫ومنهجية التحليل والتمثيل‪ ،‬وتصور طبيعة املحتوى املعجمي الداليل‪.‬‬
‫Ÿ Ÿفمن املفاهيم التي ينبغي أن يتخذ فيها موقف مبني عيل درس نظري؛ املوقف‬
‫من التجمعات اللفظية إ ْذ إنه غري واضح أو حمدد وبه اختالط‪ ،‬فالفروق‬
‫ليست جليه بني أنواع هذه التجمعات‪ .‬ويشتد اخللط عند احلديث عن التعبري‬
‫االصطالحي ‪ .Idiom‬عيل أن هذا املوقف ليس له أن ينضبط ما مل يعتمد عيل‬
‫نظري شامل‪ ،‬ومدونة حموسبة حتلل النتائج املستخرجة منها ثم يتم‬ ‫ٍّ‬ ‫ٍ‬
‫تأسيس‬
‫متثيلها عىل أسس معجمية داللية‪ .‬إذ ال أمل يف تعريف احلاسوب التَّعبريات‬
‫االصطالحية ‪ -‬مثال ‪ -‬فيتعرف عليها آل ًّيا يف النصوص التي تقدم إليه ويعرف‬
‫معناها (مقابلها إذا كان احلديث عن تطبيقات الرتمجة اآللية) ما مل تكن األفكار‬
‫النظرية واضحة يف أذهان مطوريه ابتدا ًء‪.‬‬
‫Ÿ Ÿمركزية الرصف يف املعاجلات احلاسوبية للمعجم وطغيان فكرة (اجلذر ‪ -‬اجلذع‬
‫‪ -‬الوزن ‪ -‬املجرد املزيد ‪ )..‬عيل الفكر املعجمي احلاسويب وذلك مردوده إىل‬
‫أمرين‪ :‬سهولة السيطرة عيل مادة املعجم تنظيام واستعالما من خالل الرصف‬
‫(أو املحلالت الرصفية) لصورية املقاربة الرصفية أو شكليتها وإمكان إخضاعها‬
‫للحوسبة دون الدخول يف غياهب الداللة والرتكيب واألمر الثاين هو بقايا‬
‫تكبل بالفكر املعجمي التقليدي‪ .‬عيل أننا ال نعيب االهتامم بالرصف إنام نعيب‬
‫اعتداده املحور الوحيد الذي يدار عليه املعجم‪ ،‬وهذا موقف نظري أدى إىل‬
‫إمهال البحث يف جوانب بنية املعجم التي هي من أهم القضايا يف جمال العمل‬

‫‪-40-‬‬
‫املعجمي احلاسويب الغريب‪ ،‬عىل أن البنية املعجمية هي التي يتجيل فيها الزخم‬
‫وتنظيم‪.‬‬
‫ً‬ ‫تنظريا‬
‫ً‬ ‫النظري الذي حكم املعجم‬
‫Ÿ Ÿعدم ظهور آثار احلاسوب يف جمال العمل املعجمي الورقي أو احلاسويب فلم نر‬
‫مثال معاجم لالستعامل أو معاجم التجمعات أو قوائم بأكثر الكلامت ُشيو ًعا‬
‫أمرا‬
‫ومعانيها‪ .‬وهي األمور التي ستكون معاجلتها من خالل املدونة املحوسبة ً‬
‫ال إن هي بنيت عيل تنظري لساين‪ .‬فإيل اآلن مل خيرج لنا معجم بمواصفات‬ ‫سه ً‬
‫معجم لونجامن لإلنجليزية املعارصة‪ ،‬أو كولينز كوبليد وكل ما رأيناه هي‬
‫معاجم ال تقدم جديدا غري تسهيل عملية البحث‪ ،‬هذه املعاجم يمكن أن نطلق‬
‫عليها املعاجم املحوسبة التقليدية‪.‬‬
‫Ÿ Ÿوأما ما خيص اجلانب احلاسويب فإن احلاسوبني قد َأ ْو َلوا اجلانب احلاسويب‬
‫جل اهتاممهم عىل حساب اجلانب اللساين واللغوي ‪ -‬وتلك َم َه َّم ُة اللسانيات‬
‫احلاسوبية ‪ -‬فاكتفوا بمعاجلة املعاجم الكائنة مع تطويعها للقالب احلاسويب‪،‬‬
‫دون حماولة اقرتاح تصور نظري معجمي داليل للمعجم احلاسويب املنشود‪،‬‬
‫فظلت التصورات املوجهة نحو املعجم احلاسويب‪ -‬رغم وجاهة كثري منها‬
‫تطبيقيا‪ -‬لصيقة بجدار الرصف (االشتقاق والترصيف)‪.‬‬
‫Ÿ Ÿالرتكيز عىل اجلوانب السكونية للمعجم العريب بالرتكيز عىل رسد الدالالت أو‬
‫املعاين اخلاصة بالكلامت‪ ،‬دون اجلوانب الديناميكية التوليدية لرصد اآلليات‬
‫املتعلقة بآليات توليد الدالالت اجلديدة يف السياقات اجلديدة‪.‬‬
‫Ÿ Ÿتقليدية املقاربة احلاسوبية للمعجم‪ :‬فقد ورثت املعجمية العربية احلاسوبية‬
‫ُجل املشكالت النظرية عن املعجمية التقليدية لذا فإن معظم هنات املعجم‬
‫التقليدي تظهر يف املعجم احلاسويب‪ .‬إذ تتبنى املرشوعات املعجمية احلاسوبية‬
‫األفكار املعجمية والرتكيبية والداللية التقليدية؛ فيظهر املعجم وكأنه نسخة من‬
‫املعجم التقليدي اختذت ثو ًبا حاسوب ًّيا‪ ،‬دون تبني تصور خاص يف استكشاف‬
‫البنية املعجمية الداللية العربية‪ .‬وتظهر التقليدية يف مقوالت التصنيف الرصفية‬
‫املعج ِم َّية املحوسبة عيل‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫والرتكيبية والداللية املعتمدة‪ .‬واعتامد معظم‬
‫املعاجم التقليدية التي هي نفسها تفتقر إىل األسس النظرية البحثية التي جتعلها‬
‫مادة كافية بمطالب معاجلة اللغات الطبيعية أو حتى أن تكون ذات كفاية وصفية‬

‫‪-41-‬‬
‫عج ِم َّية تتوجه للمستعمل البرشي وهو ما الحظه عبد القادر الفاريس‬ ‫ِ‬
‫كموارد ُم َ‬
‫الفهري عيل املعاجم العربية من قصور وافتقار للكفاية الوصفية ونقص يف‬
‫االستيعاب وعدم النسقية أو االنتظام يف جوانب النطق والرصف والرتكيب‬
‫والداللة أو جانب التأصيل ‪.Etymology‬‬
‫واعتامد مفاهيم لغوية تقليدية مما يؤثر عيل دقة النتائج التي خيرجها البحث‬
‫احلاسويب‪ ،‬وحتديث املفاهيم اللغوية واملعجمية ينبغي أن تسبق التحديث‬
‫التقني إذ إن األول هاد ومرشد للثاين ال العكس‪ .‬وال شك أن حل اإلشكاالت‬
‫التنظريية حال نظريا يف املعجم التقليدي ستظهر آثارها يف املعجم احلاسويب‬
‫فاملعاجلة احلاسوبية للمعجم مرآة تعكس املنجز التنظريي وحترص نتائجها‬
‫ثم تعيد متثيلها‪ ،‬فال يمكن أن نعتقد أن تقنيات التخزين ومعاجلة املعلومات‬
‫حاسوبيا ستكون معاجلة منضبطة ما مل تكن قد توفرت هلا ضوابط نظرية حمددة‬
‫قبال‪ ،‬ثم يأيت العمل احلاسويب تطبيقا هلا‪.‬‬
‫Ÿ Ÿال جمال لكل ما يقدمه احلاسوبيون من نقد للمعجم التقليدي؛ وإن كان ُج ُّله‬
‫صحيحا‪ ،‬فليس املطلوب أن هيجم احلاسويب عيل مادة سائغة ثم جيعل احلاسوب‬
‫يتعامل معها إنام ينبغي أن يوضع يف االعتبار أن املعجمية احلاسوبية هي األخرى‬
‫مطلوب منها صنع معاجم صناعة حقيقية ابتداء من التخطيط واختاذ مدونة‬
‫نصوصية ثم حوسبتها ووضع خمطط ملقوالهتا الرئيسية والفرعية ثم التحليل‬
‫املعجمي والتحرير فيكون أقرب إىل املعجم الذي نريده مجيعا‪ .‬عىل أن احلديث‬
‫عن أي عمل معجمي حاسويب دون أن تعد له العدة املعرفية اللسانية النظرية‬
‫والتطبيقية الكافية‪ ،‬جنبا إىل جنب مع األدوات احلاسوبية‪ ،‬هلو بمثابة قفز إىل‬
‫النتائج دون معاجلة املقدمات‪.‬‬

‫‪ -6‬األفكار البحثية املقرتحة يف إطار العمل املعجمي احلاسويب العريب‬


‫من واقع العمل املعجمي العريب احلاسويب ومن خالل مقارنته بالواقع املعجمي‬
‫احلاسويب العريب يمكن استرشاف آفاق العمل املعجمي احلاسويب‪.‬‬
‫‪ -1‬فهناك أعامل بحثية ودراسات ينبغي إنجازها مثل األبحاث الداللية املعجمية‪،‬‬
‫واألبحاث يف جمال االستعامل‪ ،‬والبنية املعجمية‪ ،‬والبنية االشتقاقية الداللية‬

‫‪-42-‬‬
‫للمعجم العريب‪ ،‬ودراسات لسانية نفسية تقصد إىل توصيف املعجم الذهني‬
‫عج ِم ّي‬ ‫ملتكلم العربية‪ .‬مثل هذه الدراسات سوف تكون وسيلة إلنجاز ِ‬
‫مورد ُم َ‬
‫عريب مؤسس عىل تأسيس نظري وجتريب عميل‪.‬‬
‫‪ -2‬ينبغي تطوير أدوات حتليل املدونات النصية العربية بتعميق جوانبها اللسانية‬
‫حتى يمكن فرز التجمعات اللفظية والتَّعبريات االصطالحية‪ ،‬بطريقة تتجاوز‬
‫اجلانب اإلحصائي ال ُغفل الذي يمكِّن من احلصول عىل التجمعات أ ًّيا كانت‬
‫طبيعتها دون النظر إىل بنيتها الداخلية‪.‬‬
‫عج ِم َّية‬ ‫ِ‬
‫موارد ُم َ‬ ‫‪ -3‬ينبغي التأسيس (أو إنجاز البنية البحثية التحتية) إلنشاء‬
‫حاسوبية خمتلفة لعل أمهها‪ ،‬كخطوة أوىل‪ ،‬فيام خيص الواقع املعجمي احلايل؛‬
‫املعجم العريب املقروء آل ًّيا يضاهي معجم ويبسرت السابع (‪ )7 Webster‬أو‬
‫معجم لونجامن لإلنجليزية املعارصة‪ ،‬بحيث يكون ماد ًة للبحث والدرس‬
‫ومصدرا الستخالص املعلومات الرتكيبية والداللية‪،‬‬ ‫ً‬ ‫املعجمي احلاسويب‪،‬‬
‫عج ِم َّية أخري منه أو بمساعدته مثل (‪ )Word net‬أو (‪Arabic‬‬ ‫وتوليد ِ‬
‫موارد ُم َ‬
‫‪.)Frame Net‬‬
‫املعج ِم َّية العربية الرضورية والتي ال يمكن إنجازها‬ ‫َ‬ ‫ِ‬
‫املوارد‬ ‫‪ -4‬إنجاز عدد من‬
‫اآلن إال باعتامد آليات العمل املعجمي احلاسويب نظرا الحتياج املجتمع اللغوي‬
‫والتطبيقات احلاسوبية إىل مادهتا‪ .‬ومن هذه األنواع‪ :‬املعجم التارخيي‪ ،‬واملعجم‬
‫التأصييل واملعجم االستعاميل واملعاجم القطاعية‪ :‬مثل معاجم التَّعبريات‬
‫االصطالحية واملتالزمات اللفظية‪ ،‬واألفعال العبارية ‪.‬املعاجم ذات األهداف‬
‫التطبيقية اخلاصة‪ :‬مثل معاجم الرتمجة اآللية‪.‬‬
‫املعج ِم َّية‪ ،‬بحيث يتم‬
‫َ‬ ‫ِ‬
‫املوارد‬ ‫‪ -5‬تطوير منصة لسانية حاسوبية لتقييس وتقييم‬
‫تصميمها لتحقق كال من املتطلبات اللسانية واملتطلبات احلاسوبية‪ ،‬ولتكون‬
‫ِ‬
‫املوارد املعجمية العربية‪.‬‬ ‫مرجعية لتقييس وتقويم‬

‫‪-43-‬‬
‫ببليوجرافيا مرجع َّية‬
.1998 ‫ بريوت‬،‫ دار الغرب اإلسالمي‬،‫ مقدمة لنظرية املعجم‬:)‫ابن مراد (إبراهيم‬1.1
،‫ عامل الكتب‬،‫ معجم اللغة العربية املعارصة‬:‫عمر (أمحد خمتار) بمساعدة فريق عمل‬2.2
.2008
‫ معجم شامل للمجاالت‬:‫ املكنز الكبري‬:‫عمر (أمحد خمتار) بمساعدة فريق عمل‬3.3
.2000 ،1‫ ط‬،‫ القاهرة‬،‫ سطور‬،‫واملرتادفات واملتضادات‬
،‫ توبقال للنرش‬،‫ نامذج حتليلية جديدة‬:‫ املعجم العريب‬:)‫الفهري (عبد القادر الفايس‬4.4
.1999 ،‫الدار البيضاء‬
‫ املركز الثقافـي العربـي الدار‬،‫ املعجمة والتوسيط‬:)‫الفهري (عبد القادر الفايس‬5.5
.1997 ،‫البيضاء‬
‫ واملنظمة العربية للرتبية والثقافة والعلوم‬،‫مدينة امللك عبد العزيز للعلوم والتقنية‬6.6
:‫ ورشة عمل معجم اللغة العربية التفاعيل‬:)ALECSO ‫(ألكسو‬
http://www.almuajam.org/index.htm.
7. Ahlswede, T. & Evens, M. (1989). A lexicon for a medical expert
system. In Relational models of the lexicon, Martha Evens (Ed.).
Cambridge University Press, New York, NY, USA 97-111.
8. Amsler, R. A. (1980). The Structure of the Merriam-Webster Pocket
Dic-tionary. Technical Report. University of Texas at Austin, Aus-
tin, TX, USA.
9. Atkins, B. S., & Rundell, M. (2008). The Oxford guide to practical
lexicography. Oxford University Press.
10. Attia, M., Rashwan, M., Ragheb, A., Al-Badrashiny, M., Al-Ba-
soumy, H., Abdou, S., A Compact Arabic Lexical Semantics Lan-
guage Resource Based on the Theory of Semantic Fields, Lec-
ture Notes on Computer Science (LNCS): Advances in Natural
Language Processing, Springer-Verlag Berlin Heidelberg, LNCS/

-44-
LNAI; Vol. No. 5221/2008; pp. 65-76 http://www.springerlink.com/
content/100p13145723v162/ Aug. 2008.
11. Baker, C. F. & Fillmore, C. J. & Cronin, B. (2003). The Structure of
the FrameNet Database. Int J Lexicography (2003) 16(3): 281-296
doi:10.1093/ijl/16.3.281.
12. Boas, H. C. (2009). Multilingual FrameNets in Computational
Lexi-cography: Methods and Applications. Walter de Gruyter.
13. Boguraev, B. (Ed.). (1989). Computational Lexicography for Nat-
ural Language Processing. Longman Publishing Group, White
Plains, NY, USA.
14. Byrd, R. J. (1986a). ‘Dictionary Systems for Office Practice’ in
Pro-ceedings of the Grosseto Workshop ‘On Automating the Lexi-
con’, also available as IBM Research Report RC 11872.
15. Calzolari, N. (1989). The dictionary and the thesaurus can be com-
bined. In Relational models of the lexicon, Martha Evens (Ed.).
Cambridge University Press, New York, NY, USA 75-96.
16. Cheng-ming, G. & Huang, C. & Gong, J. & Li, J. (1994). The evo-
lution of machine-tractable dictionaries. In Proceedings of the 15th
conference on Computational linguistics - Volume 2 (COLING ‘94),
Vol. 2. Association for Computational Linguistics, Stroudsburg, PA,
USA, 1231-1234. http://dx.doi.org/10.3115/991250.991352.
17. Chodorow, M. S. & Byrd, R. J. & Heidorn, G. E. (1985). Extracting se-
mantic hierarchies from a large on-line dictionary. In Proceedings of
the 23rd annual meeting on Association for Computational Linguis-
tics (ACL ‘85). Association for Computational Linguistics, Strouds-
burg, PA, USA, 299-304. http://dx.doi.org/10.3115/981210.981247.
18. Clark, J. T. (2012). Lexicological Evolution and Conceptual Pro-
gress. HardPress.
19. Debenham, J. (2012). Knowledge Engineering: Unifying Knowledge
Base and Database Design. Springer-Verlag New York Incorporated.

-45-
20. Dolk, D. R. (1988). Model management and structured modeling:
the role of an information resource dictionary system. Commun.
ACM 31, 6 (June 1988), 704-718.
21. Elkateb, S. & Black, W. & Vossen, P. & Rodríguez, H. & Pease, A.
& Alkhalifa, M. & Fellbaum, C., Building a WordNet for Arabic.
http://www.adampease.org/Articulate/publications/LREC.pdf.
22. Esuli, A. (2010). Automatic Generation of Lexical Resources for
Opinion Mining. VDM Publishing.
23. Fellbaum, C. & Alkhalifa, M. & Black, W. & Elkateb, S. & Pease,
A. & Rodríguez, H. & Vossen, P. (2006). Building a WordNet for
Arabic. Proceedings of the the 5th Conference on Language Re-
sources and Evaluation LREC2006, 2006. http://nlp.lsi.upc.edu/
papers/fellbaum06.pdf.
24. Fellbaum, C. (1998). WordNet: An Electronic Lexical Database.
Cam-bridge, MA: MIT Press.
25. Fillmore, C. J. (2005). “Frame semantics”. In: Brown, K. (ed.),
En-cyclopedia of language and linguistics. Oxford: Elsevier.
26. Francopoulo, G. and Paroubek, P. (eds) (2013). Front Matter, in
LMF Lexical Markup Framework, John Wiley & Sons, Inc., Ho-
boken, NJ USA. doi: 10.1002/9781118712696. fmatter.
27. Frawley, W. (1989). Relational models and metascience. In Rela-
tional models of the lexicon, Martha Evens (Ed.). Cambridge Uni-
versity Press, New York, NY, USA 335-372.
28. Granger, S. & Paquot, M. (2012). Electronic Lexicography. Oxford
University Press.
29. Hartmann, R.R.K. (2001). Teaching and researching lexicography.
(Ap-plied linguistics in action.) Edinburgh: Pearson Education.
30. Ide, N. & Véronis, J. (1994). Machine Readable Dictionaries: What
have we learned, where do we go? Proceedings of the International
Work-shop on the Future of Lexical Research, Beijing, China, 137-46.

-46-
31. Ide, N.& Romary, L. (2002). Standards for Language Re-sources
Proceedings of the Third Language Resources and Evaluation Con-
ference (LREC), Las Palmas, Canary Islands, Spain, 839-44.
32. Inkpen, D. (2009). Building a Lexical Knowledge-Base of Near-Syn-
onym Differences. LAP Lambert Acad. Publ.
33. Jackendoff, R. (1975). Morphological and semantic regularities in
the lexicon.Language 51. 639-671.
34. Jarmasz, M. & Szpakowicz, S. (2001a). Roget’s Thesaurus as an
Elec-tronic Lexical Knowledge Base. In NIE BEZ ZNACZENIA.
Prace ofiarowane Profesorowi Zygmuntowi Saloniemu z okazji
40-lecia pracy naukowej. W. Gruszczynski, D. Kopcinska, eds., Bi-
alystokHalliday, M A K; et al 2004 Lexicology and corpus linguis-
tics : an introduction. New York.
35. Karpova, O. & Kartashkova, F. (2009). Lexicology and terminolo-
gy: a worldwide outlook. Cambridge Scholars.
36. Landau, S.I. (2001). Dictionaries: The art and craft of lexicography.
(2nd ed.) Cambridge: Cambridge University Press.
37. Levin, B. (1993). English Verb Classes and Alternations. University
of Chicago Press.
38. Litkowski, K. C. (2005). “Computational Lexicons and Dictionar-
ies”, Encyclopedia of Language and Linguistics (2nd ed.).Elsevier
Publishers, Oxford.
39. Mel’ˇcuk, I. A. (1988). ‘Semantic Description of Lexical Units in an
Explanatory Combinatorial Dictionary: Basic Principles and Heuris-
tic Criteria; in International Journal of Lexicography 1.3. 165–188.
40. Mel’ˇcuk, I. A. (1995). The Future of the Lexicon in Linguistic
De-scription and the Explanatory Combinatorial Dictionary. In I.-H.
Lee (ed.): Linguistics in the Morning Calm 3 (Selected Papers from
SICOL-1992), Seoul, 181-270.

-47-
41. Mel’čuk, I.A. (1998). “Collocations and lexical functions”. In: Cow-
ie, A.P. (ed.), Phraseology: Theory, analysis and applications. Ox-
ford: Clarendon Press. 23–54. Ogden, C.K. and I.A. Richards. 1923.
The meaning of meaning. London: Routledge and Kegan Paul.
42. Diab, M. & Al-Badrashiny, M. & Aminian, M. & Attia, M. &
Elfardy, H. & Habash, N. & Hawwari, A. (2014). Tharwa: A Large
Scale Dialectal Arabic - Standard Arabic - English Lexicon. The 9th
edition of the Language Resources and Evaluation (LREC) Confer-
ence, 26-31 May, Reykjavik, Iceland.
43. Oltramari, A. & Vossen, P. & Qin, L. & Hovy, E. (2013). New Trends
of Research in Ontologies and Lexical Resources: Ideas, Projects,
Systems. Springer-Verlag GmbH.
44. Ovchinnikova, E. (2012). Integration of World Knowledge for Nat-
ural Language Understanding. Springer.
45. Palmer, M. & Gildea, D. & Kingsbury, P. “The Proposition Bank:
An Annotated Corpus of Semantic Roles.” Computational Linguis-
tics, 31:1., pp. 71-105, March, 2005. http://verbs.colorado.edu/
verb-index/.
46. Pustejovsky, J. & Boguraev, B. (1993). Lexical Knowledge
Rep-resentation and Natural Language Processing, in Artificial In-
telligence, http://dx.doi.org/10.1016/0004-3702(93)90017-6.
47. Pustejovsky, J. (1995). The Generative Lexicon, MIT Press.
48. Rufus H. Gouws, Ulrich Heid, Wolfgang Schweickard and Herbert
Ernst Wiegand (Editors). Dictionaries. An International Encyclo-
pedia of Lexicography. Supplementary Volume: Recent Develop-
ments with Special Focus on Computational Lexicography. Berlin/
New York: Mouton de Gruyter.
49. Russell, J. & Cohn, R. (2012). Framenet. Book on Demand.
50. Sinclair, J.M. (ed.) (1996). Looking Up: an Account of the CO-
BUILD Project in Lexical Computing. London: Collins.

-48-
51. Spohr, D. (2012). Towards a Multifunctional Lexical Resource: De-
sign and Implementation of a Graph-based Lexicon Model. Walter
de Gruyter.
52. Svensén, B. (1993). Practical Lexicography: Principles and Meth-
ods of Dictionary-Making. Oxford University Press. Translated
from the Swedish by J. Sykes and K. Schofield.
53. Vermon, L. (2012). Lexicology and Lexicography: Words and Ways.
Webster’s Digital Services.
54. Véronis, J. & Ide, N. (1991). An assessment of semantic informa-
tion automatically extracted from machine readable dictionaries. In
Proceedings of the fifth conference on European chapter of the As-
sociation for Computational Linguistics (EACL ‘91). Association
for Computational Linguistics, Stroudsburg, PA, USA.
55. Wilks, Y. & Fass, D. & Guo, C. & McDonald, J. & Plate, T. &
Slator, B. (1988). “A Tractable Machine Dictionary as a Resource
for Computational Semantics,” in Bran Boguraev and Ted Briscoe
(eds) Computational Lexicography for Natural Language Process-
ing, Harlow, Essex, Longman.
56. Würzner, KK. (Hrsg.) & Pohl, E. (Hrsg.). (2012). Lexical resources
in psycholinguistic research. Universitätsverlag Potsdam.
57. Zernik, U. (1991). Editor, Lexical acquisition: exploiting on-line
re-sources to build a lexicon. Lawrence Erlbaum Associates, Hills-
dale, NJ.

-49-
-50-
‫الفصل َّ‬
‫الثاني‬
‫امل َد َّونات ال ُّل َغ ِو َّية‬

‫السعيد‬
‫الـمعت ّز باهلل َّ‬
‫د‪ُ .‬‬

‫‪ -1‬يف مفهوم املدَ َّونات ال ُّل َغ ِو َّية‪.‬‬


‫‪ -2‬إرهاصات املنهج‪ ،‬وت َط ُّور دراسة املدَ َّونات ال ُّل َغ ِو َّية‪.‬‬
‫‪ -3‬املدَ َّونات ال ُّل َغ ِو َّية العرب َّية‪.‬‬
‫‪ -4‬أنواع املدَ َّونات ال ُّل َغ ِو َّية‪.‬‬
‫‪َ -5‬عنونة املدَ َّونات ال ُّل َغ ِو َّية‪.‬‬
‫‪ -6‬املدَ َّونات ال ُّل َغ ِو َّية وآل َّية فهرسة الن ُُّصوص‪.‬‬
‫‪ -7‬جماالت اإلفادة من املدَ َّونات ال ُّل َغ ِو َّية‪.‬‬
‫وحات علم َّي ٍة ُمستَقبل َّية‪.‬‬‫ٍ‬ ‫ألطر‬
‫أفكار بحث َّية ُ‬
‫ٌ‬ ‫‪-8‬‬
‫‪ِ -9‬من املواقع اإللكرتون َّية التَّعليم َّية واإلرشاد َّية‪.‬‬

‫‪-51-‬‬
-52-
‫‪ -1‬يف مفهوم ا ُملدَ َّونات ال ُّلغ َِو َّية‬
‫واهر ال ُّلغوية‬ ‫ات املدَ ونة (‪ )Corpus Linguistics‬بِالبحث يف ال َّظ ِ‬
‫َّ‬ ‫تُعنى لسانِ َّي ُ‬
‫الواق َع ال ُّل َغ ِو ّي؛ وهي ليست ِع ًلم‬
‫جمموعة ِمن النُّصوص التي ُت ِّث ُل ِ‬
‫َ‬ ‫ُ‬
‫ٍ‬ ‫وتفسريها من خالل‬ ‫ِ‬
‫هيدف إىل وصف واقع ال ُّلغة‬ ‫حديث نسبيا‪ِ ،‬‬ ‫ٌ‬ ‫منهج ُل َغ ِو ٌّي‬ ‫باملفهوم الدَّ قيق لل ُع ُلوم؛ لكنَّها‬
‫ًّ‬ ‫ٌ‬
‫الواقع من خالل مناهج التَّحليل‬ ‫َ‬ ‫اعتام ًدا عىل جمموعة من النصوص ا َّلتي ُت َ ِّثل ذلك‬
‫(الصوت‪،‬‬ ‫َّارخيي واملقارن والتَّقا ُب ّيل) و ُمستوياته‬ ‫عياري والت‬ ‫ال ُّل َغ ِوي (الوصفي واملِ‬
‫َّ‬ ‫ّ‬ ‫ّ‬ ‫ّ‬ ‫ّ‬
‫ات قائمةٍ‬ ‫فرضي ٍ‬
‫والتكيب‪ ،‬والدِّ اللة‪ ،‬واملعجم)‪ ،‬كام هيدف إىل التَّح ُّقق من ِ‬ ‫والبِنية‪َّ ،‬‬
‫ّ‬
‫ِ‬
‫خصائ ِصها‪.‬‬ ‫ِ‬
‫بعض‬ ‫جمموعة من ال ُّلغات َ ِ‬
‫املشتكة يف‬ ‫ٍ‬ ‫حول ُل َغ ٍة ُم َع َّينة أو‬
‫باعتبارها‬ ‫ِ‬ ‫وأدا ُة البحث يف هذا املنهج هي «املدَ َّونة ال ُّل َغ ِو َّية» (‪)Linguistic Corpus‬‬
‫َّعامل معها آلِ ًّيا والت ََّحك ُُّم‬ ‫جمموع ًة ِمن ن ُُصوص ال ُّلغة املكتوبة أو املنطوقة ا َّلتي يمكن الت ُ‬
‫بيانات ُص ِّم َمت‬ ‫ٍ‬ ‫ِ‬
‫قواعد‬ ‫دخالهتا باإلضافة أو احلذف أو التعديل من خالل‬ ‫يف بياناهتا و ُم َ‬
‫كبريا ل ُّلغة‪،‬‬ ‫حيث ُت َ ِّث ُل هذه القواعدُ خمزنًا ً‬ ‫لتكون قادر ًة عىل التَّعا ُمل مع هذه النُّصوص‪ُ ،‬‬ ‫َ‬
‫ُضاف إىل املا َّدة‬ ‫َ‬ ‫قدر من النُّصوص ا َّلتي ُيمكن أن ت‬ ‫أي ٍ‬ ‫تحمل َّ‬ ‫وقت احلاجة و َي َّ‬ ‫رجع إليه َ‬ ‫ُي َ‬
‫األساس َّية للمدَ َّونة ال ُّل َغ ِو َّية ُمستَقبالً‪.‬‬
‫ٍ‬ ‫وما َّد ُة املدَ َّونة ال ُّل َغ ِو َّية ليست ن‬
‫منتظمة‬ ‫ُصوصا تقييد َّي ًة أو عشوائية؛ لكنَّها كتل ٌة ُ‬
‫غري‬ ‫ً‬
‫اهلدف املنشو ُد من‬ ‫يدِّ دها‬ ‫ٍ‬ ‫من النُّصوص ا َّلتي‬
‫ُ‬ ‫األسس واملعايري‪َ ُ ،‬‬ ‫ختضع ملجموعة من ُ‬ ‫ُ‬
‫وي ختتلف ما َّد ُتا عن‬ ‫عج ٍم ُل َغ ٍّ‬ ‫املدَ َّونة ال ُّل َغ ِو َّية‪ .‬فاملدَ َّونة ا َّلتي ُيعت ََمد عليها يف صناعة ُم َ‬
‫ف ما َّد ُة‬ ‫جمموعة من األنامط الرتكيبي ِة أو البِن َِوي ِة ل ُّلغة؛ كام ِ‬
‫ختتل ُ‬ ‫ٍ‬ ‫مة يف َحرص‬ ‫تلك املستَخدَ ِ‬
‫َّ‬ ‫َّ‬
‫تكراري عن تلك ا َّلتي ُيعت ََمد عليها يف صناعة‬ ‫عج ٍم‬ ‫ِ‬ ‫ِ‬
‫ٍّ‬ ‫املدَ َّونة املستخدَ مة يف صناعة ُم َ‬
‫املعال َة اآلل َّي َة للنُّصوص تت َِّفق وطبيع َة املدَ َّونة؛‬ ‫َ‬ ‫املعجامت التَّارخي َّية؛ وهكذا‪ .‬كذلك َّ‬
‫فإن‬
‫كل‬ ‫ِ‬
‫وطرائق إدارة قواعد البيانات‪ُّ ..‬‬ ‫ِ‬ ‫ُ‬ ‫عال ِة النُّصوص‬ ‫فاألدوات املستَخدم ُة وطريق ُة ُم َ‬ ‫ُ‬
‫واهلدف منها‪.‬‬ ‫ُ‬ ‫واملعايري ا َّلتي ُتدِّ دها طبيع ُة املدَ َّونة ال ُّل َغ ِو َّية‬ ‫ِ‬ ‫األسس‬
‫خيض ُع لتلك ُ‬ ‫هذا َ‬
‫ِ‬
‫يقرب من أربعة‬ ‫الرئيسة الستخدام املدَ َّونات ال ُّل َغ ِو َّية منذ ما ُ‬ ‫ومع ُو ُضوح الفكرة َّ‬
‫احلديث يف ميادين احلوسبة‬ ‫ُ‬ ‫العرص‬
‫ُ‬ ‫أن ال َّطفر َة املعلومات َّي َة اهلائل َة ا َّلتي َش ِهدَ ها‬ ‫ُق ُرون‪ ،‬إالَّ َّ‬
‫ٍ‬ ‫غيت ُو ْج َه َة الباحثني‪ ،‬و َم َّكنَتهم من التَّعا ُم ِل مع‬
‫جمموعات‬ ‫وتقنية املع ُلومات قد َّ َ‬
‫واهر‬‫ووضوحا‪ .‬ومل َي ُعد تفسري ال َّظ ِ‬
‫ُ‬ ‫ً‬ ‫أكثر ِد َّق ًة‬
‫نتائج َ‬ ‫واحلصول عىل َ‬ ‫ِ‬ ‫ضخمة من النُّصوص‬ ‫ٍ‬

‫‪-53-‬‬
‫مناهج جتريب َّي ٍة‬
‫َ‬ ‫قاصا عىل النَّظر َّيات التقليد َّية؛ بل خت َّطى ذلك إىل التَّعا ُمل مع‬ ‫ً‬
‫ال ُّل َغ ِوية ِ‬
‫َّ‬
‫والربم َّيات‬
‫َ‬ ‫حتليل النُّصوص‪ .‬كام مل ي ُعد بنا ُء األدوات‬ ‫ِ‬ ‫ٍ‬
‫بدورها إىل اختالف يف طرائق‬ ‫أ َّدت ِ‬
‫أصبح لزا ًما عىل‬ ‫قاصا عىل اخلوارزمات‪ ،‬إذ‬ ‫عالة ال ُّلغات ال َّطبيعية ِ‬ ‫املساعدة يف ُم َ‬
‫َ‬ ‫ً‬ ‫َّ‬
‫ِ‬
‫صانعيها أن ُيفيدُ وا من املدَ َّونات ال ُّل َغو َّية باعتبارها مور ًدا ُل َغو ًّيا ً‬
‫رئيسا‪.‬‬
‫بنائها إلحدى ثالث ُط ُرق‪:‬‬ ‫نات ال ُّل َغ ِوي ِة عندَ ِ‬‫وي َضع اختِيار نُصوص املدَ و ِ‬
‫َّ‬ ‫َّ‬ ‫ُ ُ‬ ‫َ ُ‬
‫َّاع‬
‫طر ُح ُصن ُ‬ ‫‪ -1.1‬ال َّطريقة األوىل‪َ :‬ت ُقو ُم عىل االستبانة (‪ ،)Questionnaire‬حيث َي َ‬
‫ون املجت ََم َع ال ُّل َغ ِو ّي ا َّلذي تنتمي إليه‬ ‫أشخاص ُي َم ِّث ُل َ‬‫ٍ‬ ‫ِ‬
‫األسئلة عىل‬ ‫املدَ َّونة جمموع ًة من‬
‫ِ‬
‫املعرف َّية ا َّلتي تدعو احلاج ُة إىل َط ْرقها‪،‬‬ ‫ِ‬ ‫ول ِ‬ ‫الن ُُّصوص‪ .‬وتتع َّل ُق حماور االستبانة باحل ُق ِ‬
‫ُ‬ ‫ُ‬
‫وأوجه‬ ‫ُ‬ ‫واملصنِّفني ذوي االختصاص‪،‬‬ ‫َ‬ ‫املختارة‪ ،‬وأسامء ال ُكتَّاب‬ ‫َ‬ ‫وعناوين ال ُكتُب‬
‫نتائ ِج االستبانة ُيدَّ د حجم املدَ و ِنة ال ُّل َغ ِويةِ‬ ‫بني هذه األمور مجيعا ‪.‬ويف َضوء ِ‬ ‫املفاض َلة َ‬ ‫َ‬
‫َّ‬ ‫َّ‬ ‫ُ‬ ‫َ ُ‬
‫َّف إليها النُّصوص‪ ،‬ومصادرِ‬ ‫املعرف َّي ُة ا َّلتي ت َُصن ُ‬ ‫ِ‬ ‫ول ِ‬ ‫كذلك ‪ -‬احلُ ُق ُ‬ ‫َ‬ ‫املنشودة؛ ُ‬
‫وتَدَّ ُد ‪-‬‬
‫ُ‬ ‫َ‬ ‫ُ‬
‫الز َمنِ َّية ا َّلتي تنتمي إليها الن ُُّصوص‪ ،‬واملنطِق ُة اجلُغرافِ َّي ُة ا َّلتي ينت َِمي‬ ‫املا َّدة الن َِّّص َّية‪ ،‬وال َف َ‬
‫رت ُة َّ‬
‫ِ‬
‫واملصنِّفون ‪.‬وتُستَخدَ م هذه ال َّط ِريق ُة ‪ -‬عا َد ًة ‪ -‬يف بِناء ُمدَ َّونات الدِّ راسات‬ ‫َ‬ ‫َّاب‬‫إليها ال ُكت ُ‬
‫ِ‬
‫َّجريبِ َّية ‪ ،)(Empirical Studies‬و ُمدَ َّونات ال َّلهجات [القديمة واملعاصة]؛‬ ‫الت ِ‬
‫يم َّية‪ ،‬بام ُيساعدُ عىل صناعة‬ ‫اإلقل ِ‬ ‫ِ‬ ‫بناء املدَ ونات ال ُّل َغ ِوي ِة للمجتَم ِ‬
‫عات‬ ‫كام تُستَخدَ م يف ِ‬
‫َ‬ ‫َّ‬ ‫َّ‬ ‫ُ‬
‫األطالس ال ُّل َغ ِو َّية ‪.‬وجتدُ ُر اإلشار ُة إىل ُش ُيوع هذه ال َّطريقة يف بناء املدَ َّونات املصنوعة‬
‫املعجامت التَّعليم َّية وال ُكتُب الدِّ راس َّية‬ ‫يم َّية وتربو َّية‪ ،‬الس َّيام عندَ بناء‬ ‫تعل ِ‬
‫ألغراض ِ‬ ‫ٍ‬
‫َ‬
‫ني بغريها‪.‬‬ ‫املو ِّجهة إىل تعليم ال ُّلغات‪ ،‬سوا ٌء أكانَت ألبناء ال ُّلغة أم للنَّاطِ ِق َ‬ ‫َ‬
‫الشامــلِ للنُّصـُوص‬ ‫احلصــر َّ‬ ‫‪ -2.1‬ال َّطريـقة ال َّثانِيـة‪َ :‬ت ُقـو ُم هـذه ال َّطريقــة علـى َ‬
‫وص املجت ََم ِع‬ ‫حرص مجيع ن ُُص ِ‬ ‫َّاع املدَ َّو ِنة بِ ِ‬ ‫ُلز ُم ُصن َ‬ ‫(‪)Comprehensive Inventory‬؛ وت ِ‬
‫يشء من ما َّدة هذا املجت ََمــع‪.‬‬ ‫ٍ‬ ‫دون استثناء‬ ‫َ‬ ‫ال ُّل َغ ِو ّي ا َّلذي ُت َ ِّث ُله املدَ َّونة املنشودة‪،‬‬
‫تستهدف الدِّ راسات‬ ‫ُ‬ ‫ناء املدَ َّونات ال ُّل َغو َّية ا َّلتي‬ ‫وتُستَخــدَ م هذه ال َّط ِريق ُة ‪ -‬عاد ًة ‪ -‬عند بِ ِ‬
‫َ‬ ‫ُ‬
‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ِ‬
‫الز َمن ّي‬ ‫املسح َّية (‪)Survey Studies‬؛ كام تُستَخدَ ُم يف بناء املدَ َّونات ال ُّل َغو َّية ذات املدى َّ‬
‫ِ‬
‫عجامت األدباء‪ ،‬واملدَ َّونات‬ ‫غراف املحدود‪ ،‬كاملدَ َّونات املستَخدَ مة يف صنا َعة ُم َ‬ ‫جل ِ ّ‬
‫أو ا ُ‬
‫عجامت الكتُب امل َقدَّ َسة‪ ،‬واملدَ َّونات املستَخدَ مة يف الدِّ راسات‬ ‫ِ‬
‫املستَخدَ مة يف صنا َعة ُم َ‬
‫أديب‬ ‫ٍ‬ ‫جمموعة من ال َّظواهر عندَ‬ ‫ٍ‬ ‫ظاهرة أدب َّي ٍة ُم َع َّي ٍنة أو‬ ‫ٍ‬ ‫احلال عندَ دراسة‬ ‫األدب َّية ‪ -‬كام ُه َو ُ‬

‫‪-54-‬‬
‫احلال عندَ‬ ‫ُ‬ ‫والس ُلوك َّية ‪ -‬كام ُه َو‬ ‫ُم َع َّي‪ ،‬واملدَ َّونات املستخدَ مة يف الدِّ راسات النَّفس َّية ُّ‬
‫ِ‬
‫تم ٍع ما‪.‬‬ ‫والس ُلوك َّية يف ُم َ‬
‫دراسة ال َّظواهر النَّفس َّية ُّ‬
‫األكثر ُشيو ًعا؛ وتَقــــُو ُم عىل َن َظ ِر َّية ال َع ِّينات اإلحصائِ َّية‬ ‫ُ‬ ‫‪ -3.1‬ال َّطريقة ال َّثالِثة‪ :‬هي‬
‫يار َع ِّي ٍنة‬
‫َّاع املدَ َّو ِنة ال ُّل َغو َّية باختِ ِ‬ ‫ِ‬ ‫ِ‬
‫(‪)Statistical Sampling Theory‬؛ ومن خاللا يقو ُم ُصن ُ‬
‫عشوائ َّي ًة( (�‪Random Sam‬‬ ‫ِ‬ ‫وص ا َّلتي َتت َِّف ُق وأهدا َفهم ال َبحثِ َّية‪ ،‬سوا ٌء أكانَت َع ِّينَ ًة‬‫ِمن الن ُُّص ِ‬
‫حيث ُين َظ ُر إىل هذا النَّوع من املدَ َّونات‬ ‫عشوائ َّية (‪ُ ،)Non-Random Sample‬‬ ‫ِ‬ ‫غري‬
‫‪ ،)ple‬أم َ‬
‫باعتبار ِه َع ِّين ًة ِمن ُمت ََم ٍع غري حمدُ ود‪ ،‬هو ُمت ََمع ال ُّلغة؛ كام ُيلت ََز ُم عندَ بناء املدَ َّونات ال ُّل َغو َّية‬ ‫ِ‬
‫تكون املدَ َّون ُة‬
‫َ‬ ‫اإلحصائ ّي‪ ،‬بام يضم ُن أن‬ ‫ِ‬ ‫املصنوعة وف ًقا هلذه ال َّطريقة بأساليب التَّحليل‬
‫ريقة يف صناعة املعجامت ُعمو ًما؛‬ ‫ُم ِّثل ًة لواقع ال ُّلغة ومعب ًة عنه‪ .‬ويشيع استِخدام هذه ال َّط ِ‬
‫ُ‬ ‫َ ُ‬ ‫ُ َ ِّ‬ ‫َ‬
‫عجامت ال ُع ُلوم وال ُفنُون‪،‬‬ ‫واملعجامت ال ُّل َغو َّية التَّارخي َّية‪ ،‬و ُم َ‬
‫َ‬ ‫املعجامت ال ُّل َغ ِو َّية العا َّمة‪،‬‬
‫الس َّيام َ‬
‫كذلك ‪ -‬يف الدِّ راسات الن َّْح ِو َّية‪،‬‬ ‫َ‬ ‫واملعجامت املص َط َل ِح َّية‪ .‬وتُستَخدَ ُم هذه ال َّطريق ُة ‪-‬‬ ‫َ‬
‫حوسبة ال ُّلغة ا َّلتي تُعنى باسرتجاع‬ ‫املعالة اآلل َّية ل ُّلغات ال َّطبيع َّية‪ ،‬وميادين َ‬ ‫َ‬ ‫وصناعة أدوات‬
‫والتمجة اآلل َّية (‪.)Machine Translation‬‬ ‫املعلومات (‪َّ )Information Retrieval‬‬

‫‪ -2‬إرهاصات املنهج‪ ،‬وت َط ُّور دراسة املدَ َّونات ال ُّلغ َِو َّية‬
‫ِ‬
‫عجامتم‬ ‫قديم ‪ -‬من جمموعات الن ُُّصوص يف بناء ُم‬ ‫والصينِ ُّي َ‬
‫ون وال َع َر ُب ‪ً -‬‬ ‫أفا َد اهلُنُو ُد ِّ‬
‫ٍ‬
‫ال ُّل َغ ِو َّية وال َّت َع ُّرف عىل دالالت الكلامت‪ .‬ويف مرحلة ُم ِّ‬
‫الوسطى كانت‬ ‫تأخرة من ال ُق ُرون ُ‬
‫ِ‬
‫الفرد َّية ‪ -‬غري املنهج َّية ‪ -‬لبناء املدَ َّونات ال ُّل َغ ِو َّية واإلفادة منها يف‬ ‫بعض املحاوالت‬ ‫هناك ُ‬
‫ِ‬
‫َّحوي والدِّ راسات التَّورات َّية واأل َدبِ َّية‪،‬‬
‫فهرسة الن ُُّصوص وصناعة املعجامت والتَّقعيد الن ّ‬
‫باإلضافة إىل استخدامها يف ميادين البحث ال ُّل َغ ِو ّي‪.‬‬
‫االسكتلندي‬
‫ّ‬ ‫املؤ َّرخ هلا يف جمال الدِّ راسات التَّورات َّية‪ُ ،‬‬
‫حيث قا َم النَّارش‬ ‫وكانت البداي ُة َ‬
‫ودن » (‪ )1770-1699( )Alexander Cruden‬بجمع ما َّدة الكتاب‬ ‫«ألكسندر كر ِ‬
‫ُ‬
‫ِ‬ ‫ِ‬ ‫ِ‬
‫امل َقدَّ س باعتبارها ُمدَ َّون ًة ُل َغو َّية‪ ،‬واستخدَ َمها يف بناء فهارس ألفبائ َّية لكلامت الكتاب‬
‫حل َق هذه‬‫امل َقدَّ س ‪ -‬بعهدَ يه (القديم واجلديد) ‪ -‬وما يتع َّل ُق به من موضوعات‪ .‬وأ َ‬
‫َ‬
‫بذلك‬ ‫ليصنع‬
‫َ‬ ‫املفهرسة األوىل من الكتاب امل َقدَّ س يف عام ‪1736‬م‪،‬‬ ‫َ‬ ‫الفهارس بال َّطبعة‬
‫َ‬
‫ِ‬ ‫ٍ‬ ‫ِ‬ ‫ِ‬
‫تفصييل ُيعت ََمدُ يف إنجازه عىل ُمدَ َّونة ُل َغو َّية‪.‬‬ ‫ٍ‬
‫فهرس‬ ‫َّأو َل‬
‫ٍّ‬

‫‪-55-‬‬
‫وتال ذلك استخدام املدَ َّونات ال ُّل َغ ِو َّية يف صناعة املعاجم؛ وكانت البداية من خالل‬
‫«صموئيل جونسون » (‪-1709( )Samuel Johnson‬‬ ‫ِ‬ ‫ِ‬
‫اإلنجليز ّي‬ ‫دونة األديب‬ ‫ُم َّ‬
‫ِ‬
‫بمساعدة ستَّة من تالميذه؛ واست ََمدَّ ما َّد َة املدَ َّونة‬ ‫أنج َزها يف عام ‪1746‬م ‪ُ -‬‬ ‫‪ )1784‬ا َّلتي َ‬
‫األعامل األدب َّية لويليام شكسبري (‪ )William Shakespeare‬وجون ملتون (‪John‬‬ ‫َ‬ ‫من‬
‫اإلنجليزي يف‬ ‫‪ )Milton‬وجون درايدن (‪ )John Dryden‬وغريهم من أعالم األدب‬ ‫ِ‬
‫ّ‬
‫ذلك الوقت‪.‬‬
‫وو َس َمه بـ « ُمعجم‬ ‫ِ‬ ‫ِ‬
‫اإلنجليز َّية‪َ ،‬‬ ‫ملفردات‬
‫كبريا َ‬ ‫عجم ً‬ ‫َصنَع جونسون من ما َّدة ُمدَ َّونَته ُم ً‬
‫املعج ُم ‪-‬‬ ‫اإلنجليز َّية» (‪ .)A Dictionary of the English Language‬واشت ََم َل َ‬ ‫ِ‬ ‫ال ُّلغة‬
‫ِ‬
‫عجمي‪ ،‬وما يزيدُ‬ ‫ّ‬ ‫أكثر من أربعني ألف مدخل ُم‬ ‫ال يف عام ‪1755‬م ‪ -‬عىل َ‬ ‫ُش كام ً‬ ‫ا َّلذي ن َ‬
‫عىل ٍ‬
‫أضخم‬
‫َ‬ ‫صبح ‪ -‬بذلك ‪-‬‬ ‫حل ُقول‪ ،‬ل ُي َ‬
‫ملفردات هذه ا ُ‬ ‫حتليل ُل َغ ِو ٍّي َ‬
‫ٍ‬ ‫مئة ومخسني ألف‬
‫أهم‬ ‫املعجم واحدً ا من ِّ‬ ‫ُ‬ ‫وقت ُصدُ وره‪ .‬وال ُ‬
‫يزال هذا‬ ‫املعجامت ال ُّل َغ ِو َّية لإلنجليز َّية َ‬
‫عجامت ال ُّلغة اإلنجليز َّية عىل اإلطالق‪.‬‬ ‫وأشمل ُم َ‬
‫جمال استخدام املدَ َّونات ال ُّل َغ ِو َّية يف صناعة املعجم يف القرن التَّاسع عرش‬ ‫وات ََّس َع ُ‬
‫ِ‬
‫امليالدي مع احلاجة إليها يف بناء املعجامت ال ُّل َغ ِو َّية التَّارخي َّية؛ فاستُخد َمت املدَ َّون ُة ال ُّل َغ ِو َّي ُة‬ ‫ّ‬
‫ما َّد ًة ملعجم ال ُّلغة األملان َّية (‪ )Deutsches WörterBuch‬يف عام ‪1838‬م‪ ،‬و ُمعجم ال ُّلغة‬
‫اهلُولند َّية (‪ )Woordenboek der Nederlandsche Taal‬يف عام ‪1849‬م‪ ،‬و ُم َ‬
‫عجم‬
‫ليزية ِ‬ ‫ِ‬
‫احلديثة (‪ )New English Dictionary‬يف عام ‪1859‬م‪.‬‬ ‫اإلنج ِ َّ‬
‫ويف مطلع القرن العرشين أمك َن اإلفاد ُة من املدَ َّونات ال ُّل َغ ِو َّية يف تعليم ال ُّلغات‪،‬‬
‫األمريكي «إدوارد يل ثورنديك» (‪)Edward Lee Thorndike‬‬ ‫ّ‬ ‫ُ‬
‫حيث قا َم عامل النَّفس‬
‫(‪ )1949-1874‬ببناء ُمدَ َّو ٍنة ُل َغ ِو َّي ٍة الستخدامها يف تعليم ال ُّلغة اإلنجليز َّية‪ .‬وقامت‬
‫فردات املدَ َّونة ‪ -‬ا َّلتي تربو عىل أربعة ماليني كلمة‬ ‫فكرة ثورنديك عىل إعادة ترتيب ُم َ‬
‫نش هذه املا َّدة عىل هيئتها اجلديدة يف كتابه‬ ‫‪ -‬بحسب أكثرها ُش ُيو ًعا؛ ويف عام ‪1921‬م َ َ‬
‫ا َّلذي َو َّج َهه للمع ِّلمني ب ُعنوان (‪.)Teacher’s Word Book, New York‬‬
‫ِِ‬
‫ف‬ ‫وأم َك َن اإلفاد ُة من منهج ثورنديك يف بناء ُمدَ َّونَته‪-‬فيام بعد‪ -‬يف بناء ما ُي َ‬
‫عر ُ‬
‫ناحية أخرى‪ ،‬فقد امتَدَّ ت هذه الفكر ُة من االقتصار عىل‬ ‫ٍ‬ ‫باملعجامت التَّعليم َّية‪ .‬ومن‬
‫َ‬

‫‪-56-‬‬
‫ٍ‬ ‫ألبنائها إىل تعليم ال ُّلغات األجنب َّية للنَّاطِ ِق َ‬ ‫ِ‬ ‫تعليم ال ُّلغة األ ِّم‬
‫بصورة‬ ‫ني بغريها؛ كام َ َ‬
‫ساهت‬
‫بوي (‪.)Educational Linguistics‬‬ ‫بارشة يف تطوير مناهج علم ال ُّلغة َّ‬ ‫ٍ‬
‫الت ّ‬ ‫ُم‬
‫ُخد َمت املدَ َّونات ال ُّل َغ ِو َّي ُة ‪-‬كذلك ‪-‬يف الدِّ راسات الن ِ‬
‫َّحو َّية َ‬
‫قبل ُمنت ََصف القرن‬ ‫واست ِ‬
‫مه َّيتها يف متثيل واقع ال ُّلغة عندَ التَّقعيد هلا‪ .‬ففي عام‬ ‫العرشين‪ ،‬إذ َفطِ َن ال ُّل َغ ِو ُّي َ‬
‫ون إىل أ ِّ‬
‫األمريكي «تشارلز فريز» (‪)1967-1887( )Charles Fries‬‬ ‫ّ‬ ‫نش ال ُّل َغ ِو ُّي‬ ‫‪1940‬م َ َ‬
‫األنجلوأمريكي» (‪ ،)American English Grammar‬واعتمدَ فيه‬ ‫ّ‬ ‫كتا َبه «قواعد النَّحو‬
‫ٍ‬ ‫ٍ‬ ‫ٍ‬
‫األمريكي‪ .‬وبدا‬
‫ّ‬ ‫الرسم َّية ألعضاء الكونجرس‬ ‫عىل ُمدَ َّونة ُل َغ ِو َّية جمموعة من اخلطابات َّ‬
‫وحا يف «البحث‬ ‫أكثر منهج َّي ًة ُ‬
‫وو ُض ً‬ ‫َّحو َّية َ‬ ‫استخدا ُم املدَ َّونات ال ُّل َغ ِو َّية يف الدِّ راسات الن ِ‬
‫املسحي الستخدامات ال ُّلغة اإلنجليز َّية» (‪ )The Survey of English Usage‬ا َّلذي‬ ‫ّ‬
‫)‪-‬بمساعدة آخرين‪-‬بني‬ ‫اإلنجليزي «راندولف كويرك» (‪ُ Randolph Quirk‬‬ ‫ّ‬ ‫أعدَّ ه‬
‫يصل عدد كلامهتا إىل مليون‬ ‫ٍ‬ ‫ٍ‬
‫عا َمي ‪1959‬م و‪1968‬م‪ ،‬واعتمدَ فيه عىل ُمدَ َّونة ُل َغ ِو َّية ُ‬
‫كلمة‪.‬‬
‫منهج دراستها من خالل ُمدَ َّونة‬ ‫ُ‬ ‫مالمح املدَ َّونات ال ُّل َغ ِو َّية واكت ََم َل‬
‫ُ‬ ‫ُث َّم ات ََّض َحت‬
‫ِ‬
‫جامعة براون القياس َّية لألنجلوأمريك َّية املعاصة (‪The Brown University Standar‬‬
‫عرف بـ « ُمدَ َّونة براون»‬ ‫‪ ،)Corpus of Present-Day American English‬أو ما ُي َ‬
‫ِّشيكي «هنري كوتشريا» (‪Henry‬‬ ‫ّ‬ ‫أنج َزها ال ُّل َغ ِو َّيان‪ ،‬الت‬
‫(‪ ،)Corpus Brown‬ا َّلتي َ‬
‫واألمريكي «نلسون فرانسيس» (‪)Nelson Francis‬‬ ‫ِ‬ ‫‪)2010-1925( )Kučera‬‬
‫ّ‬
‫لتكون َّأو َل ُمدَ َّونة‬
‫َ‬ ‫بتكليف من جامعة براون يف عام ‪1961‬م‪،‬‬ ‫ٍ‬ ‫(‪،)2002-1910‬‬
‫ٍ‬
‫وسبة‪.‬‬‫ُل َغ ِو َّية ُم َ‬
‫اشت ََم َلت ُمدَ َّونة براون عىل أكثر من مليون كلمة‪ُ ،‬جِ َعت من مصادر أمريك َّية‬
‫والروايات‬ ‫حلكُوم َّية ِّ‬ ‫الصحف َّية والوثائق ا ُ‬ ‫وتنو َعت ما َّد ُتا بني ال ُكتُب واملقاالت َّ‬ ‫ُمتلفة‪َّ ،‬‬
‫واملعج ِم ِّيني‬
‫َ‬ ‫والقصص القصرية والتَّقارير وغريها‪ .‬حتظى ُمدَ َّونة براون بعناية ال ُّل َغ ِو ِّيني‬
‫ريق أما َم‬ ‫مهدَ ت ال َّط َ‬ ‫ريق لدراسة ال ِّلسان َّيات احلاسوب َّية‪ ،‬كام َّ‬ ‫مهدَ ت ال َّط َ‬ ‫منذ ُظ ِ‬
‫هورها‪ ،‬إذ َّ‬
‫العديد من املرشوعات الكربى يف جماالت البحث ال ُّل َغ ِو ّي وصناعة املعجم‪.‬‬

‫‪-57-‬‬
‫‪Members/nns of/in the/at committee/nn include/vibe Mrs./np Milton/np‬‬
‫‪Bernet/np ,/, Mrs./np J./np Clinton/np Bowman/np ,/, Mrs./np Rollie/np W./‬‬
‫‪np Bradford/np ,/, Mrs./np Samuel/np Butler/np Jr./np ,/, Mrs./np Donald/np‬‬
‫‪Carr/np Campbell/np ,/, Mrs./np Douglas/np Carruthers/np ,/, Mrs./np John/‬‬
‫‪np C./np Davis/np 3/cd ,/, ,/, Mrs./np Cris/np Dobbins/np ,/, Mrs./np William/‬‬
‫‪np E./np Glass/nn-tl ,/, Mrs./np Alfred/np Hicks/np 2/cd ,/, ,/, Mrs./np Donald/‬‬
‫‪np Magarrell/np ,/, Mrs./np Willett/np Moore/np ,/, Mrs./np Myron/np Neus-‬‬
‫‪teter/np ,/, Mrs./np Richard/np Gibson/np Smith/np ,/, Mrs./np James/np S./‬‬
‫‪np Sudier/np 2/cd ,/, and/cc Mrs./np Thomas/np Welborn/np ./.‬‬

‫الشكل‪ :1- 2‬نموذج من ُمدَ َّونة براون (‪.)1( )Brown Corpus‬‬


‫َّ‬
‫فريق من الباحثني يف جامعتَي النكَسرت‬ ‫ويف الفرتة من ‪ 1970‬إىل ‪1978‬م قا َم ٌ‬
‫ِّروجيي يف مدينة بريجن (‪ - )Bergen‬ببناء‬ ‫ّ‬ ‫َّعاون مع مركز احلوسبة الن‬ ‫وأوسلو ‪ -‬بالت ُ‬
‫« ُمدَ َّونة النكَسرت‪-‬أوسلو‪-‬برجن»( (�‪Lancaster-Oslo-Bergen (LOB) Cor‬‬
‫َ‬
‫املعالة‪.‬‬ ‫حيث منهج البناء وطريقة‬ ‫ِ‬
‫اإلنجليز َّية‪ ،‬عىل غرار ُمدَ َّونة براون من ُ‬ ‫‪ )pus‬ل ُّلغة‬
‫عة عىل َخ ِس ِم ِئة جمموعةٍ‬
‫واشتَم َلت هذه املدَ ونة عىل مليون كلمة إنجليزية مكتوبة‪ ،‬مو َّز ٍ‬
‫َُ‬ ‫َّ‬ ‫َّ‬ ‫َ‬
‫الص ُحف واملجالَّت‬ ‫ِ‬ ‫ٍ‬ ‫ٍ‬ ‫ِ‬
‫ألفي كلمة لكل جمموعة عىل حدة‪ .‬وقد ُج َعت ما َّد ُة املدَ َّونة من ُّ‬ ‫بواقع ْ‬
‫ِ‬
‫ُشت يف اململكة املتَّحدة حتى عام ‪1961‬م‪.‬‬ ‫اإلنجليز َّية ا َّلتي ن َ‬

‫‪ -3‬ا ُملدَ َّونات ال ُّلغ َِو َّية العرب َّية‬


‫الستِّينِ َّيات‬
‫وسبة يف أمريكا وأوروبا يف مطلع ِّ‬ ‫منهج دراسة املدَ َّونات ال ُّل َغ ِو َّية َ‬
‫املح َ‬ ‫َظ َه َر ُ‬
‫تعرف‬ ‫يزال جديدً ا عىل ال ُّلغة العرب َّية ا َّلتي مل ِ‬‫فاملنهج ال ُ‬ ‫رشين‪ .‬ومع هذا‪،‬‬ ‫الع ِ‬‫من القرن ِ‬
‫ُ‬
‫مرشوعات بحثِ َّية‬
‫ٍ‬ ‫رشين‪ِ ،‬من خالل‬ ‫ِ‬
‫والع ِ‬ ‫الطريق إليه إالَّ قري ًبا من القرن احلادي‬ ‫َ‬
‫نعر ُض ِ‬
‫لبعضها فيام ييل‪:‬‬ ‫لم َّية معدودة‪ِ ،‬‬ ‫وأطروحات ِع ِ‬
‫ٍ‬

‫«نايميخن» (‪)NIJMEGEN Corpus‬‬


‫ِ‬
‫‪ُ -1.3‬مدَ َّونة َ‬
‫اهلولند َّية يف عا َم ْي ‪ 1995‬و ‪1996‬م‪،‬‬ ‫ِ‬ ‫يخن‬ ‫فريق بحثي يف جامعة نايم ِ‬ ‫أنج َزها ٌ‬
‫َ‬ ‫ٌّ‬ ‫َ‬
‫املعجمي اهلولندي «يان هوخالند» (‪)Jan Hoogland‬؛ وهي ُمدَ َّون ٌة ُل َغ ِو َّي ٌة‬ ‫ّ‬ ‫بإرشاف‬
‫ِ‬
‫وتض ُّم ما يزيدُ عىل‬ ‫الص ُحف واملجالَّت واآلداب العرب َّية‪ُ ،‬‬ ‫مكتوب ٌة‪ُ ،‬ج َعت ما َّد ُتا من ُّ‬
‫ون كلمة‪ .‬است ِ‬
‫ُخد َمت يف صناعة ُمعج ٍم ُل َغ ِو ٍّي للعرب َّية واهلولند َّية‪.‬‬ ‫مل ُي َ‬
‫‪1- https://github.com/lrscy/NLP-Assginments/blob/master/HW1/Problem4/brown/ca17.‬‬

‫‪-58-‬‬
‫‪ -2.3‬ا ُملدَ َّونة العرب َّية (‪)Corpus Linguae Arabicae –CLARA‬‬

‫يك َّية يف عام‬ ‫فريق بحثي بمعهد دراسات الرشق األدنى بجامعة تشارلز الت ِِّش ِ‬ ‫أنج َزها ٌ‬
‫ٌّ‬ ‫َ‬
‫والص ُحف‬ ‫ِ‬
‫‪1997‬م؛ وهي ُمدَ َّون ٌة ُل َغ ِو َّي ٌة مكتوب ٌة‪ُ ،‬ج َعت ما َّدهتا من الدَّ ور َّيات العلمية‬
‫ُّ‬
‫املعج ِم َّية (‪.)1‬‬
‫الصناعة َ‬ ‫وتض ُّم مخسني مليون كلمة‪ .‬تُستَخدَ ُم هذه املا َّد ُة ألغراض ِّ‬ ‫العرب َّية‪ُ ،‬‬

‫‪ -3.3‬ا ُملدَ َّونة العرب َّية (‪)LEUVEN Corpus‬‬

‫وتتنوع‬ ‫يك َّية يف بلجيكا بني عا َم ْي ‪ 1995‬و ‪2004‬م؛‬ ‫نج َزت بجامعة لوفان الكاثولِ ِ‬‫ُأ ِ‬
‫َّ‬
‫الص ُحف واملجالت و ُكتُب‬ ‫ما َّدهتا بني املكتوب واملنطوق؛ فاملا َّدة املكتوبة مستقا ٌة من ُّ‬
‫تع ُّلم العربية ُ‬
‫وتض ُّم ثالثة ماليني كلمة‪ ،‬واملا َّدة املنطوقة ُمست ََمدَّ ٌة من اإلذاعات العرب َّية‬
‫واملرس ِح َّيات وتشتمل عىل ‪ 700‬ألف كلمة‪ُ .‬صنِ َعت هذه املدَ َّون ُة ل ُيستَفا َد منها يف بناء‬ ‫َ‬
‫‪/‬هولندي‪ُ ،‬ي َل ِّبي حاج َة ُمتَع ِّلمي العرب َّية من أبناء هولندا وبلجيكا‪.‬‬
‫ّ‬ ‫ُمعج ٍم عر ّ‬
‫يب‬
‫العلمي‪ ،‬نذكُر منها‪:‬‬
‫ّ‬ ‫بعض املدَ َّونات ال ُّل َغ ِو َّية العرب َّية املتاحة ألغراض البحث‬
‫وثم َة ُ‬
‫َّ‬

‫‪ُ -4.3‬مدَ َّونة ‪Egypt‬‬

‫عالة ال ُّلغة والكالم يف جامعة جون هوبكنز (‪ )John Hopkins‬يف‬ ‫مركز ُم َ‬‫ُ‬ ‫وض َعها‬
‫عام ‪ .1999‬وهي ُمدَ َّون ٌة ُل َغ ِو َّي ٌة مكتوب ٌة و ُمتوازية‪ ،‬ما َّد ُتا ال ُقرآن الكريم وترمجة معانيه‬
‫جر َيت عىل ن ُُصوص‬ ‫بعض اإلحصاءات ا َّلتي ُأ ِ‬ ‫والفرنس َية‪ ،‬وتُصاح ُبها ُ‬ ‫ِ‬ ‫ِ‬
‫اإلنجليز َّية‬ ‫إىل‬
‫بصورة جمَّانِ َّية‪.‬‬
‫ٍ‬ ‫التمجة اآلل َّية‪ ،‬وهي ُمتاح ٌة‬
‫ال ُقرآن الكريم‪ .‬تُستَخدَ ُم هذه املدَ َّونة ألغراض َّ‬
‫ِ‬
‫‪ُ -5.3‬مدَ َّونة العرب َّية املعاصة (‪)Corpus of Contemporary Arabic‬‬

‫السليطي ِضم َن األطروحة ا َّلتي تقدَّ مت هبا إىل‬ ‫َو َض َعتها الباحثة ال َق َط ِر َّية لطيفة ُّ‬
‫نوانا «تصميم وتطوير‬ ‫للح ُصول عىل درجة املاجستري يف عام ‪2004‬م‪ ،‬و ُع ُ‬ ‫جامعة ليدز ُ‬
‫ِ‬
‫ُمدَ َّونة ُل َغ ِو َّية للعرب َّية املعاصة»( (�‪Designing and Developing a Corpus of Con‬‬
‫وص املدَ َّونة من املجالَّت وصفحات الويب‪ ،‬ويربو‬ ‫ِ‬
‫‪ُ .)temporary Arabic‬ج َعت ن ُُص ُ‬
‫تعليم َّي ٍة تتع َّل ُق بتعليم‬
‫ِ‬ ‫ٍ‬
‫ألغراض‬ ‫عدد كلامهتا عىل ثامنمئة ألف كلمة؛ استَخدَ َمتها الباحث ُة‬
‫العرب َّية لغري النَّاطِ ِقني هبا‪.‬‬

‫‪1- http://web.ff.cuni.cz/ustavy/usj/staré/veda/projekty/clara.htm.‬‬

‫‪-59-‬‬
‫َّارخيي ل ُّلغة العرب َّية‬
‫ّ‬ ‫‪ُ -6.3‬مدَ َّونة املعجم الت‬
‫السعيد) ِضم َن األطروحة ا َّلتي تقدَّ َم هبا إىل جامعة‬ ‫(املعتز باهلل َّ‬
‫ّ‬ ‫ُ‬
‫الباحث‬ ‫َو َض َعها‬
‫نوانا « ُمدَ َّونة ُمعج ٍم‬
‫للح ُصول عىل درجة الدُّ كتوراه يف عام ‪2011‬م‪ ،‬و ُع ُ‬ ‫القاهرة ُ‬
‫ِ‬
‫التاث‬ ‫وص املدَ َّونة من ُّ‬ ‫عالة ُل َغ ِو َّية ُ‬
‫حاسوبِ َّية»‪ُ .‬ج َعت ن ُُص ُ‬ ‫تارخيي ل ُّلغة العرب َّية‪ُ :‬م َ‬ ‫ّ‬
‫ِ‬ ‫ِ‬
‫رب ال ُع ُصور األدب َّية للعرب َّية بد ًءا من عام ‪157‬م إىل وقت إنجازها‪.‬‬ ‫يب املكتوب ع َ‬ ‫العر ّ‬
‫األو ُل يف عام ‪ ،2011‬ويربو عد ُد الكلامت فيه عىل‬ ‫دونة ثالثة إصدارات‪َّ ،‬‬ ‫الـم َّ‬
‫وهلذه ُ‬
‫مئة مليون كلمة‪ ،‬وال َّثاين يف عام (‪ ،)2014‬ويربو عد ُد الكلامت فيه عىل مليار كلمة‪،‬‬
‫الث يف عام (‪ ،)2018‬ويربو عد ُد الكلامت فيه عىل مليار ونصف املليار كلمة‪.‬‬ ‫وال َّث ُ‬
‫َّارخيي‬
‫ّ‬ ‫األساس ا َّلذي انط َل َق من ُه ُم ُ‬
‫عجم الدَّ وحة الت‬ ‫َ‬ ‫دونة كانت‬ ‫أن هذه ا ُمل َّ‬ ‫بالذكر َّ‬
‫وجدير ِّ‬‫ٌ‬
‫ِ‬
‫رشف عىل تطويرها‪.‬‬ ‫الـمعجم‪ ،‬و ُي ُ‬ ‫دونة ُ‬ ‫ُ‬
‫الباحث ببناء ُم َّ‬ ‫حيث قا َم‬‫ل ُّلغة العرب َّية؛ ُ‬

‫‪ -7.3‬املدَ َّونات ال ُّلغ َِو َّية َ‬


‫ملؤ َّسسة «إل دي يس» (‪)LDC Corpora‬‬
‫ِ‬
‫املوارد‬ ‫أنج َزت ُم َؤ َّسسة ‪-LDC‬التَّابعة جلامعة بنسلفانيا األمريك َّية‪ -‬العديدَ من‬ ‫َ‬
‫والشام واخلليج‬ ‫َّ‬ ‫ِ‬
‫تدعم العرب َّية املعاصة وهلجاهتا الدَّ ِارجة (يف مرص‬ ‫ال ُّل َغ ِو َّية ا َّلتي‬
‫ُ‬
‫ِ‬ ‫ٍ‬ ‫ٍ‬ ‫ِ ِ‬
‫للباحثني‬ ‫ؤسسة‬ ‫املوارد عىل ُمدَ َّونات ُل َغ ِو َّية‪ ،‬ت ُ‬
‫ُتيحها ا ُمل َّ‬ ‫أكثر هذه‬
‫يب)؛ واعتمدَ َت ُ‬ ‫العر ّ‬
‫اجلدول التَّايل لبعض املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي‬ ‫ُ‬ ‫ِ‬
‫ويعرض‬
‫ُ‬ ‫املعن ِّيني بحوسبة ال ُّلغة ُ‬
‫[بمقابل]‪.‬‬
‫يحها ُم َؤ َّسسة ‪.)1( LDC‬‬ ‫ِ‬
‫تُت ُ‬
‫التَّطبيقات‬ ‫مصدر البيانات‬ ‫املدَ َّونة‬
‫مكتوبة ‪ /‬وكاالت‬
‫اسرتجاع املعلومات‪ ،‬ونمذجة‬ ‫األنباء‬ ‫جيجاوورد العرب َّية‬
‫ال ُّلغة‪ ،‬و ُمعاجلة ال ُّلغات ال َّطبيع َّية‬ ‫‪،2007 ،2006‬‬ ‫‪Arabic Gigaword‬‬
‫‪2011 ،2009‬‬
‫مكتوبة ‪ /‬وكاالت‬
‫األنباء‬
‫ِّلقائي للمحتوى‪،‬‬ ‫االستخراج الت ّ‬ ‫يب‬
‫َّحوي العر ّ‬
‫البنك الن ّ‬
‫‪،2004 ،2003‬‬
‫واسرتجاع املعلومات ُل َغ ِو ًّيا‪،‬‬ ‫‪Arabic Treebank‬‬
‫‪،2006 ،2005‬‬
‫والكشف عن املعلومات‬ ‫(أربعة أجزاء)‬
‫‪،2011 ،2010‬‬
‫‪2016 ،2014 ،2012‬‬

‫‪1- http://www.ldc.upenn.edu‬‬

‫‪-60-‬‬
‫املدَ َّونة اإلخبار َّية املنطوقة للعرب َّية‬
‫منطوقة ‪ّ /‬‬
‫البث‬
‫َّعرف عىل الكالم املنطوق‬
‫الت ُّ‬ ‫‪GALE Phase 4 Arabic‬‬
‫اإلخباري ‪2018‬‬
‫ّ‬ ‫‪Broadcast News Speech‬‬

‫التمجة اآلل َّية‬‫َّ‬ ‫منطوقة ‪ /‬نقاشات‬ ‫املدَ َّونة اا ُملتوازية ُملنتدى العر ّ‬
‫يب‬
‫ِ‬
‫املعاصة)‬ ‫(اإلنجليز َّية والعرب َّية‬ ‫علم َّية ‪2019‬‬
‫‪BOLT Arabic Discussion Forum‬‬
‫‪Parallel Training Data‬‬

‫دونات ال ُّلغو َّية ُمل َّ‬


‫ؤسسة «‪.»LDC‬‬ ‫اجلدول ‪ :1-2‬من ا ُمل َّ‬

‫‪ -4‬أنواع ا ُملدَ َّونات ال ُّلغ َِو َّية ‬


‫ِ‬
‫نوع املدَ َّونة ال ُّل َغ ِو َّية وف ًقا للهدف منها وجماالت اإلفادة من ن ُُصوصها‪َّ .‬‬
‫وثم َة‬ ‫يتحدَّ ُد ُ‬
‫اعتبارات لتصنيف املدَ َّونات‪ ،‬نُجملها عىل النَّحو التَّايل‪:‬‬ ‫ٌ‬

‫‪ -1.4‬ا ُملدَ َّونات ال ُّلغ َِو َّية باعتبار هيئة الن ُُّصوص‪ .‬وتنق�سم �إلى‪:‬‬
‫Ÿ Ÿاملدَ َّونات ال ُّل َغ ِو َّية الن َِّّص َّية (‪)Text Corpora‬‬
‫كالص ُحف‬ ‫مصادر مكتوبة‪،‬‬ ‫ِ‬
‫تستمدُّ ما َّد َتا من‬ ‫وهي املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي‬
‫ُّ‬ ‫َ‬
‫واملجالَّت وال ُكتُب املطبوعة والوثائق املخطوطة واملنشورات واألطروحات العلم َّية‪.‬‬
‫ال ملستوى ال ُّلغة‬ ‫َ‬
‫تكون متثي ً‬ ‫ب عليها أن‬ ‫واقع ال ُّلغة املكتوبة ويغ ُل ُ‬
‫تعكس هذه املدَ َّونات َ‬
‫ال ُفصحى؛ تُستَخدَ م يف الدِّ راسات ال ُّل َغ ِو َّية التَّارخي َّية وبناء املعجامت والتَّنقيب يف‬
‫َّعرف اآل ّيل عىل‬ ‫وجيات وشبكات الكلامت‪ ،‬كام تُستَخدَ م يف الت ُّ‬ ‫البيانات وبناء األُ ْن ُطو ُل ْ‬
‫الكالم املكتوب (‪ .)Optical Character Recognition -OCR‬من أمثلتها‪ُ :‬مدَ َّونة‬
‫بناؤها يف عام ‪2006‬م؛‬ ‫اكتم َل ُ‬
‫أكس ُفورد اإلنجليز َّية (‪ )Oxford English Corpus‬ا َّلتي َ‬
‫مليار ْي كلمة ‪ -‬يف إنجاز ال َّطبعة ال َّثالثة من ُمعجم‬ ‫َ‬ ‫وتُستَخدَ م ما َّدهتا ‪ -‬ا َّلتي تربو عىل‬
‫اإلنجليز َّية (‪.)Oxford English Dictionary‬‬ ‫ِ‬ ‫خي ّي] ل ُّلغة‬‫َّار ِ‬
‫أكسفورد [الت ِ‬

‫Ÿ Ÿاملدَ َّونات ال ُّل َغ ِو َّية املنطوقة (‪)Speech/Spoken Corpora‬‬

‫مصادر منطوقة‪ ،‬كاألفالم الوثائق َّية‬ ‫ِ‬


‫تستمدُّ ما َّد َتا من‬ ‫هي املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي‬
‫َ‬
‫واملسلسالت اإلذاع َّية ونرشات األخبار واملحادثات اهلاتف َّية‪ .‬تعكس هذه املدَ َّونات‬
‫ال ملستوى ال ُّلغة الدَّ ارجة؛ تُستَخدَ م يف‬ ‫َ‬
‫تكون متثي ً‬ ‫ب عليها أن‬ ‫واقع ال ُّلغة املنطوقة ويغ ُل ُ‬ ‫َ‬

‫‪-61-‬‬
‫ِ‬
‫الدِّ راسات ال ُّل َغ ِو َّية الوصف َّية ودراسة ال َّلهجات وبناء األطالس ال ُّل َغ ِو َّية والت ُّ‬
‫َّعرف اآل ّيل‬
‫عىل الكالم املنطوق (‪ .)Automatic Speech Recognition -ASR‬من أمثلتها‪:‬‬
‫َّحدة) املنطوقة‬‫مدَ ونة «سانتا باربرا» لألنجلوأمريكية (اإلنجليزية يف الواليات املت ِ‬
‫َّ‬ ‫َّ‬ ‫ُ َّ‬
‫نج َزت يف جامعة‬ ‫(‪ )Santa Barbara Corpus of Spoken American English‬ا َّلتي ُأ ِ‬
‫كاليفورنيا؛ وتُستَخدَ م ما َّدهتا يف دراسة ال َّلهجات األمريك َّية‪.‬‬

‫‪ -2.4‬ا ُملدَ َّونات ال ُّلغ َِو َّية باعتبار تعدُّ د ال ُّلغة‪ .‬و�أنواعها‪:‬‬
‫Ÿ Ÿ ُمدَ َّونات أحاد َّية ال ُّلغة (‪)Monolingual Corpora‬‬
‫ٍ‬ ‫ِ‬
‫وصها من ُلغة واحدة‪ ،‬ويغ ُل ُ‬
‫ب عليها أن ُت َغ ِّط َي‬ ‫وهي املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي تستمدُّ ن ُُص َ‬
‫ُمستوى ُل َغ ِو ًّيا ُم َع َّينًا (ال ُّلغة ال ُفصحى أو الدَّ ارجة)؛ تُستَخدَ م يف بناء املعجامت أحاد َّية‬
‫ال ُّلغة‪ ،‬كام تُستَخدم يف العديد من جماالت البحث يف ُع ُلوم ال ُّلغة‪ ،‬مثل اإلحصاء ال ُّل َغ ِو ّي‬
‫ِ‬
‫الوصف َّية‪ .‬من أمثلتها‪ُ « :‬مدَ َّونة كوبيلد»( (�‪CO‬‬ ‫َّحو َّية والدِّ راسات ال ُّل َغ ِو َّية‬
‫والدِّ راسات الن ِ‬
‫فريق بحثي مشرتك بني ِ‬ ‫ِ‬ ‫شار َك يف‬
‫جامعة برمنجهام‬ ‫ٌّ ُ‬ ‫تطويرها ٌ‬ ‫‪ )BUILD Corpus‬ا َّلتي َ‬
‫ومؤ َّسسة «كولينز» (‪ )Collins‬للنَّرش؛ وتُستَخدَ م ما َّدهتا ‪ -‬ا َّلتي تتجاوز ‪ 450‬مليون كلمة‪-‬‬ ‫َ‬
‫يف بناء وتطوير سلسلة املعاجم اإلنجليز َّية «كولينز ‪ -‬كوبيلد» (‪.)Collins Cobuild‬‬
‫Ÿ Ÿ ُمدَ َّونات ثنائ َّية ال ُّلغة (‪)Bilingual Corpora‬‬

‫فصيلة ُل َغ ِو َّي ٍة واحدة‬


‫ٍ‬ ‫وصها من ُل َغتَني تنتميان إىل‬ ‫ِ‬
‫وهي املدَ َّونات ا َّلتي تستمدُّ ن ُُص َ‬
‫التمجة اآلل َّية وتعليم‬ ‫نائ َّية ال ُّلغة وتطبيقات َّ‬ ‫أو فصي َلتَني؛ وتُستَخدَ م يف بناء املعجامت ُث ِ‬
‫ِ‬ ‫ِ‬
‫واإلنجليز َّية (‪Sentence‬‬ ‫بني العرب َّية‬ ‫للج َمل َ‬ ‫ال ُّلغات‪ .‬من أمثلتها‪ :‬املدَ َّونة ال ُّثنائ َّية ُ‬
‫أنجزهتا رشكة َصخر لإلفادة‬ ‫‪ )Aligned Bilingual Arabic English Corpus‬ا َّلتي َ‬
‫الشكة‪ ،‬وت َُض ُّم‬ ‫عالة ال ُّلغات ال َّط ِ‬
‫بيع َّية ا َّلتي تقو ُم هبا َّ‬ ‫الربم َّيات وتطبيقات ُم َ‬ ‫منها يف تقييم َ‬
‫ما يربو عىل مليون وثالثمئة ألف ُجلة بال ُّل َغتَني ال َع َربِ َّية واإلنجليز َّية‪.‬‬
‫Ÿ Ÿ ُمدَ َّونات ُمتعدِّ دة ال ُّلغات (‪)Multilingual Corpora‬‬

‫وصها من ِعدَّ ة ُلغات؛ تُستَخدَ م يف أغراض‬ ‫ِ‬


‫وهي املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي تستمدُّ ن ُُص َ‬
‫املدَ َّونات ثنائ َّية ال ُّلغة عىل ٍ‬
‫نطاق واسع‪ .‬من أمثلتها‪ :‬املدَ َّونة ُم َت َعدِّ دة ال ُّلغات (‪Multilingual‬‬
‫أطروحته للدُّ كتوراه يف جامعة‬
‫َ‬ ‫ويني ضمن‬ ‫الز ّ‬ ‫العراقي ستَّار ّ‬
‫ّ‬ ‫‪ )Corpus‬ا َّلتي أعدَّ ها الباحث‬

‫‪-62-‬‬
‫التمجة اآللية؛ ونُصوصها مستَمدَّ ٌة من ثالث ُل ٍ‬
‫غات‪،‬‬ ‫مانشسرت‪ ،‬لإلفادة منها يف تطبيقات َّ‬
‫ُ ُ ُ َ‬ ‫َّ‬
‫وسبعمئة ألف كلمة)‬ ‫والسويد َّية (يف مليونني َ‬
‫هي اإلنجليز َّية (يف سبعة ماليني كلمة) ِّ‬
‫والعرب َّية (يف مليونني ومخسمئة ألف كلمة)‪.‬‬

‫‪ -3.4‬ا ُملدَ َّونات ال ُّلغ َِو َّية باعتبار توا ُفق الن ُُّصوص‪ .‬وتنق�سم �إلى‪:‬‬
‫Ÿ Ÿاملدَ َّونات ال ُّل َغ ِو َّية املتوازية (‪)Parallel Corpora‬‬
‫ِ‬
‫ُ‬
‫وتكون الن ُُّصوص‬ ‫وصها من ُل َغتَني أو أكثر‪،‬‬ ‫وهي املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي تستمدُّ ن ُُص َ‬
‫ال يف إحدى هذه ال ُّلغات ‪ -‬وت َُس َّمى (ال ُّلغة املصدر)‪ ،‬وترمج ًة يف ال ُّلغة [أو ال ُّلغات]‬ ‫أص ً‬
‫األخرى ‪ -‬وت َُس َّمى (ال ُّلغة [أو ال ُّلغات] اهلدف)؛ من النَّامذج‬
‫املم ِّثلة للمدَ َّونات املتوازية‪ :‬ترمجات العهد القديم (وتكون‬ ‫َ‬
‫مصدرا لغريمها من ال ُّلغات)‪،‬‬ ‫ً‬ ‫العرب َّية واآلرام َّية فيها‬
‫مصدرا‬
‫ً‬ ‫وترمجات العهد اجلديد (وتكون ال ُيونان َّي ُة فيها‬
‫لغريها من ال ُّلغات)‪ ،‬وترمجات ال ُقرآن الكريم (وتكون‬
‫لغريها من ال ُّلغات‪ ،‬كام ُيعتَرب (حجر‬ ‫مصدرا ِ‬ ‫ً‬ ‫العرب َّية فيها‬
‫غات‪ ،‬هي املِ ِ‬
‫رص َّية‬ ‫حيث كُتِبت نُصوصه بثالث ُل ٍ‬
‫ُ ُ‬ ‫نموذجا هلذا النَّوع من املدَ َّونات ُ َ‬ ‫ً‬ ‫رشيد)‬
‫القديمة ( ُلغة الكَهنة) ِ‬
‫حلكَّام)‪.‬‬‫الشعب) واإلغريق َّية ( ُلغة ا ُ‬ ‫والقبط َّية ( ُلغة َّ‬ ‫َ‬
‫وتتعدَّ د وسائل اإلفادة من املدَ َّونات ال ُّل َغ ِو َّية املتوازية حيث تُستَخدَ ُم يف بناء املعجامت‬
‫والتمجة اآلل َّية‪ ،‬كام تُستَخدَ م يف تعليم ال ُّلغات‬ ‫نائ َّية ال ُّلغة وتطبيقات التَّع ُّلم اآل ّيل َّ‬ ‫ُث ِ‬
‫والدِّ راسات ال ُّل َغ ِو َّية املقارنة (بني ُلغات الفصيلة الواحدة‪ ،‬كالعرب َّية والعرب َّية) والتَّقا ُب ِل َّية‬
‫الفصائل امل َت َعدِّ دة‪ ،‬كالعرب َّية واإلنجليز َّية)؛ وحتقي ًقا لألهداف املنشودة من‬ ‫ِ‬ ‫(بني ُلغات‬
‫تظهر‬
‫ُ‬ ‫جنب‪ -‬يف قوالب متوازية‪ ،‬بحيث‬ ‫ٍ‬ ‫وصها ‪-‬جن ًبا إىل‬
‫توض ُع ن ُُص ُ‬ ‫املدَ َّونات املتوازية َ‬
‫مصفوفات ‪ -‬كلم ًة كلمة‪ ،‬أو ُجل ًة مجلة‪ ،‬وهكذا‪ .‬من أمثلتها‪ :‬املدَ َّونة املتوازية‬ ‫ٍ‬ ‫‪ -‬يف‬
‫األورب( (�‪European Parliament Proceedings Parallel Cor‬‬ ‫ّ‬ ‫لوقائع الربملان‬
‫وصا ُمتوازية بني‬ ‫نج َزت خالل الفرتة من ‪1996‬م إىل ‪2009‬م‪ ،‬وت َُض ُّم ن ُُص ً‬ ‫‪ )pus‬ا َّلتي ُأ ِ‬
‫يك َّية‪،‬‬‫االتاد األورويب‪ ،‬هي (البلغارية‪ ،‬والت ِِّش ِ‬ ‫اإلنجليز َّية وعرشين ُلغة أخرى من ُلغات ِّ‬
‫َّ‬ ‫ُ ّ‬
‫والدَّ نمرك َّية‪ ،‬واألملان َّية‪ ،‬واليونان َّية‪ ،‬واإلسبان َّية‪ ،‬واإلستون َّية‪ ،‬والفنلند َّية‪ ،‬والفرنس َّية‪،‬‬

‫‪-63-‬‬
‫واملج ِر َّية‪ ،‬واإليطال َّية‪ ،‬وال ِّليتوان َّية‪ ،‬والالَّتف َّية‪ ،‬واهلولند َّية‪ ،‬والبولند َّية‪ ،‬والربتُغال َّية‪،‬‬ ‫َ‬
‫والسويد َّية)‪.‬‬ ‫والس ُلوفين َّية‪ِّ ،‬‬ ‫والس ُلوفاك َّية‪ِّ ،‬‬‫والرومان َّية‪ِّ ،‬‬ ‫ُّ‬
‫الضوابط‬ ‫يلتز َم ُصنَّا ُعها ببعض َّ‬ ‫َوازية أن ِ‬ ‫منهج بناء املدَ َّونات ال ُّل َغ ِو َّية املت ِ‬
‫ُ‬ ‫ويقت َِض‬
‫فباإلضافة إىل ُوجوب‬‫ِ‬ ‫لتيسري ُمعاجلتها وف ًقا للغرض ا َّلذي ُو ِض َعت املدَ َّون ُة ألجله‪.‬‬
‫ِ‬ ‫ف يف ال ُّلغة اهلَدَ ف بام ُيالِ ُ‬ ‫ِ‬
‫األصل‬
‫َّ‬ ‫َّص‬‫ف الن َّ‬ ‫َص َ‬ ‫بمحاذاة الن ُُّصوص‪ ،‬ينبغي أالَّ ُيت َ َّ‬ ‫االلتزام ُ‬
‫جلمل َة اإلنجليز َّية (‪)Obama Said that‬‬ ‫يف ال ُّلغة املصدَ ر‪ .‬وعىل سبيل املثال فإنَّنا ن َُتجم ا ُ‬
‫الر ِئيس أوباما»؛ كام ينبغي أالَّ‬ ‫«قال َّ‬‫«قال أوباما ذلك»‪ ،‬وال نقول َ‬ ‫جلملة َ‬ ‫إىل العرب َّية با ُ‬
‫ال ‪ )Take the door( -‬ترمج ًة‬ ‫التمجة احلرفِ َّية بام قد ُي َغ ِّ ُي املعنى‪ ،‬فال نقول ‪ -‬مث ً‬ ‫غال يف َّ‬‫ُي َ‬
‫ناحية أخرى‪،‬‬ ‫ٍ‬ ‫جلملة (‪ .)Close the door‬ومن‬ ‫للجملة ُ‬
‫«خذ الباب»‪ ،‬وإنَّام نُرتمجها با ُ‬ ‫ُ‬
‫َّداول َّية ‪ Pragmatics‬ا َّلتي تتع َّل ُق باستعامل ال ُّلغة بني‬ ‫ِ‬ ‫ِ‬
‫ينبغي ُمراعا ُة اجلوانب الربمجات َّية‪/‬الت ُ‬
‫َّمثيل عىل هذه اجلوانب‬ ‫ألوان االستعارة والكناية واملجاز؛ و ُيمكن الت ُ‬ ‫ُ‬ ‫أهلها ‪ -‬بام يف ذلك‬ ‫ِ‬
‫ِ‬
‫«إنا يف ال ُغ ُيوم»‪،‬‬ ‫جلملة العرب َّية َّ‬ ‫جلملة (‪ )She is in the clouds‬ا َّلتي ت َُت َج ُم حرف ًّيا إىل ا ُ‬ ‫با ُ‬
‫الذهن»؛ وحتقي ًقا للهدف من املدَ َّونات املتَوازية‪ ،‬ينبغي حتديد‬ ‫«إنا شاردة ِّ‬ ‫بينام ُيرا ُد هبا َّ‬
‫ٍ‬
‫بعناية ومتييزها يف كال ال ُّل َغتَني‪.‬‬ ‫هذه اجلوانب‬
‫Ÿ Ÿاملدَ َّونات ال ُّل َغ ِو َّية غري املتوازية (‪)Non-parallel Corpora‬‬

‫املتقاربة‪/‬املتقابلة (‪ ،)Comparable Corpora‬وهي‬ ‫ِ‬ ‫أيضا باملدَ َّونات‬


‫ُعرف ً‬ ‫وت َ‬
‫جمموعة من ال َّلهجات يف ُل ٍ‬
‫ٍ‬ ‫ِ‬
‫غة واحدة‪ ،‬أو‬ ‫وصها من‬ ‫املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي تستمدُّ ن ُُص َ‬
‫أي من ال ُّلغات‬
‫غري ُم َتج ٍم يف ٍّ‬ ‫وتكون الن ُُّصوص أص ً‬
‫ال َ‬ ‫ُ‬ ‫ُل َغتَني‪ ،‬أو جمموعة من ال ُّلغات‪،‬‬
‫ا َّلتي ت َُض ُّمها املدَ َّونة؛ يندُ ر استخدا ُم هذا النَّوع من املدَ َّونات ً‬
‫نظرا لنُدرة الن ُُّصوص املتقاربة‬
‫بني ال ُّلغات (كال ُع ُقود القانون َّية بني اإلنجليز َّية والفرنس َّية يف ُمقاطعات كندا واملناهج‬
‫املهجر النَّاطقة باإلنجليز َّية)‪ .‬تُستَخدَ م‬
‫َ‬ ‫التَّعليم َّية بني العرب َّية واإلنجليز َّية يف بعض دول‬
‫املدَ َّونات املت ِ‬
‫َقاربة يف التَّع ُّلم اآل ّيل وتطبيقات َّ‬
‫التمجة اآلل َّية‪ ،‬كام ُيمك ُن اإلفاد ُة منها يف‬
‫فك االلتباس الدِّ ال ّيل للكلامت (‪.)Word Sense Disambiguation -WSD‬‬ ‫تطبيقات ّ‬
‫من أمثلتها‪ :‬املدَ َّونة الدَّ ول َّية لإلنجليز َّية (‪،)International Corpus of English‬‬
‫ا َّلتي هتدف إىل وضع ال ُف ُروق األساس َّية بني هلجات ال ُّلغة اإلنجليز َّية يف الدُّ َول النَّاطقة‬
‫جمموعة من الن ُُّصوص املتقاربة بني هلجات هذه الدُّ َول‪.‬‬ ‫ٍ‬ ‫هبا باستخدام‬

‫‪-64-‬‬
‫‪ -4.4‬ا ُملدَ َّونات ال ُّلغ َِو َّية باعتبار طبيعة الن ُُّصوص‪ .‬وتنق�سم �إلى‪:‬‬
‫صصة (‪)Specialized Corpora‬‬ ‫Ÿ Ÿاملدَ َّونات ال ُّل َغ ِو َّية َ‬
‫املتخ ِّ‬
‫ٍ‬ ‫ٍ‬ ‫حقل ُم َع َّ ٍ‬
‫ٍ‬ ‫ِ‬
‫حل ُقول‪،‬‬‫ي أو جمموعة ُم َع َّينة من ا ُ‬ ‫وصها من‬‫هي املدَ َّونات ا َّلتي تَستمدُّ ن ُُص َ‬
‫ِ‬
‫واإلخبار َّية‪ ،‬أم ُح ُقوالً تارخي َّية‬ ‫لم َّية والقانُونِ َّية‬
‫الع ِ‬
‫معرفية ‪ -‬كاحل ُقول ِ‬
‫ُ‬ ‫سوا ٌء أكانت ُح ُقوال ِ َّ‬
‫وح ُقول ال ُع ُصور األدب َّية‬ ‫ِ‬ ‫ِ‬ ‫كح ُقول ال ُّلغة القديمة والوسيطة‬
‫اإلنجليز َّية ُ‬ ‫واملعاصة يف‬ ‫‪ُ -‬‬
‫يف العرب َّية‪ ،‬أم ُح ُقوال ُجغرافِ َّي ًة كن ُُصوص العرب َّية يف وادي النِّيل واجلزيرة العرب َّية وبالد‬
‫ٍ‬
‫كاتب‬ ‫َص فيها عىل الن ُُّصوص املكتوبة أو املنطوقة‪ ،‬أو ُت َم ُع من ن ُُصوص‬ ‫فارس؛ وقد ُيقت َ ُ‬
‫اهلندي؛‬
‫ّ‬ ‫الشعر عند طاغور‬ ‫ي‪ ،‬كالن ُُّصوص املرسح َّية عند شكسبري‪ ،‬ون ُُصوص ِّ‬ ‫أديب ُم َع َّ ٍ‬
‫أو ٍ‬
‫الوصف َّية ودراسة ال َّلهجات وال َّظواهر ال ُّل َغ ِو َّية يف ُلغة‬ ‫ِ‬ ‫تُستَخدَ م يف الدِّ راسات ال ُّل َغ ِو َّية‬
‫األدباء‪ ،‬وتُستَخدم ‪ -‬كذلك ‪ -‬يف بناء األطالس ال ُّل َغ ِو َّية واملعجامت ال ُّل َغ ِو َّية املت ََخ ِّصصة‪،‬‬
‫مثل ُمعجامت ُمصطلحات ال ُع ُلوم و ُمعجامت األدباء‪ .‬من أمثلتها‪ُ :‬مدَ َّونة لندن‪-‬لوند‬
‫لإلنجليز َّية املنطوقة (‪ )London-Lund Corpus of Spoken English -LLC‬ا َّلتي‬ ‫ِ‬
‫ٍ‬
‫بتكليف من جامعة لوند‪،‬‬ ‫ويدي «جان سفارتفيك» (‪)Jan Svartvik‬‬ ‫الس ّ‬ ‫أنجزها ال ُّل َغ ِو ّي ِّ‬
‫َ‬
‫نصف مليون كلمة‪.‬‬ ‫َ‬ ‫يتجاوز‬
‫ُ‬ ‫ِ‬
‫املحك َّية يف لندن فيام‬ ‫ِ‬
‫اإلنجليز َّية‬ ‫وتستمدُّ ما َّد َتا من ال ُّلغة‬
‫Ÿ Ÿاملدَ َّونات ال ُّل َغ ِو َّية العا َّمة (‪)General Corpora‬‬

‫تتنو ُع ما َّد ُتا بني‬ ‫ي من الن ُُّصوص‪ ،‬بل َّ‬ ‫وهي ُمدَ َّونات ُل َغ ِو َّي ٌة ال َت َت َق َّيدُ بنو ٍع ُم َع َّ ٍ‬
‫حل ُقول ِ‬ ‫ٍ‬ ‫ٍ‬
‫جتمع بني الن ُُّصوص‬ ‫ُ‬ ‫جلغراف َّية‪ ،‬وقد‬ ‫املعرف َّية والتَّارخي َّية وا ُ‬ ‫جمموعات ُمتلفة من ا ُ‬
‫أغراض املدَ َّونات ال ُّل َغ ِو َّية‬
‫ُ‬ ‫ستويات ُل َغ ِو َّي ٍة ُم َت َعدِّ دة؛ تتعدَّ ُد‬
‫ٍ‬ ‫املكتوبة واملنطوقة‪ ،‬أو ُم‬
‫عالة ال ُّلغات‬ ‫العا َّمة‪ ،‬وتُستَخدَ م يف ُمتلف ميادين البحث ال ُّل َغ ِو ّي وصناعة املعجم و ُم َ‬
‫والتمجة اآلل َّية‪ .‬من أمثلتها‪:‬‬ ‫ال َّطبيع َّية‪ ،‬ويك ُثر استخدا ُمها ‪-‬حتديدً ا‪ -‬يف تعليم ال ُّلغات َّ‬
‫أنج َزهتا ُم َؤ َّسسة ‪ LDC‬يف عدَّ ة‬ ‫ُمدَ َّونة مرشوع « ُأو ْن ُطو‪-‬نُوتْس» (‪ )OntoNotes‬ا َّلتي َ‬
‫وتتنو ُع‬
‫َّ‬ ‫ِ‬
‫واإلنجليز َّية؛‬ ‫والصينِ َّية‬
‫إصدارات بني عا َمي ‪ 2007‬و‪2011‬م بال ُّلغات العرب َّية ِّ‬
‫ٍ‬
‫ما َّد ُتا بني احلوارات املكتوبة ونرشات األخبار‪.‬‬

‫‪-65-‬‬
‫‪ -5‬عنونة‪/‬تذييل املدَ َّونات ال ُّلغ َِو َّية‬
‫َ‬
‫خاللا‬ ‫عنونة‪/‬تذييل املدَ َّونة ال ُّل َغ ِو َّية (‪ )Corpus Annotation‬عمل َّي ٌة وسيط ٌة‪ُ ،‬‬
‫تنتقل‬
‫يسه ُل التَّعا ُم ُل معها آل ًّيا ( ُم َعنونة)؛‬ ‫ٍ‬
‫األول َّية (اخلام) إىل ُصورة ُ‬
‫وص من ُصورهتا َّ‬ ‫الن ُُّص ُ‬
‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ٍ‬
‫قصدُ بعنونة ن ُُصوص املدَ َّونات ال ُّل َغ ِو َّية إضافة معلومات توضيح َّية توصيف َّية لك ُِّل‬ ‫و ُي َ‬
‫الزم ًة للوحدات‪.‬‬ ‫املعلومات ُم ِ‬
‫ُ‬ ‫بحيث تُصبِ ُح‬
‫ُ‬ ‫ٍ‬
‫وحدة ُل َغ ِو َّية يف الن ُُّصوص عىل حدة‪،‬‬
‫للمعالة اآلل َّية لن ُُصوص املدَ َّونات ال ُّل َغ ِو َّية‪ ،‬كام تُساعد يف إجراء‬
‫َ‬ ‫وت َ ِّهدُ هذه العمل َّي ُة‬
‫ُ‬
‫حيث ُت َق ِّل ُل من اجلهد املبذول يف ُمتابعة وإحصاء‬ ‫ُ‬ ‫االختبارات اليدَ و َّية للن ُُّصوص‪،‬‬
‫بمدَ َّو ٍنة‬
‫امللحقة ُ‬
‫ِ‬
‫املفردات؛ ومن ناحية أخرى ُيمكن اإلفادة من ال َعنونات َ‬
‫ٍ‬
‫توصيفات َ‬
‫ِ‬
‫ُل َغ ِو َّي ٍة ُم َع َّي ٍنة يف عنونة ُمدَ َّونة ُل َغ ِو َّي ٍة أخرى يف حال اتِّفاق املدَ َّو َنتَني يف أهدافِهام‪ ،‬واتِّفاقهام‬
‫وصهام‪.‬‬‫‪ -‬كذلك ‪ -‬يف أسلوب املعاجلة اآللية لنُص ِ‬
‫َّ ُ‬
‫ِ‬
‫وأغراضها البحث َّية؛ بل قد‬ ‫وختتلف طريقة عنونة املدَ َّونات ال ُّل َغ ِو َّية باختالف أنواعها‬ ‫ُ‬
‫ختتلف طريق ُة ال َعنونة بني ُمدَ َّو َنتَني باختالف املعلومات املستَخ َل َصة منهام‪ ،‬وإن ا َّت َف َقتا يف‬
‫ُ‬
‫كيبي ‪ -‬مث ً‬
‫ال‬ ‫الت ّ‬ ‫النَّوع واهلدف‪ .‬فطريقة َعنونة املدَ َّونات ال ُّل َغ ِو َّية املستخدمة يف التَّحليل َّ‬
‫املعجمي للن ُُّصوص‪.‬‬ ‫ّ‬ ‫فك االلتباس الدِّ ال ّيل أو التَّحليل‬ ‫ختتلف عن تلك املستخدمة يف ّ‬ ‫ُ‬ ‫‪-‬‬
‫بعض ُصنَّاع املدَ َّونات ال ُّل َغ ِو َّية املستخدمة يف صناعة املعجم إىل اإلبقاء عىل‬ ‫ويعمدُ ُ‬
‫متاسك هيئة الن َُّصوص عند االستشهاد هبا‬ ‫حرصا عىل ُ‬ ‫ً‬ ‫ُمدَ َّوناهتم يف ُصورهتا اخلام‪،‬‬
‫ورتَني‪،‬‬ ‫غريهم إىل وضع املدَ َّونات ال ُّل َغ ِو َّية املعجم َّية يف ُص َ‬ ‫أو البحث فيها‪ ،‬بينام يعمدُ ُ‬
‫َ‬
‫واملعالة اآلل َّية)‪.‬‬ ‫إحدامها خام (لالستشهاد والبحث) واألخرى ُم َعنونة (لإلحصاء‬
‫توص ِيف َّية ُل َغ ِو َّية (مثل‪ :‬أقسام الكالم‬ ‫معلومات ِ‬ ‫ٍ‬ ‫وتت ََض َّم ُن َعنونات املدَ َّونات ال ُّل َغ ِو َّية‬
‫الت ِكيبِ َّية والدِّ الل َّية)‪ ،‬وأخرى غري ُل َغ ِو َّية‪ ،‬تتم َّث ُل يف املعلومات الببليوجراف َّية‪،‬‬ ‫وأنامطها َّ‬
‫الشكل َّية للن ُُّصوص (مثل‪ :‬نوع اخلُ ُطوط وأحجامها ‪ -‬يف املدَ َّونات ال ُّل َغ ِو َّية‬ ‫واخلصائص َّ‬
‫الصوتِ َّية ‪ -‬يف املدَ َّونات ال ُّل َغ ِو َّية املنطوقة)‪.‬‬ ‫الن َِّّص َّية‪ ،‬ومواضع النَّرب والتَّنغيم واملقاطع َّ‬
‫وسنعر ُض لبعض أنواع ال َعنونة يف املدَ َّونات ال ُّل َغ ِو َّية العرب َّية فيام ييل‪.‬‬ ‫ِ‬

‫‪-66-‬‬
‫التكيب َّية )‪)Syntactic Annotation‬‬
‫‪ -1.5‬ال َعنونة َّ‬
‫ي من‬ ‫نحو َّي ٍة ‪ -‬تركيب َّية ‪ -‬إىل ن ُُصوص املدَ َّونة ال ُّل َغ ِو َّية‪َ ،‬ن َت َب َّ ُ‬ ‫ٍ‬
‫معلومات ِ‬ ‫وتُعنى بإضافة‬
‫ُ‬
‫بحيث‬ ‫املفردات‪،‬‬ ‫خالهلا أقسا َم الكالم (“‪ )Parts of Speech – “PoS‬ا َّلذي تنتمي إليه َ‬
‫التكيب َّية‬ ‫اخلاص هبا؛ و ُيمكن اإلفادة من ال َعنونة َّ‬ ‫برمز لقسم الكالم‬‫دة ٍ‬ ‫ُتعنون ك ُُّل مفر ٍ‬
‫ّ‬ ‫ُ َ‬ ‫َ َ‬
‫التكيب َّية وحرص‬ ‫للمدَ َّونات ال ُّل َغ ِو َّية العرب َّية يف حتليل املدَ َّونات املتَوازية وبناء املح ِّلالت َّ‬
‫التمجة اآلل َّية واإلحصاء ال ُّل َغ ِو ّي‪.‬‬ ‫أنامط اجلملة العرب َّية‪ ،‬كام ُيستَفا ُد منه يف تطبيقات َّ‬
‫الت ِكيب َّية للمدَ َّونات ال ُّل َغ ِو َّية باستخدام إحدى وسي َلتَني‪:‬‬
‫وتتم ال َعنونة َّ‬
‫ُّ‬
‫Ÿ Ÿال َعنونة بتعيني أقسام الكالم (‪)PoS Tagging‬‬
‫لكل مفر ٍ‬ ‫ِ‬
‫دون النَّ َظ ِر إىل موقعها بني َ‬
‫املفردات‬ ‫دة َ‬ ‫َص فيها عىل إدراج قسم الكالم ِّ ُ َ‬ ‫و ُيقت َ ُ‬
‫األخرى يف املدَ َّونة ال ُّل َغ ِو َّية‪ .‬ون َُم ِّث ُل هلا بالنَّمو َذج التَّايل‪:‬‬
‫الن َُّّص َ‬
‫قبل ال َع َنونة‬
‫اآلن‪ ..‬ما الذي يشغل املثقفني املرصيني أو العرب؟ ما هي القضية التي خيتلفون حوهلا ويتفقون‬
‫عليها؟‬
‫الن َُّّص بعدَ ال َع َنونة‬

‫اآلن ‪ / .. / RB‬مــا ‪ / RP‬الــذي ‪ / WP‬يشــغل ‪ / VBP‬املثقفــن ‪ / NNS‬املرصيــن ‪ / NNS‬أو‬


‫‪ / CC‬العــرب ‪ / NNS‬؟ ‪ /‬مــا ‪ / RP‬هــي ‪ / PRP‬القضيــة ‪ / NN‬التــي ‪ / WP‬خيتلفــون ‪/ VBP‬‬
‫حوهلــا ‪ / RB‬ويتفقــون ‪ / VBP‬عليهــا ‪ / RP‬؟‬

‫ُر ُموز َعنونة أقسام الكالم‬


‫‪Tags PoS‬‬
‫ال َّظــرف ‪ ،RB‬األداة ‪ ،RP‬االســم املوصــول ‪ِ ،WP‬‬
‫الفعــل املضــارع ‪ ،VBP‬األســاء َّ‬
‫الشــائعة‬
‫(للمفــرد) ‪NN‬‬
‫َ‬ ‫الضمــر ‪ ،PRP‬األســاء َّ‬
‫الشــائعة‬ ‫(للجمــع) ‪ ،NNS‬حــرف العطــف ‪َّ ،CC‬‬

‫َّ‬
‫الشكل ‪ :2-2‬نموذج من ُمدَ َّونة ُم َعنونة بتعيني أقسام الكالم ‪ -‬من مقاالت أنيس منصور‪.‬‬

‫‪-67-‬‬
‫Ÿ Ÿال َعنونة بتحليل أقسام الكالم (‪)Parsing‬‬
‫ٍ‬
‫جل َمل‬ ‫جل َمل‪ ،‬وحتليل ا ُ‬ ‫‪Parsing‬ل) َغ ِو َّية إىل جمموعة من ا ُ‬
‫وص (املدَ َّونة ال ُّ‬
‫أقسام ُُصالكالم‬
‫بتحليل ن‬
‫بتحليل‬‫نونةُعنى‬
‫الع وت‬
‫▪ َ‬
‫ِ‬ ‫ِ‬
‫ة‪،‬‬ ‫عناصرَّكها َّ‬
‫بات‪/‬عبالر َّيات‬
‫األو‬ ‫املركَّبات إىل‬‫‪ٍ ،)Phrases‬وحتليل َ‬ ‫َّبات‪/‬عبارات (ُّ ِ‬ ‫وتعىنإىل ُم َرك‬
‫املد َّونة اللغَويَّ َة إىل جمموعة من اجلح َمل‪ ،‬وحتليل اجلح َمل إىل حمَ‬ ‫وص َ‬ ‫ص‬
‫ح‬ ‫بتحليل ن‬
‫ح‬ ‫ح‬
‫ِ‬ ‫ونستطيع التَّمثِ َّ َيل هلا بالنَّموذِ ِج التَّايل‪:‬‬
‫ُ‬
‫يل هلا ابلنَّمو َذج التَّايل‪:‬‬
‫ونستطيع التَّمث َ‬
‫ح‬ ‫األوليَّة‪،‬‬
‫املركبات إىل عناصرها َّ‬ ‫(‪ ،)Phrases‬وحتليل َ‬

‫اجلُملة ‪S /‬‬

‫أنزَل ِمن َّ‬


‫السماء ماءً ‪VP /‬‬ ‫َ‬ ‫وهللا ‪NP /‬‬

‫ماءً ‪N /‬‬ ‫ِمن َّ‬


‫السماء ‪PP /‬‬ ‫أنزَل ‪V /‬‬
‫َ‬ ‫هللا ‪NP /‬‬ ‫و‪P/‬‬

‫السماء ‪NP /‬‬


‫َّ‬ ‫ِمن ‪P /‬‬

‫مساء ‪N /‬‬ ‫الـ ‪D /‬‬

‫علي ‪،Verb Phrase‬‬ ‫اجلملة ‪ ،Sentence‬املرَّكب االمسي ‪ِ َّ ،Noun Phrase‬‬


‫املركب الف ّ‬
‫َ‬ ‫ّ‬ ‫َ‬ ‫ح‬
‫اجلار واجملرور ‪،Prepositional Phrase‬‬ ‫ِ‬
‫االسم ‪ ،Noun‬الفعل ‪ ،Verb‬شبه اجلحملة من ّ‬
‫اجلر ‪ ،Preposition‬أداة التَّعريف ‪Determiner‬‬
‫حرف ّ‬
‫الشَّكل ‪ :3-2‬منوذج من م َدَّونة معنونة بتحليل أقسام الكالم – من ال حقرآن الكرمي (النَّحل‪.)65 :‬‬
‫الشكل ‪ :3-2‬نموذج من ُمدَ َّحونة ُم َعح َ َنوَنة بتحليل أقسام الكالم‪-‬من ال ُقرآن الكريم (النَّحل‪.)65 :‬‬
‫َّ‬

‫اهلدف ُق‬
‫ي ِّقَ‬ ‫الكالمها مبا ححيَِِقق‬ ‫الرموز املستخدمة يف تعيني أقسام الكالم وحتليلِ‬
‫تنوع ُّ‬
‫اإلشار ُةإىلإىل ُّ‬ ‫وجتدُرر اإلشارةح‬ ‫وُتد‬
‫وحتليلّهاح بام ُ َ‬ ‫املستَخدَ مة يف تعيني أقسام‬ ‫الرموز َ َ‬ ‫تنوعُّ ُّ‬ ‫ح‬
‫املدَِويَّ َّةو‪.‬نة ال ُّل َغ ِو َّية‪.‬‬
‫مناللُّغَ‬
‫املددَّونة‬ ‫ود من ُ‬
‫املنشو َ َ‬ ‫املنش َ‬
‫اهلدفَ‬
‫ح‬
‫األوحل هو‬ ‫ذلكبنَبنَمَمطَ َطنينيمنمنأمناط حرموز أقسام الكالم (‪َّ ،)PoS Tags‬‬ ‫يل َ على ذلك‬ ‫ِ‬‫يع التَّمث‬ ‫ِ‬
‫ونستط ِ‬
‫األو ُل‬
‫أنامط ُرموز أقسام الكالم (‪َّ ،)PoS Tags‬‬ ‫َ‬ ‫يع التَّمثَِيل عىل‬ ‫ونسَتَط ح ُ‬
‫جبامعة) بنسلفانيا‬ ‫أقرته حم َؤسسة (‪)Linguistic Data Consortium -LDC‬‬ ‫ذي َّل َّ‬ ‫ذلك الن َّ‬
‫بجامعة‬ ‫أقر َّته ُم َؤ َّسسة (‪Linguistic Data Consortium -LDC‬‬ ‫ذي َّ‬ ‫َّمالطن َاَّملط ا‬ ‫هو َ َ‬
‫ذلكَ‬
‫اجلدول ََّمالت ُطَّايل(يف‪:)4‬‬ ‫طدُ يف‬ ‫هذا النَّم ِ‬ ‫بعض الر ِ‬
‫الر َّ‬ ‫‪ .PoS‬ونح ِشري إىل ِ‬
‫اجلدول‬ ‫ها هذا الن‬ ‫موزهاا َّلتي َ‬
‫يعتم ح‬ ‫يعتم حد‬
‫إىلموز اليت ُّ‬
‫بعضري ُّ‬
‫‪ . )Penn‬ونُش ُ‬ ‫ح‬ ‫‪)Penn‬‬ ‫‪Tags‬‬ ‫‪PoS‬‬ ‫بنسلفانيا (‬
‫(‪Tags‬‬

‫التَّايل(‪:)1‬‬
‫‪)4( LDC Website. )2011( .List of Penn PoS tags used .From:‬‬
‫‪1- LDC Website .(2011). List of Penn PoS tags used. From:‬‬
‫‪https//:catalog.ldc.upenn.edu/docs/LDC2003T06/arabic-POStags-collapse-to-‬‬
‫‪https://catalog.ldc.upenn.edu/docs/LDC2003T06/arabic-POStags-collapse-to-PennPOStags.txt.‬‬

‫‪66‬‬
‫‪-68-‬‬
‫الرمز‬
َّ ‫اإلنجليزي‬
ّ ‫املص َط َلح‬ ‫العريب‬
ّ ‫املص َط َلح‬
JJ Adjective ‫الص َفة‬
ِّ
RB Adverb ‫ال َّظرف‬
CC Coordinating Conjunction ‫َحرف َعطف‬
DT Determiner / Demonstrative Pronoun ‫اسم إشارة‬
FW Foreign Word ‫كلمة أجنَبِ َّية‬
)‫فرد‬ ِ ِ
NN Common noun, Singular َ ‫ شائع ( ُم‬/ ‫نَك َرة‬
)‫شائع (مجع‬ ِ / ‫َكرة‬ِ
NNS Common Noun, Plural َ ‫ن‬
NNP Proper Noun, Singular َ ‫اسم َع َلم ( ُم‬
)‫فرد‬
NNPS Proper Noun, Plural )‫اسم َع َلم (مجع‬
RP Particle ‫أداة‬

VBP
Imperfect Verb (***nb: imperfect rather ِ ‫فِعل ُم‬
‫ َط َلبِ ّي‬/ ‫ضارع‬
than present tense)

‫فِعل َمبنِ ّي للمجهول‬


Passive Verb (***nb: passive rather than
VBN
past participle)

‫فِعل ماض‬
Perfect Verb (***nb: perfect rather than
VBD
past tense)

UH Interjection ‫أداة َت َع ُّجب‬


PRP Personal Pronoun ‫خص‬ ِ ‫َض ِمري َش‬
ّ
$PRP Possessive Personal Pronoun ِ ‫َض ِمري ِم‬
‫لك َّية‬
CD Cardinal Number ‫عَدَ د‬
Subordinating Conjunction (FUNC_
IN
WORD) or Preposition (PREP)
‫ عطف‬/ ‫أداة َربط‬

WP Relative Pronoun ‫وصول‬


ُ ‫اسم َم‬
WRB wh-Adverb ‫َظرف بِ ِصي َغة االستِفهام‬

.»LDC« ‫ – عن‬Penn PoS Tags ‫العريب‬


ّ ‫ من ُرموز أقسام الكالم‬:2-2 ‫اجلدول‬

-69-
RDI ‫قم َّية يف ِمصــر‬
ِ ‫اهلنـدسية لتطوير النُّ ُظــم الر‬
َّ َّ
ِ ‫الشكة‬ َ ‫والن ََّم ُط‬
َّ ‫اآلخ ُر أعدَّ ته‬
ُ
‫حيث ُيعنى‬ ِ
،‫ال من سابِقه‬ ِ
ً ‫أكثر تفصي‬ ِ
ُ ‫وهو‬ ُ ،)RDI PoS Tags( - ]‫[ َعط َّية & رشوان‬
‫ إىل جانب‬،‫جلمود أو االشتقاق‬ ِ
ُ ‫املصدر َّية أو ا‬ ُ ‫للمفردات من‬
‫حيث‬ َ ‫الصفِ َّية‬
َّ ‫ببيان احلالة‬
ِ
:)1(‫الرموز ا َّلتي يعتمدُ ها يف اجلدول التَّايل‬ ِ
ُّ ‫ ونُش ُري إىل بعض‬.‫عنايته بأقسام الكالم‬
‫الرمز‬
َّ ‫اإلنجليزي‬
ّ ‫املص َط َلح‬ ‫العريب‬
ّ ‫املص َط َلح‬
Noun Nominal ‫اسم‬
NounInfinit Nouns made of infinitives ‫َمصدَ ر‬
SubjNoun Subject noun ِ ‫اسم‬
‫فاعل‬
ExaggAdj Exaggeration adjective ‫ِصيغة ُمبا َلغة‬
ObjNoun Object noun ‫اسم َمف ُعول‬
Femin Feminine ‫ُم َؤنَّث‬
Masc Masculine ‫ُم َذكَّر‬
Single Singular ‫فرد‬
َ ‫ُم‬
Binary Binary ‫ُم َثنَّى‬
Plural Plural ‫َجع‬
Prepos Preposition ‫جر‬
ّ ‫َحرف‬
Interj Interjection ‫حرف نِداء‬
RelPro Relative pronoun ‫موصول‬
ُ ‫اسم‬
DemoPro Demonstrative pronoun ‫اسم إشارة‬

.Attia & Rashwan” RDI PoS Tags“ - ‫العريب‬


ّ ‫ من ُرموز أقسام الكالم‬:3-2 ‫اجلدول‬

1- Attia, M. & Rashwan, M., A Large-Scale Arabic POS Tagger Based on a Compact Arabic
POS Tags Set, and Application on the Statistical Inference of Syntactic Diacritics of Arabic
Text Words, The Proceedings of the Arabic Language Technologies and Resources Int’l
Conference; NEMLAR, Cairo-Egypt http://www.elda.org/nemlar-conf, Sept. 2004.

-70-
‫‪ -2.5‬ال َعنونة الدِّ الل َّية )‪)Semantic Annotation‬‬
‫باملفردات ذات الدِّ الالت امل َت َعدِّ دة يف املدَ َّونة ال ُّل َغ ِو َّية‪،‬‬ ‫َ‬ ‫ختتص العنونة الدِّ الل َّية‬ ‫ُّ‬
‫االصطناعي (‪)Artificial Intelligence -AI‬‬ ‫ّ‬ ‫و ُيستخدَ م يف العديد من تطبيقات َّ‬
‫الذكاء‬
‫عالة ال ُّلغات ال َّطبيع َّية (‪ ،)Natural Language Processing -NLP‬الس َّيام تلك‬ ‫و ُم َ‬
‫والشبكات الدِّ الل َّية‬ ‫ترتبط بالتَّحليل الدِّ ال ّيل‪ ،‬مثل شبكات الكلامت (‪َّ )WordNets‬‬ ‫ُ‬ ‫ا َّلتي‬
‫ِ‬ ‫وجيات (‪ِ )Ontologies‬‬
‫مه َّيته يف‬ ‫وغريها؛ أضف إىل ذلك أ ِّ‬ ‫(‪ )Semantic Nets‬واألُ ْن ُطو ُل ْ‬
‫إعداد املدَ َّونات ال ُّل َغ ِو َّية املعجم َّية‪ ،‬وتصنيف الن ُُّصوص (‪.)Text Classification‬‬
‫دة عىل حدة باستخدام‬ ‫وتقوم فكرة العنونة الدِّ اللية عىل التَّمييز بني دالالت ك ُِّل مفر ٍ‬
‫ُ َ‬ ‫َّ‬ ‫َ‬ ‫ُ‬
‫فك االلتباس الدِّ ال ّيل (‪)WSD Algorithms‬؛ وجتدُ ر اإلشار ُة إىل َّ‬
‫أن‬ ‫ِ‬ ‫خوارزمات ّ‬
‫وصها من‬ ‫ب عنون ًة دالل َّي ًة واس َعة النِّطاق إذا َخ َلت ن ُُص ُ‬ ‫املدَ َّونات ال ُّل َغ ِو َّية العرب َّية تتط َّل ُ‬
‫حل ُروف (التَّشكيل)‪ .‬فالكلمة (بل) ‪ -‬عىل سبيل املثال ‪ -‬حتمل دالالت‬ ‫عالمات ضبط ا ُ‬
‫والفعل ( َب َّل) واحلرف ( َب ْل)» عندَ ُخ ُل ِّوها من‬ ‫أقسام الكالم ال َّثالثة «االسم (ب ٌّل) ِ‬
‫َ‬
‫بالشكل‪.‬‬ ‫ِ‬
‫حتمل إالَّ دالالت أحد أقسام الكالم عندَ ضبطها َّ‬ ‫الضبط‪ ،‬بينام ال ُ‬ ‫عالمات َّ‬
‫وثم َة طريقتان للعنونة الدِّ الل َّية ا َّلتي تُستَخدَ م يف الن ًُّصوص العرب َّية‪ ،‬تعتمد األوىل منهام‬ ‫َّ‬
‫ُ‬
‫اجلدول التَّايل‪:‬‬ ‫ي‬ ‫ِ‬
‫عىل متييز داللة الكلمة يف سياقها‪ ،‬عىل نحو ما ُي َب ِّ ُ‬
‫الدِّ اللة‬ ‫السياق‬
‫ِّ‬
‫‪1‬‬ ‫وأكرم‬ ‫اخلفيفني ‪ ..‬وقال‪ِ .. :‬‬
‫أنعم ِ‬ ‫حاجبيه‬ ‫البلقيطي‬ ‫فرفع‬
‫ّ‬ ‫َ‬
‫‪1‬‬ ‫األيرس متى يمتلئ جيبي بنقود احلُكومة‬ ‫حاجبه‬ ‫وهو َينتِ ُ‬
‫ف‬ ‫وتسا َء َل ُ‬
‫‪2‬‬ ‫ربه َّ‬
‫أن َر ُجال من اخلوارج جي َء به‬ ‫فأخ َ‬ ‫حاجبه‬ ‫فدخ َل عليه‬
‫َ‬
‫إن ِ‬
‫‪2‬‬ ‫وت ال َي َمن ‪.‬‬ ‫نت يل عليه‪ ،‬وإالّ َ‬
‫هج ُ‬ ‫أذ َ‬ ‫للحاجب‬ ‫انتظاره‪َ ،‬‬
‫قال‬ ‫ُ‬ ‫فلام َ‬
‫طال‬
‫‪3‬‬ ‫السالم أفق ُه من الغزايل‬
‫ابن عبد َّ‬ ‫احلاجب‬ ‫َ‬
‫وقال مجال الدِّ ين بن‬
‫ِ‬
‫‪3‬‬ ‫الر ُسول‬ ‫بن زرارة‪ ،‬وقد َخ َط َ‬
‫ب أمام َّ‬ ‫حاجب‬ ‫ومن اخلُ َطباء ُعطارد بن‬
‫الذكور‬ ‫ِ‬
‫وحارسه‪َ )3( ،‬ع َلم ‪ /‬من أسامء ُّ‬ ‫الش ْعر النَّابِت َف َ‬
‫وق ال َع ْي‪ )2( ،‬خازن الباب‬ ‫(‪َّ )1‬‬

‫اجلدول ‪ :4-2‬نموذج من ُمدَ َّونة ُم َعنونة دالل ًّيا ‪ -‬طريقة‪.1‬‬

‫‪-71-‬‬
‫قاق َّية‪ ،‬مع ما‬‫أما ال َّطريق ُة األخرى‪ ،‬فتبدو أكثر موافق ًة لطبيعة ال ُّلغة العربية االشتِ ِ‬
‫َّ‬ ‫َ‬ ‫َّ‬
‫ٍ‬
‫تتط َّل ُبه من وقت وجهد إلنجازها عىل الوجه املنشود؛ ومفا ُد هذه ال َّطريقة أن ُير َم َز‬ ‫ٍ‬
‫ِ ٍ‬
‫املفردة‪،‬‬
‫املفردة‪ ،‬وداللة َ‬ ‫إىل ثالثة جوانب رئيسة‪ ،‬هي‪ :‬قسم الكالم ا َّلذي تنتمي إليه َ‬
‫ِ‬ ‫ِ‬
‫يع ‪ -‬من خالل هذه اجلوانب ال َّثالثة‬ ‫َّص ا َّلذي َو َر َدت فيه؛ ونستَط ُ‬ ‫املفردة يف الن ّ‬
‫وموضع َ‬
‫باعتبار أقسام الكالم ‪ ،PoS‬وهو ما يعني‬ ‫ِ‬ ‫َّص‬
‫املفردات يف الن ّ‬ ‫بني دالالت َ‬ ‫– أن ن َُم ِّي َز َ‬
‫ٍ‬
‫مرحلة أوىل‪ُ ،‬ث َّم‬ ‫التكيب َّية بتعيني أقسام الكالم يف‬ ‫رضور َة إخضاع الن ُُّصوص للعنونة َّ‬
‫ٍ‬
‫مرحلة‬ ‫موضع املفردة يف ِ‬
‫سياقها يف‬ ‫مرحلة ثانية‪ ،‬والنَّص عىل ِ‬ ‫ٍ‬ ‫املفردة يف‬
‫َ‬ ‫ّ‬ ‫عنونتها بداللة َ‬
‫ثالثة‪.‬‬
‫نعر ُض يف اجلدول التَّايل نمو َذ ًجا للعنونة الدِّ الل َّية للمجموع‬ ‫ولتوضيح هذه ال َّطريقة‪ِ ،‬‬‫ِ‬
‫يب (من) يف بعض سياقاته ا َّلتي َو َر َدت يف ال ُقرآن الكريم‪:‬‬ ‫الكتا ّ‬
‫‪PoS‬‬ ‫السياق (من‪ :‬ال ُقرآن الكريم)‬
‫ِّ‬ ‫(م ‪ /‬د ‪)PoS /‬‬
‫‪N‬‬ ‫﴿و َظ َّل ْلنَا َع َل ْيك ُُم ا ْل َغ َم َم َ‪ ‬و َأ َنز ْلنَا َع َل ْيك ُُم امل َّن َو َّ‬
‫الس ْل َوى﴾‬ ‫َ‬ ‫(‪)1 / 1 / ..‬‬

‫‪N‬‬ ‫‪ ‬صدَ َقاتِكُم بِامل ِّن﴾‬ ‫ِ‬ ‫ِ‬


‫﴿ َيا َأ ُّ َيا ا َّلذي َن آ َمنُو ْا الَ ُت ْبط ُلو ْا َ‬ ‫(‪)1 / 2 / ..‬‬

‫‪N‬‬ ‫َا‪ ‬من‪َّ  ‬م ْر َق ِدنَا﴾‬


‫﴿ َقا ُلوا يا وي َلنَا‪ ‬من‪ ‬بع َثن ِ‬
‫َ َْ َ ََ‬ ‫(‪)1 / 3 / ..‬‬

‫‪V‬‬ ‫است ُْض ِع ُفوا ِف ْالَ ْر ِ‬


‫ض﴾‬ ‫ِ‬
‫﴿ون ُِريدُ َأن ن َُّم َّن َع َل ا َّلذي َن ْ‬
‫َ‬ ‫(‪)2 / 4 / ..‬‬

‫‪V‬‬ ‫ُّون َع َل ْي َك َأ ْن َأ ْسلموا ُقل َّل َتُنُّوا َع َ َّل إِ ْس َل َمكُم﴾‬


‫﴿ َي ُمن َ‬ ‫(‪)2 / 2 / ..‬‬

‫‪P‬‬ ‫َاب َع َل ْي ِه﴾‬ ‫ٍ‬ ‫ِ‬ ‫ِ‬


‫﴿ َف َت َل َّقى آ َد ُم من َّر ِّبه كَلامت َفت َ‬ ‫(‪)3 / 5 / ..‬‬
‫املعاين‬
‫(‪ )3‬اسم استفهام‬ ‫(‪َ )2‬م َّن‪ :‬ت َ‬
‫َفاخ َر باألنعام‬ ‫السامء‬ ‫(‪َ )1‬ط ٌّل ِ ِ‬
‫ينزل من َّ‬
‫(‪َ )5‬حرف َج ّر‬ ‫(‪َ )4‬أ ْن َع َم‬

‫املفردة‪ = )PoS( ،‬أقسام الكالم‬ ‫ِ‬ ‫ِ‬


‫‪/‬السطر‪( ،‬د) = داللة َ‬
‫َّص َّ‬
‫املفردة يف الن ّ‬
‫(م) = موضع َ‬
‫‪ = 1 = N‬االسم‪ِ = V = 2 ،‬‬
‫الفعل‪ = P = 3 ،‬األداة‬

‫اجلدول ‪ :5-2‬نموذج من ُمدَ َّونة ُم َعنونة دالل ًّيا ‪ -‬طريقة ‪.2‬‬

‫‪-72-‬‬
‫التميز (‪)Encoding‬‬
‫‪َّ -3.5‬‬
‫توص ِيفي ٍة هليكل املدَ ونة ال ُّل َغ ِوية يف ص ٍ‬
‫ورة ُت َ ِّك ُن‬ ‫معلومات ِ‬ ‫ٍ‬ ‫الت ِم ُيز بإضافة‬ ‫ُيعنى َّ‬
‫ُ‬ ‫َّ‬ ‫َّ‬ ‫َّ‬
‫ِ‬
‫املعالة اآلل َّية؛ و ُيستَفا ُد‬‫َ‬ ‫حتليل ن ُُصوصها باستخدام أدوات‬ ‫ِ‬ ‫ِ‬ ‫ِ‬ ‫برم ًّيا أو‬‫من التَّعا ُمل معها َ ِ‬
‫بصورة ُمنتَظِمة تُساعدُ يف‬ ‫ٍ‬ ‫املعلومات يف بناء قواعد بيانات املدَ َّونات ال ُّل َغ ِو َّية‬ ‫ِ‬ ‫من هذه‬
‫التم ُيز ِف التَّعا ُمل‬ ‫ِ‬ ‫ِ‬
‫وقت احلاجة إليها؛ ومن ناحية أخرى ُيساعدُ َّ‬ ‫ٍ‬ ‫ِ‬ ‫ِ‬ ‫اسرتجا ِع الن ُُّصوص َ‬
‫ِ‬
‫الش َبكة العنكبوت َّية من خالل استدعاء‬ ‫ِ‬ ‫رب َّ‬ ‫َ‬ ‫مع املدَ َّونة ال ُّل َغ ِو َّية وأدوات‬
‫املعالة اآلل َّية هلا ع َ‬
‫املباش مع تِقنِيات التَّنقيب يف‬ ‫بيانات الويب (‪ ،)Web Mining‬كام يمكِّن من التَّعامل ِ‬
‫ُ‬ ‫َُ‬
‫َفر ُع عنها‪ ،‬كالتَّنقيب يف الن ُُّصوص (‪)Text Mining‬‬ ‫البيانات (‪ ،)Data Mining‬وما َيت َّ‬
‫والبحث يف ُمستودعات البيانات (‪.)Data-Warehouse‬‬
‫املو َّحد‬ ‫ِ‬ ‫ِ‬
‫لرتميزها‪ -‬إحدى ص َيغ النِّظام َ‬ ‫وتُستَخدَ ُم لضبط هيئة الن ُُّصوص ‪ -‬متهيدً ا‬
‫حيث تتوا َف ُق‬ ‫ُ‬ ‫حل ُروف (‪،)Unicode Transformation Format -UTF‬‬ ‫لشفرات ا ُ‬
‫املحارف أو اجلرافيامت (‪ ،)Graphemes‬كام‬ ‫ِ‬ ‫ياس َّية إلظهار‬ ‫الق ِ‬
‫املعايري ِ‬ ‫ِ‬ ‫الص َيغ مع‬
‫هذه ِّ‬
‫َّخزينِ َّية‬
‫ب املِساحة الت ِ‬ ‫ِ‬ ‫يعية‪ ،‬وإن َ ِ‬
‫كان َيعي ُبها ك َ ُ‬
‫ِ‬ ‫ِ‬
‫تد َع ُم العديدَ من ألفبائ َّيات ال ُّلغات ال َّطبِ َّ‬
‫ِ‬
‫َّوصيف القابِلة‬ ‫ترم ُيز املدَ ونات ال ُّل َغ ِوية فيتم باستخدام ُلغة الت ِ‬ ‫املحارف‪ .‬أما ِ‬ ‫ِ‬ ‫ا َّلتي تشغ ُلها‬
‫ُّ‬ ‫َّ‬ ‫َّ‬ ‫َّ‬
‫لالمتِداد (‪)Extensible Markup Language -XML‬؛ وهي ُل َغ ٌة ُم َف ِّصل ٌة لبيانات‬
‫ِ‬ ‫ِ‬
‫كقاعدة‬ ‫َعم ُل‬
‫املو َّحد (‪ ،)Unicode‬وت َ‬ ‫حل ُروف الدَّ ْو ِ ّل َ‬ ‫املدَ َّونة ال ُّل َغ ِو َّية‪ ،‬تد َعم نظا َم ا ُ‬
‫رب َصفحات ِ‬ ‫ٍ‬
‫الويب‪.‬‬ ‫سهل تناق ُلها ع َ‬ ‫بيانات َي ُ‬

‫الشكل ‪ :4-2‬نموذج من ُمدَ َّونة ُم َر َّمزة باستخدام ُلغة «‪.»XML‬‬


‫َّ‬

‫‪-73-‬‬
‫‪ -6‬ا ُملدَ َّونات ال ُّلغ َِو َّية وآل َّية فهرسة الن ُُّصوص‬
‫عال ُة املدَ ونات ال ُّل َغ ِوية فهرس َة نُص ِ‬
‫وصها آل ًّيا إلتاحة ُفرصة التَّعا ُمل مع‬ ‫َ ُ‬ ‫َّ‬ ‫َّ‬ ‫ب ُم َ‬ ‫تتط َّل ُ‬
‫املركَّبة ‪ -‬عىل تعدُّ د أشكاهلا وأنامطها؛ وهذا ما تقو ُم به‬ ‫املفردة أو التَّعبريات َ‬ ‫الكلامت َ‬
‫حيث تُعنى بتحليل ن ُُصوص املدَ َّونات‬ ‫ِ‬ ‫ُ‬ ‫هرسات اآلل َّية (‪،)Automatic Indexers‬‬ ‫ِ‬ ‫امل َف ِ‬
‫كلامت وتعبريات‪ُ ،‬ث َّم حتليل الك َِلامت إىل‬ ‫ٍ‬ ‫وج ٍل‪ُ ،‬ث َّم حتليل اجلُ َم ِل إىل‬ ‫قرات ُ َ‬ ‫ال ُّل َغ ِوية إىل فِ ٍ‬
‫َّ‬
‫ِ‬
‫املعجم َّية للن ُُّصوص‪.‬‬ ‫ُف ُرو ٍع (‪ُ )Lemmas / Lemmata‬ت َ ِّث ُل الوحدات َ‬
‫هرسة‪ ،‬فت َِزيدُ ُقدر ُة‬ ‫ِ‬ ‫ِ‬ ‫ِ‬ ‫وت َض ُع َع َم ِل َّية الت ِ‬
‫َّفريع (‪ )Lemmatization‬ل َطبِيعة ال ُّلغة امل َف َ‬ ‫َ‬
‫اإللصاق َّية (كاألملانِ َّية‬
‫ِ‬ ‫هرسة ن ُُصوص ال ُّلغات‬ ‫ِ‬
‫َفريع الكلامت عندَ َف َ‬ ‫هرسات اآللِ َّية عىل ت ِ‬ ‫امل َف ِ‬
‫نسية)‪ ،‬وت َِق ُّل عند َفهرسة نُصوص ال ُّلغات االشتِ ِ‬ ‫ِ‬ ‫ِ‬
‫قاق َّية (كال َع َربِ َّية‬ ‫ُ‬ ‫َ‬ ‫واإلنجل ِيز َّية وال َف َر َّ‬
‫ِ‬ ‫والع ِربية وا ِ‬ ‫ِ‬
‫نظرا لتعدُّ د‬ ‫املعجم َّي ُة ل ُّلغات االشتقاق َّية ً‬ ‫َ‬ ‫تفرضه ال َّطبيع ُة‬‫ُ‬ ‫أمر‬
‫حل َبش َّية)‪ ،‬وهو ٌ‬ ‫َ‬ ‫َّ‬
‫املعج ِم َّية‬
‫َ‬ ‫حل ُقول‬ ‫َ‬
‫داخل ا ُ‬ ‫دات‬ ‫تتكو ُن عنها َ‬
‫املفر ُ‬ ‫الوحدات املعجم َّية (‪ )Lexemes‬ا َّلتي َّ‬
‫سات اآللِ َّي ِة عندَ‬‫للمفهر ِ‬ ‫ِ‬ ‫أدوات ُل َغ ِوي ٌة م ِ‬
‫ساعد ٌة‬ ‫َّ ُ‬ ‫ٌ‬ ‫فكثريا ما تُستَخدَ ُم‬ ‫ً‬ ‫(‪)Entries‬؛ هلذا‬
‫والت ِكيبِ َّية‪.‬‬ ‫الصفِ َّية َّ‬ ‫كاملح ِّلالت َّ‬ ‫َ‬ ‫حتليل الن ُُّصوص ال َع َربِ َّية‬ ‫ِ‬

‫اإلنجليز َّية وال َع َربِ َّية ‪.)1( Concordance 3.3 /‬‬


‫ِ‬ ‫الشكل ‪ :5-2‬آلِ َّية الت ِ‬
‫َّفريع ‪ Lemmatiser‬يف‬ ‫َّ‬

‫‪1- http://www.concordancesoftware.co.uk.‬‬

‫‪-74-‬‬
‫كائز األساس َّية ا َّلتي ُيستَفا ُد منها يف ُم َ‬ ‫وت ِّث ُل آلي ُة فهرسة النُّصوص إحدى الر ِ‬
‫عالة‬ ‫َّ‬ ‫ُ‬ ‫َّ‬ ‫َُ‬
‫دات الكلامت وإعادة‬ ‫وص وحرص تَرد ِ‬ ‫إدارة الن ُُّص ِ‬ ‫ِ‬ ‫حيث تُساعدُ يف‬ ‫ُ‬ ‫املدَ َّونات ال ُّل َغ ِو َّية؛‬
‫َ ُّ‬
‫ُساعدُ يف تعيني الكلامت الفريدة ‪ /‬غري املك ََّررة‬ ‫بيانات منتَظِم ٍة؛ كام ت ِ‬ ‫ٍ‬ ‫قواعد‬‫تشك ِيلها يف ِ‬ ‫ِ‬
‫ُ َ‬
‫جمموعة من‬ ‫ٍ‬ ‫وج ُه إىل إمكان َّية التَّعا ُمل مع‬ ‫(‪ )Unique Words‬يف الن ُُّصوص‪،‬‬
‫األمر ُي ِّ‬ ‫ُ‬
‫كثريا عن العدد الكامل لكلامت املدَ َّونة‪.‬‬ ‫يقل َعد ُدها ً‬ ‫الكلامت ا َّلتي ُّ‬
‫إخضاع ُمدَ َّو ٍنة ُل َغ ِو َّي ٍة‬
‫ُ‬ ‫تم‬
‫الصدَ د‪َّ ،‬‬ ‫ولبيان املعلومات ا َّلتي ُيمكن أن ت َُو ِّف َرها اآلل َّي ُة يف هذا َّ‬
‫املعاصة آلل َّية فهرسة الن ُُّصوص؛‬ ‫ِ‬ ‫والصحافة يف العرب َّية‬ ‫جمموعة من ن ُُصوص األدب‬ ‫ٍ‬
‫ِّ‬
‫بلغ ‪140542‬‬ ‫تتكرر يف املدَ َّونة قد َ‬ ‫أن عدَ َد الكلامت الفريدة ‪ /‬ا َّلتي مل َّ‬ ‫وأفا َدت اآلل َّي ُة َّ‬
‫كلمة من جمموع كلامت املدَ َّونة البالغ عددها ‪ 1221920‬كلمة‪ ،‬بنسبة ‪٪11.5‬؛ كام‬
‫ِ‬
‫مر ًة واحد ًة فحسب‪َّ ،‬‬
‫وأن‬ ‫أن ما يزيد عىل نصف الكلامت الفريدة مل ِيرد إالَّ َّ‬ ‫أفا َدت اآلل َّي ُة َّ‬
‫مرة (من ‪ 101‬إىل‬ ‫ٍ‬ ‫َّ‬
‫أكثر من مئة َّ‬ ‫ور َد َ‬ ‫أقل من واحد باملئة من هذه الكلامت الفريدة قد َ‬
‫َّتائج امل َب َّينة‬ ‫‪ 1000‬بنسبة ‪ ،٪0.9‬وأكثر من ‪ 1000‬بنسبة ‪ ،)٪0.07‬وغري ذلك من الن ِ‬
‫تتغي من ُمدَ َّو ٍنة‬ ‫ورتا ‪ -‬إذ َّ ُ‬
‫َّتائج ليست ثابت ًة عىل ُص ِ‬
‫َ‬ ‫َ‬
‫أن هذه الن ِ‬ ‫يف (اجلدول ‪)5-2‬؛ ومع َّ‬
‫تكون عليه نتائج الفهرسة اآلل َّية‬ ‫ُ‬ ‫للشكل ا َّلذي‬ ‫ألخرى ‪ -‬إالَّ َّأنا تُعطِي ُصور ًة قريب ًة َّ‬
‫لن ُُصوص املدَ َّونات ال ُّل َغ ِو َّية العرب َّية ُعمو ًما‪.‬‬
‫النِّسبة إىل غري املك ََّرر‬ ‫عدد الكلامت‬ ‫التَّكرار‬
‫‪٪53.5‬‬ ‫‪75271‬‬ ‫‪1‬‬
‫‪٪37‬‬ ‫‪52132‬‬ ‫‪ 2‬إىل ‪10‬‬
‫‪٪8.3‬‬ ‫‪11770‬‬ ‫‪ 11‬إىل ‪100‬‬
‫‪٪0.9‬‬ ‫‪1267‬‬ ‫‪ 101‬إىل ‪1000‬‬
‫‪٪0.07‬‬ ‫‪102‬‬ ‫أكثر من ‪1000‬‬
‫عدد كلامت املدَ َّونة = ‪1221920‬‬
‫عدد الكلامت الفريدة «‪)٪11.5( 140542 = »Unique Words‬‬
‫ِ‬
‫املعاصة‪.‬‬ ‫ٍ‬
‫جمموعة من العرب َّية‬ ‫اجلدول ‪ :6-2‬نتائج الفهرسة اآلل َّية ملدَ َّو ٍنة ُلغ َِو َّي ٍة‬
‫ِ ِ‬
‫وجتدُ ُر اإلشار ُة إىل ُوجود آل َّيتَني لفهرسة ن ُُصوص املدَ َّونات ال ُّل َغ ِو َّية؛ ت َ‬
‫ُعرف األوىل‬

‫‪-75-‬‬
‫ترتيب املفردات ألفبائ ًّيا َ‬ ‫ُتيح هذه اآلل َّي ُة‬ ‫ِ‬
‫السوابق‬
‫دون النَّظر إىل َّ‬ ‫َ‬ ‫بال َف َ‬
‫هرسة األلفبائ َّية؛ وت ُ‬
‫ودون ُمراعاة ال َّطبيعة االشتقاق َّية لبعض ال ُّلغات‪ ،‬الس َّيام ال ُّلغة العرب َّية‪.‬‬‫َ‬ ‫وال َّلواحق‬

‫األلفبائي ‪.)1( aConCorde-0.4.2‬‬


‫ّ‬ ‫اآلل‬ ‫الشكل ‪ :6-2‬نمو َذ ٌج للم َف ِ‬
‫هرس ِ ّ‬ ‫َّ‬
‫ِ‬
‫واجلذع ‪ُ Stem‬جز ٌء من الكلمة‪ ،‬يأيت‬ ‫ُ‬ ‫اجلذع َّية؛‬ ‫هرسة‬‫ف اآلل َّي ُة األخرى بال َف َ‬ ‫ُعر ُ‬
‫وت َ‬
‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ِ‬ ‫ِ‬
‫ُمش َت ًّقا أو جامدً ا‪ ،‬و َينتُج َعن ِّاتاد املورفيامت املك ََّونة لبِن َية الكَلمة األساس َّية (ومن‬
‫ِ‬
‫«واجلذع «مكتب» ا َّلذي‬ ‫اجل ْذع «عاود» ا َّلذي َتكَو َن َعنه َّ ِ‬ ‫أمثِ َلتِه‪ِ :‬‬
‫دتم‪،‬‬ ‫عاو ُ ُ‬‫التكيب « َف َ‬ ‫َّ‬ ‫َ‬
‫َتك ََّونَت َعنه ِصي َغة اجلَمع «املكتَبات»‪.‬‬
‫ِ‬ ‫ِ‬
‫السوابق‬‫يح هذه اآلل َّي ُة إمكان َّي َة البحث عن جذوع الكلامت‪ ،‬بعدَ جتريدها من َّ‬ ‫وتُت ُ‬
‫الشكل اآليت‪:‬‬ ‫ي َّ‬ ‫وال َّل ِ‬
‫واح ِق‪ ،‬عىل نحو ما ُي َب ِّ ُ‬

‫‪1- http://www.andy-roberts.net/software/aConCorde/..‬‬

‫‪-76-‬‬
‫اجلذعي ‪.)1( Concapp 5.0‬‬
‫ّ‬ ‫اآلل‬ ‫الشكل ‪ :7-2‬نمو َذ ٌج للم َف ِ‬
‫هرس ِ ّ‬ ‫َّ‬

‫‪ -7‬جماالت اإلفادة من املدَ َّونات ال ُّلغ َِو َّية‬


‫ُيمكن اإلفاد ُة من املدَ َونات ال ُّل َغ ِو َّية يف الدَّ رس ال ُّل َغ ِو ّي ‪ /‬علم ال ُّلغة (‪)Linguistics‬‬
‫ني هبا‪ ،‬والنَّاطِقـ َ‬
‫ِني ب َغ ِريها]‬ ‫وصناعة املعجامت (‪ )Lexicography‬وتعليم ال ُّلغات [للنَّاطِ ِق َ‬
‫يع َّية ‪.NLP‬‬‫عالة ال ُّلغات ال َّطبِ ِ‬‫الر ِئيس للمدَ َّونات ال ُّل َغ ِو َّية يف ُم َ‬
‫باإلضافة إىل الدَّ ور َّ‬

‫‪ -1.7‬استخدام املدَ َّونات ال ُّلغ َِو َّية يف الدَّ رس ال ُّلغ َِو ّ‬


‫ي‬
‫يرتبط استخدا ُم املدَ َّونات ال ُّل َغ ِو َّية يف دراسة ال ُّلغة بمناهج البحث يف ُع ُلومها‪.‬‬
‫اهلدف املنشو َد وطبيع َة الدِّ راسة‪،‬‬ ‫َ‬ ‫الشوع يف بناء املدَ َّو ِنة ‪ -‬أن ن َُحدِّ َد‬ ‫ي علينا ‪ -‬قبل ُّ‬‫و َي َت َع َّ ُ‬
‫يتناسب مع‬ ‫شكل املدَ َّونة ال ُّل َغ ِو َّية ومواصفاهتا‪ ،‬بام‬ ‫َ‬ ‫يع أن ن َُحدِّ َد‬ ‫ِ‬ ‫ِ‬
‫ُ‬ ‫إذ عىل أساسهام نستط ُ‬
‫وسنعرض‬
‫ُ‬ ‫البحثي ا َّلذي نلتزمه يف دراستِنا‪.‬‬ ‫ّ‬ ‫يتناسب مع املنهج‬ ‫ُ‬ ‫العلم ا َّلذي ندرسه‪ ،‬وبام‬
‫بإجياز ‪ -‬فيام ييل ‪ -‬لبعض جوانب اإلفادة من املدَ َّونات ال ُّل َغ ِو َّية يف ُع ُلوم ال ُّلغة‪.‬‬ ‫ٍ‬

‫‪1- http://wmtang.org/200820/11//concapp-5/.‬‬

‫‪-77-‬‬
‫نات ال ُّل َغ ِو َّي ُة املنطوقة يف دراسة جوانب‬
‫Ÿ Ÿاألصوات (‪ : )Phonetics‬تُستَخدَ ُم املدَ ّو ُ‬
‫تغي‬ ‫ِ‬
‫الصوت َّية «األلوفونات» (‪ )Allophones‬النَّاجتة عن ُّ‬ ‫التَّبا ُين بني التَّنويعات َّ‬
‫ِ‬
‫أشكال الوحدات «الفونيامت» (‪ ،)Phonemes‬ودراسة ال َّظواهر َّ‬
‫الصوت َّية هلذه‬
‫الوحدات يف سياق الكالم‪ ،‬مثل «النَّرب» (‪ )Stress‬و «التَّنغيم» (‪.)Intonation‬‬
‫الص َيغ‬‫نات ال ُّل َغ ِو َّي ُة الن َِّّص َّية يف دراسة ِّ‬
‫الصف (‪ : )Morphology‬تُستَخدَ ُم املدَ ّو ُ‬ ‫Ÿ Ÿ َّ‬
‫الصفِ َّية‬‫التا ُبط بني الوحدات َّ‬ ‫ستوياتا‪ ،‬ودراسة أشكال َّ‬ ‫ِ‬ ‫رب ُم‬ ‫ِ‬
‫الصف َّية يف ال ُّلغة ع َ‬‫َّ‬
‫املج َّردة «املورفيامت» (‪ )Morphemes‬املك َِّونة ألقسام الكالم‪ ،‬ودراسة أساليب‬ ‫َ‬
‫الص ّيف للكلامت املش َت َّقة من األفعال واملصادر‪.‬‬ ‫التَّوليد َّ‬
‫نات ال ُّل َغ ِو َّي ُة الن َِّّص َّية أو املنطوق ُة يف التَّحليل‬
‫التكيب (‪ : )Syntax‬تُستَخدَ ُم املدَ ّو ُ‬ ‫Ÿ Ÿ َّ‬
‫التكيب َّية‬ ‫للجملة؛ ومن جوانب اإلفادة منها‪ :‬حرص وإحصاء األنامط َّ‬ ‫كيبي ُ‬
‫الت ّ‬‫َّ‬
‫َّحوي ل ُّلغات اعتام ًدا عىل الواقع ال ُّل َغ ِو ّي‬ ‫ٍ‬
‫للجملة يف ُلغة ُم َع َّينة‪ ،‬والتَّقعيدُ الن ّ‬
‫ُ‬
‫التكيب َّية ا َّلتي ُيعت ََمدُ عليها يف وصف‬ ‫املكتوب واملنطوق‪ ،‬ودراس ُة ال َّظواهر َّ‬
‫ِ‬
‫ال ُّلغة أو استخدامها عىل النَّحو ا َّلذي توجدُ عليه بني أهلها‪.‬‬
‫نات ال ُّل َغ ِو َّي ُة يف التَّحليل الدِّ ال ّيل للن ُُّصوص‬
‫Ÿ Ÿالدِّ اللة (‪ : )Semantics‬تُستَخدَ ُم املدَ َّو ُ‬
‫وجيات وشبكات الكلامت َّ‬
‫والشبكات الدِّ الل َّية‬ ‫ويف بناء قواعد بيانات األُ ْن ُطو ُل ْ‬
‫ِ‬
‫املفردات؛ كام تُستَخدَ ُم يف‬ ‫والربط بني ُح ُقولا من خالل العالقات الدِّ الل َّية بني َ‬ ‫َّ‬
‫أوجه االلتباس الدِّ ال ّيل يف الن ُُّصوص سع ًيا إىل إجياد الوسائل املناسبة ا َّلتي‬ ‫تَعيني ُ‬
‫حل ُمشكالت هذا االلتباس‪.‬‬ ‫تُساعدُ يف ِّ‬
‫ال يف تقييم نظر َّيات‬ ‫بدور ف َّع ٍ‬
‫نات ال ُّل َغ ِو َّي ُة ٍ‬
‫املعجم َّية (‪ : )Lexicology‬تقو ُم املدَ َّو ُ‬ ‫ِ‬ ‫ŸŸ‬
‫املعجامت‬ ‫ِ‬
‫املعجم ِّيني يف بناء‬ ‫ِ‬
‫املعجم ّي ووضع املناهج ا َّلتي تُساعدُ‬ ‫ِ‬ ‫التَّحليل‬
‫َ‬ ‫َ‬ ‫َ‬
‫ِ‬ ‫ِ‬
‫املعجم ّي‪.‬‬‫ب مع طبيعة ال ُّلغة ونظامها َ‬ ‫واألطالس ال ُّل َغ ِو َّية بام َ‬
‫يتناس ُ‬
‫أي من هذه ال ُع ُلوم‬ ‫وختتلف طبيع ُة املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي تُستَخدَ ُم يف ٍّ‬ ‫ُ‬
‫ِ‬
‫دراساتم‪.‬‬ ‫اخلمسة باختالف منهج البحث ال ُّل َغ ِو ّي ا َّلذي يس ُلكُه الباحثون يف‬
‫ب ُمدَ َّون ًة ُل َغ ِو َّي ًة ُمست ََمدَّ ًة من واقع ال ُّلغة املكتوبة أو‬ ‫ِ‬
‫Ÿ Ÿفالدِّ راس ُة الوصف َّية تتط َّل ُ‬
‫الصواب واخلطأ يف االستعامل ال ُّل َغ ِو ّي‬ ‫املنطوقة‪ ،‬برصف النَّ َظر عن معايري َّ‬

‫‪-78-‬‬
‫وبعبارة أخرى‪ ..‬تعتمدُ‬ ‫ٍ‬ ‫واق ِعها احلادث؛‬ ‫للنُّصوص‪ ،‬إذ يعو ُل عىل ال ُّلغة يف ِ‬
‫ُ َ َّ‬ ‫ُ‬
‫يكون موجودا‪.‬‬ ‫َ‬ ‫الدِّ راس ُة الوصف َّي ُة ل ُّلغة عىل ما هو موجود‪ ،‬ال ما ينبغي أن‬ ‫ِ‬
‫عيارية تتط َّلب مدَ ون ًة ُل َغ ِوي ًة من مستوى ال ُّلغة ِ‬ ‫ِ‬
‫ألن هذا‬ ‫الفصيحة‪َّ ،‬‬ ‫ُ‬ ‫َّ‬ ‫ُ ُ َّ‬ ‫Ÿ Ÿوالدِّ راسة امل ِ َّ‬
‫َّوع من الدِّ راسات ال يسعى إىل وضع القواعد ال ُّل َغ ِو َّية أو التَّنظري هلا‪ ،‬وإنَّام‬ ‫الن َ‬
‫موجودة عىل أرض ِ‬
‫الواقع‪.‬‬ ‫ٍ‬ ‫ات ُل َغ ِو َّي ٍة‬
‫ات ونظري ٍ‬ ‫فرضي ٍ‬ ‫يسعى إىل التَّح ُّقق من ِ‬
‫َّ‬ ‫َّ‬
‫ألنا‬‫الزمان َّية ل ُّلغة‪َّ ،‬‬ ‫رب احلُدُ ود َّ‬‫ب ُمدَ َّون ًة ُل َغ ِو َّي ًة ُمتَدَّ ًة ع َ‬ ‫Ÿ Ÿوالدِّ راسة التَّارخي َّية تتط َّل ُ‬
‫تنفر ُد بِه ك ُُّل مرحلة عن‬ ‫أوجه التَّبا ُين بني مراحل ال ُّلغة‪ ،‬وما ِ‬ ‫ِ ِ‬
‫هتدف إىل دراسة ُ‬
‫املراحل األخرى‪ ،‬وما يطرأ عليها من َ َت ُّو ٍل و َت َغ ُّي‪.‬‬ ‫ِ‬
‫ِ‬
‫هتدف إىل املقا َبلة‬ ‫ُ‬ ‫ب ُمدَ َّون ًة ُل َغ ِو َّي ًة ُم َت َعدِّ َدة ال ُّلغات‪َّ ،‬‬
‫ألنا‬ ‫Ÿ Ÿوالدِّ راسة التَّقا ُبل َّية تتط َّل ُ‬
‫بحيث ُي َم ِّث ُل أحدُ‬
‫ُ‬ ‫خصائص ال ُّلغة يف نظا َمني ُل َغ ِو َّيني هبدف تع ُّلم ال ُّلغات‪،‬‬ ‫ِ‬ ‫بني‬
‫اآلخر ال ُّلغ َة ا َّلتي يسعى إىل تَع ُّل ِمها‪.‬‬
‫ُ‬ ‫النِّظا َمني ُلغ َة املتَع ِّلم ا َّلتي ُي ِتقنُها و ُي َم ِّثل النِّظا ُم‬

‫‪ -2.7‬استخدام املدَ َّونات ال ُّلغ َِو َّية يف صناعة املعجامت‬


‫املفردات ومعانيها عىل ال ُّلغة ا َّلتي تُستَخدَ ُم‬ ‫ِ‬
‫املعجامت القديم ُة يف تسجيل َ‬ ‫ُ‬ ‫اعتمدَ ت‬
‫َ‬
‫ِ‬
‫ون عناي ًة بتهذيب املعجامت القديمة‬ ‫املتأخ ُر َ‬
‫ون ِّ‬ ‫عىل ألسنة اجلامعة ال ُّل َغ ِو َّية؛ و َأ ْوىل َ‬
‫املعجم ُّي َ‬
‫ُ‬
‫عوامل ال َّت َط ُّور‬ ‫املعاصة و ُمست ََجدَّ اهتا ا َّلتي ُ‬
‫تفرضها‬ ‫ِ‬ ‫ب مع ال ُّلغة‬ ‫وإعادة صياغتِها‬
‫لتتناس َ‬
‫َ‬
‫بالزمان واملكان واألحداث‪.‬‬ ‫ال ُّل َغ ِو ّي املتأ ِّثرة َّ‬
‫املعج ِم ِّيني مل ُي َو َّف ُقوا إىل هذا‬
‫أن َ‬ ‫كثري من ال ُّلغات ُي َؤ ِّكدُ َّ‬ ‫املعج ِم َّية يف ٍ‬
‫الصناعة َ‬
‫ِ‬
‫لك َّن واق َع ِّ‬
‫دون النَّ َظر إىل‬ ‫املعج ِم َّية فحسب‪َ ،‬‬ ‫اهلدف‪ ،‬العتامدهم عىل املعجامت القديمة والدِّ راسات َ‬
‫ِِ‬ ‫ِ‬
‫َّعبري عنه إالَّ من خالل الن ُُّصوص املست ََمدَّ ة من هذا الواقع‪،‬‬ ‫واقع ال ُّلغة ا َّلذي ال ُيمك ُن الت ُ‬
‫فردات ال ُّلغة ومعانيها‪.‬‬ ‫َعمل من ُم َ‬ ‫املهمل واملست َ‬ ‫األمر ا َّلذي أ َّدى إىل عدم التَّمييز بني َ‬ ‫ُ‬
‫ِ‬
‫يب‬
‫عجم عر ٌّ‬ ‫يع أن ن َُم ِّث َل عىل ذلك من ال ُّلغة العرب َّية باملعجم الوسيط (وهو ُم ٌ‬ ‫ونستط ُ‬
‫ِ‬
‫جممع ال ُّلغة العرب َّية بالقاهرة يف طبعته األوىل عا َم ‪1960‬م‪ ،‬ويف طبعته‬ ‫عاص‪ ،‬أصدَ َر ُه‬ ‫ِ‬
‫ُ‬ ‫ُم ٌ‬
‫املهملة‪ ،‬عىل شاكلة‬ ‫حل ُقول َ‬ ‫حيث ُيعنى بإيراد معاين العديد من ا ُ‬ ‫ُ‬ ‫ال َّثالثة عا َم ‪2003‬م)‬
‫ِ‬ ‫ِ‬
‫وحاسوب) َّ‬
‫الشائ َعتَني‪.‬‬ ‫ُ‬ ‫ب) وال ُيعنى بكلمت َْي (حاسب‪،‬‬ ‫وجع َب َ‬ ‫حش َل‪َ ،‬‬ ‫(بجبج‪ ،‬و َب َ‬‫َ‬

‫‪-79-‬‬
‫املعج ِم َّي ‪-‬‬
‫َ‬ ‫املعجم‪َّ ،‬‬
‫ألن‬ ‫َ‬ ‫تظهر فائد ُة استخدام املدَ َّونات ال ُّل َغ ِو َّية يف صناعة‬‫ُ‬ ‫وهنا‬‫ُ‬
‫املعج ِم من ال ُّلغة املست َ‬
‫َعملة واملتَدَ اولة‬ ‫سيجمع املا َّد َة ا َّلتي يعتمدُ عليها يف صناعة َ‬
‫ُ‬ ‫حين َِئ ٍذ ‪-‬‬
‫قادرا عىل التَّمييز‬ ‫ُ‬ ‫أهلها‪ ،‬ال من ال ُّلغة املهجورة يف ثنايا املعجامت القديمة؛ كام‬ ‫بني ِ‬
‫سيكون ً‬ ‫َ‬
‫املفردات واملعاين‪ .‬ومع حت ُّقق هذه الفائدة يف ال ُّلغة‬ ‫واملهمل من َ‬ ‫َ‬ ‫َعمل والن ِ‬
‫َّادر‬ ‫بني املست َ‬ ‫َ‬
‫ِ‬ ‫ِ‬ ‫ِ‬ ‫اإلنجليز َّية ويف العديد من ال ُّلغات ِ‬
‫اجلرمان َّية والالَّتين َّية‪ ،‬إالَّ َّأنا مل تتح َّقق بعدُ يف ال ُّلغة‬ ‫ِ‬
‫ِ‬ ‫ِ‬
‫املعاصة [املكتوبة أو املنطوقة] و ُمعجامت‬ ‫عجامتا‬ ‫كبريا يف ُم‬ ‫العرب َّية ا َّلتي تُعاين ً‬
‫نقصا ً‬
‫ِ‬
‫واملعجامت االصطالح َّية والتَّعليم َّية والتَّارخي َّية‪.‬‬ ‫ال َّلهجات‬
‫َ‬

‫‪ -3.7‬استخدام املدَ َّونات ال ُّلغ َِو َّية يف تَعليم ال ُّلغات‬


‫ريق إىل‬ ‫الذكر ‪ -‬ال َّط َ‬ ‫األمريكي «إدوارد ثورنديك» ‪ -‬سالفة ِّ‬ ‫عال النَّفس‬ ‫مهدَ ت جترب ُة ِ‬
‫ّ‬ ‫َ َّ‬
‫ف‬‫عر ُ‬ ‫ونتج عن هذه التَّجربة ُظ ُه ُ‬
‫ور ما ُي َ‬ ‫استخدام املدَ َّونات ال ُّل َغ ِو َّية يف تعليم ال ُّلغات‪َ .‬‬
‫الش ِائعة» (‪ )Lists of common words‬يف العديد من ال ُّلغات‪ ،‬بام‬ ‫بـ «قوائم الكلامت َّ‬
‫والتبو ِّيني املعنِ ِّيني‬
‫ذلك العرب َّية ا َّلتي َع َر َفت هذه القوائم من خالل أعامل ال ُّل َغ ِو ِّيني َّ‬ ‫يف َ‬
‫املثال ال احلَرص‪« :-‬قائمة‬ ‫ِ‬ ‫وكان من هذه األعامل ‪-‬عىل سبيل‬ ‫َ‬ ‫بتعليم ال ُّلغة العرب َّية‪.‬‬
‫الشائعة يف ال َعرب َّية احلديثة» (‪ )A list of Modern Arabic words‬ا َّلتي‬ ‫املفردات َّ‬
‫املوسومة‬ ‫أعَدَّ ها «إوينج بييل» (‪ )Ewing Macready Bailey‬يف عام ‪ ،1948‬والدِّ راسة ُ‬
‫املوسومة بـ‬ ‫الشائعة يف ال ُّلغة العرب َّية» لداود عبده ‪ /‬يف ‪ ،1979‬والدِّ راسة ُ‬ ‫بـ «املفردات َّ‬
‫الشائعة االستخدام يف البالد العرب َّية» ُلرشدي طعيمة ‪ /‬يف ‪.1982‬‬ ‫«قائمة املفردات َّ‬
‫ب‬
‫مثل هذه القوائم ال ُت َع ِّ ُ‬ ‫أن املدَ َّونات ال ُّل َغ ِو َّية ا َّلتي ُيعت ََمدُ عليها يف إعداد ِ‬ ‫ومع َّ‬
‫كثري من األحيان‪ ،‬إالَّ‬ ‫ِ‬
‫وصها عشوائ ًّيا يف ٍ‬ ‫بالضورة عن واق ِع ال ُّلغة‪-‬إذ يتم اختيار نُص ِ‬ ‫َّ‬
‫ُ ُ‬ ‫ُّ‬
‫حيث ت َُو ِّج ُه ُم َت َع ِّلمي ال ُّلغة‬
‫تطويرها منهج ًّيا‪ُ ،‬‬ ‫ُ‬ ‫أن الفكر َة ذاهتا ُت َ ِّث ُل وسيل ًة عمل َّي ًة ُيمك ُن‬ ‫َّ‬
‫املفردات األكثر ُش ُيو ًعا يف نطاق املستوى ال ُّل َغ ِو ّي ا َّلذي تُعنى به‬ ‫َّعرف َّأوالً عىل َ‬ ‫إىل الت ُّ‬
‫األقل ُش ُيو ًعا‪ُ ،‬ث َّم ا َّلتي تليها‪ ،‬وهكذا‪.‬‬
‫املفردات ِّ‬ ‫دراستُهم‪ُ ،‬ث َّم االنتقال إىل َ‬ ‫َ‬
‫ألغراض تعليم َّي ٍة عىل‬ ‫ٍ‬ ‫املنجزة‬
‫َ‬
‫ِ‬
‫اإلحصائ َّي ُة عىل املدَ َّونات‬ ‫ات‬
‫تقترص العمل َّي ُ‬
‫ُ‬ ‫وال‬
‫والتكيب َّية ل ُّلغة‪ ،‬وا َّلتي تُساعدُ عىل تع ُّلم‬ ‫األنامط البِن َِو َّية َّ‬
‫َ‬ ‫َ‬
‫لتشمل‬ ‫الكلامت؛ وإنَّام متتدُّ‬
‫ال ‪ُ -‬يمك ُن االعتام ُد عىل املدَ َّونات ال ُّل َغ ِو َّية‬ ‫القوعد النَّحو َّية‪ .‬ففي ال ُّلغة العرب َّية ‪-‬مث ً‬
‫الشائعة لألفعال‬ ‫الصف َّية َّ‬ ‫املم ِّثلة لواقع ال ُّلغة [عىل ُمستوى البِنية] يف حرص األوزان َّ‬ ‫َ‬

‫‪-80-‬‬
‫الشائعة لك ُِّل‬ ‫ِ‬
‫الص َيغ َّ‬ ‫واملش َت َّقات واملصادر بأنواعها؛ كام ُيمك ُن االعتام ُد عليها يف حرص ِّ‬
‫التكيب] ف ُيمكن اإلفاد ُة من املدَ َّونات‬ ‫نو ٍع من املش َت َّقات عىل ِحدَ ة‪ .‬أ َّما [عىل ُمستوى َّ‬
‫وكذلك يف َحرص أنامط‬ ‫َ‬ ‫وش ُيو ًعا؛‬ ‫َّعرف عىل املواقع اإلعراب َّية األكثر تر ُّد ًدا ُ‬ ‫ال ُل َغ ِو َّية يف الت ُّ‬
‫التكيب َّية ُش ُيو ًعا‪ ،‬واستنباط‬ ‫جلملة العرب َّية‪ ،‬األمر ا َّلذي ُيساعدُ عىل معرفة أكثر األنامط َّ‬ ‫ا ُ‬
‫ِ‬
‫حيث ُمت ََو ِّسطات أطوالا وتتا ُبعات أقسامها‪.‬‬ ‫ِ‬ ‫جلملة العرب َّية من ُ‬ ‫ِ‬
‫خصائص ا ُ‬
‫ٍ‬
‫كبريا يف تطوير املناهج التَّعليم َّية‬ ‫دورا ً‬ ‫نات ال ُّل َغ ِو َّي ُة ً‬ ‫ناحية أخرى‪ ،‬ت َُؤ ِّدي املدَ َّو ُ‬ ‫ومن‬
‫خاللا ُيمك ُن توجي ُه ال ُّطالَّب إىل واقع ال ُّلغة‬ ‫ِ‬ ‫ل ُّلغات يف مراحل التَّعليم املختلفة‪ ،‬إذ من‬
‫واق ِع ِهم أو ُمستق َب ِلهم‪،‬‬ ‫فيدون منها يف ِ‬ ‫َ‬ ‫امللموس‪ ،‬بعيدً ا عن التَّعقيدات ا َّلتي قد ال ُي‬
‫ذلك بالنَّ َظر إىل ُمعاناة‬ ‫مه َّي َة َ‬ ‫ريب واملهجور‪ .‬و َل َع َّلنا‬ ‫بذلك ا ِ‬
‫نستشعر أ ِّ‬
‫ُ‬ ‫وش وال َغ َ‬ ‫حل َّ‬ ‫فنجنِّبهم َ ُ‬
‫ذلك‬ ‫يب‪َ .‬‬ ‫ُطالَّب املراحل األساس َّية يف فهم مناهج ال ُّلغة العرب َّية‪ ،‬الس َّيام قواعد النَّحو العر ّ‬
‫َّعليمي‪ ،‬برصف‬ ‫ّ‬ ‫املنهج الت‬ ‫ُ‬ ‫يكون ُم َلز ًما بدراسة القاعدة الن َّْحو َّية ا َّلتي حيوهيا‬ ‫ُ‬ ‫أن ال َّط َ‬
‫الب‬ ‫َّ‬
‫ٍ‬ ‫ٍ‬ ‫أن املا َّد ُة العلم َّي َة امل َقدَّ م َة ‪ -‬يف‬ ‫عيل هلا‪ .‬ونرى َّ‬ ‫ِ‬
‫كثرية ‪ -‬تبدو‬ ‫أحيان‬ ‫النَّ َظر عن االستخدام الف ّ‬
‫ناهيك عن َضعف ُمستوى‬ ‫َ‬ ‫الب قراء ًة أو استام ًعا؛‬ ‫امرسها ال ُّط ُ‬ ‫بعيد ًة عن ال ُّلغة ا َّلتي ُي ُ‬
‫ِ‬
‫َّواصل مع ُطال َِّبم‪.‬‬ ‫در ِ ِتم عىل الت ُ‬ ‫مني نتيج َة ال ُق ُصور يف تأهيل ِهم‪ ،‬ما ُيؤ ِّدي إىل عدم ُق َ‬ ‫املع ِّل َ‬
‫ِ‬
‫يب‪.‬‬ ‫الب يف دراست ِهم للنَّحو العر ّ‬ ‫الصدَ د بام نرا ُه ُم َق َّر ًرا عىل ال ُّط ِ‬ ‫َّمثيل يف هذا َّ‬ ‫و ُيمك ُن الت ُ‬
‫(كان وأخواهتا) بك ُِّل ما‬ ‫ُلز ُم ال ُّطال ََّب بدراسة باب َ‬ ‫املناهج التَّعليم َّية ت ِ‬‫ِ‬ ‫بعض‬‫أن َ‬ ‫ذلك َّ‬ ‫من َ‬
‫دراسته هلذا الباب إىل األفعال (ماان َف َّك‪،‬‬ ‫ِ‬ ‫ِ‬
‫الب يف َ‬ ‫حيويه من قواعدَ أساس َّية‪ .‬و ُي َو َّج ُه ال َّط ُ‬
‫الب‬‫أن ال َّط َ‬ ‫غريها‪ ،‬إالَّ َّ‬ ‫وع ِ‬ ‫األفعال ليست شائع ًة ُش ُي َ‬ ‫َ‬ ‫أن هذه‬ ‫مابر َح)‪ .‬ومع َّ‬ ‫مافتئ‪ِ ،‬‬ ‫َ‬
‫ور َّبام لن‬
‫دراستَها‪ ،‬وإن مل يسمعها من قبل أو يستخدمها؛ ُ‬ ‫ألن القاعدَ َة ُ َتت ُِّم عليه َ‬ ‫يدرسها َّ‬ ‫ُ‬
‫كذلك ‪ -‬يف ُمستَق َب ِله‪.‬‬ ‫َ‬ ‫يستخد َمها ‪-‬‬ ‫ِ‬

‫بعض القواعد‬ ‫ِ‬ ‫تقديم‬


‫َ‬ ‫الب عىل مجال ُل َغتِه و ُع ُذو َبتِها‪ ،‬إالَّ َّ‬
‫أن‬ ‫ف ال َّط ُ‬ ‫يتعر َ‬
‫مه َّية أن َّ‬ ‫ومع أ ِّ‬
‫بالضورة عىل مستوى ِ‬
‫حتص ِيله‪،‬‬ ‫ُ‬ ‫سوف ُي َؤ ِّث ُر َّ‬ ‫َ‬ ‫مرحلة تعليم َّي ٍة َّأولِ َّي ٍة‬ ‫ٍ‬ ‫أو األساليب النَّادرة يف‬
‫ٍ‬
‫وحينئذ‬ ‫أكثر ُش ُيو ًعا واستخدا ًما ممَّا ُو ِّج َه إليه‪.‬‬ ‫حتم إىل إمهال قواعدَ وأساليب َ‬ ‫وس ُي َؤ ِّدي ً‬
‫ينطق فال ُي ِسن‪.‬‬ ‫يكون ُمستغر ًبا أن يقر َأ فال يفهم‪ ،‬أو َ‬ ‫ُ‬ ‫ال‬
‫املفردات‬ ‫ِ‬ ‫ِ‬ ‫أن املدَ َّونات ال ُّل َغ ِو َّية ُو ِّظ َفت حلرص َّ‬ ‫ولو َّ‬
‫الشائع [املستَخدم فعل ًّيا] من َ‬
‫والتاكيب واألساليب‪ُ ،‬ث َّم توجيه ال ُّطالَّب إليه َّأوالً‪ ،‬ألمك َن االرتقا ُء ُ‬
‫بمستواهم‬ ‫َّ‬

‫‪-81-‬‬
‫واق ِع ُل َغتِهم ا َّلذي‬
‫ون ِحين َِئ ٍذ إىل قواعدَ مستَمدَّ ٍة من ِ‬
‫ُ َ‬
‫ٍ‬
‫درجة كبرية‪ ،‬إذ ُي َو َّج ُه َ‬ ‫َّعليمي إىل‬
‫ّ‬ ‫الت‬
‫عاصونَه‪ ،‬سوا ٌء أكانَت هذه ال ُّلغة مكتوبة أم منطوقة‪.‬‬ ‫ِ‬
‫ُي ُ‬
‫‪ -4.7‬استخدام املدَ َّونات ال ُّلغ َِو َّية يف ُم َ‬
‫عالة ال ُّلغات ال َّطبيع َّية‬
‫عالة ال ُّلغات ال َّطبيعية ا َّلتي ِ‬
‫تعتمدُ عىل املدَ َّونات ال ُّل َغ ِو َّية‬ ‫َث َّم َة العديدُ من تطبيقات ُم َ‬
‫َّ‬
‫وخصائ ُصها وف ًقا‬ ‫ِ‬ ‫نوع املدَ َّونة ال ُّل َغ ِو َّية املستَخدَ مة‬ ‫يف مراحل إعدادها ِ‬
‫ويدَّ ُد ُ‬
‫وتقييمها؛ ُ َ‬
‫وف عىل دور املدَ َّونات ال ُّل َغ ِو َّية يف‬ ‫الو ُق َ‬ ‫لطبيعة التَّطبيق واهلدف املنشود منه‪ .‬وسن ُ‬
‫ُحاول ُ‬
‫عالة ال ُّلغات ال َّطبيع َّية من خالل بعض التَّطبيقات عىل النَّحو التَّايل‪:‬‬ ‫ُم َ‬
‫َقاربة] بني ال ُّلغات‬ ‫وأداتا األساس َّي ُة ُمدَ َّون ٌة ُل َغ ِو َّي ٌة ُمتَوازية [أو ُمت ِ‬ ‫ُ‬ ‫التمجة اآلل َّية‪:‬‬ ‫Ÿ Ÿ َّ‬
‫التمجة املنشود‪ .‬و ُيستَفا ُد منها يف تعيني قواعد النَّحو وأنامط‬ ‫عالها نظام َّ‬ ‫ا َّلتي ُي ِ ُ‬
‫للتمجة الن َِّّص َّية‪ ،‬كام ُيستَفا ُد منها يف إثراء قاعدة بيانات‬ ‫التاكيب ا َّلتي ُ َت ِّي ُئ النِّظا َم َّ‬ ‫َّ‬
‫فردات ال ُّلغة اهلَدَ ف‪.‬‬‫فردات ال ُّلغة املصدر وما ُيقاب ُلها من ُم َ‬ ‫بم َ‬ ‫النِّظام ُ‬
‫ب إعدا ُدها ُمدَ َّو َنتَني ُل َغ ِو َّيتَني‪ ،‬تُعنى األوىل بمرحلة‬ ‫Ÿ Ÿآلية الت ِ‬
‫اإلمالئي‪ :‬وي َت َط َّل ُ‬
‫ّ‬ ‫َّدقيق‬ ‫َّ‬
‫ِ‬ ‫ِ‬
‫تكون خالي ًة من األخطاء اإلمالئ َّية ل ُيستَفا ُد منها يف إثراء‬ ‫َ‬ ‫التَّدريب؛ وينبغي أن‬
‫الربم ّي؛ وتُعنى األخرى بمرحلة التَّقييم‪،‬‬ ‫َِ‬ ‫ُمعجم اآلل َّية وقواعد بيانات النِّظام‬
‫عشوائ َّي ٍة‪ ،‬ل ُيستَفا َد منها يف اختبار اآلل َّية وتَعيني ُم َعدَّ ل‬ ‫ِ‬ ‫وت َم ُع ما َّد ُتا من ن ُُص ٍ‬
‫وص‬ ‫ُ‬
‫اخلطأ يف ِ‬
‫نتائ ِجها‪.‬‬
‫تنفر ُد بظاهرة‬ ‫خاص بال ُّلغة العرب َّية ا َّلتي ِ‬ ‫ٌّ‬ ‫تطبيق‬
‫ٌ‬ ‫Ÿ Ÿآل َّية تشكيل الن ُُّصوص‪ :‬وهي‬
‫ب إعدا ُد هذه‬ ‫غريها من ال ُّلغات‪ .‬ي َت َط َّل ُ‬‫يب ُي َم ِّي ُزها عن ِ‬ ‫اإلعراب وتتمت َُّع بنظا ٍم كتا ٍّ‬
‫بحيث ُيمكن اإلفاد ُة منها يف حتديد ال ُط ُرق‬ ‫ُ‬ ‫اآلل َّية ُمدَ َّون ًة ُل َغ ِو َّي ًة مشكول ًة ُك ِّل ًّيا‪،‬‬
‫اإلحصائ َّية ا َّلتي ستعتمدُ عليها خوارزمات التَّشكيل‪.‬‬ ‫ِ‬

‫ب إعدا ُدها ُمدَ َّون ًة ُل َغ ِو ًّية َغن َّي ًة باملتَصاحبات‬ ‫ِ‬


‫فك االلتباس الدِّ ال ّيل‪ :‬وي َت َط َّل ُ‬ ‫Ÿ Ÿآل َّية ّ‬
‫ٍ‬
‫دالالت ُم َت َعدِّ دة‪.‬‬ ‫ال ُّل َغ ِو َّية والتَّعبريات االصطالح َّية والكلامت ا َّلتي حتمل‬
‫و ُيستَفا ُد من هذه املدَ َّونة يف إثراء قواعد بيانات النِّظام املنشود باملفردات‬
‫دعاء معاين الكلامت ذات‬ ‫فك االلتباس باستِ ِ‬ ‫ودالالتا‪ ،‬وتدريب خوارزمات ّ‬ ‫ِ‬
‫املصاح َبة هلا يف سياق الن ُُّصوص‪.‬‬ ‫ِ‬ ‫دة من الك َِلامت‬ ‫الدِّ الالت امل َتعدِّ ِ‬
‫َ‬

‫‪-82-‬‬
‫وحات علم َّي ٍة ُمستَقبل َّية‬
‫ٍ‬ ‫ألطر‬
‫أفكار بحث َّية ُ‬
‫ٌ‬ ‫‪-8‬‬
‫َن َظ ًرا لنُدرة الدِّ راسات ا َّلتي كُتِ َبت بال َع َربِ َّية عن املدَ َّونات ال ُّل َغ ِو َّية وحداثة منهج‬
‫لبعض األفكار البحثِ َّية‬
‫ِ‬ ‫ُحاو ُل ‪-‬فيام ييل‪ -‬أن ِ‬
‫نعر َض‬ ‫دراستها عىل العرب َّية وهلجاهتا‪ ،‬سن ِ‬
‫ِ‬
‫للباحثني ال َع َرب‪.‬‬ ‫حات علم َّي ٍة‬
‫ا َّلتي قد تَص ُلح إلنجاز أطرو ٍ‬
‫ُ‬ ‫ُ‬
‫موضوع ِ‬
‫الفكرة األوىل‪:‬‬ ‫‪ُ -1.8‬‬
‫ِ‬ ‫الصحافة امل ِ ِ‬
‫املعاصة‬ ‫رص َّية‬ ‫ي يف ُلغة ِّ‬‫َّطور ال ُّلغ َِو ّ‬
‫الت ُّ‬
‫«دراسة إحصائ َّية يف ضوء ُمدَ َّونة ُل َغو َّية»‬
‫Ÿ Ÿما َّدة الدِّ راسة‪:‬‬
‫ِ‬ ‫الصحافة املِ ِ‬
‫املعاصة‪.‬‬ ‫رص َّية‬ ‫ُمدَ َّون ٌة ُل َغ ِو َّي ٌة مكتُوبة (ن َِّص َّية) ُمست ََمدَّ ٌة من ن ُُصوص ِّ‬
‫Ÿ Ÿاألسئِلة ال َبحثِ َّية‪:‬‬
‫ِ‬ ‫للصحافة املِ ِ‬ ‫ٍ‬ ‫ٍ‬
‫املعاصة؟‬ ‫رص َّية‬ ‫وات املنهج َّي ُة لبناء ُمدَ َّونة ُل َغ ِو َّية ِّ‬‫Ÿ Ÿما اخلُ ُط ُ‬
‫موضوع الدِّ راسة؟‬ ‫اإلحصائ ّي لن ُُصوص املدَ َّونة ال ُّل َغ ِو َّية ُ‬ ‫ِ‬ ‫أساليب التَّحليل‬ ‫Ÿ Ÿما‬
‫ُ‬
‫Ÿ Ÿمنهج الدِّ راسة‪ ،‬وجمال البحث‪:‬‬
‫خيي‪ ،‬و َي َتن ََّو ُع ُ‬
‫جمال البحث‬ ‫الوصفي والت ِ‬
‫َّار ّ‬ ‫ّ‬ ‫املقتح ُة عىل املنهجني‪:‬‬ ‫تقو ُم الدِّ راس ُة َ َ‬
‫بني اإلحصاء ال ُّل َغ ِو ّي ولسانِ َّيات املدَ َّونة‪.‬‬
‫املقتحة‪:‬‬ ‫ِ‬
‫األول َّية َ َ‬ ‫Ÿ Ÿاملراجع َّ‬
‫عبد العزيز (حممد حسن)‪ :‬لغة الصحافة املعارصة‪ ،‬دار الفكر العريب‪ ،‬القاهرة‪ ،‬ط‪،1‬‬
‫‪2002‬م‪.‬‬
‫‪Patten, M. L. (2007). Understanding research methods: an overview‬‬
‫‪of the essentials. Pyrczak.‬‬

‫‪-83-‬‬
‫موضوع ِ‬
‫الفكرة ال َّثانية‪:‬‬ ‫‪ُ -2.8‬‬
‫ي للعرب َّية الدَّ ِارجة يف ِمرص‬ ‫األطلس ال ُّلغ َِو ّ‬
‫«دراسة وصف َّية يف ضوء ُمدَ َّونة ُل َغ ِو َّية منطوقة»‬
‫Ÿ Ÿما َّدة الدِّ راسة‪:‬‬
‫ُمدَ َّون ٌة ُل َغ ِو َّي ٌة منطوقة ُمست ََمدَّ ٌة من ن ُُصوص ال ُّلغة العرب َّية يف مرص‪ ،‬أو يف إحدى‬
‫املعاصة‪.‬‬ ‫ِ‬ ‫ال َّلهجات املِ ِ‬
‫رص َّية‬
‫Ÿ Ÿاألسئِلة ال َبحثِ َّية‪:‬‬
‫Ÿ Ÿما املعايري ا َّلتي ينبغي توا ُف ُرها يف األطلس ال ُّل َغ ِو ّي املنشود؟‬
‫منطوقة للعرب َّية الدَّ ِارجة يف ِمرص؟‬
‫ٍ‬ ‫وات املنهج َّي ُة لبناء ُمدَ َّو ٍنة ُل َغ ِو َّي ٍة‬ ‫Ÿ Ÿما اخلُ ُط ُ‬
‫كيف ُيمكن اإلفاد ُة من األطلس ال ُّل َغ ِو ّي للعرب َّية الدَّ ِارجة يف ِمرص يف دراسة‬ ‫ŸŸ َ‬
‫املعاصة؟‬‫ِ‬ ‫رص َّية‬‫ال َّظواهر ال ُّل َغ ِو َّية للعا ِّم َّية املِ ِ‬

‫توظيف املدَ َّونة ال ُّل َغ ِو َّية املنطوقة [أداة الدِّ راسة] يف بناء أطلس‬ ‫ُ‬ ‫كيف ُيمكن‬ ‫ŸŸ َ‬
‫ِ‬
‫ُل َغ ِو ّي للعرب َّية الدَّ ِارجة يف مرص ؟‬
‫Ÿ Ÿمنهج الدِّ راسة‪ ،‬وجمال البحث‪:‬‬
‫وجمال البحث لسانِ َّيات املدَ َّونة‪.‬‬
‫ُ‬ ‫الوصفي‪،‬‬
‫ّ‬ ‫املقتح ُة عىل املنهج‬
‫تقو ُم الدِّ راس ُة َ َ‬
‫املقتحة‪:‬‬ ‫ِ‬
‫األول َّية َ َ‬
‫Ÿ Ÿاملراجع َّ‬
‫السابع‪،‬‬ ‫(خليل)‪ :‬األطلس ال ُّل َغ ِو ّي‪ ،‬جم َّلة جممع ال ُّلغة العرب َّية بالقاهرة‪ ،‬ا ُ‬
‫جلزء َّ‬ ‫عساكر َ‬
‫ص ‪1949 ،383 - 281‬م‪.‬‬
‫‪Bergsträßer, G. (1995) Sprachatlas von Syrien und Palästina.‬‬
‫‪Leipzig, J.C. Hinrichs.‬‬

‫‪-84-‬‬
‫موضوع ِ‬
‫الفكرة ال َّثالثة (‪:)1‬‬ ‫‪ُ -3.8‬‬
‫املعاصة‬ ‫ِ‬ ‫َّكراري ل ُّلغة العرب َّية‬
‫املعجم الت‬
‫ّ‬ ‫َ‬
‫«املنهج والنَّموذج يف ضوء ُمدَ َّونة ُل َغ ِو َّية»‬
‫Ÿ Ÿما َّدة الدِّ راسة‪:‬‬
‫ِ‬
‫املعاصة‪،‬‬ ‫ُمدَ َّون ٌة ُل َغ ِو َّي ٌة مكتُوبة (ن َِّص َّية) ُمست ََمدَّ ٌة من ن ُُصوص ال ُّلغة العرب َّية‬
‫واملعارف العا َّمة‪.‬‬ ‫ِ‬ ‫الصحافة‪،‬‬ ‫لتشم َل‪ :‬اآلداب العرب َّية‪ ،‬و ُلغة ِّ‬
‫وتتنو ُع ما َّد ُتا َ‬ ‫َّ‬
‫Ÿ Ÿاألسئِلة ال َبحثِ َّية‪:‬‬
‫باملعجامت الت ِ‬
‫َّكرار َّية؟ وما مكانتُها يف ال ُّلغة العرب َّية؟‬ ‫َ‬ ‫املقصو ُد‬
‫Ÿ Ÿما ُ‬
‫كيف ُيستَفا ُد من املعجم املنشود يف تعليم العرب َّية لغري النَّاطِقني هبا؟‬
‫ŸŸ َ‬
‫Ÿ Ÿمنهج الدِّ راسة‪ ،‬وجمال البحث‪:‬‬
‫جمال البحث بني اإلحصاء‬ ‫الوصفي‪ ،‬و َي َتن ََّو ُع ُ‬
‫ّ‬ ‫املقتح ُة عىل املنهج‬
‫تقو ُم الدِّ راس ُة َ َ‬
‫يب‪.‬‬‫احلاسو ّ‬
‫ُ‬ ‫ال ُّل َغ ِو ّي ولسانِ َّيات املدَ َّونة وعلم ال ُّلغة‬
‫املقتحة‪:‬‬ ‫ِ‬
‫األول َّية َ َ‬‫Ÿ Ÿاملراجع َّ‬
‫حاسوب َّية‬
‫بغريها « ُمعاجلة ُ‬ ‫قني ِ‬ ‫نحو ُمعج ٍم ل ُّلغة العرب َّية للنَّاطِ َ‬ ‫(املعتز باهلل)‪َ :‬‬
‫ّ‬ ‫السعيد‬
‫َّ‬
‫ساين» – املج َّلة الدَّ ول َّية هلندسة ال ُّلغة العرب َّية وال ِّلسان َّيات‬
‫َّواصل ال ِّل ّ‬‫إحصائ َّية»‪ ،‬جم َّلة «الت ُ‬
‫العا َّمة‪LINGUISTICA COMMUNICATIO (International journal of ،‬‬
‫)‪ ،Arabic Language Engineering & General Linguistics‬فاس‪ ،‬املغرب‪،‬‬
‫مج ‪.2018 ،19‬‬

‫َّكراري ل ُّلغة العرب َّيـــة‪ُ :‬معاجلة ُلغ َِو َّية ُ‬


‫حاسوب َّية)‪،‬‬ ‫ّ‬ ‫تنفيذ هذه الفكرة يف رسالة ماجستري ب ُعنوان (املعجم الت‬‫ُ‬ ‫‪ -1‬أمك َن‬
‫للباحث ُم َّمد جمدي‪ ،‬بإرشاف املؤ ِّلف‪.‬‬

‫‪-85-‬‬
‫الرابعة‪:‬‬ ‫ِ‬ ‫‪ُ -4.8‬‬
‫موضوع الفكرة َّ‬
‫كيبي يف ال ُّلغة العرب َّية‬ ‫الت ّ‬ ‫تقييم أدوات التَّحليل َّ‬
‫حاسوب َّية يف ضوء ُمدَ َّونة ُل َغ ِو َّية ُم َعنونة»‬ ‫ِ‬
‫«دراس ٌة ُل َغ ِو َّية ُ‬
‫Ÿ Ÿما َّدة الدِّ راسة‪:‬‬
‫ُمدَ َّون ٌة ُل َغ ِو َّي ٌة مكتُوبة (ن َِّص َّية) و ُم َعنونة تركيب ًّيا؛ ُمست ََمدَّ ٌة من ن ُُصوص ال ُّلغة‬
‫ِ‬
‫الصحافة‪.‬‬‫وتتنو ُع ما َّد ُتا بني اآلداب العرب َّية و ُلغة ِّ‬ ‫َّ‬ ‫املعاصة‪،‬‬ ‫العرب َّية‬
‫Ÿ Ÿاألسئِلة ال َبحثِ َّية‪:‬‬
‫التكيب َّية العرب َّية؟‬ ‫كيف نبني ُمدَ َّو ٍنة ُل َغ ِو َّي ٍة لتقييم املح ِّلالت َّ‬ ‫ŸŸ َ‬
‫كيبي يف العرب َّية؟‬
‫الت ّ‬‫أي مدً ى ُيمكن اإلفاد ُة من آل َّية التَّحليل َّ‬
‫Ÿ Ÿإىل ِّ‬
‫ِ‬
‫اإلحصائ َّية ا َّلتي ُيمكن اإلفادة منها يف مراحل التَّقييم؟‬ ‫أهم األساليب‬
‫Ÿ Ÿما ّ‬
‫Ÿ Ÿمنهج الدِّ راسة‪ ،‬وجمال البحث‪:‬‬
‫الوصفي‪ ،‬و َي َتن ََّو ُع ُ‬
‫جمال البحث بني اإلحصاء‬ ‫ّ‬ ‫املقتح ُة عىل املنهج‬
‫تقو ُم الدِّ راس ُة َ َ‬
‫يب‪.‬‬‫احلاسو ّ‬
‫ُ‬ ‫ال ُّل َغ ِو ّي ولسانِ َّيات املدَ َّونة وعلم ال ُّلغة‬
‫املقتحة‪:‬‬ ‫ِ‬
‫األول َّية َ َ‬ ‫Ÿ Ÿاملراجع َّ‬
‫للكتاب‪ِ ،‬‬‫رصية العامة ِ‬ ‫ِ‬
‫القاهرة‪،‬‬ ‫َّ‬ ‫(تَّام)‪ :‬ال ُّلغة ال َع َربِ َّية « َمعناها َو َمبناها»‪ ،‬اهلَيئة امل ِ َّ‬
‫َح َّسان َ‬
‫ط‪1979 ،2‬م‪.‬‬
‫‪Attia, M. & Rashwan, M., A Large-Scale Arabic POS Tagger‬‬
‫‪Based on a Compact Arabic POS Tags Set, and Application on‬‬
‫‪the Statistical Inference of Syntactic Diacritics of Arabic Text‬‬
‫‪Words, The Proceedings of the Arabic Language Technologies and‬‬
‫‪Resources Int’l Conference; NEMLAR, Cairo-Egypt http://www.‬‬
‫‪elda.org/nemlar-conf, Sept. 2004.‬‬

‫‪-86-‬‬
‫موضوع ِ‬
‫الفكرة اخلامسة‪:‬‬ ‫‪ُ -5.8‬‬
‫التمجة اآلل َّية احلديثة بني العرب َّية واإلنجليز َّية‬ ‫تقييم ُن ُظم َّ‬
‫َوازية»‬‫«يف ضوء ُمدَ َّونة ُل َغ ِو َّية ُمت ِ‬

‫Ÿ Ÿما َّدة الدِّ راسة‪:‬‬


‫ِ‬ ‫ُمدَ َّون ٌة ُل َغ ِو َّي ٌة مكتُوبة (ن َِّص َّية) و ُمت ِ‬
‫املعاصة‪.‬‬ ‫َوازية‪ُ ،‬مست ََمدَّ ٌة من ُلغة ِّ‬
‫الصحافة‬
‫ِ‬
‫اإلنجليز َّية (ال ُّل َغ َة اهلَدف)‪.‬‬ ‫ُت َ ِّث ُل العرب َّي ُة فيها (ال ُّل َغ َة املصدر)‪ُ ،‬‬
‫وت َ ِّث ُل‬
‫Ÿ Ÿاألسئِلة ال َبحثِ َّية‪:‬‬
‫Ÿ Ÿما اخلُطوات املنهج َّية لبناء ُمدَ َّو ٍنة ُل َغ ِو َّية ُمتوازية للعرب َّية واإلنجليز َّية؟‬
‫اإلحصائ َّية ا َّلتي ُيمكن اإلفادة منها يف مراحل التَّقييم؟‬ ‫ِ‬ ‫أهم األساليب‬
‫Ÿ Ÿما ّ‬
‫Ÿ Ÿمنهج الدِّ راسة‪ ،‬وجمال البحث‪:‬‬
‫الوصفي والتَّقا ُب ّيل‪ ،‬و َي َتن ََّو ُع ُ‬
‫جمال البحث‬ ‫ّ‬ ‫املقتح ُة عىل املنهجني‪:‬‬ ‫تقو ُم الدِّ راس ُة َ َ‬
‫يب‪.‬‬‫احلاسو ّ‬
‫ُ‬ ‫بني اإلحصاء ال ُّل َغ ِو ّي ولسانِ َّيات املدَ َّونة وعلم ال ُّلغة‬
‫املقتحة‪:‬‬ ‫ِ‬
‫األول َّية َ َ‬ ‫Ÿ Ÿاملراجع َّ‬
‫‪Joseph Olive (2011): Handbook of Natural Language Processing and‬‬
‫‪Machine Translation. Springer.‬‬

‫‪Szymon Rutkowski (2012): Machine Translation Evaluation: An‬‬


‫‪Analysis of Two Translations Produced by Google Translate and‬‬
‫‪English Translator XT. Lambert Academic Publishing.‬‬

‫‪Dehcheshmeh, M. (2007). Specialized Monolingual Corpora in‬‬


‫‪Translation. Translation Journal. Volume 11, No. 2.‬‬

‫‪Carmen Mill N-Varela, Francesca Bartrina (2013): The Routledge‬‬


‫‪Handbook of Translation Studies. Routledge.‬‬

‫‪-87-‬‬
‫‪ِ -9‬من املواقع اإللكرتون َّية التَّعليم َّية واإلرشاد َّية‬
‫‪1- http://corpora.wordpress.com/‬‬
‫عرف باملدَ َّونات ال ُّل َغ ِو َّية‪ ،‬و َي ِ‬
‫عرض جمموعة من األدوات‬ ‫متهيدي‪ُ ،‬ي ِّ‬
‫ّ‬ ‫Ÿ Ÿموقع‬
‫ِ‬ ‫املستَخدمة يف ُم َ‬
‫عالة ن ُُصوصها آل ًّيا‪.‬‬
‫‪2- http://arabicorpus.byu.edu/‬‬
‫Ÿ Ÿموقع املدَ َّونة ال ُّل َغ ِو َّية العرب َّية‪ ،‬يستمدُّ ما َّدته من ُّ‬
‫الص ُحف العرب َّية‪ ،‬و ُيمكن اإلفادة‬
‫أغراض بحث َّية ُمتلفة‪.‬‬ ‫ٍ‬ ‫منه يف‬
‫‪3- http://corpus.byu.edu/‬‬
‫Ÿ Ÿموقع املدَ َّونات ال ُّل َغ ِو َّية األنجلوأمريك َّية‪ ،‬و َي ُض ُّم‪-‬كذلك‪ُ -‬مدَ َّو َنتَني ُل َغ ِو َّيتَني‬
‫والبتغال َّية‪.‬‬
‫لإلسبان َّية ُ‬
‫‪4- http://faculty.washington.edu/ebender/corpora/corpora.html‬‬
‫Ÿ Ÿموقع املوقع جمموع ًة من روابط املدَ ونات ال ُّل َغ ِوية ل ُل ٍ‬
‫غات عديدة‪ ،‬و ُيعنى بروابط‬ ‫َّ‬ ‫َّ‬
‫مواقع املرشوعات ال ُّل َغ ِو َّية الكُربى‪.‬‬
‫‪5- http://www.uncorpora.org/.‬‬
‫Ÿ Ÿموقع املدَ َّونات ال ُّل َغ ِو َّية لألمم املتَّحدة‪ُ ،‬‬
‫ويض ُّم جمموع ًة من الوثائق ا َّلتي ُيمكن‬
‫ٍ‬
‫أغراض بحث َّية ُمتلفة‪.‬‬ ‫اإلفادة منها يف‬

‫‪6- http://www.natcorp.ox.ac.uk/.‬‬
‫وتتنو ُع ما َّدة‬
‫َّ‬ ‫املفردات‪،‬‬
‫Ÿ Ÿموقع املدَ َّونة الوطن َّية الربيطان َّية‪ُ ،‬يمكن البحث فيه عن َ‬
‫املدَ َّونة بني املكتوب واملنطوق‪.‬‬
‫‪7- http://www.comp.leeds.ac.uk/eric/latifa/index.htm.‬‬
‫الباحثة ال َق َط ِرية لطيفة السليطي عىل موقع جامعة ليدز‪ ،‬ي ُضم ِ‬
‫قائم ًة ببعض‬ ‫Ÿ Ÿموقع ِ‬
‫َ ُّ‬ ‫ّ‬ ‫َّ‬
‫املدَ َّونات ال ُّل َغ ِو َّية العرب َّية وتعري ًفا َ‬
‫موج ًزا هبا‬

‫‪-88-‬‬
‫ببليوجرافيا مرجع َّية‬
‫ رسالة‬،‫عالة ُل َغ ِو َّية حاسوبِ َّية‬ ِ ‫ مدَ ونة معجم عريب م‬:)‫(املعتز باهلل‬
َ ‫ ُم‬:‫عاص‬ ‫السعيد‬
ُ ّ َ ُ َّ ُ ّ َّ 1.1
.‫م‬2008 ،‫ جامعة القاهرة‬،‫ماجستري‬
،‫عالة ُل َغ ِو َّية حاسوبِ َّية‬
َ ‫ ُم‬:‫تارخيي ل ُّلغة العرب َّية‬
ّ ‫عجم‬
َ ‫ ُمدَ َّونة ُم‬:)‫(املعتز باهلل‬
ّ ‫السعيد‬
َّ 2.2
.‫م‬2011 ،‫ جامعة القاهرة‬،‫أطروحة دكتوراه‬
3. Abdel-Fattah, Y. (2018). Arabic Corpus Linguistic. Edinburgh Uni-
versity Press.
4. Adolphs, S.; Carter, R. (2013): Spoken Corpus Linguistics: From
Monomodal to Multimodal. Taylor & Francis Group.
5. Aijmer, k.; Altenberg, B. (2014). English Corpus Linguistics. Rout-
ledge.
6. Aijmer, K.; Bengt Altenberg, B. (2013): Advances in Corpus-Based
Contrastive Linguistics: Studies in Honour of Stig Johansson. John
Benjamins Publishing Company.
7. Al-Sulaiti, L. (2004). Designing and Developing a Corpus of Con-
temporary Arabic. “M.Sc. thesis”. Leeds University.
8. Arulmozi, S.; Dash, N. (2018). History, Features, and Typology of
Language Corpora. Springer.
9. Baker, P. (2012): Contemporary Corpus Linguistics. Bloomsbury.
10. Baker, P.; Hardie, A.; McEnery, T. (2006). A Glossary of Corpus
Linguistics. Edinburgh University Press.
11. Biber, D.; Reppen, R. (2015): The Cambridge Handbook of English
Corpus Linguistics. Cambridge University Press.
12. Brezina, V. (2018). Statistics in Corpus Linguistics: A Practical
Guide. Cambridge University Press.
13. Collinge, N. E. (2013): Encyclopaedia of Language. Taylor & Fran-
cis.

-89-
14. Collins, L. (2019). Corpus Linguistics for Online Communication:
A Guide for Research. Routledge.
15. Crawford, W.; Csomay, E. (2015): Doing Corpus Linguistics. Tay-
lor & Francis Limited.
16. Dillmann, L.; Arndt-Lappe, S.; Sand, A.; Hoffmann, S. (2018). Cor-
pora and Lexis. BRILL.
17. Ender, A.; Leemann, A.; Wälchli, B. (2012): Methods in Contempo-
rary Linguistics. Walter de Gruyter.
18. Eric, A. (2017). Sociolinguistics and Corpus Linguistics. Magnum
Publishing.
19. Farr, F.; Murray, L. (2016): The Routledge Handbook of Language
Learning and Technology. Routledge.
20. Flowerdew, L. (2012): Corpora and Language Education. Palgrave
Macmillan.
21. Friginal, E. (2017). Studies in Corpus-Based Sociolinguistics. Rou-
tledge.
22. Gomez, P. C. (2013): Statistical Methods in Language and Linguis-
tic Research. Isd.
23. Gries, S. T. (2009): Quantitative Corpus Linguistics With R: A Prac-
tical Introduction. Taylor & Francis.
24. Gries, S. T.; Wulff, S.; Davies, M. (2010): Corpus Linguistic Appli-
cations: Current Studies, New Directions. Rodopi.
25. Handford, M. (2018). Corpus Linguistics for Discourse Analysis: A
Guide for Research. Routledge.
26. Hansen-Schirra, S.; Neumann, S.; Steiner, E.; Culo, O.; Hansen, S.
(2012): Cross-Linguistic Corpora for the Study of Translations: In-
sights from the Language Pair English-German. De Gruyter.
27. Heine, B.; Narrog, H. (2009). The Oxford Handbook of Linguistic
Analysis‫‏‬. Oxford University Press.

-90-
28. Hinkel, E. (2013): Handbook of Research in Second Language
Teaching and Learning. Volume I. Routledge.
29. Hoffmann, T.; Trousdale, G. (2013): The Oxford Handbook of Con-
struction Grammar. Oxford University Press.
30. Hunston, S. (2002). Corpora in applied linguistics. Cambridge:
Cambridge University Press.
31. Koplenig, A. (2017). Against Statistical Significance Testing in Cor-
pus Linguistics. Stefanie Wullf.
32. Ludeling, A.; Kyto, M. (2009) Corpus Linguistics. Walter de
Gruyter.
33. Markus, M. (2012): Middle and Modern English Corpus Linguis-
tics: A Multi-Dimensional Approach. John Benjamins Publishing.
34. Marzo, S.; Heylen, K.; Sutter. G. (2012): Corpus Studies in Contras-
tive Linguistics. John Benjamins Publishing.
35. McEnery, T. (2014). Arabic Corpus Linguistics. Edinburgh Univer-
sity Press.
36. McEnery, T.; Hardie, A. (2011): Corpus Linguistics: Method, Theo-
ry and Practice. Cambridge University Press.
37. McEnery, T.; Meurers, D.; Rebuschat, P. (2017). Experimental, Cor-
pus-based and Computational Approaches to Language Learning:
Evidence and Interpretation. Wiley.
38. McEnery, T.; Wilson, A. (2001). Corpus Linguistics “An introduc-
tion”. 2nd edition. Edinburgh University Press.
39. Mikhailov, M.; Cooper, R. (2016): Corpus Linguistics for Trans-
lation and Contrastive Studies: A Guide for Research. Routledge
Corpus Linguistics Guides. Routledge.
40. Millán, C.; Bartrina, F. (2013): The Routledge Handbook of Trans-
lation Studies. Routledge.

-91-
41. O’Keeffe, A.; McCarthy, M. (2012): The Routledge Handbook of
Corpus Linguistics. Routledge.
42. Pahta, P.; Rütten, T.; Nurmi, A. (2017). Challenging the Myth of
Monolingual Corpora. BRILL.
43. Posch, C. (2014). Feminist Linguistics and Corpus Linguistics:
A database of genderfair language use with non-human referents.
GRIN Verlag.
44. Ramamoorthy, L.; Dash, N. (2018). Utility and Application of Lan-
guage Corpora. Springer Singapore.
45. Rass, T. (2013): Corpus Linguistics - An Introduction to the Field
and its Use in Linguistics. GRIN Verlag.
46. Romero-Trillo, J. (2016): Yearbook of Corpus Linguistics and Prag-
matics 2016: Global Implications for Society and Education in the
Networked Age. Springer International Publishing.
47. Rühlemann, C. (2018). Corpus Linguistics for Pragmatics: A guide
for research. Routledge.
48. Schiebert, W. (2011): Corpus Linguistics: Lexicography and Seman-
tics: Introduction to Concordance and Collocations. GRIN Verlag.
49. Schmidt, T.; Wörner, K. (2012): Multilingual Corpora and Multilin-
gual Corpus Analysis. John Benjamins Publishing.
50. Sinclair, J. M. (2004). How to use corpora in language teaching.
John Benjamins Publishing Company.
51. Speelman, D. (2018). Mastering Corpus Linguistics Methods: A
Practical Introduction with AntConc and R. John Wiley & Sons.
52. Walker, B.; Mcintyre, D. (2019). Corpus Stylistics: Theory and
Practice. Edinburgh University Press.
53. Weisser, M. (2015): Practical Corpus Linguistics: An Introduction
to Corpus-Based Language Analysis. John Wiley & Sons.
54. Wray, A.; Bloomer, A. (2013): Projects in Linguistics and Language
Studies. Routledge.

-92-
‫الفصل َّ‬
‫الثالث‬
‫الدالل َّية‬ ‫َّ‬
‫الشبكات ِّ‬
‫د‪ِ .‬‬
‫سامح األنصاري‬

‫‪ -1‬التحليل الداليل للجملة‪ :‬ملحة تارخيية‪.‬‬


‫‪ -2‬لغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫‪ -3‬املكونات اللغوية للغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫‪ -4‬موارد وأدوات لغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫‪ -5‬تطبيقات املعاجلة اآللية للداللة باستخدام لغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫‪ -6‬دعوة للمشاركة‪.‬‬

‫‪-93-‬‬
-94-
‫يقول عبد القاهر اجلرجاين يف كتابه (دالئل اإلعجاز يف علم املعاين)‪« :‬األلفاظ املفردة‬
‫التي هي أوضاع اللغة مل توضع لتعرف معانيها يف أنفسها‪ ،‬ولكن ألن يضم بعضها إىل‬
‫إن هذا النص فيه إشارة إىل أن الداللة ال تقترص عىل اجلانب‬ ‫بعض فيعرف فيام بينها فوائد» ّ‬
‫اإلفرادي فقط وإنام تتعداه إىل اجلانب الرتكيبي النحوي‪ .‬فال تتحقق الفائدة بالنظر يف‬
‫معاين األلفاظ املفردة بل تتحقق بمعرفة املعاين الناجتة عن ضم تلك الكلامت بعضها مع‬
‫األول من هذا الباب قد تعرض للمعاجلة الداللية ملفردات اللغة‬ ‫بعض‪ .‬وإذا كان الفصل َّ‬
‫فإننا يف هذا الفصل نصل ألبعد من هذا‪ ،‬وحتديدً ا إىل معاجلة الداللة عىل مستوى اجلملة‪.‬‬
‫ولعل التحليل الداليل للجملة الطبيعية ُيعد من أصعب أنواع التحليالت اللغوية ألن‬
‫حتليل داللة عبارة ما‪ ،‬ال بد أن يتم عىل مستويات متعددة هي معنى مفرداهتا (املعجم)‬
‫ومعنى األجزاء الرتكيبية لكلامهتا (الرصف) ومعنى العالقات الرتكيبية بني تلك‬
‫الكلامت (النحو) واملعاين اخلارجة عن الرتكيب التي تنتج عن ظروف برمجاتِ َّية‪/‬غري‬
‫لغوية (‪ )Pragmatic‬ولكنها تؤثر يف املعنى اللغوي‪ .‬هذا التعدد يف مستويات التحليل‬
‫جعل حماوالت املعاجلة احلاسوبية لداللة اجلملة الطبيعية يف أبكر مراحلها‪.‬‬
‫إن هذا الفصل ما هو إال مقدمة لواحدة من املحاوالت الطموحة يف املعاجلة اآللية‬ ‫ّ‬
‫ال وتوليدً ا باستخدام «لغة الشبكات الداللية‬‫للداللة عىل مستوى اجلملة العربية حتلي ً‬
‫احلاسوبية العاملية» (‪ )Universal Networking Language-UNL‬متضمنة التعريف‬
‫بتلك اللغة احلاسوبية وتقديم وصف نظري وعميل لطبيعة عملها مع عرض ألبرز‬
‫التطبيقات التي يمكن للغة الشبكات الداللية احلاسوبية العاملية أن تساهم يف تطويرها‪.‬‬
‫لبعض من النقاط البحثية اهلامة من أجل دعم خطة طريق‬ ‫ٍ‬ ‫أخريا بالتعرض‬
‫ً‬ ‫وننتهي‬
‫ملعاجلة الداللة يف اجلملة العربية‪.‬‬

‫‪ -1‬التحليل الداليل للجملة‪ :‬ملحة تارخيية‬


‫إن التحليل الداليل للغات الطبيعية ليس بفكرة مستحدثة من حيث املبدأ فلقد بدأ‬
‫مر خالهلا باجتاهات ومناهج عديدة من أجل الوصول‬ ‫التفكري به منذ زمن طويل مىض ّ‬
‫إىل منهجية مناسبة لطبيعة ومتطلبات اللغات الطبيعية والتي تتيح بدورها إمكانية‬
‫الوصول إىل متثيل معريف ملحتوى تلك اللغات‪ .‬ولطاملا كانت قضية ارتباط التحليل‬
‫الداليل بالتحليل النحوي حتتل مرتبة عالية من بني القضايا اللغوية املختلفة‪ .‬وقد أشار‬

‫‪-95-‬‬
‫النحاة العرب إىل هذا االرتباط عىل سبيل املثال يف تعريفهم للفاعل النحوي أنه من قام‬
‫بالفعل يف «كتب حممد» أو من وقع عليه الفعل أحيانا يف «سقط حممد»‪.‬‬
‫ويرى كريستوفر بتلر أنه يمكن متييز ثالثة مناهج خمتلفة للعالقة بني التحليل الداليل‬
‫والتحليل النحوي؛ يقوم أحد هذه املناهج عىل البدء بالتحليل النحوي‪ ،‬والذي ينتج‬
‫عنه شجرة نحوية؛ يتبعه حتويل هذه الشجرة النحوية إىل متثيل داليل‪ .‬ولكن هلذا املنهج‬
‫بعض السلبيات‪ ،‬منها أنه يمثل نموذجا غري معقول للتحليل أو املعاجلة التي يقوم هبا‬
‫البرش باعتبار أن الفكرة (املعنى) تنشأ يف الذهن أوال ثم ُيبنى عليه تركيب اجلملة عند‬
‫إنتاجها‪ ،‬كام أنه ال يقر بإمكانية استخدام املعلومات الداللية يف توجيه التحليل النحوي‬
‫حيث يمكن للتحليل النحوي أن يكون مسئوال عن إجياد أكثر من تفسري ممكن؛ وبالطبع‬
‫يستحيل ذلك إذا كان االنطالق من النحو‪ .‬وظهر بوضوح املنهج الثاين الذي أشار إليه‬
‫كريستوفر باتلر يف هناية الستينيات والسبعينيات؛ ويعتمد عىل تقليل التحليل النحوي‬
‫وزيادة الرتكيز عىل التحليل الداليل‪ ،‬وقد تم بناء أنظمة حتليل داليل تعتمد عيل هذا‬
‫املنهج منها نظام «اإلطار النظري للتبعية املفاهيمية» (‪)Conceptual dependency‬‬
‫[‪ ]34‬ونظام آخر يعتمد عىل ما يسمى بـ «داللة التفضيل» (�‪Preference seman‬‬
‫‪ ]38[ )tics‬وهو نظام ال يتعامل مع القيود الداللية بني املفاهيم كقيم مطلقة ولكن‬
‫تبعا ملعايري التفضيل‪ .‬فعىل سبيل املثال الفعل «يأكل» يتميز فاعله بأنه كائن حي إال أن‬
‫الفاعل غري احلي ال يستثنى بشكل مطلق مثل «إن طابعتي تأكل الورق» ويف هذا إشارة‬
‫للخصائص الداللية التي ال بد أن تتوفر يف املتعلقات الداللية لألفعال‪ .‬وقد اقرتح‬
‫كل من بريتن وودز عام ‪ 1976‬استخدام «شبكات التحول املزيدة» (‪Augmented‬‬
‫‪ )Transition Networkss‬من أجل التحليل الداليل التي تتميز بالوضوح (�‪Perspicu‬‬
‫‪ )ity‬والقدرة اإلنتاجية العالية (‪ )Generative power‬والتمثيل الدقيق (‪Efficiency‬‬
‫‪ )of representationn‬والقدرة عىل معاجلة االنتظام يف الظواهر اللغوية (�‪Regulari‬‬
‫‪ )ties‬وأيضا عموميات اللغة (‪ .)Generalities‬أما املنهج الثالث فيعتمد عىل الدمج‬
‫بني التحليل النحوي والتحليل الداليل؛ أي أن يكون هناك تفاعل دائم بينهام وهتدف‬
‫األنظمة القائمة عليه إىل منع إقامة الرتاكيب عديمة النفع أو غري املقبولة دالليا من‬
‫خالل السامح لشكل من أشكال التغذية االرجتاعية الداللية لعملية التحليل النحوي‪.‬‬

‫‪-96-‬‬
‫وقد درس اللغويون الصوريون إمكانية متثيل املعنى بعيدً ا عن ارتباطه بالتحليل‬
‫النحوي من خالل منهجية أخرى تعتمد عىل إمكانية وضع معنى العبارات اللغوية‬
‫يف بنى صورية يطلق عليها متثيل املعنى ويطلق عىل بيئة العمل املستخدمة لتوصيف‬
‫نحو وداللة هذه التمثيالت لغات متثيل املعنى حيث تصف عددا من منهجيات التمثيل‬
‫املعريف الداليل منها؛ منهجية «املنطق من الدرجة األوىل» (‪ )First-order logic‬حيث‬
‫حتتوى هذه املنهجية عىل القواعد واألصول الالزمة لصياغة نظريات الذكاء االصطناعي‬
‫امكام تعتمد عىل مبادئ املنطق البولياين (‪ )Boolean Logic‬ومنطق القضايا (�‪Proposi‬‬
‫‪ )tional Logic‬وتعترب إحدى منهجيات متثيل املعرفة التي متتاز باملرونة وسهولة الفهم‬
‫إذ أهنا تقدم أساسا حاسوبيا ملتطلبات التحقق واالستنتاج‪ .‬وكذلك منهجية «التحليل‬
‫الداليل القائم عىل النحو‪ ،‬وتعتمد عىل مبدأ الرتكيبية وتكمن فكرهتا يف أن معنى اجلملة‬
‫يمكن تركيبه من معاين أجزائها بحيث ال يعتمد فقط عىل معاين الكلامت التي تكوهنا‬
‫بل عىل ترتيب هذه الكلامت يف اجلملة وطريقة جتميعها والعالقات فيام بينها وهذا معنى‬
‫آخر للقول بأن معنى اجلملة يعتمد جزئيا عىل البنية النحوية هلا‪ .‬وبالرغم من اجلهود‬
‫املبذولة منذ القدم للوصول إىل منهج واضح ونظام فعال للتحليل الداليل إال أن كل‬
‫هذه اجلهود أسفرت عن جمرد حماوالت غري مكتملة وإىل اآلن مازال التحليل الداليل‬
‫من أصعب مستويات حتليل اللغات الطبيعية‪.‬‬

‫‪ -2‬لغة الشبكات الداللية احلاسوبية العاملية‬


‫إننا كبرش نستخدم اللغة الطبيعية للتعبري عن احلقائق واملعارف‪ّ .‬‬
‫إن اللغة الطبيعية‬
‫مرنة وشاملة بشكل كبري لكنّها تتعدد بتعدد احلضارات وختتلف باختالف الثقافات‬
‫(اللغة العربية واإلنجليزية والسواحلية ‪ ...‬إلخ) كام أن اللبس جز ًء من طبيعتها التي‬
‫يص ُعب عليها التخلص منها لكنها تعاجله بام يسبق العبارات امللتبسة وما يلحقها من‬
‫نصوص تزيل ذلك اللبس‪ ،‬فيتمكن العقل البرشي من فهم احلقائق من خالل سياق‬
‫احلديث وربطه بام ُييط بالكالم من مالبسات وظروف وحال املتحدث وا ُملخا َطب‪...‬‬
‫الخ‪ .‬ولطاملا كان يطمح جمال متثيل املعرفة إىل إجياد لغة واضحة وغري مبهمة لتمثيل‬
‫املعارف ولتكون اللغة املشرتكة بني اجلنس البرشي واآلالت‪ ،‬هذه اللغة جيب أن متكن‬
‫احلاسوب من التفكري باملعطيات واستنباط حقائق جديدة من هذه املعطيات ومن‬

‫‪-97-‬‬
‫االصطناعي‪ .‬ولعل لغة الشبكات الداللية‬
‫ّ‬ ‫ثم حل ا ُملشكالت املتعلقة بمجال الذكاء‬
‫احلاسوبية العاملية متتلك ما يؤهلها لتحقيق هذا اهلدف؛ إذ أهنا جاءت كمحاولة للتوسط‬
‫بني الشكل املعريف املجرد للمحتوى الذي يعرب عنه البرش يف حياهتم اليومية وبني الشكل‬
‫اللغوي الذي يستخدم للتعبري عن هذا املحتوى يف شكل مجل وعبارات عن طريق متثيل‬
‫املحتوى متثيال صحيحا ومتكامال خيتلف عن طريقة متثيل اللغات الطبيعية له؛ فبينام‬
‫تقوم اللغات الطبيعية بتمثيل املحتوى يف صورة مفردات لغة معينة وتراكيب تتبع قواعد‬
‫هذه اللغة‪ ،‬فإن لغة الشبكات الداللية احلاسوبية العاملية هلا مفردات وتراكيب متكنها من‬
‫متثيل املحتوى متثيال جمردا حيمل كل ما كان حيويه النص األصيل من معلومات رصفية‬
‫ونحوية وداللية وبرمجاتية يف شكل شبكة داللية دون انحياز ملفردات أو تراكيب لغة‬
‫معينة أو حتى جمموعة من اللغات؛ كأن تنحاز لرتاكيب اللغة اإلنجليزية أو اللغات‬
‫جرمانية األصل مثال‪ .‬هذا التمثيل الداليل مكّن لغة الشبكات الداللية احلاسوبية‬
‫العاملية من لعب دور اللغة الوسيطة بني اللغات الطبيعية‪ .‬ويوضح اجلدول (‪)1-3‬‬
‫الفرق بني اللغات الطبيعية ولغة الشبكات الداللية احلاسوبية العاملية يف متثيل نفس‬
‫املحتوى حيث يظهر منه أن لغة الشبكات الداللية احلاسوبية العاملية هي لغة وسيطة بني‬
‫مجيع اللغات الطبيعية‪ ،‬فجميع اللغات الطبيعية يف اجلدول (‪ )1-3‬يمكن الربط بينها‬
‫باستخدام التمثيل املعريف للغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫لغة الشبكات الداللية‬
‫اللغات الطبيعية‬
‫احلاسوبية العاملية‬
‫العربيـة‪ :‬أكل الولد التفاحـة‬
‫@‪agt(201168468:64.@past.‬‬
‫اإلنجليزية‪The boy ate the apple :‬‬
‫)‪entry,110285313:59.@def‬‬

‫@‪obj(201168468:64.@past.‬‬ ‫الفرنسية‪Le garçon a mangé la :‬‬


‫‪pomme‬‬
‫)‪entry,107739125:77.@def‬‬

‫اجلدول ‪ :1-3‬متثيل اللغات الطبيعية ولغة الشبكات الداللية احلاسوبية العاملية ملحتوى‬
‫«أكل الولد التفاحة»‪.‬‬

‫‪-98-‬‬
‫وبالرغم من أن لغة الشبكات الداللية احلاسوبية العاملية هي لغة وسيطة كام ذكرنا إال‬
‫أهنا ختتلف عن اللغات األخرى التي يطلق عليها لغات وسيطة كاإلسربانتو(‪ )1‬مث ً‬
‫ال التي‬
‫هي لغة وسيطة يمكن للبرش استعامهلا للتواصل يف حياهتم اليومية‪ ،‬لكن لغة الشبكات‬
‫الداللية لغة اصطناعية مصممة ملحاكاة التواصل اإلنساين وعىل مستوى اآللة‪.‬‬
‫وقد انطلق برنامج تطوير لغة الشبكات الداللية احلاسوبية العاملية(‪ )2‬عام ‪1996‬‬
‫عندما بدأ معهد الدراسات املتقدمة يف طوكيو الدعوة هلذا املرشوع‪ .‬وتقوم حاليا‬
‫«مؤسسة لغة الشبكات الداللية احلاسوبية العاملية» (‪ )3()UNDL Foundation‬بتطوير‬
‫هذا املرشوع وإدارته واإلرشاف عىل تنفيذه‪ .‬وقد اشرتك يف هذا املرشوع حتى اآلن سبع‬
‫عرشة لغة تقوم مؤسساهتا عىل بناء وتطوير األدوات واملوارد الالزمة لتحليل وتوليد‬
‫هذه اللغات والتي من بينها اللغة اإلسبانية والفرنسية واليابانية والربتغالية والتايالندية‬
‫واللغة العربية التي يتم حاليا بناء املكون اخلاص هبا يف مركز اللسانيات احلاسوبية‬
‫العربية(‪ )4‬يف مكتبة اإلسكندرية يف مرص‪.‬‬

‫‪ -3‬املكونات اللغوية للغة الشبكات الداللية احلاسوبية العاملية‬


‫لكي تتمكن لغة الشبكات الداللية احلاسوبية العاملية من حماكاة وظائف اللغات‬
‫الطبيعية بشكل ناجح كان ال بد أن يكون هلا نفس خصائص اللغات الطبيعية ومكوناهتا‬
‫اللغوية من مفردات (‪ .)UNL Vocabulary‬وعالقات داللية تربط بني الكلامت‬
‫(‪ )UNL Relations‬ومتثل نحو لغة الشبكات الداللية احلاسوبية العاملية‪ ،‬وهي ما‬

‫‪ -1‬اإلسربانتو لغة مصطنعة سهلة‪ ،‬اخرتعها لودفيغ أليعزر زامنهوف كمرشوع لغة اتصال دولية عام ‪.1887‬‬
‫‪-2‬جدير بالذكر أن للغة الشبكات الداللية احلاسوبية إصدارين؛ األول كان يف بداية إطالقها واستمر لعدة أعوام بعدها‬
‫خضعت لغة الشبكات الداللية احلاسوبية ملرحلة تطوير وحتسني نتج عنها إصدار جديد ُأطلق عليه ‪ UNL+3‬هذا‬
‫اإلصدار هو نفسه الذي نتعرض له يف هذا الفصل بالرشح والتفصيل ومل نأيت عىل ذكر اإلصدار األول لكن باإلمكان‬
‫معرفة املزيد عنه عن طريق هذا الرابط‪ ،http://www.undl.org :‬أما اإلصدار الثاين فيمكن متابعته عن طريق هذا‬
‫الرابط ‪.http://www.unlweb.net/unlweb :‬‬
‫‪ -3‬ملعرفة املزيد عن املؤسسة وأنشطتها ُيرجى اتباع هذا الرابط‪:‬‬
‫‪/http://www.undlfoundation.org/undlfoundation‬‬
‫‪ -4‬إسهامات املركز العريب يف دعم لغة الشبكات الداللية احلاسوبية يمكن متابعتها من خالل هذا الرابط اخلاص باملركز‬
‫العريب يف مكتبة اإلسكندرية‪http://www.bibalex.org/unl/Frontend/home.aspx :‬‬

‫‪-99-‬‬
‫يقابل تراكيب اجلمل يف اللغات الطبيعية من فعل وفاعل ومفعول وختتلف يف اللغات‬
‫الطبيعية من لغة إىل أخرى بحسب نظام اللغة لكنها ثابتة يف لغة الشبكات الداللية‬
‫احلاسوبية العاملية‪ ،‬وخصائص حتمل املعاين الناجتة عن الظروف غري اللغوية (‪UNL‬‬
‫‪ .)Attributes‬وأنطولوجيا للمفاهيم (‪ .)UNL Ontology‬وهذا ما يتناوله هذا اجلزء‬
‫بالرشح واإليضاح‪.‬‬

‫‪ -1.3‬مفردات لغة الشبكات الداللية احلاسوبية العاملية )‪(UNL Vocabulary‬‬

‫إن املفردة هي وحدة اللغة التي حتمل املعنى‪ ،‬وبالنسبة للغات الطبيعية فإن شكل‬ ‫ّ‬
‫املفردة خيتلف باختالف اللغة عىل الرغم من أن املعنى واحد‪ .‬وألن لغة الشبكات‬
‫الداللية احلاسوبية العاملية ال تنحاز ألي لغة طبيعية فقد قامت بتمثيل املفردة بطريقة‬
‫جمردة بعيدا عن الشكل املرتبط بلغة بعينها حيث يتيح نظام لغة الشبكات الداللية‬
‫احلاسوبية العاملية التعبري عن املعنى دون املبنى يف صورة ما يسمى «بالكلامت العاملية»‬
‫(‪ )1()Universal Words‬وهي متثل املعاين املجردة التي تعرب عن املفاهيم اإلنسانية مثلها‬
‫مثل كلامت اللغة الطبيعية بام فيها من أسامء وأفعال وصفات وأحوال‪ .‬ويرجع وصف‬
‫مفردات لغة الشبكات الداللية بالعاملية إىل أن مدلول هذه املفردات واحد بالنسبة لكل‬
‫اللغات الطبيعية مثلها مثل إشارة املرور بألواهنا الثالث فكل لون له مدلول ثابت ال‬
‫يمكن االختالف عليه يف مجيع أنحاء العامل مهام اختلفت اللغات وتعددت الثقافات ومن‬
‫هنا كان للكلامت العاملية القدرة عىل التوسط بني مجيع اللغات الطبيعية‪.‬‬
‫ويوضح الشكل (‪ )1-3‬مثاالً عىل ذلك فنفس املفهوم الذي تعرب عنه اللغات‬
‫املختلفة ببنى خمتلفة تقوم لغة الشبكات الداللية احلاسوبية العاملية بالتعبري عنه بشكل‬
‫خمتلف يتوسط مجيع تلك اللغات فيكون بإمكاننا أن نستبدل البنية اإلنجليزية أو العربية‬
‫أو الفرنسية أو اإلسبانية للمفهوم بالكلمة العاملية دون انحياز للغة ما أو اختالف عىل‬
‫املعنى الذي حتمله املفردة‪.‬‬

‫‪ -1‬ملعرفة املزيد عن الكلامت العاملية برجاء اتباع هذا الرابط‪:‬‬


‫‪http://www.unlweb.net/wiki/index.php/Universal_Words‬‬

‫‪-100-‬‬
‫خمتلفة تقوم لغة الشبكات الداللية احلاسوبية العاملية ابلتعبري عنه بشكل خمتلف يتوسط مجيع‬
‫تلك اللغات فيكون إبمكاننا أن نستبدل البنية اإلجنليزية أو العربية أو الفرنسية أو اإلسبانية‬
‫للمفهوم ابلكلمة العاملية دون احنياز للغة ما أو اختالف على املعىن الذي حتمله املفردة‪.‬‬

‫املعىن اجملرد ‪ /‬املفهوم‬

‫الكلمة العاملية ‪102958343 :‬‬

‫الفرنسية‪voiture :‬‬ ‫اإلسبانية‪coche :‬‬ ‫العربية‪ :‬سيارة‬ ‫اإلجنليزية‪car :‬‬

‫الشَّكل ‪ :1-3‬يوضح توسط الكلمة العاملية بني اللغات الطبيعية‪.‬‬


‫َّ‬
‫الشكل ‪ :1-3‬يوضح توسط الكلمة العاملية بني اللغات الطبيعية‪.‬‬
‫احلاسوبيةختلو‬
‫احلاسوبية العاملية‬
‫الدالليةالداللية‬
‫الشبكات‬‫الشبكات‬ ‫مفردات لغة‬
‫مفردات لغة‬ ‫فإن فإن‬ ‫الطبيعية‬
‫الطبيعية‬ ‫ملفرداتاللغات‬
‫اللغات‬ ‫وخالفاملفردات‬
‫وخالفا‬
‫للتعبري‬
‫يمكن‬‫استخدامها‬ ‫«فصل»بيةيفُيكن‬
‫اللغة العربية‬ ‫كلمةاللغة العر‬
‫املثال» يف‬
‫سبيل«فصل‬
‫فعىلكلمة‬
‫االلتباس‪،‬املثال‬
‫فعلى سبيل‬ ‫االلتباس‪،‬‬
‫أشكال‬ ‫أشكال‬
‫ختلو من‬ ‫من‬
‫العاملية‬
‫استخدامها للتعبري عن أكثر من مفهوم مثل «فصل يف كتاب» أو «فصل من فصول السنة»‬
‫أو «عملية تفريق يشء عن آخر» وغريها من املعاين املختلفة مما قد يسبب غموض ناتج‬
‫من معنى وهنا يأيت دور الكلامت العاملية يف‬
‫أكثرابط‪:‬‬
‫عنهذا الر‬
‫للتعبرياتباع‬ ‫يستخدم‬
‫العاملية برجاء‬ ‫املبنى‬
‫الكلمات‬ ‫نفس عن‬ ‫عن أن‬
‫ملعرفة املزيد‬ ‫(‪)5‬‬
‫التعبري عن املعاين املختلفة دون لبس أو غموض حيث يوضح اجلدول (‪ )2-3‬طريقة‬
‫‪http//:www.unlweb.net/wiki/index.php/Universal_Words‬‬

‫التعبري عن كلمة «فصل» باستخدام مفردات لغة الشبكات الداللية احلاسوبية العاملية‬
‫فنفس الكلمة العربية ُيقابله أربع كلامت عاملية تعرب عن املعاين املختلفة هلذه الكلمة‬
‫العربية‪.‬‬
‫املعنى‬ ‫الكلمة العاملية‬ ‫الكلمة العربية‬
‫فصل يف كتاب (جزء من كتاب)‪.‬‬ ‫‪106396142‬‬
‫فصل من فصول السنة األربعة‪.‬‬ ‫‪115236475‬‬
‫فصل‬
‫حجرة دراسية يف مدرسة‪.‬‬ ‫‪103038685‬‬
‫عملية تفريق يشء عن آخر‪.‬‬ ‫‪100216174‬‬

‫اجلدول ‪ :2-3‬التعبري عن املعاين املختلفة لكلمة «فصل» باستخدام لغة الشبكات الداللية احلاسوبية العاملية‪.‬‬

‫‪-101-‬‬
‫وقد يتبادر إىل أذهاننا أن الكلمة العاملية هي كلمة مكونة من أحرف كعادة كلامت‬
‫اللغات الطبيعية‪ ،‬ولكن عىل خالف ذلك فإن الكلمة العاملية يتم التعبري عنها برقم‬
‫كودي‪ .‬هذا الرقم مأخوذ من شبكة الكلامت اإلنجليزية (‪ )WordNet‬وقد استُخدمت‬
‫هذه األرقام للتعبري عن مفردات لغة الشبكات الداللية احلاسوبية العاملية لعدة أسباب‬
‫منها أن شبكة الكلامت اإلنجليزية عبارة عن شبكة داللية متكاملة للكلامت اإلنجليزية‬
‫(حوايل ‪ 117.659‬مفهوم) وحتتوي عىل معلومات عن معاين هذه املفاهيم والعالقات‬
‫األنطولوجية بينها وبني املفاهيم األخرى داخل شبكة املعاين‪ .‬باإلضافة إىل أن هناك‬
‫حماوالت فعلية من قبل العديد من اللغات منها اللغة الفرنسية واهلندية لبناء شبكة‬
‫كلامت فرنسية (‪ )French WordNet‬وشبكة كلامت هندية (‪)Hindi WordNet‬‬
‫الشفرات الرقمية املوجودة‬‫اعتام ًدا عىل شبكة اللغة اإلنجليزية‪ ،‬فإذا تم استخدام نفس َّ‬
‫داخل الشبكة اإلنجليزية للتعبري عن الكلامت العاملية يف لغة الشبكات الداللية سيجعل‬
‫من السهل عىل كل لغة من اللغات املشاركة يف برنامج لغة الشبكات الداللية بناء شبكة‬
‫كلامت خاصة بلغتها‪.‬‬

‫‪ -2.3‬العالقات الداللية (‪)UNL Relations‬‬

‫هتدف لغة الشبكات الداللية احلاسوبية العاملية إىل بناء شبكة داللية عاملية ألي مجلة‬
‫طبيعية تعرب عن حمتوى تلك اجلملة حيث تتشكل تلك الشبكة عن طريق ربط املفردات‬
‫بعالقات تعرب عن الدور الداليل لكل مفردة داخل اجلملة مثل عالقات الفاعل الداليل‬
‫(‪ )Agent‬واملفعول الداليل (‪ )Object‬واملكان (‪ )Place‬والزمن (‪ ... )Time‬وغريها‬
‫من العالقات الداللية املختلفة التي تربط بني كل كلمتني عىل حده يف اجلملة ويتم‬
‫التعبري عنها برموز مكونة من ثالثة أحرف مثل‪( agt :‬فاعل) و‪( obj‬مفعول) و‪plc‬‬
‫(مكان) و‪( tim‬زمن) ‪ ....‬الخ‪ .‬ويبلغ عدد العالقات الداللية املوجودة بلغة الشبكات‬
‫الداللية احلاسوبية العاملية حوايل ‪ 46‬عالقة تعرب عن مجيع العالقات الداللية املمكنة بني‬
‫كلامت اجلمل يف أية لغة طبيعية‪ .‬ومثال عىل ذلك اجلملة العربية (‪:)1‬‬
‫سيلعب الفريق املباراة النهائية يف القاهرة يوم اجلمعة القادم (‪)1‬‬
‫فالعالقات الداللية التي تربط بني كلامت هذه اجلملة هي عالقة ‪ agt‬أو فاعل داليل‬
‫بني «سيلعب» و«الفريق» وعالقة ‪ obj‬أو مفعول داليل بني «سيلعب» و«املباراة» وعالقة‬

‫‪-102-‬‬
‫‪ plc‬أو مكان بني «سيلعب» و«يف القاهرة» وعالقة ‪ tim‬أو زمن بني «سيلعب» و«يوم‬
‫اجلمعة»‪ .‬وخيتلف التعبري عن أجزاء اجلملة بعالقات داللية عىل حسب معنى اجلملة‬
‫فليس كل فاعل نحوي هو فاعل داليل‪ ،‬فمثال العالقة الداللية بني «لعب» و«حممد»‬
‫يف مجلة «لعب حممد» وهي عالقة فاعل داليل (‪ )agt‬ختتلف عن العالقة الداللية بني‬
‫«انكرس» و«الزجاج» يف مجلة «انكرس الزجاج» وهي عالقة مفعول داليل (‪ )obj‬عىل‬
‫الرغم من اتفاق العالقة النحوية (فاعل نحوي) حيث أن «الزجاج» واقع عليه الفعل‬
‫وليس قائم به‪.‬‬
‫(‪)1‬‬
‫‪ -3.3‬السامت (‪)UNL Attributes‬‬

‫إن الكالم البرشي حيمل الكثري من املعاين الضمنية التي ال يمكن التعبري عنها‬
‫بالكلامت ولكن تفهم من خالل طريقة القول أو تنغيامت اجلمل أو نربة الصوت‪،‬‬
‫فكيف للحاسوب الوصول هلذه املعاين وفهمها والتعامل معها وهي ليست معلومات‬
‫رصفية وال نحوية ولكنها تتضح من سياق الكالم وطريقة التعبري كام أهنا مهمة لنقل‬
‫املعنى السليم وقد تؤدي الختالف معاين اجلمل مثل مجلة «أأمتمت عملك اليوم» يمكن‬
‫أن تعرب عن استفهام أو عن استنكار وفقا ملا يقصده املتكلم‪ .‬وقد وضعت لغة الشبكات‬
‫الداللية احلاسوبية العاملية طريقة للتعبري عن هذه املعلومات عن طريق جمموعة من‬
‫الرموز اإلضافية (السامت) التي تستخدم يف التحليل الداليل إلضافة املعلومات‬
‫التي مل يتم التعبري عنها بمفردات لغة الشبكات الداللية أو بالعالقات الداللية إذ َّإنا‬
‫تُستَخدَ م للتعبري عن ثالثة أنواع من املعلومات؛ أوالً‪ :‬معلومات عن دور املفهوم داخل‬
‫الشبكة الداللية مثل السمة «‪ »@entry‬ومعناها «املدخل للشبكة الداللية» ومتثل‬
‫املفهوم األسايس (‪ )Main Predicate‬وتوضع لتوضح الكلمة التي متثل «مدخل»‬
‫الشبكة الداللية‪ ،‬هذا املدخل ترتبط به املفردات الرئيسية داخل الشبكة الداللية بشكل‬
‫مبارش واملفردات األخرى بشكل غري مبارش‪ ،‬و ُيعد بمثابة مفتاح الشبكة الداللية‪.‬‬
‫ثان ًيا‪ :‬معلومات مورفولوجية مثل التي حتملها السوابق واللواحق كالزمن والتذكري‬
‫والتأنيث والعدد وغريها من املعلومات فعىل سبيل املثــــال لتمثيــل الفعــــل‬

‫‪-1‬ملعرفة املزيد عن السامت يف لغة الشبكات الداللية احلاسوبية ُيرجى اتباع هذا الرابط‪ :‬‬
‫‪http://www.unlweb.net/wiki/index.php/Attributes‬‬

‫‪-103-‬‬
‫«يكتــب» تستخــدم السمــة «‪ »@present‬للتعبري عن الزمن املضارع وتوضع‬
‫عىل الرقم الكودي للمفهوم «كتب» مثل «‪ ،»present@. 200993014‬والسمتني‬
‫«‪ »@def‬و «‪ »@indef‬لتحديد التعريف والتنكري للكلامت والسمتني «‪»@female‬‬
‫و«‪ »@male‬للتعبري عن التأنيث والتذكري للكلمة كام يف «‪»male@.110020890‬‬
‫و« ‪ .»female@.110020890‬ثال ًثا‪ :‬معلومات خاصة بالسياق مثل السمة ‪@polite‬‬
‫والتي تصف التهذيب يف عبارة «وتفضلوا سيادتكم» و ‪ @exclamation‬والتي تعرب‬
‫عن التعجب كام يف مجلة «يا له من منظر رائع» وغريها من السامت األخرى‪.‬‬

‫‪ -4.3‬األنطولوجيا اللغوية (‪)UNL Ontology‬‬


‫(‪)1‬‬

‫لكي تكتمل املكونات اللغوية للغة الشبكات الداللية كان ال بد هلا أن يكون لدهيا‬
‫مكون آخر يشبه مكونات اللغات الطبيعية التي متثل القدرة اللغوية لإلنسان أال وهو‬
‫األنطولوجيا وقاعدة املعرفة‪ .‬وأنطولوجيا لغة الشبكات الداللية هي منظومة الكلامت‬
‫العاملية ولكن يف بناء شجري تُرتب فيه الكلامت العاملية بشكل هرمي طبقا للعالقات‬
‫األنطولوجية بينها‪ .‬هذه العالقات تعرب عن ارتباط الكلامت العاملية مع بعضها البعض‬
‫بعالقات هرمية مثل عالقة «نوع من» (‪ )icl‬وعالقة «مثال ل» (‪ .)iof‬واملثال (‪)2‬‬
‫شكل أحد مداخل األنطولوجيا‪ .‬وهو يعني أن التفاحة وهي ما يعرب عنها‬ ‫َ‬ ‫يوضح‬
‫بالكلمة العاملية األوىل من جهة اليسار (‪ )107739125‬هي نوع من الفاكهة وهي‬
‫ما يعرب عنها بالكلمة العاملية الثانية من جهة اليسار (‪ ،)113134947‬ويعرب عن هذا‬
‫باستخدام عالقة (‪ )icl‬أما الرقم ‪ 1‬يف النهاية يعرب عن صحة هذه العالقة األنطولوجية‬
‫بني الكلمتني العامليتني‪.‬‬
‫(‪)2‬‬ ‫;‪icl(<[[107739125]];[[ 113134947]])=1‬‬

‫ولعل ذلك يوضح أمهية األنطولوجيا يف لغة الشبكات الداللية احلاسوبية العاملية‬
‫حيث أن هبذه املنهجية يمكن للغة اهلدف التعرف عىل معنى مفهوم ما مرتبط بثقافة‬
‫اللغة املصدر (يف حالة الرتمجة)‪ .‬فمثال يمكن للغات األخرى التعرف عىل مفهوم كلمة‬

‫‪ -1‬يمكن معرفة املزيد عن األنطولوجيا اللغوية عن طريق هذا الرابط‪:‬‬


‫‪http://www.unlweb.net/wiki/index.php/Ontology‬‬

‫‪-104-‬‬
‫«اإلحرام» يف العربية بالرغم من عدم وجود البعد الثقايف هلذا املفهوم يف تلك اللغات‪.‬‬
‫ويرتبط باألنطولوجيا ما يسمى بقاعدة معرفة لغة الشبكات الداللية احلاسوبية‬
‫العاملية (‪ )UNL Knowledge Base‬وهي ختتلف عن األنطولوجيا من حيث نوع‬
‫وطبيعة العالقات فتضم قاعدة املعرفة شبكة من الكلامت العاملية تربط بينها عالقات‬
‫لغة الشبكات الداللية بينام حتتوي األنطولوجيا عىل عالقات هرمية فقط كام هو موضح‬
‫يف املثال (‪ .)2‬وعىل هذا فإن قاعدة املعرفة تشتمل عىل األنطولوجيا ولكنها أعم وأشمل‬
‫كام يتضح ذلك من املثال (‪ .)3‬ففي املثال (‪( )3‬أ) نجد نفس العالقة اهلرمية بني الكلمتني‬
‫العامليتني (‪ )100001930‬و(‪ )100001740‬كام يف املثال (‪ ،)2‬وباإلضافة إىل ذلك‬
‫نجد نوعا آخرا من العالقات كام يف ‪( 3‬ب) حيث ال يمكن حتقق العطف بني عالقتني‬
‫إحدامها (‪ )agt‬واألخرى ليست (‪ ،)agt‬فإذا كان هناك ‪ x‬و ‪ y‬بينهام عالقة (‪ )agt‬و ‪ x‬و‬
‫‪ y‬ليس بينهم عالقة (‪ )agt‬ال يمكن العطف بينهم‪ .‬ويدل الرقم ‪ 0‬يف هناية املدخل عىل‬
‫عدم حتقق العالقة‪.‬‬
‫;‪- icl(<[[100001930]];[[100001740]])=1‬أ‬
‫(‪)٣‬‬
‫;‪- and(agt(x;y);^agt(x;y))=0‬ب‬
‫ويف ختام هذا العرض للمكونات اللغوية للغة الشبكات الداللية احلاسوبية العاملية‪،‬‬
‫يوضح الشكل (‪ )2-3‬الشبكة الداللية احلاسوبية للجملة العربية يف املثال رقم (‪)4‬‬
‫التي تم متثيلها باستخدام املفردات العاملية والعالقات الداللية والسامت لتشرتك مجيعا‬
‫للتعبري عن معنى اجلملة‪ .‬وقد أمكن التعبري عن املعنى املجرد هلذه اجلملة دون الشكل‬
‫املقيد بلغة ويمكن ألي لغة طبيعية فهم هذا التمثيل وذلك جيعلنا نشعر بدقة معنى‬
‫العاملية يف لغة الشبكات الداللية احلاسوبية العاملية‪ .‬ويمكن قراءة الشبكة الداللية بد ًء‬
‫من املفهوم الذي يمثل املدخل والذي حيمل السمة «@‪ »entry‬فهو املفهوم األسايس‬
‫للشبكة الداللية‪ .‬أما الشكل (‪ )3-3‬فيعرب عن اجلملة العربية مكتوبة بلغة الشبكات‬
‫الداللية احلاسوبية العاملية‪ .‬واجلدول رقم (‪ )3-3‬يوضح املقابل العريب لكل مفهوم من‬
‫مفاهيم تلك الشبكة الداللية‪.‬‬

‫‪-105-‬‬
‫(‪)4‬‬ ‫استفادت من هذه القروض ست دول‬
‫(‪)4‬‬ ‫استفادت من هذه القروض ست دول‬
‫املفهوم بلغة‬
‫املفهوم بلغة‬ ‫‪202290461.@entry.@past‬‬
‫املقابلربيةباللغة العربية‬
‫املقابل ابللغة الع‬
‫الدالليةالداللية‬
‫الشبكات‬‫الشبكات‬ ‫‪obj‬‬
‫‪aoj‬‬ ‫‪108544813.‬‬
‫استفاد‬ ‫استفاد‬
‫‪202290461‬‬‫‪202290461‬‬ ‫@‪11339895.@pl.‬‬ ‫‪@pl‬‬
‫‪proximal.@def‬‬
‫دول‬ ‫دول‬
‫‪108544813‬‬
‫‪108544813‬‬ ‫‪qua‬‬

‫قرض‬ ‫قرض‬ ‫‪113398953‬‬


‫‪113398953‬‬
‫‪6‬‬

‫الداللية‪ .‬الداللية‪.‬‬ ‫العربيةالشبكة‬


‫ملفاهيم الشبكة‬ ‫باللغة ملفاهيم‬
‫املقابل العربية‬
‫املقابل ابللغة‬
‫اجلدول‪:3-3 :‬‬ ‫جلملةربية‪.‬‬
‫العربية‪ .‬اجلدول ‪3-3‬‬ ‫احلاسوبيةجلملة الع‬
‫الدالليةاحلاسوبية‬
‫الشبكة الداللية‬
‫‪ ::2-3‬الشبكة‬
‫َّكل ‪2-3‬‬
‫الشكل‬‫َّ‬
‫الش‬

‫}‪{unl‬‬
‫}‪{unl‬‬ ‫)‪aoj)202290461:00.@past.@entry,108544813:1Z.@pl‬‬
‫)‪aoj(202290461:00.@past.@entry,108544813:1Z.@pl‬‬
‫‪obj)202290461:00.@past.@entry,113398953:0Y.@pl.@proximal.@de‬‬
‫(‪f‬‬
‫)‪obj(202290461:00.@past.@entry,113398953:0Y.@pl.@proximal.@def‬‬
‫(‪qua)108544813:1Z.@pl,6:1N‬‬
‫)‪qua(108544813:1Z.@pl,6:1N‬‬
‫}‪{/unl} {/unl‬‬
‫الشَّكل ‪ :3-3‬اجلملة العربية مكتوبة بلغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫َّ‬
‫الشكل ‪ :3-3‬اجلملة العربية مكتوبة بلغة الشبكات الداللية احلاسوبية العاملية‪.‬‬
‫‪ -4‬موارد وأدوات لغة الشبكات الداللية احلاسوبية العاملية‬
‫العاملية‬
‫احلاسوبية العاملية‬ ‫احلاسوبية‬
‫الداللية‬ ‫الدالليةالشبكات‬
‫الشبكاتاللغوية للغة‬
‫ذكرهلغةعن املكوانت‬
‫وأدوات‬‫مواردإىل ما مت‬
‫‪-4‬ابإلضافة‬
‫اميساحلاسوبية‬
‫الداللية‬ ‫الشبكات‬
‫املتمثلة يف قو‬‫للغةالعاملية و‬ ‫اللغوية‬
‫احلاسوبية‬ ‫املكونات‬
‫الداللية‬ ‫ذكرهلغةعنالشبكات‬‫إىل ملومااردتموأدوات‬
‫باإلضافةاجلزء‬
‫نتعرض يف هذا‬
‫احلاسوبية العاملية‬ ‫الداللية‬
‫‪ )Engines‬واليت‬ ‫الشبكات‬
‫لغوية (‬ ‫وأدوات)‪،‬لغةوُمركات‬
‫‪Formal Rules‬‬ ‫اجلزء (ملوارد‬
‫هذاصورية‬‫نتعرض وقيفواعد‬ ‫(العاملية‬
‫‪،)Dictionaries‬‬
‫شبكةوحمركات‬ ‫‪،)Formal‬‬
‫‪Rules‬يف شكل‬‫ُتثيل( معناها‬
‫صورية‬ ‫وقواعد‬
‫الطبيعية و‬ ‫‪Dictionaries‬من)‪،‬اللغات‬
‫حتليل (النصوص الواردة‬
‫قواميس‬ ‫واملتمثلة يف‬
‫مهمتها يف‬ ‫تتلخص‬
‫من اللغات‬ ‫الواردة‬
‫تتماشى‬ ‫صحيحة‬‫النصوص‬‫حتليلشكل مجلة‬ ‫مهمتها يف‬
‫طبيعية يف‬ ‫تتلخصإىل أي لغة‬ ‫فك والتي‬
‫الشبكة الداللية‬ ‫‪)Engines‬‬
‫العكس‪ ،‬أي‬ ‫لغويةو (‬
‫داللية‬
‫اخل‪ .‬الشبكة الداللية إىل‬ ‫نسيةأي‪...‬فك‬ ‫والعكس‪،‬‬
‫داللية عربية أو فر‬
‫شبكةإجنليزية أو‬
‫شكلكانت‬ ‫معناها يف‬
‫اهلدف سواء‬ ‫اكيب اللغة‬‫ومتثيل‬ ‫معالطبيعية‬
‫مفردات وتر‬
‫اهلدف سواء‬ ‫الشبكاتاللغة‬
‫الداللية‬ ‫وتراكيب‬‫مفردات لغة‬
‫معوارد وأدوات‬ ‫تتامشى‬
‫عمل م‬ ‫صحيحةآللية‬ ‫عنمجلة‬
‫رسم توضيحي‬ ‫شكل‬‫طبيعية‪)4‬يف يعرب‬
‫الشكل (‪-3‬‬ ‫أيولغة‬
‫الخ‪ .‬املكتوب ابللغة الطبيعية ابستخدام موارد‬
‫‪ ...‬النص‬ ‫فرنسية‬
‫بتحليل‬ ‫اتأوالتحليل‬
‫عربية‬ ‫إنجليزية أو‬
‫فتقوم أدو‬ ‫كانت‬
‫احلاسوبية العاملية‪.‬‬
‫الدالليةالشبكات‬ ‫مواردالشبكات‬
‫وأدوات لغة‬ ‫ارد لغة‬
‫آلليةإىل مو‬
‫عمل‬ ‫ابإلضافة‬
‫توضيحي‬‫التحليل)‬
‫وقاموسرسم‬ ‫التحليل‬
‫يعرب عن‬ ‫(‪)4-3‬‬‫والشكل(قواعد‬
‫اللغة املصدر‬
‫الداللية احلاسوبية العاملية‪ .‬فتقوم أدوات التحليل بتحليل النص املكتوب باللغة‬
‫الطبيعية باستخدام موارد اللغة املصدر (قواعد التحليل وقاموس التحليل) باإلضافة‬
‫إىل موارد لغة الشبكات الداللية (قاموس لغة الشبكات الداللية ‪ )UNL‬والذي حيتوي‬

‫‪-106-‬‬
‫(قاموس لغة الشبكات الداللية ‪ )UNL‬والذي حيتوي على الكلمات العاملية وما حتتاجه من‬
‫عىل الكلامت العاملية وما حتتاجه من خصائص ومعلومات خاصة بكل كلمة وكذلك‬
‫خصائص ومعلومات خاصة بكل كلمة وكذلك األنطولوجيا اخلاصة بلغة الشبكات الداللية‬
‫األنطولوجيا اخلاصة بلغة الشبكات الداللية ليخرج النص املكتوب باللغة الطبيعية يف‬
‫ليخرج النص املكتوب ابللغة الطبيعية يف صورة شبكة داللية‪.‬‬
‫صورة شبكة داللية‪.‬‬
‫الشبكات‬ ‫املكتوبة بلغة‬
‫املكتوبة بلغة‬ ‫النصوص‬‫النصوص‬ ‫املتمثل يف‬
‫املتمثل يف‬ ‫الداليل‬
‫الداليل‬ ‫التمثيل‬
‫التمثيل‬ ‫فكفك‬ ‫إبعادة‬
‫بإعادة‬ ‫أدواتالتوليد‬
‫التوليد‬ ‫وتقومأدوات‬
‫وتقوم‬
‫(قاموساعد‬
‫اهلدفالتوليد وقو‬
‫(قاموس‬
‫اهلدفاللغة‬
‫اللغة موارد‬ ‫مطلوبة موارد‬
‫باستخدام‬ ‫طبيعيةابستخدام‬‫مطلوبة‬
‫طبيعيةلغة‬
‫لغةإىل أي‬ ‫الشبكاتإىل أي‬
‫الداللية‬ ‫الداللية‬
‫(قاموساخلاصة‬
‫‪)UNL‬بلغة‬ ‫أيضا‬
‫العاملية) و‬
‫األنطولوجيا‬ ‫التواصل ‪UNL‬‬ ‫موارد لغة‬
‫أيضا (قاموس‬ ‫وكذلك العاملية‬
‫التوليد) التواصل‬
‫وقواعدموارد لغة‬
‫التوليد وكذلك‬
‫التوليد)‬
‫الطبيعية‪.‬يف النهاية اجلملة باللغة الطبيعية‪.‬‬
‫الداللية لتخرج‬ ‫الشبكات‬
‫اجلملة ابللغة‬ ‫بلغةالنهاية‬
‫اخلاصةج يف‬ ‫واألنطولوجيا‬
‫الداللية لتخر‬ ‫الشبكات‬

‫أداة التحليل اليدوي‬


‫(‪)UNL Editor‬‬ ‫النص بلغة‬
‫النص ابللغة‬
‫الطبيعية‬ ‫الشبكات‬
‫أداة التحليل (اآلل (‪)IAN‬‬ ‫الداللية‬

‫أنطولوجيا قاموس التحليل قواعد التحليل‬ ‫قاموس‬ ‫قاموس التوليد قواعد التوليد‬
‫‪UNL‬‬
‫النص ابللغة الطبيعية‬ ‫أداة التوليد اآلل )‪(EUGENE‬‬

‫احلاسوبيةالعاملية‪.‬‬
‫العاملية‪.‬‬ ‫الدالليةاحلاسوبية‬
‫الشبكات الداللية‬
‫لغةالشبكات‬
‫اتلغة‬
‫مواردوارد وأدو‬
‫وأدوات‬ ‫عملعمل م‬
‫آلية‪ :‬آلية‬
‫‪4-:4-3‬‬
‫الشَّكل ‪3‬‬ ‫َّ‬
‫الشكل‬

‫(‪)1()8‬‬‫احلاسوبيةالعاملية‬
‫العاملية‬ ‫الدالليةاحلاسوبية‬
‫الداللية‬ ‫الشبكات‬
‫الشبكات‬ ‫قاموس لغة‬
‫قاموس لغة‬ ‫‪-1.4‬‬‫‪-1.4‬‬
‫لكيلكي‬
‫يعمل‬ ‫معلومات‬ ‫منمن‬
‫معلومات‬ ‫يلزمه‬
‫لغوي مايلزمه‬
‫أليألينظامنظاملغوي ما‬
‫يضخ‬ ‫الذي‬
‫يضخ‬ ‫القلب‬
‫الذي‬ ‫بمثابةالقلب‬
‫القاموسمبثابة‬
‫يح ُيعدعدالقاموس‬
‫يعمل بشكل جيد وفعال لذلك جيب أن تتوافر فيه املواصفات اللغوية التي متكنه من‬
‫أداء هذا الدور‪ .‬وقاموس لغة الشبكات الداللية احلاسوبية العاملية هو حجر الزاوية يف‬
‫عمليتي التحليل والتوليد والذي تتوافر فيه كل املعلومات الالزمة للوصول إىل الشبكة‬
‫(‪ )8‬ملعرفة املزيد عن قاموس لغة الشبكات الداللية احلاسوبية يرجى اتباع هذا الرابط‪:‬‬
‫‪http//:www.unlweb.net/wiki/index.php/Dictionary_Specs‬‬
‫‪ -1‬ملعرفة املزيد عن قاموس لغة الشبكات الداللية احلاسوبية يرجى اتباع هذا الرابط‪:‬‬
‫‪http://www.unlweb.net/wiki/index.php/Dictionary_Specs‬‬

‫‪-107-‬‬
‫الداللية الناجتة عن التحليل الداليل للجملة الطبيعية وكذلك الوصول للجملة الطبيعية‬
‫الناجتة عن التوليد اآليل لتلك الشبكة الداللية حيث أنه حيتوي عىل نوعني رئيسيني من‬
‫املعلومات‪ .‬األول‪ :‬الكلمة يف اللغة الطبيعية وما يقابلها يف لغة الشبكات الداللية‬
‫احلاسوبية العاملية إذ أهنا وسيلة الربط بني كلامت اللغات الطبيعية والكلامت العاملية‪.‬‬
‫والثاين‪ :‬معلومات لغوية تصف السلوك اللغوي لكلامت اللغة الطبيعية‪.‬‬
‫ويوضح الشكل (‪ُ )5-3‬صور َة املدخل القامويس اخلاص بلغة الشبكات الداللية‬
‫احلاسوبية العاملية ومكوناته‪ .‬فتحتوي خانة الـ [‪ ]NLW‬عىل الكلمة باللغة الطبيعية‬
‫وخانة الـ «‪ »UW‬عىل مقابلها يف لغة الشبكات الداللية احلاسوبية العاملية وخانة الـ‬
‫(‪ )ATTR‬عىل جمموعة اخلصائص اللغوية التي توضع مع كل كلمة لوصف سلوكها‬
‫اللغوي‪ .‬أما اخلانة األخرية من القاموس فتحتوي عىل ثالث أنواع من املعلومات‪ :‬أوال‬
‫(‪ )FLG‬وتعرب عن لغة القاموس سواء كانت عربية أو إنجليزية أو غريها من اللغات‬
‫الطبيعية‪ .‬ثانيا (‪ )FRE‬وتعرب عن تكرار ظهور الكلمة داخل اللغة الطبيعية وتفيد يف‬
‫عملية التحليل‪ .‬ثالثا (‪ )PRI‬وتعرب عن أولوية استخدام الكلمة يف اللغة الطبيعية وتفيد‬
‫يف عملية التوليد‪.‬‬
‫;>‪[NLW] {ID} “UW” (ATTR, …) <FLG, FRE, PRI‬‬

‫َّ‬
‫الشكل ‪ :5-3‬الشكل العام ملدخل القاموس اخلاص بلغة الشبكات الداللية احلاسوبية العاملية‪.‬‬

‫ويتيح القاموس إمكانية ختزين كل أنواع الكلامت سواء كانت بسيطة أو مركبة أو كلمة‬
‫متعددة املفاهيم‪ ،‬فعىل سبيل املثال يتيح قاموس لغة الشبكات الداللية احلاسوبية العاملية‬
‫إمكانية ختزين الكلامت البسيطة يف اللغة العربية مثل كلمة «كتاب» أو الكلامت املركبة مثل‬
‫«أخذ يف االعتبار» وكذلك الكلامت متعددة املفاهيم مثل «مجهورية مرص العربية»‪ .‬فيوضع‬
‫بجوار كل كلمة عربية ما يعرب عنها من كلمة عاملية يف خانة الكلمة العاملية‪.‬‬

‫§ §قاموس لغة الشبكات الداللية احلاسوبية العاملية اخلاص باللغة العربية‬


‫يف إطار لغة الشبكات الداللية احلاسوبية العاملية يتم تصميم القاموس العريب بحيث‬
‫يكون املصدر الرئييس للمعلومات التي تتطلبها عمليتي حتليل وتوليد النصوص من وإىل‬
‫العربية إذ أنه وسيلة الربط بني مفردات اللغة العربية ومفردات لغة الشبكات الداللية‬

‫‪-108-‬‬
‫احلاسوبية العاملية والتي متنع حدوث أي لبس أو غموض يف معنى الكلمة العربية فكل‬
‫مدخل يف القاموس يعرب عن مفهوم واحد لكلمة عربية حمددة‪ ،‬وقد تتكرر الكلمة العربية‬
‫(من حيث املبنى) يف أكثر من مدخل لكن معناها يكون خمتلف فيتم متثيل كل معنى من‬
‫تلك املعاين بكود رقمي خمتلف‪ .‬وحيتوي القاموس العريب عىل كل املعلومات اللغوية‬
‫اخلاصة بالكلمة العربية والتي تصف السلوك اللغوي للكلمة رصفيا ونحويا ودالليا يف‬
‫السياقات املختلفة األمر الذي يساعد عىل إمتام عمليتي التوليد والتحليل بنجاح‪ .‬هذه‬
‫اخلصائص اللغوية نوعان؛ النوع األول يصف قسم الكلمة إذا كانت اسم‪ ،‬فعل‪ ،‬صفة‪،‬‬
‫ظرف‪ ،‬أداة‪ ،‬سابقة أو الحقة وغريها من أقسام الكالم‪ ،‬وتركيب الكلمة إذا كانت‬
‫كلمة بسيطة أو مركبة أو مفهوم متعدد الكلامت‪ .‬كام حيتوي عىل بعض من املعلومات‬
‫التي تنقسم إىل‪ :‬معلومات رصفية (مثل األبواب الترصيفية‪ ،‬التجرد‪ ،‬الزيادة‪ ،‬الصحة‪،‬‬
‫االعتالل‪ ،‬التذكري‪ ،‬التأنيث‪ ،‬اإلفراد‪ ،‬التثنية‪ ،‬اجلمع‪...‬إلخ)‪ .‬ومعلومات نحوية (مثل‬
‫الصيغة‪ ،‬الزمان‪ ،‬اللزوم‪ ،‬التعدي‪ ،‬التامم‪ ،‬النقصان‪ ،‬البناء للمعلوم‪ ،‬البناء للمجهول‪...،‬‬
‫إلخ)‪ .‬ومعلومات داللية (مثل اإلدراك‪ ،‬االمتالك‪ ،‬احلركة‪ ،‬الشك‪ ،‬التواصل‪ ،‬التنافس‪،‬‬
‫املشاركة‪ ،‬العاقل‪ ،‬غري العاقل‪ ،‬الوقت‪ ،‬احلالة‪ ،‬العالقة ‪...‬إلخ)‪ .‬عىل سبيل املثال عند‬
‫إدراج الفعل «أعطى» داخل القاموس العريب تتم إضافة املعلومات اللغوية التالية له‪:‬‬
‫فعل مزيد ‪ -‬مترصف ‪ -‬معتل اآلخر ناقص‪ -‬يتبع الباب الترصيفي « َأ ْف َع َل‪ُ -‬ي ْف ِع ُل»‬
‫وهي معلومات رصفية‪ ،‬فعل مايض ‪-‬مبني للمعلوم ‪ -‬متعدي ملفعولني وهي معلومات‬
‫وأخريا أن احتامل ظهوره أعىل من أفعال‬ ‫ً‬ ‫نحوية‪ ،‬وأنه فعل حركي وهي معلومة داللية‪،‬‬
‫أخرى مثل «منح» وهي معلومة إحصائية‪.‬‬
‫أما النوع الثاين من املعلومات اللغوية فيصف سلوك الكلمة يف السياقات والرتاكيب‬
‫املختلفة وينقسم إىل قسمني‪ ،‬القسم األول مسئول عن اشتقاق األشكال الترصيفية‬
‫املختلفة للكلامت العربية‪ .‬فاللغة العربية كام نعرف غنية باالشتقاقات والكلمة الواحدة‬
‫ينتج عنها عدد كبري من الترصيفات املختلفة وف ًقا للسياق الواردة فيه لذلك كان ال‬
‫بد من وضع معلومة ختتص باشتقاق الكلامت تسمى القوالب الرصفية حيث يمكن‬
‫هلذه القوالب أن تتعامل مع كافة الكلامت العربية أ ًّيا كانت فئتها املعجمية (األسامء‪،‬‬
‫األفعال‪ ،‬الصفات‪ ،‬الظروف) وذلك بمراعاة العوامل واملعايري املختلفة التي تؤثر عىل‬
‫كل فئة منها‪ .‬فمثال الفعل «أعطى» فعل مزيد ومتعدي وناقص يتبع امليزان الرصيف‬

‫‪-109-‬‬
‫« َأ ْف َع َل‪ُ -‬ي ْف ِع ُل» وبتطبيق القالب الرصيف اخلاص هبذه النوعية من األفعال يتم توليد‬
‫األشكال الرصفية املختلفة للفعل «أعطى» وهي‪( :‬يعطي ‪ -‬يعطى ‪ -‬أعطيا ‪ -‬يعطيان ‪-‬‬
‫يعطيا ‪ -‬يعطون ‪ -‬يعطوا ‪ -‬تعطني ‪ -‬أعطي ‪ -‬يعطني ‪ -‬أعطينا ‪ -‬نعطي)‪ .‬ونفس احلال‬
‫بالنسبة ألسامء اللغة العربية حيث تتمكن القوالب الرصفية اخلاصة هبا من اشتقاق‬
‫األشكال املختلفة للجموع املنتظمة وغري املنتظمة وتلك التي تعرب عن املثنى فعىل سبيل‬
‫املثال االسم «بريء» تتمكن القوالب الرصفية من اشتقاق األشكال الرصفية املختلفة‬
‫له وهي‪« :‬بريئة ‪ -‬أبرياء ‪ -‬بريئان ‪ -‬بريئني ‪ -‬بريئات ‪ -‬بريئتان ‪ -‬بريئتني»‪ .‬وغريها من‬
‫الكلامت واألشكال املختلفة‪ .‬أما القسم الثاين هلذا النوع من املعلومات فهو مسئول‬
‫عن وصف السلوك النحوي للكلمة وحتديد عدد ونوع املتعلقات النحوية الالزمة‬
‫لتلك الكلمة (‪ .)Subcategorization Frame‬و ُيطلق عليه القالب النحوي الذي‬
‫حيدد مواصفات السياق الذي يستخدم فيه الفعل‪ .‬فعىل سبيل املثال الفعل «أعطى»‬
‫توضع بجواره معلومات تدل عىل عدد ونوع املتعلقات النحوية اخلاصة به وهي عبارة‬
‫عن ثالث متعلقات نحويــة‪( :‬خمصـــص الفــــعل (‪ )Verb Specifier (VS‬و‬
‫(املتــمــم األول للفعــل (‪ )Verb Complement (VC‬و (املتمم الثاين للفعل (‪Verb‬‬
‫‪ )Complement (VC‬والتي تظهر واضحة من خالل مجلة «اإلسالم أعطى للمرأة‬
‫حقوقها كاملة» فمخصص الفعل (‪ )VS‬وهو عبارة عن املركب االسمي (اإلسالم)‬
‫واملتمم األول للفعل (‪ )VC‬وهو عبارة عن املركب االسمي (حقوقها) واملتمم الثاين‬
‫للفعل (‪ )VC‬وهو عبارة عن شبه مجلة تبدأ بحرف اجلر «ل» متبوع باملركب االسمي‬
‫مثال لشكل مداخل القاموس العريب للفعل «أعطى»‪.‬‬ ‫«املرأة»‪ .‬ويوضح الشكل (‪ً )6-3‬‬
‫;>‪{} »200878876» (V,CMV,VER,WRD,TST2,Y18, M222)<ar,0,2‬‬

‫َّ‬
‫الشكل ‪ :6-3‬أحد مداخل القاموس العريب للغة الشبكات الداللية احلاسوبية العاملية‪.‬‬

‫ويوضح الشكل (‪ُ )6-3‬صور َة الفعل «أعطي» داخل القاموس العريب واملعلومات‬
‫اللغوية املخزنة بجانبه مثل ‪ CMV‬وهي تعرب عن التصنيف الداليل للفعل وهو فعل‬
‫تواصل (‪ )communication verb‬وتركيب الفعل ‪ WRD‬وهو فعل بسيط‪ ،‬و ‪TST2‬‬
‫ٍ‬
‫متعد ملفعولني‪ ،‬و ‪ Y18‬وهي املعلومة‬ ‫وتعني أن الفعل «أعطي» له فاعل وكذلك‬
‫اخلاصة بالسلوك النحوي للفعل داخل اللغة العربية والتي حتدد أن الفعل «أعطى» له‬

‫‪-110-‬‬
‫ثالثة متعلقات داللية‪ M222 ،‬وتعرب عن السلوك االشتقاقي للفعل «أعطى» وتسمح‬
‫باشتقاق مجيع األشكال املطلوبة هلذا الفعل‪.‬‬

‫‪ -2.4‬التحليل اآليل باستخدام لغة الشبكات الداللية احلاسوبية العاملية‬


‫إن عملية التحليل اآليل باستخدام لغة الشبكات الداللية احلاسوبية العاملية جعلت‬
‫ويرسا إذ أهنا تقوم بتمثيل كل ما يمكن أن‬ ‫ً‬ ‫التعامل مع اجلملة الطبيعية أكثر سهولة‬
‫حتتويه اجلملة الطبيعية من معلومات رصفية ونحوية وداللية وبرمجاتية يف شكل شبكة‬
‫داللية توضح املعنى الدقيق لكل كلمة يف اجلملة الواردة وماهية العالقات الداللية التي‬
‫تربط كلامت اجلملة بعضها بعضا عن طريق استخدام مفردات لغة الشبكات الداللية‬
‫(‪ )Universal Words‬وربطها بعالقات داللية (‪ ،)Semantic Relations‬ثم تستعني‬
‫بالسامت (‪ )Attributes‬إلضافة املعلومات التي مل يتم التعبري عنها سواء باملفردات أو‬
‫العالقات الداللية‪ .‬وتتم عملية التحليل اآليل عن طريق املحلل التفاعيل (‪Interactive‬‬
‫‪ )1()Analyzer- IAN‬والتي تستخدم موارد لغة الشبكات الداللية احلاسوبية العاملية‬
‫متمثل ًة يف القاموس الذي أرشنا إليه يف اجلزء اخلاص بقاموس لغة الشبكات الداللية‬
‫احلاسوبية العاملية وقواعد التحليل اخلاصة بلغة الشبكات الداللية احلاسوبية العاملية‬
‫والتي تشتمل عىل ستة مراحل تبدأ باملرحلة األوىل وهي حتليل اجلملة الطبيعية للتعرف‬
‫عىل معاين املفردات من خالل القاموس تليها املرحلة الثانية وهي التحليل الرصيف‬
‫لكلامت اجلملة الطبيعية وحتديد السامت اخلاصة بكل كلمة‪ .‬ثم املرحلة الثالثة وهي بناء‬
‫العالقات النحوية بني كلامت اجلملة الطبيعية يف شكل شجرة نحوية يف إطار علم اللغة‬
‫احلديث‪ .‬ثم املرحلة الرابعة وهي االنتقال من البنية السطحية للشجرة النحوية إىل البنية‬
‫وأخريا‬
‫ً‬ ‫العميقة‪ .‬ثم املرحلة اخلامسة وهي حتويل الشجرة النحوية إىل شبكة داللية‪.‬‬
‫املرحلة السادسة وهي تنقيح الشبكة الداللية بعد معاجلتها آليا‪.‬‬

‫‪ُ -1‬يمكن استخدام أداة التحليل اآليل للغة الشبكات الداللية احلاسوبية عن طريق هذا الرابط‪:‬‬
‫‪http://dev.undlfoundation.org/analysis/index.jsp‬‬

‫‪-111-‬‬
‫§ §التحليل اآليل للجملة العربية باستخدام لغة الشبكات الداللية احلاسوبية العاملية‬
‫نتعرض يف هذا اجلزء بالتوضيح ملراحل التحليل اآليل الست للغة الشبكات الداللية‬
‫احلاسوبية العاملية من خالل تطبيقها عىل اجلملة العربية رقم (‪ )5‬وحتى نصل إىل الشبكة‬
‫الداللية وهي اهلدف من هذه العملية‪.‬‬
‫(‪)٥‬‬ ‫بدأت مجيع الدول تعتمد عىل اإلداريني املتدربني‬

‫Ÿ Ÿالتعرف عىل معاين املفردات من خالل القاموس‬


‫يبدأ التحليل اآليل بمرحلة التعرف عىل املفردات العربية واستبداهلا باملفاهيم العاملية‬
‫حيث متر اجلملة عىل قاموس لغة الشبكات الداللية إلجياد املعنى املقابل لكل كلمة يف‬
‫اجلملة كام يظهر يف الشكل (‪.)7-3‬‬
‫;>‪" (N, PLR) <ara,125,1‬دول]{}" ‪[108168978‬‬
‫;>‪" (V, ICP,FEM,SNG,3PS,PAS) <ara,46,2‬بدأت]{}" ‪[202379528‬‬
‫;>‪" (V, MCL,SNG,NOM,2PS,PRS) <ara,46,2‬تعتمد عىل]{}" ‪[202664017‬‬
‫;>‪" (N, PLR) <ara,3,1‬إداريني]{}" ‪[110069645‬‬
‫;>‪" (J, ADJ) <ara,0,0‬متدرب]{}" ‪[301911683‬‬

‫َّ‬
‫الشكل ‪ :7-3‬ناتج مرحلة التعرف عىل معاين املفردات‪.‬‬

‫وبالتايل تتحول املفردة العربية إىل مفهوم من مفاهيم لغة الشبكات الداللية احلاسوبية‬
‫العاملية كام يف الشكل (‪ )8-3‬والذي نالحظ منه أن بعض مفردات اجلملة مل تُستبدل‬
‫مثل كلمة «مجيع» وأدوات التعريف «ال» وذلك ألهنا ليست ُمدرجة بالقاموس اخلاص‬
‫باللغة العربية والتعامل معها يتم بمراحل الحقة وليس بتلك املرحلة‪.‬‬
‫مجيع ال‪ 202664017 202379528 108168978‬ال‪ 110069645‬ال‪301911683‬‬

‫َّ‬
‫الشكل ‪ :8-3‬شكل اجلملة العربية بعد مرورها بمرحلة التعرف عىل املفردات العربية‪.‬‬

‫Ÿ Ÿالتحليل الرصيف ووسم الكلامت‬


‫تبدأ القواعد اللغوية يف هذه املرحلة بالتحليل الرصيف للسوابق واللواحق املتصلة‬
‫ببعض الكلامت والتي قد يتم حذف بعضها واستبداهلا بالسامت التي تعرب عن معناها‪.‬‬
‫وبالنسبة للجملة (‪ )5‬يتم التحليل الرصيف كام ييل‪ :‬مجيع الكلامت التي حتمل الصفة‬

‫‪-112-‬‬
‫«‪ »PLR‬الدالة عىل اجلمع واملستمدة من القاموس يتم وسمها باخلاصية (‪ )@pl‬املعربة‬
‫عن اجلمع‪ .‬والكلامت التي يتصل هبا السابق «ال» يتم وسمها باخلاصية (‪ )@def‬الدالة‬
‫عىل التعريف‪ .‬أما األفعال التي حتمل صفة املضارعة «‪ »PRS‬يتم وسمها باخلاصية‬
‫(‪ .)@present‬ويوجد يف تلك املرحلة نوع آخر من الكلامت يتم استبداهلا بسامت لغوية‬
‫مثل الفعل «بدأت» والذي لديه يف القاموس الصفة الداللية «‪ »ICP‬الدالة عىل بدء‬
‫حدث آخر يف اجلملة‪ ،‬ف ُيحذف هذا الفعل وحتل حمله اخلاصية (‪ )@inceptive‬والتي‬
‫توضع عىل الفعل الذي يليه وهو (تعتمد)‪ .‬وكذلك كلمة «مجيع» الدالة عىل الكلية‬
‫تُستبدل بالسمة (‪ )@all‬وتوضع عىل الكلمة التي تليها وهي «دول» فيكون الشكل‬
‫الناتج عن تلك املرحلة كام يف الشكل (‪:)9-3‬‬
‫‪108168978.@pl.@all.@def 202664017 @inceptiv. @present.‬‬
‫‪110069645@pl.@def.301911683‬‬

‫َّ‬
‫الشكل ‪ :9-3‬ناتج مرحلة التحليل الرصيف ووسم الكلامت‪.‬‬

‫Ÿ Ÿبناء العالقات النحوية بني الكلامت (البنية السطحية للجملة)‬


‫يف هذه املرحلة يتم حتويل اجلملة العربية املحللة رصفيا إىل شجرة نحوية تُعرب عن البنية‬
‫السطحية للجملة طب ًقا لنظرية (‪ )X-Bar‬والتي تعرض هلا الباب اخلامس من هذا الكتاب‬
‫بمزيد من اإليضاح‪ .‬فبالنسبة للجملة العربية رقم (‪ )5‬نقوم بتطبيق العمليات التالية عليها‪:‬‬
‫ ‪-‬االسم «إداريني» ذو اخلاصية (‪ )N‬يتم ربطه بالصفة «متدربني» ذات اخلاصية‬
‫(‪ )J‬ومن ثم يتم بناء املركب االسمي الوسيط ((‪ .)N-Bar (NB‬وألن «إداريني»‬
‫موسومة بالسمة (‪ - )@def‬أي أن أداة التعريف التي تعوض عنها تلك السمة‬
‫تُعد بمثابة خمصص اسمي ((‪ )Noun Specifier (NS‬لالسم «إداريني» ‪ -‬يتم‬
‫حتويل املركب االسمي الوسيط (‪ )NB‬إىل املركب االسمي النهائي ((‪Noun‬‬
‫‪ )Phrase (NP‬كام هو واضح يف الشكل (‪.)10-3‬‬
‫ ‪-‬يتم ربط املركب االسمي النهائي «إداريني متدربيني» (‪ )NP‬الذي تم بناؤه مع‬
‫الفعل «تعتمد عىل» –حيث أن «إداريني متدربني» بمثابة املفعول به بالنسبة‬
‫للفعل «تعتمد عىل» واملتممة له ((‪ - )Verb Complement (VC‬لينشأ املركب‬
‫الفعيل الوسيط ((‪ )V-Bar (VB‬كام هو واضح يف الشكل (‪.)11-3‬‬

‫‪-113-‬‬
‫«تعتمد على» –حيث أن «إداريني متدربني» مبثابة املفعول به ابلنسبة للفعل «تعتمد‬
‫على» واملتممة له ((‪ - )Verb Complement )VC‬لينشأ املركب الفعلي الوسيط‬
‫((‪ )V-Bar )VB‬كما هو واضح يف الشكل (‪.)11-3‬‬

‫متدربني‬ ‫إداريني‬ ‫تعتمد على‬ ‫متدربني‬ ‫إداريني‬


‫‪J‬‬ ‫‪N‬‬ ‫‪V‬‬
‫‪J‬‬ ‫‪N‬‬
‫‪NB‬‬
‫‪NB‬‬
‫‪NP‬‬

‫‪VB‬‬ ‫‪NP‬‬
‫الشكل ‪ :11-3‬مركب فعيل وسيط‪.‬‬ ‫ ‬ ‫الشكل ‪ :10-3‬مركب اسمي هنائي‪.‬‬
‫الشكل ‪ :11-3‬مركب فعلي وسيط‪.‬‬ ‫هنائي‪.‬‬ ‫الشكل ‪ :10-3‬مركب امسي‬
‫‪)NB)(NB‬‬
‫موسوم‬ ‫وسيط‬‫وسيط (‬‫امسياسمي‬
‫مركب‬‫والذيهوهومركب‬
‫«دول»‪N)(N‬و)الذي‬
‫االسمدول» (‬ ‫حتويل‬
‫االسم «‬ ‫ذلكيتميتمحتويل‬
‫بعدبعدذلك‬
‫‪- -‬‬
‫مبثابةالسمة‬
‫عنهاعدتلك‬ ‫موسوم بالسمة (‪ - )@def‬أي أن أداة التعريف التي تعوض‬
‫ابلسمة (‪ - )@def‬أي أن أداة التعريف اليت تعوض عنها تلك السمة تح‬
‫اضحهنائي‬
‫اسمي‬‫مركبهو و‬ ‫هنائي– (إىل‬
‫‪ )NP‬كما‬ ‫«دول»‬
‫لالسم امسي‬ ‫‪)NS‬‬
‫إىل مركب‬ ‫اسمي»( –‬ ‫خمصص‬
‫لالسم «دول‬ ‫بمثابة‪)NS‬‬
‫ُعدامسي (‬‫ت‬
‫خمصص‬
‫هو)‪.‬واضح يف الشكل (‪.)12-3‬‬ ‫‪3()NP‬كام‪12-‬‬ ‫يف (‬
‫الشكل‬
‫قبلبناؤه‬
‫ذي تم‬ ‫‪ )NP‬ا َّل‬
‫بناؤه من‬ ‫ذي( مت‬
‫‪»@def‬‬
‫«دول‪ )NP‬الَّ‬
‫النهائي@» (‬
‫االسميدول ‪def‬‬
‫املركبالنهائي «‬
‫ربط االمسي‬
‫وأخريرا‪،‬بطيتماملركب‬ ‫ ‪-‬‬
‫أخريا‪ ،‬يتم ً‬
‫‪ -‬و ً‬
‫‪verb‬الفعيل‬
‫واملخصص‬
‫الفعلي له (‬ ‫املخصصعىل)‬
‫للفعلو(تعتمد‬
‫بالنسبة على)‬
‫الفاعل (تعتمد‬ ‫والذي يمثل‬
‫ابلنسبة للفعل‬ ‫ُيثل‪-‬الفاعل‬‫الذيقبل‬‫‪ -‬و من‬
‫إداريني‬
‫عىلبني»‬
‫«تعتمدمتدر‬‫الوسيطإداريني‬ ‫الفعيل‬
‫تعتمد على‬ ‫الفعلي املركب‬
‫الوسيط «‬ ‫كب) ‪ -‬مع‬ ‫‪verb‬‬‫‪ Specifier‬املر‬ ‫‪ VS‬له (‪- VS‬‬
‫‪ - )Specifier-‬مع‬
‫‪)Verb-Phrase‬‬
‫‪– )VP‬كما هو واضح‬ ‫الفعيل النهائي (‬
‫‪Verb-Phrase‬‬ ‫‪– VP‬‬‫الرتكيب‬
‫لبناءالنهائي (‬ ‫وذلك‬
‫الفعلي‬ ‫الرت)كيب‬ ‫متدربني» (‬
‫لبناء‪VB‬‬ ‫(‪ )VB‬وذلك‬
‫واضح)‪.‬يف الشكل (‪.)13-3‬‬ ‫الشكلهو(‪13-3‬‬ ‫يف كام‬
‫متدربني‬ ‫إداريني‬ ‫تعتمد على‬ ‫دول‬ ‫دول‬
‫‪J‬‬ ‫‪N‬‬ ‫‪V‬‬ ‫‪N‬‬
‫‪N‬‬
‫‪NB‬‬ ‫‪NB‬‬

‫‪NP‬‬ ‫‪NB‬‬
‫‪NP‬‬
‫‪V‬‬
‫‪B‬‬ ‫‪NP‬‬
‫‪VP‬‬
‫مركب‪ .‬فعيل هنائي‪.‬‬ ‫‪:13-3‬‬
‫فعلي هنائي‬ ‫كلمركب‬ ‫اسمي هنائي‪ .‬الشَّكل ‪َّ -3‬‬
‫الش‪:13‬‬ ‫مركب‬
‫هنائي‪.‬‬ ‫‪ :12-3‬امسي‬ ‫الشَّكل َّ‪3‬‬
‫الش‪-‬كل‬
‫‪ :12‬مركب‬
‫• االنتقال من البنية السطحية للشجرة النحوية إىل البنية العميقة‬
‫يف هذه املرحلة يتم فك الشجرة النحوية اليت مت تكوينها يف املرحلة السابقة لفروع ثنائية‬
‫‪-114-‬‬
‫حنوية أكثر تعقيدا على النحو التايل‪:‬‬
‫§ §االنتقال من البنية السطحية للشجرة النحوية إىل البنية العميقة‬
‫يف هذه املرحلة يتم فك الشجرة النحوية التي تم تكوينها يف املرحلة السابقة لفروع‬
‫ثنائية نحوية أكثر تعقيدا عىل النحو التايل‪:‬‬
‫ ‪-‬فك الرتكيب الفعيل النهائي (‪ )VP‬إىل مركب فعيل وسيط (‪ )VB‬وبناء عالقة‬
‫خمصص فعيل (‪ )VS‬بني الفعل «يعتمد عىل» واالسم «دول» كام هو واضح يف‬
‫الشكل (‪.)14-3‬‬

‫الشكل ‪ :14-3‬بناء املخصص الفعيل (‪.)VS‬‬


‫َّ‬

‫ ‪-‬يتم حتويل املركب الفعيل الوسيط (‪ )VB‬إىل العالقة النحوية متمم فعيل (‪)VC‬‬
‫بني الفعل «يعتمد عىل» واالسم «إداريني» كام هو واضح يف الشكل (‪.)15-3‬‬

‫َّ‬
‫الشكل ‪ :15-3‬بناء املتمم الفعيل (‪.)VC‬‬

‫‪-115-‬‬
‫وأخريا يتم حتويل املركب االسمي النهائي (‪ )NP‬بني االسم «إداريني» والصفة‬
‫ً‬ ‫ ‪-‬‬
‫«متدربني» إىل العالقة النحوية ملحق اسمي ((‪ )Noun Adjunct (NA‬كام هو‬
‫واضح يف الشكل (‪.)16-3‬‬

‫َّ‬
‫الشكل ‪ :16-3‬بناء امللحق االسمي (‪.)NA‬‬

‫Ÿ Ÿاملرحلة اخلامسة‪ :‬حتويل الشجرة النحوية إىل شبكة داللية للجملة العربية‬
‫يف هذه املرحلة يتم حتويل الشجرة النحوية إىل شبكة داللية معربة عن حمتوى اجلملة‬
‫العربية‪ ،‬حيث يتم حتويل (امللحق االسمي ‪ )NA‬إىل عالقة (الوصفية الداللية ‪.)aoj‬‬
‫وأخريا حتويل (املخصص‬
‫ً‬ ‫وحتويل (املتمم الفعيل ‪ )VC‬إىل عالقة (املفعولية الداللية ‪.)obj‬‬
‫الفعيل ‪ )VS‬إىل عالقة (الفاعلية الداللية ‪ )agt‬كام موضح يف الشكل (‪.)17-3‬‬

‫َّ‬
‫الشكل ‪ :17-3‬حتويل العالقات النحوية إىل عالقات داللية‪.‬‬

‫‪-116-‬‬
‫Ÿ Ÿتعديل الشبكة الداللية‬
‫هي مرحلة يتم فيها تعديل الشبكة الداللية الناجتة عن املراحل السابقة من حيث‬
‫دمج عالقة أو تقسيمها أو إضافة أخرى‪ ...‬إلخ لكنها مرحلة اختيارية لسنا بحاجة‬
‫إليها يف هذه اجلملة‪ .‬لكن ربام تكون ذات أمهية يف حاالت أخرى‪ .‬بالتايل وبعد املرور‬
‫باملراحل السابقة مجيعها تصبح اجلملة العربية ممثلة دالليا كام يف الشكل (‪.)18-3‬‬
‫}‪{org‬‬
‫بدأت مجيع الدول تعتمد عىل اإلداريني املتدربني‬
‫}‪{/org‬‬
‫}‪{unl‬‬
‫)‪agt(202664017:14.@entry.@inceptive.@present,108168978:45.@all.@def‬‬
‫)‪obj(202664017:14.@entry.@inceptive.@present,110069645:93.@pl.@def‬‬
‫)‪aoj(301911683:99,110069645:93.@pl.@def‬‬
‫}‪{/unl‬‬
‫]‪[/S‬‬

‫َّ‬
‫الشكل ‪ :18-3‬ناتج أداة التحليل اآليل جلملة عربية‪.‬‬
‫وهذا التمثيل الداليل يمكن التعبري عنه يف شكل شبكة داللية سهلة القراءة كام يف‬
‫الشكل (‪:)19-3‬‬

‫َّ‬
‫الشكل ‪ :19-3‬شبكة داللية جلملة عربية‪.‬‬

‫‪-117-‬‬
‫‪ -3.4‬التوليد اآليل باستخدام لغة الشبكات الداللية احلاسوبية العاملية‬
‫حتدثنا يف اجلزء السابق عن التحليل اآليل للجملة الطبيعية وانتهينا بتمثيل مجلة عربية‬
‫يف شكل شبكة داللية ترتبط مفرداهتا بعالقات داللية‪ .‬وسنقوم يف هذا اجلزء بتوضيح‬
‫كيفية توليد الشبكة الداللية يف شكل مجلة طبيعية واضحة املعنى ومتكاملة األركان‬
‫وف ًقا لقواعد كل لغة‪ .‬ولكن ال بد يف البداية من توضيح مفهوم التوليد اآليل للجملة‬
‫الطبيعية‪.‬‬

‫§ §التوليد اآليل للجملة الطبيعية‬


‫هو القدرة عىل بناء جمموعة غري متناهية من اجلمل الصحيحة بلغة طبيعية من متثيل‬
‫آيل وهيتم التوليد اآليل باجلملة من ثالث جوانب‪:‬‬
‫Ÿ Ÿجانب املعنى‪ :‬حيث جيب أن تتسم اجلملة املو ّلدة آل ًّيا بوضوح املعنى وسهولة‬
‫الفهم واخل ّلو من اللبس‪ ،‬والتعبري بشكل سليم عن املعنى املراد دون انحراف‬
‫أو إخالل به بد ًء من االختيار السليم ملفردات اجلملة وانتها ًء بتجنب الرتاكيب‬
‫ربز التداخل بني الرتكيب واملعنى‪.‬‬ ‫التي قد تتسبب يف اللبس الداليل وهنا ي ُ‬
‫Ÿ Ÿجانب الرتكيب النحوي‪ :‬والذي هيتم باختيار الرتكيب املناسب للجملة املولدة‬
‫ٍ‬
‫حينئذ حتديد‬ ‫هل هو تركيب فعيل أم اسمي أم غري ذلك؟ إن كان فعيل فيجب‬
‫القالب الذي ستصاغ فيه اجلملة املو ّلدة آل ًّيا إن كان يف شكل (فعل‪-‬فاعل‪-‬‬
‫مفعول) أم (فاعل‪-‬فعل‪-‬مفعول) وهكذا‪ .‬وإن كان اسمي فيجب حتديد كيف‬
‫يكون الرتتيب بني الكلامت وبعضها داخل اجلملة من تقديم لكلمة عىل أخرى‬
‫أو تأخري كلامت بعينها وغري ذلك من العمليات النحوية من حذف وإضامر‬
‫وغريها‪.‬‬
‫Ÿ Ÿجانب الرصف‪ :‬وهذا اجلانب يعنى بكل كلمة داخل اجلملة من الناحية‬
‫املورفولوجية وتوليدها بام يتناسب مع سياق اجلملة والكلامت املجاورة هلا‬
‫فيهتم بحاالت املطابقة بني الفعل والفاعل والصفة واملوصوف‪ ،‬وترصيف‬
‫األفعال واألسامء‪ ،‬والعالمات اإلعرابية للكلامت طب ًقا ملوقعها داخل‬
‫اجلملة‪ ،‬وهنا يربز التداخل بني الرتكيب والرصف‪ .‬وغري ذلك من العمليات‬

‫‪-118-‬‬
‫املورفولوجية املختلفة‪ .‬لذلك ُيعدّ التوليد اآليل أحد املجاالت املتقدمة يف‬
‫املعاجلة اآللية للنصوص ملا يشتمل عليه من عمليات ُمعقدة جتمع بني الرتكيب‬
‫النحوي والصياغة الداللية للجملة والشكل املورفولوجي للكلامت‪.‬‬
‫ويف إطار لغة الشبكات الداللية احلاسوبية العاملية تُستخدم أداة التوليد اآليل‬
‫والتي ُيطلق عليها ((‪ )EUGENE)1‬لتوليد النصوص الطبيعية آليا من أية شبكة‬
‫داللية باستخدام موارد اللغة املراد توليدها من قواميس وقواعد توليد والتي تشتمل‬
‫عىل ستة مراحل تبدأ باملرحلة األوىل وهي حتديد الكلمة املناسبة لسياق اجلملة تليها‬
‫املرحلة الثانية وهي تعديل الشبكة الداللية الناجتة عن عملية التحليل بام يتناسب مع‬
‫اللغة اهلدف ثم املرحلة الثالثة والتي يتم فيها استبدال العالقات الداللية بني الكلامت‬
‫بعالقات نحوية تعرب عن الدور النحوي لكل كلمة داخل اجلملة لتمثيل البنية العميقة‬
‫للجملة‪ .‬ثم املرحلة الرابعة والتي يتم فيها استخالص الشجرة النحوية السطحية من‬
‫البنية العميقة للجملة تليها املرحلة اخلامسة حيث خيضع هذا الشكل الشجري للعديد‬
‫وأخريا املرحلة‬
‫ً‬ ‫من عمليات التحويل والتغيري ليصبح يف شكل قائمة أفقية من الكلامت‪.‬‬
‫السادسة التي تعنى بتنقيح القائمة األفقية لتوليد الكلامت يف الشكل املورفولوجي‬
‫املناسب للسياق طب ًقا لقواعد كل لغة طبيعية لتتولد يف النهاية اجلملة الطبيعية التي‬
‫كانت ممثلة يف شكل شبكة داللية‪.‬‬

‫§ §التوليد اآليل للجملة العربية باستخدام لغة الشبكات الداللية احلاسوبية العاملية‬
‫فيام ييل عرض تفصييل ملراحل التوليد اآليل جلملة عربية من الشبكة الداللية‬
‫املوجودة يف الشكل (‪ )20-3‬والتي تتكون من ثالث عالقات داللية تربط بني الفعل‬
‫وفاعله الداليل (‪ -)agt‬الفعل ومفعوله الداليل (‪ - )obj‬الفعل وحاله (‪.)man‬‬

‫‪-1‬هذا الرمز اختصار لـ (‪ )dEep-to-sUrface GENErator‬و ُيمكن استخدام أداة التوليد اآليل عن طريق هذا الرابط‪:‬‬
‫‪.http://dev.undlfoundation.org/generation/index.jsp‬‬

‫‪-119-‬‬
‫}‪{unl‬‬
‫)‪agt(201168468:0M.@present.@entry,110285313:00.@def‬‬
‫)‪obj(201168468:0M.@present.@entry,107739125:02.@def‬‬
‫)‪man(201168468:0M.@present.@entry,400105603:06‬‬
‫}‪{/unl‬‬

‫َّ‬
‫الشكل ‪ :20-3‬شبكة داللية‪.‬‬

‫Ÿ Ÿحتديد الكلمة املناسبة لسياق اجلملة‪ :‬حتويل املفاهيم إىل كلامت‬


‫أوىل مراحل التوليد اآليل هي مرحلة حتويل املفاهيم املوجودة داخل الشبكة الداللية‬
‫إىل كلامت عربية تناسب سياق ومعنى اجلملة لتصبح الشبكة الداللية بعد االنتهاء من‬
‫تلك املرحلة كام نراها يف الشكل (‪.)21-3‬‬
‫)‪.@def‬ولد"‪M.@entry.@present, "00:‬أكل"‪agt("0:‬‬
‫)‪.@def‬تفاحة"‪M.@entry.@present, "02:‬أكل"‪obj("0:‬‬
‫)برسعة"‪M.@entry.@present, "06:‬أكل"‪man("0:‬‬

‫َّ‬
‫الشكل ‪ :21-3‬الشبكة الداللية بعد حتويل املفاهيم العاملية إىل كلامت عربية‪.‬‬

‫Ÿ Ÿتعديل الشبكة الداللية بام يتناسب مع متطلبات توليد اجلملة العربية‬


‫تتيح قواعد التوليد اآليل لنظام لغة الشبكات الداللية إمكانية تعديل الشبكة‬
‫الداللية الناجتة عن التحليل الداليل بام يتناسب مع متطلبات كل لغة طبيعية لكنها‬
‫مرحلة اختيارية قد نحتاج إليها وقد ال نحتاج إليها تب ًعا لطبيعة الشبكة الداللية الناجتة‪.‬‬
‫وعدم املرور بتلك املرحلة ال ُيعد إخالالً بخطوات توليد اجلملة‪ .‬والشبكة الداللية‬
‫التي معنا ليست بحاجة إىل تعديل لذلك سيتم االستغناء عن تلك املرحلة يف هذا املثال‪.‬‬

‫Ÿ Ÿحتويل العالقات الداللية إىل عالقات نحوية‬


‫باستخدام قواعد تلك املرحلة يتم حتويل الشبكة الداللية إىل شبكة نحوية‬
‫باستبدال العالقات الداللية بني الكلامت بعالقات نحوية‪ .‬وبالنسبة للشبكة الداللية‬
‫املوجودة يف الشكل (‪ )21-3‬تتحول عالقة الفاعل الداليل (‪ )agt‬إىل العالقة النحوية‬
‫خمصص فعيل ((‪ )Verb Specifier (VS‬وتتحول عالقة املفعول الداليل (‪ )obj‬إىل‬
‫وأخريا تتحول عالقة‬
‫ً‬ ‫العالقة النحوية متمم فعيل ((‪،)Verb Complement (VC‬‬

‫‪-120-‬‬
‫احلال الداليل (‪ )man‬إىل العالقة النحوية ملحق فعيل ((‪ )Verb Adjunct (VA‬أي‬
‫حال الفعل‪ .‬كام يظهر يف الشكل (‪.)22-3‬‬
‫)‪.@def‬ولد"‪M.@entry.@present, "00:‬أكل"‪VS("0:‬‬
‫)‪.@def‬تفاحة"‪M.@entry.@present, "02:‬أكل"‪VC("0:‬‬
‫)برسعة"‪M.@entry.@present, "06:‬أكل"‪VA("0:‬‬

‫َّ‬
‫الشكل ‪ :22-3‬الشبكة النحوية الناجتة عن املرحلة الثانية للتوليد‪.‬‬

‫Ÿ Ÿبناء الشجرة النحوية‪ :‬من البنية العميقة إىل البنية السطحية للجملة‬
‫بعد حتويل العالقات الداللية (الشبكة الداللية) إىل عالقات نحوية (الشبكة‬
‫النحوية) يتم متثيل تلك العالقات النحوية يف شكل شجري اعتامدا عىل نظرية ‪X-Bar‬‬
‫النحوية ولكي نصل إىل هذا الشكل الشجري ال بد من املرور بمراحل عدة يف االنتقال‬
‫باجلملة من البنية العميقة إىل البنية السطحية‪ .‬فالعالقات املوجودة داخل الشبكة‬
‫النحوية الناجتة عن املرحلة السابقة عبارة عن عالقات ثنائية بني الكلامت ولكي نصل‬
‫إىل الشكل الشجري ال بد من ربط تلك األفرع الثنائية لتتكون الشجرة النحوية تدرجي ًّيا‪.‬‬
‫ومن خالل الشبكة النحوية الناجتة عن املرحلة السابقة واملوجودة يف الشكل (‪)21-3‬‬
‫يتضح أن لدينا شبكة نحوية تتكون من خمصص فعيل (‪ )VS‬ومتمم فعيل (‪ )VC‬وملحق‬
‫فعيل (‪ .)VA‬فنبدأ عن طريق العالقة النحوية (‪ )VS‬ببناء فرع املخصص الفعيل الذي‬
‫هو عبارة عن االسم «ولد» املوسوم بالسمة ‪ - @def‬أي أنه ُمعرف باأللف والالم –‬
‫وبالتايل يكون فرع املخصص الفعيل عبارة عن مركب اسمي هنائي (‪ )NP‬كام يف الشكل‬
‫(‪ .)23-3‬ثم عن طريق العالقة النحوية (‪ )VC‬نبني فرع املركب الفعيل الوسيط (‪)VB‬‬
‫أيضا عبارة عن االسم‬ ‫هذا الفرع جيمع بني الفعل «أكل» ومتممه «التفاحة» ‪ -‬الذي هو ً‬
‫«تفاحة» موسومة بالسمة (‪ )@def‬أي أن املتمم «تفاحة» عبارة عن مركب اسمي هنائي‬
‫وأخريا بناء‬
‫ً‬ ‫(‪ - )NP‬ليصبح فرع املركب الفعيل الوسيط كام نراه يف الشكل (‪.)24-3‬‬
‫فرع امللحق الفعيل ((‪ )A-Bar (AB‬الذي هو عبارة عن احلال ‪«0‬برسعة» كام يف الشكل‬
‫(‪.)25-3‬‬

‫‪-121-‬‬
‫َّ‬
‫الشكل ‪ :25-3‬امللحق الفعيل‪.‬‬ ‫َّ‬
‫الشكل ‪ :24-3‬املركب الفعيل الوسيط‪.‬‬ ‫َّ‬
‫الشكل ‪ :23-3‬املخصص الفعيل‪.‬‬

‫الزلنا يف مرحلة بناء الشبكة النحوية؛ بعد بناء األفرع بشكل منفرد تبدأ مرحلة‬
‫مجع تلك األفرع املنفردة لتكتمل الشجرة النحوية‪ .‬فنجمع فرع املركّب الفعيل الوسيط‬
‫(‪ )VB‬مع فرع امللحق الفعيل (‪ )AB‬وننتقل هبم ملستوى أعىل يف الشجرة النحوية وهو‬
‫مستوى املركب الفعيل الوسيط الثاين (‪ )VB‬كام يظهر يف الشكل (‪ .)26-3‬ثم نجمع‬
‫فرع املركب الفعيل الوسيط الثاين (‪ )VB‬الناتج عن اخلطوة السابقة مع فرع املخصص‬
‫الفعيل (‪ )NP‬املوجود يف الشكل (‪ )23-3‬لنصل إىل رأس الشجرة النحوية الرتكيب‬
‫الفعيل النهائي (‪ )VP‬كام تظهر لنا يف الشكل (‪ )27-3‬وبذلك تكون قد اكتملت‬
‫الشجرة النحوية وهي اهلدف من هذه املرحلة‪.‬‬

‫َّ‬
‫الشكل ‪ :27-3‬الشجرة النحوية مكتملة‪.‬‬ ‫َّ‬
‫الشكل ‪ :26-3‬فرع املركب الفعيل الوسيط الثاين‪ .‬‬

‫‪-122-‬‬
‫Ÿ Ÿفك الشجرة النحوية إىل متثيل أفقي‬
‫بعد اكتامل بناء الشجرة النحوية واالنتهاء من وضع أسس البنية السطحية للجملة‬
‫العربية تبدأ مرحلة فك الشجرة النحوية واالنتقال باجلملة من التمثيل الشجري إىل‬
‫التمثيل األفقي ووضع الكلامت العربية بجانب بعضها البعض مع مراعاة املسافات فيام‬
‫بينها حتى ال خترج متالصقة‪ .‬ويف تلك املرحلة جيب علينا أن نأخذ يف االعتبار الرتتيب‬
‫بني كلامت الفرع الواحد بعد أن قمنا بالرتتيب بني األفرع يف املرحلة السابقة‪ .‬فالصفة‬
‫تتبع املوصوف وأداة التعريف تسبق املعرف‪ .‬وبعض الكلامت ال حتتاج إىل مسافة بينها‬
‫وبني الكلمة التي تليها كأداة التعريف «ال» وغريها‪ .‬يوضح الشكل (‪ )28-3‬التمثيل‬
‫األفقي للشجرة النحوية الناجتة عن املرحلة السابقة وهو عبارة عن مجلة إسمية تبدأ‬
‫بالفاعل «الولد» ‪.‬‬

‫الولد أكل التفاحة برسعة‬


‫َّ‬
‫الشكل ‪ :28-3‬التمثيل األفقي للشجرة النحوية‪.‬‬

‫Ÿ Ÿمعاجلة الكلمة مورفولوج ًّيا وتوليد اجلملة يف شكلها النهائي‬


‫من أبرز اخلصائص التي تطوع اللغة العربية للمعاجلة اآللية طبيعتها الرصفية‬
‫االشتقاقية ذات اإلنتاجية العالية واملستمدة أساسا من املكونني الرياضيني اجلذر‬
‫والوزن‪ ،‬ومن شأن هذا أن يدحض بعض الدعوات التي ترى أن اللغة العربية لغة‬
‫معقدة وصعبة عىل مستوى املعاجلة اآللية فرغم أهنا تتسم باالشتقاق الرصيف الغزير إال‬
‫أنه اشتقاق شبه منتظم‪ .‬وهذا االنتظام جيعل املستوى الرصيف أكثر املستويات اللسانية‬
‫قابلية للحوسبة دونًا عن املستويات األخرى الداللية والرتكيبية خاصة يف مرحلة‬
‫التوليد اآليل للغة العربية‪ .‬ويف املثال الذي لدينا الفعل «أكل» لديه السمة @‪present‬‬
‫والتي تدل عىل أن هذا الفعل حدث يف زمن املضارع‪ ،‬ومع األخذ يف االعتبار لطبيعة‬
‫الفاعل املفرد املذكر تقوم قواعد االشتقاق اخلاصة بتلك املرحلة بتوليد شكل املضارعة‬
‫للفعل «أكل» وهو «يأكل» ليصبح الشكل النهائي للجملة املولدة آل ًّيا كام يف الشكل‬
‫(‪ .)29-3‬كذلك هتتم تلك املرحلة بوضع اللمسات األخرية يف توليد اجلملة العربية‬
‫والعناية بالشكل النهائي هلا من خالل إضافة لعالمات استفهام أو أدوات تعجب أو‬
‫تعديل كلمة ما بشكل معني مل نتمكن من تعديله خالل املراحل السابقة‪.‬‬

‫‪-123-‬‬
‫الولد يأكل التفاحة برسعة‬
‫َّ‬
‫الشكل ‪ :29-3‬اجلملة العربية يف شكلها النهائي‪.‬‬

‫‪ -5‬تطبيقات املعاجلة اآللية للداللة باستخدام لغة الشبكات الداللية‬


‫احلاسوبية العاملية‬
‫بعد أن استعرضنا كيف تقوم لغة الشبكات الداللية احلاسوبية العاملية باستخالص‬
‫املعنى الدقيق للمحتوى الوارد يف النصوص املكتوبة بأية لغة طبيعية ومتثيله يف شكل‬
‫حيادي جمرد‪ ،‬وكيف يستطيع النظام نفسه وضع هذا التمثيل احليادي يف إطار أية لغة‬
‫طبيعية مرة أخرى‪ ،‬ينبغي علينا أن نتساءل كيف يمكن االستفادة من مثل هذه التقنية‪.‬‬
‫ولعل أول تطبيق يتبادر إىل أذهاننا هو الرتمجة اآللية من لغة إىل أخري‪ .‬وبالرغم من أن‬
‫الرتمجة اآللية تعد من أبرز استخدامات لغة الشبكات الداللية احلاسوبية العاملية إال أهنا‬
‫ليست التطبيق األوحد بل بإمكان لغة الشبكات الداللية احلاسوبية العاملية أن تنطلق‬
‫ألبعد من هذا بكثري ألهنا تقوم بفهم املعنى الذي حتمله اجلمل والكلامت قبل حتويلها‬
‫ونقله إىل لغة وسيطة نستطيع أن ننطلق منها إىل تطبيقات أخرى عديدة مثل البحث‬
‫اآليل‪ ،‬والتلخيص اآليل‪ ،‬والتنقيح اآليل‪ .‬وفيام ييل عرض لبعض من التطبيقات التي‬
‫قامت عىل نظام لغة الشبكات الداللية احلاسوبية العاملية‪.‬‬

‫‪ -1.5‬الرتمجة اآللية للنصوص‬


‫نظرا ملا حتتله تطبيقات الرتمجة اآللية للنصوص من أمهية يف املعاجلة اآللية للغات‬
‫ً‬
‫الطبيعية‪ ،‬ونظرا للجهد املبذول من اللغويني يف املحاولة للوصول إىل تطبيق آيل يتمتع‬
‫بإمكانية فهم النص واستيعابه ومن ثم التعبري عن معناه املقصود يف الشكل النحوي‬
‫الذي تسمح به اللغة اهلدف‪ ،‬فإن الرتمجة اآللية تُعد من أبرز التطبيقات التي ُيمكن للغة‬
‫نظرا ملا تتمتع به من أدوات‬‫الشبكات الداللية احلاسوبية العاملية أن تساهم يف تطويرها ً‬
‫لغوية متكنها من حتليل النص ونقل معناه املراد إىل لغة وسيطة وإعادة توليده ثاني ًة يف‬
‫الشكل الذي يتامشى مع اللغة اهلدف دون املساس باملحتوى الداليل للنص األصيل‪.‬‬
‫وللمركز العريب للغة الشبكات الداللية احلاسوبية العاملية عدة حماوالت يف استخدام‬

‫‪-124-‬‬
‫لغة الشبكات الداللية كمرتجم آيل من أية لغة طبيعية إىل اللغة العربية نذكر منها عىل‬
‫سبيل املثال‪:‬‬

‫§ §موسوعة دعم نظم احلياة (‪ :)EOLSS‬هي موسوعة متعددة التخصصات وتعد‬


‫أضخم موسوعة إلكرتونية مكتوبة باللغة اإلنجليزية حيث تتكون من ‪123000‬‬
‫صفحة إنرتنت أي ما يعادل حوايل ‪ 250000‬صفحة مطبوعة‪ .‬وقد قام املركز‬
‫العريب للغة الشبكات الداللية بمكتبة اإلسكندرية باالشرتاك يف املرشوع الذي‬
‫ُطرح من قبل منظمة اليونسكو هبدف ترمجة هذه املوسوعة إىل اللغات الست‬
‫الرسمية لألمم املتحدة‪ ،‬وكان املركز العريب مسئوال عن إنتاج النسخة العربية(‪.)1‬‬
‫وتضمنت املرحلة األوىل من املرشوع ترمج َة ‪ 25‬نصا (حوايل ‪ 13000‬مجلة)‬
‫من املوسوعة ُم َش َّف ًرا من قبل مؤسسة لغة الشبكات الداللية احلاسوبية العاملية‬
‫(‪ )UNDL Foundation‬و ُم َعدًّ ا للرتمجة إىل اللغات املطلوبة‪ .‬وقد متكنت قواعد‬
‫التوليد العربية باستخدام قاموس متخصص من ترمجة النصوص املطلوبة‪ .‬وتم‬
‫تقييم الرتمجات املولدة مقارنة ببعض أنظمة الرتمجة اآللية األخرى وكانت جودة‬
‫النسخة العربية املولدة من لغة الشبكات الداللية مرضية‪ ،‬وبالفعل تم إنشاء موقع‬
‫عىل اإلنرتنت(‪ )2‬يضم النصوص املتفق عىل ترمجتها وتتصل فيه اللغات املشرتكة‬
‫يف املرشوع ببعضها‪ ،‬ويتم من خالل املوقع ترمجة النصوص عىل اإلنرتنت مبارشة‪.‬‬
‫وبعد نرش نتائج هذا املرشوع تلقى املركز العريب للغة الشبكات الداللية دعوة من‬
‫القائمني عىل بناء وتطوير موسوعة احلياة (‪ )3()EOL‬إلصدار النسخة العربية من‬
‫املوسوعة وهي موسوعة إلكرتونية متاحة جمانا عىل اإلنرتنت باللغة اإلنجليزية‬
‫وتضم معلومات عن ‪ 1.8‬مليون كائن حي‪ .‬وهتدف ترمجة املوسوعة إىل نرش‬
‫املعرفة عن هذه الكائنات للمحافظة عليها‪ ،‬وقد تم اختبار مدى قدرة قواعد‬
‫التوليد العربية عىل التعامل مع نصوص هذه املوسوعة‪ ،‬وكانت النتائج جيدة‬
‫مقارنة ببعض أنظمة الرتمجة اآللية األخرى‪.‬‬

‫‪ -1‬نتائج هذا املرشوع موجودة يف ‪.http://www.eolss.net/Eolss-Definition-Context.aspx‬‬


‫‪ -2‬هذا املوقع هو ‪.http://www.undl.org/unleolss/unleolss.htm‬‬
‫‪ -3‬ملعرفة املزيد عن موسوعة احلياة‪.http://eol.org :‬‬

‫‪-125-‬‬
‫كام قامت العديد من املراكز األخرى املمثلة للغات املشاركة يف مرشوع لغة الشبكات‬
‫الداللية احلاسوبية العاملية ببناء أنظمة ترمجة آلية معتمدة عىل لغة الشبكات العاملية كام يف‬
‫املركز اهلندي للغة الشبكات الداللية‪ ،‬واملركز الرويس للغة الشبكات الداللية‪ ،‬واملركز‬
‫الفرنيس‪ ،‬وغريهم‪.‬‬

‫‪ -2.5‬الباحث اآليل عرب حاجز اللغة‬


‫استخدام آخر ال يقل أمهية عن توليد النصوص هو استخدام الشبكة الداللية من‬
‫أجل البحث داخل حمتوى اإلنرتنت واسرتجاع ما حيتاجه املستخدم من معلومات‪.‬‬
‫فعن طريق فهمه ملا يبحث عنه املستخدم يستطيع الربنامج املبني عىل تكنولوجيا لغة‬
‫الشبكات الداللية احلاسوبية العاملية البحث عن املعلومات املطلوبة داخل صفحات‬
‫اإلنرتنت املكتوبة بأي لغة وليست لغة البحث فقط بينام يقوم بإظهار نتائج البحث‬
‫بلغة املستخدم لإلنرتنت أيا كانت اللغة األصلية املخزنة هبا تلك النتائج يف صفحات‬
‫اإلنرتنت‪.‬‬
‫أي أن برنامج لغة الشبكات الداللية سيعتمد عىل مقارنة املعنى الداليل‪ .‬وكذلك‬
‫يعربترب اسرتجاع املعلومات عرب اللغة (�‪cross-language information retriev‬‬
‫‪ )al‬من ضمن التطبيقات التي تندرج حتت البحث عرب اللغة‪ .‬حيث يمكن عىل سبيل‬
‫املثال البحث داخل فهارس املكتبات اإللكرتونية ومعرفة معلومات عن الكتب املتاحة‬
‫واحلصول عىل أي معلومة من هذه الكتب بل وقراءهتا مهام كانت لغة هذه الكتب‪.‬‬
‫ولقد قام املركز العريب بتصميم وتنفيذ نموذج هلذا الباحث اآليل عىل تطبيق «نظام‬
‫مكتبات غري معتمد عىل لغة»‪ ،‬وهو نظام يسمح برتمجة املعلومات اخلاصة بالكتب إىل‬
‫اللغات الست الرسمية لألمم املتحدة باإلضافة إىل اللغة الربتغالية‪.‬‬
‫وهذا النظام مصمم لكي يسمح للمستخدم باستدعاء وتصفح املعلومات اخلاصة‬
‫بالكتب املوجودة يف فهارس املكتبات اإللكرتونية باللغة التي يطلبها برصف النظر عن‬
‫اللغة املخزنة هبا كام يسمح للمستخدم املتخصص (املكتبي) بفهرسة الكتب وإضافة أو‬
‫تعديل املعلومات املختلفة اخلاصة بكل كتاب‪ ،‬كام يوفر معلومات إحصائية عن عدد‬
‫الكتب التي تم ختزينها‪.‬‬

‫‪-126-‬‬
‫كام قام املركز الفرنيس للغة الشبكات الداللية احلاسوبية العاملية بعمل نظام بحث‬
‫واسرتجاع للمعلومات عرب اإلنرتنت معتمدا عىل لغة الشبكات الداللية احلاسوبية‬
‫العاملية‪ .‬وكذلك املركز اإلسباين للغة الشبكات الداللية احلاسوبية العاملية الذي وضع‬
‫نظا ًما متعدد اللغات السرتجاع للمعلومات [‪ ]30‬وكذلك أيضا املركز اهلندي للغة‬
‫الشبكات الداللية احلاسوبية العاملية [‪.]32‬‬

‫‪ -3.5‬التلخيص والتنقيح اآليل للنصوص‬


‫ال تقترص استخدامات لغة الشبكات الداللية احلاسوبية العاملية عىل التحويل من‬
‫لغة إىل أخرى‪ ،‬فقد تستخدم يف داخل إطار اللغة الواحدة‪ .‬ويف تلك احلالة يكون‬
‫التحويل من شكل إىل شكل أو من أسلوب إىل أسلوب لكن بنفس اللغة ودون املساس‬
‫باملحتوى‪.‬‬
‫من بني االستخدامات التي تندرج يف هذا اإلطار‪ :‬التنقيح اآليل‪ ،‬التلخيص اآليل‪،‬‬
‫والتبسيط اآليل‪ .‬ويف عمليات التنقيح اآليل يتم تغيري بعض املفردات أو بعض الرتاكيب‬
‫يف النص األصيل للوصول إىل نسخة خمتلفة معدلة‪ ،‬فمثال إبدال بعض املفردات العامية‬
‫بأخرى فصحى أو العكس فيكون النص اخلارج نصا خمتلفا من املنظور االجتامعي أو‬
‫التنوع املفردي‪.‬‬
‫وبنفس الطريقة يمكن تغيري األسلوب األديب العام عن طريق تبسيط بعض الرتاكيب‬
‫أو إضافة بعض املحسنات البالغية التي ال تغري يف املحتوى الداليل للنص وبذلك يتولد‬
‫نص خمتلف عن النص األصيل من حيث الطابع األديب‪.‬‬
‫ويمكن أيضا استخدام الفهم الذي تصل إليه لغة الشبكات الداللية احلاسوبية‬
‫العاملية يف عملية التلخيص اآليل عن طريق توليد نص مقابل خيتلف مع النص األصيل‬
‫يف طوله بحيث يكون خمترصا‪ .‬ويتم ذلك من خالل حتديد املفاهيم الرئيسية واملفاهيم‬
‫الثانوية واالستغناء عن تلك الثانوية‪.‬‬
‫أما مهمة التبسيط اآليل فهدفها جعل النص األصيل أسهل من ناحية القراءة والفهم‪.‬‬
‫وحيدث هذا من خالل تغيري بعض الرموز أو الرتاكيب التي من شأهنا تعقيد النص‪.‬‬

‫‪-127-‬‬
‫فمثال يف اجلملة التالية‪« :‬ولد يف هبجورة ‪ -‬األقرص ‪ -‬مرص» تكمن الصعوبة يف حتديد‬
‫مدلول العالمة «‪ ، »-‬عندئذ تكون مهمة لغة الشبكات الداللية احلاسوبية العاملية معرفة‬
‫ما املقصود هبذه العالمة والتعبري عنها بشكل أكثر وضوحا فيكون العنوان املبسط «ولد‬
‫يف هبجورة يف األقرص يف مرص» ‪.‬‬
‫وهذا التفسري ال يعتمد عىل العالمة نفسها بل يعتمد عىل فهم لغة الشبكات الداللية‬
‫احلاسوبية العاملية ملعنى اجلملة‪ ،‬فنفس تلك العالمة يف مجلة مثل «معارض كثرية‬
‫بفرنسا‪-‬كندا» يتم تبسيطها إىل «معارض كثرية بفرنسا وكندا» ‪.‬‬
‫وتقوم بكل العمليات السابقة أداة موجودة بالفعل لكنها الزالت ختضع للتطوير‬
‫وهي أداة توت(‪)1‬؛ وهي عبارة عن مكتبة رقمية للنصوص املمثلة يف شبكات داللية‪،‬‬
‫وتضم أكثر من ‪ 30000‬عنوان والشبكات الداللية املمثلة هلم (إن وجدت)‪.‬‬
‫وبإمكان املستخدم اختيار عرض أي من النسخة األصلية‪ ،‬أو النسخة املخترصة‪ ،‬أو‬
‫النسخة املنقحة‪ ،‬أو النسخة املبسطة‪.‬‬

‫‪ -6‬دعوة للمشاركة‬
‫من أجل تطوير املعاجلة اآللية للداللة يف اللغة العربية قمنا بوضع خطة طريق‬
‫للباحثني يف هذا املجال هبدف حتقيق أفضل النتائج يف معاجلة الداللة‪ .‬تتضمن تلك‬
‫اخلطة العديد من النقاط البحثية‪ ،‬منها‪:‬‬
‫‪ -1‬توصيف األدوار النحوية يف اجلملة العربية بام يقابلها من أدوار داللية وكيفية‬
‫االنتقال من الدور النحوي إىل الدور الداليل والعكس‪.‬‬
‫‪ -2‬دراسة املتعلقات النحوية والتصنيف الداليل للكلامت العربية أ ًّيا كانت فئتها‬
‫املعجمية (األسامء‪ ،‬األفعال‪ ،‬الصفات‪ ،‬الظروف)‪.‬‬
‫‪ -3‬دراسة كيفية ختزين الكلامت املركبة داخل القاموس واشتقاق األشكال الرصفية‬
‫املختلفة منها‪.‬‬

‫‪ -1‬ملعرفة املزيد عن األداة «توت» يرجى اتباع هذا الرابط‪.http://www.unlweb.net/tut :‬‬

‫‪-128-‬‬
‫‪ -4‬بناء شبكة الكلامت العربية الداللية (‪.)Arabic WordNet‬‬
‫‪ -5‬دراسة أسس ومعايري بناء قامــوس حاسويب عريب‪ ،‬يضــم كلمـــات اللغة‬
‫العربــية وما حتتاجه من معلومات ُل َغ ِو َّية؛ يصلــح لتطبيقات املعاجلة اآللية‬
‫للغة العربية‪.‬‬
‫‪ -6‬دراسة عن كيفية التعامل مع املركبات اللفظية التي يفصل السياق بني أجزاءها‬
‫مما يؤدي إىل تباعدها وبالتايل صعوبة التعرف عليها‪ .‬مثل تعبري «قطع مسافة»‬
‫والذي قد يأيت هبذا الشكل‪( :‬قطعت السيارة مسافة ميلني قبل أن تصل لوجهتها)‬
‫أثناء التحليل اآليل هلذه اجلملة سيكون هناك مشكلة يف جعل احلاسوب يعترب‬
‫هاتان الكلمتان املنفصلتان مفهوم واحد‪.‬‬
‫‪ -7‬دراسة الرتاكيب الداللية التي ال تقبل التجاور ورشوط التجاور‪ .‬فهناك بعض‬
‫الرتاكيب الداللية التي يصعب تتابعها داخل اجلملة العربية مثل تتابع الصفة‬
‫بعد الفعل غري مسموح به داخل اجلملة العربية كام يف املثال‪( :‬ذهبت اجلميالت‬
‫إىل احلديقة) اجلميالت هنا اسم وليست صف فيكون عىل املحلل اآليل أن خيتار‬
‫«اجلميالت» ذات وسم االسم وليس الصفة‪.‬‬

‫‪-129-‬‬
‫ببليوجرافيا مرجع َّية‬
‫ النظام العريب للغة التواصل‬:)‫ العديل (هنى‬،)‫ ناجي (جمدي‬،)‫األنصاري (سامح‬1.1
‫ اململكة‬،‫ الرياض‬،)ICCA( ‫ املؤمتر الدويل لعلوم وهندسة احلاسوب‬،‫العاملية‬
.2011 ،‫العربية السعودية‬
‫ املجلة العربية للعلوم‬،‫ التحليل الداليل للجملة العربية‬:)‫الرمحن‬
َّ ‫أ ُّيوب (عبد‬2.2
.1983 ‫ مارس‬،‫ جامعة الكويت‬،‫اإلنسانية‬
،‫ دار الكتب العلمية‬،‫ دالئل اإلعجاز يف علم املعاين‬:)‫اجلرجاين (عبد القاهر‬3.3
.1988 ،1‫ ط‬،‫ لبنان‬،‫بريوت‬
.‫ ي‬.‫ ن‬.‫ د‬:‫ حترير‬،‫ ضمن املوسوعة اللغوية‬،‫ اللغة واحلسابية‬:‫ بتلر‬. ‫كريستوفر س‬4.4
.‫ املجلد الثاين‬،‫ عبداهلل احلميدان‬.‫ حمي الدين محيدي ود‬.‫ ترمجة د‬،‫كولنج‬
5. Adly, N. & Sameh Alansary, S. (2009c). Evaluation of Arabic Ma-
chine Translation System based on the Universal Networking Lan-
guage, 14th International Conference on Applications of Natural
Language to Information Systems (NLDB 2009), Saarland Univer-
sity, Saarbrücken-Germany.
6. Alansary, S. & Nagi, M. & Adly, N. (2006). Processing Arabic Text
Content: The Encoding Component in an Interlingual System for
Man-Machine Communication in Natural Language, 6th Interna-
tional Conference on Language Engineering, Ain Shams University,
Cairo.
7. Alansary, S. & Nagi, M. & Adly, N. (2007). A Semantic-Based
Approach for Multilingual Translation of Massive Documents, 7th
Symposium of Natural Language Processing, Thailand.
8. Alansary, S. & Nagi, M. & Adly, N. (2009a). A Library Information
System (LIS) based on UNL knowledge infrastructure, Seventh In-
ternational Conference on Computer Science and Information Tech-
nologies, Yerevan, Armenia.

-130-
9. Alansary, S. & Nagi, M. & Adly, N. (2009b). The Universal Net-
working Language in Action in English-Arabic Machine Transla-
tion, 9th Conference on Language Engineering, Ain Shams Univer-
sity, Cairo.
10. Alansary, S. & Nagi, M. & Adly, N. (2010a). UNL+3: The Gateway
to a Fully Operational UNL System, 10th International Conference
on Language Engineering, Ain Shams University, Cairo, Egypt.
11. Alansary, S. & Nagi, M. & Adly, N. (2011). Understanding Natural
Language through the UNL Grammar Work-bench, Conference on
Human Language Technology for Development (HLTD 2011), Bib-
liotheca Alexandrina, Alexandria, Egypt.
12. Alansary, S. & Nagi, M. & Adly, N. (2011). UNL Editor: An Anno-
tation tool for Semantic Analysis, 11th International Conference on
Language Engineering, Ain Shams University, Cairo, Egypt.
13. Alansary, S. & Nagi, M. & Adly, N. (2012). IAN: An Automatic
Tool for Natural Language Analysis, 11th International Conference
on Language Engineering , Ain Shams University, Cairo, Egypt.
14. Alansary, S. & Nagi, M. & Adly, N. (2013). A Suite of Tools for Ar-
abic Natural Language Processing: A UNL Approach, (ICCSPA’13),
Sharjah, UAE.
15. Alansary, S. & Nagi, M. (2013). LILY: Lan-guage-to-Interlanguage-
to-Language System Based on UNL, 12th International Conference
on Language Engineering, Ain Shams University, Cairo, Egypt.
16. Alansary, S. (2009). Issues on Interlingua Machine Translation Sys-
tems, 9th Conference on Language Engineering, Ain Shams Uni-
versity, Cairo, Egypt.
17. Alansary, S. (2010b). A Practical Application of the UNL+3 Pro-
gram on the Arabic Language, 10th International Conference on
Language Engineering, Ain Shams University, Cairo, Egypt.

-131-
18. Alansary, S. (2012). A Formalized Reference Grammar for UNL-
based Machine Translation between English and Arabic, COLING,
the 24th International Conference on Computational Linguistics,
IIT Bombay, Mumbai, India.
19. Alansary, S. (2014). MUHIT: A Multilingual Harmonized Diction-
ary, The 9th edition of the Language Resources and Evaluation
Conference, 26-31 May, Reykjavik, Iceland.
20. Alansary, S. (2015). Keys: A Knowledge Extraction System Based
on UNL knowledge infrastructure, TENCON - IEEE Region 10
Conference, Macau, China.
21. Bhat, B. & Bhattacharyya, P. (2011). IndoWordnet and its Linking
with Ontology, International Conference on Natural Language Pro-
cessing (ICON 2011), Chennai.
22. Boguslavsky, I & Frid, N. & Iomdin, L. & Kreidlin, L. & Sagalova,
I. & Sizov, V. (2000). Creating a Universal Networking Language
Module within an Advanced NLP System, COLING 2000, Saar-
brücken, Germany 31/07-04/08, p.76-82.
23. Boitet, C. (2002). A rationale for using UNL as an Interlingua and
more in various domains, proceedings “First International Workshop
on UNL, other Interlinguas and their Applications, LREC2002, Las
Palmas, Spain.
24. Boitet, C. (2005). Gradable quality translations through mutualis-
ation of human translation and revision, and UNL-based MT and
coedition.Universal Network Language: Advances in Theory and
Applica-tions. Research on Computing Science 12, 2005, pp. 395–
412.
25. Boudh, S. & Bhattacharyya, P. (2010). Unification of Universal
Word Dictionaries Using WordNet Ontology and Similarity Meas-
ures, 5th International Conference on Global Wordnet (GWC2010),
Mumbai.

-132-
26. Burton, R.R. & Woods, W.A. (1976). A compiling system for aug-
mented transition networks. Preprints of COLING 76: The Interna-
tional Conference on Computational Linguistics, Ottawa.
27. Butler, C. S. (1985a). Computers in Linguistics, Blackwell, Oxford.
28. Butler, C. S. (1985b). Statistics in Linguistics, Blackwell, Oxford.
29. Butler, C. S. (1985c). Systemic Linguistics: Theory and Applica-
tions, Batsford.
30. Cardeñosa, J. & Gallardo, C. & Toni, A. (2009). Multilingual Cross
Language Information Retrieval: A new approach, UNL Workshop,
in conjunction with CSIT 7th International Conference Yerevan, Ar-
menia.
31. Dave, S. & Parikh, J. & Bhattacharyya, P. (2001). Interlingua-based
English- Hindi Machine Translation and Language Divergence.
Journal of Machine Translation 16(4), 251–304 (2001) 8. Chatterji,
S., Roy, D., Sarkar, S.
32. Kagathara, S. & Deolalkar, M. & Bhattacharyya, P. (2005). A Mul-
ti Stage Fall-back Search Strategy for Cross-Lingual Information
Retrieval, proceedings of Symposium on Indian Morphology, Pho-
nology and Language Engineering [SIMPLE 2005], IIT Kharagpur,
India.
33. Martins, R. & Avetisyan, V. (2009). Generative and Enumerative
Lexi-cons in the UNL Framework, In proceedings of 7th Interna-
tional Conference on Computer Science and Information Technolo-
gies, CSIT 2009, Yerevan, Armenia, 2009.
34. Schank, R. C. (1972). ‘Conceptual dependency: a theory of natural
lan-guage understanding’, Cognitive Psychology, 3 / 4: 552 – 630.
35. Shaalan, K. & Rafea, A. & Baraka, H. (2006). Mapping Interlin-
gua Representations to Feature Structures of Arabic Sentences, The
Challenge of Arabic for NLP/MT, London.

-133-
36. Uchida, H. & Zhu, M. & Senta, T. D. (2005). Universal Networking
Language, UNDL Foundation.
37. Uchida, H. (1996). UNL: Universal Networking Language – An
Electronic Language for Communication, Understanding, and Col-
laboration, UNU/IAS/UNL Center, Tokyo, Japan.
38. Wilks, Y. ‘Preference semantics’, in Keenan, E. L. (ed.), Formal
Se-mantics of Natural Language, Cambridge University Press,
Cambridge: 329– 48,1975.

-134-
‫الفصل الرابع‬
‫اآللي‬
‫ّ‬ ‫موارد ال َّتع ُّلم‬
‫اآللي)‬
‫ّ‬ ‫(مدخل إلى التَّع ُّلم‬

‫د‪ُ .‬م ِسن َرشوان‬

‫‪ -1‬شجرة القرار‪.‬‬
‫‪ -2‬مصنِّف بايز املبسط‪.‬‬
‫‪ -3‬الشبكات العصبية‪.‬‬
‫‪ -4‬آل َّيات املتجهات الداعمة‪.‬‬
‫‪ -5‬نامذج ماركوف ا ُمل َخ َّبأة‪.‬‬

‫‪-135-‬‬
-136-
‫موارد التَّعلُّم اآلل‬

‫‪ -1‬شجرة القرار‬
‫‪ -1‬شجرة القرار‬
‫يف كثري من األحيان ُيكن حسم القرار يف ميادين حوسبة اللُّغة عن طريق ما يسمى «شجرة‬
‫يف كثري من األحيان يمكن حسم القرار يف ميادين حوسبة ال ُّلغة عن طريق ما يسمى‬
‫كثريا ما تحستخدم شجرة القرار حلل املشكالت الَّيت تسمح‬ ‫‪ .)Decisions‬و ً‬ ‫القرار» (‪Tree‬‬
‫وكثريا ما تُستخدم شجرة القرار حلل املشكالت‬ ‫ً‬ ‫)‪.‬‬‫‪Decisions‬‬ ‫‪Tree‬‬ ‫(‬ ‫القرار»‬ ‫«شجرة‬
‫سم حح فيها بثالثة أسئلة – حب ٍّد‬ ‫سي‬ ‫»‬ ‫الفاكهة؟‬ ‫هي‬ ‫ما‬ ‫«‬ ‫لعبة‬ ‫املثال‪.‬‬ ‫هذا‬ ‫وإليك‬ ‫بذلك؛‬ ‫طبيعتها‬
‫ا َّلتي تسمح طبيعتها بذلك؛ وإليك هذا املثال‪ .‬لعبة «ما حهيَ الفاكهة؟» س ُي َ‬
‫سم ُح فيها‬
‫نوع(‪.)1-4‬‬
‫الفاكهة‪ .‬انظر الشكل (‪.)1-4‬‬ ‫الشكل‬ ‫الفاكهة‪.‬صانظر‬
‫ول إىل‬ ‫إىل نوع‬
‫أقىص ‪ -‬للو‬ ‫ص‪-‬ولبحدٍّ‬ ‫للو‬
‫بثالثة – ح‬
‫أسئلة ح‬ ‫أقصى‬
‫ُ ُ‬

‫ما لوهنا؟‬

‫أخضر‬ ‫أصفر‬ ‫أمحر‬

‫ما حجمها؟‬ ‫ما شكلها؟‬ ‫ما حجمها؟‬

‫كروي‬ ‫طويل‬ ‫كبري‬ ‫صغري‬


‫صغري متوسط كبري‬
‫ما حجمها؟‬ ‫موز‬ ‫تفاح‬
‫عنب تفاح أخضر بطيخ‬ ‫ما طعمها؟‬
‫أمحر‬

‫كبري‬ ‫صغري‬ ‫حلو‬ ‫حامض‬


‫كرز‬ ‫عنب الذع‬
‫ليمون هندي‬ ‫ليمون‬

‫نوع الفاكهة‪.‬‬
‫الفاكهة‪.‬‬ ‫‪ ::1-4‬نوع‬
‫َّكل ‪1-4‬‬
‫الشكل‬‫َّ‬
‫الش‬

‫بسيطة (من نوع‪« :‬نعم‪/‬ال» فقط)‪ .‬ولتحويل‬


‫‪142‬‬
‫ويف بعض األحيان تُستَخدَ ُم أسئلة‬
‫الشجرة إىل هذا النوع البسيط من األسئلة يمكن مراجعة نفس املثال السابق يف صورته‬
‫اجلديدة يف الشكل (‪.)2-4‬‬

‫‪-137-‬‬
‫خد حم أسئلة بسيطة (من نوع‪« :‬نعم‪/‬ال» فقط)‪ .‬ولتحويل الشجرة‬
‫ويف بعض األحيان تحستَ َ‬
‫إىل هذا النوع البسيط من األسئلة ُيكن مراجعة نفس املثال السابق يف صورته اجلديدة يف‬
‫الشكل (‪.)2-4‬‬

‫لون = أخضر‬

‫نعم‬ ‫ال‬

‫احلجم = كبري‬ ‫لون = أصفر‬

‫نعم‬ ‫ال‬ ‫نعم‬ ‫ال‬

‫بطيخ‬ ‫احلجم=متوسط‬ ‫الشكل=كروي‬ ‫احلجم =صغري‬

‫نعم‬ ‫نعم‬ ‫ال‬ ‫نعم‬ ‫ال‬


‫ال‬

‫عنب أخضر تفاح أخضر‬ ‫احلجم=كبري‬ ‫موز‬ ‫الطعم= حلو‬ ‫تفاح أخضر‬

‫نعم‬ ‫ال‬ ‫نعم‬ ‫ال‬


‫ليمون هندي‬ ‫ليمون‬ ‫الكرز‬ ‫عنب الذع‬
‫أسئلة‪ 3.‬أسئلة‪.‬‬
‫أكثر من‬
‫أكثرإىلمن ‪3‬‬
‫نحتاج‬ ‫«نعم‪/‬ال»قد– قد‬
‫حنتاج إىل‬ ‫األسئلة«نعم‪/‬ال» –‬
‫نوعاألسئلة‬
‫عىل نوع‬
‫مبنية على‬
‫القرارار مبنية‬ ‫شجرة‬
‫شجرة القر‬ ‫‪:2-:2-4‬‬ ‫َّ‬
‫الشكل‬
‫الشَّكل ‪4‬‬
‫حلول تعتمد عىل القواعد‪ .‬ويف كثري من األحيان‬‫ٍ‬ ‫ٍ‬
‫بكفاءة مع‬ ‫وتُستخدم شجر ُة القرار‬
‫وتحستخدم شجرةح القرار بكفاءةٍ مع حلول تعتمد على القواعد‪ .‬ويف كثري من األحيان حتتاج‬
‫ٍ‬
‫حتتاج هذه القواعد إىل تنظيم وترتيب‪ ،‬ويكون ذلك باستدعاء شجرة القرار‪.‬‬
‫هذه القواعد إىل تنظيم وترتيب‪ ،‬ويكون ذلك ابستدعاء شجرة القرار‪.‬‬

‫‪ -2‬مصنِّف بايز املبسط‬


‫‪143‬‬
‫تعالوا م ًعا نصيغ املشكلة رياضيا‪ ،‬املطلوب هو حساب (‪P(si /C‬‬

‫حيث ‪ si‬هو املعنى ‪ )Sense i( i‬الذى يمكن أن تأخذه الكلمة ‪ w‬حمل التحليل‪ .‬ويقرأ‬
‫التعبري السابق كاآلتى‪ :‬احتامل املعنى ‪ i‬برشط توفر السياق ‪ .C‬وليس لدينا معلومات‬

‫‪-138-‬‬
‫يمكن أن نستنبط منها احلل مبارشة لـ (‪ P(si /C‬ولكن «بيز» يقدم لنا حتليال مهام البد أن‬
‫نلجأ إليه كخطوة نحو احلل كام يف املعادلة ‪:1‬‬
‫)‪P(C/si) P(si‬‬
‫)‪(1‬‬ ‫= )‪P(si/C‬‬
‫)‪P (C‬‬
‫وهذا يقربنا خطوة نحو احلل‪ ،‬فحساب (‪ P(si( ، P(C /si‬ممكن وسهل‪ ،‬اما بالنسبة‬
‫ال ألهنا ستكون موجودة مع كل املعانى‬ ‫(‪ P(C‬فلسنا يف احلقيقة يف حاجة إليها اص ً‬
‫املحتملة للكلمة ‪ w‬حمل الدراسة‪ .‬ولذلك فاملعادلة السابقة يعاد صيغتها كاآلتى‪:‬‬
‫)‪(2‬‬ ‫)‪g(si/C) = P(C /si( P(si‬‬

‫تالحظ هنا أننا غرينا اسم الطرف االيرس إىل (‪ g(si/C‬النه مل يعد يعرب عن االحتامل‬
‫باملعنى املصطلحى الذى قيمته حمصورة بني الصفر والواحد‪.‬‬
‫وهنا سنحتاج لفرض آخر لتبسيط احلل من خالل مصن ٍ‬
‫َّف بسيط‪ ،‬إالَّ أنَّه ف َّع ٌال‬
‫َّفات أخرى أكثر‬ ‫كثري من األحيان‪ -‬مع نتائج مصن ٍ‬
‫لدرجة كبرية‪ ،‬وتتنافس نتائجه ‪-‬يف ٍ‬
‫منه تعقيدً ا‪ .‬إنَّه «مصنف بايز املبسط (‪ .)Naïve Bayes Classifier‬وجريا عىل عرف‬
‫ال ُكتَّاب عند استخدام مصطلح كثري االستخدام أن خيترصوا اسمه باستخدام األحرف‬
‫أيضا (‪ .)NBC‬ويسمى املبسط ألن هناك‬ ‫األوىل‪ ،‬أي (م ب م) وخيترصونه باإلنجليزية ً‬
‫فرضية رياضية لتبسيط احلل وهي اعتبار أن الكلامت التي متثل السياق مستقلة بعضها‬
‫كثريا‬
‫عن بعض‪ -‬وإن كان ذلك يف احلقيقة غري صحيح‪ ،‬ألن بعض الكلامت يقرتن ً‬
‫بكلامت أخرى‪ .‬وهذا الفرض سمح لنا بإمكانية التعامل مع السياق بشكل مبسط‪.‬‬
‫والسياق هو جمموع الكلامت التي سبقت الكلمة مبارشة أو تلتها‪ .‬وجيوز لنا هبذا‬
‫الفرض أن نكتب سياق الكلمة ‪ wj‬كاآليت‪:‬‬
‫)‪(3‬‬ ‫)‪P(C) = P(w1 ) * P(w2 )…P(wj-1) )*P(wj+1)…P(wN‬‬
‫وكذلك يمكن إعادة كتابة املعادلة (‪ )3‬كاآليت‪:‬‬
‫)‪(4) g(sj/C) =[P(w1/sj) * P(w2/sj)…P(wj-1)/sj‬‬
‫)‪*P(wj+1)/sj)…P(wN)]*P(sj‬‬

‫‪-139-‬‬
‫إن صياغة املعادلة جيعل احلل يف متناول أيدينا‪ .‬فلو أننا متكنا من حسـاب الكميات‬
‫أيضا )‪ P(sj‬نكون قد حسمنا األمر كله وعرفنا أي احللول يف هذا‬
‫( ‪ ،)P(wk/sj‬ثم حسبنا ً‬
‫السياق هو األوفق‪.‬‬
‫إن حساب هذه الكميات يمكن الرجوع إليه يف ملحق‪ 1-‬لنظرية االحتامالت‬
‫وكذلك فصل «نمذجة اللغة»‪ .‬واليفوتنا هنا أن نذكر بأن االحتامل )‪ P(sj‬يسمى النحو‬
‫األحادي‪ ،‬وهو احتامل أن تأيت الكلمة هبذا احلل عموما‪ ،‬برصف النظر عن السياقات‬
‫املختلفة (أي‪ :‬احتامل وجودها ككلمة مفردة)‪.‬‬
‫ومثال ذلك‪ :‬كلمة «قال» من مادة القول قد يصل نحوها األُحادي ‪ -‬املرشوط بورود‬
‫«قال» ‪ -‬إىل أكثر من ‪ 0.999‬بينام كلمة «قال» من مادة قيل (أي النوم بالظهرية) قد‬
‫ال يصل نحوها األحادي ‪ -‬املرشوط بورود «قال» ‪ -‬إىل ‪ .0.001‬واجلدير بالذكر أننا‬
‫سوف نقابل عند تطبيق هذا اخلوارزم أو هذا املصنف مشكلة‪ ،‬وهي أن بعض الكلامت‬
‫مل نرها من قبل يف الذخرية اللغوية ا َّلتي تدرب النظام عليها‪ .‬ويف سياق جديد إذا أتت‬
‫صفرا‪ ،‬وسوف نرضب يف صفر‬ ‫كلمة واحدة مل تُر من قبل‪ ،‬فسيكون احتامل ورودها ً‬
‫فتكون النتيجة صفرا مهام كانت قوة شواهد الكلامت األخرى يف السياق‪ .‬ولقد واجهنا‬
‫هذه املشكلة يف الباب ال َّثامن ‪ -‬عندَ َح ِديثنا عن َ‬
‫«نمذجة ال ُّلغة» واستطعنا أن نمنع هذا‬
‫الصفر بافرتاض نسبة احتامل صغرية نسبيا ملا مل نره من الكلامت‪.‬‬

‫‪ -3‬الشبكات العصبية‬
‫بمختلف أنواعه‪ ،‬سمعا وبرصا وفهام‬ ‫يتمتع اإلنسان بمقدرة رائعة عىل البيان ُ‬
‫أنظار العلامء‪ ،‬وال يزالون مبهورين بقدرة املخ‬
‫َ‬ ‫البرشي‬
‫ُّ‬ ‫ونطقا‪ ...‬إلخ‪ .‬ولقد َل َف َت الدما ُغ‬
‫علم إال بالقليل جدًّ ا عن‬
‫البرشي عىل اإلدراك والتَّذكُّر واالستامع واإلبصار‪ ،‬فلم حييطوا ً‬
‫ّ‬
‫فهم الوحدة األساسية واللبنة األوىل يف بناء مخ‬
‫كيفية ذلك‪ .‬ولقد حاول بعض العلامء َ‬
‫اإلنسان‪ ،‬ونقصد «اخللية العصبية»‪.‬‬
‫حيتوي مخ اإلنسان عىل نحو ‪ 10‬مليارات خلية عصبية ولكل خلية منها اتصال‬
‫بمتوسط يصل إىل نحو ‪ 10‬آالف وصلة بـ ‪ 10‬آالف خلية أخرى‪.‬‬ ‫ٍ‬ ‫بغريها من اخلاليا‬
‫وهذا يعني أن عدد وصالت اخلاليا يبلغ نحو مئة ألف مليار وصلة‪ .‬و ُيظ ُّن أن يف هذه‬
‫ختزن املعلومات‪ .‬وهذه الوصالت ال تبقى بال استخدام‪ ،‬وإنَّام تتآكل وتضمر‬
‫الوصالت ِّ‬

‫‪-140-‬‬
‫مع الوقت وخاصة التي تبقي بال استخدام‪ .‬فعددها كامل عند الصغار وتقل مع الزمن‪.‬‬
‫صغريا عنده الكثري منها ليخزن فيه ما حيفظ‪ ،‬والذي حيفظ عىل‬
‫ً‬ ‫فالذي حيفظ القرآن‬
‫الكرب جيد صعوب ًة أكرب سواء يف احلفظ أو تذكر ما حيفظ‪.‬‬
‫وبالنسبة للغة ‪ -‬وهي متطورة جدًّ ا عند اإلنسان ‪ -‬فقد ُرو َيت حادثة عن طفلة يف‬
‫قبو حتت املنزل‪ ،‬وكان يلقي‬ ‫السادسة من عمرها‪ ،‬وقد حبسها أبوها وهي صغرية جدا يف ٍ‬
‫إليها الطعام دون أي خمالطة أو حمادثة حتى بلغت السادسة من عمرها‪ .‬وبعد اكتشاف‬
‫هذه البنت (بالطبع عوقب أبوها)‪ ،‬أخذ علامء كثريون البنت لينظروا ‪ -‬نفس ًّيا ولغو ًّيا ‪-‬‬
‫ماذا فقدت؟ وكيف يمكن تعويضها؟‪ .‬وحاولوا تعليمها اللغة شهورا طويلة فاستطاعت‬
‫أن تستوعب أسامء األشياء‪ ،‬مثل‪ :‬شجرة‪ ،‬طريق‪ ،‬ثالجة‪ ...،‬إلخ‪ .‬ولكن تعبريات مثل‬
‫«يف الثالجة»‪« ،‬إىل املدرسة»‪ ...،‬إلخ‪ ،‬مل تستطع تعلمها؛ فاستنبطوا أن اإلنسان مزود‬
‫بأداة للغة (جزء من الدماغ خمصص لذلك)‪ ،‬وهلا وقتها للتعلم‪ .‬فإذا مر الوقت املناسب‬
‫ضعفت وتآكلت‪ .‬ولعلها تلك الوصالت التي تتآكل إذا مر وقت استعامهلا ومل تستعمل‪.‬‬
‫لذلك من املهم جدا أن نعطي األوالد حقهم يف التعلم واللعب‪ ،‬ولكل س ٍّن ما يناسبه من‬
‫األلعاب وما يناسبه من املفردات وقواعد للغة ا َّلتي ُيلت ََمس تعلمها‪.‬‬
‫مبسطا لعمل اخللية العصبية‪ ،‬كام‬ ‫ولقد اجتهد العلام ُء ووضعوا نموذجا رياض ًّيا َّ‬
‫تعرضوا لكيف َّية اجلمع بني طبقات اخلاليا العصب َّية‪ ،‬عىل النَّحو امل َب َّي يف الشكل (‪.)3-4‬‬
‫َّ‬

‫املبسط للخل َّية العصب َّية‪.‬‬


‫الريايض َّ‬
‫ّ‬ ‫َّ‬
‫الشكل ‪ :3-4‬النموذج‬

‫‪-141-‬‬
‫إن الوصالت بني اخلاليا (الشكل ‪ )3-4‬حتمل األوزان «‪ »wj‬لكل إشارة ‪xj‬داخلة‬
‫للخلية؛ وإذا زاد املجموع املرجح(‪ )weighted sum‬يف حالتنا ‪ ƩNj =1wjxj‬عىل ما‬
‫يسمى «العتبة» (‪ )threshold‬ويرمز هلا بالرمز ‪( θ‬وهي قيمة تتعلمها اخللية كام تتعلم‬
‫الوصالت قيم األوزان)‪ ،‬فإن اخللية تعطي خرجا «‪ »y‬له قيمة عالية ُيعرب عنها رياضيا‬
‫بالقيمة «‪»1‬؛ وإال فإن قيمة ‪ y‬تظل «‪.»0‬‬
‫واآلن يمكننا أن نتعلم كيف تعمل اخللية العصبية للتمييز بني شكلني مثال‪ .‬فلو‬
‫كانت لكل شكل ميزات خمتلفة (الطول والعرض مثال) فإننا نقيس هذه امليزات أو‬
‫اخلصائص ونضعها يف متجه (‪ )Vector‬من اخلصائص‪:‬‬

‫()‬
‫‪x1‬‬
‫=‪X‬‬ ‫‪x2‬‬
‫‪x3‬‬

‫ثم نعيد هذه القياسات مرات عديدة لكل شكل عىل حدة‪ .‬وتعالوا نفرض أن لدينا‬
‫‪ -‬من هذه اخلصائص التي تقاس ‪ -‬اثنتني فقط (ليسهل التصور)‪ .‬لو تصورنا أن لدينا‬
‫أوال ًدا وبنات يف سن معينة‪ ،‬وكنا نقيس الطول والوزن ونحاول من خالهلام معرفة جنس‬
‫الطفل مثالً‪ ،‬فستكون قياسات األوالد والبنات عىل النَّحو امل َب َّي يف الشكل (‪.)4-4‬‬

‫َّ‬
‫الشكل ‪ :4-4‬عينات من األوالد والبنات بعد قياس الطول والوزن لكل منهم (حيث « » متثل عينة‬
‫من األوالد و «•» متثل عينة من البنات)‪.‬‬

‫‪-142-‬‬
‫واملطلوب من النموذج الريايض للخلية العصبية التفرقة بني األوالد والبنات الذين‬
‫أخذت قياساهتم‪ ،‬كام يف الشكل (‪( .)5-4‬مالحظة‪ :‬افرتاض متايز اجلنسني هبذا الشكل‬
‫ت ُّي ِ ّل بعض اليشء لغرض الرشح فقط)‪.‬‬
‫ََ‬
‫فإن ِق َي ًم لـ ‪ θ ،w2 ،w1‬يمكن الوصول‬
‫فبتدريب النموذج الريايض للخلية العصبية‪َّ ،‬‬
‫إليها بالتدريب والتعلم حتى تفصل بني عينات اجلنسني؛ فإذا كانت قيم (‪ )x2 ،x1‬متثل‬
‫أوال ًدا‪ ،‬فإن قيمة اخلرج «‪ »y‬للخلية يكون «‪ ،»1‬وإال فإنه يكون «‪ .»0‬إذن‪ ،‬كيف ُّ‬
‫يتم‬
‫تدريب اخللية؟ إن هذا أمر بسيط يف الواقع‪ ،‬ويشبه تعليم األطفال‪ .‬إننا حني نعلم‬
‫ُ‬
‫الطفل متييز هذا‬ ‫األطفال نرهيم الشكل ونقول هذا «كذا»‪ ،‬ونعيد ونكرر حتى يستطيع‬
‫الشكل وحده‪ .‬نقوم بعملية مماثلة رياض ًّيا حتى نتمكن من الوصول باألوزان (‪،w2،θ‬‬
‫‪ )w1‬لتمثيل فاصل بني عينات األوالد والبنات كام يف الشكل (‪.)4-4‬‬
‫حتى اآلن يمكن ‪ -‬من خالل نموذج ريايض خللية عصبية واحدة ‪ -‬التمييز بني‬
‫شكلني بسهولة؛ ولكن حتى نتمكن من التمييز بني أشكال معقدة جيدر بنا أن نستخدم‬
‫تراكيب معقدة ويف شكل طبقات للخاليا العصبية‪ .‬انظر الشكل (‪.)5-4‬‬

‫َّ‬
‫الشكل ‪ :5-4‬اخلاليا العصبية يف شكل طبقات‪.‬‬

‫‪-143-‬‬
‫هذه األشكال املركبة قادرة عىل تعلم التفرقة بني أشكال معقدة (وأكثر من شكلني‬
‫يف آن واحد)‪ .‬وعند تدريبها تستخدم طرق رياضية لتعليم األوزان (‪ )weights‬من‬
‫خالل استخدام اخلصائص املختلفة لألشكال املطلوب التعرف عليها‪ .‬وختيل عند كل‬
‫سهم وزن «‪ »w‬قابل للتعليم‪.‬‬
‫وتتميز الشبكات العصبية (‪ )Neural Networks‬بخصائص جذابة للعاملني يف‬
‫حقل التمييز بني األنامط‪ ،‬من أمهها‪:‬‬
‫ أن أعباء احلسابات تتوزع عىل كمية كبرية من اخلاليا العصبية‪ ،‬وكلها تعمل‬ ‫‪َّ -1‬‬
‫عىل التوازي فال يعطل بعضها بعضا‪ .‬وهذا مناسب للتطور احلادث يف تقنيات‬
‫احلواسيب‪ ،‬إذ إن هذه التقنية تتجه إىل استخدام كمية كبرية من املعاجلات( (�‪pro‬‬
‫‪ )cessors‬التي يمكن استخدامها عىل التوازي‪.‬‬
‫‪ -2‬أن األوزان (‪ )weights‬التي تتعلمها تتوزع فيها املعلومة الواحدة عىل أوزان‬
‫كثرية؛ والدليل عىل ذلك أننا لو عطلنا (يف الشكل ‪ )5-4‬عد ًدا من نامذج اخلاليا‬
‫العصبية (مثال ‪ ٪10‬من املتاح منها ‪ -‬بغرض التجربة)‪ ،‬فغالبا ستظل تعمل‬
‫بكفاءة تامة؛ وهذا بالضبط ما حيدث يف مخ اإلنسان‪ ،‬إذ متوت كل يوم خاليا‬
‫كثري جدًّ ا من هذه‬
‫ويظل املخ يعمل بكفاءة تامة‪ ،‬إال إذا تأخر العمر ومات ٌ‬
‫اخلاليا‪ ،‬أو عند حدوث حادث يصيب خاليا املخ بشدة؛ عندئذ ربام تضعف‬
‫هذه الكفاءة‪ .‬هذه اخلاصية مهمة جدًّ ا للكائنات احلية‪ ،‬ألهنا تتعرض لإلصابة‬
‫واملرض مما يعطى فرصة لفقد بعض اخلاليا‪ ،‬أو حتى لعامل الزمن‪ .‬بينام يف‬
‫أي يشء‪،‬‬ ‫احلاسبات املألوفة لدى البرش ال تتحمل الربامج التقليدية أن تُفقدها َّ‬
‫فورا‪.‬‬
‫وإال تعطلت عن العمل ً‬
‫إال أن هناك مشكلة تواجه الباحثني يف جمال اخلاليا العصبية‪ ،‬وهي أهنم عند تركيب‬
‫عدد كبري منها حلل مشكلة بعينها ال يمكنهم الوصول للحل األمثل‪ ،‬وإنام حياولون‬
‫الوصول إىل أحسن حل ممكن‪ ،‬وليس هناك ما يضمن أنه احلل األمثل‪.‬‬
‫وهناك مشكلة أخرى‪ ،‬تكمن يف أهنم ال يعرفون سل ًفا طريق ًة لرتكيب هذه اخلاليا‬
‫حتى نضمن أحسن حل للمشكلة املراد استخدام النموذج الريايض للخاليا العصبية‬

‫‪-144-‬‬
‫يف حلها‪ .‬أي‪ ،‬ال يعرفون عدد طبقات اخلاليا وعدد اخلاليا يف كل طبقة ‪ -‬كل ذلك‬
‫حياولون فيه بالتجربة واخلطأ‪.‬‬

‫‪ -4‬آل َّيات املتجهات الداعمة (‪)Support Vector Machines -SVM‬‬


‫إنه نوع جديد نسبيا من املصنفات (‪ ،)classifiers‬أثبتت نتائجه تفوقه عىل كثري من‬
‫املصنفات األخرى‪ .‬وقد قدمه العامل (فابنيك) عام ‪ .1995‬ولكي نفهم املبادئ التي‬
‫تقوم عليها آل َّيات املتَّجهات الدَّ اعمة علينا أن ننظر إىل حالة وجود صنفني فقط من‬
‫األصناف املراد التفريق بينها‪ .‬انظر الشكل (‪.)6-4‬‬

‫َّ‬
‫الشكل ‪ :6-4‬بيانات صنفني‪ ،‬لكل منهام رمز خمتلف‪.‬‬

‫إن أي خط بني الصنفني سيكون كافيا للفصل بني الصنفني كام يف الشكل (‪،)6-4‬‬
‫ولكن هناك فاصل سيكون هو األفضل عىل اإلطالق‪ ،‬حيث يكون يف نصف املسافة‬
‫اجتاها يكون الفاصل فيه بني الصنفني أكرب ما يمكن‪ ،‬بحيث لو‬
‫أن له ً‬‫بينهام متاما‪ ،‬كام َّ‬
‫سيمس نقا ًطا تتبع الصنف‬
‫ُّ‬ ‫رسمنا خطني متوازيني من ناحيتي «الفاصل األفضل»‬
‫األول ونقا ًطا تتبع الصنف َ‬
‫اآلخر‪ .‬انظر الشكل (‪ .)7-4‬وهلذه النقاط أمهية كبرية‪،‬‬
‫أساسا يف معادلة «الفاصل األفضل» ولذلك تسمى «املتجهات‬ ‫ً‬ ‫إذ هي التي تساهم‬
‫الداعمة» (‪.)Support Vectors- SV‬‬

‫‪-145-‬‬
‫َّ‬
‫الشكل ‪ :7-4‬أفضل فاصل بني الصنفني والنقاط التي متس احلدود (املتجهات الداعمة)‪.‬‬

‫لنفرض‪:7‬أن‪:‬‬
‫أفضل فاصل بني الصنفني والنقاط اليت ُتس احلدود (املتجهات الداعمة)‪.‬‬ ‫معادلة احلل‪:‬الشَّكل ‪-4‬‬

‫الصفات واخلصائص التي يمكن قياسها‪ ،‬واملطلوب استخدامها‬ ‫يمثل متجه‬


‫لنفرض أن‪:‬‬ ‫‪:X‬‬
‫معادلة احلل‪:‬‬
‫املقاسة خصائصها‪ .‬هل تتبع الصنف األول أو الصنف َ‬
‫اآلخر؟‪.‬‬ ‫َ‬ ‫ملعرفة النقطة‬
‫‪ُ :‬يثل متجه الصفات واخلصائص اليت ُيكن قياسها‪ ،‬واملطلوب استخدامها ملعرفة‬
‫األول‪.‬‬ ‫الصنف َ‬
‫اآلخر؟‪.‬‬ ‫تتبع الصنف‬ ‫املقاسة‬
‫األول أو‬ ‫النقطة‬
‫الصنف َ‬ ‫كانت‬
‫هل تتبع‬ ‫تساوية ‪ 1+‬إذا‬
‫خصائصها‪.‬‬ ‫املقاس‬ ‫‪:yi‬‬
‫النقطة َ‬
‫األول‪ .‬الثاين‪.‬‬
‫الصنف‬ ‫تتبعتتبع‬
‫الصنف‬ ‫املقاسة‬
‫النقطة َ‬
‫املقاسة َ‬ ‫كانتالنقطة‬
‫إذا كانت‬ ‫تساوي‪1-‬‬
‫‪ +1‬إذا‬ ‫وتساوي‬
‫𝑖𝑖𝑦𝑦‪:‬‬
‫‪i =1,‬تتبع الصنف الثاين‪.‬‬
‫املقاسة‬
‫‪َ …,‬‬ ‫كانتأن ‪n‬‬
‫النقطة‬ ‫إذا أى‬
‫العينة‬
‫افراد ‪-1‬‬
‫‪ :n‬عددوتساوي‬
‫الوصول إىل قيمها ملعرفة معادلة اخلط الفاصل‬ ‫املطلوب‪i =1,‬‬
‫الثوابت أن 𝑛𝑛 ‪…,‬‬
‫مناد العينة أى‬ ‫‪:𝑛𝑛:w‬متجه‬
‫عدد افر‬
‫األفضل‪ :.‬متجه من الثوابت املطلوب الوصول إىل قيمها ملعرفة معادلة اخلط الفاصل األفضل‪.‬‬
‫𝑤𝑤‬
‫الذياخلط‬
‫معادلة‬ ‫حيث‬
‫اخلط (و‬ ‫األفضل‪،‬‬
‫معادلة‬ ‫بالفاصل‬
‫األفضل‪ ،‬حيث‬ ‫اخلاصة‬
‫ابلفاصل‬ ‫املعادلة‬
‫اخلاصة‬ ‫ملعرفةاملعادلة‬
‫مطلوبة ملعرفة‬ ‫كميةثابتة‬
‫اثبتة مطلوبة‬ ‫كمية‬
‫‪: b :b‬‬
‫األفضل‪:‬للفاصل األفضل‪:‬‬
‫للفاصلاألبعاد)‬ ‫مستوى ذا ب ٍ‬
‫األبعاد)متعدد‬
‫عد أو‬ ‫يكونذا ب ٍ‬ ‫(والذي يمكن أن‬
‫عد أو ُ‬
‫متعدد‬ ‫ُيكن أن يكون مستوى ح‬
‫‪TǦX-b=0w‬‬
‫𝑤𝑤‪„ൌ0‬‬
‫احلل كاآليت‪:‬‬
‫كاآليت‪:‬‬ ‫ويكوناحلل‬
‫ويكون‬
‫𝑛𝑛‬ ‫𝑛𝑛‬

‫𝑖𝑖‪𝑤𝑤 = ∑ 𝑎𝑎𝑖𝑖 𝑦𝑦𝑖𝑖 X‬‬ ‫𝑘𝑘‪𝑏𝑏 = 𝑦𝑦𝑘𝑘 − ∑ 𝑎𝑎𝑖𝑖 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖 𝑇𝑇 X‬‬ ‫‪𝑓𝑓𝑓𝑓𝑓𝑓 𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎𝑘𝑘 > 0‬‬
‫‪𝑖𝑖=1‬‬ ‫‪𝑖𝑖=1‬‬
‫‪152‬‬

‫‪-146-‬‬
‫أكربقيمة‬
‫قيمةوله‬ ‫حيث 𝑖𝑖𝑎𝑎 قيم الزمة للحل‪ .‬وأتخذ القيمة «‪ »0‬للمتجه البعيد عن احلدود وله‬
‫احلدود‬ ‫حيث ‪ ai‬قيم الزمة للحل‪ .‬وتأخذ القيمة «‪ »0‬للمتجه البعيد عن‬
‫من «‪ »0‬إذا كان من املتجهات الداعمة‪ .‬ونقسم جمموعة املتجهات الداعمة •‪.‬‬
‫أكرب من «‪ »0‬إذا كان من املتجهات الداعمة‪ .‬ونقسم جمموعة املتجهات الداعمة ‪.s‬‬
‫وُيكن أن نكون دالة التميز )𝑥𝑥(𝑓𝑓 واليت تكون قيمتها كافية حلسم النقطة إىل أي الصنفني‬
‫نكوّن دالة ّ‬
‫التم ّيز (‪ f(x‬والتي تكون قيمتها كافية حلسم ّ‬
‫أي‬
‫النقطة إىل ّ‬ ‫ويمكن أن ّ‬
‫تنتمي‪:‬‬
‫الصنفني تنتمي‪:‬‬
‫𝑇𝑇‬
‫𝑏𝑏 ‪𝑓𝑓(𝑥𝑥) = ∑ 𝑎𝑎𝑖𝑖 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖 𝑋𝑋𝑘𝑘 +‬‬
‫𝑠𝑠∈ 𝑖𝑖‪x‬‬

‫جمموعة‬
‫املتجهات‬ ‫املجموعة ‪s‬‬
‫جمموعة أى‬ ‫املنتمية إىل‬
‫اجملموعة • أى‬ ‫املتجهات املنتمية إىل‬ ‫جمموعة‬
‫املتجهات 𝑋𝑋‪i‬‬ ‫ومصطلح 𝑠𝑠 ∈ 𝑖𝑖𝑋𝑋 أى‬
‫أى جمموعة‬ ‫ومصطلح‬
‫الداعمة‪.‬الداعمة‪.‬‬
‫املتجهات‬
‫فصلها‪ .‬إن‬
‫املرادإن الوصول‬ ‫الصنفني‬
‫فصلها‪.‬‬ ‫فاصل بني‬
‫الصنفني املراد‬ ‫أفضل‬
‫فاصل بني‬ ‫طابعأنهأنهأفضل‬
‫حيملطابع‬
‫أبنه حيمل‬‫احللبأنه‬
‫هذاهذااحلل‬ ‫ويتميز‬
‫ويتميز‬
‫باملعادالت الرياضية‪.‬‬ ‫حسمه‬
‫ًّيضية‪.‬‬ ‫حسمهَّام يمكن‬
‫ابملعادالت الر‬ ‫واخلطأ‪ ،‬وإن‬ ‫بالتجربة َّ‬
‫وإمنا ُيكن‬ ‫ليسبة واخلطأ‪،‬‬
‫إليهابلتجر‬
‫الوصولليس‬
‫إليه‬

‫املثاليةفقط‬
‫وليس‬ ‫الصنفني‪،‬‬
‫للحالة‬ ‫نقاطوليس فقط‬ ‫نقاطفيها‬
‫الصنفني‪،‬‬ ‫تتداخل‬ ‫للحاالت التي‬
‫تتداخل فيها‬ ‫محلهللحاالت اليت‬
‫يمكن محله‬
‫احلل ُيكن‬‫احلل‬‫وهذاوهذا‬
‫األوضاع الَّيت‬
‫ذكية يف‬ ‫حالة بطريقة‬
‫استعامله‬ ‫يمكن‬
‫ذكية يف‬ ‫استعمالهبلبطريقة‬
‫ليسُيكنفحسب؛‬ ‫سابقا‪ .‬بل‬
‫تناولناهافحسب؛‬ ‫لناهاالتي‬
‫سابقا‪ .‬ليس‬ ‫املثالية‬ ‫للحالة‬
‫اليت تناو‬
‫الفضاء‪ .‬اخلطي ‪.Linear Space‬‬ ‫يف ‪Linear‬‬ ‫اخلطياحلل‬
‫‪Space‬‬ ‫الفضاء فيها‬
‫يستحيل‬ ‫فيهاا َّلتي‬
‫احلل يف‬ ‫حالة يستحيل‬
‫األوضاع‬
‫الشكلال ُيكن‬
‫(‪،)8-4‬‬ ‫الشكلمن(‪،)8-4‬‬
‫من (‪)a‬‬ ‫كام يفترى‬
‫(‪ )a‬يف‬ ‫(‪)8-4‬؛ ترى‬
‫الشكل‪)8-4‬؛ كما‬
‫انظرالشكل (‬
‫للتوضيح‪ .‬انظر‬
‫مثاالمثاال للتوضيح‪.‬‬
‫خذ خذ‬
‫‪2‬‬ ‫مكان ‪ ،)X‬أمكن‬
‫(استخدام ‪X‬‬
‫‪2‬‬
‫(استخدام ‪X‬‬
‫تربيع ‪X‬‬ ‫الصنفني؛بيع ‪X‬‬
‫ولكن عند‬ ‫بنيلكن عند تر‬
‫الصنفني؛ و‬
‫خطيةبنيللفصل‬
‫معادلةللفصل‬
‫معادلة خطية‬ ‫ال إجياد‬
‫يمكن إجياد‬
‫الصنفني‪ .‬للفصل بني الصنفني‪.‬‬ ‫ابلرسم إجياد معادلة خطية للفصل بني‬
‫معادلة خطية‬ ‫مكان ‪ ،)X‬أمكن بالرسم إجياد‬
‫)‪Φ(X‬‬ ‫حيث‬ ‫ولتعميم الفكرة َّ‬
‫فإن احلل يظل احلل األفضل لو استبدلنا ‪ X‬بـ‬
‫)‪ Φ(X‬حيث‬
‫استبدلنا بـ‬ ‫فإن احلل يظل احلل األفضل لو‬ ‫ولتعميم الفكرة َّ‬
‫حتويل غري خطي للمتجه ‪.X‬‬
‫حتويل غري خطي للمتجه ‪.‬‬
‫هذه العملية قد يكتنفها تعقيدات غري سهلة‪ ،‬كما َّ‬
‫أن احلل األفضل ليس مضموان يف بعض‬
‫ً‬
‫ليس مضمونًا يف‬ ‫َ‬
‫األفضل َ‬ ‫أن َّ َّ‬
‫احلل‬ ‫هذه العملية قد يكتنفها تعقيدات غري سهلة‪ ،‬كام َّ‬
‫األحوال‪ ،‬إذ قد حنتاج لتجربة هذه العملية‪ ،‬واليت تسمى نقل املشكلة إىل فضاء آخر أكثر من‬
‫بعض األحوال‪ ،‬إذ قد نحتاج لتجربة هذه العملية‪ ،‬والتي تسمى نقل املشكلة إىل فضاء‬
‫مرة‪ ،‬مع أنواع خمتلفة من هذه الفضاءات‪ ،‬أي األنواع املختلفة من )‪.Φ(X‬‬
‫‪.‬‬ ‫آخر أكثر من مرة‪ ،‬مع أنواع خمتلفة من هذه الفضاءات‪ ،‬أي األنواع املختلفة من‬

‫‪‬‬ ‫‪153‬‬ ‫‪‬‬ ‫‪‬‬ ‫‬


‫(‪)a‬‬
‫اخلطي‪)a()a‬‬ ‫الفضاء‬
‫اخلطي (‬ ‫بينهما يف‬
‫الفضاء‬ ‫الفصلبينهام يف‬
‫الفصل‬‫ُيكن‬ ‫وال) وال‬
‫يمكن‬ ‫‪2 ،)2‬‬
‫(‪1( ،1‬‬
‫الصنفان‬ ‫يتداخل‬
‫الصنفان‬ ‫يتداخل‬

‫‪-147-‬‬
‫(‪)b‬‬
‫إمكانية إجياد ّ‬
‫حل إذا ر ّبعنا القيمة املقاسة ‪ x‬واملستخدمة للفصل بني الصنفني‬
‫الشكل ‪ :8-4‬كيفية حل مشكلة يستحيل حلها يف الفضاء اخل ِّط ّي‪.‬‬
‫َّ‬

‫ومن املالحظ أنه يف احلل (‪ f(x‬املذكور عاليه ال تظهر ‪ x‬وحدها‪ ،‬ولكن دائام تظهر‬
‫؛ فهل‬ ‫؛ لذلك سيظهر يف احلل بعد عملية االنتقال‬ ‫كاآليت‬
‫أصال؛ احلقيقة ال‪ ،‬وهذا أفضل كثريا ألن الكمية‬ ‫نحن يف حاجة حلساب‬

‫؛ ولكن لذلك‬ ‫يف كثري من األحيان يكون حساهبا أسهل بكثري من حساب‬
‫رشوط رياضية‪ .‬وتسمى الدوال التي ختضع للرشوط الرياضية هذه (والتي جتعل‬
‫حساهبا ميسورا) بالدوال النواة أو الدوال اجلوهرية (‪.)Kernel Functions‬‬

‫‪ -5‬نامذج ماركوف ا ُملخَ َّبأة (‪)Hidden Markov Models - HMMs‬‬

‫الـم َخ َّبأة جمموعة من النامذج الرياضية ا َّلتي تُستَخدَ م يف العديد‬


‫ُت َ ِّثل نامذج ماركوف ُ‬
‫َّامذج‬
‫تقنيات اللغات الطبيعية‪ .‬وتُستخدَ م هذه الن ُ‬ ‫ُ‬ ‫من التَّطبيقات؛ ومن هذه التَّطبيقات‬
‫التعرف عليها عىل أهنا سلسلة‬ ‫ُعرف فيها النامذج املراد ُّ‬
‫أساسا للتعامل مع الظواهر التي ت َّ‬‫ً‬

‫‪-148-‬‬
‫من الوحدات املتتابعة‪ .‬خذ مثاالً لذلك؛ كلمة مثل‪« :‬كتب» (مكتوبة ومنطوقة)؛ فإهنا‬
‫ُعرف عىل أهنا تتابع من وحدات (كتابية أو صوتية)‪.‬‬
‫مثل أي كلمة ت َّ‬
‫ونبدأ بالتدرج لرسم احلاالت (‪ ،)State Diagram‬وتشمل حاالت اليقني‬
‫لالحتامالت املتعددة واملتداخلة‪.‬‬
‫رسم احلاالت (‪)State Diagram‬‬
‫ِ‬
‫يتقلب اإلنسان عمليا بني حاالت كثرية؛ وفيام ييل بعض األمثلة التَّوضيح َّية‪.‬‬
‫‪ -1.5‬مثال‪:1‬‬
‫حييى اإلنسان يف األسبوع بني أيام اجلمعة‪ ،‬فالسبت‪ ،‬فاألحد‪ ،‬فاإلثنني‪ ،‬فالثالثاء‪،‬‬
‫فاألربعاء‪ ،‬فاخلميس‪ ،‬ثم يعود للجمعة مرة أخرى‪ .‬ويف كل يوم من هذه األيام تكون‬
‫الشكل‬‫لإلنسان حالة خمتلفة؛ فإما أن يكون يف عمل أو إجازة؛ ويمكن توضيح ذلك يف َّ‬
‫(‪.)9-4‬‬

‫الشكل ‪ :9-4‬بيان حاالت اإلنسان أليام األُسبوع‪.‬‬


‫َّ‬

‫باعتبار أن اإلنسان الذي حييى يف يوم اإلثنني ُت َ ِّثله احلالة ‪ 4‬أو ‪.)S4 )State 4‬‬
‫وينتقل اإلنسان من حالة إىل أخرى يوم ًّيا الساعة ‪ 12‬صباحا‪ .‬وليس يف هذا املثال‬
‫احتامالت وإنام هو مثال للحاالت التي حيصل فيها انتقال حمدد وغري احتاميل ألنه عند‬
‫أي مكان حمدد عىل األرض سيكون اإلنسان يف حالة حمددة من أيام األسبوع‪.‬‬
‫‪ -2.5‬مثال‪:2‬‬
‫حالة اإلنسان االجتامعية؛ فاإلنسان يتقلب بني هذه احلاالت‪:‬‬
‫Ÿ Ÿ َع َزب‪.‬‬
‫Ÿ Ÿ قد يتزوج‪.‬‬

‫‪-149-‬‬
‫Ÿ Ÿوقد يطلق‪.‬‬
‫Ÿ Ÿ َّ‬
‫متوف‪.‬‬
‫ويمكن رسم هذه احلاالت كام َّ‬
‫بالشكل (‪)10-4‬‬

‫الشكل ‪ :10-4‬احلاالت االحتامل َّية األربعة ‪.S1, S2, S3, S4‬‬


‫َّ‬

‫عز ًبا إىل الوفاة‪ ،‬وكذلك‬


‫كام هو مبني يف الرسم فإن ال َع َز َب إما أن يتزوج وإما أن يظل َ‬
‫املتزوج إما أن يظل كذلك حتى الوفاة أو ربام يطلق ثم يتوىف أو ربام تتوىف زوجته فيصبح‬
‫أرمالً‪ ،‬وربام يتزوج أو يبقى كذلك حتى الوفاة‪.‬‬
‫ولكن يف حالتنا هذه ليست احلاالت حمددة وإنام احتاملية‪ .‬وبدراسة حياة ‪ 100‬حالة‬
‫يف بلد ما وجدنا هذه األرقام‪:‬‬
‫عز ًبا ‪ 10‬أفراد‪.‬‬
‫Ÿ Ÿعدد من عاش عمره كله َ‬
‫Ÿ Ÿعدد من تزوج ‪ ،90‬ومن طلق أو فقد زوجه ‪ ،30‬أو ثلث من تزوج أى ‪.%33‬‬
‫Ÿ Ÿ‪ 20‬ممَّن طلق أو ترمل تزوج مرة أخرى‪ ،‬أى الثلثان بنسبة ‪.%67‬‬
‫ويمكننا إعادة رسم الشكل (‪ )10-4‬ل ُيصبِ َح عىل النَّحو امل َب َّي يف الشكل (‪.)11-4‬‬

‫‪-150-‬‬
‫الشكل ‪ :11-4‬إحصاء احلاالت االحتامل َّية األربعة ‪.S1, S2, S3, S4‬‬
‫َّ‬

‫يف الشكل (‪ )11-4‬يمكن مالحظة اآليت‪:‬‬


‫Ÿ Ÿأن كل حالة خيرج منها ســهم أو أكثر يكون جمموع االحتامالت لألسهم‬
‫اخلارجية ‪.1‬‬
‫َّ‬
‫املتوف بالطبع عىل حاله مهام طال الزمن وال تتغري حالته؛‬ ‫Ÿ Ÿيف حالة الوفاة يبقى‬
‫ويعرب عن هذا الوضع بالسهم اخلارج والداخل حلالة الوفاة‪ ،‬وعليه االحتامل‬
‫‪ 1‬أي املؤكد‪.‬‬
‫و ُيمكن من خالل املصفوفة ‪ A‬وضع املسألة التي بني أيدينا يف شكل ريايض عىل‬
‫النَّحو التَّايل‪:‬‬

‫‪-151-‬‬
‫و ُت َل َّخص املصفوفة ‪ A‬عن املسألة السابقة‪ ،‬حيث ن َُحدِّ د احتامل االنتقال بني كل‬
‫حالتني من (‪ )S1, S2, S3, S4‬بالرقم املذكور بينهام‪ .‬مثال؛ االحتامل أن ننتقل من احلالة ‪2‬‬
‫إىل احلالة ‪ 3‬يساوى ‪ 0.33‬وهكذا‪.‬‬
‫بعد أن تعرفنا عىل رسم احلاالت‪ ،‬سواء أكان مؤكدً ا (‪ )Deterministic‬أم احتامل ًّيا‬
‫(‪ ،)Probabilistic‬سنُحاول أن ِ‬
‫نعر َض مثاالً أكثر تعقيدً ا‪.‬‬
‫‪ -3.5‬مثال‪:3‬‬
‫تعال نتصور أن لدينا ‪ 3‬أوعية ويف كل وعاء عدة ألوان‪ ،‬ولتكن أربعة ألوان (أمحر‪،‬‬
‫أخرض‪ ،‬أزرق‪ ،‬أصفر)؛ وسنرمز لأللوان األربعة بالرموز (‪ .)R, G, B, Y‬نريد أن‬
‫نصف عملية معقدة إلخراج األلوان كاآليت‪:‬‬
‫بأي األوعية نبدأ (يمكن أن نحول الزهر السدايس إىل‬
‫زهرا لنحدد ّ‬‫Ÿ Ÿسنلقي ً‬
‫ثالثي إذا اعتربنا أن رقمي (‪1>= 2 ،1‬؛ ‪2 >= 4 ،3‬؛ ‪)3 >= 6 ،5‬؛ وبذلك‬
‫سنحدد بأي األوعية نبدأ‪ .‬ويمكن التعبري الريايض عن ذلك كاآليت‪:‬‬
‫)‪π = (π1, π2, π3‬‬

‫حيث ‪ π‬بمكوناهتا الثالثة متثل احتامالت البدء لكل وعاء‪ ،‬والرشط أن يكون‪:‬‬
‫‪(π1+ π2+ π3) =1‬‬

‫Ÿ Ÿيف كل فرتة زمنية حمددة ‪ -‬ولتكن كل دقيقة‪ -‬سنلقى الزهر مرة أخرى لنحدد‬
‫رقم الوعاء القادم‪ ،‬فربام كان نفس الوعاء أو وعا ًء آخر‪ .‬ونعرب عن ذلك‬
‫بمصفوفة ‪ A‬كام ييل‪:‬‬

‫عبنا عن اإلناء‬
‫َو ُت ّعرف ‪ A‬بأهنا مصفوفة احتامالت االنتقال بني األواين؛ وإذا َّ‬
‫فسوف يكون بإمكاننا تسمية ‪« A‬مصفوفة‬ ‫َ‬ ‫الذي عليه الدور باحلالة (‪)State‬‬
‫االحتامالت االنتقالية» بني احلاالت املختلفة املتاحة (‪Transition Matrix‬‬
‫‪ .)State‬مع رشط‪:‬‬

‫‪-152-‬‬
‫‪(α1+ α2+ α3) =1‬‬

‫الصفوف‪.‬‬
‫وكذلك يف بق َّية ُّ‬
‫Ÿ Ÿيف كل مرة نقف عىل إناء سوف نمد أيدينا ونأخذ لونًا من ألوانه األربعة املتاحة‬
‫عشوائ ًّيا (بافرتاض وجود عدد كبري من كل لون ال يؤثر عىل النسب بينها أو أهنا‬
‫تعوض ما ُأخذ منها حفا ًظا عىل النسب بينها)‪.‬‬
‫وألن كل إناء حيتوي عىل نسب خمتلفة فإن احتامل خروج أي لون خيتلف من إناء‬
‫عب عن ذلك باملصفوفة ‪ ، B‬حيث‪:‬‬ ‫آلخر‪ .‬و ُي َّ‬

‫وهكذا َّ‬
‫فإن ‪ b23‬تعني احتامل اللون األزرق يف احلالة الثانية‪ .‬مع رشط‪:‬‬
‫‪(α11+ α12+ α13+ α14) =1‬‬

‫وكذلك يف بق َّية األعمدة‪.‬‬


‫‪ -4.5‬مثال‪:4‬‬
‫حتم من اإلناء األول‪ ،‬حيث ُيسمح فقط لالنتقال لإلناء الالحق مع‬
‫بافرتاض البدء ً‬
‫جتهيز الزهر لذلك؛ بمعنى أنه يأخذ القيمة ‪ 1‬أو ‪ 2‬فقط (يف هذا املثال يمكن استخدام‬
‫العملة «ملك = ‪،1‬كتابة = ‪.)»2‬‬
‫إذا كان ‪ ←1‬نفس احلالة (اإلناء)‪.‬‬
‫إذا كان ‪ ←2‬االنتقال لإلناء اآلخر؛ حتى إذا وصل إىل اإلناء األخري توقف االنتقال‪.‬‬
‫هب أننا بعد وضع الضوابط للمسألة كام أسلفنا وبعد طرح الزهر مرات كثرية‬
‫عديدة سجلنا االحتامالت اآلتية‪:‬‬

‫‪-153-‬‬
‫االنتقال‪..‬‬
‫توقف االنتقال‬
‫األخري توقف‬
‫اإلانء األخري‬
‫إىل اإلانء‬
‫وصل إىل‬
‫إذا وصل‬
‫حىت إذا‬
‫اآلخر؛ حىت‬
‫لإلانء اآلخر؛‬
‫االنتقال لإلانء‬ ‫كان ‪←22‬‬
‫← االنتقال‬ ‫إذا كان‬
‫إذا‬
‫عديدة‬
‫كثرية عديدة‬
‫ات كثرية‬
‫الزهر ممررات‬
‫ح الزهر‬
‫طرح‬
‫وبعد طر‬
‫أسلفنا وبعد‬
‫كما أسلفنا‬
‫للمسألة كما‬
‫ابط للمسألة‬
‫الضووابط‬
‫وضع الض‬
‫بعد وضع‬
‫أننا بعد‬
‫هب أننا‬
‫هب‬
‫اآلتية‪:‬‬
‫االحتماالت اآلتية‪:‬‬
‫سجلنا االحتماالت‬
‫سجلنا‬
‫‪0.8‬‬ ‫‪0.2‬‬ ‫‪0.8‬‬
‫‪0.8‬‬ ‫‪0.1‬‬
‫‪0.1‬‬ ‫‪0.1‬‬
‫‪0.1‬‬
‫‪0.8‬‬ ‫‪0.2‬‬ ‫‪00‬‬ ‫‪0.1‬‬ ‫‪0.7‬‬
‫‪0.1‬‬ ‫‪0.7‬‬ ‫‪0.1‬‬
‫)‪0.1‬‬
‫‪𝜋𝜋 = [1,0,0] ; 𝐴𝐴 = ( 00‬‬
‫𝜋𝜋‬ ‫=‬ ‫[‬ ‫‪1,0,0‬‬ ‫]‬ ‫;‬ ‫𝐴𝐴‬ ‫=‬ ‫(‬ ‫‪0.7‬‬
‫‪0.7‬‬ ‫)‪0.3‬‬
‫‪0.3‬‬ ‫𝐵𝐵 ;; )‬ ‫(=‬
‫= 𝐵𝐵‬ ‫‪(0.05‬‬ ‫‪0.1‬‬ ‫‪0.3‬‬ ‫)‬
‫‪00‬‬ ‫‪00‬‬ ‫‪11‬‬ ‫‪0.05‬‬
‫‪0.05‬‬ ‫‪0.1‬‬
‫‪0.1‬‬ ‫‪0.3‬‬
‫‪0.5‬‬
‫‪0.05‬‬ ‫‪0.1‬‬ ‫‪0.5‬‬

‫َّايل‪:‬التَّايل‪:‬‬
‫َّحوالنالتَّحو‬
‫بالرسمالنعىل‬ ‫املسألةاملسألة‬
‫ابلرسم على‬ ‫هذه هذه‬
‫التعبري عن‬ ‫ويمكن‬
‫التعبري عن‬ ‫وُيكن‬
‫وُيكن التعبري عن هذه املسألة ابلرسم على النَّحو التَّايل‪:‬‬

‫‪R‬‬
‫‪R‬‬ ‫‪0.8‬‬
‫‪0.8‬‬ ‫‪0.1‬‬
‫‪0.1‬‬ ‫‪0.1‬‬
‫‪0.1‬‬
‫‪G‬‬
‫‪G‬‬ ‫‪0.1‬‬
‫‪0.1‬‬ ‫‪0.7‬‬
‫‪0.7‬‬ ‫‪0.1‬‬
‫)‪0.1‬‬
‫(‬
‫‪(0.05‬‬
‫‪B‬‬
‫‪B‬‬ ‫‪0.05‬‬ ‫‪0.1‬‬
‫‪0.1‬‬ ‫)‪0.3‬‬
‫‪0.3‬‬
‫‪Y‬‬ ‫‪0.05‬‬
‫‪0.05‬‬ ‫‪0.1‬‬
‫‪0.1‬‬ ‫‪0.5‬‬
‫‪0.5‬‬
‫‪Y‬‬

‫ترتيب األلوان من اليسار إىل اليمني‪ ،‬وال نعرف‬


‫‪160‬‬ ‫وإليك املسألة؛ هب أننا حصلنا عىل‬
‫‪160‬‬
‫أي وعاء؛ كل ما نعرفه أن اللون األول (‪ R‬يف حالتنا) ُأخذ ً‬
‫حتم من‬ ‫خرج من ّ‬
‫أي األلوان َ‬ ‫َّ‬
‫اإلناء األول ‪ S1‬وأن اللون األخري (‪ Y‬يف حالتنا) ُأخذ من اإلناء األخري ‪.S3‬‬
‫‪Time:‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪4‬‬ ‫‪5‬‬ ‫‪6‬‬ ‫الزمن‪:‬‬
‫‪Colors:‬‬ ‫‪R‬‬ ‫‪R‬‬ ‫‪G‬‬ ‫‪G‬‬ ‫‪B‬‬ ‫‪Y‬‬ ‫األلوان‪:‬‬

‫لعلمت‬
‫َ‬ ‫فكرت قليال‬
‫َ‬ ‫نريد أن نعرف ترتيب األواين‪ ،‬إذ يف معرفتها ٌّ‬
‫حل للمشكلة‪ .‬لو‬
‫أن هناك احتامالت كثرية جدًّ ا لرتتيب تلك األواين‪ ،‬وهي تؤدي إىل نفس ترتيب األلوان‬
‫املذكورة عاليه‪ .‬ويمكن رسم املسارات املمكنة كام يف الشكل (‪.)12-4‬‬

‫‪-154-‬‬
‫َّ‬
‫الشكل ‪ :12-4‬عرض ملسارات احلل املمكنة باستعراض احلاالت املتاحة مع الزمن‪.‬‬

‫لو تتبعت الشبكة املرسومة يف الشكل (‪ )12-4‬ألمكنك تت ُّبع عرشة مسارات‬


‫خمتلفة‪ ،‬ولو اخرتنا أحد هذه املسارات (املؤرش يف الشكل)‪ ،‬كيف نحسب احتاملية هذا‬
‫املسار كمثال؟‬
‫احتاملية املسار املختار للدراسة = (‪P(of the selected path‬‬

‫ ‬
‫‪-155-‬‬
‫وهكذا لو حسبنا املسارات العرشة سوف نجد أن أحد هذه املسارات هو األعىل‬
‫وير َّشح هذا املسار ألن يصف ترتيب األواين التي تعاملنا معها عرب ‪ 6‬وقفات‬
‫احتامال؛ ُ‬
‫َّضح ما قمنا به فإننا عند كل وقفة زمنية نحسب‪:‬‬
‫زمنية‪ .‬وحتى يت َ‬
‫(احتامل أن نصل إىل احلالة (اإلناء) التي وصلنا إليها) * (احتامل خروج اللون الذي‬
‫خرج من اإلناء الذي نقف عنده)‬
‫ثم نكرر ذلك عرب الوقفات الزمنية كلها‪.‬‬
‫ويسمى هذا النموذج الريايض «نموذج ماركوف املـ َُخ َّبأ» (‪ .)HMM‬وهلذا النموذج‬
‫الريايض ‪ 3‬مسائل‪:‬‬
‫املسألة األوىل‪:‬‬
‫إذا توافرت كميات مناسبة من املشاهدات املتتابعة‬
‫‪O = o1 ,o2 ,…oT‬‬

‫وتوفر كذلك نموذج ‪ ،HMM‬ويعرف رياض ًّيا كاآليت‪:‬‬


‫(‪λ = (π,A,B‬‬
‫فام هو احتامل أن تنتمي املشاهدات إىل النموذج الريايض ‪HMM‬؟‬
‫ويعرب عن ذلك بـ (‪P(O/λ‬‬

‫املسألة الثانية‪:‬‬
‫املعطى‪ :‬املشاهدات املتا َبعة‬
‫‪O = o1 ,o2 ,…oT‬‬

‫الريايض‪:‬‬
‫ّ‬ ‫وكذلك نموذج ‪HMM‬‬
‫(‪λ = (π,A,B‬‬
‫واملطلوب معرفة تتابع احلاالت (‪ )State Sequence‬األكثر احتامال؛ وتسمى هذه‬
‫املشكلة فيرتيب ‪.Viterbi‬‬

‫‪-156-‬‬
‫املسألة الثالثة‪:‬‬
‫ِ‬
‫ياض (‪.λ = (π,A,B‬‬
‫الر ّ‬
‫املعطى‪ :‬املشاهدات ‪ .O‬واملطلوب‪ :‬تقدير قيم معامالت النَّموذج ِّ‬
‫أي تقدير قيم ‪ ،πi , bik , aij‬والتي جتعل الكمية (‪ P(O/λ‬أعىل ما يمكن‪.‬‬
‫الـم َخ َّبأة‪ ،‬تعالوا نراجع بعض‬
‫وقبل اخلوض يف احلسابات املرتبطة بنامذج ماركوف ُ‬
‫التعريفات‪.‬‬
‫‪O = o1 ,o2 , o3 , o4 ,…oT‬‬

‫تعني سلسلة املشاهدة ‪ ،O‬والتي تتكون من عدد ‪ T‬مشاهدة؛ تعني يف حالتنا سلسلة‬
‫األلوان املتتابعة والتي من املفرتض أن نبحث فيها عن سلسلة األواين التي أخرجنا منها‬
‫هذه األلوان املتتابعة‪.‬‬
‫عدد احلاالت (األواين) يف النموذج حتت الدراسة =‪N‬‬

‫عدد األلوان التي يمكن استخراجها من أي أناء =‪M‬‬

‫رمز لكل حالة أو أناء ‪S = S1 , S2 , S3 , ... SN‬‬

‫مصفوفة االنتقال بني احلاالت‪ ،‬حيث ‪ aij‬يمثل املكون {‪A= {bik‬‬

‫رقم ‪ i , j‬يف املصفوفة‪ ،‬وهو يمثل احتامل االنتقال من احلالة (‪ )i‬إىل احلالة (‪)j‬‬
‫مصفوفة ربط األلوان أو الرموز (‪ )k‬املنبعثة من احلالة (‪B )i‬‬

‫(أو اإلناء)‪ .‬و ‪ bik‬تعنى احتامل إخراج اللون ‪ k‬من احلالة (اإلناء ‪.)i‬‬
‫احتامالت البدء ‪π = π1, π2,... πN‬‬

‫حيث ‪ πj‬تعني احتامل البدء باحلالة (‪.)j‬‬


‫ويف كثري من التطبيقات نفرض عىل النموذج البدء باحلالة األوىل‪ ،‬وهو ما يعني َّ‬
‫أن‬
‫‪ π1 = 1‬وبق َّية حاالت البدء = ‪0‬؛ ويف هذه احلالة يكون (‪.π = (1,0,0,…0‬‬

‫‪-157-‬‬
‫ّ‬
‫حل املسألة األوىل‪ :‬خوارزم «لألمام‪-‬للخلف»‪Forward-Backwar Algorithm‬‬

‫لنبدأ بتعريف‬

‫أي احتامل مرور سلسلة املشاهدات من ‪ ،o1,o2,…ot‬ومع البدء باحلالة األوىل؛ هذا‬
‫باعتبار أن لدينا نموذج ماركوف ُم َ َّب ًأ بعينه ‪ ،λ‬حيث ‪ it‬متثل رقم احلالة ‪ i‬عند الزمن ‪.t‬‬
‫ويتكون اخلوارزم «لألمام ثم اخللف» من ثالث خطوات‪:‬‬
‫اخلُطوة ‪ :1‬خطوة البدء‬

‫حتتوي عىل جمموع احتامالت املسارات من البدء إىل احلالة (‪ )i‬يف زمن (‪.)t‬‬ ‫حيث‬
‫اخلُطوة ‪ :2‬خطوة التكرار‬

‫تعني احتامل أن يكون اللون (أو الرمز) عند الزمن ‪ t+1‬خارجا‬ ‫حيث‬
‫من اإلناء (‪.)j‬‬
‫تعني جمموع املسارات الواردة بتغيري احلالة رقم (‪ )i‬من ‪ 1‬إىل ‪.N‬‬
‫اخلُطوة ‪ :3‬خطوة االنتهاء‬

‫حيث(‪ P(O/λ‬تعني احتامل انتامء سلسلة املشاهدات ‪ O‬إىل النموذج ‪ ،λ‬وحتسب‬ ‫ُ‬
‫كمجموع احتامالت املسارات املحتملة من البدء إىل النهاية عند الزمن ‪T.‬‬

‫‪-158-‬‬
‫ويف كثري من التطبيقات يكون لزا ًما علينا أن نبدأ باحلالة األوىل وننتهي باحلالة‬
‫األخرية ‪N‬؛ وعندئذ‪:‬‬

‫ويسمى النموذج يف هذه احلالة نموذج الشامل‪-‬يمني (‪.)Left-right model‬‬

‫ّ‬
‫حل املسألة الثانية‪ :‬خوارزم فيرتيب‪:‬‬
‫يتكون هذا اخلوارزم من أربع خطوات‪:‬‬
‫اخلُطوة ‪ :1‬خطوة البدء‬

‫حتتوي عىل احتامل املسار األعىل احتامال من البدء إىل احلالة (‪ )i‬يف زمن‬ ‫حيث‬
‫حتتوى عىل رقم احلالة التي انتقلنا منها إىل احلالة (‪ )i‬عىل املسار األعىل‬ ‫(‪ ،)t‬و‬
‫احتامال يف الزمن (‪.)t‬‬
‫اخلُطوة ‪ :2‬خطوة التكرار‬
‫‪ ،‬واحلالة (‪ )j‬تتغري من‬ ‫الوقت ‪ t‬يتغري من‬

‫تعني احتامل أن يكون اللون عند الزمن ‪ t‬خارجا من اإلناء (أو‬ ‫حيث‬
‫احلالة) رقم (‪.)i‬‬
‫تعني أننا نحسب أعىل قيمة ملا بني األقواس [ ] بتغيري قيمة (‪.)i‬‬ ‫و‬

‫تعني أننا نحتفظ برقم (‪ )i‬الذي أعطى أعىل قيمة ملا بني األقــواس‬ ‫و‬
‫[ ]‪ ،‬وليس قيمة احلسبة نفسها‬

‫‪-159-‬‬
‫اخلُطوة ‪ :3‬خطوة االنتهاء‬

‫حيث *‪ P‬تعنى احتامل انتامء سلسلة ألوان متتابعة ‪ O‬إىل النموذج (‪ λ = (π,A,B‬عىل‬
‫أساس حساب املسار األعىل احتامال‪.‬‬
‫هو رقم احلالة عىل املسار األعىل احتامال عند االنتهاء بالزمن ‪.T‬‬ ‫و‬
‫اخلُطوة ‪ُ :4‬خطوة معرفة املسار األكثر احتامالً‬
‫‪For t = T-1, T-2,…2,1‬‬

‫أي برتاجع الزمن‬

‫حساب تعنى «بالرتاجع» يمكن احلساب عند كل زمن ‪ t‬احلالة (‪ )i‬التى تقع عىل‬
‫املسار األعىل احتامال‪.‬‬

‫الـمخَ َّبأة‬ ‫ّ‬


‫حل املسألة الثالثة‪ :‬تقديرات «بوم‪ -‬والش» لثوابت نموذج ماركوف ُ‬
‫(‪λ=(π,A,B‬‬

‫أي حساب قيم‪:‬‬


‫و ُيمكن القيام بذلك عىل النَّحو التَّايل‪:‬‬

‫‪-160-‬‬
‫اختيار قيم عشوائية هلذه الثوابت‬

‫استخدام القيم السابقة للثوابت حلساب القيم اجلديدة بتمرير كل املشاهدات  على‬
‫النموذج بثوابته املقدرة (من اخلطوة السابقة) ُث احلساب للقيم اجلديدة كاآليت‪ :‬‬
‫جمموع مرات البدأ ابحلالة )𝑖𝑖(‬
‫= 𝑖𝑖𝑙𝑙‪π‬‬
‫جمموع مرات البدأ‬
‫جمموع مرات اليت مر هبا النموذج على احلالة )𝑖𝑖( ُث احلالة )𝑗𝑗(‬
‫= 𝑖𝑖𝑖𝑖𝑙𝑙‪π‬‬
‫جمموع مرات اليت مر هبا النموذج على احلالة )𝑖𝑖(‬
‫جمموع مرات اليت مر هبا النموذج على احلالة )𝑗𝑗( وإخراج اللون )𝑘𝑘(‬
‫𝑙𝑙‬
‫𝑗𝑗𝑗𝑗𝑏𝑏‬ ‫=‬
‫جمموع مرات اليت مر هبا النموذج على احلالة )𝑗𝑗(‬
‫‬

‫حساب‬
‫‪]2‬الثوابت يف الدورة )𝑙𝑙( ‪ −‬الثوابت يف الدورة )‪𝑒𝑒 = [(𝑙𝑙 − 1‬‬

‫ال‬
‫)قيمة صغرية جدا( ∈<𝑒𝑒‬

‫نعم‬

‫قف‬

‫‪168‬‬

‫‪-161-‬‬
‫ويف ختام هذا الفصل َتدُ ُر اإلشار ُة إىل التطور اهلائل يف جمال استخدام الشبكات‬
‫العصبية يف األبحاث اخلاصة بمجال حوسبة اللغات الطبيعية‪ .‬لقد تطورت األشكال‬
‫واألنامط هلذه الشبكات العصبية تطورا هائال وأعطت نتائج يف معظم احلاالت أفضل‬
‫بكثري من تلك النتائج التي كنا نحصل عليها بالطرق التقليدية‪ .‬إال أنه من املالحظ أن‬
‫الطرق التقليدية تتفوق عندما يكون حجم البيانات املخصصة للتدريب ً‬
‫قليل نسبيا‪.‬‬
‫وحتى يف هذه احلالة هناك نامذج ظهرت سبق أن تدربت عىل بيانات كثرية متوفرة؛‬
‫ولكن ملهام خمتلفة أو للغة أخرى‪ .‬وعندئذ يبدؤون تدريب هذه النامذج سالفة التدريب‬
‫عىل القليل من البيانات املتاحة‪ ،‬فإذا هبا تعطي نتائج ممتازة‪ .‬ستكون السنوات القادمة‬
‫مليئة بإنجازات هائلة يف جمال حوسبة اللغات احلية بام يقرهبا من املستوى البرشي‬
‫املعجز‪ .‬وستكون هذه من الفتوحات العلمية التي َم َّن اهلل علينا هبا‪ ،‬وسيتجىل تأثري‬
‫ذلك يف كل مناحى احلياة‪.‬‬

‫‪-162-‬‬
‫ببليوجرافيا مرجع َّية‬
1. Balivada, L. K. & Raju, K. P. (2012): Optimization Techniques of
Viterbi Algorithm: Performance Analysis of Different Algorithms.
Lambert Academic Publishing.
2. Cristianini, N. & Shawe-Taylor, J. (2000), An Introduction to Sup-
port Vector Machines and other kernel-based learning methods,
Cam-bridge University Press.
3. Deng, L.; Liu, Y. (2018). Deep Learning in Natural Language Pro-
cessing. Springer.
4. Fraser, A. M. (2008): Hidden Markov Models and Dynamical Sys-
tems. SIAM.
5. Haykin, S. (1999), Neural Networks: A Comprehensive Foundation,
Prentice Hall.
6. Kaleli, C. & Polat, H. (2010): NAÏVE BAYESIAN CLASSIFI-
ER-BASED PRIVATE RECOMMENDATIONS: PRIVACY-PRE-
SERVING NAÏVE BAYESIAN CLASSIFIER-BASED COLLAB-
ORATIVE FILTERING. LAP Lambert Acad. Publ.
7. Karwowski, W. (2019). Intelligent Human Systems Integration
2019. Springer.
8. Kubat, M. (2012), Machine Learning, illustrated, Eleven Learning.
9. Kulkarni, A.; Shivananda, A. (2019). Natural Language Processing
Recipes: Unlocking Text Data with Machine Learning and Deep
Learning using Python. Apress.
10. Mamon, R. S. & Elliott, R. J. (2010): Hidden Markov Models in
Finance. Springer.
11. Neamat El, G.; Yee, S. (2018). Computational Linguistics, Speech
and Image Processing for Arabic Language. World Scientific.

-163-
12. Rish, I. (2001). “An empirical study of the naive Bayes classifier”.
IJCAI 2001 Workshop on Empirical Methods in Artificial Intelli-
gence. Availabl online here: http://www.research.ibm.com/ peo-
ple/r/rish/papers/RC22230.pdf
13. Russell, J. & Cohn, R. (2012): Viterbi Algorithm. Book on Demand.
14. Sharp, B.; Sedes, F.; Lubaszewski, W. (2017). Cognitive Approach
to Natural Language Processing. Elsevier.
15. Srinivasa-Desikan, V. (2018). Natural Language Processing and
Computational Linguistics: A practical guide to text analysis with
Python, Gensim, spaCy, and Keras. Packt Publishing.
16. Vojislav, K. (2001), Learning and Soft Computing, Support Vector
Ma-chines, Neural Networks and Fuzzy Logic Models, The MIT
Press, Cambridge, MA.
17. Zizka, J.; Darena, F.; Svoboda, A. (2019). Text Mining with Ma-
chine Learning. Taylor & Francis Group.

-164-
‫الفصل اخلامس‬
‫من َذجة ال ُّلغـة‬

‫د‪ُ .‬م ِسن َرشوان‬

‫العددي‪.‬‬
‫ّ‬ ‫‪ -1‬النَّحو‬
‫‪ -2‬التَّنعيم‪.‬‬
‫العددي‪.‬‬
‫ّ‬ ‫‪ -3‬موضوعات تساعد عىل حتسني النَّحو‬
‫‪ -4‬تقويم قوة النَّحو ال َعدَ ِد ّي‪.‬‬
‫‪ -5‬جماالت اإلفادة من النَّحو ال َعدَ ِد ّي‪.‬‬
‫وحات علم َّي ٍة ُمستَقبل َّية‪.‬‬
‫ٍ‬ ‫ألطر‬
‫أفكار بحث َّية ُ‬
‫ٌ‬ ‫‪-6‬‬

‫‪-165-‬‬
-166-
‫متهيد‬
‫ال ُّلغات احلية يف احلقيقة مع َّقدة بام فيه الكفاية لتلبية حاجة اإلنسان يف التَّعبري عن‬
‫ٍ‬
‫بعدد‬ ‫يعب عن معنى جيول يف خاطره‬ ‫مشاعره وأفكاره املتجدِّ دة‪ ،‬إذ يمكن لإلنسان أن ِّ َ‬
‫نفس املعنى‪ .‬وربام ختتلف عن بعضها يف الدِّ قة والبالغة‪،‬‬ ‫كبري جدً ا من اجلُ َمل ا َّلتي تؤ ِّدي َ‬
‫دقيق للتعبري عن فهم‬ ‫وضع إطار ريايض ٍ‬ ‫َ‬ ‫واملشاعر املحيطة باملعنى‪ ...‬إلخ‪ .‬وهذا جيعل‬
‫ٍّ‬
‫ِ‬
‫ال ‪ -‬يف الوقت احلايل؛ ويف‬ ‫الص ُعوبة ‪ -‬إن مل يكُن ُمستَحي ً‬ ‫أمرا بال َغ ُّ‬‫املتحدث وقصده ً‬
‫نستطيع االستغنا َء عن نمذجة ال ُّلغة ا َّلتي ت َُو ِّج ُه التِّقنيات ال ُّل َغ ِو َّية إىل حتقيق‬ ‫ُ‬ ‫الوقت ذاته ال‬
‫َّعرف اآل ّيل عىل الكالم املكتوب أو املنطوق‪.‬‬ ‫ٍ‬
‫أهدافها املنشودة يف جماالت ُم َت َعدِّ دة‪ ،‬كالت ُّ‬
‫ث‬‫أن املتَحـَدِّ َ‬
‫افتضـــنا َّ‬ ‫وعىل سبيل املثال‪ ،‬يف جمال ال َّت َع ُّرف عىل الكالم املنطوق‪ ،‬لو َ َ‬
‫نطق مجل ًة حتتوي عىل ‪ُ 100‬فونيام متتال ًيا (حوايل ‪ 12-10‬كلمة متصلة) ‪ -‬آخذي َن يف‬ ‫َ‬
‫تتعرف عىل الكالم املنطوق ال يتجــاوز متوسط د َّقتها‬ ‫أدق األنظمة التي َّ‬ ‫ِ‬
‫االعتبار أن َّ‬
‫فإن درجـــة ِد َّقة التّقنية عىل مستــوى اجلمل إذا خت َّلينا‬ ‫‪ ٪80‬لكل فونيم عىل حدة ‪َّ -‬‬
‫ُ‬
‫ستكون عىل النَّحو امل َب َّي يف اجلدول التَّايل‪:‬‬ ‫عن استخدام النَّمو َذج ال ُّل َغ ِو ّي‬
‫عدد الفونيامت املكونة للكلمة أو اجلملة بافرتاض متوسط دقة ‪ ٪80‬لكل فونيم‬
‫د َّقة ال َّت َع ُّرف‬ ‫عدد الفونيامت‬
‫‪٪80‬‬ ‫‪1‬‬
‫(‪٪64 = 2^)٪80‬‬ ‫‪2‬‬
‫(‪٪51.2 =3^)٪80‬‬ ‫‪3‬‬
‫(‪٪10.7 = 10^)٪80‬‬ ‫‪( 10‬متوسط الكلمة)‬
‫(‪٪0.0014 = 50^)٪80‬‬ ‫‪( 50‬مجلة قصرية)‬
‫(‪٪0 ≈ 100^)٪80‬‬ ‫‪( 100‬مجلة متوسطة)‬

‫لغوي‪.‬‬
‫ّ‬ ‫اجلدول ‪ :1-5‬د َّقة الكلامت واجلمل بدون نموذج‬

‫ووف ًقا هلذه النَّتائج‪ ،‬س ُي َؤ ِّدي االستغناء عن النَّمو َذج ال ُّل َغ ِو ّي إىل نتائج ليست ذات‬
‫قيمة‪ ،‬وبالتَّايل ستُصبِ ُح تقنية ال َّت َع ُّرف عىل الكالم املنطوق عديمة الفائدة ُ‬
‫بخ ُل ِّوها من‬
‫ستتحرك‬
‫َّ‬ ‫فإن الكلامت العربية يف ُصورهتا املفردة‬ ‫هذا النَّمو َذج‪ .‬أ َّما إذا اعتمدنا عليه َّ‬

‫‪-167-‬‬
‫من ‪ ٪10.7‬إىل أكثر من ‪( ٪90‬يف ظروف تسجيل مناسبة)‪ ،‬بمساعدة الن ِ‬
‫َّامذج ال ُّل َغ ِو َّية‬
‫وبعبارة أخرى‪،‬‬ ‫ٍ‬ ‫قالب ِ‬
‫رياض؛‬ ‫باعتبارها جمموعة من املعلومات الر ِ‬
‫ياض َّية املوضوعة يف ٍ‬ ‫ِ‬
‫ّ‬ ‫ِّ‬
‫تُساعد «نمذجة اللغة» (‪ )Language Modeling‬يف حتقيق الفائدة من تقنيات ال ُّلغات‪.‬‬
‫حتتمل ال َّلفظة‬
‫ُ‬ ‫ب إىل»‪ ،‬حيث‬ ‫يت « َذ َه َ‬
‫الصو ّ‬
‫ونستطيع التَّمثيل عىل ذلك بتحليل املقطع َّ‬‫ُ‬
‫ِ‬
‫ونستطيع أن نستَد َّل عىل االحتامل‬ ‫تكون ‪« .1‬آيل»‪ ،‬أو ‪« .2‬آال»‪ ،‬أو ‪« .3‬إىل»‪.‬‬ ‫َ‬ ‫«إىل» أن‬
‫ُ‬
‫الصواب بتحليل تتا ُبع هذه الكلامت يف سياقاهتا ال ُّل َغ ِو َّية؛ وبافرتاض أنَّنا‬ ‫األقرب إىل َّ‬
‫أن كلمة «إىل»‬ ‫بشكل صحيح‪ ،‬فإنَّنا سنجد َّ‬ ‫ٍ‬ ‫ب» َّ‬
‫وتعرفنا عليها‬ ‫ُقمنا بتحليل كلمة « َذ َه َ‬
‫الصواب‪.‬‬ ‫أقرب إىل َّ‬ ‫ُ‬ ‫الث‬ ‫َ‬
‫االحتامل ال َّث َ‬ ‫األكثر التصا ًقا هبا‪ ،‬مايعني َّ‬
‫أن‬ ‫ُ‬ ‫هي‬

‫العددي (‪)N-gram‬‬
‫ّ‬ ‫‪ -1‬النحو‬
‫بعض ال ُط ُرق ا َّلتي تُستَخدَ م يف توجيه تقنيات ال ُّلغة وتطبيقاهتا إىل االحتامل‬ ‫هناك ُ‬
‫ِ‬
‫الصواب من النَّاحية ال ُّل َغ ِو َّية؛ و ُي َعدُّ النَّحو العدد ّي «‪ »N-gram‬أوســ ََع‬‫األقرب إىل َّ‬
‫مه َّية النَّحو‬ ‫الو ُق َ‬
‫وف ‪-‬فيام ييل‪ -‬عىل أ ِّ‬ ‫انتشارا وأكثرها استخدا ًما‪ .‬وسنُحاول ُ‬ ‫ً‬ ‫هـذه ال ُط ُرق‬
‫ني له باحلديث عن االحتمــاالت [‪.]14 ،4،5‬‬ ‫ِ‬
‫العددي ودوره يف تقنيات ال ُّلغة‪ُ ،‬م َقدِّ م َ‬
‫ّ‬

‫‪ -1.1‬حساب االحتامالت واالحتامالت َّ‬


‫الشط َّية‬
‫ور َدت‬
‫تض ُّم مليون كلمة‪ ،‬وكانت إحدى كلامهتا قد َ‬ ‫دون ٌة ُل َغ ِو َّي ٌة ُ‬
‫إذا كانت لدينا ُم َّ‬
‫ورود هذه الكلمة يف وثيقة تتشاب ُه ما َّد ُتا مع‬ ‫نستطيع حتديدَ احتامل ُ‬ ‫ُ‬ ‫‪ 1000‬مرة‪ ،‬فإنَّنا‬
‫ما َّدة املدونة ال ُّل َغ ِو َّية باستخدام املعا َدلة التَّالية‪:‬‬
‫عدد مرات ورود الكلمة يف املدونة‬
‫= (‪P(w‬‬ ‫احتامل الورود =‬
‫عدد كلامت املدونة كلها‬
‫‪1000‬‬
‫= (‪P(w‬‬ ‫‪= 0.001 =%0.1‬‬
‫‪1000.000‬‬
‫أي واحد يف األلف‪.‬‬
‫(اختصارا لـ ‪،)Word‬‬
‫ً‬ ‫حيث تر ُمز ‪ w‬إىل الكلمة‪،‬‬
‫(اختصارا لـ ‪.)Probability of Word‬‬
‫ً‬ ‫الو ُرود‪،‬‬
‫وترمز (‪ P(w‬إىل احتامل ُ‬

‫‪-168-‬‬
‫دعنا نعرف االحتامالت املرشوطة يف هذا املثال‪ :‬ورد يف القرآن الكريم كله عدد‬
‫‪ 77934‬كلمة‪ ،‬وكانت كلمة «اهلل» هي األكثر ورو ًدا فيه‪ ،‬وجاءت هذه اللفظة الكريمة‬
‫‪ 2707‬مرة‪ ،‬فكانت مرفوعة يف ‪ 980‬مرة‪ ،‬ومنصوبة يف ‪ 592‬مرة‪ ،‬وجمرورة يف ‪1135‬‬
‫مرة‪ .‬فلو سألنا عن احتامل ورود كلمة اهلل يف القرآن الكريم كله ستكون اإلجابة‪:‬‬
‫‪2707‬‬
‫=)اهلل(‪P‬‬ ‫‪= %3.47‬‬
‫‪77934‬‬
‫بينام لو سألنا عن كلمة القرآن مرفوعة يف القرآن كله تكون اإلجابة‪:‬‬
‫‪980‬‬
‫=)اهلل(‪P‬‬
‫ُ‬ ‫‪= %1.26‬‬
‫‪77934‬‬
‫ماذا لو سألنا هذا السؤال‪ :‬ما احتامل ورود كلمة (اهلل) مرفوعة منسوبة إىل كل كلامت‬
‫(اهلل) يف القرآن الكريم؟ أو بعبارة أخرى‪ :‬ما احتامل ورود كلمة (اهلل) مرفوعة برشط‬
‫نسبها إىل كلمة (اهلل) يف القرآن كله؟ سيكون التَّعبري رياض ًّيا عىل هذا النَّحو‪:‬‬
‫اهلل(‪P‬‬
‫)اهلل‪ُ /‬‬
‫رشط حساب احتامل ورود كلمة‬‫َ‬ ‫السابق َّ‬
‫أن‬ ‫يايض َّ‬
‫الر ّ‬
‫الشطة املائلة يف التَّعبري ِّ‬
‫وتعني َّ‬
‫(اهلل) مرفوعة هو ورود كلمة (اهلل) أ ًّيا كان تشكيلها‪ .‬ويكون حساهبا كاآليت‪:‬‬
‫‪980‬‬
‫اهلل(‪P‬‬
‫ُ‬ ‫=)اهلل‪/‬‬ ‫‪= %36.2‬‬
‫‪٢٧٠٧‬‬

‫األحادي (‪)Uni-gram‬‬
‫ّ‬ ‫العددي‬
‫ّ‬ ‫‪ - 2.1‬النَّحو‬
‫العددي‪.‬‬
‫ّ‬ ‫الشط َّية‪ُ ،‬يمكنُنا أن ُن َقدِّ َم فكر ًة عن النَّحو‬ ‫بعد أن قدَّ منا فكر َة االحتامالت َّ‬
‫ماسة إىل معلومات عن ال ُّلغة وعن تر ُّدد كلامهتا‬ ‫كام أسلفنا يف املقدمة أنَّنا يف حاجة َّ‬
‫وترابطها م ًعا‪ ،‬لنتم َّك َن من دعم احلل الصحيح يف تقنيات كثرية من تقنيات ال ُّلغات‬
‫ِ‬
‫العرشين‬ ‫العددي االحتام ّيل يف اخلمسين َّيات من القرن‬ ‫ّ‬ ‫أن ُظ ُهور النَّحو‬
‫والواقع َّ‬
‫ُ‬ ‫احلية‪.‬‬
‫عالة ال ُّلغات احل َّية قد القى عزو ًفا من قبل‬ ‫ِ‬
‫إحصائ ًّيا ُيستَخدَ م يف ُم َ‬ ‫مسارا‬ ‫ِ‬
‫باعتباره‬
‫ً‬
‫األمريكي َن ُعوم تشومسكي‬
‫ّ‬ ‫أفرزته نظر َّيات ال ُّل َغ ِو ّي‬
‫ال ُّل َغ ِو ِّيني يف ذلك الوقت نتيج َة ما َ‬
‫نقد هلذا املسار‪ .‬ولكن بعد أن نجحت رشكة ‪ IBM‬يف السبعين َّيات من العودة إىل‬ ‫من ٍ‬

‫‪-169-‬‬
‫العددي بنجاح‪َ َّ ،‬‬
‫ات َه الباحثون يف تقنيات ال ُّلغات احلية إىل االستعانة به‪ ،‬حتى‬ ‫ّ‬ ‫النَّحو‬
‫غدا أساسا ال غنى عنه ملطوري هذه التقنيات‪.‬‬
‫ِ‬ ‫دعنا نأخذ مثاالً مطوالً لفهم النَّحو‬
‫العددي [أو اإلحصائ ّي] ‪ .N-gram‬لو َّ‬
‫تصورنا‬ ‫ّ‬
‫أن لدينا مدون ًة لغوية ُم َب َّسطة تتكون من هاتَني اجلملتَني‪:‬‬
‫َّ‬

‫«ذهب حممد إىل املدرسة»‬


‫«حني وصل حممد إىل املدرسة قابل زميله أمحد»‬

‫عدد الكلامت يف هذه املدونة املبسطة ‪ 12‬كلمة؛ وبإضافة رمز لبداية مجلة ( َم َّرتني)‪،‬‬
‫ورمز هناية مجلة ( َم َّرتني)‪ ،‬وكأهنام كلمتان مضافتان ملفردات املدونة‪ ،‬يكون عدد الكلامت‬
‫‪ 16‬كلمة‪ .‬أي‪ :‬عدد مفردات املدونة ‪ 16‬مفردة (‪ + 12‬بدايتني جلملتني وهنايتني)‪.‬‬
‫العددي‪ ،‬نود أن ن ُِشري إىل قيام ِ‬
‫عال‬ ‫ِ‬ ‫الشوع يف توضيح مفهوم النَّحو‬ ‫وقبل ُّ‬
‫َ‬ ‫ُّ‬ ‫ّ‬
‫ٍ‬
‫مبسط‬ ‫ريايض‬ ‫ٍ‬
‫نموذج‬ ‫ويس أندريه ماركوف (‪ )1922-1856‬بوضع‬
‫ٍّ‬ ‫الر ّ‬
‫الرياض َّيات ُّ‬
‫ِّ‬
‫للتَّن ُّبؤ باملستقبل باالستعانة فقط ببضع خطوات من املايض‪ .‬وسوف نستفيد من تبسيطه‬
‫الريايض فيام ييل‪:‬‬
‫ّ‬
‫السابقة (وا َّلتي ال يتعدَّ ى حمتواها ‪ 16‬كلمة) حسابات‬
‫لنحسب للمدونة امل َب َّسطة َّ‬
‫العددي‪:‬‬
‫ّ‬ ‫تدخل يف مفهوم النَّحو‬
‫العددي بـ «النحو األحادي ‪»uni - gram‬‬
‫ّ‬ ‫ف الدَّ رجة األوىل يف النحو‬ ‫أو الً‪ :‬ت َ‬
‫ُعر ُ‬
‫أو ‪1-gram‬؛ وفيه نحسب فقط احتاملية تكرار كل كلمة برصف النظر عن ما قبلها‬
‫أو ما بعدها‪ ،‬عىل النَّحو امل َب َّي يف اجلدول التَّايل‪:‬‬
‫النِّسبة‬ ‫األحادي‬
‫ّ‬ ‫النَّحو‬ ‫الت ُّدد ُ‬
‫(الو ُرود)‬ ‫َّ َ‬ ‫ُمفردات املدونة‬ ‫م‬
‫‪0.125‬‬ ‫‪8/1 =16/2‬‬ ‫‪2‬‬ ‫بداية مجلة‬ ‫‪1‬‬
‫‪0.0625‬‬ ‫‪16/1‬‬ ‫‪1‬‬ ‫ذهب‬ ‫‪2‬‬
‫‪0.125‬‬ ‫‪8/1 = 16/2‬‬ ‫‪2‬‬ ‫حممد‬ ‫‪3‬‬
‫‪0.125‬‬ ‫‪8/1 = 16/2‬‬ ‫‪2‬‬ ‫إىل‬ ‫‪4‬‬
‫‪0.125‬‬ ‫‪8/1 = 16/2‬‬ ‫‪2‬‬ ‫املدرسة‬ ‫‪5‬‬

‫‪-170-‬‬
‫النِّسبة‬ ‫األحادي‬
‫ّ‬ ‫النَّحو‬ ‫الت ُّدد ُ‬
‫(الو ُرود)‬ ‫َّ َ‬ ‫ُمفردات املدونة‬ ‫م‬
‫‪0.0625‬‬ ‫‪16/1‬‬ ‫‪1‬‬ ‫حني‬ ‫‪6‬‬
‫‪0.0625‬‬ ‫‪16/1‬‬ ‫‪1‬‬ ‫وصل‬ ‫‪7‬‬
‫‪0.0625‬‬ ‫‪16/1‬‬ ‫‪1‬‬ ‫قابل‬ ‫‪8‬‬
‫‪0.0625‬‬ ‫‪16/1‬‬ ‫‪1‬‬ ‫زميله‬ ‫‪9‬‬
‫‪0.0625‬‬ ‫‪16/1‬‬ ‫‪1‬‬ ‫أمحد‬ ‫‪10‬‬
‫‪0.125‬‬ ‫‪8/1 = 16/2‬‬ ‫‪2‬‬ ‫هناية اجلملة‬ ‫‪11‬‬
‫‪1.00‬‬ ‫‪1.00‬‬ ‫‪16‬‬ ‫املجموع‬

‫األحادي ملفردات املدَ َّونة امل َب َّسطة‪.‬‬


‫ّ‬ ‫اجلدول ‪ :2-5‬حسابات النَّحو‬

‫الثنائي (‪)Bi-gram‬‬
‫ّ‬ ‫العددي‬
‫ّ‬ ‫‪ - 3.1‬النَّحو‬
‫العددي إذا نظرنا خلفنا لكلمة واحدة‪ ،‬واستعنَّا‬‫ّ‬ ‫يمكن االرتقاء درج ًة وحساب النَّحو‬
‫نضع يف‬ ‫ُ‬
‫ُالحظ أنَّنا َ‬ ‫هبذه املعلومة حلسابات املستقبل‪ .‬فبالنَّظر إىل اجلدول رقم (‪ )2-5‬سن‬
‫نائي [‪.]24 ،5‬‬‫ويسمى هذا بالنَّحو ال ُّث ّ‬
‫َّ‬ ‫حساباتنا (بداية اجلملة) و (هناية اجلملة)‪.‬‬
‫الكلمة السابقة‬
‫بداية مجلة‬
‫هناية مجلة‬

‫املدرسة‬
‫وصل‬

‫ذهب‬
‫زميله‬

‫حممد‬
‫قابل‬

‫حني‬
‫أمحد‬

‫إىل‬

‫بداية مجلة‬ ‫‪1‬‬


‫‪1‬‬ ‫ذهب‬ ‫‪2‬‬
‫‪1‬‬ ‫‪1‬‬ ‫حممد‬ ‫‪3‬‬
‫‪2‬‬ ‫إىل‬ ‫‪4‬‬
‫‪2‬‬ ‫املدرسة‬ ‫‪5‬‬
‫‪1‬‬ ‫حني‬ ‫‪6‬‬
‫‪1‬‬ ‫وصل‬ ‫‪7‬‬
‫‪1‬‬ ‫قابل‬ ‫‪8‬‬

‫‪-171-‬‬
‫الكلمة السابقة‬

‫بداية مجلة‬
‫هناية مجلة‬

‫املدرسة‬
‫وصل‬

‫ذهب‬
‫زميله‬

‫حممد‬
‫قابل‬

‫حني‬
‫أمحد‬

‫إىل‬
‫‪1‬‬ ‫زميله‬ ‫‪9‬‬
‫‪1‬‬ ‫أمحد‬ ‫‪10‬‬
‫‪1‬‬ ‫‪1‬‬ ‫هناية مجلة‬ ‫‪11‬‬
‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫املجموع‬

‫اجلدول ‪ :3-5‬النحو الثنائي للمدَ َّونة‪.‬‬

‫= (‪P*(wn/wn-1‬‬ ‫عدد ورود عدد ورود‬ ‫االحتامل الرشطى‬


‫(‪C(wn ,wn-1‬‬
‫‪C(w ,w )+0.01‬‬ ‫‪n‬‬ ‫‪n-1‬‬
‫ــــــــــــــــــــــــــــــــــــــ‬ ‫الكلمة الكلمتني معاً‬ ‫للنحو الثنائي‬
‫ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ‬ ‫(‪C(wn-1‬‬
‫‪C(wn-1)+121*0.01‬‬ ‫(‪C(wn ,wn-1‬‬ ‫(‪C(wn-1‬‬ ‫(‪P(wn/wn-1‬‬

‫‪0.315‬‬ ‫‪0.5‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫)ذهب‪/‬بداية ُجلة(‪P‬‬

‫‪0.457‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫)حممد‪/‬ذهب(‪P‬‬

‫‪0.626‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫)إىل‪/‬حممد(‪P‬‬

‫‪0.626‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫)املدرسة‪/‬إىل(‪P‬‬

‫‪0.315‬‬ ‫‪0.5‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫)هناية ُجلة‪/‬املدرسة(‪P‬‬

‫‪0.315‬‬ ‫‪0.5‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫)حني‪/‬بداية(‪P‬‬

‫‪0.457‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫)وصل‪/‬حني(‪P‬‬

‫‪0.315‬‬ ‫‪0.5‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫)قابل‪/‬املدرسة(‪P‬‬

‫‪0.457‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫)زميله‪/‬قابل(‪P‬‬

‫‪0.457‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫)أمحد‪/‬زميله(‪P‬‬

‫‪0.457‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫)هناية ُجلة‪/‬أمحد(‪P‬‬

‫‪0.0045‬‬ ‫‪0‬‬ ‫‪0‬‬ ‫لو كانت‪:‬‬


‫‪C(wn-1( =1‬‬ ‫اى تتابع‬
‫ثنائى مل يرد‬
‫لو كانت‪:‬‬ ‫عاليه‬
‫‪0.0031‬‬ ‫‪0‬‬ ‫‪0‬‬
‫‪C(wn-1( =2‬‬

‫اجلدول ‪ :4-5‬النحو الثنائي للمدَ َّونة‪ .‬العمود الثالث حمسوب فيه النحو الثنائي بدون مراعاة‬

‫‪-172-‬‬
‫لـ ‪ ،OOV‬والعمود األخري حمسوب فيه النحو الثالثي بعد مراعاة ‪.OOV‬‬
‫وهكذا‪ ،‬لو أردنا درج ًة أخرى من ٍ‬
‫نحو أعمق فبإمكاننا أن نلجــأ للنَّحو ال ُّث ّ‬
‫الثي‬
‫(‪ ،)3-gram‬وعندئذ يكون مثالً‪:‬‬
‫‪٢‬‬
‫= (حممد‪ ،‬إىل ‪ /‬املدرسة) ‪P‬‬ ‫‪=١‬‬
‫ــــــــــــــ‬

‫‪٢‬‬
‫اميس‪ ...‬إلخ‪.‬‬
‫باعي واخلُ ّ‬
‫الر ّ‬‫حساب النَّحو ُّ‬
‫ُ‬ ‫وعليه‪ ،‬يمك ُن‬
‫واآلن‪ ،‬نريد أن نقف عند مشكلة خطرية يف هذا الطرح‪ ،‬أال وهي‪ :‬ماذا نفعل مع‬
‫ِ‬
‫الكلامت ا َّلتي مل ترد يف سياق املدَ َّونة؟ سيكون احتامل ُو ُرودها ً‬
‫صفرا‪ ،‬وهذا يتغري كثريا‬
‫إذا حسبنا أن ما مل نره يف املدونة يكون احتامل ور ِ‬
‫وده صفرا [‪.]21 ،3‬‬ ‫ُُ‬
‫مثال‪ :‬إذا قابلتنا عبارة (ذهب أمحد إىل املدرسة)‪ ،‬وأردنا االستفادة من املدونة السابقة‬
‫يف استنباط نتائج مفيدة‪:‬‬
‫‪( = ٠‬ذهب ‪.‬أمحد)‪P‬‬

‫سوف نجد أهنا تساوي صفرا ألننا يف الواقع مل نر هذا الرتكيب يف املدونة التي‬
‫رضرا‬
‫فإن هذا سوف يسبب ً‬ ‫ال هلذه املشكلة َّ‬ ‫استنبطنا منها نحونا ال ُّث ّ‬
‫نائي‪ .‬ولو مل نجد ح ًّ‬
‫إن مجل ًة حمتملة بصورة كبرية‪ ،‬وربام بدرجة احتامل‬ ‫ألي استخدا ٍم هلذه النتائج‪ ،‬إذ َّ‬
‫بالغا ّ‬
‫والسبب أن‬ ‫مجلة (ذهب حممد إىل املدرسة)‪ ،‬لن نجدَ هلا ما يدعمها من النَّحو ال ُّث ّ‬
‫نائي؛ َّ‬
‫املدونات ال ُّل َغ ِو َّية مهام كربت فلن تغني عن أن واقع اللغات احلية متد ِّفق ومتنامي‪.‬‬ ‫َّ‬
‫مجل وتعبريات هذا الواقع أن يكون ال هنائ ًّيا؛ فكيف نستنبط ما مل نره يف‬ ‫ويكا ُد تعداد ُ‬
‫املدونة؟‬

‫‪ -4.1‬مشكلة‪ :‬من خارج ُمفردات املدَ َّونة (‪)Out Of Vocabulary - OOV‬‬


‫اإلحصائي أن يكون مفيدا‪َّ ،‬‬
‫ألن رضره‬ ‫ّ‬ ‫لو مل نجب عىل هذا السؤال ما أم َك َن للنَّحو‬
‫ٍ‬
‫وبعبارة أخرى‪ ،‬لو مل يتمكَّن الباحثون من‬ ‫سيكون أكرب من نفعه يف كثري من األحيان‪.‬‬
‫إجياد حلول هلذه املشكلة ملا كانت هلذا النحو قائمة‪.‬‬

‫نحوا فيه ‪ 11‬كلمة فقط‪ ،‬ووجدنا فيه ‪ 11‬حالة للنَّحو ال ُّث ّ‬


‫نائي‬ ‫نفتض أن لدينا ً‬
‫تعالوا َ‬
‫أي كلمة من مفردات‬ ‫يمكن أن ُن َقدِّ َرها تقريبا بـ ‪ ،121=11×11‬أي أن هناك ‪ّ 121‬‬

‫‪-173-‬‬
‫«و َجا َء َر ُّب َك‬
‫املدونة عقب كلمة أخرى (ويمكن أن تتكرر الكلمة‪ ،‬يف مثل قوله تعاىل‪َ :‬‬
‫َوامل َل ُك َص ًّفا َص ًّفا»)‪ ،‬ولكن ورود ‪ 12‬حالة فقط (كام ىف اجلدول رقم ‪ )4 -8‬معناها أن‬
‫هناك احتامالً لـ ‪ 109‬حاالت مل ترد يف املدونة‪ .‬واحلقيقة قد يكون ورود بعض التتابعات‬
‫مستحيال مثل ورود بداية مجلة تتبعها بداية أو هناية مجلة ‪ ..‬إلخ‪ ،‬ولكن يف مدونة حقيقية‬
‫كبرية ال يكون هلذه االحتامالت أثر اذا امهلناها‪ .‬وكذلك يف الواقع احلقيقى يمكن أن‬
‫املمكنة‪،‬إالهذا~‬
‫التتابعاتلن نرى‬
‫لكلنفرض أنه‬‫ُيكن أن‬ ‫احلقيقى‬
‫بالنسبة‬ ‫تتابعواقع‬
‫الكلامت‬ ‫من يف ال‬
‫كذلك‬‫امهلناها‪ .‬و‬
‫‪%50‬‬ ‫حتماالتلنأثر اذا‬
‫نرى إال ~‬ ‫نفرض أنه‬‫اال‬
‫هذا مقبول وحينئذ ُيكن أن‬ ‫املمكنة‪،‬‬
‫التتابعات توقع‬ ‫نحسب لكل‬
‫حساباتنا عىل‬ ‫الكلمات ابلنسبة‬
‫تتابعيمكن أن‬ ‫مقبول من‬
‫وحينئذ‬ ‫‪%50‬‬
‫‪ 60 ~ ← OOV‬كلمة فقط‪.‬‬
‫حنسب حساابتنا على توقع ‪ 60 ~ ← OOV‬كلمة فقط‪ .‬ولكن يف مدونتنا البسيطة‬
‫ولكن يف مدونتنا البسيطة سنفرض للسهولة أن كل التتابعات ممكنة‪.‬‬
‫سنفرض للسهولة أن كل التتابعات ممكنة‪.‬‬
‫حل املشكلة‪:‬‬
‫حل املشكلة‪:‬‬
‫جلأ كثري من الباحثني إىل حماولة تقدير احتامالت للمفردات والتَّتا ُبعات (الثنائية‬
‫جلأ كثري من الباحثني إىل ُماولة تقدير احتماالت للمفردات والتَّتابحعات (الثنائية والثالثية‪...‬‬
‫والثالثية‪ ...‬إلخ) التي مل ترد يف املدونة مع إعادة حساب التتابعات التي وردت بحيث‬
‫إخل) اليت مل ترد يف املدونة مع إعادة حساب التتابعات اليت وردت حبيث يكون جمموع‬
‫يكون جمموع االحتامالت واحدا صحيحا‪ ،‬ألن هذه من مسلامت نظرية االحتامالت‪.‬‬
‫االحتماالت واحدا صحيحا‪ ،‬ألن هذه من مسلمات نظرية االحتماالت‪.‬‬
‫تعالوا نفرتض أننا أضفنا مقدارا ثابتًا‪ ،‬وقدره «‪ ، »0.01‬إىل كل احتامالت تتابع‬
‫مقدارا ً اثبتًا‪ ،‬وقدره «‪ ، »0.01‬إىل كل احتماالت تتابع‬‫ً‬ ‫تعالوا نفرتض أننا أضفنا‬
‫إىل إضافة ‪ 121‬مرة «‪ »0.01‬إىل البسط يف ‪ 121‬حالة‪ ،‬شاهدان‬
‫شاهدنا‬ ‫حالة‪،‬‬ ‫‪121‬‬ ‫يف‬ ‫البسط‬ ‫إىل‬ ‫«‪»0.01‬‬ ‫مرة‬ ‫‪121‬‬ ‫إضافة‬ ‫نحتاجإىل‬
‫سوف حنتاج‬
‫الكلامت؛ سوف‬
‫الكلمات؛‬
‫ولذلك ستتغري‬
‫ستتغري‬ ‫تقديرا‪.‬ا‪ .‬ولذلك‬ ‫«‪ »»0.01‬مرة‬
‫مرة تقدير‬ ‫ابعتباروروده‬
‫وروده «‪0.01‬‬ ‫سنكتفي باعتبار‬
‫الباقي سنكتفي‬
‫والباقي‬ ‫‪ 12‬حالة‬
‫حالة و‬ ‫فقط ‪12‬‬
‫فقط‬
‫األخري‪.‬‬ ‫العمود‬
‫األخري‪.‬‬ ‫(‪)4-8‬العمود‬
‫رقم‪)4-8‬‬
‫جدولرقم (‬
‫يف جدول‬
‫مبني يف‬
‫هو مبني‬
‫كام هو‬
‫االحتامالتكما‬
‫االحتماالت‬
‫مجلتني‪:‬مجلتني‪:‬‬
‫علينا بني‬
‫األمربني‬
‫واختلط علينا‬ ‫مجلة‪،‬‬
‫اختلط األمر‬ ‫مسعناسمعنا‬
‫مجلة‪ ،‬و‬ ‫هبَّناأنَّنا‬ ‫اآلن؛‬
‫هب أن‬ ‫حتى‬
‫اآلن؛‬ ‫نتائجناحىت‬
‫لنخترب َ‬
‫نتائج َنا‬ ‫لنخترب‬

‫املدرسة»‪.‬‬
‫املدرسة»‪.‬‬ ‫ذهبإىلأمحد إىل‬
‫«ذهب«أمحد‬
‫ŸŸ ▪‬
‫أمحدإىلزميله»‬
‫أمحد زميله»‬ ‫«قابل«إىلقابل‬
‫ŸŸ ▪‬
‫الصواب)‪.‬‬
‫اب)‪َّ .‬‬ ‫إىل ُلولَّ‬
‫الصوإىل‬ ‫ول احلُ‬
‫أقرب‬ ‫لرتجيح‬
‫أقرب احلحلح‬ ‫العدديجيح‬
‫َّحوَّحو ّ‬
‫العددي لرتّ‬ ‫ستخدم الن‬ ‫كيف ُي‬
‫ستخدم الن‬ ‫معما ًعا‬
‫كيف يح‬ ‫(لنرى ً‬
‫(لنرى‬

‫االحتامالت‪:‬‬
‫نظريةاالحتماالت‪:‬‬
‫بتطبيقنظرية‬
‫بتطبيق‬
‫)إىل‪⁄‬املدرسة( *‪) ∗ P‬أمحد‪⁄‬إىل( *‪) ∗ P‬ذهب‪⁄‬أمحد( *‪) ∗ P‬ذهب( *‪) ≈ P‬ذهب أمحد إىل املدرسة( ‪P‬‬
‫‪= 0.0625 ∗ 0.0045 ∗ 0.0045 ∗ 0.457 = 5.78 ∗ 10−7‬‬
‫)‪(OOV) (OOV‬‬

‫بينما "قابل إىل أمحد زميله"‬

‫‪183‬‬
‫‪-174-‬‬
‫بينام «قابل إىل أمحد زميله»‬

‫)أمحد‪⁄‬زميله( *‪) ∗ P‬إىل‪⁄‬أمحد( *‪) ∗ P‬قابل‪⁄‬إىل( *‪) ∗ P‬قابل( *‪) ≈ P‬قابل إىل أمحد زميله( ‪P‬‬
‫‪= 0.0625 ∗ 0.0045 ∗ 0.0031 ∗ 0.0045 = 3.92 ∗ 10−9‬‬
‫)‪(OOV) (OOV) (OOV‬‬
‫)ذهب أمحد إىل املدرسة(𝑃𝑃 <‬
‫املر َّجحة‪.‬‬
‫إذن‪ :‬تكون اجلملة األوىل هي َ‬
‫إذن‪ :‬تكون اجلملة األوىل هي املَر َّجحة‪.‬‬
‫‪ -2‬التنعيم (‪)Smoothing‬‬
‫ُعرف بعملية‬ ‫املشكلة (من خارج املفردات) بطريقة أكثر عم ًقا‪ ،‬ت َ‬ ‫تعالوا نعالج هذه‬
‫‪ -2‬التنعيم (‪)Smoothing‬‬
‫التنعيم؛ أي‪ :‬تنعيم قيم االحتامالت الناجتة عن احلساب املبارش الناتج عن قسمة عدد‬
‫التنعيم؛‬ ‫بعملية‬ ‫عرف‬‫عىلًقا‪ ،‬تح َ‬
‫إلخ) عم‬
‫املتجاورتني‪ ...‬أكثر‬
‫الكلمتنياملفردات) بطريقة‬
‫(من خارج‬ ‫(سواء املشكلة‬
‫نعاجل هذه‬ ‫تعالوا‬
‫للكلامت‬ ‫العدد ِّ ّ‬
‫الكل‬ ‫للكلمة أو‬ ‫التكرارات‬
‫الناتج عن قسمة عدد التكرارات (سواء‬ ‫املباشرأمهها‪.‬‬ ‫احلساب‬
‫نتعرف عىل‬ ‫الناُتة عن‬
‫للتنعيم‬ ‫االحتماالت كثرية‬
‫قيموهناك طرق‬ ‫يف تنعيم‬
‫املدونة‪.‬‬ ‫أي‪:‬‬
‫للكلمة أو الكلمتني املتجاورتني‪ ...‬إخل) على العدد الكلِّ ّي للكلمات يف املدونة‪ .‬وهناك طرق‬
‫‪ -1.2‬التنعيم باخلصم (‪)Smoothing by Discount‬‬
‫كثرية للتنعيم نتعرف على أمهها‪.‬‬
‫كام أسلفنا فإن مشكلة عدم ورود كل االحتامالت املمكنة يف اللغة يف قواعد البيانات‬
‫النحو العددي اذا مل تعالج هذه‬ ‫‪by‬عا الستخدام‬
‫‪)Smoothing‬‬ ‫‪Discount‬ذري ً‬ ‫عيم ابخلصم‬
‫التدريب (يسبب فشال‬ ‫‪ -1.2‬التن‬
‫املستخدمة يف‬
‫املشكلة‪ .‬وهناك العديد من الطرق لتقدير هذه االحتامالت‪.‬‬
‫كما أسلفنا فإن مشكلة عدم ورود كل االحتماالت املمكنة يف اللغة يف قواعد البياانت‬
‫§ §تنعيم البالس (‪)Laplace Smoothing‬‬
‫الستخدام النحو العددي اذا مل تعاجل هذه املشكلة‪.‬‬ ‫املستخدمة يف التدريب يسبب فشال ذر ًيعا‬
‫وتعتمـد هـذه الطريقـة علـى تقديـر عدد املرات التي نراها‪ ،‬ثم إضافة واحد لكـل‬
‫وهناك العديد من الطرق لتقدير هذه االحتماالت‪.‬‬
‫احلاالت التي مرت بنا (بام يف ذلك املرات التي مرت «صفر» مرة)؛ وبلغــة اإلحصـاء‪:‬‬
‫البالس (‪)Laplace Smoothing‬‬ ‫▪ تنعيم‬
‫وتعتمـد هـذه الطريقـة علـى تقديـر عــدد املرات اليت نراهـا‪ ،‬ثـم إضافـة واحـد لكـل احلاالت‬
‫حيث ‪ Cj‬عدد مرات ورود الكلمة ‪ ، wj‬و ‪ N‬العدد الكيل لكلامت املدونة‪.‬‬
‫اليت مرت بنا (مبا يف ذلك املرات اليت مرت «صفر» مرة)؛ وبلغــة اإلحصـاء‪:‬‬
‫وتصبح بعد طريقة تنعيم البالس‪:‬‬
‫‪Cj‬‬
‫ = ) ‪P(𝑤𝑤j‬‬
‫‪N‬‬
‫حيث ‪ Cj‬عدد مرات ورود الكلمة ‪ ،𝑤𝑤j‬و ‪ N‬العدد الكلي لكلمات املدونة‪.‬‬

‫‪-175-‬‬ ‫وتصبح بعد طريقة تنعيم البالس‪:‬‬


‫‪184‬‬
‫حيث ‪ V‬عدد املفردات املختلفة التي يمكن أن نصادفها‪ .‬ولنأخذ مثاال لذلك‪:‬‬
‫هب أننا نملك مدونة هبا ‪ 3‬كلامت فقط‪ ،‬وقدَّ رنا أن هناك كلمة واحدة يمكن‬
‫إضافتها؛ إذن ستكون (‪ .)V=4‬وبافرتاض ورود الكلامت كاآليت‪:‬‬
‫عدد ورود الكلمة قبل التنعيم‬ ‫عدد ورود الكلمة بعد التنعيم‬
‫)‪C1 = C(w1‬‬ ‫‪3‬‬ ‫‪4‬‬
‫)‪C2 = C(w2‬‬ ‫‪2‬‬ ‫‪3‬‬
‫)‪C3 = C(w3‬‬ ‫‪1‬‬ ‫‪2‬‬
‫)‪C4 = C(w4‬‬ ‫‪0‬‬ ‫‪1‬‬
‫‪V1= 3, N1=6‬‬ ‫‪V = 4, N =10‬‬
‫‪Cj + 1 2‬‬ ‫‪2‬‬

‫= ) ‪PLaplace (𝑤𝑤j‬‬
‫(مفردات)‪:‬‬ ‫‪ ،6‬و ‪3 = V2‬‬
‫احلالة‪N=+‬‬
‫قبل التنعيم‪ N1 :‬يف هذه ‪V‬‬
‫حيث ‪ V‬عدد املفردات املختلفة اليت ُيكن أن نصادفها‪ .‬ولنأخذ مثاال لذلك‪:‬‬
‫هب أننا منلك مدونة هبا ‪ 3‬كلمات فقط‪َّ ،‬‬
‫وقدران أن هناك كلمة واحدة ُيكن إضافتها؛‬
‫إذن ستكون (‪ .)V=4‬وابفرتاض ورود الكلمات كاآليت‪:‬‬
‫عدد ورود الكلمة قبل التنعيم‬ ‫عدد ورود الكلمة بعد التنعيم‬
‫‪C1‬‬ ‫(مفردات)‪:‬‬
‫𝑤𝑤(‪= C‬‬‫)‪1‬‬ ‫تنعيم البالس ‪ ،10 = N2← N1‬و ‪4 =V2← V31‬‬ ‫لتصبح بعد ‪4‬‬
‫‪C2‬‬ ‫) ‪= C(𝑤𝑤2‬‬ ‫‪2‬‬ ‫‪3‬‬
‫‪C3‬‬ ‫) ‪= C(𝑤𝑤3‬‬ ‫‪1‬‬ ‫‪2‬‬
‫‪C4‬‬ ‫) ‪= C(𝑤𝑤4‬‬ ‫‪0‬‬ ‫‪1‬‬
‫‪V1=3, N1=6‬‬ ‫‪V2=4, N2=10‬‬
‫قبل التنعيم‪ N1 :‬يف هذه احلالة = ‪ ،6‬و ‪( 3 = V2‬مفردات)‪:‬‬
‫‪C1 3‬‬
‫= )‪ 1‬‬
‫𝑤𝑤(‪P‬‬ ‫‪= = 0.5‬‬
‫‪N1 6‬‬
‫الصحيح‪ ،‬بام يتفق‬
‫وإذا مجعت كل االحتامالت اآلن سوف جتد أهنا تساوي الواحد‪C2 2‬‬
‫= ) ‪P(𝑤𝑤2‬‬ ‫‪= = 0.33‬‬ ‫مع إحدى مسلامت نظرية االحتامالت‪.‬‬
‫‪N1 6‬‬
‫‪C3 1‬‬
‫= ) ‪P(𝑤𝑤3‬‬ ‫‪= = 0.167‬‬
‫‪N1 6‬‬ ‫‪-176-‬‬
‫لتصبح بعد تنعيم البالس ‪ ،10 = N2  N1‬و ‪( 4 = V2  V1‬مفردات)‪:‬‬
‫من الواضح أن إضافة واحد صحيح لكل مرات ورود املفردات يضعف بشكل‬
‫ملموس احتامل املفردات التي وردت يف املدونة بتكرار قليل بالنسبة لتلك املفردات‬
‫التي مل ترد عىل اإلطالق؛ لذلك فإن هناك حماوالت لتحسني هذا النوع من التنعيم‬
‫بإضافة كمية ثابتة أقل من الواحد‪ ،‬وهذا يعتمد عىل حجم املدونة املستخدمة للتدريب‪.‬‬
‫ولكن كيف يتم تقدير عدد املفردات ‪V‬؟ بالنسبة للنحو األحادي‪ ،‬يتم تقديره عىل‬
‫أساس املعرفة باللغة؛ ولكن اللغة العربية غنية جدا يف عدد كلامهتا؛ ففي مدونة من‬
‫حواىل ‪ 158‬مليون كلمة من األخبار وجدنا هبا ‪ 950‬ألف مفردة خمتلفة بعضها عن‬
‫بعض (كتاب‪ ،‬والكتاب‪ُ ،‬تسبان كلمتني خمتلفتني)‪ ،‬ويف مدونة قريبة من ‪ 660‬مليون‬
‫كلمة وجدنا قري ًبا من ‪ 1.8‬مليون مفردة‪ ،‬لكنَّها احتوت عىل كمية كبرية من األخطاء‬
‫اللغوية‪ .‬فنحن ُن َقدِّ ر املفردات الصحيحة يف هذه احلالة بنحو ‪ 1.4‬مليون كلمة‪ .‬لذلك‬
‫عند التعامل مع جمال مثل األخبار (وباملناسبة‪ ،‬هو من املجاالت الغنية باملفردات لكثرة‬
‫جماالته الفرعية من سياسة واقتصاد‪ ،‬ورياضة‪ ،‬وعلوم‪ ،‬وحاالت الطقس‪ ...‬إلخ)‬
‫يمكن فرض أن عدد املفردات التي نتعامل معها قد يصل إىل أكثر من ‪ 2‬مليون مفردة‪،‬‬
‫زلزال يضيف مفردة جديدة للمجال‬ ‫ٌ‬ ‫مع ُمالحظة أن اسم قرية جديدة أو مدينة و َق َع هبا‬
‫كل يوم‪.‬‬
‫مالحظة‪ :‬ليس بالرضورة أن تكون إضافة ‪ 1‬هو احلل الوحيد املتاح‪ ,‬إذ يمكن إضافة‬
‫منخفضا جدًّ ا كام‬
‫ً‬ ‫كمية ثابتة أقل ‪ -‬كام يف املثال الذي سقناه آن ًفا (وإن مل يكُن بالرضورة‬
‫فعلنا‪ ،‬إنام اخرتنا القيمة القليلة (‪ )0.01‬لتناسب بساطة املدونة املستخدمة)‪ .‬وعادة ما‬
‫يتم ذلك عرب عدة جتارب‪.‬‬
‫ومن اجلدير ِّ‬
‫بالذكر أننا يف مثل هذه التجارب نحتاج إىل تقسيم املدونة إىل ‪ 3‬أقسام‪:‬‬
‫العددي)‪.‬‬
‫ّ‬ ‫Ÿ Ÿالقسم األول للتعلم (يف حالتنا لتعلم النحو‬
‫Ÿ Ÿالقسم الثاين الختيار أفضل القيم لبعض املعامالت (يف حالتنا الختيار أفضل قيمة‬
‫للثابت (‪.)...0.1 ،0.5 ،1‬‬
‫النهائي‪ ،‬وال جيوز تغيري املعامالت ثم إعادة التجربة‪ ،‬ألن ذلك‬
‫ّ‬ ‫Ÿ Ÿالقسم الثالث لالختبار‬
‫يعني أننا استعملنا قسم االختبار يف التدريب‪ .‬لتوضيح ذلك‪ ،‬هب أننا أعددنا اختبارا‬

‫‪-177-‬‬
‫للطالب فوجدنا مستواهم ضعي ًفا يف موضوع ما‪ ،‬فراجعناه معهم ثم أعدنا هلم‬
‫نفس االمتحان! هذا ال يفرز الطالب احلافظ من الطالب الفاهم‪ ،‬هلذا الغرض‬
‫ص القسم الثاين الغراض ضبط متغريات احلل‪.‬‬ ‫ُخ ِّص َ‬
‫§خصم جود‪-‬تيورينج (‪)Good-Turing Discount‬‬ ‫§‬
‫وهي نظر َّي ٌة إحصائ َّية‪ ،‬ت َ‬
‫ُنسب إىل العاملني «إرفنج جود (‪ )Irving John Good‬وأالن‬
‫تيورينج (‪ . »)Alan Turing‬وتعتمد منهجية اخلصم هنا عىل فكرة بسيطة‪ .‬إذا حسبنا‬
‫عدد املفردات التي ور َدت يف املدونة مرة واحدة‪ ،‬ولنسمها ‪ ، N1‬وعدد املفردات التي‬
‫ور َدت يف املدونة مرتَني‪ ،‬ولنسمها ‪ ،N2‬وهكذا سنحصل عىل ‪....،N5 ، N4 ، N3‬‬
‫تقديرا نظر ًّيا؛‬
‫ً‬ ‫وكذلك يمكن تقدير ‪ N2‬أي‪ ..‬املفردات التي مل ترد يف املدونة ‪ -‬ولو‬
‫فإننا لو افرتضنا يف ختصص معني أننا لن نتجاوز املليون مفردة‪ ،‬فإن‬
‫……‪N0=1,000,000 - N1 - N2 - N3 - N4 .‬‬

‫ونعود ملنهجية تقدير احتامالت ورود املفردات‪:‬‬

‫حيث ‪ C‬هو عدد التكرارات احلقيقي‪ ،‬و *‪ C‬هو التكرار التقديري ألغراض تنعيم‬
‫املالحظ يف أ َّية مدونة أنه كلام زادت تكرارات املفردات ُك َّلام َق َّلت‬
‫َ‬ ‫االحتامالت‪ .‬ومن‬
‫أعدادها؛ وهذا يعني أن ‪( Nc > Nc+1‬هذه العالمة < تعني أن شامهلا أكرب من يمينها)‪.‬‬
‫هي مقدار التخفيض يف األعداد‪ .‬ولو الحظت أننا‬ ‫ولذلك يمكننا اعتبار أن‬

‫فستكون النتيجة‪:‬‬ ‫زدنا «‪ »1‬وخفضنا بمقدار‬

‫Ÿ Ÿختفيض يف قيم االحتامالت ملا ورد من مفردات املدونة‪.‬‬


‫Ÿ Ÿوجود قيمة الحتامالت ورود املفردات التي مل ترد يف املدونة‪.‬‬
‫َ‬
‫تعال نستدعي مدونتنا الصغرية مرة أخرى‪:‬‬
‫Ÿ Ÿذهب حممد إىل املدرسة‪.‬‬

‫‪-178-‬‬
‫Ÿ Ÿحني وصل حممد إىل املدرسة قابل زميله أمحد‪.‬‬
‫يف مدونتنا السابقة؛ كام ورد منها يف مدونتنا البسيطة ‪ 11‬كلمة‪.‬‬
‫إذن‪ :‬تكون األعداد ‪ Nc‬كاآليت‪:‬‬

‫حممد‪ ،‬إىل‪ ،‬املدرسة‪ ،‬بداية اجلملة وهناية اجلملة‪ ،‬وال تنس أن عدد الكلامت ِّ ّ‬
‫الكل‬
‫املشاهد يف املدونة هو ‪ 16‬كلمة = ‪ . N‬وعليه‪ ،‬سيكون تطبيق منهجية التنعيم باستخدام‬
‫جود‪-‬تيورينج يف تقدير احتامل النحو الثنائى الذى مل نره يف املدونة‪:‬‬

‫بتنعيم جود‪-‬تيورينج‪.‬‬ ‫يعني احتامل ورود‬ ‫والرمز‬

‫‪ -2.2‬التنعيم باستخدام اإلدراج (‪)Interpolation‬‬

‫ترتكز طرق التنعيم باخلصم عىل تقدير قدر مناسب من االحتامالت للحاالت التي‬
‫خصم مما ورد علينا يف املدونة‪ .‬ولكن التنعيم باإلدراج يفيد يف حسـن تقدير ما‬
‫ً‬ ‫مل نر فيها‬
‫ورد علينا يف املدونة‪ ،‬وذلك كاآليت؛ إذا أردنا حتسينا للنحو الثالثي مثال‪:‬‬

‫بحيث يكون‬

‫‪-179-‬‬
‫وقيم ‪ λj‬أعال ُه يمكن إجيادها بإجراء التجارب ووضع قيم خمتلفة هلا واختيار القيم‬
‫التي تعطي أفضل النتائج للنحو (حسب املشكلة املستخدم فيها النحو)‪.‬‬
‫ولقراءة هذه املعادلة لتكون مفهومة أكثر سنعيد كتابتها بالكالم‪:‬‬
‫االحتامل املقدر للكلمة ن برشط ورود الكلمتان ن‪ ،1-‬ن‪=2-‬‬
‫ثابت يقدر من مدونة التدريب * احتامل كلمة ن برشط ورود الكلمتان ن‪،1-‬‬
‫ن‪2-‬قبلها‬
‫ثابت آخر يقدر من مدونة التدريب * احتامل كلمة ن برشط ورود كلمــة ن‪1-‬‬
‫قبـلها‬
‫ثابت آخر يقدر من مدونة التدريب * احتامل كلمة ن (أى النحو العددى)‬
‫عىل أن جمموع الثوابت الثالثة البد أن يكون واحدا صحيحا‪.‬‬
‫والفكرة من وراء هذا التحسني لتقدير النحو العددي تتبني من هذا املثال‪:‬‬
‫«قال اهلل تعاىل» و «ريض اهلل عنه»‪.‬‬
‫نفرتض جدالً أننا عند دراسة النحو الثالثي لكلمتي (تعاىل)‪( ،‬وعنه) وجدنا أن‬
‫ٍ‬
‫متساو يف املدونة؛ ولكن كان ورود (اهلل تعاىل) أكثر من (اهلل عنه)؛ وعليه‪..‬‬ ‫تكرارمها‬
‫فس ُيساهم هذا يف رفع احتامل (قال اهلل تعاىل) عن (ريض اهلل عنه)‪.‬‬

‫(‪)Smoothing using back-off‬‬ ‫‪ -3.2‬التنعيم بالرتاجع‬


‫§تراجع كاتز (‪)Katz back-off‬‬ ‫§‬
‫كم ٍل خلصم جود‪-‬تيورينج؛ وتُستَوحى فكرتُه‬ ‫كم ِّ‬
‫تراجع كاتز ‪ -‬عاد ًة ‪ُ -‬‬
‫ُيستَخدَ م ُ‬
‫من التنعيم باإلدراج؛ ويمكن من خالله فهم كيفية تقدير النحو العددي من درجة أعىل‬
‫بداللة النحو العددي من الدرجة األدنى منه مبارش ًة يف املدونة‪.‬‬
‫لو أن عندنا نحوا ثالثيا مطلوب تقديره‪ ،‬ألننا مل نره يف املدونة‪َّ ،‬‬
‫فإن الطرق السابقة‬
‫للخصم ‪ -‬وربام أفضلها حتى اآلن جود‪-‬تيورينج ‪-‬ستعطي ك َُّل ما مل نره َ‬
‫نفس االحتامل‪،‬‬
‫ولكن «كاتز» ُيقدِّ رها اعتامدا عىل النحو الثنائي واألحادي إذا لزم األمر‪ .‬وهذا يعني أن‬

‫‪-180-‬‬
‫نعطي احتامال أكرب للنحو الثالثي املقدر لكلامت مل ترد يف املدونة إذا كان نحوها الثنائي‬
‫أكرب‪ .‬ولبسط التعريف الرياىض انظر اسفل الصفحة(‪.)1‬‬
‫§التنعيم باستخدام طريقة «نزر‪-‬ناي» (‪)Kenser-Ney‬‬ ‫§‬
‫وف عىل هذه ال َّطريقة من خالل املثال التَّايل‪:‬‬
‫الو ُق َ‬
‫نستطيع ُ‬
‫ُ‬
‫أردت أن أقرأ فأخرجت‪ ......‬ومل يرد يف املدونة مثل هذه اجلملة قط‬
‫بافرتاض وجود كلمتني مرجحتني وهلام نفس النحو العددي األقل‪ ،‬مها‪:‬‬
‫Ÿ Ÿ«النظارة» (ما ورد يف املدونة‪ :‬عملت النظارة‪ ،‬وقعت النظارة‪ ،‬استخدمت النظارة‪،‬‬
‫وضعت النظارة‪.)....،‬‬
‫Ÿ Ÿ«بور» والتي مل ترد إال يف (بور سعيد‪ ،‬بور فؤاد)‪.‬‬
‫ُرجح‪ ،‬ألن ورودها مع كلامت أكثر يف املدونة جيعلها مرشحة‬ ‫فإن كلمة «النظارة» ت َّ‬
‫للورود أكثر من كلمة «بور» فيام مل نره ‪.‬‬
‫(‪)2‬‬

‫‪ -1‬نحتاج أن ن ّعرف‪:‬‬
‫‪C(x)= count of x‬‬ ‫أي تكرارات "‪"x‬‬
‫ ‬
‫احتامل ‪ x‬بعد اخلصم (باستخدام طريقة من طرق اخلصم السابقة) )‪P*(x‬‬
‫وبدال من استخدام ‪ wn,wn-1 , wn-2‬فإننا سنستخدم ‪ x,y,z‬لتكون املعادالت كاآليت‪:‬‬

‫العددي من درجة‬
‫ّ‬ ‫صحيحا)‪ ،‬ولنقل اعتامد النَّحو‬
‫ً‬ ‫حيث تعني معامل التطبيع (لتجعل جمموع االحتامالت ‪1‬‬
‫أعىل إىل درجة أقل‪ .‬أما ( ‪ )x,y‬أو ( ‪ )y‬فتعني أن هذا املعامل متغري يعتمد عىل ما بني األقواس‪.‬‬
‫أي درجة من النحو العددي؛ أي َّ‬
‫أن اقتصار املعادالت‬ ‫أن تراجع كاتز يمكن تعميمه عىل ّ‬ ‫وجتدُ ُر اإلشار ُة إىل َّ‬
‫التي ذكرناها عىل النحو العددي من الدرجة الثالثة هو ملجرد التبسيط وتوضيح الفكرة‪ .‬كذلك َّ‬
‫فإن املعامالت‬
‫أيضا من تكرارات النحو األحادي والنَّحو الثنائي ‪ ...‬إلخ‪.‬‬
‫جيري حساهبا ً‬
‫‪ -١‬وتصاغ معادالته كاآليت‪:‬‬

‫ثنائي ورد يف املدونة‪.‬‬


‫حيث ‪ d‬ثابت يطرح من كل احتامل لنحو ّ‬
‫صحيحا‪.‬‬
‫ً‬ ‫ُتتار (وهي خمتلفة من كلمة ألخرى) لتجعل جمموع االحتامالت ‪1‬‬ ‫و‬
‫تعني عدد الكلامت املختلفة (‪ )wi-1‬التي ترد فيها مع يف املدونة‪ ،‬مع مالحظة‬ ‫و‬
‫أننا نحيص التنوع وليس عدد مرات الورود‪ .‬مثال‪ :‬لو وردت الكلمة (‪ 10 )wi‬مرات مع كلمة و‪ 5‬مرات مع كلمة‬
‫الريايض |‪ |....‬إىل َّ‬
‫أن القيمة‬ ‫ّ‬ ‫الريايض املذكور هو ‪ 2‬وليس ‪( .15‬حيث يشري التعبري‬
‫ّ‬ ‫أخرى فقط‪ ،‬فيكون مفهوم التعبري‬
‫املذكورة تشمل عدد األنواع‪ ،‬وليس عدد التَّكرارات)‪.‬‬
‫تعني جمموع عدد املرات التي وردت فيها كلامت خمتلفة يف املدونة كلها‪ .‬‬ ‫و‬

‫‪-181-‬‬
‫العددي‬
‫ّ‬ ‫‪ -3‬موضوعات تساعد عىل حتسني النَّحو‬
‫هناك بعض اجلوانب ا َّلتي تساعد عىل حتسني التقدير‪ ،‬ومن ذلك‪:‬‬

‫‪ - 1.3‬النحو العددي الفئوي (‪)Class Based N-gram‬‬


‫خذ هذه األمثلة‪:‬‬
‫كان راتب سعيد ‪ 1000‬جنيه يف الشهر‬
‫ذهب عىل إىل اإلسكندرية يوم األربعاء‬
‫ركبت مريم طائرة مرص للطريان‬
‫الراتب‬
‫فلو ارتبط النحو العددي برقم (‪ )1000‬فقط ملا استفدنا من هذه املعلومة لو جاء َّ‬
‫خمتلفا يف موضع جديد؛ ولكن يمكن أن نحدد أن هناك فئة من األرقام يمكن أن حيل أحدها‬
‫مكان اآلخر‪ .‬وكذلك أيام األسبوع أو الشهور أو أسامء رشكات الطريان‪ ...‬إلخ‪.‬‬
‫ففي املدونات قليلة العدد يمكن تعظيم الفائدة منها إذا عاجلنا بعض األسامء‬
‫واألرقام باستخدام اسم الفئة التي تنتمي إليها هذه األسامء أو األرقام‪.‬‬

‫العددي املوضوعيّ (‪)Topic Based N-gram‬‬


‫ّ‬ ‫‪ - 2.3‬النحو‬
‫نحوا عدد ًّيا من مدونة ذات موضوعات‬
‫تتأثر النتائج كثريا بشكل إجيايب إذا استخدمنا ً‬
‫مشاهبة للموضوع الذي نحن بصدده‪.‬‬
‫كل منها عىل موضوعات‬ ‫لذلك يمكن حساب النحو العددي ملدونات حتتوي ٌّ‬
‫متشاهبة‪ ،‬مثل (مدونة سياسية‪ ،‬اقتصادية‪ ،‬علمية‪ ،‬قانونية‪ ...،‬إلخ)‪ .‬وهناك إضافات نوعية‬
‫قد تكون مفيدة عند استخدام النحو العددي‪ ،‬ومنها االستفادة من ظاهرة‪ :‬االستدعاء‪.‬‬

‫العددي باالستفادة من ظاهرة االستدعاء‬


‫ّ‬ ‫‪ -3.3‬دعم النَّحو‬
‫خذ هذا املثال‪:‬‬
‫ذهب إىل‬ ‫ ‬
‫ذهب حممد إىل‬ ‫ ‬
‫ذهب حممد وعيل إىل‬ ‫ ‬
‫ذهب حممد وعيل وسمري إىل‬ ‫ ‬
‫تالحظ أن كلمة «ذهب» استدعت وجود كلمة «إىل» يف كثري من األحيان بعدها‪.‬‬

‫‪-182-‬‬
‫العددي متغري الطول (‪)Variable length N-gram‬‬
‫ّ‬ ‫‪ - 4.3‬النَّحو‬
‫العددي أمهية قصوى يف تطبيقات كثرية؛ ولذلك نحتاج إىل دعمه بنظريات‬ ‫ّ‬ ‫للنَّحو‬
‫جديدة لغوية املنشأ مستوعبة الحتياج احلاسوبيني‪ ،‬وخاصة مع اللغة العربية ا َّلتي تتمت َُّع‬
‫ِ‬
‫بظاه َر َت االشتقاق والتَّوليد‪ .‬وإذا كنَّا نحتاج يف كثري من التطبيقات‪ ،‬مثل‪ :‬التعرف عىل‬
‫الكالم املنطوق يف اللغة اإلنجليزية‪ ،‬إىل ‪ 64‬ألف كلمة تغطي ‪ ٪99‬من احتياجات‬
‫الكلامت يف جمال معني (مثل جمال األعامل ‪ )Business‬فإننا نحتاج إىل أكثر من ‪600‬‬
‫ألف كلمة عربية لنقرب من درجة التغطية ‪ .٪99‬إن ذلك جيعل احتياجنا ملدونات كبرية‬
‫جدًّ ا ال مفر منه‪ ،‬واالحتياج إىل املعاجلات اللغوية املسبقة رضورة‪ .‬ومن هذه املعاجلات‬
‫التحليل الرصيف ملعرفة السوابق واللواحق وجذع الكلمة‪ ،‬وربام نحتاج أيضا للوزن‬
‫واجلذر‪( .‬الالفت لالنتباه أن العربية مبنية بعدد حمدود من السوابق واللواحق واألوزان‬
‫واجلذور) إال أن بناء النحو من هذه اللبنات له حتدياته ويستغرق جهو ًدا علم َّي ًة عميق ًة‬
‫من اللغويني واحلاسوبيني للخروج بنحو عددي يستفيد من ميزات اللغة العربية‬
‫الرصيف‪ ،‬ويلبي حاجة التطبيقات املختلفة‪.‬‬
‫ّ‬ ‫وتطورها‬

‫ي‬ ‫ِ‬
‫‪ -4‬تقويم قوة النَّحو ال َعدَ د ّ‬
‫نحتاج إىل تقويم كفاءة النحو املستخدم‪ ،‬ففي بعض التطبيقات يقيسون هذه الكفاءة‬
‫بام يسمى مقدار «االلتباس» (‪ .)Perplexity‬وكلام قل االلتباس يعني ذلك كفاءة أعىل‬
‫للنحو املستخدم‪ .‬وحيسب مقدار االلتباس كام يف املثال التايل‪:‬‬
‫عىل سبيل املثال‪ ،‬يف اللغة اإلنجليزية حيسب االلتباس عندما ال يكون هناك نحو عىل‬
‫تدر َبت عليها التقنية‪،‬‬ ‫ٍ‬
‫اإلطالق يف تقنية ال َّت َع ُّرف عىل الكالم املنطوق لعدد كلامت ُمت ََملة َّ‬
‫ومقدارها ‪ 20000‬كلمة‪.‬‬
‫ي يف اجلدول اآليت‪:‬‬
‫فكان مقدار االلتباس كام هو ُم َب َّ ٌ‬
‫االلتباس (‪)Perplexity‬‬ ‫العددي (‪)N-gram‬‬
‫ّ‬ ‫النحو‬
‫‪20000‬‬ ‫بدون نحو عىل االطالق‬
‫‪962‬‬ ‫النحو األحادي (‪)Uni-gram‬‬

‫‪-183-‬‬
‫االلتباس (‪)Perplexity‬‬ ‫العددي (‪)N-gram‬‬
‫ّ‬ ‫النحو‬
‫‪170‬‬ ‫النحو الثنائي (‪)Bi-gram‬‬

‫‪109‬‬ ‫النحو الثالثي (‪)Tri-gram‬‬

‫لننظر كيف انخفض مقدار االلتباس من ‪ 20000‬بدون أي معلومات معطاة للنظام‬


‫عن اللغة‪ ،‬إىل فقط ‪ 109‬بعد استخدام النَّحو ال ُّثالثِ ّي‪ .‬يمكن النَّظر إىل هذه األرقام‬
‫كأن املهمة التي تلقى عىل عاتق النظام قبل إعطاءه أي معلومات لغوية عند‬ ‫كاآليت‪ّ :‬‬
‫التعرف عىل الكلمة التي سمعها هي مهمة اختيار كلمة من ‪ 20000‬كلمة‪ .‬وليس له‬
‫دليل عىل هذه الكلمة إال ما يسمعه من صوت‪ .‬وتنخفض درجة االلتباس لنفس املهمة‬
‫إذا أفدنا النظام بمعلومات عن اللغة واستخداماهتا وتتابعات كلامهتا ملخصة يف النحو‬
‫الثالثي لتصبح املهمة كام لو كانت هي التعرف عىل كلمة من ‪ 109‬كلمة فقط باستخدام‬
‫تصو َر النتائج يف احلالتني؟ احلالة األوىل‪:‬‬
‫نستطيع ُّ‬
‫ُ‬ ‫املعلومات الواردة من الصوت‪ .‬هل‬
‫يفشل النظام متاما يف الوصول إىل نتيجة هلا أي اعتبار‪ ،‬أما يف احلالة الثانية فإن النتائج‬
‫يمكن أن تزيد عن ‪ ٪90‬كنسبة د َّقة يف التعرف عىل الكالم املنطوق يف ظروف مناسبة‪.‬‬
‫العددي إال أنه ‪ -‬وبعد املعاجلات املختلفة ملا مل يره‬
‫ّ‬ ‫فبالرغم من بساطة فكرة النحو‬
‫ٍ‬
‫درجة كبرية‪.‬‬ ‫أصبح ُمفيدً ا للغاية وعمليا إىل‬ ‫من كلامت وتتابعات ‪-‬‬
‫َ‬
‫هل لديك أخي الباحث فكرة نرية كهذه يصلح مع تطبيقها أن نصل لنتائج أفضل؟ إذا‬
‫متثيل ال ُّلغة رياض ًّيا‪ ،‬فإنَّنا كعاملني يف جمال تقنيات ال ُّلغة سنستفيد كثريا من ذلك‪.‬‬
‫أمكن ُ‬
‫ِ‬
‫واجتهد‪.‬‬ ‫فشمر‬
‫ِّ‬

‫وهناك العديد من األعامل اآلن يف جمال توليد نامذج لغوية من الشبكات العصبية؛‬
‫والنتائج تتحدث عن تفوق ملموس عن النحو العددي‪ ،‬إال أهنا حتتاج حلسابات تأخذ‬
‫يف الغالب وقتا أطول بكثري من ذلك الوقت الذي حيتاجه النحو العددي‪.‬‬

‫‪-184-‬‬
‫ي‬ ‫ِ‬
‫‪ -5‬أمثلة عىل جماالت اإلفادة من النَّحو ال َعدَ د ّ‬
‫َّعرف عىل الكالم املنطوق؛ كام أسلفنا‪ .‬فربام كان هذا هو التطبيق األول الذي‬
‫‪ -1‬الت ُّ‬
‫وتم من خالله عالج أخطر ُمشكالته‪ ،‬وهي عدم‬ ‫العددي َّ‬
‫ّ‬ ‫أظهر قوة النَّحو‬
‫حمتملة‪.‬‬
‫رؤيته حلاالت كثرية َ‬
‫ُالحظ إشارات اخلطأ احلمراء ا َّلتي ُينَ ِّب ُهنا إليها‬
‫ُ‬ ‫اإلمالئي؛ ولع َّلنا ن‬
‫ّ‬ ‫‪ -2‬التَّدقيق‬
‫ٍ‬
‫احتامالت‬ ‫املكتبي «ميكروسوفت ورد ‪ ، »MS-Word‬وما ُيرفقه من‬ ‫الربنامج‬
‫ّ‬
‫للصواب‪ .‬إن أصل العمل َّيات التي يقوم هبا هذا املدقق اإلمالئي هي من مثل‬ ‫َّ‬
‫العددي‪.‬‬
‫ّ‬ ‫النَّحو‬
‫ٍ‬
‫عبارات‬ ‫‪ -3‬الرتمجة اآللية؛ فقد تطورت ُن ُظم الرتمجة اآللية‪ ،‬وأمك َن من خالهلا توليد‬
‫العددي يف توليد الرتمجة ل ُّلغــة املستهــدفة‪.‬‬
‫ّ‬ ‫أكثر د َّقة عند استخدام النَّحو‬
‫‪ -4‬كام أن هناك يف ساحة حمركات البحث فرصة لتحسني البحث باستخدام النحو‬
‫العددي‪.‬‬
‫ّ‬
‫‪ -5‬وكذلك يف التطبيقات التعليمية لتعليم اللغات حيث ُيستخدم احلاسب لتحليل‬
‫العددي‪.‬‬
‫ّ‬ ‫ما كتبه املتعلم واحلكم عليه‪ .‬وهنا أيضا يستفاد من النحو‬
‫‪ -6‬هناك نظم للتعرف عىل احلروف العربية‪ ،‬فمنها املصمم للتعرف عىل الكالم‬
‫املطبوع‪ ،‬ومنها املصمم للتعرف عىل الكالم املكتوب باليد‪ ،‬ولوال استخدا ُم‬
‫العددي يف هذه التَّطبيقات لكانت النتائج جد هزيلة ‪...‬‬
‫ّ‬ ‫النحو‬

‫وحات علم َّي ٍة ُمستَقبل َّية‬


‫ٍ‬ ‫ألطر‬
‫أفكار بحث َّية ُ‬
‫ٌ‬ ‫‪-6‬‬
‫‪ -1‬تكوين مدونة لبعض املجاالت‪ُ ،‬تتار موضوعاهتا بحيث حتقق أعىل تغطية‬
‫للكلامت التي يمكن أن تأيت يف هذا املجال‪.‬‬
‫‪ -2‬البحث يف أفكار جديدة ملعاجلة مشكلة الكلامت التي مل نرها من قبل (يف املدونة‬
‫املخصصة للتدريب)‪ ،‬والتي نسميها التنعيم‪ .‬كلام استفدنا من خصائص اللغة‬
‫كلام كانت احللول أوفق وأفضل‪.‬‬

‫‪-185-‬‬
‫موارد لغوية تساعد عىل تفضيل كلمة عن كلمة أخرى متقاربتني يف‬ ِ ‫ تكوين‬-3
.‫النطق أو الكتابة اعتام ًدا عىل خصائص داللية للكلمتني‬
‫ عمل معاجم مستنبطة من مدونات ترجح استخدام كلمة عن كلمة متقاربة‬-4
.‫معها ىف الرسم أو النطق تبعا للسياق‬
‫ حتتاج كثري من التطبيقات كالتعرف عىل الكالم املنطوق إىل معرفة نطق الكلمة‬-5
‫ فوضع منظومة من القواعد املساعدة لضبط الكلمة من‬- ‫الصحيح من سياقها‬
.‫سياقها سيساعد كثريا‬

‫ببليوجرافيا مرجع َّية‬


1. Bellegarda, J. R. & Monz, C. (2016). State of the art in statistical
methods for language and speech processing. Computer Speech &
Language, Elsevier, Vol. 35, pp. 163-184.
2. Cui, J. (2011). Integrating Linguistic and Statistical Knowledge in
Language Modeling. BiblioBazaar.
3. Deng, L.; Liu, Y. (2018). Deep Learning in Natural Language Pro-
cessing. Springer.
4. Farghaly, A. A. S. (2010). Arabic Computational Linguistics. Uni-
versity of Chicago Press.
5. Franz, A. & Brants, T. (2006). “All Our N-gram are Belong to You”.
Google Research Blog.
6. Friedenthal, S. & Moore, A. & Steiner, R. (2011). A Practical Guide
to SysML: The Systems Modeling Language. Elsevier.
7. Goutte, C. (2009): Learning Machine Translation. MIT Press.

8. Huang, G. & Huang, G.B. & Song, S. & You, K. (2015). Trends in
extreme learning machines: a review. Neural Networks, Elsevier,
Vol. 61, pp. 32-48.

-186-
9. Johnson, M. & Khudanpur, S. P. & Ostendorf, M. & Rosenfeldm R.
(2004). Mathematical Foundations of Speech and Language Pro-
cessing. Springer.
10. Jozefowicz, R. & Vinyals, O. & Schuster, M. & Shazeer, N. & Wu
& Y. (2016). Exploring the limits of language modeling. Cornell
University.
11. Jurafsky, D. & Martin, J. H. (2009). Speech and Language Process-
ing: An Introduction to Natural Language Processing, Computa-
tional Linguistics, and Speech Recognition. Prentice Hall.
12. Koren, B. & Vuik, K. (2010). Advanced Computational Methods in
Sci-ence and Engineering. Springer.
13. Kumarm E. (2011). Natural Language Processing. I. K. Internation-
al Pvt Ltd.
14. Luong, M. T.& Le, Q. V. & Sutskever, I. & Vinyals, O. & Kaiser,
L. (2015). Multi-task sequence to sequence learning. Cornell Uni-
versity.
15. Lv, Y. & Zhai, C. (2009). Positional Language Models for Informa-
tion Retrieval, in Proceedings of the 32nd international ACM SIGIR
conference on Research and development in information retrieval
(SIGIR).
16. Manning, C. D. & Schütze, H. (1999). Foundations of Statistical
Natural Language Processing, MIT Press: ISBN 0-262-13360-1.
17. Matsumoto, Y. & Sproat, R. & Wong, K. & Zhang, M. (2006). Com-
puter Processing of Oriental Languages. Beyond the Orient: The
Research Challenges Ahead: 21st International Conference, IC-
CPOL 2006, Singapore, December 17-19, 2006, Proceedings.
18. Mishra, S. (2018). Artificial Intelligence and Natural Language Pro-
cessing. Cambridge Scholars Publisher.

-187-
19. Mulder, W. D. & Bethard, S. & Moens, M. F. (2015). A survey on
the application of recurrent neural networks to statistical language
modeling. Computer Speech & Language, Elsevier, Vol. 30, pp. 61-
98.
20. Neamat El, G.; Yee, S. (2018). Computational Linguistics, Speech
and Image Processing for Arabic Language. World Scientific.
21. Olive, J. (2011). Handbook of Natural Language Processing and
Machine Translation. Springer.
22. Sauro, J. & Lewis, J. R. (2012). Quantifying the User Experience:
Practical Statistics for User Research. Elsevier.
23. Schimek, M. G. (2012). Smoothing and Regression: Approaches,
Computation, and Application. John Wiley & Sons.
24. Soudi, A. (2012). Challenges for Arabic Machine Translation. John
Benjamins Publishing.
25. Srinivasa-Desikan, V. (2018). Natural Language Processing and
Computational Linguistics: A practical guide to text analysis with
Python, Gensim, spaCy, and Keras. Packt Publishing.
26. Su, Y. (2011). Knowledge Integration into Language Models: A
Random Forest Approach. BiblioBazaar.
27. Sundermeyer, M. & Ney, H. & R Schlüter, R. (2015). From feed-
forward to recurrent LSTM neural networks for language modeling.
IEEE/ACM Transactions on Audio, Speech and Language Process-
ing, Vol. 23, pp. 517-529.
28. Wei, X. (2007). Topic Models in Information Retrieval. ProQuest.

29. Weinert, H. L. (2013). Fast Compact Algorithms and Software for


Spline Smoothing. Howard L. Weinert.
30. Zhai, C. (2009): Statistical Language Models for Information Re-
trieval. Morgan & Claypool Publishers.

-188-
‫الباحثون‬

‫‪-189-‬‬
-190-
‫الرازق عيل رشوان‬ ‫ِ‬
‫الدكتور‪ُ /‬مسن عبد َّ‬
‫أستاذ بقسم اإللكرتونيات واالتصاالت‬ ‫ٍ‬ ‫يشغل منصب‬
‫ختر َج عام ‪1977‬‬‫الكهربائية يف ُك ِّل َّية اهلندسة ‪ -‬جامعة القاهرة‪َّ .‬‬
‫وحصل عىل ثالتة ماجستريات‪ ،‬ثم‬ ‫َ‬ ‫وكان األول عىل دفعته‪،‬‬
‫عىل الدُّ كتوراه من جامعة كوين بكندا؛ أرشف عىل أكثر من مائة‬
‫املتخ ِّصصة‬ ‫الشكة اهلندسية لتطوير النُّ ُظم الر ِ‬
‫قم َّية ‪َ RDI‬‬ ‫رسالة ماجستري ودكتوراه‪ .‬يدير َّ‬
‫َّ‬ ‫َّ‬
‫يف جمال تقنيات ال ُّلغة العرب َّية‪.‬‬

‫الدكتور‪ /‬ا ُملعت ّز باهلل َّ‬


‫السعيد طه‬
‫الـمساعد بجامعة القاهرة‪ ،‬وأستاذ‬ ‫أستاذ الدِّ راسات ال ُّلغو َّية ُ‬
‫ال ِّلسان َّيات احلاسوب َّية املـُشارك بمعهد الدَّ وحة للدِّ راسات ال ُعليا‪،‬‬
‫الـمعجم َّية بمرشوع ُمعجم الدَّ وحة‪.‬‬ ‫نسق َوحدة املوارد ُ‬ ‫و ُم ِّ‬
‫عدد من الكتب‬ ‫ٍ‬ ‫ثالثني ورقة علم َّي ٍة‪ ،‬باإلضافة إىل‬ ‫نحو‬
‫َ‬ ‫َش َ‬ ‫نََ‬
‫وأسهم يف أكثر من عرشة‬ ‫عاصة‪،‬‬ ‫يف الـمعج ِمية العربِية والدِّ راسات ال ُّل َغ ِوية الـم ِ‬
‫َ‬ ‫ُ‬ ‫َّ‬ ‫ُ َ َّ َ َ َّ‬
‫عدد من اجلوائز‬ ‫حصل عىل ٍ‬ ‫َ‬ ‫وعات بحث َّي ٍة دول َّي ٍة يف ميادين ُم َ‬
‫عالة ال ُّلغات ال َّطبيع َّية‪.‬‬ ‫ٍ‬ ‫مرش‬
‫ُ‬
‫ختصصه‪ ،‬منها‪ :‬جائزة (ألكسو ‪ )ALECSO‬لإلبداع واالبتكار يف «املـَع ُلومات َّية‬ ‫يف َميدان ُّ‬
‫حيد لل ُع ُلوم وال َّثقافة‪.‬‬ ‫عالة اآلل َّية ل ُّلغة العرب َّية»‪ ،‬وجائزة راشد بن ُ َ‬
‫والـم َ‬
‫ُ‬

‫هواري‬
‫الدكتور‪ /‬عبد العاطي إبراهيم َّ‬
‫َعمل باح ًثا زائرا يف جامعة جورج واشنطن‪ ،‬يف الواليات‬
‫ا ُملتَّحدة األمريك َّية‪ .‬حصل عىل درجة الدُّ كتوراه يف اللسانيات عام‬
‫عمل‬‫عمل يف العديد من املرشوعات البحث َّية العرب َّية؛ كام َ‬ ‫‪2008‬م‪َ .‬‬
‫باح ًثا يف جامعة كولورادو وجامعة كولومبيا األمريك َّية َ‬
‫قبل أن يت َِّّج َه‬
‫َش عد ًدا من األوراق البحث َّية‬ ‫للعمل يف جامعة جورج واشنطن‪ .‬ن َ َ‬
‫َ‬
‫شارك يف العديد من‬ ‫يف الدِّ اللة ا ُملعجم َّية وقضايا ا ُملعجم َّية ال َع َر ِّب َّية والرصف العريب‪ ،‬كام‬
‫داخل مرص وخارجها‪ .‬له عد َد من ا ُمل َؤ َّلفات العلم َّية املنشورة‪.‬‬ ‫املؤمترات الدَّ ول َّية َ‬

‫‪-191-‬‬
‫األنصاري‬
‫ّ‬ ‫الدكتور‪ /‬سامح َسعد أبو ا َملجد‬
‫الصوتِ َّيات‬ ‫ورئيسا لقسم َّ‬ ‫ً‬ ‫احلاسوبِ َّية‬
‫ُ‬ ‫َيعمل أستا ًذا ل ِّلسان َّيات‬
‫ومديرا ملركز‬ ‫ً‬ ‫وال ِّلسان َّيات ب ُك ِّل َّية اآلداب بجامعة اإلسكندر َّية‪،‬‬
‫ال ُّلغو َّيات احلاسوب َّية العرب َّية بمكتبة اإلس َكندَ ِر َّية‪ .‬شارك يف العديد‬
‫َش ال َع ِديدَ من األوراق ال َبحثِ َّية ا َملعنِ َّية‬ ‫من املرشوعات العلمية ون َ َ‬
‫ضو بجمع َّية ال ِّلسان َّيات ال َع َربِ َّية‬ ‫بحوسبة ال ُّلغة ال َع َربِ َّية؛ وهو ُع ٌ‬
‫الشبكات الداللية احلاسوبية العا َلِ َّية‬ ‫بم َؤ َّسسة ُلغة َّ‬
‫وعضو ُ‬ ‫ٌ‬
‫ِ‬
‫األمريك َّية‪،‬‬ ‫بالواليات ا ُملتَّحدة‬
‫بجنيف‪.‬‬

‫‪-192-‬‬
‫مباحث لغوية ‪٥٦‬‬
‫الموارد ال ُّلغو َّية الحاسوب َّية‬

‫يُصدِ ر مركز امللك عبداهلل بن عبدالعزيز الدولي خلدمة اللغة العربية هذا الكتاب ضمن سلسلة‬
‫(مباحث لغوية)‪ ،‬وذلك وفق خطة عمل مقسمة إلى مراحل‪ ،‬ملوضوعات علمية رأى املركز حاجة املكتبة‬
‫اللغوية العربية إليها‪ ،‬أو إلى بدء النشاط البحثي فيها‪ ،‬واجتهد يف استكتاب نخبة من احملررين واملؤلفني‬
‫للنهوض بعنوانات هذه السلسلة على أكمل وجه‪.‬‬
‫ويهدف املركز من وراء ذلك إلى تنشيط العمل يف املجاالت التي تُـنَـ ّبه إليها هذه السلسلة‪ ،‬سواء أكان‬
‫العمل علميا بحثيا‪ ،‬أم عمليا تنفيذيا‪ ،‬ويدعو املركز الباحثني كافة من أنحاء العالم إلى املساهمة يف هذه‬
‫السلسلة‪.‬‬
‫وجهد ُمح ِّر َري الكتاب‪ ،‬على ما تفضلوا به من رؤى‬
‫وتو ّد األمانة العامة أن تشيد بجهد السادة املؤلفني‪ُ ،‬‬
‫وأفكار خلدمة العربية يف هذا السياق البحثي‪.‬‬
‫والشكر والتقدير الوافر ملعالي وزير التعليم املشرف العام على املركز‪ ،‬الذي يحث على كل ما من‬
‫شأنه تثبيت الهوية اللغوية العربية‪ ،‬ومتتينها‪ ،‬وفق رؤية استشرافية محققة لتوجيهات قيادتنا احلكيمة‪.‬‬
‫موجهة إلى جميع املختصني واملهتمني للتواصل مع املركز؛ لبناء املشروعات العلمية‪ ،‬وتكثيف‬
‫والدعوة ّ‬
‫اجلهود‪ ،‬والتكامل نحو متكني لغتنا العربية‪ ،‬وحتقيق وجودها السامي يف مجاالت احلياة‪.‬‬

‫األمني العام للمركز‬


‫أ‪ .‬د‪ .‬محمود إسماعيل صالح‬

You might also like