You are on page 1of 6

‫تع د اللغ ة العربي ة من أص عب اللغ ات في مج ال المعالج ة اآللي ة للمنط وق والمكت وب‪،‬‬

‫نظ را للخص ائص الص رفية والتركيبي ة والص وتية ال تي تتمت ع به ا‪ .‬ش هدت الس نوات األخ يرة‬

‫اهتمام ا متزاي دا بمختل ف حق ول المعالج ة اآللي ة للغ ة العربي ة‪ ،‬وتوص ل الب احثون إلى كث ير من‬

‫اإلنج ازات في المورفولوجي ا‪ ،‬والبحث عن المعلوم ات‪ ،‬واص طناع الكالم‪ ،‬والتع رف على‬

‫المنطوق‪...‬‬

‫بوادر المعالجة اآللية للغة العربية‬ ‫‪-1‬‬

‫شرع في البحث في هذا المجال في سنوات ‪ 1970‬حتى قبل أن يحل الباحثون مشكل‬

‫الكتابة باللغة العربية في الحاسوب‪ ،‬وارتكزت أول الدراسات على المعجم‪ ،‬والص رف‪ .‬لكن في‬

‫أواخ ر س نوات ‪ ،1990‬ك ان لتعميم اإلن ترنت وانتش ار أدوات االتص ال بالعربي ة أث ر في تزاي د‬

‫الحاج ة إلى إنج از المزي د من التطبيق ات‪ .‬تش ير اإلحص اءات إلى أن ه بداي ة من س نوات ‪1995‬‬

‫عندما أطلقت أول صحيفة إلكترونية باللغة العربية‪ ،‬ارتفع عدد المواقع بصفة تصاعدية‪ ،‬وفي‬

‫حدود سنوات ‪ 2000‬بلغ عددها ‪ 20000‬موقعا‪.‬‬

‫بالنتيج ة‪ ،‬امت د نش اط البحث ليش مل مح اور أخ رى في المعالج ة اآللي ة للغ ة العربي ة‬

‫كالتحلي ل النحوي‪ ،‬والترجم ة اآللية‪ ،‬والفهرس ة اآللي ة‪ ،‬والبحث عن المعلوم ات‪ ،‬والتعرف على‬

‫الكالم واصطناعه‪ ،‬وترجمة المنطوق‪...‬‬

‫المعالجة اآللية للنص‬ ‫‪-2‬‬

‫تتض من األبجدي ة العربي ة ص وامت وص وائت وعالم ات للض بط وال ترقيم‪ .‬دائم ا تك ون‬

‫الص وائت مس بوقة بالص وامت ومص احبة ل ه في الكتاب ة فوق ه أو تحت ه‪ .‬تتم يز العربي ة بش كل‬

‫خاص للكلمة تسهل تحديد المقاطع حيث إن عددها ال يتجاوز ‪ 03‬ترتيبات ممكنة‪ ،‬وهي‪CV, :‬‬

‫‪ CVC, CVCC‬ويشمل ‪ V‬كال الصامتين الطويل والقصير‪.‬‬


‫يختل ف ش كل الح رف بحس ب موقع ه في الكلم ة بداي ة أو انته اء أو م درجا أو مع زوال؛‬

‫فكل صامت له على األكثر ‪ 04‬أشكال مختلفة‪ .‬هناك ‪ 28‬صامتا و‪ 6‬صوائت (طويلة وقصيرة‬

‫‪ .)/i/, /a/, /u/‬باإلض افة إلى ذل ك‪ ،‬هن اك عالم ات (الحرك ات) ت دل على الص وائت القص يرة‬

‫وأخرى على تضعيف الصامت أو الصائت (الشدة والمدة)‪ ،‬والتنوين والسكون‪.‬‬

‫تس تعمل األرق ام العربي ة أو الهندي ة لكن نطقه ا يختل ف بحس ب الس ياق النح وي فمثال‬

‫ال رقم ‪ 7‬ينط ق بـ‪ 12‬إمكاني ة (‪sab3i/, /sab3a/, /sab3u/, /sab3in/, /sab3an/,/‬‬

‫‪.)//sab3un/, /sab3ati/, /sab3ata/,/sab3atu/, /sab3atin/, /sab3atan/, /sab3atun‬‬

‫تكتب النص وص العربي ة وتق رأ من اليمين إلى اليس ار‪ ،‬وال تعين الص وائت القص يرة‬

‫عموما‪ ،‬مما يعني أن هناك تمثيلين صائتيا وغير صائتي‪ .‬لدى قراءة نص غير مشكل يضفي‬

‫المتكلم العربي بطريقة مضمرة الصائت المناسب على الصامت‪ .‬مثل هذه العملية معقدة جدا‬

‫لتع الج آلي ا‪ .‬مثال‪> :‬كتبت< يمكن أن يحي ل على ‪ 4‬طرائ ق في النط ق‪katabtu/,/ :‬‬

‫‪ ./katabta/, /katabti/, /katabat‬وبالت الي يس تحيل نط ق مث ل ه ذه الكلم ات دون معرف ة‬

‫السياق‪ ،‬وكذا نحتاج في كثير من األحيان أن نفهم النص حتى نشكله وننطقه‪.‬‬

‫من جهته‪ ،‬يعكس الصرف العربي نوعا خاصا من األنظمة الصرفية‪ ،‬ويتميز بتأسيسه‬

‫على مفه ومي الج ذر وال وزن‪ ،‬مم ا يجع ل أغلب القواع د الص رفية محكم ة البن اء والتنظيم‪،‬‬

‫وبالنتيجة تمثل المحلالت الصرفية أبرز أنظمة المعالجة اآللية للغة العربية‪ ،‬واسترعت انتباه‬

‫كثير من الباحثين‪ .‬بالمقابل‪ ،‬يتطلب تصميم محلل صرفي ذي جودة عالية قاعدة بيانات شاملة‬

‫ووافية وتنظيما سهل التكيف مع البيانات الجديدة‪.‬‬

‫المعالجة اآللية للكالم‬ ‫‪-3‬‬


‫حققت البحوث حول معالجة الكالم العربي تقدما كبيرا‪ ،‬نظرا لتحسين تقنيات معالجة‬

‫اإلش ارة‪ ،‬وتط ور الدراس ات ال تي تتن اول الخص ائص التنغيمي ة والمقطعي ة للغ ة العربي ة وك ذا‬

‫النمذج ة الص وتية للص يغ العربي ة‪ .‬ينبغي له ذه النت ائج أن تش جع على المزي د من التق دم في‬

‫مجاالت أكثر ابتكارا‪ ،‬مثل االصطناع والتعرف اآلليين للكالم‪.‬‬

‫‪ -1.3‬االصطناع اآللي للكالم‬

‫يع د اس تعمال الحاس وب وتطبيقات ه في دراس ة العربي ة من أح دث االتجاه ات في‬

‫اللس انيات العربي ة المعاص رة ‪ .‬وق د ق ام بعض الب احثين الع رب المعاص رين بتطوي ع تقني ات‬

‫الحاسوب خدمة للعربية وقضاياها وتطوير دراستها صرفا ونحوا وصوتا ومعجما وداللة ‪ .‬إن‬

‫أولى االس تخدامات العربي ة لإلف ادة من تقني ات الحاس وب وتوظيفه ا في البح وث اللغوي ة ك انت‬

‫على يد أستاذ الفيزياء بجامعة الكويت الدكتور علي حلمي موسى ‪ ،‬فأصدر ‪:‬‬

‫دراسة إحصائية لجذور معجم الصحاح باستخدام الكومبيوتر ‪ ،‬طبعته جامعة الكويت‬ ‫‪.1‬‬

‫طبعتين مابين ‪ 1972 – 1971‬و ‪ ، 1973‬وطبعته الهيئة المصرية العامة للكتاب ط‬

‫‪. 1978 / 3‬‬

‫دراس ة إحص ائية لج ذور معجم ت اج الع روس باس تخدام الكوم بيوتر ‪ ،‬باالش تراك م ع‬ ‫‪.2‬‬

‫الدكتور عبد الصبور شاهين ‪ ،‬من مطبوعات جامعة الكويت ‪. 1973‬‬

‫اس تعمال الحاس وب في دراس ة ألف اظ الق رآن مجل ة ع الم الفك ر مج‪ - 12‬ع‪1982 4‬‬ ‫‪.3‬‬

‫وفكرة هذه الدراسات هو الوقوف على بنية الكلمة العربية وطبيعة نسجها ‪ ،‬وإ حصاء‬

‫األص ول المعجمي ة لم واد العربي ة على ش كل ج داول تُحص ي ج ذور اللغ ة وحروفه ا‬
‫وتتابع الصوتي ‪ ،‬وخصائص التجمعات الفونولوجية للعربية ‪ ،‬ومقارنة نتائج المعاجم‬

‫سجل‬
‫بعضها ببعض من إهمال أو زيادة في كمية الجذور المذكورة في أحدهما ‪ .‬وما ُي ّ‬

‫لهذه الدراسات ‪:‬‬

‫أ‌‪ -‬أنها ابتكار غير مسبوق ‪ ،‬يتسم بالجدة في دراسة العربية وقضاياها ‪.‬‬

‫ب‌‪ -‬ش ِهدت ألول مرة تعاونا بين الفيزيائيين واللغويين‬

‫تبين أن التطبيق األول للسانيات الحاسوبية هو حقل اإلحصاء اللغوي ‪.‬‬


‫ج‌‪ّ -‬‬

‫لق د ك انت ه ذه هي الب دايات األولى لظه ور اللس انيات الحاس وبية ‪Computational‬‬

‫وتوس ع مفهوم هذا الفرع اللساني الجديد شيئا فشيئا في الدراسات‬


‫ّ‬ ‫تطور‬
‫‪ ، Linguistics‬وقد ّ‬

‫ال تي ص درت فيم ا بع د ‪ ،‬فص ار يع الج اللغ ة حاس وبيا ‪ ،‬مازج ا بين مب ادئ اللس انيات العام ة‬

‫ومب ادئ علم الحاس بات األلكتروني ة مث ل ال ذكاء االص طناعي وعلم المنط ق وعلم الرياض يات ‪.‬‬

‫واستقر تعريفه ‪ :‬بأنه علم دراسة أنظمة الحاسوب لغرض فهم وتوليد اللغة الطبيعية ‪ ،‬ودراسة‬

‫الجوانب الحاس وبية للغ ة والمش اكل ال تي تواج ه المعالج ة الحاسوبية للغ ة المكتوب ة والمنطوق ة‪.‬‬

‫وتطورت اللسانيات الحاسوبية على شقين ‪:‬‬

‫األول ‪ :‬زيادة الدراسات في العربية واللسانيات الحاسوبية وتطبيق المعالجة اآللية على أنظمة‬

‫العربية الصوتية والصرفية والنحوية والمعجمية ‪ .‬إن أول كتاب كان للدكتور نبيل علي (اللغة‬

‫العربية والحاسوب ‪ )1988 -‬ويعد إلى اآلن من المراجع المهمة والرائدة ‪ ،‬ثم توالى التأليف‬

‫فأصدر الدكتور عبد ذياب العجيلي كتابه (الحاسوب واللغة العربية ‪ ، )1996‬ومن اإلسهامات‬

‫المهمة كتاب الدكتور نهاد الموسى (العربية نحو توصيف جديد في ضوء اللسانيات الحاسوبية‬

‫‪ ، )2000 -‬وترج ع أهميت ه لكون ه ص ادرا من متخص ص باللغ ة العربي ة ‪ .‬ه ذا فض ال عن‬
‫عش رات البح وث ال تي ُن ِش رت في المجالت أو ال تي أُلقيت في الم ؤتمرات والن دوات المختص ة‬

‫بتقنية الحاسوب واستثمارها لغويا ‪.‬‬

‫الث اني ‪ :‬إنش اء بعض الكلي ات لقس م خ اص باس م (علم اللغ ة الحاس وبي) ‪ ،‬في جامع ة األم ير‬

‫سلطان األهلية بالرياض ‪ ،‬وهو أول قسم متخصص في هذا المجال بالجامعات العربية ‪ .‬وقد‬

‫لعت على توص يف المق رر الدراس ي لم ادة علم اللغ ة الحاس وبي ‪ ،‬فك ان هدف ه إعط اء فك رة‬
‫ط ُ‬ ‫اّ‬

‫أساس ية عن المعالج ة اآللي ة للص رف والنح و ‪ ،‬م ع التع ّرف على م زيج من المعرف ة اللغوي ة‬

‫والمعرفة الحاسوبية المرتبطة بالذكاء االصطناعي ‪.‬‬

‫إن للسانيات الحاسوبية شقّين ‪:‬‬

‫األول ‪ :‬نظري ‪ ،‬ويبحث في اإلطار النظري العميق الذي من خالله يمكن افتراض كيفية عم ل‬

‫العقل األلكتروني لحل المشكالت اللغوية ‪.‬‬

‫الث اني ‪ :‬تط بيقي ‪ُ ،‬يعنى بالن اتج العملي لنمذج ة االستعمال اإلنساني للغ ة ‪ ،‬وإ نت اج ب رامج ذات‬

‫معرفة باللغة اإلنسانية الحاسوبية ‪ .‬والجانب التطبيقي هو األهم في اللسانيات الحاسوبية ؛ ألنه‬

‫سخر إمكانات الذكاء االصطناعي (العقل األلكتروني) لحل القضايا اللغوية ‪ِ ،‬م ّم ا يؤدي إلى‬
‫ُي ّ‬

‫تفاع ل مس تمر بين اللغ ويين والحاس وبيين ‪ ،‬فينتج عن ه محاول ة لح ّل المش كالت ال تي تواج ه‬

‫التحليل الحاسوبي للعربية‪ ،‬منها ما يتعلّ ق بأصواتها أو بنيتها أو تركيبها أو داللتها أو معجمها‬

‫ا‪.‬‬ ‫ام كتابته‬ ‫أو بنظ‬

‫وق د زاد من أهمي ة اللس انيات الحاس وبية اس تثمار نتائجه ا في مج ال التع ريب وص ناعة المعجم‬

‫واإلحصاء اللغوي والمعالجة اآللية وتعلم اللغات والترجمة اآللية فضال عن خدمته لرفد اللغة‬

‫الفني ة لمختل ف العل وم ‪ِ ،‬م ّم ا ّ‬


‫أدى إلى إنش اء بن وك للمص طلحات ته دف لخل ق‬ ‫بالمص طلحات ّ‬

‫المعربة منها وتوفيرها وتوثيقها وتوحيدها ‪.‬‬


‫ّ‬
‫إن العربية هي المستفيد األول من استخدام تقنية الحاسوب ‪ ،‬الذي يمكن تطويع آلياته وأنظمته‬

‫للتواءم مع خصوصية العربية على جميع مستوياتها اللغوية ‪ ،‬وال سيما أن الجيل الخامس من‬

‫الحواس يب سيتواص ل كالمي ا م ع المس تخدم ‪ ،‬وم ا ذل ك إال ألن التواص ل الكالمي أس هل وأنج ع‬

‫أن واع التواص ل ‪ ،‬فمن األولى أن يك ون ل دينا أنظم ة حاس وبية تتع ّرف على لغتن ا وتحل ل‬

‫مي ز الكالم ال ذي يتم تولي ده آلي اً‪ ،‬وتحلي ل كلم‬


‫وي ّ‬
‫نصوص ها وأوامره ا ليتع ّرف عليه ا الحاس وب ُ‬

‫العربي ة وتركيبه ا‪ ،‬وتحلي ل جمله ا وتولي دها‪ ،‬ومعالج ة العربي ة معالج ة آلي ة تعتم د في أص ولها‬

‫وأساسها على بناء قاعدة من البيانات المستخلصة من سمات العربية القابلة للمعالجة حاسوبياً‬

‫صبت الجهود في هذا الفرع اللساني في ‪:‬‬


‫بمتوياتها كافة ‪ .‬لقد ّ‬

‫إقامة عالقة بين المقاييس العلمية والمعايير اللغوية ‪ ،‬فتتخلّص اللغة من عموميتها إلى‬ ‫‪.1‬‬

‫دقة التمثيل الرياضي المنضبط ‪.‬‬

‫بيان قدرة العربية على استيعاب لغة العصر وتمثُّل تقنياته بكفاءة واقتدار ‪ ،‬وانضمامها‬ ‫‪.2‬‬

‫للغ ات اإلنس انية المتض منة األس س الرياض ية للنم اذج اللنحوي ة حاله ا ح ال جمي ع‬

‫اللغ ات ‪ ،‬واستش راف خص ائص العربي ة ال تي تجعله ا ذات قابلي ة للمعالج ة الحاس وبية‬

‫على المستوى الصرفي والتركيبي والمعجمي‪.‬‬

‫إن الطريق أمام إسهامات اللسانيات الحاسوبية وتوظيفها في خدمة العربية ما زال طويال ‪،‬‬
‫ويحتاج لجهود الباحثين المخلصين لتذليل العقبات أمام هذا الفرع الجديد من اللسانيات‬
‫‪.‬التطبيقية‬

You might also like