Professional Documents
Culture Documents
المحاضره 10 تعريب الحاسبات
المحاضره 10 تعريب الحاسبات
الحاسبـ ـ ـ ـ اـات
تتعريب ال ا
الفرقة ال ابعة
الرابعة قسم الحاسب اآللي -الف قة
المحاضرة العاش ـ ـ ـ ـ ـ ـ ــرة
استاذ المقرر
د /أأحمد لالحربي
١
ٓ
المعالجة اال ليـ ـ ـ ـ ـ ـ ـ ــة للكالم المنط ـ ـ ـ ـ ـ ــوق
ٔ
التعرف و ال ال ف
التاليف ال ف
٢
مقدمة
تنشا اللغات مثل بقية الكائنات الحية وتتطور وتضمحل متأثرة بحضارة
متكلميھا ومؤثرة فيھا .والعوامل ذات األثر في تطور اللغات عديدة
ومتنوعة يتعدى البت في كل خفاياھا أھداف ھذه الورقة غير أن
المتأمل في تطور تاريخ ھذه اللغات ال يخفي علية الدور الفعال الذي
بعثته التكنولوجيا في ضمان بقاء بعض اللغات وإقصاء لغات أخري أو
النزول بھا إلي درجة اللھجات لقد كانت اللغة أساسا كامال منطوقا
إلي أن برزت تكنولوجيا الكتابة ومرت الكتابة بمراحل عديدة بدأت من
النحت علي الحجارة ثم مرورا بالقلم والرق إلي أن حلت ثورة الطباعة
ويعلم كلنا ما كان للطباعة من أثر في تطور الفكر اإلنساني عامة
ومصير بعض اللغات البشرية إذ أصبحت اللغات المطبوعة لغات فكر
وتواصل علي نطاق واسع دون سواھا وتواصلت ھيمنة حضارة
الطباعة إلي حد منتصف القرن عندما بدأت تظھر تحوالت عميقة
نتيجة تطور المعلوماتية التي فرضت استعمال الحاسوب في جميع
المجاالت مما أدي إلي بروز ما نسميه بحضارة الشاشة وقد يكون أثر
حضارة الشاشة في اللغات البشرية أھم بكثير من أثر الطباعة.
٣
مقدمة
ومما الشك فيه أن أھم عامل اقتصادي في عصرنا ھذا ھو
الحصول علي المعلومات إذ ال يمكن ألي بلد أن يتخلص من
عليل عل الحصول مواطنوهه من ال
ة إذا حرم اطن
االقتصادية
التبعية االقت اد
الت ة
المعلومات كما أننا نعلم أنه يمكن خزن جل المعلومات
واإلنجليزية
ز كالعربية و إل
رب طبيعيةي لغات ب
وتوزيعھا في
ومعالجتھا و وز ھ
ھ و
وبواسطة الحاسوب غير أأن استعمال الحاسوب مقتصر
عادة علي من لھم معرفة بلغاته الصورية فإذا علمنا
فيھا سواء كانالطبيعة فإن التعامل معه ف ھا
الحاسوب لغتنا الط عة
ذلك كتابيا أم شفويا سيمكن عامة الناس من الوصول إلي
ھذه المعلومات وإذ لم نطوع لغتنا لمثل ھذه االستعماالت
اآللة من
فإننا سنستعمل للضرورة لغة غيرنا ممن مكن آل
فھم لغته واستعمالھا فنكون قد أضفنا إلي التبعية
االقتصادية والعملية خطرا أخرا ھو تھميش لغتنا وھويتنا
٤الثقافية
اللغوية
االصناعات ا وي
• أمام ھذه المتغيرات الجديدة ومواجھة للتحديات التي
نتجت عنھا نشأ حقل معرفي جديد تظافرت فيه جھود
الباحثين في عدد من المجاالت أھمھا ميدانا الحوسبة
واللسانيات وھو حقل يعرف باللسانيات الحاسوبية لقد
جوانب عدةة منھاا ا
ما الحاسوبية ان
ة اللسانيات ال ا
ميدان الل ان ا
ان ل
شمل
ش
ھو نظري ومنھا ما ھو تطبيقي وتطور الجانب العلمي
األھمية
ي ن
لھا من
التطبيقات ھ
بي ن
عديد من
ن ي مسفرا عن
ر
العلمية واالقتصادية ما جعلھا تعرف بالصناعات اللغوية
أو الھندسة اللسانية أو حتى تكنولوجيا اللغات
دان عالجة
معالجة علي ميدانقة عل
الورقة
أركز ففي ھذه الو
وسأحاول أن أ كز
و أحاول
الخطاب الشفوي إلبراز أھم أھدافه ووسائل البحث
فيه .وسأتطرق في أخر البحث إلي مشروع عربي
تأليف الكالم.
يعني توليد الكالم آآليا أأي أ
٥
اف صناعات االكالم
الم أھداف
أھ
أن ما يصبو إليه الباحثون في ھذا الحقل ھو تلقين
الحاسوب لغة بشرية يمكن التحاور معه فيھا
شفويا أي أن الحاسوب يصبح قادر علي فھم
الكالم وقادرا علي توليده أيضا وقد نتساءل
علي الفائدة من مثل ھذه البحوث المعقدة
بالنسبة إلي المجتمعات البشرية .
٦
المبررات الحقيقية للجھود
أأوال ً :قد ذكرنا في المقدمة أأن من نتائج الثورة
المعلوماتية تسرب الحواسيب في حياتنا اليومية
طبع
وآالت ط
مفاتيح آال
ولوحات ا
شاشات ل ا
ترافقھاا ا ا ا
انتشرت كلھا في المصالح اإلدارية والبنوك
أكثر من
عمل أكث
ل ويتمثل
البيوت ت ثل
وحتى ففي ال توالمدارس ت
ال دا
ثلثي اليد العاملة النشيطة باالتحاد األوربي )أي
١٠٠مليون نسمة ( في معالجة الحروف واألرقام
واألشكال لكننا نعلم أن استعمال ھذه األجھزة
م أنه ييحتكرر نظرر المستعمل
ل تدريبا خاصا ثم
ب ريبييتطلب
ويديه خاصة إذا علمنا أنه يوجد العديد من
التطبيقات التي تحتاج فيھا المستعمل إلي تركيز
بصره أأو يديه علي مھام أأخري
٧
للجھود
الحقيقية جھو
المبررات ا ي ي
ا بررا
ثانيا :أن الكالم ھوه الوسيلة الطبيعية في التواصل
البشر فإذا ما فھمته اآللة
يحسن استعماله عامة البش
حررنا اليدين والبصر لمھام أخري واستغنينا عن رموز
معقدة وما ينجر عن الكتابة عامة من أغالط مطبعية
الوسيلة ففي التواصل أي
تسمح ھذه الو لة
ح كما ت
ورسمية ك ا
ة و
الخطاب الشفوي باستعمال شبكات الھاتف فنتمكن
من االتصال عن بعد بمراكز المعلومات وبنوك المعطيات
وقد أأبرزت
شفوياا ق
معلومات منھاا شف
علي ل ا ل ل والحصول
ال
دراسات تمت بالواليات المتحدة األمريكية الدور الخاص
الذي يلعبه الدور الشفوي بالمقارنة مع وسائل االتصال
البحوث بينت أأنه إذا ا
ما ھذه ال
نتائج ذ
األخرى إذ أأن أأحد ائ
األ
دعم الصوت وسيلة اتصال أخري فإنه يتم حل
بدون
م و الوقت الذي يتطلبه القيام
ي نصف و المشكلة في
الصوت. مشاركة ال
ا
٨
المبررات الحقيقية للجھود
ثالثا :إذا كان الجانب العلمي التطبيقي يبدو أھم حافز
لتطوير ميدان صناعات الكالم فإن للبعض منا أھدافا أخري
ة
حرية بكل
الكالم كل
فالتخاطب مع اآللة عبر الكال
ة فال اط علمية
ة لنظرية
ظ
يمثل تحديا لفھمنا لعملية إنتاج الكالم وإدراكه عند البشر
إذ أن تمثيل المعرفة اللغوية علي مستوي اآللة يفترض
وخفاياه ققد يري
اا البشري السلوك ال
لھذا ال ل ك
دقيقا ل ا
فھما ق ا
مسبقا ف ا
ا
البعض ممن يفضل الحلول "الھندسية" البحتة ويستغني
ھم ما يجري في
ي ي فھم
ضرورة إإلي
اللسانية أنه ال رور
ي المعرفة
ر ن
عن
اآللة من
العقل البشري وتقليده عند إنجاز تطبيقات تمكن آل
أداء سلوك بشري كالكالم ويضربون علي ذلك مثل الطائرة
معھود
جناحيھا كما ھوو ھو
تحرك ج يھ دون أن ر ير و
ع ووتطير
ي تقلع
التي
عند الطيور غير أأن اإلنجازات التي ال يقع االعتماد فيھا
علي جزء ھام من المعرفة اللسانية تبقي محدودة
االستعمال كما سنري الحقا.
٩
للجھود
الحقيقية جھو
المبررات ا ي ي
ا بررا
• رابعا :أن وراء ھذا المشروع الطموح في
صناعات الكالم رھانات صناعية واقتصادية
المختصون سوق
وق و وثقافية ييقدرر م
سياسية و ي
ري ي ي ووأخري
صناعات الكالم بعشرات آالف الماليين من
الدوالرات فمن سيسطر علي ھذه السوق
الجديدة ؟ من ستكون لغته حضارته ممثلة في
مستوي أجھزة المستقبل ؟ فقد نقدر جيدا
المبالغ ال ال ة
الخيالية رأيناا ال الغ
الرھانات إذا ماا أ
ھذه ال ا ا
خطورةة ذ
ط
التي تنفقھا الدول المصنعة كل سنة علي
الميدان.
البحث في ھذا الم دان
برامج ال حث
ب امج
١٠
البحث
ين ا ب
ميادين
ي
• إذا كان الھدف من صناعات الكالم ھو التحاور
مع اآللة شفويا فإن ذلك يفترض أننا سنمكن
اآللة من مھارتين ضروريتين لممارسة ھذا
السلوك وھما القدرة علي إنتاجه أي الجواب
بكالم يشبه الكالم المنطوق ولكن اصطناعيا
والتقدم في واحد من ھذين الحقلين من
المعرفة ال يعني بالضرورة التقدم في األخر إذ
ھما ميدانان مختلفان كما سنري.
١١
علي االكالم
الم رف ياالتعرف
• قبل التطرق إلي أھداف ھذا الحقل المعرفي ومناھج
البحث فيه من المفيد أن نفرق بين مصطلحي فھم
وتعرف فإذا كان العديد من الباحثين يستعمل الفھم
أأحيانا و"التعرف" أأحيانا أأخري للداللة علي نفس
العملية أو المفھوم )كما ھو الشأن حتى في ھذه
الفھم"
بكثير من "ال
أقرب ك
ف ھي أق
التعرفعبارةة ال
فإن ا الورقة( فإ
ال قة
لوصف ما توصلت إلية البحوث إلي حد اآلن فاألنظمة
الموجودة حاليا ال تفھم في الحقيقة الكالم بل تع ف
تعرف
أي كلمة نطقت من بين كلمات أخري أو تعرف ھوية
نطقھا.
ھ من
ن
١٢
ي الكالمم
التعرف علي
• ورغم أن اھتمام الباحثين بالتعرف اآللي علي الكالم ليس
وليد الساعة بل يرجع إلي منتصف القرن الحالي فإن
ف علي الكالم لم تسجل تقدما ملحوظا إال التعرف
تكنولوجياا التع
تكنولوج
في السبعينات حيث بدأت تظھر في السوق بعض
التطبيقات وإن كانت محدودة االستعمال في أغلب
متكلم ا د
واحد أكثر من تكل
تفھم أكث
أنظمة ال تف
أنھا عادة أنظ ة الحاالت أي أن ا
ال االت
تم تعويدھا علي صوته ،كما أنھا محدودة المعجم تقتصر
معرفتھا علي عدد معين من الكلمات ولھا صعوبة في
المتكلم أن
بأن تطالب ال كل
ث طال ل حيثالمتواصل
الطبيعي ال ا الكالم الط
ففھم الكال
يتوقف بين الكلمة واألخرى .والقصور راجع إلي سبب
معرفي رئيسي وھو أننا لم نتمكن من تلقين اآللة عملية
ا
فھمھا الحقيقة للم نفھم بعد فألنناا ففي ال
وفھمه أل الكالم ف
تحليل الكال
لل
حقيقيا عملية أدراك الكالم عند البشر.وأمام ھذا الوضع
المتوخاة
و ل البحث في سبل
كبير ي
ي حد ر مدرستان إإلي برزت ررز
اآللة من التعرف علي الكالم في عملية تمكين آل
١٣
التحليلية
الطريقة ا ي ي
ا ري
علي الكالمم المتواصل انطالقا من
ي التعرف ي ج إلي
• يھدف ھذا المنھج
األصوات الفردية التي تتركب منھا الكلمات فإذا ما
معرفة وتشخيص أل
تواصل النظام إلي معرفة األصوات صوتا صوتا تمكن من تحديد
ويمكن
ن بسيط وي
البداية إن المشكل ب ي
في ب ي
الباحثون ي
ظن ب ون والجمل وولقد ن
الكلمات و ج
حله في وقت وجيز غير أنه ظھر بسرعة أن التعرف علي األصوات
)الصوامت والصوائت أو الحروف والحركات( أمر معقد جدا يمكن
يجاورھا من
ن سمعية مختلفة ما يج ور
ي الواحد خصائص
ص للصوت و
و ن ييكون
ون أن
األصوات وطول الكلمة وسرعة التلفظ وعمر المتكلم أو جنسه أو
حالته النفسية والصحية وغير ذلك من العوامل المؤثرة فالكسرة في
المقطع المفتوح في كلمة "يجد"تختلف سمعيا أي ليس لھا نفس الطيف
عن الكسرة في المقطع المغلق في كلمة "يجد" وھما يختلفان في المدى
الزمني عن الكسرة في كلمة " يجيد" وتختلف كلھا في الخصائص
مفخم.
السمعية عن الكسرة ففي جوار حرف مطبق مفخ
١٤
التحليلية
الطريقة ا ي ي
ا ري
ي للحركات والحروف عكسا وطول الكلمة • كما يتغير المدى الزمني
وسرعة التلفظ وقرب الصوت من بداية الكلمة وقرب الكلمة من بداية
الجملة من عوامل أخري فطول الصوت يتقلص كلما طالت الكلمة
وجد في
ي ن وج
الصوت أن
و ون
ويكون
سرعة التلفظ ويفيھا أوو كلما ذادت ر
يوجد يھ
ي يوج
التي
أخر الكلمة أطول مما ھو علية إذا وجد في أول الكلمة وغير ذلك من
العوامل التي تؤثر في طول الصوت وإذا علمنا أن المدى يلعب دورا
ن خلط إإذا لممج من
بين لنا ما قد يينتج
العربية تبين
ي للغة ربي الصوتي
و ي النظامم
ھاما في
يتمكن نظام تعرف معين من التفريق بين مد أصلي مميز مثل الذي
يفرق بين طول فتحة الكاف في كلمة "كتب" وطولھا في كلمة "كاتب"
وبين تغير في المدى الزمني ناتج عن عوامل ظرفية مثل تلك التي
ذكرتھا كما أن التصاحب النطقي أي تأثير صوت في إنجاز صوت
مجاور عادة ما يغير الخصائص السمعية لھذا الصوت فاألصوات
المطبقة ففي العربية كالصاد أو الطاء
١٥
التحليلية
الطريقة ا ي ي
ا ري
مثال تأثر في إنجاز األصوات المحاورة داخل الكلمة
الواحدة فيصبح من الصعب التفريق بين كلمتي "صوت"
التاء
كلمة "صوت" في ال ال كلداخلالصاد ا
سوط" إإذ تؤثر ال ا
و" ط
فتنطق طاء كما تؤثر طاء "سوط" في السين فتنطق
يميز بين الكلمتين
ين ي أن ي يز
م آلي ي نظام
ي أي
فيتعذر علي
صاد ي ر
انطالقا من خصائصھما السمعية فقط ويتطلب التعرف
علي الكالم بھذه الطريقة التحليلية االستعانة بالتركيب
والصرف والداللة لرفع اللبس من ناحية وألن ھذه
المستويات اللغوية "العليا" قد تؤثر في سلوك النظام
الصوتي تدغم "الم" مثال في الصوت الشمسي الذي
يتبعھا لكن ال يتم ذلك إال إذا كانت "لالم" التعريف
وليست من أصل الكلمة إذا تسقط "الالم" في كلمة
"السماء" و"الشمس" و"السنة" ولكنھا تنطق في كلمة
"ألسن" ألن "الالم" ھنا ھي من أصل الكلمة ول ست
وليست
١٦الم التعريف .
التحليلية
الطريقة ا ي ي
ا ري
• فالقواعد النطقية تتطلب في ھذه الحالة معرفة
تتعدى المستوي الصوتي إلي مستوي تركيب
الكلمة في العربية ومعرفة بدايتھا ونھايتھا
وھناك أمثلة عديدة في العربية وغير العربية
تبين ضرورة الرجوع إلي مستويات الصرف
والتركيب والداللة عند تطبيق القواعد الصوتية.
١٧
التحليلية
الطريقة ا ي ي
ا ري
• وفي الخالصة فإن الجھود الرامية إلي إيجاد أنظمة
تتعرف علي الكالم حسب الطريقة التحليلية الزالت
تواجه العديد من الصعوبات جلھا معرفي فبالرغم من
أن عدد األصوات التي تتركب منھا لغة معينة قد يكون
تقتصر
ف اآللي علي الكالم ال تقتص التعرف
ة التع
عملية
صغيراا فإن عمل
صغ
علي التعرف علي مجموعة من األنماط السمعية
خاصة وأن الطيف السمعي للصوت للواحد غير ثابت
وألسباب أأخري معروفة لألسباب التي ذكرتھا سابقا أل أل
أھمھا التغير في النطق لدي المتكلم الواحد الناتج عن
تغير في حالته الصحية والنفسية أو سرعة التلفظ
والتغير الذي يحصل من متكلم إلي أخر والناتج عن
الجھازز
ھ م
س أوو العمرر أوو حجم
اللھجات أوو الجنس
في ھ• اختالف ي
النطقي وغير ذلك
١٨
الكلية
الطريقة ا ي
ا ري
• تعتبر ھذه الطريقة أكثر نجاحا إذا ما علمنا أن أجھزة
تصميمھا تعتمد علي
ي ي ھ م
التي تم
الكالم ي
م ي
التعرف علي
ر
الطريق التي ال تحاول تحليل الكالم إلي الوحدات
الصوتية الدنيا التي تكون الكلمة بل ترمي إلي التعرف
علي الكلمة دون تجزئتھا لتفادى المشاكل الناتجة عن
التصاحب النطقي وعدم الثبات عند إنجاز األصول كما
ذكرت سابقا ولقد كان ھذا المنھج عند نشأته منھجا
ھندسيا بحتا ال يعتمد المعرفة اللسانية أثناء عملية
التعرف إذ أن لكل كلمة يطالب النظام بمعرفتھا شكال أو
أشكاال سماعية تم تخزينھا فيه مسبقا فإذا ما نطق
طيف الكلمة
يقارن بين ط ف
متكلم تلك الكلمة فإن النظام قا ن
المنطوقة واألطياف المخزونة وأنظمة التعرف علي الكالم
وفق الطريقة الكلية متعددة األھداف والمناھج ولھا
حدود.
١٩
الكلية
الطريقة ا ي
ا ري
• توجد عامة ثالث أنواع من أنظمة التعرف علي
الكالم اعتمادا علي المنھج الكلي:
-١كلمات منفصلة ومتكلم واحد:
في ھذه الحالة يتعرف النظام علي عدد محدود
من الكلمات تنطق مع مرعاة مدة من الصمت
)حوالي ربع ثانية أو أقل( بين الكلمة واألخرى
صوت المتكلم
م ي و م علي
تدريب النظام
كما يجب ر
حتى يتعود علية إذ ال يمكن لھذا النظام
التعرف علي كالم ينطقه أكثر من متكلم واحد
ف للدية
معروف
٢٠
الكلية
الطريقة ا ي
ا ري
-٢كلمات منفصلة وأكثر من متكلم :
أنظمة ف
تعرف عادة ھو تصميم أ ظ
الدافع ا
كان ال اف
• إإذاا كا
يستعملھا عدة متكلمين فإن بلوغ ھذا الھدف
أكثر
علي نطق أكثالنظام عل
فتدريب النظا
باليسير فتد
لليس ال
من متكلم يتطلب خزن عدد من األشكال
السماعية المختلفة لكل كلمة حتى تكون
الكلمات المخزنة عينة تمثل نطق مجموعة
معينة فكلما ز
ازداد عدد الكلمات تعقد لغوية يوي
النظام وارتفعت نسبة األخطاء ولھذه األسباب
فإن األنظمة التي يمكنھا التعرف علي عدد
كبير من المتكلمين تستعمل معجما محدودا
٢١
الطريقة الكلية
-٣كلمات غير منفصلة :
ذكرت يتطلب تنطق منفصلة كما ر
ق علي كلمات
التعرف ي
ر •
مدة من الصمت بين الكلمة واألخرى حتى ال يؤثر
التصاحب النطقي وغير ذلك من القواعد الصوتية في
الكلمة
ل الكل
الموجودة ففي أأول
لألصوات ال
السماعية لأل ا
ا الخصائص ال
ال ا
أو أخرھا كما ھو الشأن عندما نتكلم بطريقة طبيعية
غير أن الكالم مع اإلبقاء علي مدة من الصمت ب ن
بين غ
الكلمة واألخرى ليس بطبيعي وال يتوقع أن تكون ھناك
مثل ھذا القصور
ور تشكو ل
و تعرف
في اقتناء أنظمة ر
رغبة ي
ر ب
ولھذا السبب حاول الباحثون إيجاد طرق للتعرف علي
كلمات تنطق بدون توقف بينھا.
٢٢
الطريقة الكلية
لقد كانت ھذه األنظمة في بدابتھا محدودة جدا لذي
فھي ال تفھم أكثر من متكلم واحد وال تقبل إال
عددا محدودا من الكلمات في جمل بسيطة
التعرف علي
ي ر ن
ي ھذه األنظمة بعيدة عن ووتبقي
الكالم المسترسل الطبيعي إذ تنطق الكلمات
بنفس الطريقة مھما كانت مكانتھا في الجملة
ة ال ا ة
الواحدة الكلمة
نطق الكل
الذي يتغير ففيه ط
الحين الذففي ال
في الكالم الطبيعي متأثرا بعدة عوامل منھا
ووظيفتھا الع ا ل
والعوامل لة ظ فتھا
الجملة
ة ففي الج
الكلمة
كانة الكل
مكانة
التي تؤثر في التنغيم علي مستوي الجملة
وغيرھا.
٢٣
الكلية
الطريقة ا ي
ا ري
ورغم كل الصعوبات التي يواجھھا الباحثون •
فإن عدد أنظمة التعرف علي الكالم التي
كل يوم وإ
وإن كان يتزايد ل
األسواق ي ز ي
و في
تعرض يرض
األنظمة التي تتميز بنسبة أأحسنھا أأداء أأي أل
أخطاء ضئيلة ال يفھم عادة أكثر من متكلم
منفصلة .وتوجد
ل الكلمات
نطق الكل اواحد مع وجوب ط ا
اآلن بعض األنظمة التي تمكن من إمالء
شفوياا ت ت ل
وتستعمل الحاسوب شف علي ال ا
النصوص علالن
خاصة للتقارير المختصة كالتقارير الطبية
والقانونية.
٢٤
الطريقة الكلية
إن الوصول إلي أنظمة تعرف تمتاز بأداء يقبله المستعمل •
يستجوب مواصلة البحث في عدة ميادين .البد من فھم
أدق لإلشارة الصوتية وما تحمله من معلومات لسانية
وأخرى تتصل بحالة المتكلم النفسية والفيزيولوجية كما
يجب أأن نكون قادرين علي التميز بين ما ھو ثابت في
ھذه اإلشارة وما ھو متغير.فاللسانيات عامة والصوتيات
فھمھا من
ا يمكن ف
التي ققد كالميادين ال
أھم ال اتمثل أھ
خاصة ت ثل
خا ة
الوصول إلي خلق أنظمة تعرف قد تقترب من أداء البشر
.كما يجب مواصلة فھم العالقة بين اإلشارة الصوتية
والمستويات اللسانية األخرى كالتركيب والداللة وكيفية
الحاسوب.
و مستوى
و علي
المعرفة اللسانية ير تمثيل ھذه
ل
٢٥
تأليف الكالم
• إذا كان التعرف علي الكالم وخاصة المسترسل
منه ال يزال يجابه مشاكل راجعة أساسا إلي
فھمنا المحدود إلي عمليات إنتاج الكالم وإدراكه
ي كانت تجابه تأليف الكالم
م ل التيفأن المشاكل
ھي في أأغلبھا بصدد الحل .ويمكن اآلن مد
الحاسوب بالمعلومات الضرورية لكي يولد كالما
ميدان
ا فالبحوث ففيالبشر فال
ينطقه ال
ما طيشبه ا
التأليف لم تعد تعني بإمكانية إنتاج أصوات آلية
تحسين ن ع ة
نوعية إلي تحجھا اآلن إل
ھا موجھا
أغلبھا
ح أغل
أصبح
ل أص
بل
الصوت الذي تنتجه اآللة حتى يقترب من
األصوات البشرية الطبيعية.
٢٦
تأليف الكالم
آلياا
مركب آل
كالم كعلى كال
للحصول ل
ل طريقة لل
أكثر من ط قة ھناك أكث
• ھ اك
غير أنني سأركز على تأليف الكالم انطالقا من النص
المكتوب أي تحويل نص مكتوب إلي خطاب شفوي آليا
توليد كل ا
ما يمكن من لالنص ك انطالقا من ال
التأليف ا طالقا
آلن ال أل
آل
أردناه من كالم في لغة معينة بدون استثناء وله
تطبيقات ھامة مثل مساعدة المعاقين )آالت تقرأ
ل
والحصولالنطق ( ال
جھاز ال ط
ا للمكفوفين أأو تعوض
الكتب لل كالك
علي معلومات عبر الھاتف في قواعد البيانات وغير ذلك
المعرفة
ر من
شيئا ني ي المفيدة كما أن لي
ي التطبيقات
بي ن
من
في ھذا الحقل إذ إنجازنا منذ ثالث سنوات في مخبر
تحليل الكالم بالمعھد اإلقليمي للمعلوماتية واالتصاالت
عن بعد نظاما لتأليف الكالم العربي انطالقا من النص
المكتوب .وسوف نقدم وصف مراحل إنجاز ھذا
المشروع و إعطاء القاري فكرة عما يمكن القيام به
لتوليد الكالم آليا من النص المكتوب.
٢٧
ي رموز صوتية
نقل الحروف )الكتابة( إلي
إذا كان الھدف ھو نقل نص مكتوب إلي كالم منطوق •
بطريقة آلية فأول عملية نقوم بھا ھي وضع برنامج
يقابلھا من
إلي ماا قا ل ا
الكتابة( إل
العربية )أي الك ا ة
ة ف ال
األحرف
يترجم األ
رموز صوتية تكون المدخل إلي المؤلف نفسه فالنص
المشكول يحول إلي من الرموز يمثل كل واجد منھا
بالمدى قواعد تعني ال
تطبيق ق ايلي ذلك ط حركة ل
حرفا أأو كة
فا
الزمني للحروف المضعفة والحركات الطويلة وبعض
عن أثرر
مثل تلك الناتجة ن
األخرى ل
ر القواعد النطقية
و
األصوات الشمسية في "ال" التعريف ويتم تطبيق أل
القواعد علي النص حسب ترتيب معين كما يرجع
جم الكلمات الشاذةإلي معجمالمرحلة إ ي
ي ھذه ر م في النظام
أأي الكلمات التي ال يمكن أأن نستنتج نطقھا من
المبادئ العامة التي تمليھا قواعد نطق اللغة العربية
فكلمة ھذا مثال لبد من إدخالھا ضمن ھذا المعجم
وإال نطقت "ھذى"
٢٨
نقل الحروف )الكتابة( إلي رموز صوتية
وبعد ما يتم نقل الكلمة المكتوبة إلي رموز صوتية يفحص
النظام تركيب المقاطع داخل كل كلمة محوال كل الرموز
الصواتم
ثل ال ات
واحد من رمزين :رمز) (Cيمثل
إلي ا د الصوتية إل
ال ت ة
)الحروف( ورمز) (Vيمثل الصوائت )الحركات(فتقسم كل
تكونھا
ي وھ القصيرة التي
ر الطويلة أوو
و ع
ي عدد المقاطع
كلمة إإلي
فنقسم مثال كلمة "كتب" إلي ثالث مقاطع قصيرة كما
يلي ،CV.CV.CVونقسم "كاتب" إلي نفس العدد من
غير أن المقطع األول طويل CVV CV CV
CVV.CV.CV المقاطع غ
ونقسم كلمة "كتبه" إلي أربعة مقاطع CVC.CV.CV.CV
أولھا طويل ويتم ھذا التقطيع في جميع كلمات النص
حتى يعرف النظام المقطع الذي يقع عليه النبر إذ تجدد
مكانة النبر في العربية حسب طول المقطع أو نقله
ومكانته انطالقا من أخر الكلمة
٢٩
نقل الحروف )الكتابة( إلي رموز صوتية
وإذا كان وضع النبر علي المقاطع أمرا يسيرا نسبيا
برمجتھا إ
فإن ن بر ج ھ ثابتة ييمكن
قواعد ب ي وع إإلي
إإذ ھوو ييخضع
قواعد امتداد التفخيم أي انتشار أثر صوت مفخم
ي اللغة
تحديدھا في
ي يصعب
المجاورة ي ب
األصوات ج ورو من
ن
العربية الفصحى ويرجع عدم الثبات أساسا إلي
حسب ررأيي
يي ب ى
ق الفصحى ي نطقالعاميات في
ي أثرر
ولقد اضطررنا إلي تعديل قواعد انتشار التفخيم
أدركيه نستعين
ين اختبارات ر ي
بر إجراء
مرة ببعد إ ر
من رأكثرر ن
أثناءھا بآراء المستمعين في مقبولية النطق
طبيعيا.
يعتبرونه نطقا بي ي
موافقته لما ي بروومدي و
و ي
٣٠
نقل الحروف )الكتابة( إلي رموز صوتية
كما يخضع الربط بين الكلمات في الكالم المتواصل إلي
مجموعة من القواعد إذ أن التقاء الكلمتين قد ينتج عنه
بروز مقطع جديد بينھما يؤدي إلي إعادة ھيكلة المقاطع
وما ينجر عن ذلك من تعديل في جرس الحركات وطولھا.
الكتابة
نقل الك ا
إلي ل الرامي إل
التأليف ال ا
نظام ال أل
الجزء من ظا
وينتھي ھذاا ال
إلي رموز صوتية بمعالجة بعض القواعد الصوتية الدقيقة
تطبيقھا في وضوح الكالم المولد إذ
يؤثر عدم تط قھا
التي ال يؤث
يبقي مفھوما ولكنه يؤثر في أصالته وصبغته الطبيعية
ي كلمة "ووعدت" أبتعد ووالدال"د" في فالباء "ب" في
ي كلمة ب ب
تنطق كل واحدة منھما مھموسة ألن التاء "ت" التي
تليھا مھموسة تفقد كل منھما جھرھا .والقواعد الصوتية
التي يجب تطبيقھا عديدة ومتنوعة .
٣١
نظام التأليف
يعتمد الباحثون في تأليف الكالم انطالقا من النص أحد
منھجين ھما :التأليف اعتمادا على سلسلة من
الوحدات الصوتية الصغيرة كما سنري الحقا ومنھج
الحركات
ر أحزمة
قيمة ز ور يلقواعد تحدد تطور
تبعا و التأليف ب
ي
وخاصة عند االنتقال من صوت إلي أخر والتأليف انطالقا
من القواعد يستغرق إنجاز وقتا طويال إذا البد من القيام
األحزمة بين كل مسار األ
ا طيفية تبين بدقةبتحاليل ط
ال ل
األصوات في لغة معينة وھذا عمل طويل النفس يتطلب
المختصين ففي الصوت ات
الصوتيات اللسانين ال ختص
التعاون بين الل ان
والمھندسين المختصين في معالجة اإلشارة ولقد
تواصلت البحوث مثال أكثر من عشر سنوات في إحدى
٣٢الجامعات األمريكية
نظام التأليف
إلنتاج نظام تأليف للغة اإلنجليزية اعتمادا على •
القواعد قادرا على إنتاج أصوات خمسة
أشخاص )رجلين،امرأتين،وطفل(
أما التأليف اعتمادا على وحدات صوتية •
مخزونة مسبقا فإن إنجازه أسرع بكثير
القواعد وي و
ويتكون و ى
التأليف اعتمادا على
ي ن
من
من منظومتين ھما معجم الوحدات
الصوتية وبرنامج التأليف وسأواصل في
تأليف
وصفي للمنظومتين الرجوع إلي نظام أ
الكالم العربي انطالقا من النص الذي ذكرناه
سابقا.
ا قا
٣٣
أوالً :المعجم
يتكون المعجم من وحدات صوتية تحتوي كل وحدة منھا
أساسا علي الجزء الذي يمثل الفترة االنتقالية بين
صوتين فإذا أأردنا أأن نؤلف كلمة "كتب" مثال استوجب
ذلك استعمال إحدى عشرة )(١١وحدة كاآلتي )كاف
تاء(
فتحة+تا
فتحة()+فت ة
فتحة() +فت ة
الكلمة ()+كاف +فت ة
ل الكل ة
ففي أأول
) +تاء()+تاء+فتحة( ) +فتحة( ) +فتحة+باء( +
)باء+فتحة( )فتحة في أخر الكلمة( وكل ھذه الوحدات
مخزنه في معجم ويمكن استعمالھا في كلمات أخرى
وتخزين وحدات تحتوي على الجزء االنتقالي بين صوتين
أأمر ھام جدا إذا ليست ھناك حدود واضحة بين صوت
وأخر مثال بين الكاف والفتحة التي تتبعھا في كلمة
"ككتب"
٣٤
أوالً :المعجم
وما ينتج من تركيب سلسلة من األصوات يمثل
حرف(
أو ر حركة و
منفردا ) ر
ر صوتا
منھا و
ل وواحدا ھ كل
يكون كالما مزعجا وغير مفھوم ال يمكن في
أنحباسية مثال "التاء"
ب ي أصوات
عزل و الحقيقة ز
ي
والكاف والباء عن الحركات المجاورة وال يمكن
الحركات وي و
ويعود ھذا ر غياب
في ي ب بينھا ي
التمييز بي ھ
ييز
أساسا إلي قيود ميكانيكية تتحكم في تحرك
ل ييتعدى ر
ذكرھا عوامل
ي و ق ووھيأعضاء النطق
أھداف ھذه الورقة.
٣٥
أوالً :المعجم
• تمثل الوحدات الصوتية المخزنة:
لحرفين
ين العربية ر
في ربي التركيبات الممكنة ي
كل ر يب • ل
)(C1.C2مختلفين مثال "كت" في كلمة "يكتب "
"وجع"في "مجعول" وھناك طبعا بعض الصوامت
العربية ل
مثل تلتقي في ال التي ال يمكن للھاا أأن ل ال
"خع" أو"غع“ ...
صامت يتبعهالتي تتكون من ا التركيبات ال
ا كل ال
-ل
صائت)(CVمثال "كاف+فتحه "في كتب مع
التي تتم
ف ال
والحروف
ال ال
ة أأصال
المفخمة
ف ال فخ الحروف
اعتبار ال
ا ا
تفخيمھا نتيجة التصاحب النطقي مع مراعاة
جرس الحركة في المقطعين المفتوح والمغلق
٣٦
أوالً :المعجم
-الحروف في أول الكلمة وفي أخرھا عند الوقوف علي
السكون
-الحركات في أخر الكلمة مع اعتبار ما سبقھا من حروف
)مطبقة ،مستعلية الخ(....
• أأخذت ھذه الوحدات الصوتية من كلمات ال معني لھا ركبت
لھذا الغرض وحاولنا عند تركيبھا اإلبقاء علي نفس المقطع
لة
جملة كلمة ففي
وفي أأخرھاا وضعت كل كل ة ة فالكلمة
ل الكل
ففي أأول
واستعملت نفس الجملة لحمل كل الكلمات وذلك للتحكم
في النبر والتنغيم وطول الجملة وطول الكلمة وأغلب
المتغيرات التي يجب إبطال تأثيرھا في نطق الوحدات
بصوت متكلم
م الجمل ب و
ل ج ل تسجيل كل
جيل وتم
التجريبية و م
الصوتية جريبي
وي
من تونس.
٣٧
أوالً :المعجم
• أخذت الوحدات الصوتية التي لن تمثل أصواتا
من ووسط الكلمة
نھايتھا ن
أو ھ ي ھبداية الكلمة و
يب ي في
ومن مقطع غير منبور فإذا أردنا "تاء+فتحة"
علي المقطع
ع بر ي ع النبر
حيث ييقع
ب" ي ن "ببتب
تأخذھا من
األول وبعد خزن الوحدات الصوتية تتم معالجة
الجزء ب
الثابت ي جزبوضع عالمات عليمنھا بو ع
واجدة ھكل و ج
ل
في كل من الصوتين الذين يكونان الوحدة وعلي
لألصوات جھور
المجھورة و ب
التذبذب
ب فترات
ر
٣٨
برنامج التأليف
• يفحص نظام التأليف النص الذي تم نقله إلي
القواعد ي
عليه تطبيق مختلف و
ووقع بيق صوتية وو ع
رموز و ي
ر وز
ويقسم كل كلمة وفق الوحدات الصوتية
المخزونة في المعجم طبعا البد أن يجد النظام
العثور
يمكن ال
التي ك الوحدات ال
ا المعجم كل الفي ال
عليھا في تركيب نص عربي وإال امتنع عن
ة الض ة
الضرورية الصوتية
دات ال ت
الوحداتفة ال
د معرفةلة وبعد
مواصلة
ا
لتركيب كل كلمة من كلمات النص يقع
استرجاعھا من المعجم واستعمالھا لتوليد كالم
منطوق )(١طبعا ھناك عدة تعديالت يقوم بھا
للقراءة.
جاھزا رالنص ج ز
يكون ص بل أن ي و
التأليف قبل
ي م
نظام
٣٩
برنامج التأليف
• أوال يجب في بعض الحاالت إدخال تعديل علي المدى
الحرف مضاعفا)ييحمل
ل ر الصوت إإذا كان
و طول
أي و
الزمني ي
ز ي
شدة في النص المكتوب(أو إذا كانت الحركة طويلة أو
إذا كان السياق أي األصوات المجاورة ذا أثر في طول
صوت معين فإذا أأردنا أأن نؤلف كلمة "كتب" ونسمع
التاء طويلة البد من الزيادة في طول الجزء الثابت من
فتحة+ت(و )ت +
الوحدتين )ف ة
ت الصوت "ت" الذي يجمع ال
ال
فتحة( .ولقد تم الحصول علي المعلومات الضرورية
لتقدير المدى الزمني لجميع الحروف والحركات العربية
في مختلف السياقات الصوتية اعتمادا علي تحليل
سماعية أنجزت بمخبرنا .
٤٠
برنامج التأليف
• كما يجب تعديل التردد األساسي ) (FOبالنسبة
ع المنبور
ور أخر الكلمة فالمقطع
ومقطع ر
ع ور و
ع المنبور
للمقطع
يكون تردده األساسي أعلي من المقطع الذي ال يقع
عليه النبر ويكون تردد المقطع األخير أقل من تردد
مقطع غير منبور.
ط
• ينتج ھذا النظام كأمثاله في لغات أخرى وخاصة
وغير مزعج
واضحاا غ
مفھوماا ا
كالماا ف
والفرنسية كال
ة اإلنجليزية الف
اإل ل ة
من نقاط الضعف في تأليف الكالم اعتمادا علي
الوحدات الصوتية المسجلة عدم القدرة علي تغير
صوت المتكلم فإذا أردنا صوت امرأة أو طفل وجب
ي ووحدات أخذت من
ن يحتوي علي
و معجم جديد
م تكوين
ون
صوت امرأة أو طفل.
٤١
برنامج التأليف
• ولعل أھم صعوبات تقف أمام إنجاز أنظمة تأليف
)انطالقا من النص( تولد كالما يشبه الكالم
الشفوي المنطوق إنما تتمثل في القدرة علي
توليد تنغيم طبيعي فالنص المكتوب ال يحمل
عالمات تبين التنغيم مع الجملة إال في حاالت
االستفھام أو التعجب وكلنا يعلم أننا إذا ما قرأنا
نصا أو تكلمنا بدون تغيير في التنغيم أي بال بقاء
علي نفس التردد األساسي كان الكالم ممال
وغير طبيعي والتنغيم يتغير وفق عوامل متعددة
أھمھا الداللة وتركيب الجملة.
٤٢
برنامج التأليف
• وأغلب البحوث في تأليف الكالم انطالقا من
النص مركزة اآلن علي التحليل التركيبي آليا
للنص المكتوب وإيجاد العالقة بين التركيب
والداللة من ناحية والتنغيم من ناحية أخرى
وكلنا يعتقد أن السيطرة علي المتغيرات التي
تتحكم في التنغيم وانبر واإليقاع سيفضي إلي
كالم آلي يشبه الكالم الطبيعي .
٤٣
برنامج التأليف
• كما تنكب البحوث أيضا علي استعمال وحدات
صوتية أطول من تلك التي وصفتھا مما
سيمكننا من تحسين جودة الصوت المركب
فالواو والياء مثال ھي أصوات متغيرة ليس لھا
جزء ثابت وتقسيمھا صعب فيحسن مثال أن ال
نقسم "الواو" في كلمة "دون" بل أن تكون
ھناك وحدة صوتية مركبة من
"فتحة+واو+فتحة" أي ما يسمي بالوحدات
المتعددة األصوات وتجربتنا لمثل ھذه الوحدات
كانت مشجعة.
٤٤
برنامج التأليف
• كما يواصل المختصون في الحوسبة بأنواعھا
مجھوداتھم لتمكين ھذه األنظمة سواء كانت
أنظمة تعرف أو تأليف من القيام بمھامھا
بسرعة فائقة أي في زمن طبيعي وبواسطة
أجھزة سھلة النقل والتوزيع ومقابل أثمان
معقولة حتى يتمكن من استعمالھا عامة
الناس.
٤٥
برنامج التأليف
• وفي الختام فإن معالجة الكالم الشفوي في
م الذي
ي س االھتمام ى ببنفس
العربية ال ييحظى
البالد ربيب
يحظى يه ميدان معالجة الكالم المكتوب توجد
بعض المحاوالت الفردية في بعض الجامعات أو
ذاتمشاريع مؤثرة اا لكنھاا لليست
البحوث لك
مركز ال
ك
أھداف بعيدة المدى ثم أنه ال يوجد تعاون بين
ة
العربيةالبالد ال
الحقل ففي ال الد
العاملين ففي ھذا ال قل
ال ا ل
والواقع أنه من الصعب جدا إنجاز مثل ھذه
المشاريع اعتمادا علي إمكانيات فريق واحد أو
مخير واحد وأملنا أن تكون ھناك إرادة سياسية
م لغتنا
حتى نخدمالبحوث ى
مثل ھذه ب ولدعم ل
م
٤٦ونتمكن من الحفاظ علي ھويتنا الثقافية .