You are on page 1of 46

‫بسم ﷲ الرحمن الرحيم‬

‫الحاسبـ ـ ـ ـ اـات‬
‫تتعريب ال ا‬
‫الفرقة ال ابعة‬
‫الرابعة‬ ‫قسم الحاسب اآللي‪ -‬الف قة‬
‫المحاضرة العاش ـ ـ ـ ـ ـ ـ ــرة‬
‫استاذ المقرر‬
‫د‪ /‬أأحمد لالحربي‬

‫‪١‬‬
‫ٓ‬
‫المعالجة اال ليـ ـ ـ ـ ـ ـ ـ ــة للكالم المنط ـ ـ ـ ـ ـ ــوق‬
‫ٔ‬
‫التعرف و ال ال ف‬
‫التاليف‬ ‫ال ف‬

‫‪٢‬‬
‫مقدمة‬
‫تنشا اللغات مثل بقية الكائنات الحية وتتطور وتضمحل متأثرة بحضارة‬
‫متكلميھا ومؤثرة فيھا‪ .‬والعوامل ذات األثر في تطور اللغات عديدة‬
‫ومتنوعة يتعدى البت في كل خفاياھا أھداف ھذه الورقة غير أن‬
‫المتأمل في تطور تاريخ ھذه اللغات ال يخفي علية الدور الفعال الذي‬
‫بعثته التكنولوجيا في ضمان بقاء بعض اللغات وإقصاء لغات أخري أو‬
‫النزول بھا إلي درجة اللھجات لقد كانت اللغة أساسا كامال منطوقا‬
‫إلي أن برزت تكنولوجيا الكتابة ومرت الكتابة بمراحل عديدة بدأت من‬
‫النحت علي الحجارة ثم مرورا بالقلم والرق إلي أن حلت ثورة الطباعة‬
‫ويعلم كلنا ما كان للطباعة من أثر في تطور الفكر اإلنساني عامة‬
‫ومصير بعض اللغات البشرية إذ أصبحت اللغات المطبوعة لغات فكر‬
‫وتواصل علي نطاق واسع دون سواھا وتواصلت ھيمنة حضارة‬
‫الطباعة إلي حد منتصف القرن عندما بدأت تظھر تحوالت عميقة‬
‫نتيجة تطور المعلوماتية التي فرضت استعمال الحاسوب في جميع‬
‫المجاالت مما أدي إلي بروز ما نسميه بحضارة الشاشة وقد يكون أثر‬
‫حضارة الشاشة في اللغات البشرية أھم بكثير من أثر الطباعة‪.‬‬
‫‪٣‬‬
‫مقدمة‬
‫ومما الشك فيه أن أھم عامل اقتصادي في عصرنا ھذا ھو‬
‫الحصول علي المعلومات إذ ال يمكن ألي بلد أن يتخلص من‬
‫علي‬‫ل عل‬ ‫الحصول‬ ‫مواطنوهه من ال‬
‫ة إذا حرم اطن‬
‫االقتصادية‬
‫التبعية االقت اد‬
‫الت ة‬
‫المعلومات كما أننا نعلم أنه يمكن خزن جل المعلومات‬
‫واإلنجليزية‬
‫ز‬ ‫كالعربية و إل‬
‫رب‬ ‫طبيعية‬‫ي لغات ب‬
‫وتوزيعھا في‬
‫ومعالجتھا و وز ھ‬
‫ھ‬ ‫و‬
‫وبواسطة الحاسوب غير أأن استعمال الحاسوب مقتصر‬
‫عادة علي من لھم معرفة بلغاته الصورية فإذا علمنا‬
‫فيھا سواء كان‬‫الطبيعة فإن التعامل معه ف ھا‬
‫الحاسوب لغتنا الط عة‬
‫ذلك كتابيا أم شفويا سيمكن عامة الناس من الوصول إلي‬
‫ھذه المعلومات وإذ لم نطوع لغتنا لمثل ھذه االستعماالت‬
‫اآللة من‬
‫فإننا سنستعمل للضرورة لغة غيرنا ممن مكن آل‬
‫فھم لغته واستعمالھا فنكون قد أضفنا إلي التبعية‬
‫االقتصادية والعملية خطرا أخرا ھو تھميش لغتنا وھويتنا‬
‫‪٤‬الثقافية‬
‫اللغوية‬
‫االصناعات ا وي‬
‫• أمام ھذه المتغيرات الجديدة ومواجھة للتحديات التي‬
‫نتجت عنھا نشأ حقل معرفي جديد تظافرت فيه جھود‬
‫الباحثين في عدد من المجاالت أھمھا ميدانا الحوسبة‬
‫واللسانيات وھو حقل يعرف باللسانيات الحاسوبية لقد‬
‫جوانب عدةة منھاا ا‬
‫ما‬ ‫الحاسوبية ان‬
‫ة‬ ‫اللسانيات ال ا‬
‫ميدان الل ان ا‬
‫ان‬ ‫ل‬
‫شمل‬
‫ش‬
‫ھو نظري ومنھا ما ھو تطبيقي وتطور الجانب العلمي‬
‫األھمية‬
‫ي‬ ‫ن‬
‫لھا من‬
‫التطبيقات ھ‬
‫بي‬ ‫ن‬
‫عديد من‬
‫ن ي‬ ‫مسفرا عن‬
‫ر‬
‫العلمية واالقتصادية ما جعلھا تعرف بالصناعات اللغوية‬
‫أو الھندسة اللسانية أو حتى تكنولوجيا اللغات‬
‫دان عالجة‬
‫معالجة‬ ‫علي ميدان‬‫قة عل‬
‫الورقة‬
‫أركز ففي ھذه الو‬
‫وسأحاول أن أ كز‬
‫و أحاول‬
‫الخطاب الشفوي إلبراز أھم أھدافه ووسائل البحث‬
‫فيه‪ .‬وسأتطرق في أخر البحث إلي مشروع عربي‬
‫تأليف الكالم‪.‬‬
‫يعني توليد الكالم آآليا أأي أ‬
‫‪٥‬‬
‫اف صناعات االكالم‬
‫الم‬ ‫أھداف‬
‫أھ‬
‫أن ما يصبو إليه الباحثون في ھذا الحقل ھو تلقين‬
‫الحاسوب لغة بشرية يمكن التحاور معه فيھا‬
‫شفويا أي أن الحاسوب يصبح قادر علي فھم‬
‫الكالم وقادرا علي توليده أيضا وقد نتساءل‬
‫علي الفائدة من مثل ھذه البحوث المعقدة‬
‫بالنسبة إلي المجتمعات البشرية ‪.‬‬

‫‪٦‬‬
‫المبررات الحقيقية للجھود‬
‫أأوال ً‪ :‬قد ذكرنا في المقدمة أأن من نتائج الثورة‬
‫المعلوماتية تسرب الحواسيب في حياتنا اليومية‬
‫طبع‬
‫وآالت ط‬
‫مفاتيح آال‬
‫ولوحات ا‬
‫شاشات ل ا‬
‫ترافقھاا ا ا‬ ‫ا‬
‫انتشرت كلھا في المصالح اإلدارية والبنوك‬
‫أكثر من‬
‫عمل أكث‬
‫ل‬ ‫ويتمثل‬
‫البيوت ت ثل‬
‫وحتى ففي ال ت‬‫والمدارس ت‬
‫ال دا‬
‫ثلثي اليد العاملة النشيطة باالتحاد األوربي )أي‬
‫‪ ١٠٠‬مليون نسمة ( في معالجة الحروف واألرقام‬
‫واألشكال لكننا نعلم أن استعمال ھذه األجھزة‬
‫م أنه ييحتكرر نظرر المستعمل‬
‫ل‬ ‫تدريبا خاصا ثم‬
‫ب ريب‬‫ييتطلب‬
‫ويديه خاصة إذا علمنا أنه يوجد العديد من‬
‫التطبيقات التي تحتاج فيھا المستعمل إلي تركيز‬
‫بصره أأو يديه علي مھام أأخري‬
‫‪٧‬‬
‫للجھود‬
‫الحقيقية جھو‬
‫المبررات ا ي ي‬
‫ا بررا‬
‫ثانيا‪ :‬أن الكالم ھوه الوسيلة الطبيعية في التواصل‬
‫البشر فإذا ما فھمته اآللة‬
‫يحسن استعماله عامة البش‬
‫حررنا اليدين والبصر لمھام أخري واستغنينا عن رموز‬
‫معقدة وما ينجر عن الكتابة عامة من أغالط مطبعية‬
‫الوسيلة ففي التواصل أي‬
‫تسمح ھذه الو لة‬
‫ح‬ ‫كما ت‬
‫ورسمية ك ا‬
‫ة‬ ‫و‬
‫الخطاب الشفوي باستعمال شبكات الھاتف فنتمكن‬
‫من االتصال عن بعد بمراكز المعلومات وبنوك المعطيات‬
‫وقد أأبرزت‬
‫شفوياا ق‬
‫معلومات منھاا شف‬
‫علي ل ا‬ ‫ل ل‬ ‫والحصول‬
‫ال‬
‫دراسات تمت بالواليات المتحدة األمريكية الدور الخاص‬
‫الذي يلعبه الدور الشفوي بالمقارنة مع وسائل االتصال‬
‫البحوث بينت أأنه إذا ا‬
‫ما‬ ‫ھذه ال‬
‫نتائج ذ‬
‫األخرى إذ أأن أأحد ائ‬
‫األ‬
‫دعم الصوت وسيلة اتصال أخري فإنه يتم حل‬
‫بدون‬
‫م و‬ ‫الوقت الذي يتطلبه القيام‬
‫ي نصف و‬ ‫المشكلة في‬
‫الصوت‪.‬‬ ‫مشاركة ال‬
‫ا‬
‫‪٨‬‬
‫المبررات الحقيقية للجھود‬
‫ثالثا‪ :‬إذا كان الجانب العلمي التطبيقي يبدو أھم حافز‬
‫لتطوير ميدان صناعات الكالم فإن للبعض منا أھدافا أخري‬
‫ة‬
‫حرية‬ ‫بكل‬
‫الكالم كل‬
‫فالتخاطب مع اآللة عبر الكال‬
‫ة فال اط‬ ‫علمية‬
‫ة ل‬‫نظرية‬
‫ظ‬
‫يمثل تحديا لفھمنا لعملية إنتاج الكالم وإدراكه عند البشر‬
‫إذ أن تمثيل المعرفة اللغوية علي مستوي اآللة يفترض‬
‫وخفاياه ققد يري‬
‫اا‬ ‫البشري‬ ‫السلوك ال‬
‫لھذا ال ل ك‬
‫دقيقا ل ا‬
‫فھما ق ا‬
‫مسبقا ف ا‬
‫ا‬
‫البعض ممن يفضل الحلول "الھندسية" البحتة ويستغني‬
‫ھم ما يجري في‬
‫ي‬ ‫ي فھم‬
‫ضرورة إإلي‬
‫اللسانية أنه ال رور‬
‫ي‬ ‫المعرفة‬
‫ر‬ ‫ن‬
‫عن‬
‫اآللة من‬
‫العقل البشري وتقليده عند إنجاز تطبيقات تمكن آل‬
‫أداء سلوك بشري كالكالم ويضربون علي ذلك مثل الطائرة‬
‫معھود‬
‫جناحيھا كما ھوو ھو‬
‫تحرك ج يھ‬ ‫دون أن ر‬ ‫ير و‬
‫ع ووتطير‬
‫ي تقلع‬
‫التي‬
‫عند الطيور غير أأن اإلنجازات التي ال يقع االعتماد فيھا‬
‫علي جزء ھام من المعرفة اللسانية تبقي محدودة‬
‫االستعمال كما سنري الحقا‪.‬‬
‫‪٩‬‬
‫للجھود‬
‫الحقيقية جھو‬
‫المبررات ا ي ي‬
‫ا بررا‬
‫• رابعا‪ :‬أن وراء ھذا المشروع الطموح في‬
‫صناعات الكالم رھانات صناعية واقتصادية‬
‫المختصون سوق‬
‫وق‬ ‫و‬ ‫وثقافية ييقدرر م‬
‫سياسية و ي‬
‫ري ي ي‬ ‫ووأخري‬
‫صناعات الكالم بعشرات آالف الماليين من‬
‫الدوالرات فمن سيسطر علي ھذه السوق‬
‫الجديدة ؟ من ستكون لغته حضارته ممثلة في‬
‫مستوي أجھزة المستقبل ؟ فقد نقدر جيدا‬
‫المبالغ ال ال ة‬
‫الخيالية‬ ‫رأيناا ال الغ‬
‫الرھانات إذا ماا أ‬
‫ھذه ال ا ا‬
‫خطورةة ذ‬
‫ط‬
‫التي تنفقھا الدول المصنعة كل سنة علي‬
‫الميدان‪.‬‬
‫البحث في ھذا الم دان‬
‫برامج ال حث‬
‫ب امج‬
‫‪١٠‬‬
‫البحث‬
‫ين ا ب‬
‫ميادين‬
‫ي‬
‫• إذا كان الھدف من صناعات الكالم ھو التحاور‬
‫مع اآللة شفويا فإن ذلك يفترض أننا سنمكن‬
‫اآللة من مھارتين ضروريتين لممارسة ھذا‬
‫السلوك وھما القدرة علي إنتاجه أي الجواب‬
‫بكالم يشبه الكالم المنطوق ولكن اصطناعيا‬
‫والتقدم في واحد من ھذين الحقلين من‬
‫المعرفة ال يعني بالضرورة التقدم في األخر إذ‬
‫ھما ميدانان مختلفان كما سنري‪.‬‬

‫‪١١‬‬
‫علي االكالم‬
‫الم‬ ‫رف ي‬‫االتعرف‬
‫• قبل التطرق إلي أھداف ھذا الحقل المعرفي ومناھج‬
‫البحث فيه من المفيد أن نفرق بين مصطلحي فھم‬
‫وتعرف فإذا كان العديد من الباحثين يستعمل الفھم‬
‫أأحيانا و"التعرف" أأحيانا أأخري للداللة علي نفس‬
‫العملية أو المفھوم )كما ھو الشأن حتى في ھذه‬
‫الفھم"‬
‫بكثير من "ال‬
‫أقرب ك‬
‫ف ھي أق‬
‫التعرف‬‫عبارةة ال‬
‫فإن ا‬ ‫الورقة( فإ‬
‫ال قة‬
‫لوصف ما توصلت إلية البحوث إلي حد اآلن فاألنظمة‬
‫الموجودة حاليا ال تفھم في الحقيقة الكالم بل تع ف‬
‫تعرف‬
‫أي كلمة نطقت من بين كلمات أخري أو تعرف ھوية‬
‫نطقھا‪.‬‬
‫ھ‬ ‫من‬
‫ن‬
‫‪١٢‬‬
‫ي الكالمم‬
‫التعرف علي‬
‫• ورغم أن اھتمام الباحثين بالتعرف اآللي علي الكالم ليس‬
‫وليد الساعة بل يرجع إلي منتصف القرن الحالي فإن‬
‫ف علي الكالم لم تسجل تقدما ملحوظا إال‬ ‫التعرف‬
‫تكنولوجياا التع‬
‫تكنولوج‬
‫في السبعينات حيث بدأت تظھر في السوق بعض‬
‫التطبيقات وإن كانت محدودة االستعمال في أغلب‬
‫متكلم ا د‬
‫واحد‬ ‫أكثر من تكل‬
‫تفھم أكث‬
‫أنظمة ال تف‬
‫أنھا عادة أنظ ة‬ ‫الحاالت أي أن ا‬
‫ال االت‬
‫تم تعويدھا علي صوته ‪،‬كما أنھا محدودة المعجم تقتصر‬
‫معرفتھا علي عدد معين من الكلمات ولھا صعوبة في‬
‫المتكلم أن‬
‫بأن‬ ‫تطالب ال كل‬
‫ث طال‬ ‫ل حيث‬‫المتواصل‬
‫الطبيعي ال ا‬ ‫الكالم الط‬
‫ففھم الكال‬
‫يتوقف بين الكلمة واألخرى‪ .‬والقصور راجع إلي سبب‬
‫معرفي رئيسي وھو أننا لم نتمكن من تلقين اآللة عملية‬
‫ا‬
‫فھمھا‬ ‫الحقيقة للم نفھم بعد ف‬‫ألنناا ففي ال‬
‫وفھمه أل‬ ‫الكالم ف‬
‫تحليل الكال‬
‫لل‬
‫حقيقيا عملية أدراك الكالم عند البشر‪.‬وأمام ھذا الوضع‬
‫المتوخاة‬
‫و‬ ‫ل البحث‬ ‫في سبل‬
‫كبير ي‬
‫ي حد ر‬ ‫مدرستان إإلي‬ ‫برزت ر‬‫رز‬
‫اآللة من التعرف علي الكالم‬ ‫في عملية تمكين آل‬
‫‪١٣‬‬
‫التحليلية‬
‫الطريقة ا ي ي‬
‫ا ري‬
‫علي الكالمم المتواصل انطالقا من‬
‫ي التعرف ي‬ ‫ج إلي‬
‫• يھدف ھذا المنھج‬
‫األصوات الفردية التي تتركب منھا الكلمات فإذا ما‬
‫معرفة وتشخيص أل‬
‫تواصل النظام إلي معرفة األصوات صوتا صوتا تمكن من تحديد‬
‫ويمكن‬
‫ن‬ ‫بسيط وي‬
‫البداية إن المشكل ب ي‬
‫في ب ي‬
‫الباحثون ي‬
‫ظن ب ون‬ ‫والجمل وولقد ن‬
‫الكلمات و ج‬
‫حله في وقت وجيز غير أنه ظھر بسرعة أن التعرف علي األصوات‬
‫)الصوامت والصوائت أو الحروف والحركات( أمر معقد جدا يمكن‬
‫يجاورھا من‬
‫ن‬ ‫سمعية مختلفة ما يج ور‬
‫ي‬ ‫الواحد خصائص‬
‫ص‬ ‫للصوت و‬
‫و‬ ‫ن ييكون‬
‫ون‬ ‫أن‬
‫األصوات وطول الكلمة وسرعة التلفظ وعمر المتكلم أو جنسه أو‬
‫حالته النفسية والصحية وغير ذلك من العوامل المؤثرة فالكسرة في‬
‫المقطع المفتوح في كلمة "يجد"تختلف سمعيا أي ليس لھا نفس الطيف‬
‫عن الكسرة في المقطع المغلق في كلمة "يجد" وھما يختلفان في المدى‬
‫الزمني عن الكسرة في كلمة " يجيد" وتختلف كلھا في الخصائص‬
‫مفخم‪.‬‬
‫السمعية عن الكسرة ففي جوار حرف مطبق مفخ‬
‫‪١٤‬‬
‫التحليلية‬
‫الطريقة ا ي ي‬
‫ا ري‬
‫ي للحركات والحروف عكسا وطول الكلمة‬ ‫• كما يتغير المدى الزمني‬
‫وسرعة التلفظ وقرب الصوت من بداية الكلمة وقرب الكلمة من بداية‬
‫الجملة من عوامل أخري فطول الصوت يتقلص كلما طالت الكلمة‬
‫وجد في‬
‫ي‬ ‫ن وج‬
‫الصوت أن‬
‫و‬ ‫ون‬
‫ويكون‬
‫سرعة التلفظ وي‬‫فيھا أوو كلما ذادت ر‬
‫يوجد يھ‬
‫ي يوج‬
‫التي‬
‫أخر الكلمة أطول مما ھو علية إذا وجد في أول الكلمة وغير ذلك من‬
‫العوامل التي تؤثر في طول الصوت وإذا علمنا أن المدى يلعب دورا‬
‫ن خلط إإذا لمم‬‫ج من‬
‫بين لنا ما قد يينتج‬
‫العربية تبين‬
‫ي للغة ربي‬ ‫الصوتي‬
‫و‬ ‫ي النظامم‬
‫ھاما في‬
‫يتمكن نظام تعرف معين من التفريق بين مد أصلي مميز مثل الذي‬
‫يفرق بين طول فتحة الكاف في كلمة "كتب" وطولھا في كلمة "كاتب"‬
‫وبين تغير في المدى الزمني ناتج عن عوامل ظرفية مثل تلك التي‬
‫ذكرتھا كما أن التصاحب النطقي أي تأثير صوت في إنجاز صوت‬
‫مجاور عادة ما يغير الخصائص السمعية لھذا الصوت فاألصوات‬
‫المطبقة ففي العربية كالصاد أو الطاء‬
‫‪١٥‬‬
‫التحليلية‬
‫الطريقة ا ي ي‬
‫ا ري‬
‫مثال تأثر في إنجاز األصوات المحاورة داخل الكلمة‬
‫الواحدة فيصبح من الصعب التفريق بين كلمتي "صوت"‬
‫التاء‬
‫كلمة "صوت" في ال ا‬‫ل كل‬‫داخل‬‫الصاد ا‬
‫سوط" إإذ تؤثر ال ا‬
‫و" ط‬
‫فتنطق طاء كما تؤثر طاء "سوط" في السين فتنطق‬
‫يميز بين الكلمتين‬
‫ين‬ ‫ي أن ي يز‬
‫م آلي‬ ‫ي نظام‬
‫ي أي‬
‫فيتعذر علي‬
‫صاد ي ر‬
‫انطالقا من خصائصھما السمعية فقط ويتطلب التعرف‬
‫علي الكالم بھذه الطريقة التحليلية االستعانة بالتركيب‬
‫والصرف والداللة لرفع اللبس من ناحية وألن ھذه‬
‫المستويات اللغوية "العليا" قد تؤثر في سلوك النظام‬
‫الصوتي تدغم "الم" مثال في الصوت الشمسي الذي‬
‫يتبعھا لكن ال يتم ذلك إال إذا كانت "لالم" التعريف‬
‫وليست من أصل الكلمة إذا تسقط "الالم" في كلمة‬
‫"السماء" و"الشمس" و"السنة" ولكنھا تنطق في كلمة‬
‫"ألسن" ألن "الالم" ھنا ھي من أصل الكلمة ول ست‬
‫وليست‬
‫‪١٦‬الم التعريف ‪.‬‬
‫التحليلية‬
‫الطريقة ا ي ي‬
‫ا ري‬
‫• فالقواعد النطقية تتطلب في ھذه الحالة معرفة‬
‫تتعدى المستوي الصوتي إلي مستوي تركيب‬
‫الكلمة في العربية ومعرفة بدايتھا ونھايتھا‬
‫وھناك أمثلة عديدة في العربية وغير العربية‬
‫تبين ضرورة الرجوع إلي مستويات الصرف‬
‫والتركيب والداللة عند تطبيق القواعد الصوتية‪.‬‬

‫‪١٧‬‬
‫التحليلية‬
‫الطريقة ا ي ي‬
‫ا ري‬
‫• وفي الخالصة فإن الجھود الرامية إلي إيجاد أنظمة‬
‫تتعرف علي الكالم حسب الطريقة التحليلية الزالت‬
‫تواجه العديد من الصعوبات جلھا معرفي فبالرغم من‬
‫أن عدد األصوات التي تتركب منھا لغة معينة قد يكون‬
‫تقتصر‬
‫ف اآللي علي الكالم ال تقتص‬ ‫التعرف‬
‫ة التع‬
‫عملية‬
‫صغيراا فإن عمل‬
‫صغ‬
‫علي التعرف علي مجموعة من األنماط السمعية‬
‫خاصة وأن الطيف السمعي للصوت للواحد غير ثابت‬
‫وألسباب أأخري معروفة‬ ‫لألسباب التي ذكرتھا سابقا أل‬ ‫أل‬
‫أھمھا التغير في النطق لدي المتكلم الواحد الناتج عن‬
‫تغير في حالته الصحية والنفسية أو سرعة التلفظ‬
‫والتغير الذي يحصل من متكلم إلي أخر والناتج عن‬
‫الجھازز‬
‫ھ‬ ‫م‬
‫س أوو العمرر أوو حجم‬
‫اللھجات أوو الجنس‬
‫في ھ‬‫• اختالف ي‬
‫النطقي وغير ذلك‬
‫‪١٨‬‬
‫الكلية‬
‫الطريقة ا ي‬
‫ا ري‬
‫• تعتبر ھذه الطريقة أكثر نجاحا إذا ما علمنا أن أجھزة‬
‫تصميمھا تعتمد علي‬
‫ي‬ ‫ي ھ‬ ‫م‬
‫التي تم‬
‫الكالم ي‬
‫م‬ ‫ي‬
‫التعرف علي‬
‫ر‬
‫الطريق التي ال تحاول تحليل الكالم إلي الوحدات‬
‫الصوتية الدنيا التي تكون الكلمة بل ترمي إلي التعرف‬
‫علي الكلمة دون تجزئتھا لتفادى المشاكل الناتجة عن‬
‫التصاحب النطقي وعدم الثبات عند إنجاز األصول كما‬
‫ذكرت سابقا ولقد كان ھذا المنھج عند نشأته منھجا‬
‫ھندسيا بحتا ال يعتمد المعرفة اللسانية أثناء عملية‬
‫التعرف إذ أن لكل كلمة يطالب النظام بمعرفتھا شكال أو‬
‫أشكاال سماعية تم تخزينھا فيه مسبقا فإذا ما نطق‬
‫طيف الكلمة‬
‫يقارن بين ط ف‬
‫متكلم تلك الكلمة فإن النظام قا ن‬
‫المنطوقة واألطياف المخزونة وأنظمة التعرف علي الكالم‬
‫وفق الطريقة الكلية متعددة األھداف والمناھج ولھا‬
‫حدود‪.‬‬
‫‪١٩‬‬
‫الكلية‬
‫الطريقة ا ي‬
‫ا ري‬
‫• توجد عامة ثالث أنواع من أنظمة التعرف علي‬
‫الكالم اعتمادا علي المنھج الكلي‪:‬‬
‫‪ -١‬كلمات منفصلة ومتكلم واحد‪:‬‬
‫في ھذه الحالة يتعرف النظام علي عدد محدود‬
‫من الكلمات تنطق مع مرعاة مدة من الصمت‬
‫)حوالي ربع ثانية أو أقل( بين الكلمة واألخرى‬
‫صوت المتكلم‬
‫م‬ ‫ي و‬ ‫م علي‬
‫تدريب النظام‬
‫كما يجب ر‬
‫حتى يتعود علية إذ ال يمكن لھذا النظام‬
‫التعرف علي كالم ينطقه أكثر من متكلم واحد‬
‫ف للدية‬
‫معروف‬
‫‪٢٠‬‬
‫الكلية‬
‫الطريقة ا ي‬
‫ا ري‬
‫‪ -٢‬كلمات منفصلة وأكثر من متكلم ‪:‬‬
‫أنظمة ف‬
‫تعرف‬ ‫عادة ھو تصميم أ ظ‬
‫الدافع ا‬
‫كان ال اف‬
‫• إإذاا كا‬
‫يستعملھا عدة متكلمين فإن بلوغ ھذا الھدف‬
‫أكثر‬
‫علي نطق أكث‬‫النظام عل‬
‫فتدريب النظا‬
‫باليسير فتد‬
‫لليس ال‬
‫من متكلم يتطلب خزن عدد من األشكال‬
‫السماعية المختلفة لكل كلمة حتى تكون‬
‫الكلمات المخزنة عينة تمثل نطق مجموعة‬
‫معينة فكلما ز‬
‫ازداد عدد الكلمات تعقد‬ ‫لغوية ي‬‫وي‬
‫النظام وارتفعت نسبة األخطاء ولھذه األسباب‬
‫فإن األنظمة التي يمكنھا التعرف علي عدد‬
‫كبير من المتكلمين تستعمل معجما محدودا‬
‫‪٢١‬‬
‫الطريقة الكلية‬
‫‪ -٣‬كلمات غير منفصلة ‪:‬‬
‫ذكرت يتطلب‬ ‫تنطق منفصلة كما ر‬
‫ق‬ ‫علي كلمات‬
‫التعرف ي‬
‫ر‬ ‫•‬
‫مدة من الصمت بين الكلمة واألخرى حتى ال يؤثر‬
‫التصاحب النطقي وغير ذلك من القواعد الصوتية في‬
‫الكلمة‬
‫ل الكل‬
‫الموجودة ففي أأول‬
‫لألصوات ال‬
‫السماعية لأل ا‬
‫ا‬ ‫الخصائص ال‬
‫ال ا‬
‫أو أخرھا كما ھو الشأن عندما نتكلم بطريقة طبيعية‬
‫غير أن الكالم مع اإلبقاء علي مدة من الصمت ب ن‬
‫بين‬ ‫غ‬
‫الكلمة واألخرى ليس بطبيعي وال يتوقع أن تكون ھناك‬
‫مثل ھذا القصور‬
‫ور‬ ‫تشكو ل‬
‫و‬ ‫تعرف‬
‫في اقتناء أنظمة ر‬
‫رغبة ي‬
‫ر ب‬
‫ولھذا السبب حاول الباحثون إيجاد طرق للتعرف علي‬
‫كلمات تنطق بدون توقف بينھا‪.‬‬

‫‪٢٢‬‬
‫الطريقة الكلية‬
‫لقد كانت ھذه األنظمة في بدابتھا محدودة جدا لذي‬
‫فھي ال تفھم أكثر من متكلم واحد وال تقبل إال‬
‫عددا محدودا من الكلمات في جمل بسيطة‬
‫التعرف علي‬
‫ي‬ ‫ر‬ ‫ن‬
‫ي ھذه األنظمة بعيدة عن‬ ‫ووتبقي‬
‫الكالم المسترسل الطبيعي إذ تنطق الكلمات‬
‫بنفس الطريقة مھما كانت مكانتھا في الجملة‬
‫ة ال ا ة‬
‫الواحدة‬ ‫الكلمة‬
‫نطق الكل‬
‫الذي يتغير ففيه ط‬
‫الحين الذ‬‫ففي ال‬
‫في الكالم الطبيعي متأثرا بعدة عوامل منھا‬
‫ووظيفتھا الع ا ل‬
‫والعوامل‬ ‫لة ظ فتھا‬
‫الجملة‬
‫ة ففي الج‬
‫الكلمة‬
‫كانة الكل‬
‫مكانة‬
‫التي تؤثر في التنغيم علي مستوي الجملة‬
‫وغيرھا‪.‬‬
‫‪٢٣‬‬
‫الكلية‬
‫الطريقة ا ي‬
‫ا ري‬
‫ورغم كل الصعوبات التي يواجھھا الباحثون‬ ‫•‬
‫فإن عدد أنظمة التعرف علي الكالم التي‬
‫كل يوم وإ‬
‫وإن كان‬ ‫يتزايد ل‬
‫األسواق ي ز ي‬
‫و‬ ‫في‬
‫تعرض ي‬‫رض‬
‫األنظمة التي تتميز بنسبة‬ ‫أأحسنھا أأداء أأي أل‬
‫أخطاء ضئيلة ال يفھم عادة أكثر من متكلم‬
‫منفصلة ‪.‬وتوجد‬
‫ل‬ ‫الكلمات‬
‫نطق الكل ا‬‫واحد مع وجوب ط‬ ‫ا‬
‫اآلن بعض األنظمة التي تمكن من إمالء‬
‫شفوياا ت ت ل‬
‫وتستعمل‬ ‫الحاسوب شف‬ ‫علي ال ا‬
‫النصوص عل‬‫الن‬
‫خاصة للتقارير المختصة كالتقارير الطبية‬
‫والقانونية‪.‬‬
‫‪٢٤‬‬
‫الطريقة الكلية‬
‫إن الوصول إلي أنظمة تعرف تمتاز بأداء يقبله المستعمل‬ ‫•‬
‫يستجوب مواصلة البحث في عدة ميادين ‪.‬البد من فھم‬
‫أدق لإلشارة الصوتية وما تحمله من معلومات لسانية‬
‫وأخرى تتصل بحالة المتكلم النفسية والفيزيولوجية كما‬
‫يجب أأن نكون قادرين علي التميز بين ما ھو ثابت في‬
‫ھذه اإلشارة وما ھو متغير‪.‬فاللسانيات عامة والصوتيات‬
‫فھمھا من‬
‫ا‬ ‫يمكن ف‬
‫التي ققد ك‬‫الميادين ال‬
‫أھم ال ا‬‫تمثل أھ‬
‫خاصة ت ثل‬
‫خا ة‬
‫الوصول إلي خلق أنظمة تعرف قد تقترب من أداء البشر‬
‫‪ .‬كما يجب مواصلة فھم العالقة بين اإلشارة الصوتية‬
‫والمستويات اللسانية األخرى كالتركيب والداللة وكيفية‬
‫الحاسوب‪.‬‬
‫و‬ ‫مستوى‬
‫و‬ ‫علي‬
‫المعرفة اللسانية ي‬‫ر‬ ‫تمثيل ھذه‬
‫ل‬
‫‪٢٥‬‬
‫تأليف الكالم‬
‫• إذا كان التعرف علي الكالم وخاصة المسترسل‬
‫منه ال يزال يجابه مشاكل راجعة أساسا إلي‬
‫فھمنا المحدود إلي عمليات إنتاج الكالم وإدراكه‬
‫ي كانت تجابه تأليف الكالم‬
‫م‬ ‫ل التي‬‫فأن المشاكل‬
‫ھي في أأغلبھا بصدد الحل ‪ .‬ويمكن اآلن مد‬
‫الحاسوب بالمعلومات الضرورية لكي يولد كالما‬
‫ميدان‬
‫ا‬ ‫فالبحوث ففي‬‫البشر فال‬
‫ينطقه ال‬
‫ما ط‬‫يشبه ا‬
‫التأليف لم تعد تعني بإمكانية إنتاج أصوات آلية‬
‫تحسين ن ع ة‬
‫نوعية‬ ‫إلي تح‬‫جھا اآلن إل‬
‫ھا موجھا‬
‫أغلبھا‬
‫ح أغل‬
‫أصبح‬
‫ل أص‬
‫بل‬
‫الصوت الذي تنتجه اآللة حتى يقترب من‬
‫األصوات البشرية الطبيعية‪.‬‬
‫‪٢٦‬‬
‫تأليف الكالم‬
‫آلياا‬
‫مركب آل‬
‫كالم ك‬‫على كال‬
‫للحصول ل‬
‫ل‬ ‫طريقة لل‬
‫أكثر من ط قة‬ ‫ھناك أكث‬
‫• ھ اك‬
‫غير أنني سأركز على تأليف الكالم انطالقا من النص‬
‫المكتوب أي تحويل نص مكتوب إلي خطاب شفوي آليا‬
‫توليد كل ا‬
‫ما‬ ‫يمكن من ل‬‫النص ك‬ ‫انطالقا من ال‬
‫التأليف ا طالقا‬
‫آلن ال أل‬
‫آل‬
‫أردناه من كالم في لغة معينة بدون استثناء وله‬
‫تطبيقات ھامة مثل مساعدة المعاقين )آالت تقرأ‬
‫ل‬
‫والحصول‬‫النطق ( ال‬
‫جھاز ال ط‬
‫ا‬ ‫للمكفوفين أأو تعوض‬
‫الكتب لل ك‬‫الك‬
‫علي معلومات عبر الھاتف في قواعد البيانات وغير ذلك‬
‫المعرفة‬
‫ر‬ ‫من‬
‫شيئا ن‬‫ي ي‬ ‫المفيدة كما أن لي‬
‫ي‬ ‫التطبيقات‬
‫بي‬ ‫ن‬
‫من‬
‫في ھذا الحقل إذ إنجازنا منذ ثالث سنوات في مخبر‬
‫تحليل الكالم بالمعھد اإلقليمي للمعلوماتية واالتصاالت‬
‫عن بعد نظاما لتأليف الكالم العربي انطالقا من النص‬
‫المكتوب‪ .‬وسوف نقدم وصف مراحل إنجاز ھذا‬
‫المشروع و إعطاء القاري فكرة عما يمكن القيام به‬
‫لتوليد الكالم آليا من النص المكتوب‪.‬‬
‫‪٢٧‬‬
‫ي رموز صوتية‬
‫نقل الحروف )الكتابة( إلي‬
‫إذا كان الھدف ھو نقل نص مكتوب إلي كالم منطوق‬ ‫•‬
‫بطريقة آلية فأول عملية نقوم بھا ھي وضع برنامج‬
‫يقابلھا من‬
‫إلي ماا قا ل ا‬
‫الكتابة( إل‬
‫العربية )أي الك ا ة‬
‫ة‬ ‫ف ال‬
‫األحرف‬
‫يترجم األ‬
‫رموز صوتية تكون المدخل إلي المؤلف نفسه فالنص‬
‫المشكول يحول إلي من الرموز يمثل كل واجد منھا‬
‫بالمدى‬ ‫قواعد تعني ال‬
‫تطبيق ق ا‬‫يلي ذلك ط‬ ‫حركة ل‬
‫حرفا أأو كة‬
‫فا‬
‫الزمني للحروف المضعفة والحركات الطويلة وبعض‬
‫عن أثرر‬
‫مثل تلك الناتجة ن‬
‫األخرى ل‬
‫ر‬ ‫القواعد النطقية‬
‫و‬
‫األصوات الشمسية في "ال" التعريف ويتم تطبيق‬ ‫أل‬
‫القواعد علي النص حسب ترتيب معين كما يرجع‬
‫جم الكلمات الشاذة‬‫إلي معجم‬‫المرحلة إ ي‬
‫ي ھذه ر‬ ‫م في‬ ‫النظام‬
‫أأي الكلمات التي ال يمكن أأن نستنتج نطقھا من‬
‫المبادئ العامة التي تمليھا قواعد نطق اللغة العربية‬
‫فكلمة ھذا مثال لبد من إدخالھا ضمن ھذا المعجم‬
‫وإال نطقت "ھذى"‬
‫‪٢٨‬‬
‫نقل الحروف )الكتابة( إلي رموز صوتية‬
‫وبعد ما يتم نقل الكلمة المكتوبة إلي رموز صوتية يفحص‬
‫النظام تركيب المقاطع داخل كل كلمة محوال كل الرموز‬
‫الصواتم‬
‫ثل ال ات‬
‫واحد من رمزين‪ :‬رمز)‪ (C‬يمثل‬
‫إلي ا د‬ ‫الصوتية إل‬
‫ال ت ة‬
‫)الحروف( ورمز)‪ (V‬يمثل الصوائت )الحركات(فتقسم كل‬
‫تكونھا‬
‫ي وھ‬ ‫القصيرة التي‬
‫ر‬ ‫الطويلة أوو‬
‫و‬ ‫ع‬
‫ي عدد المقاطع‬
‫كلمة إإلي‬
‫فنقسم مثال كلمة "كتب" إلي ثالث مقاطع قصيرة كما‬
‫يلي ‪،CV.CV.CV‬ونقسم "كاتب" إلي نفس العدد من‬
‫غير أن المقطع األول طويل ‪CVV CV CV‬‬
‫‪CVV.CV.CV‬‬ ‫المقاطع غ‬
‫ونقسم كلمة "كتبه" إلي أربعة مقاطع ‪CVC.CV.CV.CV‬‬
‫أولھا طويل ويتم ھذا التقطيع في جميع كلمات النص‬
‫حتى يعرف النظام المقطع الذي يقع عليه النبر إذ تجدد‬
‫مكانة النبر في العربية حسب طول المقطع أو نقله‬
‫ومكانته انطالقا من أخر الكلمة‬
‫‪٢٩‬‬
‫نقل الحروف )الكتابة( إلي رموز صوتية‬
‫وإذا كان وضع النبر علي المقاطع أمرا يسيرا نسبيا‬
‫برمجتھا إ‬
‫فإن‬ ‫ن بر ج ھ‬ ‫ثابتة ييمكن‬
‫قواعد ب‬ ‫ي و‬‫ع إإلي‬
‫إإذ ھوو ييخضع‬
‫قواعد امتداد التفخيم أي انتشار أثر صوت مفخم‬
‫ي اللغة‬
‫تحديدھا في‬
‫ي‬ ‫يصعب‬
‫المجاورة ي ب‬
‫األصوات ج ور‬‫و‬ ‫من‬
‫ن‬
‫العربية الفصحى ويرجع عدم الثبات أساسا إلي‬
‫حسب ررأيي‬
‫يي‬ ‫ب‬ ‫ى‬
‫ق الفصحى‬ ‫ي نطق‬‫العاميات في‬
‫ي‬ ‫أثرر‬
‫ولقد اضطررنا إلي تعديل قواعد انتشار التفخيم‬
‫أدركيه نستعين‬
‫ين‬ ‫اختبارات ر ي‬
‫بر‬ ‫إجراء‬
‫مرة ببعد إ ر‬
‫من ر‬‫أكثرر ن‬
‫أثناءھا بآراء المستمعين في مقبولية النطق‬
‫طبيعيا‪.‬‬
‫يعتبرونه نطقا بي ي‬
‫موافقته لما ي برو‬‫ومدي و‬
‫و ي‬
‫‪٣٠‬‬
‫نقل الحروف )الكتابة( إلي رموز صوتية‬
‫كما يخضع الربط بين الكلمات في الكالم المتواصل إلي‬
‫مجموعة من القواعد إذ أن التقاء الكلمتين قد ينتج عنه‬
‫بروز مقطع جديد بينھما يؤدي إلي إعادة ھيكلة المقاطع‬
‫وما ينجر عن ذلك من تعديل في جرس الحركات وطولھا‪.‬‬
‫الكتابة‬
‫نقل الك ا‬
‫إلي ل‬ ‫الرامي إل‬
‫التأليف ال ا‬
‫نظام ال أل‬
‫الجزء من ظا‬
‫وينتھي ھذاا ال‬
‫إلي رموز صوتية بمعالجة بعض القواعد الصوتية الدقيقة‬
‫تطبيقھا في وضوح الكالم المولد إذ‬
‫يؤثر عدم تط قھا‬
‫التي ال يؤث‬
‫يبقي مفھوما ولكنه يؤثر في أصالته وصبغته الطبيعية‬
‫ي كلمة "ووعدت"‬ ‫أبتعد ووالدال"د" في‬ ‫فالباء "ب" في‬
‫ي كلمة ب‬ ‫ب‬
‫تنطق كل واحدة منھما مھموسة ألن التاء "ت" التي‬
‫تليھا مھموسة تفقد كل منھما جھرھا‪ .‬والقواعد الصوتية‬
‫التي يجب تطبيقھا عديدة ومتنوعة ‪.‬‬
‫‪٣١‬‬
‫نظام التأليف‬
‫يعتمد الباحثون في تأليف الكالم انطالقا من النص أحد‬
‫منھجين ھما ‪ :‬التأليف اعتمادا على سلسلة من‬
‫الوحدات الصوتية الصغيرة كما سنري الحقا ومنھج‬
‫الحركات‬
‫ر‬ ‫أحزمة‬
‫قيمة ز‬ ‫ور ي‬‫لقواعد تحدد تطور‬
‫تبعا و‬ ‫التأليف ب‬
‫ي‬
‫وخاصة عند االنتقال من صوت إلي أخر والتأليف انطالقا‬
‫من القواعد يستغرق إنجاز وقتا طويال إذا البد من القيام‬
‫األحزمة بين كل‬ ‫مسار األ‬
‫ا‬ ‫طيفية تبين بدقة‬‫بتحاليل ط‬
‫ال ل‬
‫األصوات في لغة معينة وھذا عمل طويل النفس يتطلب‬
‫المختصين ففي الصوت ات‬
‫الصوتيات‬ ‫اللسانين ال ختص‬
‫التعاون بين الل ان‬
‫والمھندسين المختصين في معالجة اإلشارة ولقد‬
‫تواصلت البحوث مثال أكثر من عشر سنوات في إحدى‬
‫‪ ٣٢‬الجامعات األمريكية‬
‫نظام التأليف‬
‫إلنتاج نظام تأليف للغة اإلنجليزية اعتمادا على‬ ‫•‬
‫القواعد قادرا على إنتاج أصوات خمسة‬
‫أشخاص )رجلين‪،‬امرأتين‪،‬وطفل(‬
‫أما التأليف اعتمادا على وحدات صوتية‬ ‫•‬
‫مخزونة مسبقا فإن إنجازه أسرع بكثير‬
‫القواعد وي و‬
‫ويتكون‬ ‫و‬ ‫ى‬
‫التأليف اعتمادا على‬
‫ي‬ ‫ن‬
‫من‬
‫من منظومتين ھما معجم الوحدات‬
‫الصوتية وبرنامج التأليف وسأواصل في‬
‫تأليف‬
‫وصفي للمنظومتين الرجوع إلي نظام أ‬
‫الكالم العربي انطالقا من النص الذي ذكرناه‬
‫سابقا‪.‬‬
‫ا قا‬
‫‪٣٣‬‬
‫أوالً‪ :‬المعجم‬
‫يتكون المعجم من وحدات صوتية تحتوي كل وحدة منھا‬
‫أساسا علي الجزء الذي يمثل الفترة االنتقالية بين‬
‫صوتين فإذا أأردنا أأن نؤلف كلمة "كتب" مثال استوجب‬
‫ذلك استعمال إحدى عشرة )‪(١١‬وحدة كاآلتي )كاف‬
‫تاء(‬
‫فتحة‪+‬تا‬
‫فتحة(‪)+‬فت ة‬
‫فتحة(‪) +‬فت ة‬
‫الكلمة (‪)+‬كاف ‪ +‬فت ة‬
‫ل الكل ة‬
‫ففي أأول‬
‫‪) +‬تاء(‪)+‬تاء‪+‬فتحة( ‪) +‬فتحة( ‪) +‬فتحة‪+‬باء( ‪+‬‬
‫)باء‪+‬فتحة( )فتحة في أخر الكلمة( وكل ھذه الوحدات‬
‫مخزنه في معجم ويمكن استعمالھا في كلمات أخرى‬
‫وتخزين وحدات تحتوي على الجزء االنتقالي بين صوتين‬
‫أأمر ھام جدا إذا ليست ھناك حدود واضحة بين صوت‬
‫وأخر مثال بين الكاف والفتحة التي تتبعھا في كلمة‬
‫"ككتب"‬
‫‪٣٤‬‬
‫أوالً‪ :‬المعجم‬
‫وما ينتج من تركيب سلسلة من األصوات يمثل‬
‫حرف(‬
‫أو ر‬ ‫حركة و‬
‫منفردا ) ر‬
‫ر‬ ‫صوتا‬
‫منھا و‬
‫ل وواحدا ھ‬ ‫كل‬
‫يكون كالما مزعجا وغير مفھوم ال يمكن في‬
‫أنحباسية مثال "التاء"‬
‫ب ي‬ ‫أصوات‬
‫عزل و‬ ‫الحقيقة ز‬
‫ي‬
‫والكاف والباء عن الحركات المجاورة وال يمكن‬
‫الحركات وي و‬
‫ويعود ھذا‬ ‫ر‬ ‫غياب‬
‫في ي ب‬ ‫بينھا ي‬
‫التمييز بي ھ‬
‫ييز‬
‫أساسا إلي قيود ميكانيكية تتحكم في تحرك‬
‫ل ييتعدى ر‬
‫ذكرھا‬ ‫عوامل‬
‫ي و‬ ‫ق ووھي‬‫أعضاء النطق‬
‫أھداف ھذه الورقة‪.‬‬

‫‪٣٥‬‬
‫أوالً‪ :‬المعجم‬
‫• تمثل الوحدات الصوتية المخزنة‪:‬‬
‫لحرفين‬
‫ين‬ ‫العربية ر‬
‫في ربي‬ ‫التركيبات الممكنة ي‬
‫كل ر يب‬ ‫• ل‬
‫)‪(C1.C2‬مختلفين مثال "كت" في كلمة "يكتب "‬
‫"وجع"في "مجعول" وھناك طبعا بعض الصوامت‬
‫العربية ل‬
‫مثل‬ ‫تلتقي في ال‬ ‫التي ال يمكن للھاا أأن ل‬ ‫ال‬
‫"خع" أو"غع“ ‪...‬‬
‫صامت يتبعه‬‫التي تتكون من ا‬ ‫التركيبات ال‬
‫ا‬ ‫كل ال‬
‫‪ -‬ل‬
‫صائت)‪(CV‬مثال "كاف‪+‬فتحه "في كتب مع‬
‫التي تتم‬
‫ف ال‬
‫والحروف‬
‫ال ال‬
‫ة أأصال‬
‫المفخمة‬
‫ف ال فخ‬ ‫الحروف‬
‫اعتبار ال‬
‫ا ا‬
‫تفخيمھا نتيجة التصاحب النطقي مع مراعاة‬
‫جرس الحركة في المقطعين المفتوح والمغلق‬
‫‪٣٦‬‬
‫أوالً‪ :‬المعجم‬
‫‪ -‬الحروف في أول الكلمة وفي أخرھا عند الوقوف علي‬
‫السكون‬
‫‪ -‬الحركات في أخر الكلمة مع اعتبار ما سبقھا من حروف‬
‫)مطبقة‪ ،‬مستعلية الخ‪(....‬‬
‫• أأخذت ھذه الوحدات الصوتية من كلمات ال معني لھا ركبت‬
‫لھذا الغرض وحاولنا عند تركيبھا اإلبقاء علي نفس المقطع‬
‫لة‬
‫جملة‬ ‫كلمة ففي‬
‫وفي أأخرھاا وضعت كل كل ة‬ ‫ة ف‬‫الكلمة‬
‫ل الكل‬
‫ففي أأول‬
‫واستعملت نفس الجملة لحمل كل الكلمات وذلك للتحكم‬
‫في النبر والتنغيم وطول الجملة وطول الكلمة وأغلب‬
‫المتغيرات التي يجب إبطال تأثيرھا في نطق الوحدات‬
‫بصوت متكلم‬
‫م‬ ‫الجمل ب و‬
‫ل ج ل‬ ‫تسجيل كل‬
‫جيل‬ ‫وتم‬
‫التجريبية و م‬
‫الصوتية جريبي‬
‫وي‬
‫من تونس‪.‬‬
‫‪٣٧‬‬
‫أوالً‪ :‬المعجم‬
‫• أخذت الوحدات الصوتية التي لن تمثل أصواتا‬
‫من ووسط الكلمة‬
‫نھايتھا ن‬
‫أو ھ ي ھ‬‫بداية الكلمة و‬
‫يب ي‬ ‫في‬
‫ومن مقطع غير منبور فإذا أردنا "تاء‪+‬فتحة"‬
‫علي المقطع‬
‫ع‬ ‫بر ي‬ ‫ع النبر‬
‫حيث ييقع‬
‫ب" ي‬ ‫ن "ببتب‬
‫تأخذھا من‬
‫األول وبعد خزن الوحدات الصوتية تتم معالجة‬
‫الجزء ب‬
‫الثابت‬ ‫ي جز‬‫بوضع عالمات علي‬‫منھا بو ع‬
‫واجدة ھ‬‫كل و ج‬
‫ل‬
‫في كل من الصوتين الذين يكونان الوحدة وعلي‬
‫لألصوات جھور‬
‫المجھورة‬ ‫و‬ ‫ب‬
‫التذبذب‬
‫ب‬ ‫فترات‬
‫ر‬

‫‪٣٨‬‬
‫برنامج التأليف‬
‫• يفحص نظام التأليف النص الذي تم نقله إلي‬
‫القواعد ي‬
‫عليه‬ ‫تطبيق مختلف و‬
‫ووقع بيق‬ ‫صوتية وو ع‬
‫رموز و ي‬
‫ر وز‬
‫ويقسم كل كلمة وفق الوحدات الصوتية‬
‫المخزونة في المعجم طبعا البد أن يجد النظام‬
‫العثور‬
‫يمكن ال‬
‫التي ك‬ ‫الوحدات ال‬
‫ا‬ ‫المعجم كل ال‬‫في ال‬
‫عليھا في تركيب نص عربي وإال امتنع عن‬
‫ة الض ة‬
‫الضرورية‬ ‫الصوتية‬
‫دات ال ت‬
‫الوحدات‬‫فة ال‬
‫د معرفة‬‫لة وبعد‬
‫مواصلة‬
‫ا‬
‫لتركيب كل كلمة من كلمات النص يقع‬
‫استرجاعھا من المعجم واستعمالھا لتوليد كالم‬
‫منطوق )‪(١‬طبعا ھناك عدة تعديالت يقوم بھا‬
‫للقراءة‪.‬‬
‫جاھزا ر‬‫النص ج ز‬
‫يكون ص‬ ‫بل أن ي و‬
‫التأليف قبل‬
‫ي‬ ‫م‬
‫نظام‬
‫‪٣٩‬‬
‫برنامج التأليف‬
‫• أوال يجب في بعض الحاالت إدخال تعديل علي المدى‬
‫الحرف مضاعفا)ييحمل‬
‫ل‬ ‫ر‬ ‫الصوت إإذا كان‬
‫و‬ ‫طول‬
‫أي و‬
‫الزمني ي‬
‫ز ي‬
‫شدة في النص المكتوب(أو إذا كانت الحركة طويلة أو‬
‫إذا كان السياق أي األصوات المجاورة ذا أثر في طول‬
‫صوت معين فإذا أأردنا أأن نؤلف كلمة "كتب" ونسمع‬
‫التاء طويلة البد من الزيادة في طول الجزء الثابت من‬
‫فتحة‪+‬ت(و )ت ‪+‬‬
‫الوحدتين )ف ة‬
‫ت‬ ‫الصوت "ت" الذي يجمع ال‬
‫ال‬
‫فتحة(‪ .‬ولقد تم الحصول علي المعلومات الضرورية‬
‫لتقدير المدى الزمني لجميع الحروف والحركات العربية‬
‫في مختلف السياقات الصوتية اعتمادا علي تحليل‬
‫سماعية أنجزت بمخبرنا ‪.‬‬
‫‪٤٠‬‬
‫برنامج التأليف‬
‫• كما يجب تعديل التردد األساسي )‪ (FO‬بالنسبة‬
‫ع المنبور‬
‫ور‬ ‫أخر الكلمة فالمقطع‬
‫ومقطع ر‬
‫ع‬ ‫ور و‬
‫ع المنبور‬
‫للمقطع‬
‫يكون تردده األساسي أعلي من المقطع الذي ال يقع‬
‫عليه النبر ويكون تردد المقطع األخير أقل من تردد‬
‫مقطع غير منبور‪.‬‬
‫ط‬
‫• ينتج ھذا النظام كأمثاله في لغات أخرى وخاصة‬
‫وغير مزعج‬
‫واضحاا غ‬
‫مفھوماا ا‬
‫كالماا ف‬
‫والفرنسية كال‬
‫ة‬ ‫اإلنجليزية الف‬
‫اإل ل ة‬
‫من نقاط الضعف في تأليف الكالم اعتمادا علي‬
‫الوحدات الصوتية المسجلة عدم القدرة علي تغير‬
‫صوت المتكلم فإذا أردنا صوت امرأة أو طفل وجب‬
‫ي ووحدات أخذت من‬
‫ن‬ ‫يحتوي علي‬
‫و‬ ‫معجم جديد‬
‫م‬ ‫تكوين‬
‫ون‬
‫صوت امرأة أو طفل‪.‬‬
‫‪٤١‬‬
‫برنامج التأليف‬
‫• ولعل أھم صعوبات تقف أمام إنجاز أنظمة تأليف‬
‫)انطالقا من النص( تولد كالما يشبه الكالم‬
‫الشفوي المنطوق إنما تتمثل في القدرة علي‬
‫توليد تنغيم طبيعي فالنص المكتوب ال يحمل‬
‫عالمات تبين التنغيم مع الجملة إال في حاالت‬
‫االستفھام أو التعجب وكلنا يعلم أننا إذا ما قرأنا‬
‫نصا أو تكلمنا بدون تغيير في التنغيم أي بال بقاء‬
‫علي نفس التردد األساسي كان الكالم ممال‬
‫وغير طبيعي والتنغيم يتغير وفق عوامل متعددة‬
‫أھمھا الداللة وتركيب الجملة‪.‬‬
‫‪٤٢‬‬
‫برنامج التأليف‬
‫• وأغلب البحوث في تأليف الكالم انطالقا من‬
‫النص مركزة اآلن علي التحليل التركيبي آليا‬
‫للنص المكتوب وإيجاد العالقة بين التركيب‬
‫والداللة من ناحية والتنغيم من ناحية أخرى‬
‫وكلنا يعتقد أن السيطرة علي المتغيرات التي‬
‫تتحكم في التنغيم وانبر واإليقاع سيفضي إلي‬
‫كالم آلي يشبه الكالم الطبيعي ‪.‬‬

‫‪٤٣‬‬
‫برنامج التأليف‬
‫• كما تنكب البحوث أيضا علي استعمال وحدات‬
‫صوتية أطول من تلك التي وصفتھا مما‬
‫سيمكننا من تحسين جودة الصوت المركب‬
‫فالواو والياء مثال ھي أصوات متغيرة ليس لھا‬
‫جزء ثابت وتقسيمھا صعب فيحسن مثال أن ال‬
‫نقسم "الواو" في كلمة "دون" بل أن تكون‬
‫ھناك وحدة صوتية مركبة من‬
‫"فتحة‪+‬واو‪+‬فتحة" أي ما يسمي بالوحدات‬
‫المتعددة األصوات وتجربتنا لمثل ھذه الوحدات‬
‫كانت مشجعة‪.‬‬
‫‪٤٤‬‬
‫برنامج التأليف‬
‫• كما يواصل المختصون في الحوسبة بأنواعھا‬
‫مجھوداتھم لتمكين ھذه األنظمة سواء كانت‬
‫أنظمة تعرف أو تأليف من القيام بمھامھا‬
‫بسرعة فائقة أي في زمن طبيعي وبواسطة‬
‫أجھزة سھلة النقل والتوزيع ومقابل أثمان‬
‫معقولة حتى يتمكن من استعمالھا عامة‬
‫الناس‪.‬‬

‫‪٤٥‬‬
‫برنامج التأليف‬
‫• وفي الختام فإن معالجة الكالم الشفوي في‬
‫م الذي‬
‫ي‬ ‫س االھتمام‬ ‫ى ببنفس‬
‫العربية ال ييحظى‬
‫البالد ربي‬‫ب‬
‫يحظى يه ميدان معالجة الكالم المكتوب توجد‬
‫بعض المحاوالت الفردية في بعض الجامعات أو‬
‫ذات‬‫مشاريع مؤثرة ا‬‫ا‬ ‫لكنھاا لليست‬
‫البحوث لك‬
‫مركز ال‬
‫ك‬
‫أھداف بعيدة المدى ثم أنه ال يوجد تعاون بين‬
‫ة‬
‫العربية‬‫البالد ال‬
‫الحقل ففي ال الد‬
‫العاملين ففي ھذا ال قل‬
‫ال ا ل‬
‫والواقع أنه من الصعب جدا إنجاز مثل ھذه‬
‫المشاريع اعتمادا علي إمكانيات فريق واحد أو‬
‫مخير واحد وأملنا أن تكون ھناك إرادة سياسية‬
‫م لغتنا‬
‫حتى نخدم‬‫البحوث ى‬
‫مثل ھذه ب و‬‫لدعم ل‬
‫م‬
‫‪ ٤٦‬ونتمكن من الحفاظ علي ھويتنا الثقافية ‪.‬‬

You might also like