Professional Documents
Culture Documents
الكلمات الشائعة في اللغة العربية
الكلمات الشائعة في اللغة العربية
فهرس الموضوعات
الصفحة الموضوع
وهي أيضا الكلمات المستبعدة هي التى الكلمات تستبعد قبل المعالجة اللغوية االلية
للبيانات (نصوص).
وهي الكلمات تتكرر في النصوص مثل ( في ،من ،إلى )....ويستحسن تجاهلها
وعدم فهرستها من أجل تحسين البحث ويرجع الفضل لها بيتر لوهن (من الرواد
في استرجاع المعلومات ) .
وتعتبر هذه الطرية مقاربة سلبية في التعامل مع األدوات وحروف المعاني في
الجمل ز ال توجد قائمة كلمات محددة لالستبعاد ،ال تستعمل كل أدوات المعالجة
اللغوية قائمة كلمات شائعة .ويمكن تستعملها كل المحلالت الصرفية .
الكلمات الشائعة معروف أيضا بالكلمات البصرية ،هي الكلمات األكثر تكرارا
واستخداما في اللغة المكتوبة .وعلى الرغم أن اللغة العربية تحتوى على ماليين
الكلمات إال أن خمسين بالمئة من اللغة المكتوبة تتألف من تلك الكلمات البصرية .
يتم تحديد الكلمات البصرية بالنظر الى عدة مناهج مدرسية مستخدمه لتعليم اللغة
ويتم تحديد الكلمات األكثر استخداما وتكرارا في كل منها .
بالنسبة اللغة العربية اخترنا عدة مناهج منها منهج االمارات العربية المتحددة.
ولغتنا العربية من األردن ومنهج البحرين وأرض األصوات ولغتي فرحي وأحب
العربية .
من امالخط أن الثير من هذه الكلمات غير حسية مثل ( هذا ،والذي ،ولن ،وهكذا )
ومن الصعب تصوير تلك الكلمات أو حتى تعريفها .فاذا لألطفال أن يتعلموا
القراءة في الوقت قصيرا فإن عليهم أن يتفنوا ويحفظوا تلك الكلمات البصرية واال
سيضطرون الى قراءتهم حرفا حرفا .وذلك يتطلب وقتا طويال كما أن التهجئة
تعيق وتحد من فهمهم ال يقرأون .إن معرفة الكلمات كثيرة االستخدام بصريا
يحتاج إلى تشغيل الذاكرة وإلى التكرار .
األمثلة :كان-أنا-هذا-يا-ماما-بابا-في-من-مع-كل-بيت-باب-قال-ما-أن-رسم-أسود-
أكل-عند-نعم-تحت-الى-عندي-نحن-هناك-أريد-ركض-ركب-ذلك-هو-جاء-يحب-
ماذا-ال-هي-هم-أسد-بطة-جمل-فيل-دب-دار-سرير-قرأ-وقف-ثوب-رأس-فم-عين.
هناك جدال حول تقارب وتباين معالجة اللغة الطبيعية عن مجال اللغويات
الحاسوبية .وقد قامت جمعية اللسانيات الحاسوبية بتعريف اللغويات الحاسوبية
الطبيعية .وترتكز على أنها تركز على الجوانب النظرية لمعالجة اللغة
الخوارزميات الحديثة لمعالجة اللغة الطبيعية في تعلم اآللة وبخاصة تعلم اآللة
األبحاث الحديثة في خوارزميات تعلم اآللة األحصائي تتطلب فهم األحصائي.
عدد من المجاالت المتباينة ،بما في ذلك اللغويات وعلوم الحاسب واإلحصاء .
التي عملت في بيئة محددة من الكلمات ،عملت بشكل فعّال للغاية ،مما قاد الباحثين
إلى التفائل
الشديد الذي تالشى بسرعة عندما تم تطبيق األنظمة في بيئات أكثر واقعية بوجود
التعقيد واإلبهام (عدم الوضوح) في اللغات التي يتداولها البشر .
.
فهم اللغات الطبيعية يشار إليه أحيانا بمشكلة الذكاء االصطناعي الكاملة ،ألن
تمييز وفهم اللغات الطبيعية يحتاج إلى معرفة مكثفة بالعالم الخارجي والقدرة على
التحكم به .تعريف مفهوم "الفهم" هو واحد من المشاكل الرئيسية في معالجة
اللغات الطبيعية .
مثال على بعض المشاكل التي تواجه أنظمة فهم وتحليل اللغات الطبيعية :
جملة "أعطينا القردة الموزة ألنها كانت جائعة" وجملة "أعطينا القردة الموزة
ألنها كانت ناضجة" لهما ذات التكوين القواعدي ،ولكن الضمير "ها" في كلمة
ألنها تعود في األولى على القردة ،وفي الثاني تعود على الموزة :ففهم الجملة
بشكل صحيح غير ممكن دون معرفة خصائص الموز وسلوك القردة .
ارتبطت بداية هذه المرحلة ( حوالي عام 1960م) بفقدان األمل في امكانية لتمثيل
لغة بأكملها داخل الحاسب و قصر الباحثون جهودهم على تراكيب لغوية محددة
نتصل اتصاال باختبارات التحليل الداللي .وكان أول برنامجين بدالن على هذا
التغير برنامجي " شردلو " و "لونار " .وتنمي هذا المرحلة أيضا بقصر هجف
الفهم على الجمل المنفردة دون محاولة ربط هذه الجمل بنص كامل .
وحيث أنه ال يوجد اتفاق عام على ماينبغي على التمثيل الداخلي أن يحتويه أو على
ماهية معنى الجملة ،فإن تقسيم معالجة اللغات الى برنامج فرعية يكون اختياريا ً
تماما ً فيمكن أن تبدأ عملية االستنتاج قبل أنتهاء عملية التحليل ،عالوة على ذلك
فليس بالضرورة أن يحتوي كل كل برنامج على خطوات االستداللية .
هو الجزء الذي يهتم بعالقة الكلمات بعضها مع بعض ،هيكلية الجملة ،وغيرها من
المعلومات النحوية ،ويعتمد على المرحلة الصرفية .
التحليل الداللي :
هو الجزء الذي يهتم بفهم المقصود من الجملة عن طريق الربط المنطقي بين
موضوع الحديث في الجملة ومعلومات من العالم الواقعي .تعتمد هذه المرحلة
على كل من المرحلة الصرفية والنحوية .
في هذا الفصل ،نحن سنناقش عن قوائم المفردات الشائعة .تعد قوائم المفردات
الشائعة من األعمال المرجعية األساسية التي يمكن اإلفادة منها في تقنين وتنظيم
المواد اللغوية التعليمية .وقد ارتبطت منذ نشأتها بتعليم اللغة حيث كانت تهدف في
األساس إلى تسهيل التعليم وتبسيطه .وتنوعت قوائم المفردات الشائعة في العربية
من حيث ثالث نواحي وهي من حيث منهج اإلعداد وعينات الجمع ومصارده
والجمهور الذي تتوجه إليه كل قائمة.
"أوال :من حيث المنهج :اتبعت أكثر من القوائم العربية منهج االحصاء
الموضوعي الذي يقوم على حساب تكرار الكلمات في العينات المختارة والمقارنة
بينها على هذا األساس النتقاء أكثرها شيوعا .ومن القائمة التي لم يشذ عن هذه
القاعدة هي قائمة طعيمة المسماة ب "قائمة المفردات الشائعة االستخدام في البالد
العربية" .اعتمدت في تحديد درجة الشيوع على استجابات خمسين طالبا عربيا
يدرسون في الجامعة المصرية بخصوص عدد من الكلمات المتعلقة ببعض
المواقف.
ثانيا :من حيث عينات الجمع :يمثل االعتماد على النصوص المكتوبة اتجاها
سائدا في قوائم المفردات العربية الشائعة .تختلف درجة تخصص مادة الجمع أو
عموميتها بحسب الهدف الموضوع لكل قائمة .ويظهر من النظر في هذه القوائم
أن غالبيتها اتجه إلى الكتب المدرسية ،وبالتحديد كتب المراحل التعليمية األولى
مثل في قائمة التى أعدها قدري لطفي كجزء من متطلبات شهادة الدكتوراه من
جامعة شيكاغو األمريكية في العام ( )۱٩٤٨بعنوان Changes needed in :
[ ،Egyptian readers to increase their valueالتغييرات الالزمة لرفع
كفاءة كتب القراءة المصرية] .وقد قام الباحث في قائمة طعيمة في العام ()۱٩٨٥
بإحصاء المفردات المستخدمة في كتب المطالعة الستة للروضة وفي الفرقتين
األوليين من المدارس اإلبتدائية المصرية.
وهناك قوائم مفردات أخرى اعتمدت على نصوص مكتوبة(غير دراسية) هادفة
فيما يبدو إلى مساندة إعداد مواد اللغة للناطقين بالعربية أو بغيرها ولكن في
المرحلة المتقدمة .ومن هذا الصنف قائمة بريل التي صدرت ( )۱٩٤۰بعنوان :
[ ،The basic word list of the Arabic Daily Newspaperقاموس
الصحافة العربية] .ومن هذا النوع أيضا قائمة بيلي في العام ( )۱٩٧٩بعنوان A :
[ ،list of Modern Arabic wordsقائمة المفردات الشائعة في العربية
الحديثة] التى جمعها عدد من الصحف اليومية والمجالت األسبوعية .وتهدف
هاتان القائمتان إلى اإلسهام في إعداد الكتب التعليمية من خالل تعريف المؤلفين
بالمفردات األكثر شيوعا وترددا في الجرائد اليومية ليسهل على طالبهم قراءتها
وفهمها.
"وفي هذا العصر المتطور سنجد هائل من البرامج التي تتيح لنا أن نقوم بالقوائم
المفردات الشائعة المصدرة من النصوص المختارة أو الكتب المعينة .مثال ،من
Voyeur Toolsعلى شبكة اإلنترنت ،نستطيع أن نحلل خالل برنامج
النصوص ثم ننتج القائمة الكلمات الشائعة .هذا البرنامج يستخدم منهج اإلحصاء
لحساب تكرار الكلمات.1
أهم الشيء الستخدام هذا البرنامج هو االنترنت ألنه بناء على االنترنت .أوال،
نفتح الموقع بالحاسوب بعنوان http://www.voyant-tools.org :وعندما
يبدو هذه الصورة في شاشة الحاسوب ،نضغط واصل! :
http://dirtdirectory.org/tags/word-frequency : انظر. 2
قائمة المصادر والمراجع ()APA style
الخاتمة
األول ما قبل كل شيء ،نشكر هللا تعالى على نعمة صحة العقل والجسم حتى نقوم
بهذا البحث بسهولة .نقدم الشكر الجزيل إلى أستاذنا ،دكتور فهام الذي يساعدنا
مساعدة ً هائالة ً في إجراءات إتممام البحث .ولو نستطيع أن ننتهى من هذا البحث
في مدة مشترطة ولكن نجد تحديين حينما نحول أن نبدأ بهذا البحث .واألول،
موضوع بحثنا هو الموضوع الذي لما يدرسنا األستاذ في الفصل ،إذن علينا أن
نبحث عن هذا الموضوع في كتب متعددة وفي موقع اإلنترنت ثم نفهمه ونستوعبه
بأنفسنا حتى يمكن علينا أن نشرح لآلخرين ونفهمهم .ثانيهما ،نواجه الصعوبة في
ترجمة الكلمات التى تستخدم في علم المعلومات والتكنولوجيا مثل (،)corpus
و( ،)concordanceو(،)natural language electronic processing
و( )stop wordوما إلى ذلك .ونتمنى أن بحثنا بالموضوع "الكلمات الشائعة في
اللغة العربية" يستفيد الطلبة والمعلمين والباحثين في سهولة الفهم واالستيعاب
حول هذا الباب حتى يطبقوا العلوم من هذا البحث في األعمال نحو إقامة بحث
العلوم وإقامة قوائم الكلمات الشائعة من مجموعة من النصوص المكتوبة وغيرها
تتعلق بهذا البحث.