You are on page 1of 20

‫البحث حول الكلمات الشائعة في اللغة العربية لمادة تطبيقات الحاسوب‬

‫في اللغة العربية وآدبه‬


‫اسم الطالب‪:‬‬
‫فرح هانم بنت محمد عيسى ( ‪) 1526962‬‬
‫سيتي نجيبة بنت عبدهللا (‪) 1518694‬‬
‫وان نور فاتحة بنت وان شعري ( ‪) 1524450‬‬

‫البريد اإللكتروني ‪groupictgempak@gmail.com :‬‬

‫فهرس الموضوعات‬

‫الصفحة‬ ‫الموضوع‬

‫المقدمة المراد الكلمة الشائعة‬ ‫‪-1‬‬

‫الكلمة الشائعة في اللغة العربية‬ ‫‪-2‬‬


‫معالجة اللغات الطبيعية في الكلمات الشائعة‬ ‫‪-3‬‬

‫قوائم الكلمات الشائعة في اللغة العربية‬ ‫‪-4‬‬

‫قائمة المصادر و المراجع‬ ‫‪-5‬‬

‫المقدمة ‪( :‬المراد بالكلمات الشائعة)‬

‫الكلمات الشائعة باالجليزية (‪)High Frequency words‬‬

‫وهي أيضا الكلمات المستبعدة هي التى الكلمات تستبعد قبل المعالجة اللغوية االلية‬
‫للبيانات (نصوص)‪.‬‬

‫وهي الكلمات تتكرر في النصوص مثل ( في‪ ،‬من‪ ،‬إلى ‪ )....‬ويستحسن تجاهلها‬
‫وعدم فهرستها من أجل تحسين البحث ويرجع الفضل لها بيتر لوهن (من الرواد‬
‫في استرجاع المعلومات ) ‪.‬‬
‫وتعتبر هذه الطرية مقاربة سلبية في التعامل مع األدوات وحروف المعاني في‬
‫الجمل ز ال توجد قائمة كلمات محددة لالستبعاد ‪ ،‬ال تستعمل كل أدوات المعالجة‬
‫اللغوية قائمة كلمات شائعة ‪ .‬ويمكن تستعملها كل المحلالت الصرفية ‪.‬‬

‫وأدوات معالجة اللغة الطبيعية للتحليل الصرفي التقليل من استخدام كلمات‬


‫مستبعدة ال سيما عند تحليل الجمل ‪ .‬الكلمات المستبعدة قد سبب مشاكل عند‬
‫استخدام محرك البحث عن العبارات التى تدخل فيها‪.‬‬

‫الكلمات الشائعة في اللغة العربية‬

‫الكلمات الشائعة معروف أيضا بالكلمات البصرية ‪ ،‬هي الكلمات األكثر تكرارا‬
‫واستخداما في اللغة المكتوبة ‪ .‬وعلى الرغم أن اللغة العربية تحتوى على ماليين‬
‫الكلمات إال أن خمسين بالمئة من اللغة المكتوبة تتألف من تلك الكلمات البصرية ‪.‬‬
‫يتم تحديد الكلمات البصرية بالنظر الى عدة مناهج مدرسية مستخدمه لتعليم اللغة‬
‫ويتم تحديد الكلمات األكثر استخداما وتكرارا في كل منها ‪.‬‬

‫بالنسبة اللغة العربية اخترنا عدة مناهج منها منهج االمارات العربية المتحددة‪.‬‬
‫ولغتنا العربية من األردن ومنهج البحرين وأرض األصوات ولغتي فرحي وأحب‬
‫العربية ‪.‬‬

‫من امالخط أن الثير من هذه الكلمات غير حسية مثل ( هذا‪ ،‬والذي‪ ،‬ولن‪ ،‬وهكذا )‬
‫ومن الصعب تصوير تلك الكلمات أو حتى تعريفها ‪ .‬فاذا لألطفال أن يتعلموا‬
‫القراءة في الوقت قصيرا فإن عليهم أن يتفنوا ويحفظوا تلك الكلمات البصرية واال‬
‫سيضطرون الى قراءتهم حرفا حرفا ‪ .‬وذلك يتطلب وقتا طويال كما أن التهجئة‬
‫تعيق وتحد من فهمهم ال يقرأون ‪ .‬إن معرفة الكلمات كثيرة االستخدام بصريا‬
‫يحتاج إلى تشغيل الذاكرة وإلى التكرار ‪.‬‬

‫صف الروضة ‪:‬‬

‫األمثلة ‪ :‬كان‪-‬أنا‪-‬هذا‪-‬يا‪-‬ماما‪-‬بابا‪-‬في‪-‬من‪-‬مع‪-‬كل‪-‬بيت‪-‬باب‪-‬قال‪-‬ما‪-‬أن‪-‬رسم‪-‬أسود‪-‬‬
‫أكل‪-‬عند‪-‬نعم‪-‬تحت‪-‬الى‪-‬عندي‪-‬نحن‪-‬هناك‪-‬أريد‪-‬ركض‪-‬ركب‪-‬ذلك‪-‬هو‪-‬جاء‪-‬يحب‪-‬‬
‫ماذا‪-‬ال‪-‬هي‪-‬هم‪-‬أسد‪-‬بطة‪-‬جمل‪-‬فيل‪-‬دب‪-‬دار‪-‬سرير‪-‬قرأ‪-‬وقف‪-‬ثوب‪-‬رأس‪-‬فم‪-‬عين‪.‬‬

‫صف األول ‪:‬‬


‫األمثلة ‪ :‬كان‪-‬أنا‪-‬هذا‪-‬يا‪-‬ماما‪-‬بابا‪-‬في‪-‬من‪-‬مع‪-‬كل‪-‬بيت‪-‬باب‪-‬قال‪-‬ما‪-‬أن‪-‬رسم‪-‬‬
‫أسود‪-‬أكل‪-‬عند‪-‬نعم‪-‬تحت‪-‬الى‪-‬عندي‪-‬نحن‪-‬هناك‪-‬أريد‪-‬ركض‪-‬ركب‪-‬ذلك‪-‬هو‪-‬جاء‪-‬‬
‫يحب‪-‬ماذا‪-‬ال‪-‬هي‪-‬هم‪-‬أسد‪-‬بطة‪-‬جمل‪-‬فيل‪-‬دب‪-‬دار‪-‬سرير‪-‬قرأ‪-‬وقف‪-‬ثوب‪-‬رأس‪-‬‬
‫فم‪-‬عين‪-‬لهم‪-‬عنده‪-‬أختي‪-‬مثل‪-‬عندها‪-‬غرفة‪-‬كيف‪-‬دخل‪-‬شجرة‪-‬سأل‪-‬له‪-‬أين‪-‬أى‪-‬لها‪-‬‬
‫بعد‪-‬شكرا‪-‬كتاب‪-‬يعيش‪-‬بعض‪-‬شرب‪-‬فتح‪-‬فوق‪-‬بنت‪-‬مدرسة‪-‬أريد‪-‬ذهب‪-‬شمس‪-‬‬
‫أمي‪-‬أبي‪-‬إذا‪-‬هل‪-‬يوم‪-‬أخي‪-‬لك‪-‬لم‪-‬قد‪-‬لعب‪-‬جلس‪-‬اسم‪-‬الذي‪-‬كتب‪-‬سبح‪-‬طبيب‪.‬‬

‫صف الثاني ‪:‬‬


‫األمثلة ‪ :‬كان‪-‬أنا‪-‬هذا‪-‬يا‪-‬ماما‪-‬بابا‪-‬في‪-‬من‪-‬مع‪-‬كل‪-‬بيت‪-‬باب‪-‬قال‪-‬ما‪-‬أن‪-‬رسم‪-‬أسود‪-‬‬
‫أكل‪-‬عند‪-‬نعم‪-‬تحت‪-‬الى‪-‬عندي‪-‬نحن‪-‬هناك‪-‬أريد‪-‬ركض‪-‬ركب‪-‬ذلك‪-‬هو‪-‬جاء‪-‬يحب‪-‬‬
‫ماذا‪-‬ال‪-‬هي‪-‬هم‪-‬أسد‪-‬بطة‪-‬جمل‪-‬فيل‪-‬دب‪-‬دار‪-‬سرير‪-‬قرأ‪-‬وقف‪-‬ثوب‪-‬رأس‪-‬فم‪-‬عين‪-‬‬
‫لهم‪-‬عنده‪-‬أختي‪-‬مثل‪-‬عندها‪-‬غرفة‪-‬كيف‪-‬دخل‪-‬شجرة‪-‬سأل‪-‬له‪-‬أين‪-‬أى‪-‬لها‪-‬بعد‪-‬‬
‫شكرا‪-‬كتاب‪-‬يعيش‪-‬بعض‪-‬شرب‪-‬فتح‪-‬فوق‪-‬بنت‪-‬مدرسة‪-‬أريد‪-‬ذهب‪-‬شمس‪-‬أمي‪-‬‬
‫أبي‪-‬إذا‪-‬هل‪-‬يوم‪-‬أخي‪-‬لك‪-‬لم‪-‬قد‪-‬لعب‪-‬جلس‪-‬اسم‪-‬الذي‪-‬كتب‪-‬سبح‪-‬طبيب‪-‬الحمدهلل‪-‬‬
‫دائما‪-‬هؤالء‪-‬حول‪-‬عادت‪-‬كثير‪-‬ألن‪-‬بكى‪-‬عدة‪-‬قبل‪-‬فرحا‪-‬عمل‪-‬معا‪-‬حديقة‪-‬أهال‪-‬‬
‫يشتري‪-‬أزهار‪-‬نظر‪-‬أول‪-‬معلمة‪-‬أخضر‪-‬حقيبة‪-‬التي‪-‬أو‪-‬تكلم‪-‬أوالد‪-‬قلم‪-‬ماء‪-‬مطر‪-‬‬
‫يغني‪-‬يدخل‪-‬الذين‪-‬رجل‪-‬سرعة‪-‬سنة‪-‬الصباح‪-‬اآلن‪-‬كرة‪-‬غسل‪-‬درس‪-‬عصير‪-‬أخذ‬

‫صف الثالث ‪:‬‬


‫األمثلة ‪ :‬كان‪-‬أنا‪-‬هذا‪-‬يا‪-‬ماما‪-‬بابا‪-‬في‪-‬من‪-‬مع‪-‬كل‪-‬بيت‪-‬باب‪-‬قال‪-‬ما‪-‬أن‪-‬رسم‪-‬أسود‪-‬‬
‫أكل‪-‬عند‪-‬نعم‪-‬تحت‪-‬الى‪-‬عندي‪-‬نحن‪-‬هناك‪-‬أريد‪-‬ركض‪-‬ركب‪-‬ذلك‪-‬هو‪-‬جاء‪-‬يحب‪-‬‬
‫ماذا‪-‬ال‪-‬هي‪-‬هم‪-‬أسد‪-‬بطة‪-‬جمل‪-‬فيل‪-‬دب‪-‬دار‪-‬سرير‪-‬قرأ‪-‬وقف‪-‬ثوب‪-‬رأس‪-‬فم‪-‬عين‪-‬‬
‫لهم‪-‬عنده‪-‬أختي‪-‬مثل‪-‬عندها‪-‬غرفة‪-‬كيف‪-‬دخل‪-‬شجرة‪-‬سأل‪-‬له‪-‬أين‪-‬أى‪-‬لها‪-‬بعد‪-‬‬
‫شكرا‪-‬كتاب‪-‬يعيش‪-‬بعض‪-‬شرب‪-‬فتح‪-‬فوق‪-‬بنت‪-‬مدرسة‪-‬أريد‪-‬ذهب‪-‬شمس‪-‬أمي‪-‬‬
‫أبي‪-‬إذا‪-‬هل‪-‬يوم‪-‬أخي‪-‬لك‪-‬لم‪-‬قد‪-‬لعب‪-‬جلس‪-‬اسم‪-‬الذي‪-‬كتب‪-‬سبح‪-‬طبيب‪-‬الحمدهلل‪-‬‬
‫دائما‪-‬هؤالء‪-‬حول‪-‬عادت‪-‬كثير‪-‬ألن‪-‬بكى‪-‬عدة‪-‬قبل‪-‬فرحا‪-‬عمل‪-‬معا‪-‬حديقة‪-‬أهال‪-‬‬
‫يشتري‪-‬أزهار‪-‬نظر‪-‬أول‪-‬معلمة‪-‬أخضر‪-‬حقيبة‪-‬التي‪-‬أو‪-‬تكلم‪-‬أوالد‪-‬قلم‪-‬ماء‪-‬مطر‪-‬‬
‫يغني‪-‬يدخل‪-‬الذين‪-‬رجل‪-‬سرعة‪-‬سنة‪-‬الصباح‪-‬اآلن‪-‬كرة‪-‬غسل‪-‬درس‪-‬عصير‪-‬أخذ‪-‬‬
‫بعيد‪-‬بضع‪-‬أسرة‪-‬كامل‪-‬امرأة‪-‬لكن‪-‬معي‪-‬مكان‪-‬ألنها‪-‬يكبر‪-‬حيوان‪-‬ألنه‪-‬أخير‪-‬بدأ‪-‬‬
‫سؤال‪-‬حمل‪-‬تستطيع‪-‬ضحك‪-‬أحسن‪-‬بالد‪-‬خفيف‪-‬نظف‪-‬بيوت‪-‬طويل‪-‬لذيذ‪-‬بنفسي‪-‬‬
‫ثمانية‪-‬عطى‪-‬أبدا‪-‬وقع‪-‬صنع‪-‬مكتبة‪-‬بعض‪-‬فقط‪-‬أحتاج‪-‬أيها‪-‬أرض‪-‬يجمع‪-‬يمين‪-‬‬
‫حزين‪-‬سبعة‪-‬يسار‪-‬مسرور‪-‬سالم‪-‬صباح‪-‬مساء‪-‬خيرا‪-‬أنت‪-‬قرآن‪.‬‬

‫صف الرابع ‪:‬‬


‫األمثلة ‪ :‬كان‪-‬أنا‪-‬هذا‪-‬يا‪-‬ماما‪-‬بابا‪-‬في‪-‬من‪-‬مع‪-‬كل‪-‬بيت‪-‬باب‪-‬قال‪-‬ما‪-‬أن‪-‬رسم‪-‬أسود‪-‬‬
‫أكل‪-‬عند‪-‬نعم‪-‬تحت‪-‬الى‪-‬عندي‪-‬نحن‪-‬هناك‪-‬أريد‪-‬ركض‪-‬ركب‪-‬ذلك‪-‬هو‪-‬جاء‪-‬يحب‪-‬‬
‫ماذا‪-‬ال‪-‬هي‪-‬هم‪-‬أسد‪-‬بطة‪-‬جمل‪-‬فيل‪-‬دب‪-‬دار‪-‬سرير‪-‬قرأ‪-‬وقف‪-‬ثوب‪-‬رأس‪-‬فم‪-‬عين‪-‬‬
‫لهم‪-‬عنده‪-‬أختي‪-‬مثل‪-‬عندها‪-‬غرفة‪-‬كيف‪-‬دخل‪-‬شجرة‪-‬سأل‪-‬له‪-‬أين‪-‬أى‪-‬لها‪-‬بعد‪-‬‬
‫شكرا‪-‬كتاب‪-‬يعيش‪-‬بعض‪-‬شرب‪-‬فتح‪-‬فوق‪-‬بنت‪-‬مدرسة‪-‬أريد‪-‬ذهب‪-‬شمس‪-‬أمي‪-‬‬
‫أبي‪-‬إذا‪-‬هل‪-‬يوم‪-‬أخي‪-‬لك‪-‬لم‪-‬قد‪-‬لعب‪-‬جلس‪-‬اسم‪-‬الذي‪-‬كتب‪-‬سبح‪-‬طبيب‪-‬الحمدهلل‪-‬‬
‫دائما‪-‬هؤالء‪-‬حول‪-‬عادت‪-‬كثير‪-‬ألن‪-‬بكى‪-‬عدة‪-‬قبل‪-‬فرحا‪-‬عمل‪-‬معا‪-‬حديقة‪-‬أهال‪-‬‬
‫يشتري‪-‬أزهار‪-‬نظر‪-‬أول‪-‬معلمة‪-‬أخضر‪-‬حقيبة‪-‬التي‪-‬أو‪-‬تكلم‪-‬أوالد‪-‬قلم‪-‬ماء‪-‬مطر‪-‬‬
‫يغني‪-‬يدخل‪-‬الذين‪-‬رجل‪-‬سرعة‪-‬سنة‪-‬الصباح‪-‬اآلن‪-‬كرة‪-‬غسل‪-‬درس‪-‬عصير‪-‬أخذ‪-‬‬
‫بعيد‪-‬بضع‪-‬أسرة‪-‬كامل‪-‬امرأة‪-‬لكن‪-‬معي‪-‬مكان‪-‬ألنها‪-‬يكبر‪-‬حيوان‪-‬ألنه‪-‬أخير‪-‬بدأ‪-‬‬
‫سؤال‪-‬حمل‪-‬تستطيع‪-‬ضحك‪-‬أحسن‪-‬بالد‪-‬خفيف‪-‬نظف‪-‬بيوت‪-‬طويل‪-‬لذيذ‪-‬بنفسي‪-‬‬
‫ثمانية‪-‬عطى‪-‬أبدا‪-‬وقع‪-‬صنع‪-‬مكتبة‪-‬بعض‪-‬فقط‪-‬أحتاج‪-‬أيها‪-‬أرض‪-‬يجمع‪-‬يمين‪-‬‬
‫حزين‪-‬سبعة‪-‬يسار‪-‬مسرور‪-‬سالم‪-‬صباح‪-‬مساء‪-‬خيرا‪-‬أنت‪-‬قرآن‪-‬ستة‪-‬مدينة‪-‬تعال‪-‬‬
‫صغير‪-‬شيء‪-‬عشرة‪-‬فيه‪-‬يحتفظ‪-‬مجروح‪-‬يملك‪-‬عطلة‪-‬أحضر‪-‬انتهى‪-‬سرعة‪-‬حقيبة‪-‬‬
‫مشهور‪-‬تلميذ‪-‬عظة‪-‬مستشفى‪-‬أجد‪-‬انسان‪-‬مهم‪-‬أصبح‪-‬حياة‪-‬مساء‪-‬صديق‪-‬ربما‪-‬‬
‫مرة‪-‬أعطى‪-‬فكر‪-‬يقدر‪-‬ابتعد‪-‬أشرف‪-‬صحيفة‪-‬رجال‪-‬نساء‪-‬مجموعة‪-‬نسيم‪-‬امتالء‪-‬‬
‫هواء‪-‬طائر‪-‬مجالت‪-‬أرسل‪-‬سنين‪-‬وطن‪-‬ملك‪.‬‬
‫صف الخامس ‪:‬‬
‫األمثلة ‪ :‬كان‪-‬أنا‪-‬هذا‪-‬يا‪-‬ماما‪-‬بابا‪-‬في‪-‬من‪-‬مع‪-‬كل‪-‬بيت‪-‬باب‪-‬قال‪-‬ما‪-‬أن‪-‬رسم‪-‬أسود‪-‬‬
‫أكل‪-‬عند‪-‬نعم‪-‬تحت‪-‬الى‪-‬عندي‪-‬نحن‪-‬هناك‪-‬أريد‪-‬ركض‪-‬ركب‪-‬ذلك‪-‬هو‪-‬جاء‪-‬يحب‪-‬‬
‫ماذا‪-‬ال‪-‬هي‪-‬هم‪-‬أسد‪-‬بطة‪-‬جمل‪-‬فيل‪-‬دب‪-‬دار‪-‬سرير‪-‬قرأ‪-‬وقف‪-‬ثوب‪-‬رأس‪-‬فم‪-‬عين‪-‬‬
‫لهم‪-‬عنده‪-‬أختي‪-‬مثل‪-‬عندها‪-‬غرفة‪-‬كيف‪-‬دخل‪-‬شجرة‪-‬سأل‪-‬له‪-‬أين‪-‬أى‪-‬لها‪-‬بعد‪-‬‬
‫شكرا‪-‬كتاب‪-‬يعيش‪-‬بعض‪-‬شرب‪-‬فتح‪-‬فوق‪-‬بنت‪-‬مدرسة‪-‬أريد‪-‬ذهب‪-‬شمس‪-‬أمي‪-‬‬
‫أبي‪-‬إذا‪-‬هل‪-‬يوم‪-‬أخي‪-‬لك‪-‬لم‪-‬قد‪-‬لعب‪-‬جلس‪-‬اسم‪-‬الذي‪-‬كتب‪-‬سبح‪-‬طبيب‪-‬الحمدهلل‪-‬‬
‫دائما‪-‬هؤالء‪-‬حول‪-‬عادت‪-‬كثير‪-‬ألن‪-‬بكى‪-‬عدة‪-‬قبل‪-‬فرحا‪-‬عمل‪-‬معا‪-‬حديقة‪-‬أهال‪-‬‬
‫يشتري‪-‬أزهار‪-‬نظر‪-‬أول‪-‬معلمة‪-‬أخضر‪-‬حقيبة‪-‬التي‪-‬أو‪-‬تكلم‪-‬أوالد‪-‬قلم‪-‬ماء‪-‬مطر‪-‬‬
‫يغني‪-‬يدخل‪-‬الذين‪-‬رجل‪-‬سرعة‪-‬سنة‪-‬الصباح‪-‬اآلن‪-‬كرة‪-‬غسل‪-‬درس‪-‬عصير‪-‬أخذ‪-‬‬
‫بعيد‪-‬بضع‪-‬أسرة‪-‬كامل‪-‬امرأة‪-‬لكن‪-‬معي‪-‬مكان‪-‬ألنها‪-‬يكبر‪-‬حيوان‪-‬ألنه‪-‬أخير‪-‬بدأ‪-‬‬
‫سؤال‪-‬حمل‪-‬تستطيع‪-‬ضحك‪-‬أحسن‪-‬بالد‪-‬خفيف‪-‬نظف‪-‬بيوت‪-‬طويل‪-‬لذيذ‪-‬بنفسي‪-‬‬
‫ثمانية‪-‬عطى‪-‬أبدا‪-‬وقع‪-‬صنع‪-‬مكتبة‪-‬بعض‪-‬فقط‪-‬أحتاج‪-‬أيها‪-‬أرض‪-‬يجمع‪-‬يمين‪-‬‬
‫حزين‪-‬سبعة‪-‬يسار‪-‬مسرور‪-‬سالم‪-‬صباح‪-‬مساء‪-‬خيرا‪-‬أنت‪-‬قرآن‪-‬ستة‪-‬مدينة‪-‬تعال‪-‬‬
‫صغير‪-‬شيء‪-‬عشرة‪-‬فيه‪-‬يحتفظ‪-‬مجروح‪-‬يملك‪-‬عطلة‪-‬أحضر‪-‬انتهى‪-‬سرعة‪-‬حقيبة‪-‬‬
‫مشهور‪-‬تلميذ‪-‬عظة‪-‬مستشفى‪-‬أجد‪-‬انسان‪-‬مهم‪-‬أصبح‪-‬حياة‪-‬مساء‪-‬صديق‪-‬ربما‪-‬‬
‫مرة‪-‬أعطى‪-‬فكر‪-‬يقدر‪-‬ابتعد‪-‬أشرف‪-‬صحيفة‪-‬رجال‪-‬نساء‪-‬مجموعة‪-‬نسيم‪-‬امتالء‪-‬‬
‫هواء‪-‬طائر‪-‬مجالت‪-‬أرسل‪-‬سنين‪-‬وطن‪-‬ملك‪-‬طبيعة‪-‬تراث‪-‬جمال‪-‬علوم‪-‬مؤمن‪-‬‬
‫مجتمع‪-‬بيئة‪-‬صحة‪-‬فائدة‪-‬أخالق‪-‬سبحان‪-‬غداء‪-‬عقل‪-‬موسم‪-‬غصب‪-‬مسلم‪-‬صديق‪-‬‬
‫زرعة‪-‬سعادة‪-‬حديقة‪-‬هدية‪-‬زهرة‪-‬استيقظ‪-‬صياد‪-‬أرض‪-‬وسيم‪-‬نفس‪-‬عصفور‪-‬‬
‫تجربة‪-‬طريق‪-‬جديد‪-‬نار‪-‬رياح‪-‬عاصفة‪-‬يمين‪-‬يسار‪-‬شمال‪-‬جملة‪-‬فقرة‪-‬كلمة‪-‬مقيدة‪-‬‬
‫سؤال‪-‬مناسبة‪-‬حركة‪-‬صورة‪-‬استخرج‪-‬تالي‪-‬احتاج‪.‬‬
‫الخالصة ‪ :‬زيادة استخدام الكلمات الشائعة اللغة العربية لكل الصف ‪ .‬وكل‬
‫الكلمات أكثر استخدام الناس في الكتابة و غيرذلك‪.‬‬

‫يستخدم معالجة اللغات الطبيعية لتحليل الكلمات الشائعة ‪:‬‬


‫معالجة الطبعية هي مجال علوم الحاسوب واللغويات المعنية بالتفاعالت بين‬
‫الحاسوب واللغات الطبيعية ‪ .‬التي بدأت كفرع من الذكاء االصطناعي والتي‬
‫بدورها متفرعة من المعلوماتية ‪.‬‬

‫هناك جدال حول تقارب وتباين معالجة اللغة الطبيعية عن مجال اللغويات‬
‫الحاسوبية‪ .‬وقد قامت جمعية اللسانيات الحاسوبية بتعريف اللغويات الحاسوبية‬
‫الطبيعية‪ .‬وترتكز‬ ‫على أنها تركز على الجوانب النظرية لمعالجة اللغة‬
‫الخوارزميات الحديثة لمعالجة اللغة الطبيعية في تعلم اآللة وبخاصة تعلم اآللة‬
‫األبحاث الحديثة في خوارزميات تعلم اآللة األحصائي تتطلب فهم‬ ‫األحصائي‪.‬‬
‫عدد من المجاالت المتباينة ‪ ،‬بما في ذلك اللغويات وعلوم الحاسب واإلحصاء ‪.‬‬

‫تحليل النصوص الطبيعية‬


‫أولى األنظمة مثل‬ ‫‪SHRDLU ،‬‬

‫التي عملت في بيئة محددة من الكلمات‪ ،‬عملت بشكل فعّال للغاية‪ ،‬مما قاد الباحثين‬
‫إلى التفائل‬

‫الشديد الذي تالشى بسرعة عندما تم تطبيق األنظمة في بيئات أكثر واقعية بوجود‬
‫التعقيد واإلبهام (عدم الوضوح) في اللغات التي يتداولها البشر ‪.‬‬
‫‪.‬‬

‫فهم اللغات الطبيعية يشار إليه أحيانا بمشكلة الذكاء االصطناعي الكاملة‪ ،‬ألن‬
‫تمييز وفهم اللغات الطبيعية يحتاج إلى معرفة مكثفة بالعالم الخارجي والقدرة على‬
‫التحكم به‪ .‬تعريف مفهوم "الفهم" هو واحد من المشاكل الرئيسية في معالجة‬
‫اللغات الطبيعية ‪.‬‬

‫مثال على بعض المشاكل التي تواجه أنظمة فهم وتحليل اللغات الطبيعية ‪:‬‬

‫جملة "أعطينا القردة الموزة ألنها كانت جائعة" وجملة "أعطينا القردة الموزة‬
‫ألنها كانت ناضجة" لهما ذات التكوين القواعدي‪ ،‬ولكن الضمير "ها" في كلمة‬
‫ألنها تعود في األولى على القردة‪ ،‬وفي الثاني تعود على الموزة‪ :‬ففهم الجملة‬
‫بشكل صحيح غير ممكن دون معرفة خصائص الموز وسلوك القردة ‪.‬‬

‫مفهوم الذكاء االصناعي لفهم الجمل المنفصلة ‪:‬‬

‫ارتبطت بداية هذه المرحلة ( حوالي عام ‪1960‬م) بفقدان األمل في امكانية لتمثيل‬
‫لغة بأكملها داخل الحاسب و قصر الباحثون جهودهم على تراكيب لغوية محددة‬
‫نتصل اتصاال باختبارات التحليل الداللي‪ .‬وكان أول برنامجين بدالن على هذا‬
‫التغير برنامجي " شردلو " و "لونار " ‪ .‬وتنمي هذا المرحلة أيضا بقصر هجف‬
‫الفهم على الجمل المنفردة دون محاولة ربط هذه الجمل بنص كامل ‪.‬‬

‫وحيث أنه ال يوجد اتفاق عام على ماينبغي على التمثيل الداخلي أن يحتويه أو على‬
‫ماهية معنى الجملة‪ ،‬فإن تقسيم معالجة اللغات الى برنامج فرعية يكون اختياريا ً‬
‫تماما ً فيمكن أن تبدأ عملية االستنتاج قبل أنتهاء عملية التحليل‪ ،‬عالوة على ذلك‬
‫فليس بالضرورة أن يحتوي كل كل برنامج على خطوات االستداللية ‪.‬‬

‫مستويات تحليل اللغات الطبيعية ‪:‬‬


‫النسبة للنصوص المكتوبة‪ ،‬فإن تحليها يمر في عدّة مراحل تختلف باختالف‬
‫طريقة التحليل وغناء اللغة‪ ،‬فمثال معالجة اللغة العربية تحتاج الي تحليل يشمل كل‬
‫المراحل ‪:‬‬ ‫المستويات‪ .‬ومستويات التحليل األكثر انتشارا تتبع‬

‫التحليل الصرفي ‪:‬‬


‫يقوم بتحليل الكلمة لمعرفة جذرها ووزنها الصرفي وما طرأ عليها من زيادة أو‬
‫نقصان أو إعالل أو إبدال أو إدغام أو قلب‪ ،‬باإلضافة إلى معرفة ما اتصل بها من‬
‫سوابق ونوع تلك السوابق‪ ،‬وما لحقها من ضمائر أو لواحق ومكونات تلك‬
‫الضمائر واللواحق‪ ،‬ومعرفة نوع الكلمة نفسها ؛ اسما أو فعال أو حرفا‪ ،‬إلى غير‬
‫ذلك من التوصيفات الصرفية التي تخص كل قسم من أقسام الكلم العربي ‪.‬‬

‫التحليل النحوي ‪:‬‬

‫هو الجزء الذي يهتم بعالقة الكلمات بعضها مع بعض‪ ،‬هيكلية الجملة‪ ،‬وغيرها من‬
‫المعلومات النحوية‪ ،‬ويعتمد على المرحلة الصرفية ‪.‬‬
‫التحليل الداللي ‪:‬‬
‫هو الجزء الذي يهتم بفهم المقصود من الجملة عن طريق الربط المنطقي بين‬
‫موضوع الحديث في الجملة ومعلومات من العالم الواقعي‪ .‬تعتمد هذه المرحلة‬
‫على كل من المرحلة الصرفية والنحوية ‪.‬‬

‫قوائم المفردات الشائعة‬

‫في هذا الفصل‪ ،‬نحن سنناقش عن قوائم المفردات الشائعة‪ .‬تعد قوائم المفردات‬
‫الشائعة من األعمال المرجعية األساسية التي يمكن اإلفادة منها في تقنين وتنظيم‬
‫المواد اللغوية التعليمية‪ .‬وقد ارتبطت منذ نشأتها بتعليم اللغة حيث كانت تهدف في‬
‫األساس إلى تسهيل التعليم وتبسيطه‪ .‬وتنوعت قوائم المفردات الشائعة في العربية‬
‫من حيث ثالث نواحي وهي من حيث منهج اإلعداد وعينات الجمع ومصارده‬
‫والجمهور الذي تتوجه إليه كل قائمة‪.‬‬

‫"أوال‪ :‬من حيث المنهج ‪ :‬اتبعت أكثر من القوائم العربية منهج االحصاء‬
‫الموضوعي الذي يقوم على حساب تكرار الكلمات في العينات المختارة والمقارنة‬
‫بينها على هذا األساس النتقاء أكثرها شيوعا‪ .‬ومن القائمة التي لم يشذ عن هذه‬
‫القاعدة هي قائمة طعيمة المسماة ب "قائمة المفردات الشائعة االستخدام في البالد‬
‫العربية"‪ .‬اعتمدت في تحديد درجة الشيوع على استجابات خمسين طالبا عربيا‬
‫يدرسون في الجامعة المصرية بخصوص عدد من الكلمات المتعلقة ببعض‬
‫المواقف‪.‬‬

‫ثانيا‪ :‬من حيث عينات الجمع ‪ :‬يمثل االعتماد على النصوص المكتوبة اتجاها‬
‫سائدا في قوائم المفردات العربية الشائعة‪ .‬تختلف درجة تخصص مادة الجمع أو‬
‫عموميتها بحسب الهدف الموضوع لكل قائمة‪ .‬ويظهر من النظر في هذه القوائم‬
‫أن غالبيتها اتجه إلى الكتب المدرسية‪ ،‬وبالتحديد كتب المراحل التعليمية األولى‬
‫مثل في قائمة التى أعدها قدري لطفي كجزء من متطلبات شهادة الدكتوراه من‬
‫جامعة شيكاغو األمريكية في العام ( ‪ )۱٩٤٨‬بعنوان ‪Changes needed in :‬‬
‫‪[ ،Egyptian readers to increase their value‬التغييرات الالزمة لرفع‬
‫كفاءة كتب القراءة المصرية]‪ .‬وقد قام الباحث في قائمة طعيمة في العام (‪)۱٩٨٥‬‬
‫بإحصاء المفردات المستخدمة في كتب المطالعة الستة للروضة وفي الفرقتين‬
‫األوليين من المدارس اإلبتدائية المصرية‪.‬‬

‫وهناك قوائم مفردات أخرى اعتمدت على نصوص مكتوبة(غير دراسية) هادفة‬
‫فيما يبدو إلى مساندة إعداد مواد اللغة للناطقين بالعربية أو بغيرها ولكن في‬
‫المرحلة المتقدمة‪ .‬ومن هذا الصنف قائمة بريل التي صدرت (‪ )۱٩٤۰‬بعنوان ‪:‬‬
‫‪[ ،The basic word list of the Arabic Daily Newspaper‬قاموس‬
‫الصحافة العربية]‪ .‬ومن هذا النوع أيضا قائمة بيلي في العام (‪ )۱٩٧٩‬بعنوان ‪A :‬‬
‫‪[ ،list of Modern Arabic words‬قائمة المفردات الشائعة في العربية‬
‫الحديثة] التى جمعها عدد من الصحف اليومية والمجالت األسبوعية‪ .‬وتهدف‬
‫هاتان القائمتان إلى اإلسهام في إعداد الكتب التعليمية من خالل تعريف المؤلفين‬
‫بالمفردات األكثر شيوعا وترددا في الجرائد اليومية ليسهل على طالبهم قراءتها‬
‫وفهمها‪.‬‬

‫ثالثا ‪ :‬جمهور المسفيدين ‪ :‬تنوعت قوائم المفردات الشائعة المعمولة في اللغة‬


‫العربية من حيث الشريحة المستهدفة من إعدادها‪ .‬فهناك قوائم تشير صراحة إلى‬
‫أنها تهدف إلى تحسين مستوى المواد التعليمية الموجهة لدارسي العربية كلغة أولى‬
‫مثل قائمة بيلي‪ ،‬وفاخر‪ ،‬وعاقل‪ ،‬ولطفي‪ ،‬وخاطر‪ ،‬ورضوان‪ ،‬ويونس‪ ،‬والحسون‪،‬‬
‫وقائمة الرصيد اللغوي‪ .‬بينما اتجهت قوائم أخرى إلى متعلمي اللغة العربية من‬
‫الناطقين بغيرها مثل قائمة النداو‪ ،‬وسارتين‪ ،‬وقائمة معهد الخرطوم الدولي‪،‬‬
‫وقائمة مكاريوس وراموني‪.‬‬

‫"وفي هذا العصر المتطور سنجد هائل من البرامج التي تتيح لنا أن نقوم بالقوائم‬
‫المفردات الشائعة المصدرة من النصوص المختارة أو الكتب المعينة‪ .‬مثال‪ ،‬من‬
‫‪ Voyeur Tools‬على شبكة اإلنترنت‪ ،‬نستطيع أن نحلل‬ ‫خالل برنامج‬
‫النصوص ثم ننتج القائمة الكلمات الشائعة‪ .‬هذا البرنامج يستخدم منهج اإلحصاء‬
‫لحساب تكرار الكلمات‪.1‬‬

‫أهم الشيء الستخدام هذا البرنامج هو االنترنت ألنه بناء على االنترنت‪ .‬أوال‪،‬‬
‫نفتح الموقع بالحاسوب بعنوان ‪ http://www.voyant-tools.org :‬وعندما‬
‫يبدو هذه الصورة في شاشة الحاسوب‪ ،‬نضغط واصل! ‪:‬‬

‫‪ . 1‬انظر ‪ :‬جامعة الملك سعود‪ ،‬قوائم المفردات الشائعة وتعليم اللغة‬


‫فيظهر لنا الموقع‪ ،‬نضغط على تحميل (‪ )upload‬إذا نريد أن نعمل قائمة الكلمات‬
‫الشائعة من الملفات في الكمبيوتر ثم انتظر حولي دقيقتين إلى ثالث دقائق لتحليل‬
‫النصوص‪ ،‬إذا حجم الملف كبير ممكن أكثر من ثالث دقائق‪.‬‬

‫فيبدو لكم تحليالت النصوص في اإلحصاء والقائمة والخالصة كما التالي‪:‬‬


‫المثال األخرى لبرنامج إصدار القوائم المفردات الشائعة هو ‪ .wordsmith‬أوال‪،‬‬
‫يلي‪:‬‬ ‫كما‬ ‫الموقع‬ ‫عنوان‬ ‫نفتح‬ ‫أن‬ ‫علينا‬
‫‪ ،http://www.lexically.net/wordsmith‬هذا البرنامج يحتاج علينا أن‬
‫نحمله في الحاسوب للعمل به‪ .‬هذا البرنامج ينتج قائمة الكلمات حسب مرتب‬
‫األحرف األبجدية ودرجة تكرارها‪ .‬البرنامج ‪ Ant word Profiler‬هو من‬
‫البرمجيات المجانية لتحليل الكلمات الشائعة في االنص المختار‪.‬‬
‫‪ TextSTAT - Simple Text Analysis Tool‬أيضا من برمجية مجانية وبسيطة‬
‫لتحليل النصوص‪ .‬تقرأ ملفات النص العادي (في ترميزات مختلفة)‪ ،‬وملفات‬
‫‪( HTML‬مباشرة من اإلنترنت)‪ ،‬وتنتج القوائم الكلمات الشائعة والفهارس حسب‬
‫مرتب األحرف األبجدية من هذه الملفات‪ .‬هذا البرنامج متعدد اللغات ألنه يستخدم‬
‫‪ Unicode‬داخليا‪ ،‬يمكن ‪ TextSTAT‬التعامل مع العديد من لغات مختلفة‬
‫وترميزات الملفات‪.‬‬
: ‫ويمكن أن نحمل هذه البرمجية من هذا الموقع‬
2
"http://neon.niederlandistik.fu-berlin.de/en/textstat

http://dirtdirectory.org/tags/word-frequency :‫ انظر‬. 2
‫قائمة المصادر والمراجع (‪)APA style‬‬

‫المراجع العربية‪:‬‬ ‫أ)‬

‫الخاتمة‬
‫األول ما قبل كل شيء‪ ،‬نشكر هللا تعالى على نعمة صحة العقل والجسم حتى نقوم‬
‫بهذا البحث بسهولة‪ .‬نقدم الشكر الجزيل إلى أستاذنا‪ ،‬دكتور فهام الذي يساعدنا‬
‫مساعدة ً هائالة ً في إجراءات إتممام البحث‪ .‬ولو نستطيع أن ننتهى من هذا البحث‬
‫في مدة مشترطة ولكن نجد تحديين حينما نحول أن نبدأ بهذا البحث‪ .‬واألول‪،‬‬
‫موضوع بحثنا هو الموضوع الذي لما يدرسنا األستاذ في الفصل‪ ،‬إذن علينا أن‬
‫نبحث عن هذا الموضوع في كتب متعددة وفي موقع اإلنترنت ثم نفهمه ونستوعبه‬
‫بأنفسنا حتى يمكن علينا أن نشرح لآلخرين ونفهمهم‪ .‬ثانيهما‪ ،‬نواجه الصعوبة في‬
‫ترجمة الكلمات التى تستخدم في علم المعلومات والتكنولوجيا مثل (‪،)corpus‬‬
‫و(‪ ،)concordance‬و(‪،)natural language electronic processing‬‬
‫و(‪ )stop word‬وما إلى ذلك‪ .‬ونتمنى أن بحثنا بالموضوع "الكلمات الشائعة في‬
‫اللغة العربية" يستفيد الطلبة والمعلمين والباحثين في سهولة الفهم واالستيعاب‬
‫حول هذا الباب حتى يطبقوا العلوم من هذا البحث في األعمال نحو إقامة بحث‬
‫العلوم وإقامة قوائم الكلمات الشائعة من مجموعة من النصوص المكتوبة وغيرها‬
‫تتعلق بهذا البحث‪.‬‬

You might also like