Professional Documents
Culture Documents
محرك البحث جوجل :يعد محرك البحث جوجل من أكثر محركات البحث شهرة على
المستوى العالمي نظرا ً لما يتمتع به من سرعة في ملحقة الصفحات الجديدة وتكشيفها،
.حيث يبلغ حجم قاعدة بياناته وفقا ً لخر التقديرات حوالي 9مليار صفحة
وقد قام بتطوير هذا المحرك اثنان من طلبة الدكتوراه بجامعة ستانفورد عام 1998هما:
Sergey Brin and Larry Page.سيرغي برين ولري بايج
والمصطلح جوجل يعنى بالنجليزية مليين المليارات كما تعنى أيضا يبحلق أو ينظر بشدة
وتركيز مما يعكس رغبة مؤسسيه على ملحقة وتكشيف أكبر قدر ممكن من صفحات
.ومواقع الويب ،كما يعكس أيضا إدراكهم منذ البداية للنمو السريع لشبكة النترنت
وتشير إحصائيات محرك البحث جوجل إلى أنه يجيب على أكثر من 150مليون استفسار
يوميا بمختلف لغات العالم ،حيث يتيح البحث بحوالي 35لغة منها اللغة العربية .وقد أثبت
محرك البحث جوجل كفاءة كبيرة في تعامله مع اللغة العربية من خلل العديد من
.التجارب والدراسات التي سعت إلى تقييم أداء محركات البحث
ومن أهم الملمح التي تميز محرك البحث جوجل هو قدرته الفائقة على عرض وترتيب
النتائج وفقا لرتباطها بموضوع الستفسار ،حيث أشارت العديد من دارسات تقييم نتائج
البحث والسترجاع من محركات البحث إلى أن محرك البحث جوجل يتفوق على كل
وغيرها .ويرجع الفضل في AltaVista, Yahoo, Allthewebالمحركات المنافسة مثل
هذه الميزة إلى الطريقة التي يعتمد عليها محرك البحث في ترتيب نتائج السترجاع والتي
Page Rank ، .تعرف بنموذج بترتيب الصفحة
ويرجع تفوق محرك البحث جوجل على غيره من محركات البحث المعروفة في معدلت
في تصورنا Ranking Accuracyودقة الترتيب Precisionوالتحقيق Recallالستدعاء
:إلى
Web Linkالسبب الول يتمثل في اعتماده على استخدام بنية روابط الويب o
وهو النظام الذي Rank Order Calculation.لحساب ترتيب الصفحات Structure
Page Rank Model.oيطلق عليه نموذج ترتيب الصفحة
لتحسين نتائج البحث من حيث معدلت Linksالسبب الثاني هو استخدام الروابط
الستدعاء (عدد الصفحات المسترجعة) حيث يسترجع محرك البحث الصفحات المصدرية
ذات العلقة بموضوع الستفسار وغيرها من الصفحات المرتبطة بها §.نموذج ترتيب
واحدة من أهم الملمح المميزة Hyperlinksتعتبر الروابط Page Rank Modelالصفحة
للشبكة العنكبوتية حيث تشبه العلقة بين الصفحات والروابط تلك العلقة التي أستخدمها
في منتصف الخمسينات من القرن الماضي في ( )Eugene Garfieldيوجين جارفيلدد
إعداد كشافات الستشهادات المرجعية .وتعتمد فكرة هذه الكشافات على افتراض
منطقي يدعى وجود علقة تربط بين المقالة المصدرية والمصادر المستشهد بها في هذه
المقالة .وهو ما يساعد على حساب مدى قوة أو ضعف العلقات التي تربط بين مصادر
.المعلومات سواء كانت مقالت أو دوريات أو مؤلفين
وهو نفس الساس الذي اعتمد عليه القائمون على بناء محرك البحث جوجل حيث
افترضوا وجود علقة بين الصفحة والصفحات التي تشير إليها من خلل الروابط الفائقة،
وقد ثبت نجاح هذا الفتراض بشكل كبير.وقد اعتمد القائمون على بناء محرك البحث
التي قاموا بتجهيزها وتضمنت ما يقرب من Maps 518جوجل على مجموعة من الخرائط
لكي تمثل عينة متميزة للعلقات التي Hyperlinksمليون وحدة من الروابط الفائقة
تربط بين صفحات المعلومات على الشبكة العنكبوتية .وقد أتاحت هذه الخرائط إجراء
.حسابات سريعة للتعرف على مدى قوة العلقة التي تربط بين مجموعة من الصفحات
ثم ترتيب هذه الصفحات من خلل العتماد على تحليل ما تحويه من روابط داخلية تربطها
بصفحات أخرى والروابط الخارجية التي تربط الصفحات الخرى بها .ويتميز هذا المقياس
بأنه مقياس ديمقراطي إلى حد كبير حيث يحدد مكانة الصفحة بين غيرها من الصفحات
بناء على مدى أهميتها بالنسبة للصفحات الخرى سواء بالشارة إلى هذه الصفحات أو
.بالشارات التي تتلقاها الصفحة من الصفحات الخرى
يتم حساب عدد Page Rank Calculation Methodطريقة حساب ترتيب الصفحة §
الروابط الموجودة في الصفحة وتشير إلى صفحات أخرى كما يتم حساب عدد الروابط
هذه الحسابات لتحديد Normalizationالتي تشير إلى الصفحة المصدرية ثم يتم تطبيع
بين الصفحة والصفحات أخرى .وتتم عملية التطبيع وفقاً Similarity Scoreقيمة تشابه
( )Point to itمرتبطة بصفحات أخرى تشير إليها Aللمعادلة التالية:نفترض أن الصفحة
هو معامل ثابت ما بين ( )0,1وعادة ما يأخذ القيمة d 0.85والمعامل T1-----Tnوعددها
.إل في حالت استثنائية سنوضحها فيما بعد
)Point toإلى عدد الروابط الخارجة من الصفحة وتشير إلى صفحات أخرى Cوتشير
(:PR• )A( = )1-dكما يلى ( PR)Aبالتالي يكون حساب ترتيب الصفحة (other Pages
نلحظ من المعادلة أن ترتيب((+ d )PR)T1( / C)T1( +------------ PR)Tn( / C)Tn
لكل صفحات Probability Distributionيمثل توزيع احتمالي Page Rankالصفحة
مما يعنى أن مجموع ترتيب الصفحات لكل عملية يعادل واحدًا Over Web Pagesالويب
حا ،مما يسمح بترتيب الصفحات تنازليا ً وفقا لقيمة
ويتم حساب معامل آخر A.صحي ً
وهو معامل يتعلق بسلوك Link Structureلترتيب الصفحة يعتمد أيضا على بنية الروابط
المستفيدين عند التعامل مع الصفحة .وهذا المعامل يتعلق بمعدلت الفادة من صفحة
معينه ،مما يعنى أن المستفيد يمكن أن يغير من ترتيب الصفحات وفقا ً لمدى استخدامه
لهذه الصفحات .ويتم تحديد مدى الفادة من صفحة معينة وفقا ً لعدد مرات النقر على
الرابط الفائق المتعلق بهذه الصفحة في كل مرة تظهر فيه هذه الصفحة ضمن نتائج
d.البحث ،حيث يتم تعديل قيمة المعامل
فإذا قام المستفيد بفتح الصفحة التي تظهر في ترتيب 3مثل ً ولم يفتح الصفحة التي تظهر
في الترتيب 1يعتبر محرك البحث جوجل أن هذا إعلن من المستفيد أن الصفحة 3أفضل
من الصفحة 1بالنسبة لهذا الستفسار ،مما يجعل محرك البحث يعدل من قيمة المعامل
الخاص بترتيب الصفحة 3مما يجعلها تظهر قبل الصفحة 2 ، 1إذا كان سلوك كل أو d
معظم المستفيدين منها يسير في نفس التجاه .ويعتبر هذا المقياس أيضا من المقاييس
.الديمقراطية التي تميز محرك البحث جوجل عن غيره من المحركات
والذي Relevance Feedbackبرد فعل الصلحية dوتعرف عملية تعديل قيمة المعامل
يتوقف على مجموع سلوك المستفيدين من صفحة معينة خلل فترة زمنية معينة §.
يتم معاملة النصوص التي تعبر عن الروابط في الملف Anchor Text :نصوص الزاوية
وهو الملف الذي يشتمل على أكواد لغة تكويد النصوص الفائقة Source File-المصدري
.بطريقة خاصة في محرك البحث جوجل HTML-
Link Analysisحيث تتعامل معظم محركات البحث التي تستخدم أسلوب تحليل الروابط
مع الروابط التي توجد داخل الصفحة وتكشف النصوص التي توجد داخل هذه الروابط
ولهذه Point to it.بينما يكشف محرك البحث جوجل الروابط التي تشير إلى الصفحة
• :الطريقة العديد من المزايا ومنها
عادة ما تتضمن وصف دقيق لصفحة الويب يفوق ما Anchor Textأول ً نصوص الزاوية
تقدمه الصفحة في جسمها الرئيسي من كلمات مفتاحية تصف الموضوع الذي تتناوله،
وهو ما أثبتته العديد من الدراسات حيث أن هذه النصوص تمثل عناوين الموضوعات
الرئيسية التي تتناولها هذه الصفحات
ثانيا ً نصوص الزاوية تساعد على تكشيف الصفحات التي ل يمكن تكشيفها من خلل •.
وبالتالي يمكن استخدام هذه Text Based Search Engines ،محركات بحث نصية
مثل ملفات الصوت ،الفيديو Multimedia ،النصوص في تكشيف الوسائط المتعددة
الصور ،برامج الكمبيوتر ،الخرائط ،قواعد البيانات...الخ
Crawlersثالثا ً تساعد نصوص الزاوية على تكشيف صفحات لم تقوم الزواحف •.
بتجميعها أو زيارتها ،بالتالي يمكن من خلل هذا السلوب تجميع أكبر عدد ممكن من
الصفحات أو التعرف عليها دون الحاجة إلى زيارة الخوادم التي تستضيفها .خاصة إذا ما
.عرفنا أن هذه الزواحف عادة ما تكون متحيزة جغرافيا ً ولغويا ً في تغطيتها
وهو ما جعل محرك البحث جوجل من أكبر محركات البحث وأشملها من حيث حدود
Domainالتغطية سواء الجغرافية أو اللغوية أو الموضوعية أو وفقا ً للسماء السائدة
Names.
وتجدر الشارة هنا إلى أن هذه الميزة قد تنقلب إلى عيب كبير وتسبب مشاكل كثيرة
حيث أن محرك البحث يمكن أن يسترجع نتائج لصفحات لم يزورها الزاحف مطلقا ً ويتأكد
من وجودها .ويعتبر استخدام نصوص أقواس الزاوية عملية في غاية الصعوبة نظراً
لضخامة حجم البيانات التي يتم معالجتها حيث أن معالجة 24مليون صفحة تتطلب على
القل معالجة 259مليون نص زاوية في محرك البحث جوجل حتى عام 2000بمتوسط
10.8نص زاوية للصفحة الواحدة .وقد استخدمت فكرة توسيع التغطية من خلل التعامل
للصفحات التي تشير إلى Anchor Text Propagatingمع نصوص أقواس الزاوية
وهو أول محرك بحث يتضمن WWW WORMالصفحات المصدرية في محرك البحث
Non Textual Pages.زاحف – تم بناءه عام – 1994لتكشيف الصفحات الغير نصية
ويعتبر استخدام نصوص أقواس الزاوية عملية في غاية الصعوبة نظرا ً لضخامة حجم
البيانات التي يتم معالجتها حيث أن معالجة 24مليون صفحة تتطلب على القل معالجة
259مليون نص زاوية في محرك البحث جوجل حتى عام 2000بمتوسط 10.8نص
زاوية للصفحة الواحدة .وبالضافة إلى استخدام الروابط ونصوص الزاوية في تكشيف
لتحديد أهمية Link Locationالصفحات يقوم محرك البحث جوجل بتحديد موقع الرابط
.الرابط في الصفحة
فتعتبر الروابط التي تأتى في عناوين منفصلة أكثر أهمية من الروابط التي ترد ضمن نص
ما ،والروابط التي ترد في المحتويات والفئات التي تتضمنها الصفحة أكثر أهمية من
.الروابط التي ترد في عناوين فرعية
كما يستخدم محرك البحث جوجل أساليب التكشيف التقليدية مثل أسلوب تردد
وأساليب Proximity Indexing،والتكشيف التجاورى Term Frequency،المصطلحات
Pageمن ثم فإن نظام ترتيب الصفحة Term Weighting Schemes.وزن المصطلحات
يعتمد على الطبيعة الديمقراطية الفريدة في الويب ،وذلك باستعمال الرتباطات Rank
.كدليل على أهمية صفحة معينة Hyperlinks
يفسر الرتباط من صفحة أ إلى الصفحة ب على أنه تصويت من Googleبمعنى أن
الصفحة أ لمصلحة الصفحة ب .لكنه ل ينظر فقط إلى كمية الصوات (أي الرتباطات
الموجهة إلى صفحة معينة) ،بل يحلل الصفحة التي تقوم بالتصويت .فإذا كانت الصفحات
التي تصوِّت "مهمة" ،يعطيها ذلك وزنا أكبر ،ويجعل الصفحات الخرى التي تم التصويت
أعلى ،المر Page Rankلها مهمة أيضا .تحصل المواقع المهمة رفيعة الجودة على ترتيب
.في كل مرة يُجري بحثا Googleالذي يتذكره
وبالطبع ل تعني الصفحات المهمة للمستفيد شيئا إن كانت ل تطابق بحثه .لذلك يجمع
المعقدة ليجد Text Matchingوتقنيات مطابقة النص Page Rankبين Google
عند عدد المرات Googleصفحات مهمة وتلئم موضوع البحث على السواء .ول يتوقف
التي تظهر فيها عباره معينة في الصفحة ،بل يفحص كل أوجه محتويات الصفحة
.ومحتويات الصفحات المرتبطة بها ليعرف ما إذا كانت مطابقة للبحث أم ل
نزاهة جوجل:من أهم السمات التي تميز النتائج المسترجعة من محرك البحث جوجل هى
النزاهة في عرض النتائج ،حيث أن طريقة عمل جوجل المعقدة واللية تجعل من الصعب
العبث البشرى بالنتائج المسترجعة .ذلك على الرغم من أن جوجل يقوم بعرض إعلنات
مدفوعة الجر في قمة صفحة النتائج لمجموعة من المنتجات المرتبطة بموضوع
الستفسار إل أنه ل يبيع مواقع أفضل ضمن صفحات النتائج الرئيسية ،حيث ل يسمح
بالتالي فإن البحث في جوجل يمثل Page Rank،محرك البحث بشراء ترتيب الصفحة
طريقة سهلة وموضوعية للعثور على نتائج عالية الجودة وتحوى معلومات تطابق موضوع
.البحث
Relevanceوعلى الرغم من ذلك فإن اعتماد جوجل على أسلوب رد فعل الصلحية
الذي يعطى الصفحة ترتيبًا أعلى في حالة تردد استخدامها من جانب Feedback
المستفيدين ،قد ساعد بشكل غير مباشر على العبث البشرى بنتائج البحث ،حيث يمكن
للمستفيد أن يرفع من ترتيب صفحة ما من خلل إعادة البحث مرات عديدة وفتح تلك
الصفحة مما يعطيها أهمية أو قيمة أكبر من الصفحات التي تسترجع معها.مبررات
معد الكتاب السنوي لمحركات ( )Andre Rouxاستخدام جوجل:يرى أندريه روكس
أنه توجد مجموعة من المبررات المنطقية التي Search Engines Yearbookالبحث
تدفع المستفيدين إلى تفضيل جوجل عن غيره من محركات البحث وزيادة معدلت
:استخدامه من جانب رواد شبكة النترنت ،وتشمل هذه المبررات ما يلي
أن محرك البحث جوجل أكبر محركات Google Coverage:التغطية في جوجل 1-
البحث من حيث تغطيته لصفحات ومواقع الويب كما انه أسرع محركات البحث المتاحة
على الشبكة العنكبوتية .وقد أثبتت العديد من الدراسات كما سبق وعرضنا أن جوجل
يتفوق على كل محركات البحث المتاحة على الشبكة العنكبوتية ،كما أوضحت دراسات
الفادة من محركات البحث أن جوجل يأتى على قمة المحركات التي يستخدمها
المستفيدون من الشبكة العنكبوتية في جميع أنحاء العالم ،كما انه يتميز أيضا بتنوع
خدماته إلى الحد الذي جعل من جوجل أكبر شركة لتقديم خدمات المعلومات على شبكة
النترنت .وتوجد منافسة شرسة بين كل من جوجل وياهو على تحقيق أعلى الرباح من
خلل خدمات النترنت
الساس الذي أعتمد عليه مصممي Search Engine Structure:بنية محرك البحث .2-
جوجل هو أساس ديمقراطي إلى حد كبير ويتناسب مع طبيعة الشبكة العنكبوتية بما تتميز
به من روابط فائقة حتى أن مصمم الشبكة العنكبوتية تيم برنر لى يرى أن مصممي
جوجل تفوقوا على كل محركات البحث الخرى بإدراكهم هذه الميزة التي جعلت من
جوجل بيئة متميزة لسترجاع المعلومات من الشبكة العنكبوتية
إن محرك البحث جوجل يتميز أيضا بأنه يسعى لتنظيم Neutral and Un-Biasالحياد .3-
شبكة النترنت بحيادية تامة حيث يقوم بعرض النتائج مدفوعة الجر في موقع منفصل
وبعيد تماما ً عن نتائج البحث الساسية
تتميز النتائج المسترجعة Accuracy of Retrieved Results:دقة النتائج المسترجعة .4-
من محرك البحث جوجل بالدقة المتناهية حيث يعتمد على أسلوب المطابقة الحرفية
بالتالي فهو ل يسترجع إل النتائج التي تتطابق مع كلمات البحث سواء Exact Match
ضمن نص الصفحة أو ضمن الرتباطات التي تشير إلى الصفحة.كما أن استخدام مبدأ
جعل من النتائج التي يسترجعها محرك البحث Proximity Search،البحث التجاورى
جوجل ل تتضمن كل كلمات البحث فقط بل يحلل جوجل أيضا الكلمات المجاورة
لمصطلحات البحث في الصفحة .فبخلف محركات بحث كثيرة يرتب جوجل النتائج وفقا
لتجاور مصطلحات البحث أول حيث يعطى أولوية للنتائج التي تكون فيها كلمات البحث
متجاورة أكثر من تلك التي تكون فيها كلمات البحث متباعدة .بالتالي يستطيع المستفيد
.أن يحصل على نتائجه مرتبة وفقا لحتياجاته الخاصة والتي تختلف من مستفيد لخر
يقدم جوجل وغيره من محركات البحث وصف Results Description:وصف النتائج 5-
دقيق للصفحة المسترجعة في صورة مقتطفات من النص الذي يطابق البحث ،وبالطبع
تتغير هذه المقتطفات وفقا لكلمات البحث .ولكن أهم ما يميز جوجل عن غيره من
من الصفحة تتضمن تحليل كامل Page Cashالمحركات أنه يقوم بتخزين نسخة مخبأة
للصفحة وفقا ً لرتباطها بكلمات البحث .وذلك لكي تتمكن من استعمالها في حال توقف
مع أن، وكثيرا ما تكون الصفحة المخبأة أسرع من الرتباط العادي.الصفحة وقتيا
المعلومات قد ل تكون محدّثة
.6- وقت الستجابةResponse Time:يتيح جوجل طريقة سريعة للبحث المحدد الذي
يبحث عن صفحة معينة فيما يعرف بضربة حظI `m Lucky. فإذا كنت تبحث عن أشياء
يضع، مثل اسم شركة، شائعة ومعروفةGoogle .النتيجة المطلوبة في رأس الصفحة
حيث أنشأ القائمون على جوجل زر "ضربة حظ" الذي يأخذ المستفيد مباشرة إلى موقع
وميزة "ضربة حظ أنها مصممة ليصالك إلى المعلومات المفيدة.نتيجة البحث الولى
بشكل سريع ومباشر.
تناولت هذه الورقة عرض للطريقة التي يعتمد عليها محرك البحث جوجل في:الخلصة
.تحليل وترتيب صفحات الويب والتى تميزه عن غيره من محركات البحث العالمية
وأشارت الورقة إلى أن محرك البحث جوجل استند في فكرته الساسية للتحليل والفرز
على أحد الساليب المعروفة لدى المتخصصين في علوم المعلومات بأسلوب تحليل
وأعتمد عليها بشكل،الستشهادات المرجعية والتى أطلق عليها تحليل الروابط الفائقة
كما استعرضت أيضا.بصفة أساسية في تطوير خوارزميات التكشيف والسترجاع والفرز
الملمح الساسية التي تبرر استخدام هذا المحرك من جانب عدد كبير من المستفيدين
من حيث التغطية والبنية والحياد والدقة ووصف النتائج ووقت الستجابة.