You are on page 1of 15

‫التنقيب في البيانات ‪ Data mining‬واستخراج املعرفة‬

‫من املؤكد أن التنقيب في البيانات ‪ Data mining‬هو من املوضوعات بالغة ألاهمية‪ .‬وإال ما الذي يجعلها أحد املوضوعات‬
‫ً‬
‫ألاكثر أهمية لرئيس الواليات املتحدة أوباما ‪ Obama‬؟ فاملتتبعون لنشاط رئيس الدولة ألاكثر تحكما في العالم سيعرفون أنه بتاريخ‬
‫‪ 71‬ديسمبر ‪ ،3172‬كان في لقاء مع قيادات تقنية املعلومات والذين كان منهم ‪ Tim Cook‬من شركة أبل ‪ Apple‬و ‪ Eric Schmidt‬من‬
‫جوجل وكذلك املدراء التنفيذيين لكل من ‪،Yahoo! ،Dropbox ،Etsy ،Netflix ،Salesforce ،Facebook ،Microsoft ،Twitter‬‬
‫‪ !!!LinkedIn ،Comcast ،Sherpa Global ،Zynga‬وذلك ملناقشة موضوع التنقيب في البيانات‪ .‬كما أنه في خطاب له بتاريخ ‪ 71‬يناير‬
‫‪ 3172‬عاود من جديد طرح املوضوع من خالل الدعوة إلى إجراء إصالحات في نظام التنقيب عن البيانات‪ .‬ذلك يؤكد الاهتمام الذي‬
‫يتم إيالءه ملوضوع التنقيب في البيانات على املستوي الدولي والعالمي‪.‬‬
‫ماذا يعني التنقيب عن البيانات‬
‫أدى الانتشار الواسع لتقنية املعلومات وسهولة إتاحتها إلى تضخم حجم املعلومات بصورة استباقية لم يشهدها التاريخ من‬
‫ً‬
‫قبل‪ ،‬مما جعل من قضية البيانات الضخمة على إلانترنت مثارا للجدل‪ ،‬من حيث جدوى وجودها بهذه الصورة العشوائية‪ .‬وعندما‬
‫نتحدث عن البيانات الضخمة‪ ،‬فإننا نتحدث عن كميات ال يمكن تخيلها من البيانات املتعددة ألانواع واملصادر بججم يصل إلى‬
‫املئات من التيرابايت أو حتى البيتابايت (البيتابايت هو الرقم واحد متبوعا بـ ‪ 71‬صفر)‪ .‬كما أن شركة ‪ IBM‬تتحدث عن ‪3.1‬‬
‫كوينتيليون بايت من البيانات كل يوم (الكوينتيليون هو الرقم واحد متبوعا بـ ‪ 71‬صفرا)‪ .‬معلومات في كل مكان وفي موضوعات شتى‪.‬‬
‫ً‬ ‫وهنا نتساءل ما أهمية هذه البيانات في ظل وجود حقيقة تشير إلى أن املعلومات املنظمة من هذه البيانات ال تشكل إال ً‬
‫جزء ضئيال‬
‫يصل إلى ‪ %71‬مقارنه باملعلومات غير املنظمة والتي تشكل الباقي‪ .‬ذلك أدى إلى ازدياد الحاجة إلى تطوير أدوات تمتاز بالقوة لتحليل‬
‫البيانات واستخراج املعلومات واملعارف منها‪ ،‬فاألساليب التقليدية وإلاحصائية ال تستطيع أن تتعامل مع هذا الكم الهائل لذا‬
‫تستخدم أدوات ذكية ملعالجة هذه البيانات‪.‬‬
‫من هنا ظهر ما يسمى باستخراج البيانات ‪ Data Mining‬كتقنية تهدف إلى استنتاج املعرفة من كميات هائلة من البيانات‪،‬‬
‫تعتمد على الخوارزميات الرياضية والتي تعتبر أساس التنقيب عن البيانات وهي مستمدة من العديد من العلوم مثل علم إلاحصاء‬
‫والرياضيات واملنطق وعلم التعلم‪ ،‬والذكاء الاصطناعي والنظم الخبيرة‪ ،‬وعلم التعرف على ألانماط ‪،‬وعلم آلالة‪ .‬وغيرها من العلوم‬
‫التي تعتبر من العلوم الذكية وغير التقليدية‪.‬‬
‫ظهر التنقيب في البيانات (‪ )Data mining‬في أواخر الثمانيات وأثبت وجوده كأحد الحلول الناجحة لتحليل كميات ضخمة‬
‫قيمة يمكن استغاللها و الاستفادة‬ ‫من البيانات‪ ،‬وذلك بتحويلها من مجرد معلومات متراكمة وغير مفهومة (بيانات) إلى معلومات ِّ‬
‫منها بعد ذلك‪.‬‬
‫وقد اجتذبت مرحلة التنقيب في البيانات الكثير من الاهتمام في ألاوساط البحثية على مدى العقد املاض ي‪ ،‬في محاولة‬
‫لتطوير خوارزميات قابلة للتوسع والتكيف مع كميات متزايدة من البيانات في البحث عن أنماط معرفية ذات معنى‪ .‬وقد نمت حزم‬
‫من الخوارزميات والبرمجيات و بشكل كبير خالل العقد املاض ي‪ ،‬إلى حد أن التوسع قد جعل من الصعب على العاملين في هذا‬
‫الحقل تتبع التقنيات املتاحة لحل مهمة معينة‪.‬‬
‫ولكن ما أذهلني عند البحث عن تعريفات ملفهوم التنقيب في املعلومات‪ ،‬الكم الهائل من التعريفات لهذا املفهوم‪ .‬فموقع‬
‫ً‬
‫مؤسسة ‪ IGI Global‬يقدم ‪ 13‬تعريفا ملفهوم التنقيب في البيانات‪ .‬وبعد املرور على جميع هذه التعريفات‪ ،‬تم اختيار التعريفات‬
‫التالية‪:‬‬
‫ً‬
‫‪ ‬عملية البحث داخل كميات كبيرة من البيانات للكشف عن العالقات التي لم يتم كشفها سابقا بين عناصر البيانات‪،‬‬
‫واملعروفة أيضا باسم اكتشاف املعرفة في قواعد البيانات (‪.)KDD‬‬
‫‪ ‬هي النشاط الذي يقوم باستخراج املعلومات املتواجدة في كميات كبيرة من البيانات‪ ،‬بهدف البحث عن أنماط معرفية‬
‫واكتشاف الحقائق الخفية الواردة في قواعد البيانات‪.‬‬
‫‪ ‬هي عملية تحليل البيانات لتحديد العالقات التي لم تكتشفها التحليالت السابقة من قبل‪ .‬كما أنها تحليل البيانات إلقامة‬
‫عالقات وتحديد أنماط‪.‬‬
‫‪ ‬تحليل البيانات املتواجدة في قواعد البيانات باستخدام ألادوات التي تبحث عن الاتجاهات أو البيانات التي ال معنى لها‪،‬‬
‫ً‬
‫واستخراج معلومات ضمنية‪ ،‬لم تكن معروفة سابقا‪ ،‬ويمكن أن تكون مفيدة‪.‬‬
‫‪ ‬عملية استخراج أنماط معرفية من مجموعات البيانات الكبيرة من خالل الجمع بين ألاساليب من إلاحصاءات والذكاء‬
‫الاصطناعي مع إدارة قواعد البيانات‪.‬‬
‫‪ ‬هو خطوة واحدة في اكتشاف املعرفة داخل قواعد البيانات (‪ )KDD‬حيث تستخدم أساليب التحليل مثل‪ :‬الشبكات‬
‫العصبية ‪ Neural Networks‬أو الخوارزميات الجينية ‪ Genetic Algorithms‬أو شبكة القرارات ‪Decision Trees‬‬
‫والتقنية والنماذج الهجينة ‪ Hybrid Models‬لتحديد ألانماط والعالقات في مجموعات البيانات‪.‬‬
‫‪ ‬عملية اكتشاف املعرفة في قواعد البيانات عن طريق تحديد ألانماط والاتجاهات في البيانات التي تم جمعها باستخدام‬
‫طرق مختلفة مثل‪ :‬التصنيف ‪ Classification‬أو التحليل التسلسلي ‪ Sequential analysis‬أو العنقدة (التجميع)‬
‫‪ clustering‬أو قواعد الارتباط ‪.Association Rule‬‬
‫‪ ‬عملية يتم من خاللها فرز كميات كبيرة من البيانات بهدف استخالص املعلومات ذات الصلة‪ .‬ويستخدم هذا املصطلح‬
‫على نحو متزايد في العلوم الستخراج املعلومات من مجموعات البيانات الهائلة الناتجة عن الطرق التجريبية والرصدية‬
‫الحديثة‪ ،‬والسيما في سياق الحقول البيولوجية‪.‬‬
‫‪ ‬عملية الاختيار‪ ،‬والاستكشاف‪ ،‬ووضع نماذج لكميات كبيرة من البيانات الكتشاف الاطراد أو العالقات املجهولة بهدف‬
‫الحصول على نتائج واضحة ومفيدة ملالك قاعدة البيانات‪.‬‬
‫‪ ‬فرع من علوم الكمبيوتر‪ ،‬يهتم باستخراج أنماط من مجموعات البيانات الكبيرة من خالل الجمع بين التحليل إلاحصائي‬
‫والذكاء الاصطناعي مع إدارة قواعد البيانات‪ .‬ويعتبر استخراج البيانات كأداة ذات أهمية متزايدة من قبل رجال ألاعمال‬
‫ً‬
‫الحديثة لتحويل البيانات إلى معلومات إلعطاء ألاعمال ميزة إعالمية‪ .‬ويستخدم حاليا في مجموعة واسعة من ممارسات‬
‫التنميط‪ ،‬مثل التسويق‪ ،‬واملراقبة‪ ،‬والكشف عن الغش‪ ،‬واختيار شريك تجاري‪.‬‬
‫‪ ‬فرع مهم في الصناعة والسوق‪ ،‬واسترجاع املعلومات الهامة من كمية هائلة من البيانات‪ ،‬ويستخدم عادة مع كمية هائلة‬
‫ً‬
‫من البيانات غير املتجانسة‪ ،‬حيث استخدام أجهزة الكمبيوتر أمرا ال مفر منه‪.‬‬
‫ً‬
‫‪ ‬في اللغة الشائعة‪ ،‬غالبا ما يتم إلاشارة إلى التنقيب عن البيانات بصفة عامة إلى فكرة التحقيق بعمق في جبال من‬
‫ً‬
‫البيانات‪ .‬هذا الاستخدام غير الرسمي لهذا املصطلح عادة ما يستخدم القليل من التقنيات للقيام بالتحقيق‪ .‬في املقابل‪،‬‬
‫ً‬
‫فإن الاستخدام الرسمي لهذا املصطلح يشير تحديدا إلى استخدام التقنيات الحاسوبية للكشف عن أنماط في مجموعات‬
‫البيانات الضخمة‪ .‬تتنوع هذه التقنيات ما بين ألاساليب إلاحصائية إلى الذكاء الاصطناعي‪ ،‬ومجموعات التحقق‬
‫واستخراج البيانات‪ ،‬وهي متنوعة ومتزايدة أكثر من أي وقت مض ى‪.‬‬
‫‪ ‬عملية تقنية تستخدم خوارزميات لتحليل البيانات من وجهات نظر متعددة واستخراج أنماط ذات معنى والتي يمكن‬
‫استخدامها للتنبؤ بالسلوك املستقبلي للمستخدمين‪ .‬نظام تحليل سلة السوق الذي يستخدمه ‪ Amazon.com‬يوص ي‬
‫بمنتجات جديدة لعمالئها على أساس مشترياتهم املاضية‪ ،‬وهو مثال معروف على نطاق واسع للكيفية التي يمكن أن‬
‫تستخدم التنقيب عن البيانات في مجال التسويق‪.‬‬
‫‪ ‬عملية اكتشاف الارتباطات ذات املغزى‪ ،‬وألانماط‪ ،‬والاتجاهات بالنخل من خالل كميات كبيرة من البيانات املخزنة في‬
‫املستودعات‪ ،‬وذلك باستخدام تقنيات التعرف على ألانماط وكذلك ألاساليب إلاحصائية والرياضية‪.‬‬
‫‪ ‬اكتشاف املعرفة في قواعد البيانات هي أنماط معرفية مفهومة يتم استخراجها من مجموعات البيانات الكبيرة املخزنة في‬
‫قواعد البيانات ‪ Databases‬ومستودعات البيانات الضخمة ‪.Data warehouses‬‬
‫ً‬ ‫ً‬
‫‪ ‬في عام ‪ 3117‬كتب ‪ Micheline Kamber & Jiawei Han‬عن التنقيب عن البيانات باعتبارها جزءا رئيسا من اكتشاف‬
‫املعرفة‪ .‬التنقيب عن البيانات هو كل ش يء مرتبط باستخراج املعرفة املفيدة من كميات كبيرة من البيانات‪ .‬إنه العثور‬
‫على مجموعة صغيرة من الشذرات الثمينة (املعرفة) من قدر كبير من املواد الخام (البيانات)‪.‬‬
‫ً‬
‫‪ ‬هناك مصطلحات أخرى ذات الصلة التي تستخدم أيضا في ألاوراق ألاكاديمية والبحثية للتنقيب عن البيانات‪ ،‬مثل‬
‫التنقيب عن املعرفة‪ ،‬واستخراج املعرفة‪ ،‬وأنماط تحليل البيانات‪ ،‬وعلم آثار البيانات وتحريف البيانات‪ ،‬ولكن في عالم‬
‫ً‬
‫ألاعمال عموما مصطلح «التنقيب عن البيانات» هو أكثر شعبية‪.‬‬
‫‪ ‬التنقيب عن البيانات هو حقل متعدد التخصصات‪ ،‬يستفيد من املجاالت بما في ذلك تقنية قاعدة البيانات‪ ،‬الذكاء‬
‫الاصطناعي‪ ،‬والتعلم آلالي‪ ،‬والشبكات العصبية‪ ،‬وإلاحصاءات والتعرف على ألانماط‪ ،‬والنظم القائمة على املعرفة‪،‬‬
‫واكتساب املعرفة‪ ،‬واسترجاع املعلومات‪ ،‬والحوسبة عالية ألاداء والصورة ومعالجة إلاشارات‪ ،‬وتحليل البيانات املكانية‬
‫والبيانات التصورية (‪ ،)Data Visualization‬والتي تعتمد بشكل كلي على إلادراك البصري‪.‬‬
‫مراحل اكتشاف املعرفة‬
‫اكتشاف املعرفة في قواعد البيانات (‪ Knowledge Discovery in Database (KDD‬ليس بالعملية السهلة والتي قد يعتقد‬
‫ً‬
‫البعض أنها تتوقف عند تجميع البيانات وإدارتها‪ ،‬بل نراها تمتد إلى التحليل والتوقع والتنبؤ بما سيحدث مستقبال‪.‬‬
‫ً‬ ‫ً‬
‫التنقيب في البيانات يشكل جزءا من اكتشاف املعرفة ‪ ،Knowledge Discovery‬وهذه العملية هي ألاكثر شموال‪.‬‬
‫تتضمن عملية اكتشاف املعرفة الخطوات التالية‪:‬‬
‫‪ .1‬اكتشاف البيانات ‪:Data discovery‬وهي مرحلة جمع البيانات وتشمل كشف وتحديد وتوصيف البيانات املتاحة‪.‬‬
‫‪ .3‬تصفية البيانات وتنقيتها ‪ :Data cleaning‬ويتم في هذه املرحلة إزالة البيانات املزعجة ‪ Noise‬التي ال أهمية لها‪ ،‬كما يتم‬
‫حذف البيانات املتضاربة والبيانات الغير متناسقة‪.‬‬
‫‪ .2‬تكامل البيانات ‪ :Data integration‬يتم في هذه املرحلة تجميع البيانات املتشابهة وذات الصلة من مصادر البيانات‬
‫املتعددة ودمجها معا‪.‬‬
‫‪ .2‬اختيار البيانات ‪ :Data selection‬في هذه املرحلة‪ ،‬يتم تحديد واسترجاع البيانات املالئمة من مجموعة البيانات‪.‬‬
‫‪ .1‬تحويل البيانات ‪ :Data transformation‬في هذه املرحلة يتم تحويل البيانات إلى نماذج مخصصة مالئمة إلجراءات‬
‫البحث والاسترجاع بواسطة خالصة إلانجاز أو عمليات التجميع‪.‬‬
‫‪ .6‬التنقيب عن البيانات ‪ :Data mining‬أي استخدام طرق ذكية تطبق الستخالص أنماط البيانات استخراج نماذج‬
‫مفيدة قدر إلامكان‪.‬‬
‫‪ .1‬تقييم النمط ‪ :Pattern evaluation‬يتم في هذه املرحلة تحديد ألانماط املهمة حقا والتي تمثل قاعدة املعرفة‬
‫الستخدام بعض املقاييس املهمة‪.‬‬
‫‪ .1‬تمثيل املعرفة وتقديمها ‪ :Knowledge presentation‬وهي املرحلة ألاخيرة من مراحل اكتشاف املعرفة في قواعد‬
‫البيانات وهي املرحلة التي يراها املستفيد‪ ،‬هذه املرحلة ألاساسية تستخدم ألاسلوب املرئي ملساعدة املستفيد في فهم و‬
‫وتفسير نتائج استخراج البيانات‪.‬‬
‫وبالتالي التنقيب في البيانات هو خطوة أساسية لتطبيق أساليب ذكية بهدف الكشف عن أنماط البيانات املثيرة لالهتمام‬
‫واملخبأة في مجموعات البيانات الكبيرة‪ .‬ومع ذلك‪ ،‬في بعض املنظمات نجد أن مصطلح التنقيب عن البيانات «‪ »Data mining‬أصبح‬
‫أكثر شعبية لإلشارة إلى العملية التي يتم فيها اكتشاف املعرفة »‪ «Knowledge Discovery‬برمتها‪.‬‬
‫ً‬
‫وهناك جانب مهم جدا‪ ،‬يجب النظر إليه بعين الاعتبار و هو أن هناك أنماط جديدة قد تبرز‪ ،‬عادة ما تكون غير معروفة من‬
‫قبل‪ .‬وبالتالي يجب أن تكون أدوات التنقيب عن البيانات قادرة على البحث عن أنواع مختلفة من ألانماط‪ ،‬بأشكال متوازية لزيادة‬
‫ً‬
‫كفاءة التنقيب عن البيانات‪ .‬كما يجب أيضا أن يتم الكشف عن ألانماط في ألاجزاء الصغيرة والفرعية‪ ،‬والتي تعرف بالحبيبات‬
‫‪ ،Granularities‬مما يعني البحث في مستويات مختلفة من التجريد أو التفصيل‪ .‬حلول التنقيب عن البيانات الجيدة هي التي تشير‬
‫ً‬
‫أيضا إلى قدر من الثقة أو اليقين املرتبطة مع نمط اكتشافها‪ ،‬ألن بعض ألانماط قد ال تصلح لكافة البيانات في مجموعة البيانات‬
‫التي تم تحليلها‪.‬‬
‫استخدامات التنقيب عن البيانات‬
‫في ضوء املفهوم العام للتنقيب في البيانات يبدأ التساؤل عن الفوائد التي يمكن للمنظمات تحقيقها من استخدام التنقيب‬
‫في البيانات؟ وما هي املنظمات التي بدأت باستثمار هذه التقنية في أنشطتها؟‬
‫واحدة من القطاعات املهنية التي بدأت باالستفادة من هذا املفهوم هي الرعاية الصحية‪ .‬مع النمو في السجالت الصحية‬
‫إلالكترونية (السجالت الصحية إلالكترونية)‪ ،‬املزيد واملزيد من التسهيالت وجمع كميات هائلة من البيانات الرقمية للمريض‪.‬‬
‫بالتالي يمكن ملقدمي الرعاية الصحية والباحثين استخدام التنقيب عن البيانات من مخازن هائلة من البيانات لكشف أنماط‬
‫ً‬
‫معرفية كانت مجهولة سابقا ومن ثم استخدام هذه املعلومات لبناء النماذج التنبؤية لتحسين التشخيص ونتائج الرعاية الصحية‪.‬‬
‫مهنة أخرى استطاعت الاستفادة من التنقيب عن البيانات وهي قطاع تجارة التجزئة‪ .‬من خالل تطبيق أدوات التنقيب عن‬
‫البيانات‪ ،‬وسالسل البيع بالتجزئة أصبحت قادرة على اكتشاف ألايام التي يتوافد املستهلكون فيها بغزارة إلى املحالت التجارية‬
‫والقيام بالتسوق الخاص بهم‪ ،‬وكيف ينفقون معظم أموالهم‪ ،‬وعلى أي من املنتجات املتواجدة يذهب املال‪ ،‬كل هذه املعلومات‬
‫واملعرفة بهذه ألانماط والتي قد يكون الكثير منها غير معروف لديهم‪ ،‬ساعد املخططين على توجيه استثماراتهم ً‬
‫بناء على هذه‬
‫املعلومات املكتسبة لزيادة إيراداتها في الواقع‪.‬‬
‫التنقيب في البيانات هو إعادة رؤية للبيانات من منظور جديد ومن هنا تكون القيمة املضافة والذي تعطي بيانات ال يمكن‬
‫توقعها باألساليب التقليدية‪ ،‬التنقيب عن البيانات يعطي هذه القيم املضافة في مجاالت عددية إذا ما تم استخدامه‪.‬‬
‫في تدوينه قادمة سيتم مناقشة مجاالت استخدامه بصورة أوسع سواء في الطب أو الكيمياء الحيوية والتجارة واملكتبات‬
‫ومؤسسات املعلومات التي كانت الصين من الدول الرائدة في استخدام التنقيب عن البيانات في هذا املجال (املكتبات)‪ ،‬كما سنعرف‬
‫كيف أثرت تقنية التنقيب عن البيانات في قرار املمثلة العاملية أنجلينا جولي إجراء عملية جراحية‪ .‬هذا باإلضافة إلى مناقشة‬
‫ألانظمة والبرمجيات التي يتم استخدامها إلجراء عمليات التنقيب عن املعلومات‪.‬‬
‫التنقيب في البيانات‬
‫التنقيب في البيانات هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه‬
‫املعرفة‪ .‬كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة) إليجاد عالقة منطقية‬
‫تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات‪ .‬يطلق اسم «نماذج ‪ »Models‬على العالقات والبيانات‬
‫امللخصة التي يتم الحصول عليها من التنقيب في البيانات‪ .‬يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها‬
‫ً‬
‫بغرض غير غرض التنقيب في البيانات (مثال قاعدة بيانات التعامالت في مصرف ما) مما يعني أن طريقة التنقيب في البيانات ال تؤثر‬
‫ً‬
‫مطلقا على طريقة تجميع البيانات ذاتها‪ .‬هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن إلاحصاء‪ ،‬ولهذا يشار إلى‬
‫ً‬
‫عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية‪ .‬يشير التعريف أيضا إلى أن كمية البيانات تكون عادة كبيرة‪ ،‬أما في حال‬
‫كون كمية البيانات صغيرة فيفضل استخدام الطرق إلاحصائية العادية في تحليلها‪.‬‬
‫عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط املميزة في البيانات‪ ،‬وكيفية تحليل‬
‫ً‬
‫البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي عالقة ظاهرية تعكس حقيقة في طبيعة البيانات‪ .‬عادة يتم التنقيب في‬
‫ً‬ ‫ً‬ ‫ً‬
‫بيانات تكون جزءا من كامل البيانات حيث يكون الغرض عادة تعميم النتائج على كامل البيانات (مثال تحليل البيانات الحالية‬
‫ً‬
‫ملستهلكي منتج ما بغرض توقع طلبات املستهلكين املستقبلية)‪ .‬من أحد أهداف تنقيب البيانات أيضا هو اختزال كميات البيانات‬
‫الكبيرة أو ضغطها بحيث تعبر بشكل بسيط عن كامل البيانات بدون تعميم‪.‬‬
‫محتويات‬
‫‪ 7 ‬أنواع التنقيب‬
‫‪ 3 ‬الكيفية‬
‫‪ 2 ‬أهداف التنقيب‬
‫‪ 2 ‬وسائل التنقيب في البيانات‬
‫‪ 1 ‬تطبيقات التنقيب في البيانات‬
‫‪ -1‬أنواع التنقيب‬
‫هناك نوعان أساسيان للتنقيب في البيانات هما‪ :‬التنقيب الاستشرافي والتنقيب الوصفي‪.‬‬
‫التنقيب الاستشرافي ينتج عنه نموذج عن النظام الذي تصفه البيانات املستخدمة في التنقيب‪.‬‬
‫بناء على املعلومات املوجودة داخل البيانات املستخدمة في عملية التنقيب‪.‬‬ ‫أما التنقيب الوصفي فينتج عنه معلومات جديدة ً‬
‫‪ -2‬الكيفية‬
‫أهداف التنقيب‬
‫هناك ثالثة أهداف للتنقيب في البيانات‪:‬‬
‫‪ .7‬من أجل تعليل بعض الظواهر املرئية‪.‬‬
‫‪ .3‬من أجل التثبت من نظرية ما‪ .‬مثال‪ :‬التثبت من النظرية التي تقول بأن ألاسر الكبيرة تهتم بالضمان الصحي أكثر من‬
‫ألاسر الصغيرة عددا‪.‬‬
‫ً‬
‫‪ .3‬من أجل تحليل البيانات للحصول على عالقات جديدة وغير متوقعة‪ .‬مثال‪ :‬كيف سيكون إلانفاق العام إن كان مالزما‬
‫لعمليات خداع واسعة من قبل البطاقات الائتمانية‪.‬‬
‫وسائل التنقيب في البيانات‬
‫هناك عدة وسائل مختلفة من أجل التنقيب في البيانات‪ .‬اختيار الوسيلة املناسبة يعتمد على طبيعة البيانات تحت الدراسة‬
‫وعلى حجمها‪ .‬يمكن إجراء عملية التنقيب في البيانات باملقارنة مع سوق البيانات ومخزن البيانات‪.‬‬
‫بعض من هذه الوسائل هي‪:‬‬
‫­ الاستدالل املبني على حاالت سابقة ‪ :Case-Based reasoning‬التفكير واستخالص النتائج والقوانين من أمثلة حية‬
‫ً‬
‫وقضايا تم حلها سابقا‪.‬‬
‫­ الكشف عن قانون ‪ :Rule Discovery‬البحث عن منوال معين أو عالقة معينة في جزئية كبيرة من البيانات‪.‬‬
‫­ معالجة إلاشارات ‪ :Signal Processing‬إيجاد الظواهر املتشابه مع بعضها البعض‪.‬‬
‫­ شبكات عصبونية ‪ :Neural Nets‬تطوير نماذج قابلة لتنبؤ النتائج‪ .‬هذه النماذج تم تطويرها ً‬
‫بناء على أسس تم‬
‫استنباطها من عقل إلانسان‪.‬‬
‫­ منحنيات غير ثابتة ‪ :Fractals‬تصغير البيانات الكبيرة من دون ضياع املعلومات‪.‬‬
‫تطبيقات التنقيب في البيانات‬
‫ً‬ ‫ُ‬
‫وسائل التنقيب في البيانات تستعمل وبنجاح في الكثير من التطبيقات الحقيقة حول العالم‪ .‬التطبيقات التالية تشمل بعضا‬
‫من ألامثلة‪:‬‬
‫­ كتابة تقرير مختصر عن فئة معينة ‪ :Profiling Populations‬تطوير وإنشاء تقارير موجزة عن الزبائن املهمين وعن‬
‫بطاقات الائتمان‪.‬‬
‫­ تحليل النزعة التجارية ‪ :Analysis of Business Trend‬إيجاد ألاسواق ذات قدرات النمو القوية أو الضعيفة‪.‬‬
‫­ التسويق لفئة معينة ‪ :Target Marketing‬إيجاد الزبائن من أجل منح التخفيضات لهم لسبب معين‪.‬‬
‫­ تحليل الاستعمال ‪ :Usage Analysis‬إيجاد منوال معين الستعمال الخدمات والسلع‪.‬‬
‫­ فعالية الحملة ‪ :Campaign Effectiveness‬مقارنة استراتيجيات الحمالت مع بعضها البعض من أجل إيجاد أكثرها‬
‫ً‬
‫فعالية وتأثيرا‪.‬‬
‫­ جاذبية السلعة‪ :‬إيجاد السلع التي تباع مع بعضها البعض‪.‬‬
‫تطبيقات التنقيب في البيانات بدأت تنمو بصورة كبيرة لألسباب التالية‪:‬‬
‫‪ .7‬كمية البيانات املوجودة في مخزن البيانات وسوق البيانات تنمو بصورة أسية (‪.)exponential‬‬
‫‪ .3‬ومن أجل ذلك‪ ،‬فإن املستخدم يحتاج إلى أدوات متطورة من مثل التنقيب في البيانات من اجل استخالص الفائدة‬
‫واملعرفة من هذه البيانات‪.‬‬
‫‪ .2‬الكثير من أدوات التنقيب عن البيانات بدأت تظهر مؤخرا‪ ،‬وكل أداة أفضل من ألاخرى‪.‬‬
‫‪ .2‬املنافسة الشديدة املوجودة في السوق تدفع الشركات إلى الاستفادة القصوى من البيانات التي بيدها‪ .‬عمليات التنقيب في‬
‫البيانات تفعل ذلك تماما‪.‬‬
‫ذكاء ألاعمال (‪)Business Intelligence‬‬
‫هي عبارة عن نظريات ومنهجيه وعمليات وخصائص وتقنيات تقوم على تحويل البيانات ألاولية إلى معلومات مفيدة ذات‬
‫معنى ألغراض ألاعمال‪ .‬له القدرة على التعامل مع أعداد هائلة من املعلومات ملساعدة املؤسسات في تحديد وتطوير الفرص التجارية‬
‫الجديدة‪ ،‬والاستفادة من الفرص الجديدة وتنفيذ استراتيجية فعالة‪.‬‬
‫تكنولوجيات ذكاء ألاعمال توفر آراء تاريخية وحالية وتنبؤيه لعمليات ألاعمال‪ .‬املهام املشتركة لتكنولوجيات ذكاء ألاعمال هي‬
‫إلابالغ وتحليالت ‪ OLAP‬واستخراج البيانات وإدارة عمليات ألاعمال ومعايير القياس واستخراج نص وتحليالت تنبؤيه‪.‬‬
‫غالبا ما تهدف إلى دعم أفضل ألعمال ُ‬ ‫ً‬
‫صنع القرار‪ .‬ولذلك نظام ذكاء ألاعمال يمكن أن يسمى نظام دعم القرار‬ ‫ذكاء ألاعمال‬
‫‪.DSS‬‬
‫محتويات‬
‫‪ 7 ‬نظرة تاريخية‬
‫‪ 3 ‬ذكاء ألاعمال كعملية‬
‫‪ 2 ‬ذكاء ألاعمال كتكنولوجيا‬
‫‪ 2 ‬أنظمة ذكاء ألاعمال و تخزين البيانات‬
‫‪ 1 ‬ذكاء وتحليالت ألاعمال‬
‫‪ 6 ‬الذكاء التنافس ي‬
‫‪ 1 ‬مستقبل ذكاء ألاعمال‬
‫نظرة تاريخية‬
‫في مقال نشر عام ‪ ،7511‬استخدم باحث أي بي إم هانز بيتر لين مصطلح ذكاء ألاعمال‪ .‬لقد عرفت الذكاء على النحو التالي‬
‫«القدرة على القبض على العالقات املتبادلة للوقائع املقدمة في مثل هذا النحو لتوجيه العمل نحو الهدف املنشود»‪.‬‬
‫هوارد دريسنير في عام ‪ 7515‬في وقت الحق محلل مجموعة غارتنر (‪ )Gartner‬اقترح ذكاء ألاعمال كمصطلح مظلة لوصف‬
‫«مفاهيم وأساليب لتحسين عملية اتخاذ القرار باستخدام الواقع القائم على نظم الدعم»‪ .‬لم يكن هذا حتى أواخر عام ‪7551‬‬
‫حيث أن هذا الاستخدام أصبح منتشر على نطاق واسع‪.‬‬
‫ذكاء ألاعمال كعملية‬
‫ً‬
‫هي عملية مستمرة أي أن املؤسسة تجمع بشكل مستمر‪ ،‬تسجل وتحلل بيانات وفقا ألهداف معينة وتستخدم النتائج في‬
‫عملية اتخاذ القرار لتحسين أداء املؤسسة‪.‬‬
‫ذكاء ألاعمال كتكنولوجيا‬
‫هي مجموعة من التقنيات في تكنولوجيا املعلومات تعطي ذكاء ألاعمال مضمون وشكل في املؤسسات‪ .‬بالعموم هي العمليات‪،‬‬
‫الاستراتيجيات‪ ،‬الثقافة‪ ،‬ألادوات‪ ،‬الهيكلة‪ ،‬املعايير والتقنيات التي تنتج عنها أداء أكثر ذكاء للمؤسسات‪.‬‬
‫أنظمة ذكاء ألاعمال و تخزين البيانات‬
‫ً‬
‫تحديات حقيقية في استخدام البيانات املتوفرة في دعم القرار‪ .‬كثيرا ما تستخدم‬
‫تواجه املؤسسات في جميع أنحاء العالم ِّ‬
‫تطبيقات ذكاء ألاعمال البيانات التي تم جمعها من مخزن البيانات‪ .‬ومع ذلك‪ ،‬ليس كل مخازن البيانات ُمستخدمة لذكاء ألاعمال وال‬
‫جميع تطبيقات ذكاء ألاعمال تتطلب مخزن بيانات‪ .‬وأهم هذه التحديات في استخراج املؤشرات التجارية تتلخص في ما يلي‪:‬‬
‫­ تخزين البيانات في ملفات و قواعد بيانات متعددة وغير املترابطة مع بعضها البعض‪.‬‬
‫­ ربط البيانات املتعددة املصادر لتوفير رؤية موحدة ومتكاملة عن بيانات املؤسسة‪.‬‬
‫­ القدرة على متابعة تنفيذ الاستراتيجيات و الخطة املوضوعة من واقع البيانات و املؤشرات‪.‬‬
‫ً‬
‫­ جودة البيانات لغايات التحليل وخصوصا التاريخية منها‪.‬‬
‫­ عدم استخدام العرض و التصميم املناسب لكل مؤشر وإحصائية من خالل الرسومات البيانية وربط ذلك بقواعد‬
‫البيانات‪.‬‬
‫ذكاء وتحليالت ألاعمال‬
‫ُ‬
‫توماس دافنبورت جادل بأن ذكاء ألاعمال يجب أن تقسم إلى الاستعالم وإلابالغ و‪ ،OLAP‬أداة تنبيهات وتحليل ألاعمال‪.‬‬
‫ً‬
‫تحليل ألاعمال هو عبارة عن فرع من املعرفة التي تعرف احتياجات ألاعمال وتحدد الحلول ملشاكلها‪ .‬الحلول غالبا ما تشمل‬
‫النظام‪ ،‬وكما أنها يمكن أن تتكون من تحسينات عملية أو تغيرات تنظيمية‪ .‬والشخص الذي يقوم بهذه املهمة يسمى‬ ‫عنصر تطوير ِّ‬
‫محلل ألاعمال‪.‬‬
‫محللو ألاعمال الذين يعملون فقط على تطوير أنظمة البرمجيات يمكن أن يطلق عليهم محللو تكنولوجيا املعلومات التجارية‬
‫أو محللو ألاعمال التقنيون أو محللو ألانظمة‪.‬‬
‫الذكاء التنافس ي‬
‫ً‬
‫مصطلح ذكاء ألاعمال غالبا ما تستخدم كمرادف للذكاء التنافس ي‪.‬‬
‫مستقبل ذكاء ألاعمال‬
‫ورقة غارتنر عام ‪ 3115‬تتوقع هذه التطورات في سوق ذكاء ألاعمال‪:‬‬
‫­ بسبب فقر املعلومات والعمليات وألادوات‪ ،‬خالل عام ‪ ،3173‬أكثر من ‪ 21‬في املائة من أعلى ‪ 1111‬شركه عاملية سوف‬
‫تفشل بانتظام في اتخاذ القرارات الثاقبة عن التغييرات الكبيرة في أعمالهم وأسواقهم‪.‬‬
‫­ بحلول عام ‪ ،3173‬سوف تحكم وحدات ألاعمال ما ال يقل عن ‪ 21‬في املائة من مجموع امليزانية لذكاء ألاعمال‪.‬‬
‫­ بحلول عام ‪ 31 ،3171‬في املائة من املنظمات سيكون لديها صناعه تطبيق تحليلي محدد ُمستلم عن طريق البرمجيات‬
‫كخدمة كعنصر داعم مللف ذكاء ألاعمال‪.‬‬
‫­ في عام ‪ ،3115‬اتخاذ قرار تعاوني سوف يبرز كفئة منتج جديد الذي يجمع بين البرامج الاجتماعية مع منصة قدرات ذكاء‬
‫ألاعمال‪.‬‬
‫ُ‬
‫­ بحلول عام ‪ ،3173‬ثلث التطبيقات التحليلية املطبقة على عمليات ألاعمال سوف ترسل من خالل ردئ مزج تطبيق‬
‫الحبيبات‪.‬‬
‫أدوات ذكاء ألاعمال ‪Business Intelligence Tools‬‬
‫تملك أغلب املؤسسات كميات كبيرة من البيانات موزعة ضمن مخازن بيانات متنوعة‪ ،‬مثل قواعد البيانات‪ ،‬ووثائق بصيغ‬
‫مختلفة مثل ‪ Word Excel‬و ‪ PDF‬وغيرها من املستودعات في مختلف فروع وأقسام املؤسسة‪ .‬إن وجود تطبيقات بأنواع مختلفة‬
‫ً‬
‫يجعل استخراج املعلومات وتحليلها أمرا في غاية الصعوبة‪.‬‬
‫ً‬
‫يعني التعبير «ذكاء ألاعمال ‪ ،«Business Intelligence‬الذي يشار له باملختصر ‪ ،BI‬مجمل ألادوات وألانظمة التي تؤدي دورا‬
‫ً‬
‫رئيسيا في عمليات التخطيط الاستراتيجي للمؤسسة‪ .‬يسمح ذكاء ألاعمال للمؤسسة بتجميع البيانات وتخزينها وتحليلها بهدف‬
‫ُ‬
‫ظهر هذه ألانظمة وألادوات ذكاء ألاعمال في مجاالت مثل فرز الزبائن ودعمهم وتقسيم السوق وأبحاث‬ ‫املساعدة على اتخاذ القرار‪ .‬ت ِّ‬
‫السوق وعائدية املنتجات والتحليل إلاحصائي وتحليل التوزيع والجرد‪.‬‬
‫سنتطرق في هذا املقال إلى ألادوات املستخدمة في بناء تطبيقات ذكاء ألاعمال‪ ،‬معددين أنواعها وشارحين باختصار بعض‬
‫هذه ألادوات من كل نوع‪.‬‬
‫أ‪ -‬أنواع أدوات ذكاء ألاعمال‬
‫ً‬
‫إن أدوات ذكاء ألاعمال هي برمجيات تطبيقية مصممة لتحليل وعرض البيانات وبناء التقارير‪ .‬تقرأ ألادوات عادة البيانات‬
‫ً‬
‫املخزنة سلفا ضمن مستودعات ومخازن البيانات‪ .‬يمكن تصنيف أدوات ذكاء ألاعمال في عدد من الفئات الرئيسية‪:‬‬
‫­ برمجيات الجداول ‪.Spreadsheets‬‬
‫­ برمجيات توليد التقارير ‪.Reporting Software‬‬
‫­ برمجيات التحليل آلاني ‪.OLAP‬‬
‫­ لوحات القيادة ‪.Dashboard‬‬
‫­ التنقيب في البيانات ‪.Data Mining‬‬
‫­ هندسة القرارات ‪.Decision Process‬‬
‫­ التنقيب في إلاجراءات ‪.Process Mining‬‬
‫­ إدارة أداء ألاعمال ‪.Business Performance Management‬‬
‫­ نظم املعلومات املحلية ‪.Local Information Systems‬‬
‫تباع هذه ألادوات‪ ،‬ما عدا برمجيات الجداول‪ ،‬كأدوات منفصلة أو كطقم أدوات أو كجزء من أنظمة تخطيط موارد‬
‫املؤسسات ‪ ERP‬أو كمكونات لبرمجيات مخصصة‪.‬‬
‫سنتحدث فيما يلي عن بعض هذه املنتجات‪ ،‬مصنفين إياها من حيث رخصة الاستخدام وفتح مصادر رمازها‪.‬‬
‫ب‪ -‬منتجات مفتوحة املصدر مجانية‬
‫‪ .1‬مشروع ‪Eclipse BIRT‬‬
‫بيرت ‪ BIRT‬هو نظام لتوليد تقارير‪ ،‬وهو مفتوح املصدر ومعتمد على إكليبس ‪ Eclipse‬للتطبيقات املعتمدة على الوب‪،‬‬
‫ً‬
‫وخاصة تلك املعتمدة على جافا ‪ Java‬وتقنية‪ .J2EE.‬يحوي بيرت مكونين رئيسيين‪ :‬مصمم تقارير معتمدا على إكليبس‪ ،‬ومكون تشغيل‬
‫ً‬
‫‪ runtime‬يمكن إضافته إلى مخدم التطبيقات‪ .‬كما يقدم بيرت محركا للرسوم البيانية يسمح بإضافة املخططات والرسوم إلى‬
‫التطبيقات‪.‬‬
‫يمكن باستخدام بيرت إضافة العديد من التقارير إلى التطبيقات نذكر من أنواعها‪ :‬اللوائح ‪،Lists‬واملخططات‬
‫‪،Charts‬واملصفوفات‪، Crosstabs‬والوثائق والرسائل والتقارير املركبة من مجمل هذه ألانواع‪.‬‬
‫‪ .2‬ألاداة ‪Jasper Soft‬‬
‫إن طقم أدوات جاسبر سوفت لذكاء ألاعمال هي برمجيات مفتوحة املصدر‪ ،‬تتضمن برمجيات خاصة بتوليد التقارير‬
‫ولوحات القياس ‪ Dashboards‬والتحليل ومكاملة البيانات‪ ،‬وهي متوفرة كحزمة برمجية متكاملة أو كتطبيقات منفصلة يمكن‬
‫ً‬ ‫تنصيبها َ‬
‫وحدها ثم دعمها بالتطبيقات ألاخرى مستقبال‪.‬‬
‫ً‬
‫يتوفر الرماز ألاساس ي لهذه البرمجيات مجانا بحيث يمكن للمستخدم مواءمة البرمجيات لتناسب عمله‪ .‬جاسبر ريبورتس‬
‫‪Jasper Reports‬هو أحد هذه التطبيقات وهو مكتبة إعداد تقارير مفتوحة املصدر مكتوبة بلغة جافا تسمح بتصدير التقارير إلى‬
‫ً‬ ‫ً‬
‫العديد من الصيغ‪ ،‬ويمكن دمجها في التطبيقات املهيئة لجافا ومنها تطبيقات الوب‪ ،‬بحيث تولد محتوى ديناميكيا‪ .‬هنالك أيضا‬
‫توسعة تسمح باستخدام ‪ PL/SQL‬الخاصة بأوراكل‪.‬‬
‫ً‬ ‫ً‬ ‫ً‬
‫رخصة النظام املفتوح حاليا هي من النوع ‪ LGPL‬وهنالك أيضا عدد من البرمجيات التجارية املطورة اعتمادا على جاسبر‬
‫ريبورتس‪.‬‬
‫‪ .3‬ألاداة ‪Rapid Miner‬‬
‫رابيد ماينر ‪ Rapid Miner‬هو بيئة مفتوحة املصدر إلجراء الاختبارات في مجال تعلم آلالة والتنقيب في البيانات‪ ،‬فهي تسمح‬
‫ببناء عدد ضخم من املؤثرات (الخطوات التحليلية) ضمن توصيف ‪ ،XML‬ويمكن بناء هذه ألاخيرة باستخدام واجهة رابيد ماينر‬
‫ُ‬
‫البيانية‪ .‬تستخدم رابيد ماينر في مجال ألابحاث والعالم الحقيقي للتنقيب في البيانات‪.‬‬
‫طورت وحدة الذكاء الصنعي في جامعة دورتموند ألامريكية النسخة ألاولى عام ‪ 2001‬وهي توزع تحت الرخصة ‪AGPL‬‬
‫ويستضيف املوقع ‪ Source Forge‬املشروع منذ عام ‪ .3112‬املشروع مطور باستخدام لغة البرمجة جافا‪ ،‬وهو من ثم يعمل على‬
‫أغلب نظم التشغيل املعروفة‪.‬‬
‫من ميزات رابيد ماينر نذكر املجموعة الواسعة من خوارزميات التنقيب في البيانات‪ ،‬مثل أشجار القرارات والخرائط الذاتية‬
‫التنظيم‪ ،‬وكذلك ألاشكال البيانية املعقدة واملتطورة‪ ،‬مثل ألاشكال الشجرية والنقاط املبعثرة الثالثية ألابعاد واملكعبات البيانية‬
‫املتداخلة‪ ،‬إضافة إلى العديد من املقابس ‪ plugins‬مثل مقبس تحليل النصوص‪.‬‬
‫‪ .4‬ألاداة ‪Spago BI‬‬
‫ُ‬ ‫ً ً‬
‫سباغو بي آي ‪ Spago BI‬هي منصة تكامل لذكاء ألاعمال مطورة كليا وفقا ملفهوم البرمجيات الحرة املفتوحة املصدر‪ .‬تعتبر‬
‫َ‬
‫سباغو بي آي منصة‪ ،‬ألنها تحقق كافة متطلبات ذكاء ألاعمال من ناحيتي تحليل وإدارة البيانات‪ ،‬فهي تقدم وظائف مثل إعداد‬
‫ً‬
‫التقارير والتحليل املتعدد ألابعاد ‪ MOLAP‬والتنقيب في البيانات ولوحات القياس والاستفسارات املخصصة‪ .‬ولديها أيضا أدوات‬
‫الستخراج وتحويل وتحميل البيانات ‪ ETL‬إضافة إلى دعم عمل مدير النظام من ناحية صيانة الوثائق التحليلية وإدارة النسخ‬
‫ً‬
‫والتحكم بتدفق ألاعمال‪ .‬سباغو بي آي ‪ Spago BI‬هي مفتوحة املصدر وحرة كليا وال يوجد منها نسخ متعددة أو مجتزءات تجارية‪.‬‬
‫ج‪ -‬منتجات مفتوحة املصدر تجارية‬
‫‪ .7‬ألاداة ‪Palo‬‬
‫ً‬ ‫ُ‬
‫بالو ‪ Palo‬هي مخدم قواعد بيانات متعدد ألابعاد ‪ MOLAP‬ويستخدم عادة كأداة لذكاء ألاعمال في مجال الضبط وإدارة‬
‫امليزانيات‪ ،‬وذلك عبر واجهة استخدام مشابهة لبرمجيات الجداول ‪ Spreadsheet‬وإضافة إلى مفهوم البيانات املتعددة ألابعاد‬
‫يسمح بالو لعدة مستخدمين بالتشارك في مخزن بيانات واحد‪ .‬بالو متاح كبرمجيات مفتوحة املصدر وكذلك كبرمجيات مغلقة‬
‫املصدر‪ .‬يتمتع بالو بعدد من إلاضافات املفتوحة املصدر مثل بالو الخاص باألكسل ‪ Palo for Excel‬وإلاضافة ‪ PalOO Ca‬الخاصة‬
‫بأوبن أوفيس ‪ .Open Office org‬يمكن دمج بالو في أنظمة أخرى عبر مكتبات خاصة بجافا و ‪ PHP‬و ‪ C/C++‬و‪.NET‬‬
‫‪ .3‬ألاداة ‪Pentaho‬‬
‫ً‬ ‫ً‬
‫يوفر طقم أدوات بينتاهو ‪ Pentaho‬الخاص بذكاء ألاعمال طيفا كامال من إمكانات ذكاء ألاعمال التي تتضمن الاستفسار‬
‫وتوليد التقارير والتحليل التفاعلي ولوحات القياس ‪ Dashboards‬وتكامل البيانات وتقنية الاستخراج‪/‬التحويل‪/‬التحميل ‪ETL‬‬
‫والتنقيب في البيانات‪ ،‬إضافة إلى كونها منصة لذكاء ألاعمال جعلتها من أهم برمجيات ذكاء ألاعمال املفتوحة املصدر‪ .‬يتألف طقم‬
‫بينتاهو من عدة أجزاء يمكن انتقاؤها كحزمة واحدة أو مفردة وهي‪ :‬مولد التقارير ‪ Pentaho Reporting‬ومحلل ‪Pentaho Analysis‬‬
‫ولوحات القياس ‪ Pentaho Dashboards‬وأداة التنقيب في البيانات ‪.Pentaho Data Mining‬‬
‫د‪ -‬منتجات تجارية حرة‬
‫‪ .1‬البرمجية ‪Freereporting.com‬‬
‫ً‬
‫إن فريريبورتينج ‪ Freereporting.com‬هي برنامج لتقارير ذكاء ألاعمال ُيدار اعتمادا على الوب‪ ،‬وهو مطور من قبل ‪Logi‬‬
‫‪ XML‬ومتاح بدون تكلفة تحت الرخصة‪ OEM .‬النسخة املجانية تقدم ميزات أساسية في البرنامج وهنالك نسخة تجارية كاملة‬
‫ً‬
‫املواصفات‪ .‬تستخدم واجهة التخاطب املعتمدة على الوب في النسخة املجانية تقارير جدولية ومخططات ورسوما بيانية‪ ،‬وتسمح‬
‫ً‬
‫بتجميع البيانات ووضعها في صفحات وترتيبها مع إمكان التغلغل في البيانات‪ .‬أما ميزات ذكاء ألاعمال ألاكثر تطورا‪ ،‬مثل لوحات‬
‫القياس وشبكة التحليل ومعاين البيانات التفاعلي‪ ،‬فهي غير متاحة في النسخة املجانية ولكنها متاحة في النسخة التجارية‪.‬‬
‫‪ .2‬ألاداة ‪Style Intelligence‬‬
‫ً‬
‫تطور شركة آينتسوفت تكنولوجي ‪ InetSoft Technology‬تطبيقات ذكاء ألاعمال املعتمدة على الوب‪ .‬تملك آينتسوفت منتجا‬
‫ً‬
‫وحيدا هو ستايل إنتليجنس ‪ Style Intelligence‬بإصدارات متعددة تركز على ذكاء ألاعمال العملياتي‪ ،‬ومعاينة البيانات‪ ،‬وتقارير‬
‫ألاعمال ومحرك تقارير قابل للتضمين‪.‬‬
‫يشمل التطبيق أدوات لتوليد التقارير ولوحات القياس والتحليل املرئي وبطاقات التسجيل ‪ ،Scorecards‬ثم إن الشركة‬
‫توفر البرمجيات كخدمات‪.‬‬
‫تعتمد منتجات آينتسوفت على املعايير املفتوحة مثل ‪ XML‬و ‪ SOAP‬ولغة جافا‪ .‬تعتمد رخصة آينتسوفت على وحدة‬
‫ً‬
‫املعالجة بدال من املستخدم‪.‬‬
‫‪ .2‬ألاداة ‪Micro Strategy‬‬
‫شركة ميكرو ستراتيجي ‪ Micro Strategy‬هي شركة مطورة لبرمجيات ذكاء ألاعمال وإعداد تقارير الشركات والتحليل آلاني‪،‬‬
‫أدوات إلعداد التقارير وتحليل البيانات املخزنة في قواعد بيانات عالئقية ‪ ROLAP‬وقواعد بيانات متعددة ألابعاد‬
‫ٍ‬ ‫إذ توفر برمجياتها‬
‫‪MOLAP‬أو حتى في ملفات نصية‪.‬‬
‫آخر نسخة من برمجياتها هي ‪ Micro strategy 9‬ولديها نسخة خاصة بآي فون ‪ iPhone‬وآيباد ‪ iPad‬تدعى مايكرو ستراتيجي‬
‫موبايل‪ .‬تقدم الشركة طقم برمجيات إعداد التقارير ‪ Micro Strategy Reporting‬كبرمجيات تجارية حرة تسمح بتطوير التقارير‬
‫التشغيلية والتحليلية‬
‫ه‪ -‬منتجات تجارية‬
‫ً‬
‫إضافة إلى املنتجات املذكورة سابقا‪ ،‬هنالك العديد من منتجات ذكاء ألاعمال التجارية واملغلقة املصدر‪ .‬ولكثرة هذه‬
‫املنتجات‪ ،‬سنعرض ملحة إلى بعض هذه ألادوات املشهورة‪.‬‬
‫‪ .1‬ألاداة ‪IBM Cognos‬‬
‫ً‬ ‫ً‬
‫توفر النسخة ‪ 1‬من البرمجية كونيوس ‪ Cognos‬من أي بي إم طيفا كامال من إمكانات ذكاء ألاعمال‪ :‬توليد التقارير والتحليل‬
‫ولوحات القياس ‪ Dashboards‬وبطاقات التسجيل على بنية خدمات موجهة واحدة‪.‬‬
‫‪ .2‬ألاداة ‪SQL Server Analysis Services‬‬
‫إن خدمات التحليل من مايكروسوفت ‪ Microsoft Analysis Services‬هي جزء من مخدم قواعد البيانات ‪ SQL Server‬فقد‬
‫ً‬
‫ضمنت مايكروسوفت عددا من الخدمات ضمن مخدم ‪ SQL Server‬تتعلق بذكاء ألاعمال ومستودعات البيانات‪ .‬تتضمن هذه‬
‫الخدمات التكامل والتحليل‪ ،‬وتتضمن ألاخيرة إمكانات معالجة التحليل آلاني ‪ OLAP‬والتنقيب في البيانات‪ .‬تتخذ خدمات تحليل‬
‫ً‬ ‫ً‬
‫مايكروسوفت موقفا حياديا من النقاش بين ‪ MOLAP‬و ‪ ،ROLAP‬فهي توفر كافة النكهات من ‪ MOLAP‬املتعدد ألابعاد و ‪ROLAP‬‬
‫العالئقي و ‪ HOLAP‬الهجين‪.‬‬
‫‪ .3‬أدوات ‪SAS Institute‬‬
‫إن النظام ساس ‪ SAS‬هو نظام متكامل من املنتجات البرمجية املطورة من قبل معهد ساس ‪ SAS Institute.‬يسمح النظام‬
‫للمبرمجين بعمليات مثل إدخال البيانات واستخراجها ومعالجتها والتنقيب فيها‪ ،‬إضافة إلى توليد التقارير والرسوم البيانية‬
‫والتحليل إلاحصائي وتخطيط ألاعمال ودعم القرار وبحوث العمليات وغيرها‪.‬‬
‫‪ .4‬ألاداة ‪Oracle Business Intelligence Suite Enterprise Edition‬‬
‫إن النسخة ‪ 11g‬من إصدار ذكاء ألاعمال للمؤسسات من أوراكل ‪Oracle Business Intelligence Enterprise Edition 11g‬‬
‫ً‬ ‫ً‬
‫)‪ (OBIEE‬هي منصة شاملة لذكاء ألاعمال التي توفر مجاال كامال من ميزات توليد التقارير وتحليل البيانات وبطاقات التسجيل‬
‫ولوحات القياس والتحليل املخصص والتحليل آلاني‪.‬‬
‫‪ComArch‬‬ ‫‪COA Solutions‬‬ ‫‪Bime‬‬
‫‪Decision Support Panel‬‬ ‫‪Data Applied‬‬ ‫‪CyberQuery‬‬
‫‪IBM Applix‬‬ ‫‪HP Neoview‬‬ ‫‪Dimensional Insight‬‬
‫‪IBM SPSS‬‬ ‫‪IBM Cognos‬‬
‫‪Informatica‬‬ ‫‪InetSoft‬‬ ‫‪IDV Solutions Visual Fusion‬‬
‫‪Izenda‬‬ ‫‪InfoZoom‬‬ ‫‪Information Builders‬‬
‫‪LogoXML‬‬ ‫‪Klipfolio Dashboard‬‬ ‫‪Jreport‬‬
‫‪Microsoft PerfomancePoint‬‬ ‫‪Microsoft SQL Server Analysis‬‬ ‫‪Microsoft SQL Server Reporting‬‬
‫‪Server 2007‬‬ ‫‪Services‬‬ ‫‪Services‬‬
‫‪m-Power‬‬ ‫‪MicroStrategy‬‬ ‫‪Microsoft Proclarity‬‬
‫‪Oracle Business Intelligence Suite‬‬
‫‪Hyperion Solutions Corporation‬‬ ‫‪Oracle Corporation‬‬
‫‪Enterprise Edition‬‬
‫‪Pervasive DataRush‬‬ ‫‪Pentaho‬‬ ‫‪Panorama Software‬‬
‫‪Qliktech‬‬ ‫‪PRELYTIS‬‬ ‫‪Pilot Software, Inc‬‬
‫‪SAP Business Information‬‬
‫‪OutlookSoft‬‬ ‫‪Business Objects‬‬
‫‪Warehouse‬‬
Sportfire(now Tibco) Siebel Systems SAS Institute
Tableau Software Sybasse IQ StarSoft
XLCubed Thomson Data Analyzer Teradata

You might also like