Professional Documents
Culture Documents
Data Mining and Forcasting
Data Mining and Forcasting
من املؤكد أن التنقيب في البيانات Data miningهو من املوضوعات بالغة ألاهمية .وإال ما الذي يجعلها أحد املوضوعات
ً
ألاكثر أهمية لرئيس الواليات املتحدة أوباما Obama؟ فاملتتبعون لنشاط رئيس الدولة ألاكثر تحكما في العالم سيعرفون أنه بتاريخ
71ديسمبر ،3172كان في لقاء مع قيادات تقنية املعلومات والذين كان منهم Tim Cookمن شركة أبل Appleو Eric Schmidtمن
جوجل وكذلك املدراء التنفيذيين لكل من ،Yahoo! ،Dropbox ،Etsy ،Netflix ،Salesforce ،Facebook ،Microsoft ،Twitter
!!!LinkedIn ،Comcast ،Sherpa Global ،Zyngaوذلك ملناقشة موضوع التنقيب في البيانات .كما أنه في خطاب له بتاريخ 71يناير
3172عاود من جديد طرح املوضوع من خالل الدعوة إلى إجراء إصالحات في نظام التنقيب عن البيانات .ذلك يؤكد الاهتمام الذي
يتم إيالءه ملوضوع التنقيب في البيانات على املستوي الدولي والعالمي.
ماذا يعني التنقيب عن البيانات
أدى الانتشار الواسع لتقنية املعلومات وسهولة إتاحتها إلى تضخم حجم املعلومات بصورة استباقية لم يشهدها التاريخ من
ً
قبل ،مما جعل من قضية البيانات الضخمة على إلانترنت مثارا للجدل ،من حيث جدوى وجودها بهذه الصورة العشوائية .وعندما
نتحدث عن البيانات الضخمة ،فإننا نتحدث عن كميات ال يمكن تخيلها من البيانات املتعددة ألانواع واملصادر بججم يصل إلى
املئات من التيرابايت أو حتى البيتابايت (البيتابايت هو الرقم واحد متبوعا بـ 71صفر) .كما أن شركة IBMتتحدث عن 3.1
كوينتيليون بايت من البيانات كل يوم (الكوينتيليون هو الرقم واحد متبوعا بـ 71صفرا) .معلومات في كل مكان وفي موضوعات شتى.
ً وهنا نتساءل ما أهمية هذه البيانات في ظل وجود حقيقة تشير إلى أن املعلومات املنظمة من هذه البيانات ال تشكل إال ً
جزء ضئيال
يصل إلى %71مقارنه باملعلومات غير املنظمة والتي تشكل الباقي .ذلك أدى إلى ازدياد الحاجة إلى تطوير أدوات تمتاز بالقوة لتحليل
البيانات واستخراج املعلومات واملعارف منها ،فاألساليب التقليدية وإلاحصائية ال تستطيع أن تتعامل مع هذا الكم الهائل لذا
تستخدم أدوات ذكية ملعالجة هذه البيانات.
من هنا ظهر ما يسمى باستخراج البيانات Data Miningكتقنية تهدف إلى استنتاج املعرفة من كميات هائلة من البيانات،
تعتمد على الخوارزميات الرياضية والتي تعتبر أساس التنقيب عن البيانات وهي مستمدة من العديد من العلوم مثل علم إلاحصاء
والرياضيات واملنطق وعلم التعلم ،والذكاء الاصطناعي والنظم الخبيرة ،وعلم التعرف على ألانماط ،وعلم آلالة .وغيرها من العلوم
التي تعتبر من العلوم الذكية وغير التقليدية.
ظهر التنقيب في البيانات ( )Data miningفي أواخر الثمانيات وأثبت وجوده كأحد الحلول الناجحة لتحليل كميات ضخمة
قيمة يمكن استغاللها و الاستفادة من البيانات ،وذلك بتحويلها من مجرد معلومات متراكمة وغير مفهومة (بيانات) إلى معلومات ِّ
منها بعد ذلك.
وقد اجتذبت مرحلة التنقيب في البيانات الكثير من الاهتمام في ألاوساط البحثية على مدى العقد املاض ي ،في محاولة
لتطوير خوارزميات قابلة للتوسع والتكيف مع كميات متزايدة من البيانات في البحث عن أنماط معرفية ذات معنى .وقد نمت حزم
من الخوارزميات والبرمجيات و بشكل كبير خالل العقد املاض ي ،إلى حد أن التوسع قد جعل من الصعب على العاملين في هذا
الحقل تتبع التقنيات املتاحة لحل مهمة معينة.
ولكن ما أذهلني عند البحث عن تعريفات ملفهوم التنقيب في املعلومات ،الكم الهائل من التعريفات لهذا املفهوم .فموقع
ً
مؤسسة IGI Globalيقدم 13تعريفا ملفهوم التنقيب في البيانات .وبعد املرور على جميع هذه التعريفات ،تم اختيار التعريفات
التالية:
ً
عملية البحث داخل كميات كبيرة من البيانات للكشف عن العالقات التي لم يتم كشفها سابقا بين عناصر البيانات،
واملعروفة أيضا باسم اكتشاف املعرفة في قواعد البيانات (.)KDD
هي النشاط الذي يقوم باستخراج املعلومات املتواجدة في كميات كبيرة من البيانات ،بهدف البحث عن أنماط معرفية
واكتشاف الحقائق الخفية الواردة في قواعد البيانات.
هي عملية تحليل البيانات لتحديد العالقات التي لم تكتشفها التحليالت السابقة من قبل .كما أنها تحليل البيانات إلقامة
عالقات وتحديد أنماط.
تحليل البيانات املتواجدة في قواعد البيانات باستخدام ألادوات التي تبحث عن الاتجاهات أو البيانات التي ال معنى لها،
ً
واستخراج معلومات ضمنية ،لم تكن معروفة سابقا ،ويمكن أن تكون مفيدة.
عملية استخراج أنماط معرفية من مجموعات البيانات الكبيرة من خالل الجمع بين ألاساليب من إلاحصاءات والذكاء
الاصطناعي مع إدارة قواعد البيانات.
هو خطوة واحدة في اكتشاف املعرفة داخل قواعد البيانات ( )KDDحيث تستخدم أساليب التحليل مثل :الشبكات
العصبية Neural Networksأو الخوارزميات الجينية Genetic Algorithmsأو شبكة القرارات Decision Trees
والتقنية والنماذج الهجينة Hybrid Modelsلتحديد ألانماط والعالقات في مجموعات البيانات.
عملية اكتشاف املعرفة في قواعد البيانات عن طريق تحديد ألانماط والاتجاهات في البيانات التي تم جمعها باستخدام
طرق مختلفة مثل :التصنيف Classificationأو التحليل التسلسلي Sequential analysisأو العنقدة (التجميع)
clusteringأو قواعد الارتباط .Association Rule
عملية يتم من خاللها فرز كميات كبيرة من البيانات بهدف استخالص املعلومات ذات الصلة .ويستخدم هذا املصطلح
على نحو متزايد في العلوم الستخراج املعلومات من مجموعات البيانات الهائلة الناتجة عن الطرق التجريبية والرصدية
الحديثة ،والسيما في سياق الحقول البيولوجية.
عملية الاختيار ،والاستكشاف ،ووضع نماذج لكميات كبيرة من البيانات الكتشاف الاطراد أو العالقات املجهولة بهدف
الحصول على نتائج واضحة ومفيدة ملالك قاعدة البيانات.
فرع من علوم الكمبيوتر ،يهتم باستخراج أنماط من مجموعات البيانات الكبيرة من خالل الجمع بين التحليل إلاحصائي
والذكاء الاصطناعي مع إدارة قواعد البيانات .ويعتبر استخراج البيانات كأداة ذات أهمية متزايدة من قبل رجال ألاعمال
ً
الحديثة لتحويل البيانات إلى معلومات إلعطاء ألاعمال ميزة إعالمية .ويستخدم حاليا في مجموعة واسعة من ممارسات
التنميط ،مثل التسويق ،واملراقبة ،والكشف عن الغش ،واختيار شريك تجاري.
فرع مهم في الصناعة والسوق ،واسترجاع املعلومات الهامة من كمية هائلة من البيانات ،ويستخدم عادة مع كمية هائلة
ً
من البيانات غير املتجانسة ،حيث استخدام أجهزة الكمبيوتر أمرا ال مفر منه.
ً
في اللغة الشائعة ،غالبا ما يتم إلاشارة إلى التنقيب عن البيانات بصفة عامة إلى فكرة التحقيق بعمق في جبال من
ً
البيانات .هذا الاستخدام غير الرسمي لهذا املصطلح عادة ما يستخدم القليل من التقنيات للقيام بالتحقيق .في املقابل،
ً
فإن الاستخدام الرسمي لهذا املصطلح يشير تحديدا إلى استخدام التقنيات الحاسوبية للكشف عن أنماط في مجموعات
البيانات الضخمة .تتنوع هذه التقنيات ما بين ألاساليب إلاحصائية إلى الذكاء الاصطناعي ،ومجموعات التحقق
واستخراج البيانات ،وهي متنوعة ومتزايدة أكثر من أي وقت مض ى.
عملية تقنية تستخدم خوارزميات لتحليل البيانات من وجهات نظر متعددة واستخراج أنماط ذات معنى والتي يمكن
استخدامها للتنبؤ بالسلوك املستقبلي للمستخدمين .نظام تحليل سلة السوق الذي يستخدمه Amazon.comيوص ي
بمنتجات جديدة لعمالئها على أساس مشترياتهم املاضية ،وهو مثال معروف على نطاق واسع للكيفية التي يمكن أن
تستخدم التنقيب عن البيانات في مجال التسويق.
عملية اكتشاف الارتباطات ذات املغزى ،وألانماط ،والاتجاهات بالنخل من خالل كميات كبيرة من البيانات املخزنة في
املستودعات ،وذلك باستخدام تقنيات التعرف على ألانماط وكذلك ألاساليب إلاحصائية والرياضية.
اكتشاف املعرفة في قواعد البيانات هي أنماط معرفية مفهومة يتم استخراجها من مجموعات البيانات الكبيرة املخزنة في
قواعد البيانات Databasesومستودعات البيانات الضخمة .Data warehouses
ً ً
في عام 3117كتب Micheline Kamber & Jiawei Hanعن التنقيب عن البيانات باعتبارها جزءا رئيسا من اكتشاف
املعرفة .التنقيب عن البيانات هو كل ش يء مرتبط باستخراج املعرفة املفيدة من كميات كبيرة من البيانات .إنه العثور
على مجموعة صغيرة من الشذرات الثمينة (املعرفة) من قدر كبير من املواد الخام (البيانات).
ً
هناك مصطلحات أخرى ذات الصلة التي تستخدم أيضا في ألاوراق ألاكاديمية والبحثية للتنقيب عن البيانات ،مثل
التنقيب عن املعرفة ،واستخراج املعرفة ،وأنماط تحليل البيانات ،وعلم آثار البيانات وتحريف البيانات ،ولكن في عالم
ً
ألاعمال عموما مصطلح «التنقيب عن البيانات» هو أكثر شعبية.
التنقيب عن البيانات هو حقل متعدد التخصصات ،يستفيد من املجاالت بما في ذلك تقنية قاعدة البيانات ،الذكاء
الاصطناعي ،والتعلم آلالي ،والشبكات العصبية ،وإلاحصاءات والتعرف على ألانماط ،والنظم القائمة على املعرفة،
واكتساب املعرفة ،واسترجاع املعلومات ،والحوسبة عالية ألاداء والصورة ومعالجة إلاشارات ،وتحليل البيانات املكانية
والبيانات التصورية ( ،)Data Visualizationوالتي تعتمد بشكل كلي على إلادراك البصري.
مراحل اكتشاف املعرفة
اكتشاف املعرفة في قواعد البيانات ( Knowledge Discovery in Database (KDDليس بالعملية السهلة والتي قد يعتقد
ً
البعض أنها تتوقف عند تجميع البيانات وإدارتها ،بل نراها تمتد إلى التحليل والتوقع والتنبؤ بما سيحدث مستقبال.
ً ً
التنقيب في البيانات يشكل جزءا من اكتشاف املعرفة ،Knowledge Discoveryوهذه العملية هي ألاكثر شموال.
تتضمن عملية اكتشاف املعرفة الخطوات التالية:
.1اكتشاف البيانات :Data discoveryوهي مرحلة جمع البيانات وتشمل كشف وتحديد وتوصيف البيانات املتاحة.
.3تصفية البيانات وتنقيتها :Data cleaningويتم في هذه املرحلة إزالة البيانات املزعجة Noiseالتي ال أهمية لها ،كما يتم
حذف البيانات املتضاربة والبيانات الغير متناسقة.
.2تكامل البيانات :Data integrationيتم في هذه املرحلة تجميع البيانات املتشابهة وذات الصلة من مصادر البيانات
املتعددة ودمجها معا.
.2اختيار البيانات :Data selectionفي هذه املرحلة ،يتم تحديد واسترجاع البيانات املالئمة من مجموعة البيانات.
.1تحويل البيانات :Data transformationفي هذه املرحلة يتم تحويل البيانات إلى نماذج مخصصة مالئمة إلجراءات
البحث والاسترجاع بواسطة خالصة إلانجاز أو عمليات التجميع.
.6التنقيب عن البيانات :Data miningأي استخدام طرق ذكية تطبق الستخالص أنماط البيانات استخراج نماذج
مفيدة قدر إلامكان.
.1تقييم النمط :Pattern evaluationيتم في هذه املرحلة تحديد ألانماط املهمة حقا والتي تمثل قاعدة املعرفة
الستخدام بعض املقاييس املهمة.
.1تمثيل املعرفة وتقديمها :Knowledge presentationوهي املرحلة ألاخيرة من مراحل اكتشاف املعرفة في قواعد
البيانات وهي املرحلة التي يراها املستفيد ،هذه املرحلة ألاساسية تستخدم ألاسلوب املرئي ملساعدة املستفيد في فهم و
وتفسير نتائج استخراج البيانات.
وبالتالي التنقيب في البيانات هو خطوة أساسية لتطبيق أساليب ذكية بهدف الكشف عن أنماط البيانات املثيرة لالهتمام
واملخبأة في مجموعات البيانات الكبيرة .ومع ذلك ،في بعض املنظمات نجد أن مصطلح التنقيب عن البيانات « »Data miningأصبح
أكثر شعبية لإلشارة إلى العملية التي يتم فيها اكتشاف املعرفة » «Knowledge Discoveryبرمتها.
ً
وهناك جانب مهم جدا ،يجب النظر إليه بعين الاعتبار و هو أن هناك أنماط جديدة قد تبرز ،عادة ما تكون غير معروفة من
قبل .وبالتالي يجب أن تكون أدوات التنقيب عن البيانات قادرة على البحث عن أنواع مختلفة من ألانماط ،بأشكال متوازية لزيادة
ً
كفاءة التنقيب عن البيانات .كما يجب أيضا أن يتم الكشف عن ألانماط في ألاجزاء الصغيرة والفرعية ،والتي تعرف بالحبيبات
،Granularitiesمما يعني البحث في مستويات مختلفة من التجريد أو التفصيل .حلول التنقيب عن البيانات الجيدة هي التي تشير
ً
أيضا إلى قدر من الثقة أو اليقين املرتبطة مع نمط اكتشافها ،ألن بعض ألانماط قد ال تصلح لكافة البيانات في مجموعة البيانات
التي تم تحليلها.
استخدامات التنقيب عن البيانات
في ضوء املفهوم العام للتنقيب في البيانات يبدأ التساؤل عن الفوائد التي يمكن للمنظمات تحقيقها من استخدام التنقيب
في البيانات؟ وما هي املنظمات التي بدأت باستثمار هذه التقنية في أنشطتها؟
واحدة من القطاعات املهنية التي بدأت باالستفادة من هذا املفهوم هي الرعاية الصحية .مع النمو في السجالت الصحية
إلالكترونية (السجالت الصحية إلالكترونية) ،املزيد واملزيد من التسهيالت وجمع كميات هائلة من البيانات الرقمية للمريض.
بالتالي يمكن ملقدمي الرعاية الصحية والباحثين استخدام التنقيب عن البيانات من مخازن هائلة من البيانات لكشف أنماط
ً
معرفية كانت مجهولة سابقا ومن ثم استخدام هذه املعلومات لبناء النماذج التنبؤية لتحسين التشخيص ونتائج الرعاية الصحية.
مهنة أخرى استطاعت الاستفادة من التنقيب عن البيانات وهي قطاع تجارة التجزئة .من خالل تطبيق أدوات التنقيب عن
البيانات ،وسالسل البيع بالتجزئة أصبحت قادرة على اكتشاف ألايام التي يتوافد املستهلكون فيها بغزارة إلى املحالت التجارية
والقيام بالتسوق الخاص بهم ،وكيف ينفقون معظم أموالهم ،وعلى أي من املنتجات املتواجدة يذهب املال ،كل هذه املعلومات
واملعرفة بهذه ألانماط والتي قد يكون الكثير منها غير معروف لديهم ،ساعد املخططين على توجيه استثماراتهم ً
بناء على هذه
املعلومات املكتسبة لزيادة إيراداتها في الواقع.
التنقيب في البيانات هو إعادة رؤية للبيانات من منظور جديد ومن هنا تكون القيمة املضافة والذي تعطي بيانات ال يمكن
توقعها باألساليب التقليدية ،التنقيب عن البيانات يعطي هذه القيم املضافة في مجاالت عددية إذا ما تم استخدامه.
في تدوينه قادمة سيتم مناقشة مجاالت استخدامه بصورة أوسع سواء في الطب أو الكيمياء الحيوية والتجارة واملكتبات
ومؤسسات املعلومات التي كانت الصين من الدول الرائدة في استخدام التنقيب عن البيانات في هذا املجال (املكتبات) ،كما سنعرف
كيف أثرت تقنية التنقيب عن البيانات في قرار املمثلة العاملية أنجلينا جولي إجراء عملية جراحية .هذا باإلضافة إلى مناقشة
ألانظمة والبرمجيات التي يتم استخدامها إلجراء عمليات التنقيب عن املعلومات.
التنقيب في البيانات
التنقيب في البيانات هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه
املعرفة .كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية بيانات (عادة ما تكون كمية كبيرة) إليجاد عالقة منطقية
تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات .يطلق اسم «نماذج »Modelsعلى العالقات والبيانات
امللخصة التي يتم الحصول عليها من التنقيب في البيانات .يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها
ً
بغرض غير غرض التنقيب في البيانات (مثال قاعدة بيانات التعامالت في مصرف ما) مما يعني أن طريقة التنقيب في البيانات ال تؤثر
ً
مطلقا على طريقة تجميع البيانات ذاتها .هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن إلاحصاء ،ولهذا يشار إلى
ً
عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية .يشير التعريف أيضا إلى أن كمية البيانات تكون عادة كبيرة ،أما في حال
كون كمية البيانات صغيرة فيفضل استخدام الطرق إلاحصائية العادية في تحليلها.
عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط املميزة في البيانات ،وكيفية تحليل
ً
البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي عالقة ظاهرية تعكس حقيقة في طبيعة البيانات .عادة يتم التنقيب في
ً ً ً
بيانات تكون جزءا من كامل البيانات حيث يكون الغرض عادة تعميم النتائج على كامل البيانات (مثال تحليل البيانات الحالية
ً
ملستهلكي منتج ما بغرض توقع طلبات املستهلكين املستقبلية) .من أحد أهداف تنقيب البيانات أيضا هو اختزال كميات البيانات
الكبيرة أو ضغطها بحيث تعبر بشكل بسيط عن كامل البيانات بدون تعميم.
محتويات
7 أنواع التنقيب
3 الكيفية
2 أهداف التنقيب
2 وسائل التنقيب في البيانات
1 تطبيقات التنقيب في البيانات
-1أنواع التنقيب
هناك نوعان أساسيان للتنقيب في البيانات هما :التنقيب الاستشرافي والتنقيب الوصفي.
التنقيب الاستشرافي ينتج عنه نموذج عن النظام الذي تصفه البيانات املستخدمة في التنقيب.
بناء على املعلومات املوجودة داخل البيانات املستخدمة في عملية التنقيب. أما التنقيب الوصفي فينتج عنه معلومات جديدة ً
-2الكيفية
أهداف التنقيب
هناك ثالثة أهداف للتنقيب في البيانات:
.7من أجل تعليل بعض الظواهر املرئية.
.3من أجل التثبت من نظرية ما .مثال :التثبت من النظرية التي تقول بأن ألاسر الكبيرة تهتم بالضمان الصحي أكثر من
ألاسر الصغيرة عددا.
ً
.3من أجل تحليل البيانات للحصول على عالقات جديدة وغير متوقعة .مثال :كيف سيكون إلانفاق العام إن كان مالزما
لعمليات خداع واسعة من قبل البطاقات الائتمانية.
وسائل التنقيب في البيانات
هناك عدة وسائل مختلفة من أجل التنقيب في البيانات .اختيار الوسيلة املناسبة يعتمد على طبيعة البيانات تحت الدراسة
وعلى حجمها .يمكن إجراء عملية التنقيب في البيانات باملقارنة مع سوق البيانات ومخزن البيانات.
بعض من هذه الوسائل هي:
الاستدالل املبني على حاالت سابقة :Case-Based reasoningالتفكير واستخالص النتائج والقوانين من أمثلة حية
ً
وقضايا تم حلها سابقا.
الكشف عن قانون :Rule Discoveryالبحث عن منوال معين أو عالقة معينة في جزئية كبيرة من البيانات.
معالجة إلاشارات :Signal Processingإيجاد الظواهر املتشابه مع بعضها البعض.
شبكات عصبونية :Neural Netsتطوير نماذج قابلة لتنبؤ النتائج .هذه النماذج تم تطويرها ً
بناء على أسس تم
استنباطها من عقل إلانسان.
منحنيات غير ثابتة :Fractalsتصغير البيانات الكبيرة من دون ضياع املعلومات.
تطبيقات التنقيب في البيانات
ً ُ
وسائل التنقيب في البيانات تستعمل وبنجاح في الكثير من التطبيقات الحقيقة حول العالم .التطبيقات التالية تشمل بعضا
من ألامثلة:
كتابة تقرير مختصر عن فئة معينة :Profiling Populationsتطوير وإنشاء تقارير موجزة عن الزبائن املهمين وعن
بطاقات الائتمان.
تحليل النزعة التجارية :Analysis of Business Trendإيجاد ألاسواق ذات قدرات النمو القوية أو الضعيفة.
التسويق لفئة معينة :Target Marketingإيجاد الزبائن من أجل منح التخفيضات لهم لسبب معين.
تحليل الاستعمال :Usage Analysisإيجاد منوال معين الستعمال الخدمات والسلع.
فعالية الحملة :Campaign Effectivenessمقارنة استراتيجيات الحمالت مع بعضها البعض من أجل إيجاد أكثرها
ً
فعالية وتأثيرا.
جاذبية السلعة :إيجاد السلع التي تباع مع بعضها البعض.
تطبيقات التنقيب في البيانات بدأت تنمو بصورة كبيرة لألسباب التالية:
.7كمية البيانات املوجودة في مخزن البيانات وسوق البيانات تنمو بصورة أسية (.)exponential
.3ومن أجل ذلك ،فإن املستخدم يحتاج إلى أدوات متطورة من مثل التنقيب في البيانات من اجل استخالص الفائدة
واملعرفة من هذه البيانات.
.2الكثير من أدوات التنقيب عن البيانات بدأت تظهر مؤخرا ،وكل أداة أفضل من ألاخرى.
.2املنافسة الشديدة املوجودة في السوق تدفع الشركات إلى الاستفادة القصوى من البيانات التي بيدها .عمليات التنقيب في
البيانات تفعل ذلك تماما.
ذكاء ألاعمال ()Business Intelligence
هي عبارة عن نظريات ومنهجيه وعمليات وخصائص وتقنيات تقوم على تحويل البيانات ألاولية إلى معلومات مفيدة ذات
معنى ألغراض ألاعمال .له القدرة على التعامل مع أعداد هائلة من املعلومات ملساعدة املؤسسات في تحديد وتطوير الفرص التجارية
الجديدة ،والاستفادة من الفرص الجديدة وتنفيذ استراتيجية فعالة.
تكنولوجيات ذكاء ألاعمال توفر آراء تاريخية وحالية وتنبؤيه لعمليات ألاعمال .املهام املشتركة لتكنولوجيات ذكاء ألاعمال هي
إلابالغ وتحليالت OLAPواستخراج البيانات وإدارة عمليات ألاعمال ومعايير القياس واستخراج نص وتحليالت تنبؤيه.
غالبا ما تهدف إلى دعم أفضل ألعمال ُ ً
صنع القرار .ولذلك نظام ذكاء ألاعمال يمكن أن يسمى نظام دعم القرار ذكاء ألاعمال
.DSS
محتويات
7 نظرة تاريخية
3 ذكاء ألاعمال كعملية
2 ذكاء ألاعمال كتكنولوجيا
2 أنظمة ذكاء ألاعمال و تخزين البيانات
1 ذكاء وتحليالت ألاعمال
6 الذكاء التنافس ي
1 مستقبل ذكاء ألاعمال
نظرة تاريخية
في مقال نشر عام ،7511استخدم باحث أي بي إم هانز بيتر لين مصطلح ذكاء ألاعمال .لقد عرفت الذكاء على النحو التالي
«القدرة على القبض على العالقات املتبادلة للوقائع املقدمة في مثل هذا النحو لتوجيه العمل نحو الهدف املنشود».
هوارد دريسنير في عام 7515في وقت الحق محلل مجموعة غارتنر ( )Gartnerاقترح ذكاء ألاعمال كمصطلح مظلة لوصف
«مفاهيم وأساليب لتحسين عملية اتخاذ القرار باستخدام الواقع القائم على نظم الدعم» .لم يكن هذا حتى أواخر عام 7551
حيث أن هذا الاستخدام أصبح منتشر على نطاق واسع.
ذكاء ألاعمال كعملية
ً
هي عملية مستمرة أي أن املؤسسة تجمع بشكل مستمر ،تسجل وتحلل بيانات وفقا ألهداف معينة وتستخدم النتائج في
عملية اتخاذ القرار لتحسين أداء املؤسسة.
ذكاء ألاعمال كتكنولوجيا
هي مجموعة من التقنيات في تكنولوجيا املعلومات تعطي ذكاء ألاعمال مضمون وشكل في املؤسسات .بالعموم هي العمليات،
الاستراتيجيات ،الثقافة ،ألادوات ،الهيكلة ،املعايير والتقنيات التي تنتج عنها أداء أكثر ذكاء للمؤسسات.
أنظمة ذكاء ألاعمال و تخزين البيانات
ً
تحديات حقيقية في استخدام البيانات املتوفرة في دعم القرار .كثيرا ما تستخدم
تواجه املؤسسات في جميع أنحاء العالم ِّ
تطبيقات ذكاء ألاعمال البيانات التي تم جمعها من مخزن البيانات .ومع ذلك ،ليس كل مخازن البيانات ُمستخدمة لذكاء ألاعمال وال
جميع تطبيقات ذكاء ألاعمال تتطلب مخزن بيانات .وأهم هذه التحديات في استخراج املؤشرات التجارية تتلخص في ما يلي:
تخزين البيانات في ملفات و قواعد بيانات متعددة وغير املترابطة مع بعضها البعض.
ربط البيانات املتعددة املصادر لتوفير رؤية موحدة ومتكاملة عن بيانات املؤسسة.
القدرة على متابعة تنفيذ الاستراتيجيات و الخطة املوضوعة من واقع البيانات و املؤشرات.
ً
جودة البيانات لغايات التحليل وخصوصا التاريخية منها.
عدم استخدام العرض و التصميم املناسب لكل مؤشر وإحصائية من خالل الرسومات البيانية وربط ذلك بقواعد
البيانات.
ذكاء وتحليالت ألاعمال
ُ
توماس دافنبورت جادل بأن ذكاء ألاعمال يجب أن تقسم إلى الاستعالم وإلابالغ و ،OLAPأداة تنبيهات وتحليل ألاعمال.
ً
تحليل ألاعمال هو عبارة عن فرع من املعرفة التي تعرف احتياجات ألاعمال وتحدد الحلول ملشاكلها .الحلول غالبا ما تشمل
النظام ،وكما أنها يمكن أن تتكون من تحسينات عملية أو تغيرات تنظيمية .والشخص الذي يقوم بهذه املهمة يسمى عنصر تطوير ِّ
محلل ألاعمال.
محللو ألاعمال الذين يعملون فقط على تطوير أنظمة البرمجيات يمكن أن يطلق عليهم محللو تكنولوجيا املعلومات التجارية
أو محللو ألاعمال التقنيون أو محللو ألانظمة.
الذكاء التنافس ي
ً
مصطلح ذكاء ألاعمال غالبا ما تستخدم كمرادف للذكاء التنافس ي.
مستقبل ذكاء ألاعمال
ورقة غارتنر عام 3115تتوقع هذه التطورات في سوق ذكاء ألاعمال:
بسبب فقر املعلومات والعمليات وألادوات ،خالل عام ،3173أكثر من 21في املائة من أعلى 1111شركه عاملية سوف
تفشل بانتظام في اتخاذ القرارات الثاقبة عن التغييرات الكبيرة في أعمالهم وأسواقهم.
بحلول عام ،3173سوف تحكم وحدات ألاعمال ما ال يقل عن 21في املائة من مجموع امليزانية لذكاء ألاعمال.
بحلول عام 31 ،3171في املائة من املنظمات سيكون لديها صناعه تطبيق تحليلي محدد ُمستلم عن طريق البرمجيات
كخدمة كعنصر داعم مللف ذكاء ألاعمال.
في عام ،3115اتخاذ قرار تعاوني سوف يبرز كفئة منتج جديد الذي يجمع بين البرامج الاجتماعية مع منصة قدرات ذكاء
ألاعمال.
ُ
بحلول عام ،3173ثلث التطبيقات التحليلية املطبقة على عمليات ألاعمال سوف ترسل من خالل ردئ مزج تطبيق
الحبيبات.
أدوات ذكاء ألاعمال Business Intelligence Tools
تملك أغلب املؤسسات كميات كبيرة من البيانات موزعة ضمن مخازن بيانات متنوعة ،مثل قواعد البيانات ،ووثائق بصيغ
مختلفة مثل Word Excelو PDFوغيرها من املستودعات في مختلف فروع وأقسام املؤسسة .إن وجود تطبيقات بأنواع مختلفة
ً
يجعل استخراج املعلومات وتحليلها أمرا في غاية الصعوبة.
ً
يعني التعبير «ذكاء ألاعمال ،«Business Intelligenceالذي يشار له باملختصر ،BIمجمل ألادوات وألانظمة التي تؤدي دورا
ً
رئيسيا في عمليات التخطيط الاستراتيجي للمؤسسة .يسمح ذكاء ألاعمال للمؤسسة بتجميع البيانات وتخزينها وتحليلها بهدف
ُ
ظهر هذه ألانظمة وألادوات ذكاء ألاعمال في مجاالت مثل فرز الزبائن ودعمهم وتقسيم السوق وأبحاث املساعدة على اتخاذ القرار .ت ِّ
السوق وعائدية املنتجات والتحليل إلاحصائي وتحليل التوزيع والجرد.
سنتطرق في هذا املقال إلى ألادوات املستخدمة في بناء تطبيقات ذكاء ألاعمال ،معددين أنواعها وشارحين باختصار بعض
هذه ألادوات من كل نوع.
أ -أنواع أدوات ذكاء ألاعمال
ً
إن أدوات ذكاء ألاعمال هي برمجيات تطبيقية مصممة لتحليل وعرض البيانات وبناء التقارير .تقرأ ألادوات عادة البيانات
ً
املخزنة سلفا ضمن مستودعات ومخازن البيانات .يمكن تصنيف أدوات ذكاء ألاعمال في عدد من الفئات الرئيسية:
برمجيات الجداول .Spreadsheets
برمجيات توليد التقارير .Reporting Software
برمجيات التحليل آلاني .OLAP
لوحات القيادة .Dashboard
التنقيب في البيانات .Data Mining
هندسة القرارات .Decision Process
التنقيب في إلاجراءات .Process Mining
إدارة أداء ألاعمال .Business Performance Management
نظم املعلومات املحلية .Local Information Systems
تباع هذه ألادوات ،ما عدا برمجيات الجداول ،كأدوات منفصلة أو كطقم أدوات أو كجزء من أنظمة تخطيط موارد
املؤسسات ERPأو كمكونات لبرمجيات مخصصة.
سنتحدث فيما يلي عن بعض هذه املنتجات ،مصنفين إياها من حيث رخصة الاستخدام وفتح مصادر رمازها.
ب -منتجات مفتوحة املصدر مجانية
.1مشروع Eclipse BIRT
بيرت BIRTهو نظام لتوليد تقارير ،وهو مفتوح املصدر ومعتمد على إكليبس Eclipseللتطبيقات املعتمدة على الوب،
ً
وخاصة تلك املعتمدة على جافا Javaوتقنية .J2EE.يحوي بيرت مكونين رئيسيين :مصمم تقارير معتمدا على إكليبس ،ومكون تشغيل
ً
runtimeيمكن إضافته إلى مخدم التطبيقات .كما يقدم بيرت محركا للرسوم البيانية يسمح بإضافة املخططات والرسوم إلى
التطبيقات.
يمكن باستخدام بيرت إضافة العديد من التقارير إلى التطبيقات نذكر من أنواعها :اللوائح ،Listsواملخططات
،Chartsواملصفوفات، Crosstabsوالوثائق والرسائل والتقارير املركبة من مجمل هذه ألانواع.
.2ألاداة Jasper Soft
إن طقم أدوات جاسبر سوفت لذكاء ألاعمال هي برمجيات مفتوحة املصدر ،تتضمن برمجيات خاصة بتوليد التقارير
ولوحات القياس Dashboardsوالتحليل ومكاملة البيانات ،وهي متوفرة كحزمة برمجية متكاملة أو كتطبيقات منفصلة يمكن
ً تنصيبها َ
وحدها ثم دعمها بالتطبيقات ألاخرى مستقبال.
ً
يتوفر الرماز ألاساس ي لهذه البرمجيات مجانا بحيث يمكن للمستخدم مواءمة البرمجيات لتناسب عمله .جاسبر ريبورتس
Jasper Reportsهو أحد هذه التطبيقات وهو مكتبة إعداد تقارير مفتوحة املصدر مكتوبة بلغة جافا تسمح بتصدير التقارير إلى
ً ً
العديد من الصيغ ،ويمكن دمجها في التطبيقات املهيئة لجافا ومنها تطبيقات الوب ،بحيث تولد محتوى ديناميكيا .هنالك أيضا
توسعة تسمح باستخدام PL/SQLالخاصة بأوراكل.
ً ً ً
رخصة النظام املفتوح حاليا هي من النوع LGPLوهنالك أيضا عدد من البرمجيات التجارية املطورة اعتمادا على جاسبر
ريبورتس.
.3ألاداة Rapid Miner
رابيد ماينر Rapid Minerهو بيئة مفتوحة املصدر إلجراء الاختبارات في مجال تعلم آلالة والتنقيب في البيانات ،فهي تسمح
ببناء عدد ضخم من املؤثرات (الخطوات التحليلية) ضمن توصيف ،XMLويمكن بناء هذه ألاخيرة باستخدام واجهة رابيد ماينر
ُ
البيانية .تستخدم رابيد ماينر في مجال ألابحاث والعالم الحقيقي للتنقيب في البيانات.
طورت وحدة الذكاء الصنعي في جامعة دورتموند ألامريكية النسخة ألاولى عام 2001وهي توزع تحت الرخصة AGPL
ويستضيف املوقع Source Forgeاملشروع منذ عام .3112املشروع مطور باستخدام لغة البرمجة جافا ،وهو من ثم يعمل على
أغلب نظم التشغيل املعروفة.
من ميزات رابيد ماينر نذكر املجموعة الواسعة من خوارزميات التنقيب في البيانات ،مثل أشجار القرارات والخرائط الذاتية
التنظيم ،وكذلك ألاشكال البيانية املعقدة واملتطورة ،مثل ألاشكال الشجرية والنقاط املبعثرة الثالثية ألابعاد واملكعبات البيانية
املتداخلة ،إضافة إلى العديد من املقابس pluginsمثل مقبس تحليل النصوص.
.4ألاداة Spago BI
ُ ً ً
سباغو بي آي Spago BIهي منصة تكامل لذكاء ألاعمال مطورة كليا وفقا ملفهوم البرمجيات الحرة املفتوحة املصدر .تعتبر
َ
سباغو بي آي منصة ،ألنها تحقق كافة متطلبات ذكاء ألاعمال من ناحيتي تحليل وإدارة البيانات ،فهي تقدم وظائف مثل إعداد
ً
التقارير والتحليل املتعدد ألابعاد MOLAPوالتنقيب في البيانات ولوحات القياس والاستفسارات املخصصة .ولديها أيضا أدوات
الستخراج وتحويل وتحميل البيانات ETLإضافة إلى دعم عمل مدير النظام من ناحية صيانة الوثائق التحليلية وإدارة النسخ
ً
والتحكم بتدفق ألاعمال .سباغو بي آي Spago BIهي مفتوحة املصدر وحرة كليا وال يوجد منها نسخ متعددة أو مجتزءات تجارية.
ج -منتجات مفتوحة املصدر تجارية
.7ألاداة Palo
ً ُ
بالو Paloهي مخدم قواعد بيانات متعدد ألابعاد MOLAPويستخدم عادة كأداة لذكاء ألاعمال في مجال الضبط وإدارة
امليزانيات ،وذلك عبر واجهة استخدام مشابهة لبرمجيات الجداول Spreadsheetوإضافة إلى مفهوم البيانات املتعددة ألابعاد
يسمح بالو لعدة مستخدمين بالتشارك في مخزن بيانات واحد .بالو متاح كبرمجيات مفتوحة املصدر وكذلك كبرمجيات مغلقة
املصدر .يتمتع بالو بعدد من إلاضافات املفتوحة املصدر مثل بالو الخاص باألكسل Palo for Excelوإلاضافة PalOO Caالخاصة
بأوبن أوفيس .Open Office orgيمكن دمج بالو في أنظمة أخرى عبر مكتبات خاصة بجافا و PHPو C/C++و.NET
.3ألاداة Pentaho
ً ً
يوفر طقم أدوات بينتاهو Pentahoالخاص بذكاء ألاعمال طيفا كامال من إمكانات ذكاء ألاعمال التي تتضمن الاستفسار
وتوليد التقارير والتحليل التفاعلي ولوحات القياس Dashboardsوتكامل البيانات وتقنية الاستخراج/التحويل/التحميل ETL
والتنقيب في البيانات ،إضافة إلى كونها منصة لذكاء ألاعمال جعلتها من أهم برمجيات ذكاء ألاعمال املفتوحة املصدر .يتألف طقم
بينتاهو من عدة أجزاء يمكن انتقاؤها كحزمة واحدة أو مفردة وهي :مولد التقارير Pentaho Reportingومحلل Pentaho Analysis
ولوحات القياس Pentaho Dashboardsوأداة التنقيب في البيانات .Pentaho Data Mining
د -منتجات تجارية حرة
.1البرمجية Freereporting.com
ً
إن فريريبورتينج Freereporting.comهي برنامج لتقارير ذكاء ألاعمال ُيدار اعتمادا على الوب ،وهو مطور من قبل Logi
XMLومتاح بدون تكلفة تحت الرخصة OEM .النسخة املجانية تقدم ميزات أساسية في البرنامج وهنالك نسخة تجارية كاملة
ً
املواصفات .تستخدم واجهة التخاطب املعتمدة على الوب في النسخة املجانية تقارير جدولية ومخططات ورسوما بيانية ،وتسمح
ً
بتجميع البيانات ووضعها في صفحات وترتيبها مع إمكان التغلغل في البيانات .أما ميزات ذكاء ألاعمال ألاكثر تطورا ،مثل لوحات
القياس وشبكة التحليل ومعاين البيانات التفاعلي ،فهي غير متاحة في النسخة املجانية ولكنها متاحة في النسخة التجارية.
.2ألاداة Style Intelligence
ً
تطور شركة آينتسوفت تكنولوجي InetSoft Technologyتطبيقات ذكاء ألاعمال املعتمدة على الوب .تملك آينتسوفت منتجا
ً
وحيدا هو ستايل إنتليجنس Style Intelligenceبإصدارات متعددة تركز على ذكاء ألاعمال العملياتي ،ومعاينة البيانات ،وتقارير
ألاعمال ومحرك تقارير قابل للتضمين.
يشمل التطبيق أدوات لتوليد التقارير ولوحات القياس والتحليل املرئي وبطاقات التسجيل ،Scorecardsثم إن الشركة
توفر البرمجيات كخدمات.
تعتمد منتجات آينتسوفت على املعايير املفتوحة مثل XMLو SOAPولغة جافا .تعتمد رخصة آينتسوفت على وحدة
ً
املعالجة بدال من املستخدم.
.2ألاداة Micro Strategy
شركة ميكرو ستراتيجي Micro Strategyهي شركة مطورة لبرمجيات ذكاء ألاعمال وإعداد تقارير الشركات والتحليل آلاني،
أدوات إلعداد التقارير وتحليل البيانات املخزنة في قواعد بيانات عالئقية ROLAPوقواعد بيانات متعددة ألابعاد
ٍ إذ توفر برمجياتها
MOLAPأو حتى في ملفات نصية.
آخر نسخة من برمجياتها هي Micro strategy 9ولديها نسخة خاصة بآي فون iPhoneوآيباد iPadتدعى مايكرو ستراتيجي
موبايل .تقدم الشركة طقم برمجيات إعداد التقارير Micro Strategy Reportingكبرمجيات تجارية حرة تسمح بتطوير التقارير
التشغيلية والتحليلية
ه -منتجات تجارية
ً
إضافة إلى املنتجات املذكورة سابقا ،هنالك العديد من منتجات ذكاء ألاعمال التجارية واملغلقة املصدر .ولكثرة هذه
املنتجات ،سنعرض ملحة إلى بعض هذه ألادوات املشهورة.
.1ألاداة IBM Cognos
ً ً
توفر النسخة 1من البرمجية كونيوس Cognosمن أي بي إم طيفا كامال من إمكانات ذكاء ألاعمال :توليد التقارير والتحليل
ولوحات القياس Dashboardsوبطاقات التسجيل على بنية خدمات موجهة واحدة.
.2ألاداة SQL Server Analysis Services
إن خدمات التحليل من مايكروسوفت Microsoft Analysis Servicesهي جزء من مخدم قواعد البيانات SQL Serverفقد
ً
ضمنت مايكروسوفت عددا من الخدمات ضمن مخدم SQL Serverتتعلق بذكاء ألاعمال ومستودعات البيانات .تتضمن هذه
الخدمات التكامل والتحليل ،وتتضمن ألاخيرة إمكانات معالجة التحليل آلاني OLAPوالتنقيب في البيانات .تتخذ خدمات تحليل
ً ً
مايكروسوفت موقفا حياديا من النقاش بين MOLAPو ،ROLAPفهي توفر كافة النكهات من MOLAPاملتعدد ألابعاد و ROLAP
العالئقي و HOLAPالهجين.
.3أدوات SAS Institute
إن النظام ساس SASهو نظام متكامل من املنتجات البرمجية املطورة من قبل معهد ساس SAS Institute.يسمح النظام
للمبرمجين بعمليات مثل إدخال البيانات واستخراجها ومعالجتها والتنقيب فيها ،إضافة إلى توليد التقارير والرسوم البيانية
والتحليل إلاحصائي وتخطيط ألاعمال ودعم القرار وبحوث العمليات وغيرها.
.4ألاداة Oracle Business Intelligence Suite Enterprise Edition
إن النسخة 11gمن إصدار ذكاء ألاعمال للمؤسسات من أوراكل Oracle Business Intelligence Enterprise Edition 11g
ً ً
) (OBIEEهي منصة شاملة لذكاء ألاعمال التي توفر مجاال كامال من ميزات توليد التقارير وتحليل البيانات وبطاقات التسجيل
ولوحات القياس والتحليل املخصص والتحليل آلاني.
ComArch COA Solutions Bime
Decision Support Panel Data Applied CyberQuery
IBM Applix HP Neoview Dimensional Insight
IBM SPSS IBM Cognos
Informatica InetSoft IDV Solutions Visual Fusion
Izenda InfoZoom Information Builders
LogoXML Klipfolio Dashboard Jreport
Microsoft PerfomancePoint Microsoft SQL Server Analysis Microsoft SQL Server Reporting
Server 2007 Services Services
m-Power MicroStrategy Microsoft Proclarity
Oracle Business Intelligence Suite
Hyperion Solutions Corporation Oracle Corporation
Enterprise Edition
Pervasive DataRush Pentaho Panorama Software
Qliktech PRELYTIS Pilot Software, Inc
SAP Business Information
OutlookSoft Business Objects
Warehouse
Sportfire(now Tibco) Siebel Systems SAS Institute
Tableau Software Sybasse IQ StarSoft
XLCubed Thomson Data Analyzer Teradata