You are on page 1of 47

‫محمد لطفي‬ ‫ن‬

‫ا� ت‬
‫ا�‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫أن‬
‫�‬

‫أنواع البيانات‬
‫‪Data Types‬‬
‫ت‬ ‫ن‬
‫ال� ي�ا�ا�؟‬
‫ه� ب‬
‫ما ي‬
‫تتعدد صور البيانات‪ ،‬فهي قد تكون على شكل نصوص‪ ،‬صور‪ ،‬فيديو‪ ،‬صوت‪،‬‬
‫وقد تخزن في قواعد للبيانات التي تتسع لكم هائل منها‪.‬‬

‫البيانات هي املادة الخام ألي رشكة‪،‬‬


‫مؤسسة أو أي نشاط‪ .‬وهي يف حد ذاتها‬
‫ليست ذات قيمة كبرية‪ ،‬مجرد مجموعة‬
‫من األرقام والصور والنصوص التي ال‬
‫يربط بينها أي رابط‪.‬‬

‫ولكنها األساس لفهم وتطوير‪ ،‬تقريبا‪،‬‬


‫جميع مناحي الحياة‪ .‬مثل التشخيص‬
‫املبكر لألمراض‪ ،‬وتحسني شبكات‬
‫التواصل االجتامعي‪ .‬تقريبا أي مجال‬
‫يستطيع االستفادة من البيانات‪ ،‬كاملجال‬
‫املايل أو التعليمي أو الصناعي أو الطبي‬
‫وغريها الكثري‪.‬‬
‫تستطيع استخدام البيانات لصنع قرارت‬
‫أفضل وتحقيق أهدافك عىل أساس‬
‫علمي‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪1‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫ا� ت‬
‫ا�‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫أن‬
‫�‬
‫ة‬ ‫ن ت ن‬ ‫ة‬ ‫ت‬ ‫ن‬
‫وع��‬
‫وال� ي�ا�ا� ال� ي‬
‫ب‬ ‫الكم��‬
‫ي‬ ‫ال� ي�ا�ا�‬
‫ب‬
‫‪Quantitative Data and Categorical Data‬‬

‫البيانات النوعية‬
‫تستخدم لتصنيف مجموعة‬
‫من الوحدات‪ ،‬وال نستطيع‬
‫‪٪‬‬ ‫‪+‬‬ ‫البيانات الكمية‬
‫تكون في شكل أرقام‬
‫تستطيع إجراء عمليات‬
‫إجراء أية عمليات حسابية‬ ‫حسابية عليها‪ ،‬كالجمع‬
‫عليها‪.‬‬ ‫والطرح‪ ،‬أو إيجاد‬
‫أمثلة‪ :‬النوع (ذكر ‪ /‬أنثى)‪،‬‬ ‫المتوسط‪.‬‬
‫سالالت الكالب املختلفة‪ ،‬التقدير‬ ‫أمثلة‪ :‬عمرك‪ ،‬عدد الطالب‪،‬‬
‫(مقبول ‪ /‬جيد ‪ /‬جيد جدا ‪/‬‬ ‫مقدار املال الذي معك‪ ،‬أو‬
‫ممتاز)‪ ،‬الرمز الربيدي‪ ،‬أرقام‬ ‫درجة الحرارة‪.‬‬
‫‪Quantitative Data‬‬
‫الالعبني يف مباراة‪ ،‬أرقام‬
‫السيارات‪ ،‬أو أرقام الهواتف‪.‬‬
‫‪Categorical Data‬‬

‫مالحظة‪:‬‬
‫قد تكون البيانات النوعية على شكل "أرقام" ولكننا ال نستطيع إجراء‬
‫عمليات حسابية عليها‪ ،‬مثل أرقام الهواتف‪ ،‬أو الرقم الربيدي أو أرقام‬
‫الالعبني‪ ،‬حيث ال معنى جلمع هذه القيم أو حساب املتوسط اخلاص بها‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪2‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫ا� ت‬
‫ا�‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫أن‬
‫�‬
‫�أ ئ ة‬
‫س�ل�‬
‫حدد نوع كل من البيانات التالية (كمية – نوعية)‪:‬‬
‫‪Quantitative Or Categorical‬‬
‫الرمز الربيدي‬
‫العمر‬
‫الدخل‬
‫الحالة االجتامعية (عزب ‪ /‬متزوج ‪)... /‬‬
‫الطول‬
‫طول الطريق إىل العمل‬
‫التقييم يف استقصاء للرأي (ضعيف – مقبول – جيد)‬
‫متوسط الرسعة‬
‫أرقام كرات البلياردو‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪3‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫ا� ت‬
‫ا�‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫أن‬
‫�‬
‫ة‬ ‫ن ت ن‬
‫وع�� ‪Categorical Data‬‬
‫ال� ي�ا�ا� ال� ي‬
‫ب‬
‫ميكن تقسيم البيانات النوعية إىل نوعني‪:‬‬

‫بيانات رتبية ‪Ordinal‬‬

‫مثال‪ :‬تقديرك يف االمتحانات‬ ‫هي بيانات نوعية أستطيع ترتيبها‬


‫لمستويات مختلفة‪.‬‬
‫امتياز‬
‫جيد جدا‬ ‫هذه البيانات ال أستطيع إجراء عمليات‬
‫جيد‬ ‫حسابية عليها‪ ،‬إذن فهي بيانات نوعية‪،‬‬
‫مقبول‬ ‫ولكني أستطيع ترتيبها من األقل (ضعيف‬
‫ضعيف‬ ‫جدا) لألعىل (امتياز)؛ لذا فهي بيانات‬
‫ضعيف جدا‬ ‫رتبية‪.‬‬

‫مالحظة‬
‫ال يشرتط معرفة "قيمة" الفارق بني كل رتبة والتي تليها‪ ،‬تكفي فقط‬
‫معرفة أن قيمة بيان ما هي أكرب أو أقل من األخرى‪.‬‬

‫مثال‪ :‬يف استطالع للرأي كانت اإلجابات كالتايل‪ :‬ال أوافق – أوافق – أوافق‬
‫بشدة‪.‬‬
‫هنا نستطيع ترتيب البيانات من األدىن (ال أوافق) لألعىل (أوافق بشدة)‪ ،‬أو‬
‫العكس‪ ،‬دون الحاجة ملعرفة "كم" يفصل بني كل اختيار واآلخر‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪4‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫ا� ت‬
‫ا�‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫أن‬
‫�‬

‫بيانات اسمية ‪Nominal‬‬

‫على عكس البيانات الرتبية‪ ،‬ال أستطيع ترتيبها‪.‬‬


‫أمثلة‪ :‬النوع (ذكر ‪ /‬أنثى)‪ ،‬الحالة االجتامعية (عزب ‪ /‬متزوج ‪.)... /‬‬
‫ة‬ ‫ن‬
‫ا� ت‬
‫الكم�� ‪Quantitative Data‬‬
‫ي‬ ‫ا�‬ ‫ال� ي�‬
‫ب‬
‫بيانات منعزلة ‪Discrete Data‬‬

‫سميت بالبيانات‬ ‫وهي البيانات التي قيمها أعداد صحيحة وال‬


‫المنعزلة (أو المنفصلة)‬ ‫نستطيع تجزئتها‪.‬‬
‫ألن كل قيمة منفصلة‬ ‫مثال‪ :‬عدد األطفال يف حفل ما‪ .‬فهو إما ‪ 10‬أو ‪20‬‬
‫عن األخرى‪ ،‬فيوجد طفل‬
‫واحد أو طفالن‪ ،‬ولكن ال‬ ‫أو ‪ ،1000‬ولكن ال نستطيع القول أنهم ‪ 100.5‬طفل‬
‫توجد قيم بينهما‪.‬‬ ‫(مائة طفل ونصف)‪.‬‬

‫بيانات متصلة ‪Continuous Data‬‬


‫سميت بالبيانات المتصلة ألن القيم‬ ‫هي بيانات تأخذ أية قيمة‪ ،‬سواء‬
‫تتصل فيما بينها‪ ،‬فبين طول ‪ 1‬سم‬ ‫عدد صحيح (‪ )6‬أو عشري (‪،)6.3‬‬
‫و ‪ 2‬سم توجد قيم مختلفة على شكل‬ ‫أو حتى عدد سالب (‪.)12-‬‬
‫قيم عشرية (‪ ،1.3 ،1.2 ،1.1‬وهكذا)‪.‬‬
‫وأيضا ألنه يمكن تقسيم أية قيمة إلى‬ ‫مثال‪ :‬طولك‪ ،‬ميكن أن يكون قيمة‬
‫قيم أصغر‪ ،‬ففي حالة العمر (وهو بيان‬ ‫صحيحة (‪ 170‬سم)‪ ،‬أو قيمة عرشية‬
‫متصل ‪ )Continuous‬نستطيع‬
‫تقسيمه إلى سنوات‪ ،‬والسنة إلى شهور‪،‬‬ ‫(‪ 182.6‬سم)‪ .‬أو درجة الحرارة‪.‬‬
‫والشهر إلى أيام‪ ،‬واليوم إلى ساعات‪،‬‬
‫وهكذا‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪5‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ا�‬
‫ن‬
‫ا� ت‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫�أ ن‬

‫‪Data Types‬‬
‫أنواع البيانات‬
‫‪Numerical Data‬‬ ‫‪Categorical Data‬‬
‫ة‬ ‫ت‬ ‫ن‬ ‫ة‬ ‫ن ت ن‬
‫كم��‬
‫ي‬ ‫ب� ي�ا�ا�‬ ‫وع��‬
‫ب� ي�ا�ا� � ي‬
‫يجرى عليها عمليات حسابية‪.‬‬ ‫للتصنيف فقط‪ ،‬وال يجرى عليها‬
‫عمليات حسابية‪.‬‬

‫‪Continuous Data Discrete Data‬‬ ‫‪Nominal Data‬‬ ‫‪Ordinal Data‬‬


‫بيانات متصلة‬ ‫بيانات منعزلة‬ ‫بيانات اسمية‬ ‫بيانات رتبية‬
‫قيم صحيحة وعرشية‪.‬‬ ‫قيم صحيحة فقط‪.‬‬ ‫ال ميكن ترتيبها‪.‬‬ ‫ميكن ترتيبها تصاعديا‬
‫أو تنازليا‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪6‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫ا� ت‬
‫ا�‬ ‫ال� ي�‬
‫ب‬ ‫واع‬‫�‬
‫أن‬
‫�‬

‫ضع عالمة أمام البيانات النوعية االسمية ‪:categorical nominal‬‬

‫التقديرات باألحرف (‪.).A, B+, B, B-, etc‬‬


‫أنواع الفاكهة (تفاح‪ ،‬موز‪ ،‬الخ)‪.‬‬
‫التقييامت عىل استطالع للرأي (غري مقبول‪ ،‬مقبول‪ ،‬عظيم)‪.‬‬
‫أنواع سالالت الكالب‪.‬‬
‫أنواع األفالم (رعب‪ ،‬كوميدي‪ ،‬الخ)‪.‬‬
‫النوع (ذكر‪ ،‬أنثى)‪.‬‬
‫الجنسية‬
‫التعليم (ثانوي فني‪ ،‬بكالريوس‪ ، ،‬ماجستري‪ ،‬دكتوراة)‪.‬‬

‫ضع عالمة أمام البيانات الكمية املتصلة ‪: continuous‬‬


‫املسافة بني البيت والعمل‪.‬‬
‫عدد صفحات كتاب‪.‬‬
‫كمية املطر خالل العام‪.‬‬
‫الوقت املستغرق لقطع مسافة ميل واحد‪.‬‬
‫عدد األفالم التي شاهدتها خالل أسبوع‪.‬‬
‫كمية املياة التي تستهلكها يف اليوم‪.‬‬
‫عدد التليفونات يف كل منزل‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪7‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫‪Summary Statistics‬‬

‫إحصائيات للتلخيص‬
‫‪Summary Statistics‬‬
‫تظهر أهمة علم اإلحصاء في تمكيننا من "رؤية" و"فهم" البيانات‬
‫والقيم المتوفرة معنا بشكل واضح‪.‬‬
‫فمثال لو كان لديك مرتبات ‪ 100‬موظف يف رشكة ما‪ ،‬فهذه القيم ليست ذات‬
‫قيمة كبرية يف حد ذاتها‪ ،‬ومن الصعب أن نفهم منها معلومة مفيدة‪.‬‬
‫ولكن‪ ،‬باستخدام اإلحصاء‪ ،‬واإلحصاء الوصفي بشكل أدق‪ ،‬نستطيع تلخيص تلك‬
‫املائة مرتب يف رقم واحد‪ ،‬يكون هو متوسط هذه املرتبات‪ ،‬وتشري قيمة املتوسط‬
‫إىل منتصف أو مركز القيم التي لدينا‪ ،‬بحيث تتوزع بقية القيم حولها‪ ،‬فيكون‬
‫تقريبا نصف القيم أكرب منها والنصف اآلخر أصغر منها‪.‬‬
‫وتوجد ثالث طرق لحساب‬
‫طرق حساب املتوسط‪:‬‬ ‫المتوسط‪ ،‬كل طريقة لها‬
‫حسابها الخاص ولها مميزاتها املتوسط احلسابي ‪Mean‬‬
‫وعيوبها‪ ،‬ومن المهم جدا‬
‫الوسيط ‪Media‬‬ ‫معرفة متى تستخدم إحدى هذه‬
‫الطرق‪ ،‬وسنتعرف على ذلك‬
‫املنوال ‪Mode‬‬ ‫عند شرح كل منها بالتفصيل‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪8‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫‪Summary Statistics‬‬
‫ونستطيع أيضا باستخدام اإلحصاء معرفة شكل "توزيع"‬
‫‪ Spread‬تلك المرتبات‪ ،‬بمعنى هل مرتبات الموظفين متقاربة‬
‫وال توجد فروق فيما بينهم‪ ،‬أم أن المرتبات تتفاوت بشكل‬
‫كبير وتوجد فروق كبيرة بينها‪ .‬وتساعدنا معادالت حساب توزيع‬
‫البيانات في معرفة ذلك‪.‬‬
‫وألن الصورة تغني عن ألف كلمة‪ ،‬نستطيع أيضا أن نعرب عن قيمة هذا التوزيع‪،‬‬
‫أو التفاوت‪ ،‬بني املرتبات عن طريق "رسم" هذا التوزيع‪ ،‬فيتضح لنا مبجرد‬
‫النظر مدى التفاوت بني القيم التي لدينا‪.‬‬

‫وسنرى خالل كل ما سبق‬


‫كيف ننتبه لما يسمى بالقيم‬
‫المتطرفة ‪ ،Outliers‬والتي‬
‫تؤثر على حساب المتوسط أو‬
‫توزيع البيانات‪ .‬فالقيم المتطرفة‬
‫‪ Outliers‬هي القيم الكبيرة جدا‬
‫أو الصغيرة جدا عن بقية القيم‬
‫األخرى‪ ،‬وسنرى كيفية تفاديها‬
‫حتى ال تؤثر على مصداقية‬
‫النتائج التي نستخلصها‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪9‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫‪Summary Statistics‬‬

‫‪Which of the below are measures of center‬‬


‫‪(check all that apply):‬‬
‫أيا مام يأيت مقاييس للمركز (اخرت كل ما ينطبق عليه اإلجابة الصحيحة)‪:‬‬

‫املتوسط الحسايب ‪Mean‬‬

‫االنحراف املعياري ‪Standard Deviation‬‬

‫التباين ‪Variance‬‬

‫الوسيط ‪Median‬‬

‫املدى الربيعي ‪Inter-quartile Range‬‬

‫املنوال ‪Mode‬‬

‫املدى ‪Range‬‬

‫القيمة الكربى ‪Maximum‬‬

‫القيمة الصغرى ‪Minimum‬‬

‫محمد لطفي‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪10‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الحسا� ي� ‪Mean‬‬
‫ب‬ ‫وسط‬
‫ت‬
‫الم�‬

‫المتوسط الحسابي ‪Mean‬‬


‫املتوسط الحسايب (أيضا الوسط الحسايب أو املعدل) ‪ Mean‬هو أحد املقاييس‬
‫التي تشري إىل مركز (منتصف) القيم ‪.center of the values‬‬

‫يتم حساب املتوسط الحسايب عن‬


‫طريق جمع جيمع القيم ‪sum of‬‬ ‫تعبر قيمة المتوسط الحسابي‬
‫‪ ،the values‬ثم قسمتها عىل‬ ‫عن القيمة التي تتركز حولها‬
‫جميع قيم البيانات التي لدينا‪.‬‬
‫عدد هذه القيم ‪count of the‬‬
‫‪.values‬‬

‫مجموع القيم‬
‫المتوسط الحسابي =‬
‫عدد القيم‬ ‫‪Mean‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪11‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الحسا� ي� ‪Mean‬‬
‫ب‬ ‫وسط‬
‫ت‬
‫الم�‬

‫مثال‪:‬‬
‫نفرتض أن لدينا مرتبات خمسة موظفني كالتايل‪:‬‬
‫‪2000 – 2300 – 1800 – 2000 – 2500‬‬
‫يساعدنا املتوسط الحسايب ‪ Mean‬عىل التعبري عن هذه القيمة بقيمة واحدة‬
‫فقط‪ ،‬هذه القيمة تعرب عن منتصف أو مركز البيانات التي لدينا‪ ،‬بحيث يتوزع‬
‫حولها بقية القيم األخرى‪.‬‬

‫ق‬ ‫ذ‬ ‫�أ ً ن‬


‫حس� م�ج موع ه�ه ال� ي�م‪:‬‬
‫ب‬ ‫ولا‪� :‬‬
‫‪2000 + 2300 + 1800 + 2000 + 2500 = 10600‬‬
‫ق‬ ‫ن ق‬ ‫ث ن‬
‫�ا� يً�ا‪�� :‬سم الم�ج موع على عدد ال� ي�م‬
‫‪10600 ÷ 5 = 2120‬‬

‫هذه هي قيمة متوسط ‪ Mean‬املرتبات‪ ،‬ونجد أنها بالفعل تقع تقريبا يف مركز‬
‫أو منتصف القيم‪.‬‬
‫‪2000‬‬
‫‪1800 2000 2120 2300 2500‬‬

‫المتوسط الحسابي‬
‫‪Mean‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪12‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الحسا� ي� ‪Mean‬‬
‫ب‬ ‫وسط‬
‫ت‬
‫الم�‬

‫مالحظة‬
‫المتوسط الحسابي ‪ Mean‬ال يجب أن يكون إحدى القيم التي لدينا‪ ،‬بل يمكن‬
‫أن يكون قيمة مختلفة‪ ،‬فالمتوسط ‪ 2120‬ال يوجد بين قيم المرتبات‪.‬‬

‫لنفرتض أن لدينا قيم ‪ 5‬مرتبات أخرى كالتايل‪:‬‬


‫‪2000 – 2300 – 15000 – 2000 – 2500‬‬
‫لحساب املتوسط الحسايب ‪:Mean‬‬
‫ق‬ ‫�أ ً ن‬
‫ولا‪�� :‬ج مع ال� ي�م‪:‬‬
‫‪2000 + 2300 + 15000 + 2000 + 2500 = 23800‬‬
‫ق‬ ‫ن ق‬ ‫ث ن‬
‫�ا� يً�ا‪�� :‬سم الم�ج موع على عدد ال� ي�م‪:‬‬
‫‪23800 ÷ 5 = 4760‬‬
‫بالرغم من أن عدد القيم يف هذا املثال‪ ،‬هو نفسه عدد القيم يف املثال السابق‬
‫(‪ ،)5‬إال أن وجود قيمة واحدة فقط هي ‪ ،15000‬والتي تزيد بشكل كبري عن‬
‫بقية القيم‪ ،‬أدى إىل ارتفاع قيمة املتوسط الحسايب ‪.Mean‬‬
‫قيمة المتوسط الحسابي في هذه الحالة ليست في منتصف‬
‫القيم‪ ،‬لذا فهي غير معبرة ‪ not representative‬عن‬
‫القيم التي لدينا‪ ،‬أي أنها ال تمثل مركز تلك البيانات‬

‫‪2000‬‬
‫‪2000‬‬ ‫‪2300 2500‬‬ ‫‪4760‬‬ ‫‪15000‬‬

‫والسبب هو وجود تلك القيمة الكبيرة جدا (‪ ،)15000‬وتسمى‬


‫في اإلحصاء بالقيمة المتطرفة أو الشاذة ‪.Outlier‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪13‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الحسا� ي� ‪Mean‬‬
‫ب‬ ‫وسط‬
‫ت‬
‫الم�‬
‫وال يشرتط أن تكون القيمة املتطرفة ‪ Outlier‬كبرية جدا‪ ،‬بل قد تكون أيضا‬
‫صغرية جدا‪ ،‬ويف هذه الحالة تقلل قيمة املتوسط الحسايب ‪.Mean‬‬

‫مالحظة‬
‫ال يتم حساب المتوسط الحسابي ‪ Mean‬إال للقيم الكمية فقط‬
‫‪ ،Quantitative values‬سواء كانت متصلة ‪ continuous‬أو‬
‫منفصلة ‪.Discrete‬‬

‫نستنتج مما سبق إلى أن المتوسط‬


‫الحسابي ‪ Mean‬يتأثر بالقيم‬
‫المتطرفة‪ ،‬وهذه يمثل قصور‬
‫وعيب في المتوسط الحسابي‪ ،‬لذا‬
‫يفضل في حال وجود قيم شاذة‬
‫‪ Outliers‬استخدام طريقة أخرى‬
‫لتالفي هذا التأثير‪ ،‬وهذا موضوع‬
‫الدرس القادم‪.‬‬

‫محمد لطفي‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪14‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الوس�ط ‪Median‬‬
‫ي‬

‫الوسيط ‪Median‬‬
‫الوسيط ‪ median‬وسيلة أخرى من وسائل قياس مركز (منتصف) القيم‬
‫‪.center of the values‬‬

‫الوسيط ‪Median‬‬

‫والـ ‪ %50‬األخرى تكون أكرب‬ ‫‪ %50‬من القيم تكون أقل‬


‫منه‪.‬‬ ‫من الوسيط ‪.median‬‬

‫ق ة‬
‫الوس�ط ‪:median‬‬
‫ي‬ ‫حسا�‬
‫ب‬ ‫ق‬ ‫طر���‬ ‫ت تي‬
‫ن‬ ‫ت‬ ‫�أ‬ ‫ت‬ ‫ت‬ ‫ت‬
‫�ر��� ال��م �ر���ا �صاعد�ا ( و �� ز‬
‫ل�ا)‪.‬‬
‫ي‬ ‫ا�‬ ‫ي‬ ‫ي ب‬ ‫ي‬ ‫ي ب‬
‫ف‬ ‫ق‬ ‫ن‬ ‫�ذ‬
‫رد� ‪n = odd value‬‬ ‫إ� ا كا� عدد ال� ي�م � ي‬
‫نضيف عليها ‪ ،1‬ثم نقسمها عىل ‪2‬‬ ‫ •‬
‫ • الناتج هو "ترتيب" الوسيط‪ ،‬وليس قيمة الوسيط‪.‬‬
‫ • نستخرج "قيمة" الوسيط من القيم املرتبة حسب الرتتيب الذي حصلنا عليه‪.‬‬
‫ز‬ ‫ق‬ ‫ن‬ ‫�ذ‬
‫إ� ا كا� عدد ال� ي�م �و�ج ي� ‪n = even value‬‬
‫ • نقسم العدد عىل ‪.2‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪15‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الوس�ط ‪Median‬‬
‫ي‬
‫ • نضيف إىل ناتج القسمة ‪.1‬‬
‫ • لدينا اآلن ترتيبان‪ ،‬فنستخرج القيمتني املقابلتني لهام‪.‬‬
‫ • نحسب متوسط ‪ mean‬القيمتني بجمعهام وقسمة املجموع عىل ‪.2‬‬
‫الناتج هو الوسيط ‪.median‬‬
‫سنحسب اآلن قيمة الوسيط ‪ Median‬على بيانات المرتبات من‬
‫المثال السابق‪ ،‬والتي كانت كالتالي‪:‬‬
‫‪2000 – 2300 – 15000 – 2000 – 2500‬‬
‫ت‬ ‫ت ت‬ ‫ق‬ ‫ت ت‬ ‫ن ق‬ ‫�أ‬
‫صاعد�ا‪:‬‬
‫ي‬ ‫ولا‪ :‬س��وم ب��ر� ي� ب� ال� ي�م �ر� ي� ب�ا �‬
‫‪2000 – 2000 – 2300 – 2500 – 15000‬‬
‫ث‬ ‫ن �ض ف‬ ‫ف‬ ‫ق‬ ‫ن‬ ‫ث ن‬
‫عل�ها ‪� ،1‬م‬
‫رد� (‪ ،)5‬س� ي�� ي‬
‫ن� قا� ي�ا‪ :‬ل�أ ن� تعدد ال� ي�م � ي‬
‫��سم ال�ا� ج� على ‪2‬‬
‫‪5+1=6‬‬
‫‪6÷2=3‬‬
‫ق ة‬ ‫ث ث ن ت �خ‬
‫الوس�ط‬
‫ي‬ ‫ر� � ي�م�‬
‫�ال�ا‪� :‬س� ج‬
‫قيمة الوسيط هي القيمة الثالثة = ‪2300‬‬

‫نجد أن قيمة الوسيط لهذه‬


‫القيم (‪ )2300‬معبرة بشكل‬
‫سليم عن المركز الذي تتوزع‬
‫‪2000 – 2000 – 2300 – 2500 – 15000‬‬ ‫حوله بقية القيم‪ ،‬على العكس‬
‫من قيمة المتوسط الحسابي‬
‫لنفس القيم (‪ )4760‬الذي‬
‫لم يكن في المنتصف لتأثره‬
‫بالقيم الشاذة ‪.Outliers‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪16‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫الوس�ط ‪Median‬‬
‫ي‬
‫من مميزات الوسيط ‪ Median‬أنه ال يتأثر بالقيم الشاذة‬
‫‪ ،Outliers‬وذلك أننا حين نرتب القيم تصاعديا‪ ،‬فإن القيم‬
‫الصغيرة جدا تكون في البداية‪ ،‬والقيم الكبيرة جدا تكون‬
‫في النهاية‪ ،‬فال يتم اختيار أي منهما‪ ،‬وتصبح قيمة الوسيط‬
‫‪ Median‬في هذه الحالة معبرة عن القيم بشكل أدق من‬
‫المتوسط الحسابي ‪.Mean‬‬
‫مالحظة‬
‫مثل المتوسط الحسابي ‪ ،Mean‬فإنك تستطيع حساب قيمة الوسيط‬
‫‪ Median‬من القيم الكمية فقط ‪ ،Quantitative‬سواء‬
‫المنفصلة ‪ Discrete‬أو المتصلة ‪.Continuous‬‬

‫مثال آخر‬
‫لديك درجات مجموعة من الطالب‪ ،‬وتريد إيجاد قيمة الوسيط ‪ Median‬لها‪:‬‬
‫‪76 – 90 – 55 – 64 – 94 – 86 – 71 – 80‬‬
‫ت‬ ‫ت ت‬ ‫ق‬ ‫ت ت‬ ‫ن ق‬ ‫�أ‬
‫صاعد�ا‬
‫ي‬ ‫ولا‪�� :‬وم ب��ر� ي� ب� ال� ي�م �ر� ي� ب�ا �‬
‫‪55 – 64 – 71 – 76 – 80 – 86 – 90 – 94‬‬
‫ة‬ ‫ق‬ ‫ن ق‬ ‫ز‬ ‫ق‬ ‫ن‬ ‫ث ن‬
‫�ا� ي�ا‪ :‬ل�أ� عدد ال� ي�م �و�ج ي� (‪�� ،)8‬وم ب�ال�سم� على ‪2‬‬
‫‪8÷2=4‬‬
‫ثم نجمع عىل الناتج ‪1‬‬
‫‪4+1=5‬‬
‫اآلن لدينا ترتيبان (‪ )5 ،4‬لقيمتني‪ ،‬هام‪80 ،76 :‬‬
‫ن‬ ‫ن‬ ‫ق ت‬ ‫ت‬ ‫ث ث ن‬
‫حس� م�وسط ال� ي�م� ي�� ‪ Mean‬ل�حصل على‬
‫ب‬ ‫�‬ ‫�ال�ا‪:‬‬
‫الوس�ط ‪Median‬‬
‫ي‬
‫‪(76 + 80) ÷ 2 = 78‬‬

‫‪17‬‬
‫محمد لطفي‬ ‫‪facebook.com/groups/arab.data.analysis‬‬
‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫الم�وال ‪Mode‬‬

‫‪Mode‬‬ ‫المنوال‬
‫المنوال ‪ Mode‬هو القيمة األكثر "تكرارا" ‪ Frequency‬في‬
‫البيانات‪.‬‬
‫لدينا أعمار مجموعة من األطفال المشتركين في ورشة رسم‬
‫كالتالي‪:‬‬
‫‪9 – 7 – 11 – 9 – 12 – 11 – 8 – 9‬‬
‫ألن املنوال ‪ Mode‬هو القيمة ذات أكرب "تكرار" ‪ ،Frequency‬فيجب أوال‬
‫حساب تكرار كل قيمة‪.‬‬
‫ ‪9‬‬ ‫‪3‬‬
‫ ‪7‬‬ ‫‪1‬‬
‫ ‪11‬‬ ‫‪2‬‬
‫ ‪12‬‬ ‫‪1‬‬
‫ ‪8‬‬ ‫‪1‬‬
‫فنجد أن القيمة ‪ 9‬هي صاحبة أكرب تكرار (‪ ،)3‬لذا فإن املنوال ‪9 = Mode‬‬

‫إذا علمت أن نوع هؤاالء األطفال كان كالتالي‪:‬‬


‫ذكر – أنثى – أنثى – ذكر – أنثى – ذكر – أنثى – أنثى‬
‫وأردنا أن نستنتج املنوال ‪ Mode‬الخاص بتلك البيانات‪.‬‬
‫نقوم مرة أخرى بحساب "تكرار" ‪ Frequency‬كل قيمة‪:‬‬
‫‪3‬‬ ‫ ‬‫ذكر‬
‫‪5‬‬ ‫ ‬
‫أنثى‬
‫ألن القيمة "أنثى" هو صاحب أكرب تكرار ‪ Frequency‬لذا فإن املنوال‬
‫‪ Mode‬هو القيمة "أنثى"‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪18‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن‬
‫الم�وال ‪Mode‬‬
‫مالحظة‬

‫نستنتج من المثال السابق‪ ،‬أن من مميزات المنوال ‪ Mode‬أننا نستطيع‬


‫حسابه من القيم الكمية ‪ ،Quantitative‬وأيضا من القيم النوعية‬
‫‪.Categorical‬‬

‫تم اشتراك طفل جديد في ورشة الرسم‪ ،‬وكان عمره ‪ 11‬عاما‪،‬‬


‫لتصبح البيانات كالتالي‪:‬‬
‫‪9 – 7 – 11 – 9 – 12 – 11 – 8 – 9 – 11‬‬
‫وأردت أن تحسب املنوال لهذه البيانات مرة أخرى‪.‬‬
‫سنقوم أوال بحساب تكرار كل قيمة‪:‬‬
‫ ‪9‬‬ ‫‪3‬‬
‫ ‪7‬‬ ‫‪1‬‬
‫ ‪11‬‬ ‫‪3‬‬
‫ ‪12‬‬ ‫‪1‬‬
‫ ‪8‬‬ ‫‪1‬‬
‫ستالحظ أن أكرب تكرار (‪ )3‬هو لقيمتني‪ .11 ،9 :‬ويف هذه الحالة يصبح‬
‫املنوال هام هاتني القيمتني‪ .‬وتكون البيانات لدينا ‪ ،Bimodal‬أو‬
‫مزدوجة املنوال‪.‬‬

‫محمد لطفي‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪19‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬

‫‪Notation‬‬ ‫الترميز‬
‫الترميز ‪ Notation‬هو اللغة المستخدمة في الرياضيات‪،‬‬
‫وهي تستخدم الرموز بدال من الكلمات‪.‬‬
‫يعترب الرتميز ‪ Notation‬لغة عاملية يتواصل بها الجميع لحل املشكالت‬
‫املتعلقة بالبيانات والقيم والرياضيات بشكل عام‪.‬‬
‫لفهم الترميز ‪ Notation‬بشكل واضح‪ ،‬دعنا نتخيل المثال التالي‪:‬‬
‫لديك مدونة ‪ blog‬عىل االنرتنت‪ ،‬وتريد معرفة املعلومات التالية‪:‬‬
‫كم عدد األشخاص الذين يزورون مدونتك؟‬
‫كم يقيض الزائرون من الوقت يف مدونتك؟‬
‫هل توجد اختالفات يف عدد الزيارات للمدونة فيام بني أيام األسبوع؟‬
‫كم عدد عمليات الرشاء التي تتم من خالل املدونة؟‬
‫لإلجابة على كل هذه التساؤالت‪ ،‬قررت إنشاء جدول في برنامج‬
‫‪ MS Excel‬لتسجيل البيانات الخاصة بمدونتك‪ ،‬كما يلي‪:‬‬
‫‪DATE DOW* TIME BUY‬‬
‫‪Jun 15 Thur. 5 No‬‬
‫‪Jun 15 Thur. 10 Yes‬‬
‫‪Jun 16 Fri. 7 Yes‬‬
‫‪Jun 16 Fri. 9 Yes‬‬
‫‪Jun 16 Fri. 12 No‬‬
‫ما قمنا بتصميمه يسمى بشكل عام ‪( dataset‬مجموعة من‬
‫البيانات المرتبطة ببعضها)‪.‬‬
‫‪DOW: Day of the Week‬‬
‫اليوم الذي متت الزيارة فيه‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪20‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬
‫تتكون من ‪ Columns‬أعمدة (‪.)… ,DATE, DOW‬‬
‫‪DATE DOW TIME BUY‬‬
‫نستطيع التعبير عن أي عمود ‪ column‬بحرف مثل ‪.X, y or Z‬‬
‫‪DATE DOW TIME BUY‬‬
‫ )‪(X) (Y‬‬
‫هذه األحرف تمثل ما يسمى بالمتيغر العشوائي ‪Random‬‬
‫‪.variable‬‬
‫المتغير العشوائي ‪ random variable‬هو نائب عن‬
‫‪ placeholder‬أو ممثل عن جميع القيم المحتملة ‪possible‬‬
‫‪ values‬لعملية معينة ‪( process‬مثل ‪ DATE‬أو ‪.)BUY‬‬
‫بعنى‪ ،‬أننا نستطيع يف الجدول السابق‬
‫وبلغة الرتميز ‪ Notation‬التعبري عن العمود (‪ ،)DATE‬والذي‬
‫يعترب متغري عشوايئ ‪random‬‬ ‫نعرب عن املتغري العشوائي‬
‫‪ random variable‬املمثل ‪ ،variable‬بالحرف ‪ ،X‬والذي‬
‫جلميع القيم احملتملة بأحرف‬
‫ميثل الرتميز الخاص به‪ ،‬هنا نحن قمنا‬
‫كبرية‪ ،‬مثل ‪ ،X, Y, Z‬أو أية أحرف‬
‫باستخدام الرتميز ‪ X‬للتعبري عن املتغري‬ ‫أخرى‪.‬‬
‫العشوايئ ‪.DATE‬‬
‫والترميز ‪ X‬في هذه الحالة‬
‫يمثل جميع القيم المحتملة‬
‫)‪(X‬‬
‫‪DATE DOW TIME BUY‬‬ ‫للمتغير العشوائي ‪،DATE‬‬
‫‪Jun 15 Thur. 5 No‬‬ ‫وال يعبر عن قيمة محددة‬
‫‪Jun 15 Thur. 10 Yes‬‬
‫ ‪Jun 16 Fri.‬‬ ‫‪7 Yes‬‬ ‫بذاتها‪ .‬بمعنى‪ ،‬إذا قلنا ‪،X‬‬
‫ ‪Jun 16 Fri.‬‬ ‫‪9 Yes‬‬ ‫فنحن نعني أية قيمة من قيم‬
‫ ‪Jun 16 Fri.‬‬ ‫‪12 No‬‬
‫المتغير ‪ ،DATE‬وليست قيمة‬
‫معينة‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪21‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬
‫تخيل أن المتغير العشوائي‬
‫‪ random variable‬هو فنجان‬
‫قهوة‪ ،‬مجرد وعاء يستطيع أن‬
‫يحمل جميع األنواع المحتملة‬
‫للقهوة‪ ،‬ولكنه ليس هو‬
‫القهوة ذاتها‪ ،‬هو فقط وعاء‬
‫لها‪.‬‬

‫لإلجابة على التساؤالت التي قمنا بطرحها‪ ،‬وصممنا الجدول‬


‫لإلجابة عنها‪ ،‬فإننا نستخدم قيم كل عمود ‪ column‬للحصول‬
‫على المعلومة التي نريدها‪ ،‬فمثال‪:‬‬
‫كم يقيض الزائرون من الوقت يف مدونتك؟‬
‫نستطيع من خالل بيانات العمود ‪ Time‬اإلجابة عىل هذا التساؤل‪.‬‬
‫كم عدد عمليات الرشاء التي تتم من خالل املدونة؟‬
‫نستطيع اإلجابة عىل هذا السؤال من خالل قيم العمود ‪.Buy‬‬
‫�ة‬ ‫ن ق‬ ‫�ة ف ن‬ ‫ق‬
‫ال�هو و���ج ا� ال�هو‬
‫ئ‬ ‫�ش‬ ‫ت �غ‬ ‫َ ظ ة‬ ‫ق ة‬
‫ال� ي�م� الملاح�� والم� ي�ر الع وا� ي�‬
‫‪Observed Values and Random Variables‬‬
‫القيمة المالحظة‬ ‫إذا كان املتغري العشوايئ ‪random‬‬
‫‪ variable‬هو فنجان القهوة‪،‬‬
‫فإن القهوة الرتيك‪ ،‬مثال‪ ،‬هي القيمة‬
‫املالحظة ‪،observed value‬‬
‫أي ما ميكننا أن ندركه ونالحظه‪،‬‬
‫فتستطيع شم رائحة القهوة الرتيك‬
‫وتذوقها وقياس حجمها وتحليل المتغير العشوائي‬
‫مكوناتها‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪22‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬
‫وإذا أردنا استخدام الترميز ‪ Notation‬لإلشارة إلى القهوة التركي‪،‬‬
‫مالحظة ‪observed‬‬‫َ‬ ‫وبلغة اإلحصاء اإلشارة إلى قيمة محددة‬
‫‪ ،value‬نستخدم حرفا من الحروف الصغيرة‪ ،‬مثل‪ ،x :‬ويلحق‬
‫بها ‪( subscript‬حرف تحتي) لإلشارة إلى رقم القيمة التي نشير‬
‫إليها‪ ،‬ويشار غالبا إلى آخر قيمة بحرف ‪ ،n‬ليكون شكل آخر متغير‬
‫َ‬
‫مالحظ هو ‪.xn‬‬

‫‪X‬‬
‫‪DATE DOW TIME BUY‬‬
‫ ‪ 5‬‬ ‫‪x1‬‬
‫ ‪ 10‬‬ ‫‪x2‬‬
‫ ‪ ...‬‬
‫ ‪ ...‬‬
‫‪ n‬‬ ‫‪xn‬‬

‫‪x1 + x2‬‬ ‫نستطيع التعبري عن جمع أول قيمتني كالتايل‪:‬‬


‫‪= 5 + 10 = 15‬‬
‫‪DATE DOW TIME BUY‬‬
‫ ‪ 5‬‬ ‫‪x1‬‬
‫ ‪ 10‬‬ ‫‪x2‬‬
‫ ‪ 7‬‬ ‫‪x3‬‬
‫ ‪ 9‬‬ ‫‪x4‬‬
‫‪ 12‬‬ ‫‪x5‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪23‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬
‫قد يبدو هذا سهال في عدد القيم القليل‪ ،‬ولكن لو كان معنا‬
‫‪ 100‬قيمة مثال‪ ،‬وأردنا التعبير عن جمع كل تلك القيم بالترميز‬
‫‪ ،Notation‬سيكون األمر أكثر صعوبة‪.‬‬
‫توجد طريقة أسهل لكتابة صيغة الجمع ‪ Sum‬باستخدام الرتميز‬
‫‪.Notation‬‬
‫نستخدم للجمع حرف ∑ (وينطق سيجما ‪ ،)Sigma‬وهو حرف‬
‫من الحرف اليونانية (حرف كبير ‪.)capital letter‬‬

‫‪∑ xi‬‬
‫‪2‬‬ ‫النهاية‬
‫معنى هذا الترميز أن‬
‫نقوم بالجمع من القيمة‬
‫‪ x1‬حتى القيمة ‪x2‬‬
‫‪i=1‬‬ ‫البداية‬

‫‪x1 + x2‬‬
‫‪i‬‬
‫نستخدم الرمز للتعبير‬
‫‪xi‬‬ ‫عن رقم القيمة‬

‫‪∑ xi‬‬
‫‪5‬‬
‫‪x3 + x4 + x5‬‬
‫‪i=3‬‬ ‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪24‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬

‫‪∑ i‬‬
‫‪n‬‬ ‫إذا أردنا جمع جميع القيم‪،‬‬

‫‪x‬‬ ‫نستخدم الحرف ‪ n‬بدال من ذكر‬


‫ترتيب القيمة التي نريد الوقوف‬
‫عندها‪.‬‬
‫‪i=1‬‬
‫يف هذه الحالة سنقوم بجمع جميع القيم التي لدينا‪:‬‬

‫‪x1 + x2 + x3 + x4 + x5‬‬
‫‪5 + 10 + 7 + 9 + 12‬‬
‫‪= 43‬‬
‫ت‬ ‫ة‬ ‫ن‬ ‫ت‬
‫الحسا� ي� ‪Mean‬‬
‫ب‬ ‫حسا� الم�وسط‬
‫ب‬ ‫ع� ي�ر ع� معادل�‬
‫ال� ت ب‬
‫رم��ز ‪Notation‬‬
‫ب�ال� ي‬
‫نعرف أن املتوسط الحسايب ‪ Mean‬يساوي مجموع القيم عىل عددها‪.‬‬

‫مجموع القيم‬
‫المتوسط الحسابي =‬
‫عدد القيم‬ ‫‪Mean‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪25‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫رم� ز� ‪Notation‬‬
‫ي‬
‫ت‬
‫ال�‬
‫نستطيع اآلن إعادة كتابة املعادلة السابقة بالرتميز التايل‪:‬‬

‫‪∑ i‬‬
‫‪n‬‬
‫‪x‬‬ ‫جمموع‬
‫القيم‬
‫‪i=1‬‬
‫‪n‬‬ ‫مقسوم‬
‫على عددها‬

‫وميكن إعادة كتابتها كالتايل‪ ،‬لتعطي نفس املعنى‪:‬‬

‫∑‬
‫‪n‬‬
‫‪1‬‬
‫‪x‬‬
‫‪n i=1 i‬‬
‫التعبير عن مجموعة من القيم بقيمة واحدة فقط يسمى‬
‫"التجميع" ‪ ،Aggregation‬مثل التعبير عن جميع مرتبات‬
‫موظفي شركة ما بالمتوسط الحسابي (رقم واحد)‪ ،‬أو جمع‬
‫مجموعة من القيم للحصول على ناتج الجمع (رقم واحد)‪.‬‬
‫أمثلة عىل "التجميع" ‪ :Aggregation‬املتوسط الحسايب ‪ ،Mean‬الوسيط‬
‫‪ ،Median‬املنوال ‪ ،Mode‬والجمع ‪.Sum‬‬

‫‪26‬‬
‫محمد لطفي‬ ‫‪facebook.com/groups/arab.data.analysis‬‬
‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫االنتشار ‪Spread‬‬
‫أنت مدرب لفريق كرة قدم‪ ،‬وتريد االختيار من بني العبي هجوم‬
‫لالنضامم إىل فريقك‪ ،‬وكانت لديك البيانات التالية عن عدد‬
‫األهداف التي سجلها كل العب يف العرش مباريات األخرية له‪:‬‬
‫الالعب األول‪:‬‬
‫‪2, 3, 0, 2, 2, 3, 1, 2, 2, 3‬‬
‫الالعب الثاين‪:‬‬
‫‪1, 2, 0, 2, 0, 2, 6, 2, 4, 1‬‬

‫بدأت بحساب مقاييس المركز ولكن بالنظر إىل القيم املتاحة لكل‬
‫‪ measures of center‬وكانت العب‪ ،‬الحظت اختالفا‪ ،‬مام يعني أن‬
‫قيمة املتوسط وحده ال تقول كل يشء‬ ‫كلها متساوية لالعبين‪:‬‬
‫المتوسط الحسابي ‪ 2 = Mean‬عن البيانات لفهمها والحكم عليها‪.‬‬
‫الوسيط ‪2 = Median‬‬
‫المنوال ‪2 = Mode‬‬

‫ما تهتم به أيضا هو استقرار مستوى الالعب‪ ،‬مبعنى عدم وجود‬


‫تفاوت كبري يف أدائه من مباراة إىل أخرى‪.‬‬

‫يف هذه الحالة تحتاج إىل قياس مدى انتشار ‪ Spread‬البيانات التي لديك‬
‫وابتعادها عن بعضها البعض‪ .‬وكلام زاد هذا االنتشار كلام كان التفاوت كبريا بني‬
‫القيم‪ ،‬وكلام قل كلام كان التفاوت صغريا‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪27‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫أسهل طريقة لفعل ذلك هو قياس ما يسمى بالمدى‬
‫‪ ،Range‬وذلك بطرح أصغر قيمة ‪ Minimum value‬من أكبر‬
‫قيمة ‪.Maximum value‬‬
‫‪Range = Maximum value – Minimum value‬‬
‫حساب الـ ‪ Range‬لالعب األول‪ :‬نجد أن قيم الالعب الثاني لديها‬
‫‪ Range = 3 - 0 = 3‬انتشار ‪ Spread‬أعلى من قيم‬
‫حساب الـ ‪ Range‬لالعب الثاين‪ :‬الالعب األول‪ ،‬بمعنى أن أداء‬
‫‪ Range = 6 – 0 = 6‬الالعب األول أكثر استقرارا من‬
‫أداء الالعب الثاني‪.‬‬
‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫الالعب األول‬
‫‪2‬‬ ‫‪3‬‬

‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬


‫‪4‬‬ ‫‪6‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫الالعب الثاني‬
‫ولكن‪ ،‬ألن املدى ‪ Range‬يتم حسابه عن طريق أكرب وأصغر قيمة‪ ،‬فهذا يؤدي‬
‫إىل تأثره بالقيم املتطرفة أو الشاذة ‪ ،Outliers‬وبالفعل سنجد يف بيانات‬
‫الالعب الثاين قيمة متطرفة هي (‪ ،)6‬مام يجعل الـ ‪ Range‬ليس دقيقا يف‬
‫قياس مدى انتشار البيانات التي لدينا‪.‬‬
‫للحصول عىل مقياس أدق نلجأ إىل نجنيب القيم املتطرفة ‪( Outliers‬سواء‬
‫الكبرية جدا أو الصغرية جدا)‪.‬‬
‫يتم ذلك عن طريق حساب اإلرباعي األول ‪،First Quartile Q1‬‬
‫اإلرباعي الثاني ‪ ،Second Quartile Q2‬واإلرباعي الثالث ‪Third‬‬
‫‪.Quartile Q3‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪28‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫نبدأ أول بترتيب القيم ترتيبا تصاعديا‪.‬‬
‫تقسم اإلرباعيات ‪ Quartiles‬القيم إىل ‪ ٤‬أقسام متساوية‪ ،‬كل قسم ميثل‬
‫‪ %٢٥‬من البيانات‪.‬‬
‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪4‬‬

‫اإلرباعي األول‬ ‫اإلرباعي الثاني‬ ‫اإلرباعي الثالث‬


‫‪First Quartile‬‬ ‫‪First Quartile‬‬ ‫‪First Quartile‬‬
‫‪Q1‬‬ ‫‪Q2‬‬ ‫‪Q1‬‬
‫اإلرباعي الثاين هو نفسه‬
‫الوسيط ‪Median‬‬

‫توجد طريقتان لحساب اإلرباعي األول ‪ ،Q1‬واإلرباعي الثالث ‪Q3‬‬


‫ق ة‬
‫الطر��� ال�أولى‪:‬‬
‫ي‬
‫اعتبار اإلرباعي األول ‪ First Quartile Q1‬هو الوسيط ‪Median‬‬
‫للقيم التي تبدأ من أقل قيمة ‪ Minimum‬وتنتهي عند القيمة التي قبل‬
‫اإلرباعي الثاين (الوسيط ‪ Median‬لجميع القيم)‪.Q2‬‬
‫أوال‪ :‬نحسب الوسيط ‪ ،Median‬الذي هو نفسه اإلرباعي‬
‫الثاني ‪:Q2‬‬
‫ترتيب الوسيط = عدد القيم ÷ ‪5 = 2 ÷ 10 = 2‬‬
‫مبا أنه عدد القيم زوجي (‪ ،)١٠‬فإن الوسيط هو املتوسط الحسايب ‪Mean‬‬
‫للقيمتني الخامسة والسادسة‪.‬‬
‫‪2+2‬‬
‫=‪2‬‬ ‫الوسيط ‪= Median‬‬
‫‪2‬‬ ‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪29‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫‪2‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬
‫اإلرباعي الثاني‬
‫‪Second Quartile‬‬
‫‪Q2‬‬
‫اإلرباعي الثاين هو نفسه‬
‫الوسيط ‪Median‬‬

‫ثانيا‪ :‬نحسب اإلرباعي األول ‪:Q1‬‬

‫‪2‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬

‫اإلرباعي األول ‪ Q1‬هو‬


‫الوسيط ‪ Median‬لهذه‬
‫القيم‪.‬‬

‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬

‫بحساب الوسيط ‪ Median‬لهذه املجموعة من القيم‪ ،‬سنجد أنه يساوي ‪،2‬‬


‫وهو قيمة اإلرباعي األول ‪Q1‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪30‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫‪2‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬

‫اإلرباعي األول‬ ‫اإلرباعي الثاني‬


‫‪First Quartile Second Quartile‬‬
‫‪Q1‬‬ ‫‪Q2‬‬
‫الوسيط‬

‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬

‫اإلرباعي الثالث ‪ Q3‬هو‬


‫الوسيط ‪ Median‬لهذه‬
‫القيم‪.‬‬

‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬

‫بحساب الوسيط ‪ Median‬لهذه املجموعة من القيم‪ ،‬سنجد أنه يساوي ‪،3‬‬


‫وهو قيمة اإلرباعي الثالث ‪Q3‬‬

‫‪2‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬

‫اإلرباعي األول‬ ‫اإلرباعي الثاني‬ ‫اإلرباعي الثالث‬


‫‪First Quartile Second Quartile Third Quartile‬‬
‫‪Q1‬‬ ‫‪Q2‬‬ ‫‪Q3‬‬
‫الوسيط‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪31‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫ق ة ث ن ة‬
‫الطر��� ال�ا� ي��‪:‬‬
‫ي‬
‫اإلرباعي األول ‪First Quartile Q1‬‬
‫ألن اإلربايع األول يقع عند أول ربع‬
‫(‪ )%٢٥‬من القيم‪ ،‬نقوم بالقسمة ىلع ‪٤‬‬
‫إلجياد ترتيبه أو موقعه‬ ‫أوال‪ :‬نرتب القيم ترتيبا تصاعديا‪.‬‬
‫ثانيا‪ :‬نقسم عدد القيم عىل ‪n ÷ 4 4‬‬
‫ •إذا كان الناتج رقم صحيح ‪ ،integer‬فإن الـ ‪ Q1‬هو املتوسط الحسايب ‪Mean‬‬
‫للقيمتني اللتني عند هذا الرتتيب والرتتيب الذي يليه‪.‬‬
‫مثال‪ :‬إذا كانت لدينا القيم التالية‪:‬‬
‫‪12, 7, 10, 8, 5, 10, 5, 11‬‬
‫أوال‪ :‬نرتب القيم ترتيبا تصاعديا‪:‬‬
‫‪5, 5, 7, 8, 10, 10, 11, 12‬‬
‫ثانيا‪ :‬نقسم عدد القيم (‪ )٨‬عىل ‪٤‬‬
‫‪٢=٤÷٨‬‬
‫مبا أن الناتج عدد صحيح‪ ،‬إذن اإلرباعي األول سيكون متوسط القيمتني الثانية والثالثة‬
‫اإلرباعي األول = (‪6 = 2 ÷ 12 = 2 ÷ )7 + 5‬‬
‫ •إذا كان ناتج القسمة عدد غري صحيح‪ ،‬نقوم بتقريبه إىل القيمة األعىل‪ ،‬ويكون هذا هو‬
‫ترتيب قيمة اإلرباعي األول ‪.Q1‬‬
‫مثال‪ :‬لدينا التالية‪:‬‬
‫‪11, 7, 10, 8, 5, 10, 5‬‬
‫أوال‪ :‬نرتب القيم ترتيبا تصاعديا‪:‬‬
‫‪5, 5, 7, 8, 10, 10, 11‬‬
‫ثانيا‪ :‬نقسم عدد القيم (‪ )٧‬عىل ‪٤‬‬
‫‪1.75 = ٤ ÷ ٧‬‬
‫مبا أن الناتج عدد غري صحيح‪ ،‬إذن سنقوم بتقريبه إىل القيمة األعىل (‪ ،)٢‬ويكون اإلرباعي‬
‫األول سيكون عند القيمة الثانية (‪.)5‬‬
‫اإلرباعي الثالث ‪Third Quartile Q3‬‬
‫نحسب ‪3n ÷ 4‬‬
‫إذا كان الناتج رقم صحيح ‪ ،integer‬فإن الـ ‪ Q3‬هو املتوسط الحسايب ‪Mean‬‬
‫للقيمتني اللتني عند هذا الرتتيب والرتتيب الذي يليه‪.‬‬
‫إذا كان ناتج القسمة عدد غري صحيح‪ ،‬نقوم بتقريبه إىل القيمة األعىل‪ ،‬ويكون هذا هو ترتيب‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪32‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫قيمة اإلرباعي األول ‪.Q3‬‬

‫إيجاد اإلرباعي األول والثالث لالعب الثاني بالطريقة الثانية‪:‬‬

‫األهداف التي أحرزها الالعب الثاين يف آخر عرش مباريات‪:‬‬


‫‪1, 2, 0, 2, 0, 2, 6, 2, 4, 1‬‬
‫إيجاد قيمة اإلرباعي األول ‪First Quartile Q1‬‬
‫أوال نقوم برتتيب القيم ترتيبا تصاعديا‪:‬‬
‫‪0, 0, 1, 1, 2, 2, 2, 2, 4, 6‬‬
‫ثانيا‪ :‬نحسب ترتيب اإلرباعي األول‬
‫نقسم عدد القيم (‪ )١٠‬عىل ‪٤‬‬
‫‪2.5 = 4 ÷ 10‬‬
‫ألن الناتج عدد غري صحيح‪ ،‬نقوم بتقريبه للقيمة األعىل (‪.)3‬‬
‫إذن اإلرباعي األول ‪ Q1‬هو القيمة الثالثة = ‪1‬‬

‫‪2‬‬
‫‪0‬‬ ‫‪0‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪4‬‬ ‫‪6‬‬

‫اإلرباعي األول‬ ‫اإلرباعي الثاني‬


‫‪First Quartile Second Quartile‬‬
‫‪Q1‬‬ ‫‪Q2‬‬
‫الوسيط ‪Median‬‬
‫إيجاد قيمة اإلرباعي الثالث ‪Second Quartile Q3‬‬
‫نحسب ترتيب اإلرباعي الثالث‪:‬‬
‫‪3n ÷ 4 = 3 × 10 ÷ 4 = 30 ÷ 4 = 7.5‬‬
‫ألن الناتج عدد غري صحيح‪ ،‬نقوم بتقربيه إىل القيمة األعىل (‪.)8‬‬
‫إذن اإلرباعي الثالث هو القيمة الثامنة = ‪2‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪33‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫‪2‬‬
‫‪0‬‬ ‫‪0‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪4‬‬ ‫‪6‬‬

‫اإلرباعي األول‬ ‫اإلرباعي الثاني‬ ‫اإلرباعي الثالث‬


‫‪First Quartile Second Quartile Third Quartile‬‬
‫‪Q1‬‬ ‫‪Q2‬‬ ‫‪Q3‬‬
‫الوسيط ‪Median‬‬

‫يف البداية قمنا بحساب املدى (أكرب قيمة ‪ -‬أقل قيمة)‪ ،‬ووجدنا أداء الالعب‬
‫األول أكرث استقرارا من الالعب الثاين‪.‬‬
‫ولكننا وجدنا أن املدى يتأثر بالقيم املتطرفة ‪ ،Outliers‬فقمنا بحساب‬
‫اإلرباعيات (اإلرباعي األول والثاين والثالث) لنتمكن من حساب املدى اإلرباعيي‬
‫‪ Interquartile Range‬لنتجنب القيم املتطرفة ‪.Outliers‬‬
‫‪Interquartile Range = Q3 - Q1‬‬
‫المدى اإلرباعيي لالعب األول = ‪1 = 2 - 3‬‬

‫المدى اإلرباعيي لالعب الثاني = ‪1 = 1 - 2‬‬

‫نالحظ أنه بعد استبعاد القيم املتطرفة وحساب املدى اإلرباعي فإن الالعبني‬
‫أصبحا متساويان يف مدى انتشار القيم ‪ ،Spread‬وأصبحا متساويان يف‬
‫استقرار األداء‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪34‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫التلخيص بخمسة أرقام‬


‫‪The Five-number Summary‬‬
‫‪Maximum‬‬
‫تستخدم هذه القيم الخمس‬
‫‪Third Quartile‬‬ ‫لمعرفة مدى انتشار أو‬
‫‪Median‬‬ ‫تفاوت القيم فيما بينها‪ ،‬مما‬
‫يساعد على استخالص النتائج‬
‫‪First Quartile‬‬ ‫والحكم على ما لدينا من قيم‪.‬‬
‫‪Minimum‬‬

‫وميكن متثيل هذه القيم الخمس بالشكل التايل‪ ،‬ويسمى ‪:Box Plot‬‬

‫القيمة األصغر‬ ‫القيمة األعلى‬


‫‪Minimum‬‬
‫اإلرباعي األول‬ ‫اإلرباعي الثالث‬
‫‪Maximum‬‬
‫‪First Quartile‬‬ ‫‪Third Quartile‬‬
‫‪Q1‬‬ ‫‪Q3‬‬
‫اإلرباعي الثاني‬
‫‪Second Quartile‬‬
‫‪Q2‬‬
‫الوسيط‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪35‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫ن‬
‫ا�ا�ت‬ ‫ق‬ ‫ن ت �ش‬ ‫�أ�ش‬
‫ال� ي�‬
‫ب‬ ‫م‬‫�‬‫ي‬ ‫�‬ ‫ار‬ ‫�‬ ‫ا�‬ ‫كال‬
‫التوزيع االعتدالي ‪Normal Distribution‬‬

‫يسمى أيضا‬ ‫ميثل كل عمود عدد‬


‫بالتوزيع املتماثل‬
‫‪Symmetric‬‬
‫تكرارات كل قيمة‪،‬‬
‫ألن كل نصف منه‬ ‫العمود األطول هو‬
‫مياثل متاما النصف‬ ‫صاحب التكرار األكرب‪.‬‬
‫اآلخر‪.‬‬

‫يف التوزيع االعتدايل تقريبا تتساوي قيم‬


‫املتوسط احلسابي والوسيط واملنوال‪.‬‬

‫يتميز التوزيع االعتدايل بأن معظم القيم تتمركز حول املنتصف‪ ،‬يأخذ التوزيع‬
‫شكل الجرس‪ ،‬لذا يطلق عليه أحيانا ‪.Bell-Shaped‬‬
‫يف التوزيع االعتدايل تكون قيم املتوسط الحسايب ‪ Mean‬والوسيط‬
‫‪ Median‬واملنوال ‪ Mode‬تقريبا متساوية‪.‬‬

‫نجد التوزيع االعتدايل يف قيم مثل‪ :‬أوزان وأطوال األفراد يف مجتمع ما أو كمية‬
‫هطول األمطار‪ ،‬أو درجات االختبار القياسية مثل اختبار الذكاء‪.‬‬
‫يف هذه األمثلة نجد أن معظم القيم تكون حول املنتصف‪ ،‬فوق املتوسط أو أقل‬
‫منه (معظم الناس ذكاءهم أقل أو أعىل من املتوسط بقليل)‪ ،‬والقليل من القيم‬
‫تكون قليلة جدا (القليل من الناس لديهم إعاقات ذهنية) أو كبرية جدا (القليل‬
‫يتميز بالعبقرية)‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪36‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫التوزيع الملتوي ناحية اليسار‬
‫املتوسط احلسابي‬ ‫‪Left Skewed Distribution‬‬
‫‪ Mean‬قيمته أقل من‬
‫بقية املتوسطات‪ ،‬حيث‬ ‫املنوال ‪Mode‬‬
‫أنه يتأثر بالقيم الصغرية‪.‬‬ ‫هو القيمة ذات‬
‫أكرب تكرار‬

‫يف الـ ‪ Left Skewed‬تكون قيمة الوسيط ‪Median‬‬


‫أعلى من قيمة املتوسط احلسابي ‪.Mean‬‬
‫يتميز التوزيع امللتوي ناحية اليسار ‪ Left Skewed‬بأن معظم القيم تكون‬
‫أكرب من املتوسط الحسايب‪.‬‬
‫يف هذه الحالة يكون املنوال ‪ Mode‬أكرب من الوسيط ‪ Median‬والوسيط‬
‫أكرب من املتوسط الحسايب ‪.Mean‬‬

‫من األمثلة عىل التوزيع ‪ :Left Skewed‬درجات الطالب يف امتحان ما‪،‬‬


‫حيث من الطبيعي أن يكون معظم الطالب فوق املتوسط‪ ،‬والقليل هم من رسبوا‪،‬‬
‫أو أعامر الوفاة‪ ،‬حيث من الطبيعي أيضا أن ميوت معظم الناس يف أعامر‬
‫كبرية‪ ،‬والقلة هم من ميوتون صغار السن‪.‬‬
‫يسمى بالتوزيع الملتوي‬
‫ناحية اليسار‪ ،‬ألنه المنحنى‬
‫المرسوم عليه له ذيل‪ ،‬أو‬
‫التواء ناحية القيم األقل في‬
‫اليسار‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪37‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫التوزيع الملتوي ناحية اليمين‬
‫‪Right Skewed Distribution‬‬
‫املنوال ‪Mode‬‬ ‫املتوسط احلسابي‬
‫هو القيمة ذات‬ ‫‪ Mean‬قيمته أكرب من‬
‫أكرب تكرار‬ ‫بقية املتوسطات‪ ،‬حيث‬
‫أنه يتأثر بالقيم الكبرية‪.‬‬

‫يف الـ ‪ Right Skewed‬تكون قيمة الوسيط‬


‫‪ Median‬أقل من قيمة املتوسط احلسابي‬
‫‪.Mean‬‬
‫يتميز التوزيع امللتوي ناحية اليمني ‪ Right Skewed‬بأن معظم القيم‬
‫تكون أقل من املتوسط الحسايب‪.‬‬
‫يف هذه الحالة يكون املتوسط الحسايب ‪ Mean‬أكرب من الوسيط‬
‫‪ Median‬والوسيط ‪ Median‬أكرب من املنوال ‪.Mode‬‬

‫من األمثلة عىل التوزيع ‪ :Right Skewed‬توزيع الرثوات‪ ،‬فنسبة قليلة‬


‫تتمتع برثاء كبري‪ ،‬واألغلبية حول املتوسط‪ ،‬والقدرات الرياضية‪ ،‬فنسبة قليلة هي‬
‫من لديها قدرات رياضية عالية‪.‬‬

‫يسمى بالتوزيع الملتوي‬


‫ناحية اليمين‪ ،‬ألنه المنحنى‬
‫المرسوم عليه له ذيل‪ ،‬أو‬
‫التواء ناحية القيم األعلى في‬
‫اليمين‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪38‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫بالعودة إىل مثال الالعبني‪ ،‬يبدو حتى اآلن أنهام يتميزان مبستوى أداء متسا ٍو‪،‬‬
‫حسب املدى اإلرباعي ‪Interquartile Range‬‬
‫ولكن قبل أن تترسع يف الحكم‪ ،‬هناك طريقة أخرى نستطيع بها معرفة انتشار‬
‫وتوزع البيانات حول املركز (املتوسط الحسايب)‪ ،‬مام مينحنا القدرة عىل رؤية‬
‫«شكل» انتشار هذه البيانات‪ ،‬وبالتايل إصدار حكم أكرث دقة‪ ،‬كام أنها طريقة‬
‫أبسط حيث نستطيع برقم واحد‪ ،‬وليس بخمسة أرقام‪ ،‬أن نعرف مدى انتشار‬
‫البيانات‪.‬‬

‫ف‬ ‫ن‬
‫ار� ‪Standard Deviation‬‬‫المع�‬
‫ي ي‬ ‫حرا�‬‫ا�‬ ‫ال‬

‫االنحراف المعياري ‪ Standard Deviation‬هو قيمة تشير إلى‬


‫متوسط ابتعاد كل قيمة من القيم عن المتوسط الحسابي‬
‫‪.Mean‬‬

‫لنأخذ املثال التايل لنفهم أكرث ما هو االنحراف املعياري‪.‬‬


‫إذا قمت بعد عدد فناجني القهوة التي ترشبها يوميا عىل مدى خمسة أيام‪،‬‬
‫وكانت كالتايل‪:‬‬
‫‪3, 2, 3, 2, 5‬‬
‫ت‬ ‫ن‬ ‫�أ‬
‫الحسا� ي� ‪Mean‬‬
‫ب‬ ‫حس� الم�وسط‬
‫ب‬ ‫ولا‪� :‬‬
‫املتوسط الحسايب = مجموع القيم ÷ عددهم‬
‫= ‪3 = 5 ÷ 15‬‬ ‫ ‬
‫ت‬ ‫ن‬ ‫ق ة‬ ‫ن‬ ‫ف ق‬ ‫ن‬ ‫ث ن‬
‫و� ي�� الم�وسط‬
‫ب‬ ‫م�‬ ‫�‬‫ي‬ ‫�‬ ‫كل‬ ‫�‬ ‫�‬ ‫�‬
‫ب ي‬ ‫ر�‬ ‫ال�‬ ‫حس�‬
‫ب‬ ‫�‬ ‫ا‪:‬‬‫�‬‫� ي‬
‫ا�‬
‫الحسا� ي� ‪Mean‬‬
‫ب‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪39‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫ال فرق عن المتوسط‬ ‫ي‬


‫زيد‬
‫‪0=3-3‬‬ ‫ذ‬ ‫ه‬
‫ي‬ ‫ا ال‬
‫ال فرق عن المتوسط‬
‫ع‬ ‫بفن وم‬
‫جا‬
‫‪0=3-3‬‬
‫م‬ ‫‪ - 5‬ن وا ن ال‬
‫‪ = 3‬حد تو‬
‫ط‬ ‫س‬ ‫‪2‬‬

‫ينقص هذا اليوم عن المتوسط‬ ‫ينقص هذا اليوم عن المتوسط‬


‫بفنجان واحد‬ ‫بفنجان واحد‬
‫‪-1 = 3 - 2‬‬ ‫‪-1 = 3 - 2‬‬

‫الفرق عن المتوسط (‪)3‬‬ ‫عدد فناجين القهوة‬

‫‪0=3-3‬‬ ‫‪3‬‬

‫‪-1 = 3 - 2‬‬ ‫‪2‬‬

‫‪0=3-3‬‬ ‫‪3‬‬

‫‪-1 = 3 - 2‬‬ ‫‪2‬‬

‫‪2=3-5‬‬ ‫‪5‬‬

‫ألننا نريد حساب “متوسط” الفروق بني القيم وبني املتوسط الحسايب لها‪،‬‬
‫فسنقوم بجمعها ثم قسمة الناتج عىل عدد القيم‪.‬‬
‫‪0 + (-1) + 0 + (-1) + 2 = 0‬‬
‫ولكن املشكلة أن ناتج الجمع هو صفر‪ ،‬ألن املتوسط الحسايب يقع يف منتصف‬
‫القيم‪ ،‬لذا فإجاميل ما فوق املتوسط يساوي دامئا إجاميل ما تحت املتوسط‪.‬‬
‫مجموع الفروق بين القيم ومتوسطها الحسابي ‪Mean‬‬
‫هو دائما صفر‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪40‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫لحل هذه املشكلة نقوم برتبيع الفرق بني القيمة واملتوسط الحسايب ‪Mean‬‬
‫لنتخلص من القيمة السالبة‪.‬‬
‫ت‬ ‫ن‬ ‫ق ة‬ ‫ن‬ ‫ف ق‬ ‫ث ث ن‬
‫و� ي�� الم�وسط‬
‫ب‬ ‫م�‬ ‫�‬‫ي‬ ‫�‬ ‫كل‬ ‫�‬ ‫�‬ ‫�‬
‫ب ي‬ ‫ر�‬ ‫ال�‬ ‫ع‬‫ر�‬
‫�ال�ا‪ :‬ب‬
‫�‬
‫الحسا� ي� ‪Mean‬‬
‫ب‬
‫الفرق عن المتوسط (‪ )3‬مربع الفرق‬ ‫عدد فناجين القهوة‬
‫مربع أي‬ ‫‪0‬‬ ‫‪0=3-3‬‬ ‫‪3‬‬
‫قيمة‬
‫(‪)squared‬‬ ‫‪1‬‬ ‫‪-1 = 3 - 2‬‬ ‫‪2‬‬
‫هو حاصل‬ ‫‪0‬‬ ‫‪0=3-3‬‬ ‫‪3‬‬
‫ضرب‬
‫القيمة في‬ ‫‪1‬‬ ‫‪-1 = 3 - 2‬‬ ‫‪2‬‬
‫نفسها‪.‬‬ ‫‪4‬‬ ‫‪2=3-5‬‬ ‫‪5‬‬

‫ق‬ ‫ف‬ ‫را�عا‪ :‬ن� مع مر� ت‬


‫عا� قال�رو�‬ ‫ب‬ ‫�ج‬ ‫نب ق‬
‫و��سمها على عدد ال� ي�م‬
‫املجموع = ‪6 = 4 + 1 + 0 + 1 + 0‬‬
‫وحدة قياس التباين‬ ‫‪1.2 = 5 ÷ 6‬‬ ‫ثم بالقسمة عىل عددها‪:‬‬
‫هو نفس وحدة‬ ‫ن‬
‫ولك� ما قمنا بحسابه اآلن هو متوسط‬
‫قياس القيم تربيع‬
‫‪ ،squared‬بينما‬ ‫مربع الفروق بني القيم ومتوسطها الحسايب‪،‬‬
‫وحدة قياس االنحراف‬ ‫وليس متوسط الفروق بني القيم ومتوسطها‬
‫المعياري هو نفس‬ ‫الحسايب‪ ،‬لذا ما قمنا بحسابه حتى اآلن يسمى‬
‫وحدة قياس القيم‬ ‫ول�س االنحراف‬ ‫ي‬ ‫‪،‬‬ ‫‪Variance‬‬ ‫�‬ ‫ب ي‬
‫ت‬
‫ال��ا� ن‬
‫بدون تربيع‬ ‫املعياري ‪.Standard Variation‬‬
‫لنقوم بحساب االنحراف املعياري نقوم بإيجاد‬
‫ت‬
‫ع� لقيمة التباين‪.‬‬‫ر� ي� ي‬
‫ال�ج �ذر ال� ب‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪41‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫ت‬
‫لل��ا��ن‬ ‫ت‬ ‫ن‬ ‫�خ‬
‫ب ي‬ ‫ع�‬
‫ر� ي� ي‬
‫حس� ال�ج �ذر ال� ب‬
‫ب‬ ‫امسا‪� :‬‬
‫بالتقريب‬
‫ألقرب قيمتني‬
‫= ‪1.1‬‬ ‫‪1.2‬‬ ‫=‬ ‫التباين‬ ‫االنحراف املعياري =‬
‫عرشيتني‬
‫القيمة ‪ 1.1‬تعرب عن مدى انتشار ‪ Spread‬القيم عن متوسطها الحسايب‪.‬‬
‫قد ال تعطينا معلومة مفيدة يف حد ذاتها‪ ،‬ولكن غالبا نقارنها بقيمة االنحراف‬
‫املعياري ‪ Standard Deviation‬ملجموعة بيانات أخرى لرنى أيهام‬
‫أكرث تشتتا عن املركز‪ ،‬كام سنفعل اآلن مع العبي الهجوم الذين نقارن بينهام‪.‬‬
‫حساب االنحراف المعياري لالعب األول‬
‫الفرق عن المتوسط (‪ )2‬مربع الفرق‬ ‫األهداف‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪1‬‬ ‫‪1=2-3‬‬ ‫‪3‬‬

‫‪4‬‬ ‫‪-2 = 2 - 0‬‬ ‫‪0‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪1‬‬ ‫‪1=2-3‬‬ ‫‪3‬‬

‫‪1‬‬ ‫‪-1 = 2 - 1‬‬ ‫‪1‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪1‬‬ ‫‪1=2-3‬‬ ‫‪3‬‬

‫‪8‬‬ ‫المجموع‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪42‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬
‫التباين ‪0.8 = 10 ÷ 8 = Variance‬‬
‫= ‪0.89‬‬ ‫‪0.8‬‬ ‫االنحراف املعياري ‪= Standard Deviation‬‬

‫حساب االنحراف المعياري لالعب األول‬


‫الفرق عن المتوسط (‪ )2‬مربع الفرق‬ ‫األهداف‬

‫‪1‬‬ ‫‪-1 = 2 - 1‬‬ ‫‪1‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪4‬‬ ‫‪-2 = 2 - 0‬‬ ‫‪0‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪4‬‬ ‫‪-2 = 2 - 0‬‬ ‫‪0‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪16‬‬ ‫‪4=2-6‬‬ ‫‪6‬‬

‫‪0‬‬ ‫‪0=2-2‬‬ ‫‪2‬‬

‫‪4‬‬ ‫‪2=2-4‬‬ ‫‪4‬‬

‫‪1‬‬ ‫‪-1 = 2 - 1‬‬ ‫‪1‬‬

‫‪30‬‬ ‫المجموع‬

‫التباين ‪3 = 10 ÷ 30 = Variance‬‬
‫= ‪1.73‬‬ ‫‪3‬‬ ‫االنحراف املعياري ‪= Standard Deviation‬‬
‫ألن االنحراف املعياري لالعب األول أقل من االنحراف املعياري لالعب الثاين‪،‬‬
‫إذن فالالعب األول يتميز بتفاوت أقل يف أهدافه عن املتوسط‪ ،‬أي أن أداءه‬
‫أكرث استقرارا‪ ،‬وسيقع االختيار عليه‪.‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪43‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫ن ت ش‬
‫الا���ار ‪Spread‬‬

‫انحراف معياري أقل‪ ،‬لذا فإن‬ ‫انحراف معياري أكبر‪ ،‬لذا فإن‬
‫التفاوت صغير بين القيم وبين‬ ‫التفاوت كبير بين القيم وبين‬
‫متوسطها الحسابي‪.‬‬ ‫متوسطها الحسابي‪.‬‬

‫بمساعدة االنحراف المعياري ‪ Standard Deviation‬نستطيع باستخدام رقم‬


‫واحد فقط المقارنة بين انتشار ‪ Spread‬مجموعتين مستقلتين من البيانات‪.‬‬

‫محمد لطفي‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪44‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫‪Descriptive vs. Inferential Statistics‬‬

‫اإلحصاء الوصفي واالستداللي‬


‫‪Descriptive vs. Inferential Statistics‬‬
‫‪Population‬‬
‫لنفترض أنك تريد معرفة هل‬
‫هناك عالقة بين مستوى الدخل‬
‫في األسرة وبين مستوى‬
‫التحصيل لدى الطالب في‬
‫جمهورية مصر العربية‪.‬‬

‫‪Sample‬‬
‫بالطبع لن تستطيع دراسة‬
‫كل طالب الجمهورية‪ ،‬ولكنك‬
‫ستلجأ إلى اختيار عينات متنوعة‬
‫تعكس جميع مستويات الطالب‬
‫في مصر‪.‬‬

‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪45‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ ‫‪Descriptive vs. Inferential Statistics‬‬
‫‪Sample‬‬ ‫ثم ستحسب مثال مستوى‬
‫درجات كل طالب في العينات‬
‫التي اخترتها‪ ،‬وتقارنها‬
‫بمستوى دخل األسرة التي‬
‫ينتمي إليها‪.‬‬
‫وستستخدم لحساب كل‬
‫ما يتعلق بالعينة اإلحصاء‬
‫الوصفي‪ ،‬التي قمنا بدراستها‬
‫قيم العينة‬ ‫حتى اآلن‪.‬‬

‫قوانني اإلحصاء الوصفي‬ ‫النتائج التي ستحسبها‬


‫باستخدام اإلحصاء‬
‫الوصفي على العينة تسمى‬
‫إحصاءات‬ ‫«إحصاءات» ‪.Statistics‬‬
‫‪statistics‬‬ ‫مثل‪ :‬المتوسط الحسابي‪،‬‬
‫الوسيط‪ ،‬المنوال‪ ،‬أو‬
‫االنحراف المعياري‪.‬‬
‫قوانني اإلحصاء االستداليل‬
‫ثم بعد ذلك ستستخدم هذه‬
‫«اإلحصاءات» ‪Statisitcs‬‬
‫معلمات‬ ‫لتستدل على ‪ infer‬المجتمع‪،‬‬
‫‪Parameters‬‬ ‫وتستنتج النتائج التي تريد‬
‫‪Population‬‬ ‫استخالصها من المجتمع‬
‫‪.Population‬‬
‫أية قيمة تستنتجها عن‬
‫المجتمع تسمى معلمة‬
‫‪.Parameter‬‬
‫‪facebook.com/groups/arab.data.analysis‬‬
‫‪46‬‬ ‫عر� ي�‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ال� ي�ا�ا� ‪ -‬ي‬
‫حل�ل ب‬
‫� ي‬
‫ت‬
‫محمد لطفي‬ Descriptive vs. Inferential Statistics
Population ‫ المجتمع‬Parameter ‫لالستدالل على قيم‬
‫ نستخدم فرع‬Sample ‫ العينة‬Statistics ‫من إحصاءات‬
Inferential »‫آخر من اإلحصاء يسمى «اإلحصاء االستداللي‬
.Statistics

‫محمد لطفي‬

facebook.com/groups/arab.data.analysis
47 �‫عر� ي‬
‫رم� ب‬
‫م� ج‬ ‫ن‬
‫مل�و� ب‬
‫ن ت‬
‫ ي‬- �‫ال� ي�ا�ا‬
‫حل�ل ب‬
‫� ي‬
‫ت‬

You might also like