Professional Documents
Culture Documents
ا� ت
ا� ال� ي�
ب واع�
أن
�
أنواع البيانات
Data Types
ت ن
ال� ي�ا�ا�؟
ه� ب
ما ي
تتعدد صور البيانات ،فهي قد تكون على شكل نصوص ،صور ،فيديو ،صوت،
وقد تخزن في قواعد للبيانات التي تتسع لكم هائل منها.
البيانات النوعية
تستخدم لتصنيف مجموعة
من الوحدات ،وال نستطيع
٪ + البيانات الكمية
تكون في شكل أرقام
تستطيع إجراء عمليات
إجراء أية عمليات حسابية حسابية عليها ،كالجمع
عليها. والطرح ،أو إيجاد
أمثلة :النوع (ذكر /أنثى)، المتوسط.
سالالت الكالب املختلفة ،التقدير أمثلة :عمرك ،عدد الطالب،
(مقبول /جيد /جيد جدا / مقدار املال الذي معك ،أو
ممتاز) ،الرمز الربيدي ،أرقام درجة الحرارة.
Quantitative Data
الالعبني يف مباراة ،أرقام
السيارات ،أو أرقام الهواتف.
Categorical Data
مالحظة:
قد تكون البيانات النوعية على شكل "أرقام" ولكننا ال نستطيع إجراء
عمليات حسابية عليها ،مثل أرقام الهواتف ،أو الرقم الربيدي أو أرقام
الالعبني ،حيث ال معنى جلمع هذه القيم أو حساب املتوسط اخلاص بها.
facebook.com/groups/arab.data.analysis
2 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن
ا� ت
ا� ال� ي�
ب واع�
أن
�
�أ ئ ة
س�ل�
حدد نوع كل من البيانات التالية (كمية – نوعية):
Quantitative Or Categorical
الرمز الربيدي
العمر
الدخل
الحالة االجتامعية (عزب /متزوج )... /
الطول
طول الطريق إىل العمل
التقييم يف استقصاء للرأي (ضعيف – مقبول – جيد)
متوسط الرسعة
أرقام كرات البلياردو
facebook.com/groups/arab.data.analysis
3 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن
ا� ت
ا� ال� ي�
ب واع�
أن
�
ة ن ت ن
وع�� Categorical Data
ال� ي�ا�ا� ال� ي
ب
ميكن تقسيم البيانات النوعية إىل نوعني:
مالحظة
ال يشرتط معرفة "قيمة" الفارق بني كل رتبة والتي تليها ،تكفي فقط
معرفة أن قيمة بيان ما هي أكرب أو أقل من األخرى.
مثال :يف استطالع للرأي كانت اإلجابات كالتايل :ال أوافق – أوافق – أوافق
بشدة.
هنا نستطيع ترتيب البيانات من األدىن (ال أوافق) لألعىل (أوافق بشدة) ،أو
العكس ،دون الحاجة ملعرفة "كم" يفصل بني كل اختيار واآلخر.
facebook.com/groups/arab.data.analysis
4 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن
ا� ت
ا� ال� ي�
ب واع�
أن
�
Data Types
أنواع البيانات
Numerical Data Categorical Data
ة ت ن ة ن ت ن
كم��
ي ب� ي�ا�ا� وع��
ب� ي�ا�ا� � ي
يجرى عليها عمليات حسابية. للتصنيف فقط ،وال يجرى عليها
عمليات حسابية.
facebook.com/groups/arab.data.analysis
6 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن
ا� ت
ا� ال� ي�
ب واع�
أن
�
إحصائيات للتلخيص
Summary Statistics
تظهر أهمة علم اإلحصاء في تمكيننا من "رؤية" و"فهم" البيانات
والقيم المتوفرة معنا بشكل واضح.
فمثال لو كان لديك مرتبات 100موظف يف رشكة ما ،فهذه القيم ليست ذات
قيمة كبرية يف حد ذاتها ،ومن الصعب أن نفهم منها معلومة مفيدة.
ولكن ،باستخدام اإلحصاء ،واإلحصاء الوصفي بشكل أدق ،نستطيع تلخيص تلك
املائة مرتب يف رقم واحد ،يكون هو متوسط هذه املرتبات ،وتشري قيمة املتوسط
إىل منتصف أو مركز القيم التي لدينا ،بحيث تتوزع بقية القيم حولها ،فيكون
تقريبا نصف القيم أكرب منها والنصف اآلخر أصغر منها.
وتوجد ثالث طرق لحساب
طرق حساب املتوسط: المتوسط ،كل طريقة لها
حسابها الخاص ولها مميزاتها املتوسط احلسابي Mean
وعيوبها ،ومن المهم جدا
الوسيط Media معرفة متى تستخدم إحدى هذه
الطرق ،وسنتعرف على ذلك
املنوال Mode عند شرح كل منها بالتفصيل.
facebook.com/groups/arab.data.analysis
8 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي Summary Statistics
ونستطيع أيضا باستخدام اإلحصاء معرفة شكل "توزيع"
Spreadتلك المرتبات ،بمعنى هل مرتبات الموظفين متقاربة
وال توجد فروق فيما بينهم ،أم أن المرتبات تتفاوت بشكل
كبير وتوجد فروق كبيرة بينها .وتساعدنا معادالت حساب توزيع
البيانات في معرفة ذلك.
وألن الصورة تغني عن ألف كلمة ،نستطيع أيضا أن نعرب عن قيمة هذا التوزيع،
أو التفاوت ،بني املرتبات عن طريق "رسم" هذا التوزيع ،فيتضح لنا مبجرد
النظر مدى التفاوت بني القيم التي لدينا.
facebook.com/groups/arab.data.analysis
9 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي Summary Statistics
التباين Variance
الوسيط Median
املنوال Mode
املدى Range
محمد لطفي
facebook.com/groups/arab.data.analysis
10 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي الحسا� ي� Mean
ب وسط
ت
الم�
مجموع القيم
المتوسط الحسابي =
عدد القيم Mean
facebook.com/groups/arab.data.analysis
11 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي الحسا� ي� Mean
ب وسط
ت
الم�
مثال:
نفرتض أن لدينا مرتبات خمسة موظفني كالتايل:
2000 – 2300 – 1800 – 2000 – 2500
يساعدنا املتوسط الحسايب Meanعىل التعبري عن هذه القيمة بقيمة واحدة
فقط ،هذه القيمة تعرب عن منتصف أو مركز البيانات التي لدينا ،بحيث يتوزع
حولها بقية القيم األخرى.
هذه هي قيمة متوسط Meanاملرتبات ،ونجد أنها بالفعل تقع تقريبا يف مركز
أو منتصف القيم.
2000
1800 2000 2120 2300 2500
المتوسط الحسابي
Mean
facebook.com/groups/arab.data.analysis
12 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي الحسا� ي� Mean
ب وسط
ت
الم�
مالحظة
المتوسط الحسابي Meanال يجب أن يكون إحدى القيم التي لدينا ،بل يمكن
أن يكون قيمة مختلفة ،فالمتوسط 2120ال يوجد بين قيم المرتبات.
2000
2000 2300 2500 4760 15000
facebook.com/groups/arab.data.analysis
13 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي الحسا� ي� Mean
ب وسط
ت
الم�
وال يشرتط أن تكون القيمة املتطرفة Outlierكبرية جدا ،بل قد تكون أيضا
صغرية جدا ،ويف هذه الحالة تقلل قيمة املتوسط الحسايب .Mean
مالحظة
ال يتم حساب المتوسط الحسابي Meanإال للقيم الكمية فقط
،Quantitative valuesسواء كانت متصلة continuousأو
منفصلة .Discrete
محمد لطفي
facebook.com/groups/arab.data.analysis
14 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي الوس�ط Median
ي
الوسيط Median
الوسيط medianوسيلة أخرى من وسائل قياس مركز (منتصف) القيم
.center of the values
الوسيط Median
ق ة
الوس�ط :median
ي حسا�
ب ق طر��� ت تي
ن ت �أ ت ت ت
�ر��� ال��م �ر���ا �صاعد�ا ( و �� ز
ل�ا).
ي ا� ي ي ب ي ي ب
ف ق ن �ذ
رد� n = odd value إ� ا كا� عدد ال� ي�م � ي
نضيف عليها ،1ثم نقسمها عىل 2 •
• الناتج هو "ترتيب" الوسيط ،وليس قيمة الوسيط.
• نستخرج "قيمة" الوسيط من القيم املرتبة حسب الرتتيب الذي حصلنا عليه.
ز ق ن �ذ
إ� ا كا� عدد ال� ي�م �و�ج ي� n = even value
• نقسم العدد عىل .2
facebook.com/groups/arab.data.analysis
15 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي الوس�ط Median
ي
• نضيف إىل ناتج القسمة .1
• لدينا اآلن ترتيبان ،فنستخرج القيمتني املقابلتني لهام.
• نحسب متوسط meanالقيمتني بجمعهام وقسمة املجموع عىل .2
الناتج هو الوسيط .median
سنحسب اآلن قيمة الوسيط Medianعلى بيانات المرتبات من
المثال السابق ،والتي كانت كالتالي:
2000 – 2300 – 15000 – 2000 – 2500
ت ت ت ق ت ت ن ق �أ
صاعد�ا:
ي ولا :س��وم ب��ر� ي� ب� ال� ي�م �ر� ي� ب�ا �
2000 – 2000 – 2300 – 2500 – 15000
ث ن �ض ف ف ق ن ث ن
عل�ها � ،1م
رد� ( ،)5س� ي�� ي
ن� قا� ي�ا :ل�أ ن� تعدد ال� ي�م � ي
��سم ال�ا� ج� على 2
5+1=6
6÷2=3
ق ة ث ث ن ت �خ
الوس�ط
ي ر� � ي�م�
�ال�ا� :س� ج
قيمة الوسيط هي القيمة الثالثة = 2300
مثال آخر
لديك درجات مجموعة من الطالب ،وتريد إيجاد قيمة الوسيط Medianلها:
76 – 90 – 55 – 64 – 94 – 86 – 71 – 80
ت ت ت ق ت ت ن ق �أ
صاعد�ا
ي ولا�� :وم ب��ر� ي� ب� ال� ي�م �ر� ي� ب�ا �
55 – 64 – 71 – 76 – 80 – 86 – 90 – 94
ة ق ن ق ز ق ن ث ن
�ا� ي�ا :ل�أ� عدد ال� ي�م �و�ج ي� (�� ،)8وم ب�ال�سم� على 2
8÷2=4
ثم نجمع عىل الناتج 1
4+1=5
اآلن لدينا ترتيبان ( )5 ،4لقيمتني ،هام80 ،76 :
ن ن ق ت ت ث ث ن
حس� م�وسط ال� ي�م� ي�� Meanل�حصل على
ب � �ال�ا:
الوس�ط Median
ي
(76 + 80) ÷ 2 = 78
17
محمد لطفي facebook.com/groups/arab.data.analysis
عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن
الم�وال Mode
Mode المنوال
المنوال Modeهو القيمة األكثر "تكرارا" Frequencyفي
البيانات.
لدينا أعمار مجموعة من األطفال المشتركين في ورشة رسم
كالتالي:
9 – 7 – 11 – 9 – 12 – 11 – 8 – 9
ألن املنوال Modeهو القيمة ذات أكرب "تكرار" ،Frequencyفيجب أوال
حساب تكرار كل قيمة.
9 3
7 1
11 2
12 1
8 1
فنجد أن القيمة 9هي صاحبة أكرب تكرار ( ،)3لذا فإن املنوال 9 = Mode
محمد لطفي
facebook.com/groups/arab.data.analysis
19 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي رم� ز� Notation
ي
ت
ال�
Notation الترميز
الترميز Notationهو اللغة المستخدمة في الرياضيات،
وهي تستخدم الرموز بدال من الكلمات.
يعترب الرتميز Notationلغة عاملية يتواصل بها الجميع لحل املشكالت
املتعلقة بالبيانات والقيم والرياضيات بشكل عام.
لفهم الترميز Notationبشكل واضح ،دعنا نتخيل المثال التالي:
لديك مدونة blogعىل االنرتنت ،وتريد معرفة املعلومات التالية:
كم عدد األشخاص الذين يزورون مدونتك؟
كم يقيض الزائرون من الوقت يف مدونتك؟
هل توجد اختالفات يف عدد الزيارات للمدونة فيام بني أيام األسبوع؟
كم عدد عمليات الرشاء التي تتم من خالل املدونة؟
لإلجابة على كل هذه التساؤالت ،قررت إنشاء جدول في برنامج
MS Excelلتسجيل البيانات الخاصة بمدونتك ،كما يلي:
DATE DOW* TIME BUY
Jun 15 Thur. 5 No
Jun 15 Thur. 10 Yes
Jun 16 Fri. 7 Yes
Jun 16 Fri. 9 Yes
Jun 16 Fri. 12 No
ما قمنا بتصميمه يسمى بشكل عام ( datasetمجموعة من
البيانات المرتبطة ببعضها).
DOW: Day of the Week
اليوم الذي متت الزيارة فيه
facebook.com/groups/arab.data.analysis
20 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي رم� ز� Notation
ي
ت
ال�
تتكون من Columnsأعمدة (.)… ,DATE, DOW
DATE DOW TIME BUY
نستطيع التعبير عن أي عمود columnبحرف مثل .X, y or Z
DATE DOW TIME BUY
)(X) (Y
هذه األحرف تمثل ما يسمى بالمتيغر العشوائي Random
.variable
المتغير العشوائي random variableهو نائب عن
placeholderأو ممثل عن جميع القيم المحتملة possible
valuesلعملية معينة ( processمثل DATEأو .)BUY
بعنى ،أننا نستطيع يف الجدول السابق
وبلغة الرتميز Notationالتعبري عن العمود ( ،)DATEوالذي
يعترب متغري عشوايئ random نعرب عن املتغري العشوائي
random variableاملمثل ،variableبالحرف ،Xوالذي
جلميع القيم احملتملة بأحرف
ميثل الرتميز الخاص به ،هنا نحن قمنا
كبرية ،مثل ،X, Y, Zأو أية أحرف
باستخدام الرتميز Xللتعبري عن املتغري أخرى.
العشوايئ .DATE
والترميز Xفي هذه الحالة
يمثل جميع القيم المحتملة
)(X
DATE DOW TIME BUY للمتغير العشوائي ،DATE
Jun 15 Thur. 5 No وال يعبر عن قيمة محددة
Jun 15 Thur. 10 Yes
Jun 16 Fri. 7 Yes بذاتها .بمعنى ،إذا قلنا ،X
Jun 16 Fri. 9 Yes فنحن نعني أية قيمة من قيم
Jun 16 Fri. 12 No
المتغير ،DATEوليست قيمة
معينة.
facebook.com/groups/arab.data.analysis
21 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي رم� ز� Notation
ي
ت
ال�
تخيل أن المتغير العشوائي
random variableهو فنجان
قهوة ،مجرد وعاء يستطيع أن
يحمل جميع األنواع المحتملة
للقهوة ،ولكنه ليس هو
القهوة ذاتها ،هو فقط وعاء
لها.
X
DATE DOW TIME BUY
5 x1
10 x2
...
...
n xn
facebook.com/groups/arab.data.analysis
23 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي رم� ز� Notation
ي
ت
ال�
قد يبدو هذا سهال في عدد القيم القليل ،ولكن لو كان معنا
100قيمة مثال ،وأردنا التعبير عن جمع كل تلك القيم بالترميز
،Notationسيكون األمر أكثر صعوبة.
توجد طريقة أسهل لكتابة صيغة الجمع Sumباستخدام الرتميز
.Notation
نستخدم للجمع حرف ∑ (وينطق سيجما ،)Sigmaوهو حرف
من الحرف اليونانية (حرف كبير .)capital letter
∑ xi
2 النهاية
معنى هذا الترميز أن
نقوم بالجمع من القيمة
x1حتى القيمة x2
i=1 البداية
x1 + x2
i
نستخدم الرمز للتعبير
xi عن رقم القيمة
∑ xi
5
x3 + x4 + x5
i=3 facebook.com/groups/arab.data.analysis
24 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي رم� ز� Notation
ي
ت
ال�
∑ i
n إذا أردنا جمع جميع القيم،
x1 + x2 + x3 + x4 + x5
5 + 10 + 7 + 9 + 12
= 43
ت ة ن ت
الحسا� ي� Mean
ب حسا� الم�وسط
ب ع� ي�ر ع� معادل�
ال� ت ب
رم��ز Notation
ب�ال� ي
نعرف أن املتوسط الحسايب Meanيساوي مجموع القيم عىل عددها.
مجموع القيم
المتوسط الحسابي =
عدد القيم Mean
facebook.com/groups/arab.data.analysis
25 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي رم� ز� Notation
ي
ت
ال�
نستطيع اآلن إعادة كتابة املعادلة السابقة بالرتميز التايل:
∑ i
n
x جمموع
القيم
i=1
n مقسوم
على عددها
∑
n
1
x
n i=1 i
التعبير عن مجموعة من القيم بقيمة واحدة فقط يسمى
"التجميع" ،Aggregationمثل التعبير عن جميع مرتبات
موظفي شركة ما بالمتوسط الحسابي (رقم واحد) ،أو جمع
مجموعة من القيم للحصول على ناتج الجمع (رقم واحد).
أمثلة عىل "التجميع" :Aggregationاملتوسط الحسايب ،Meanالوسيط
،Medianاملنوال ،Modeوالجمع .Sum
26
محمد لطفي facebook.com/groups/arab.data.analysis
عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
االنتشار Spread
أنت مدرب لفريق كرة قدم ،وتريد االختيار من بني العبي هجوم
لالنضامم إىل فريقك ،وكانت لديك البيانات التالية عن عدد
األهداف التي سجلها كل العب يف العرش مباريات األخرية له:
الالعب األول:
2, 3, 0, 2, 2, 3, 1, 2, 2, 3
الالعب الثاين:
1, 2, 0, 2, 0, 2, 6, 2, 4, 1
بدأت بحساب مقاييس المركز ولكن بالنظر إىل القيم املتاحة لكل
measures of centerوكانت العب ،الحظت اختالفا ،مام يعني أن
قيمة املتوسط وحده ال تقول كل يشء كلها متساوية لالعبين:
المتوسط الحسابي 2 = Meanعن البيانات لفهمها والحكم عليها.
الوسيط 2 = Median
المنوال 2 = Mode
يف هذه الحالة تحتاج إىل قياس مدى انتشار Spreadالبيانات التي لديك
وابتعادها عن بعضها البعض .وكلام زاد هذا االنتشار كلام كان التفاوت كبريا بني
القيم ،وكلام قل كلام كان التفاوت صغريا.
facebook.com/groups/arab.data.analysis
27 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
أسهل طريقة لفعل ذلك هو قياس ما يسمى بالمدى
،Rangeوذلك بطرح أصغر قيمة Minimum valueمن أكبر
قيمة .Maximum value
Range = Maximum value – Minimum value
حساب الـ Rangeلالعب األول :نجد أن قيم الالعب الثاني لديها
Range = 3 - 0 = 3انتشار Spreadأعلى من قيم
حساب الـ Rangeلالعب الثاين :الالعب األول ،بمعنى أن أداء
Range = 6 – 0 = 6الالعب األول أكثر استقرارا من
أداء الالعب الثاني.
2 2 3
0 1 2 2 3 الالعب األول
2 3
2
0 1 2 2 2 2 2 3 3 3
اإلرباعي الثاني
Second Quartile
Q2
اإلرباعي الثاين هو نفسه
الوسيط Median
2
0 1 2 2 2 2 2 3 3 3
facebook.com/groups/arab.data.analysis
30 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
2
0 1 2 2 2 2 2 3 3 3
0 1 2 2 2 2 2 3 3 3
2
0 1 2 2 2 2 2 3 3 3
2
0 0 1 1 2 2 2 2 4 6
2
0 0 1 1 2 2 2 2 4 6
يف البداية قمنا بحساب املدى (أكرب قيمة -أقل قيمة) ،ووجدنا أداء الالعب
األول أكرث استقرارا من الالعب الثاين.
ولكننا وجدنا أن املدى يتأثر بالقيم املتطرفة ،Outliersفقمنا بحساب
اإلرباعيات (اإلرباعي األول والثاين والثالث) لنتمكن من حساب املدى اإلرباعيي
Interquartile Rangeلنتجنب القيم املتطرفة .Outliers
Interquartile Range = Q3 - Q1
المدى اإلرباعيي لالعب األول = 1 = 2 - 3
نالحظ أنه بعد استبعاد القيم املتطرفة وحساب املدى اإلرباعي فإن الالعبني
أصبحا متساويان يف مدى انتشار القيم ،Spreadوأصبحا متساويان يف
استقرار األداء.
facebook.com/groups/arab.data.analysis
34 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
وميكن متثيل هذه القيم الخمس بالشكل التايل ،ويسمى :Box Plot
facebook.com/groups/arab.data.analysis
35 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
ن
ا�ا�ت ق ن ت �ش �أ�ش
ال� ي�
ب م�ي � ار � ا� كال
التوزيع االعتدالي Normal Distribution
يتميز التوزيع االعتدايل بأن معظم القيم تتمركز حول املنتصف ،يأخذ التوزيع
شكل الجرس ،لذا يطلق عليه أحيانا .Bell-Shaped
يف التوزيع االعتدايل تكون قيم املتوسط الحسايب Meanوالوسيط
Medianواملنوال Modeتقريبا متساوية.
نجد التوزيع االعتدايل يف قيم مثل :أوزان وأطوال األفراد يف مجتمع ما أو كمية
هطول األمطار ،أو درجات االختبار القياسية مثل اختبار الذكاء.
يف هذه األمثلة نجد أن معظم القيم تكون حول املنتصف ،فوق املتوسط أو أقل
منه (معظم الناس ذكاءهم أقل أو أعىل من املتوسط بقليل) ،والقليل من القيم
تكون قليلة جدا (القليل من الناس لديهم إعاقات ذهنية) أو كبرية جدا (القليل
يتميز بالعبقرية).
facebook.com/groups/arab.data.analysis
36 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
التوزيع الملتوي ناحية اليسار
املتوسط احلسابي Left Skewed Distribution
Meanقيمته أقل من
بقية املتوسطات ،حيث املنوال Mode
أنه يتأثر بالقيم الصغرية. هو القيمة ذات
أكرب تكرار
ف ن
ار� Standard Deviationالمع�
ي ي حرا�ا� ال
0=3-3 3
0=3-3 3
2=3-5 5
ألننا نريد حساب “متوسط” الفروق بني القيم وبني املتوسط الحسايب لها،
فسنقوم بجمعها ثم قسمة الناتج عىل عدد القيم.
0 + (-1) + 0 + (-1) + 2 = 0
ولكن املشكلة أن ناتج الجمع هو صفر ،ألن املتوسط الحسايب يقع يف منتصف
القيم ،لذا فإجاميل ما فوق املتوسط يساوي دامئا إجاميل ما تحت املتوسط.
مجموع الفروق بين القيم ومتوسطها الحسابي Mean
هو دائما صفر
facebook.com/groups/arab.data.analysis
40 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
لحل هذه املشكلة نقوم برتبيع الفرق بني القيمة واملتوسط الحسايب Mean
لنتخلص من القيمة السالبة.
ت ن ق ة ن ف ق ث ث ن
و� ي�� الم�وسط
ب م� �ي � كل � � �
ب ي ر� ال� عر�
�ال�ا :ب
�
الحسا� ي� Mean
ب
الفرق عن المتوسط ( )3مربع الفرق عدد فناجين القهوة
مربع أي 0 0=3-3 3
قيمة
()squared 1 -1 = 3 - 2 2
هو حاصل 0 0=3-3 3
ضرب
القيمة في 1 -1 = 3 - 2 2
نفسها. 4 2=3-5 5
8 المجموع
facebook.com/groups/arab.data.analysis
42 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
التباين 0.8 = 10 ÷ 8 = Variance
= 0.89 0.8 االنحراف املعياري = Standard Deviation
30 المجموع
التباين 3 = 10 ÷ 30 = Variance
= 1.73 3 االنحراف املعياري = Standard Deviation
ألن االنحراف املعياري لالعب األول أقل من االنحراف املعياري لالعب الثاين،
إذن فالالعب األول يتميز بتفاوت أقل يف أهدافه عن املتوسط ،أي أن أداءه
أكرث استقرارا ،وسيقع االختيار عليه.
facebook.com/groups/arab.data.analysis
43 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي ن ت ش
الا���ار Spread
انحراف معياري أقل ،لذا فإن انحراف معياري أكبر ،لذا فإن
التفاوت صغير بين القيم وبين التفاوت كبير بين القيم وبين
متوسطها الحسابي. متوسطها الحسابي.
محمد لطفي
facebook.com/groups/arab.data.analysis
44 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي Descriptive vs. Inferential Statistics
Sample
بالطبع لن تستطيع دراسة
كل طالب الجمهورية ،ولكنك
ستلجأ إلى اختيار عينات متنوعة
تعكس جميع مستويات الطالب
في مصر.
facebook.com/groups/arab.data.analysis
45 عر� ي�
رم� ب
م� ج ن
مل�و� ب
ن ت
ال� ي�ا�ا� -ي
حل�ل ب
� ي
ت
محمد لطفي Descriptive vs. Inferential Statistics
Sample ثم ستحسب مثال مستوى
درجات كل طالب في العينات
التي اخترتها ،وتقارنها
بمستوى دخل األسرة التي
ينتمي إليها.
وستستخدم لحساب كل
ما يتعلق بالعينة اإلحصاء
الوصفي ،التي قمنا بدراستها
قيم العينة حتى اآلن.
محمد لطفي
facebook.com/groups/arab.data.analysis
47 �عر� ي
رم� ب
م� ج ن
مل�و� ب
ن ت
ي- �ال� ي�ا�ا
حل�ل ب
� ي
ت