Professional Documents
Culture Documents
فصل 3
فصل 3
1
نما (3
ميانه (4
چارك ها
دهک ها
چندك ها (5
صدك ها
با استفاده از جدول فراوانی و رسم نمودارها می توان داده ها را به نحو مطلوبی تنظیم کرده و اطالعات نهفته در داده ها
را تا حدودی مشخص کرد .با این حال برای ارائه یک گزارش مناسب ،بهتر است داده ها را در یک یا چند عدد مناسب
خالصه کنیم .به این اعداد شاخص یا معیارگویند .شاخص ها به دو دسته تقسیم می شوند.
اعدادی هستند که محل تمرکز یا تجمع داده ها را نشان می دهند. شاخص های مرکزی
اعدادی هستند که میزان پراکندگی داده ها از مرکز را اندازه می گیرند. شاخص های پراکندگي
از مجموع داده ها تقسیم بر تعداد داده ها به دست می آید. ميانگين حسابي
1 n 1
X xi ) ( x 1 x 2 ... x n
n i 1 n
میانگین حسابی ،زمانی مناسب است که چند جمعیت با هم جمع می شوند تا کل را تولید کنند.
در حقیقت ،میانگین حسابی به این سؤال پاسخ می دهد که:
"اگر تمام کميتها دارای مقدار یکسان باشند ،آن مقدار کدام باید باشد تا همان حاصل کل را ایجاد کند؟"
را با فراوانی های f k ,..., f 2 , f 1 اگر دادهها طبقه بندی شده باشند ،یعنی مقادیر x 1 , x 2 ,...x k
در اختیار داشتهباشیم ،در این صورت فرمول میانگین به شكل زیر خواهد بود:
1 1
f 1x 1 f 2 x 2 .... f k x k
k
x fixi
n i 1 n
xi fi fi xi مثال :میانگین حسابی را در جدول فراوانی زیر محاسبه کنید.
5 3 3×5 =15
1 1
147 8 / 17
7 3 3×7 = 21 5
8 2 2×8 =16 x fixi
9 5 5×9 = 45 18 i 1 18
10 5 5×10 = 50
جمع 18 147
ميانگين حسابي در جدول فراواني داده های پيوسته:
در داده های پیوسته که طبقه بندی شده باشند ،در فرمول باال باید به جای 𝑖𝑥 از 𝑖( 𝑥′نماینده طبقات) استفاده کنیم.
حدود طبقات fi x i f i x i
مثال :برای داده های جدول توزیع فراوانی زیر میانگین
1-3 1 2 2
حسابی را بدست آورید.
4-6 5 5 25
7-9 15 8 120
255 8.5
1 5 1
10-12 6 11 66 x f i x 'i
30 i 1 30
13-15 3 14 42
30 255
Dr. Mohammad Kazemi فهرست مطالب اين فصل
انواع میانگین
7
خواص
-1همیشه مجموع اختالف دادهها از میانگین حسابی صفر است. میانگین
حسابي
-2هرگاه به هر یک از دادهها عد ثابتی مانند aرا اضافه یا کم
کنیم ،میانگین دادههای حاصل ،برابر با میانگین دادههای قبلی
به اضافه (یا منهای) عدد ثابت aخواهد بود.
-5میانگین حسابی به شدت تحت تأثیر داده های بسیار بزرگ یا بسیار کوچک (داده های پرت) است.
مثال :در یک مجموعه 10 ،داده با میانگین x 1 4 / 2و در مجموعه دیگری 8داده با میانگین x 2 4موجود
است .میانگین کل دادهها را به دست می آورید.
درمیانگین وزنی به هریک از 𝑖𝑥 ها وزنی برابر 𝑖𝜔 داده می شودکه 0 ≤ 𝜔𝑖 ≤ 1و ميانگين حسابي وزني
∑𝜔𝑖 =1و بصورت زیر بدست می آید:
n
X i x i
i 1
𝑖𝑓
= 𝑖𝜔 است. لذا میانگین حسابی هم یک نوع میانگین وزنی با وزن نکته
𝑛
18
Dr. Mohammad Kazemi فهرست مطالب اين فصل
انواع میانگین
10
ميانگين هندسي
فرض کنید x n ..., x 2 , x 1دادههای مثبت و مخالف صفر باشند ،میانگین هندسی آنها از فرمول مقابل بدست می آید.
( x i ) x i
n n
n n
1 fi
( x i ) x i
n n
fi n n
مثال :مكعبی به ابعاد 27 ، 8و 64داریم .متوسط بعد مكعب چه اندازه باید باشد تا حجمی معادل مكعب
داده شده داشته باشیم؟
میانگین هندسی بیشتر در زمینه های اقتصادی برای محاسبه متوسط سود یا نرخ رشد و در جمعیت شناسی برای
پیدا کردن متوسط آهنگ های تغییر استفاده می شود.
مثال :فرض کنید سرمایه گذاری در سال اول 10 %سود ،در سال دوم 60 %سود و در سال سوم 20 %سود
دریافت می کند .متوسط سود ساالنه سرمایه گذار در طول سه سال گذشته چقدر است؟
جواب :اگر سرمایه فرد را در سال اول برابر یک قرار دهیم ،متوسط سرمایه وی در طول سه سال به کمک میانگین
هندسی بدست می آید
مثال :فرض کنید سرمایه گذاری در سال اول % 10سود و در سال دوم % 20ضرر کند .متوسط سود یا ضرر سرمایه گذار
چقدر است؟
G 1.1 0.8 0.9381
0.9381 1 0.0619
نکته
• در مقایسه با میانگین حسابی ،میانگین هندسی کمتر نسبت به داده های بسیار بزرگ یا بسیار کوچک
حساس است.
• هر زمان کمیت هایی در اختیار دارید که حاصل یک ضرب هستند و عالقمند به دستیابی به متوسط
مقدار هستید ،پاسخ مناسب ميانگين هندسي است.
i 1
که در آن
𝑖𝑓
= 𝑖𝜔 است. نکته :توجه داشته باشید که میانگین هندسی هم یک نوع میانگین هندسی وزنی با وزن
𝑛
فرض کنید دادههای x n ..., x 2 , x1مخالف صفر باشند ،میانگین هارمونیک آنها از ميانگين هارمونيک
(ميانگين توافقي)
نمایش میدهیم: H فرمول زیر بدست میآید و آن را با
H
n
( 1
n
1 ) 1
n 1 n i 1 x i
i 1 x
i
1 n
H ( f i
1 ) 1 ميانگين هندسي در جدول فراواني داده های گسسته:
n i 1 x i
-1این میانگین بیشتر در فیزیک ،عینک سنجی ،مطالعه شبكه های برق و مهندسی نفت استفاده می شود.
-2وقتی مجموعه ی داده ها دارای واحدهای اندازه گیری ترکیبی است (مثالً کیلومتر در ساعت) ،برای محاسبه مقدار
متوسط از میانگین هارمونیک استفاده می شود.
بنابراین
نتیجه :مالحظه می شود که متوسط سرعت جسم متحرک ،میانگین توافقی سرعت ها است و نه میانگین
حسابی سرعت ها!
همگی غیر صفر با وزن هایn ,..., 2 , 1 اگر دادههایx n ..., x 2 , x1 ميانگين هارمونيک
وزني
باشند ،میانگین هارمونیک وزنی از فرمول زیر بدست میآید
( w i 1 ) 1
n
1
H
n 1 i 1 xi
w i
i 1 xi
مثال :فرض کنید اندازه متوسط سرعت متحرکی روی خط راست در 10متر اول 4 m/sو در 25متر دوم 6 m/s
است .متوسط سرعت متحرک در تمام طول مسیر چند m/sاست؟
25 10
= ، 𝜔2بنابراین = 𝜔1و در این مثال
1 35 35
H 5.25 m / s
10 1 25 1
35 4 35 6
از مجموع توان دوم داده ها تقسیم بر تعداد داده ها به دست می آید. ميانگين ریشه ای مرتبه 2
1
1 n
( m2 ) xi
2 2
2
m2 ( x i ) 11 10 ... 16 13.21
2 2
از مجموع توان rام داده ها تقسیم بر تعداد داده ها به دست می آید. ميانگين ریشه ای مرتبه r
1
1 n
( mr ) xi
r r
n i 1
تمرین :نشان دهید که رابطه مقابل بین میانگین ها برقرار است؟ رابطه بين ميانگين ها
راهنمایي :کافی است نشان دهید که 𝑟𝑚 یک تابع نانزولی از rاست .آنگاه با جایگذاری
𝑟 = −1,0,1,2نامساوی ثابت می شود. )??( H G X m 2
نما یا مد دادهای است که بیشتر از سایر دادهها تكرار شده باشد و آن را با نماد Mنمایش میدهیم. نما
مثال :نما در دادههای زیر عدد 3است .زیرا بیشتر از همه ،عدد 3تكرار شده است،
3 1 5 9 2 3 1 7 3 2 3 4 3 3 2
مثال :در داده های زیر نما وجود ندارد ،زیرا تمام داده ها دارای فراوانی یكسانی هستند.
9 12 1 15 3 4 8 5
مثال :در داده های زیر دو داده 7و 4را به عنوان نما انتخاب می کنیم ،زیرا فراوانی این دو داده یكسان و نسبت
به بقیه داده ها بیشتر هستند.
9 7 7 7 5 5 4 4 4 3 2
خون مثال :نما درجدول زیر ،گروه خونی Bاست ،چون فراوانی آن بیشتر است.
fi
A 5
B 19
AB 13
O 8
نکته
نما تنها شاخص مرکزی است که در مورد داده های کیفی هم می تواند به کار رود.
اگر داده ها پیوسته و طبقهبندی شده باشند ،نما را به صورت زیر محاسبه کنید.
-1ابتدا طبقهای را که دارای بیشترین مقدار فراوانی است معلوم کنید ( طبقه نما).
-2از فرمول مقابل برای محاسبه نما استفاده کنید .
D1
M li C
D1 D 2
در این فرمول:
= l iکران پائین طبقهای است که فراونی مطلق آن ماکزیمم است (طبقه نما)
D f f
1 i
= D1تفاضل فراوانی مطلق طبقه نما با طبقه قبل از آن است ،یعنی
i 1
D f f
2 i
= D2تفاضل فراوانی مطلق طبقه نما با طبقه بعد از آن است ،یعنی
i 1
= Cفاصله طبقات
در برخی از کتب آماری نماینده طبقه نما به عنوان نما انتخاب می شود که این روش نیز یک روش تقریبی است. نکته
چون طبقه چهارم بیشترین فراوانی را دارد ،پس آن طبقه نما است ،بنابراین:
2
M 10 3 10 0 / 75 M 10 / 75
26
6
2
ميانه
اگر دادهها را از کوچک به بزرگ مرتب کنیم ،عدد mرا میانه داده ها می نامیم اگر نصف دادهها در
سمت چپ و نصف دیگر داده ها در سمت راست این عدد قرار بگیرد.
اگر تعداد دادهها فرد باشد ،داده ای که در وسط داده ها قرار می گیرد ،میانه است .اما اگر تعداد دادهها زوج
باشد ،میانگین دو عدد وسط ،میانه خواهد بود.
x n 1 اگر nفرد باشد
(
2
)
چون تعداد داده ها 15و عددی فرد است ،داده هشتم میانه است زیرا:
15 1
8 m x (8) 3
2
1
𝑥 =m 𝑛 𝑥+ 𝑛
2 2 2
+1
1 4+5
= ) 𝑚 = (𝑥8 + 𝑥9 = 4.5
2 2
توجه کنید که:
در دو مثال اخیر داده ها گسسته و دسته بندی نشده اند
اگر داده ها پيوسته و دسته بندي شده هستند مراحل زیر را دنبال كنيد
n
Liکران پائین طبقهای است که میانه در آن قرار دارد.
Fi 1 nتعداد دادهها
m Li 2 C
fi Fi 1فراوانی تجمعی یک طبقه ،قبل از طبقهای که شامل میانه است.
f iفراوانی مطلق طبقهای است که میانه در آن قرار دارد.
cفاصله طبقات
چارک ها به ازای 𝑝 = 0.25, 0.50, 0.75بدست می آیند و آنها را به ترتیب با Q1 چارک ها
(چارک اول) و ( 𝑄2چارک دوم) و ( 𝑄3چارک سوم) نشان می دهند.
دهک ها
دهک ها به ازای 𝑝 = 0.1, 0.2, … , 0.9بدست می آیند و آنها را به ترتیب با ( D1دهک اول)
و ( 𝐷2دهک دوم) و ...و ( 𝐷9دهک نهم) نشان می دهند.
%90 %10
صدک ها
صدک ها به ازای 𝑝 = 0.01, 0.02, … , 0.99بدست می آیند و آنها را به ترتیب با ( P1صدک
اول) و ( P1صدک دوم) و ...و ( P2صدک نود) نشان می دهند.
-1ابتدا داده ها را مرتب کنید و شكل مرتب شده آنها را با )𝑛(𝑥 ≤ ⋯ ≤ ) x(1) ≤ 𝑥(2نشان دهید.
-2اگر 𝑝 𝑛 + 1یک عدد صحیح بود ،با انتخاب 𝑝 r = 𝑛 + 1مقدار 𝑝𝑄 را برابر با )𝑟(𝑥 انتخاب می کنیم.
-3اگر 𝑝 𝑛 + 1یک عدد صحیح نبود ،با انتخاب ]𝑝 r = [ 𝑛 + 1و 𝑟 𝜔 = 𝑛 + 1 𝑝 −مقدار 𝑝𝑄 را
به صورت زیر محاسبه می کنیم
)𝑄𝑝 = 1 − 𝜔 𝑥(𝑟) + 𝜔𝑥(𝑟+1
مثال :صدک 80دادههای زیر را محاسبه کنید( .دادهها مرتب شده اند)
1,1,1,3,3,4,6,7,7
p 0.80 ( n 1) p 10 0.80 8 یک عدد صحيح است!
مثال :دهک چهارم دادههای زیر را معلوم می کنیم( .دادهها مرتب شده اند)
2/3 3 3/1 3/2 3/4 3/8 4 4/4 5/3 5/3 6/1 6/9 7/5 8/3 9/8
حل:
نسبت 𝑝 = 0.4مربوط به دهک چهارم است.
p 0.4 ( n 1) p 16 0.4 6.4
یک عدد صحيح نيست!
𝑄0.53 =5.43
اگر داده ها پيوسته و دسته بندي هستند ،براي محاسبه چندك ها مراحل زیر را دنبال كنيد
حدود طبقات fi Fi مثال :برای دادههای جدول زیر دهک چهارم و چارک های اول تا سوم را
1/35 -1/55 4 4 بدست آورید.
1/55 -1/75 6 10 حلp 0.4 n p 50 0.4 20 :
1/75 - 1/95 12 22 20 10
طبقه چندک دار D4 1.75 0.2 1.75 0.167 1.917
1/95-2/15 9
12
31
2/15 -2/35 8 39 p 0.25 n p 50 0.25 12.5
12.5 10
2/35 -2/55 6 45 Q1 1.75 0.2 1.79
12
2/55 -2/75 2 47
p 0.50 n p 50 0.50 25
2/75 -2/95 3 50 25 22
Q2 1.95 0.2 2.02
جمع 50 - 9
p 0.750 n p 50 0.75 37.5
37.5 31
Q 3 2.15 0.2 2.31
8
Dr. Mohammad Kazemi فهرست مطالب اين فصل
چندک ها
40
حدود طبقات fi Fi مثال :برای جدول توزیع فراوانی زیر مطلوبست محاسبه
الف) چارک ها.
55/3-62/3 3 3 ب) دهک اول ،پنجم و هفتم.
62/3 – 69/3 2 5 ج) صدک 50و 70
69/3 – 76/3 5 10
76/3 – 83/3 3 13
83/3 - 90/3 12 p 0.25 n p 25 0.25 6.25
25 6.25 5
25 Q1 69.3 7 71.05
5
-1دادههای زیر مربوط به تعداد اعضای 50خانوار است که به صورت جدول توزیع فراوانی زیر دستهبندی شدهاند .برای
این دادهها ،میانگین ،میانه ،نما (مد) ،چارک اول ،دهک 7و صدک 85را به دست آورید.
-4دادههای زیر زمان تأخیر ورود 30نفر از کارمندان یک شرکت (بر حسب دقیقه) در ماه گذشته است: