Professional Documents
Culture Documents
فصل 1
فصل 1
علم آمار :مجموعه روشهایی است که شامل جمعآوری اعداد و ارقام ،سازماندهی و نمایش ،تحلیل و تفسیر دادهها و در نهایت نتیجهگیری،
قضاوت و پیشبینی درمورد آزمایشها و پدیدههای تصادفی میشود.
جامعه (جمعیت) :مجموعه تمام افراد یا اشیائی که درباره یک یا چند ویژگی آنها تحقیق صورت میگیرد.
اندازه (حجم) نمونه :تعداد اعضای نمونه اندازه (حجم) جامعه :تعداد اعضای جامعه
متغیر :ویژگیای از اعضای جامعه که مطالعه و بررسی میشود و معموالً از یک عضو به عضو دیگر تغییر میکند.
مثالً متغیرهای خودرو ،رنگ ،مصرف بنزین ،حداکثر سرعت ،حجم موتور و .....هستند.
متغیرهای یک دانش آموز ،سن ،نمره ریاضی ،وزن ،قد ،گروه خونی و ......هستند.
انواع متغیر
متغیر کمّی :قابل اندازه گیری مثل قد ،وزن ،نمره ،تعداد فرزندان خانواده ،مدت زمان
متغیر کیفی :غیر قابل اندازهگیری مثل گروه خونی ،قومیت ،میزان رضایت از آشپزی ،رنگ ،نوع هلو
کمّی گسسته :اگر دو مقدار a,bرا بگیرد ،هر مقداری بین آن دو را نتواند بگیرد .مانند تعداد فرزندان خانواده ،تعداد سرنشینان خودرو ،تعداد
درختان یک شهر و ......
کیفی اسمی (غیر ترتیبی) :فاقد ترتیب مانند گروه خون ،جنسیت ،نژاد ،رنگ مو و ......
1
آمار توصیفی
این دادهها را در جدول زیر دستهبندی کنید و نمودار میلهای و دایره آن را رسم کنید.
8
کم
6
4 متوسط
2 زیاد
0
کم متوسط زیاد
2
مثال :1شاخص آلودگی هوای شهر تهران در بهمن ماه به شکل زیر بوده است .جدول فراوانی و نمودارهای دایرهای و بافتنگاشت را رسم کنید.
شاخص کیفیت هوا تاریخ شاخص کیفیت هوا تاریخ شاخص کیفیت هوا تاریخ
149 11 97 11 71 1
157 11 64 11 41 1
67 13 77 13 53 3
69 14 116 14 111 4
76 15 135 15 115 5
79 16 139 16 114 6
74 17 151 17 153 7
94 17 157 17 141 7
119 19 196 19 91 9
117 31 111 11 91 11
نمودار دایرهای
پاک
سالم
ناسالم حساس
ناسالم
بسیار ناسالم
3
نمودار میلهای :شماره دسته (یا نام متغیر) را روی محور xها مشخص میکنیم و روی هر نقطه پارهخطی به ارتفاع فراوانی ( یا فراوانی نسبی)
رسم میکنیم .این نمودار برای متغیر های کیفی و کمّی گسسته مناسب است.
نمودار بافتنگاشت (هیستوگرام ،مستطیلی) :مشابه نمودار میلهای است با این تفاوت که نمودار بافتنگاشت برای داده های کمّی پیوسته
مناسب است .لذا روی محور طولها حدود دستهها درج میشود.
مثال :3در انتخابات یک شهر 541111نفر شرکت کردهاند .اگر آنان را به 5گروه سنی تقسیم نموده و با نمودار دایرهای نشان دهیم ،درصد
شرکت کنندگان در یک گروه سنی با زاویه 63درجه نشان داده میشود .تعداد آنها چقدر است؟
مثال :4جدول مقابل درصد فراوانی نسبی گروه خونی افراد یک جامعه است .در نمودار دایرهای ،زاویه سطح مربوط به گروه خونی Oچند درجه
است؟
گروه خونی A B AB O
مثال :5جدول زیر درصد دادههای اعداد حاصل از 51بار پرتاب یک تاس است .چند بار عددی فرد ظاهر شدهاست؟
4
مثال :6با توجه به جدول فراوانی زیر ،زاویه مربوط به بازه ] [16,18در نمودار دایرهای چقدر است؟
مثال :7از دادههای آماری با نمودار بافتنگاشت مقابل ،سه داده 14و16و 16حذف شده است .در نمودار دایرهای دادههای جدید ،بزرگترین زاویه
چند درجه است؟
مثال :7با توجه به نمودار میلهای روبرو ،زاویه مربوط به دسته Bدر نمودار دایرهای را به دست آورید.
5
درس دوم :معیارهای گرایش به مرکز
n
میانگین
x x ... xn xi
میانگین nدادهی آماری x1, x2 ,..., xnبرابر است با :
x 1 2 i 1
n n
مثال : 9میانگین دادههای x1 , x2 ,..., x10برابر 5است .میانگین دادههای x1 , x2 ,..., x10,16چقدر است؟
مثال :11معدل نمرات 11درس دانشآموزی 17/3است .پس از تقاضای تجدید نظر نمره درس شیمی او که 16بود به 17تغییر میکند .معدل
واقعی این دانشآموز چقدر است؟
مثال :11میانگین دادههای روبرو را محاسبه کنید 11 .و 11و 11و 11و 11و 11و 11و 11و 11و 14و 14و 14و 14و 14و 14و 14
اگر دادههای x1 , x2 ,..., xnبه ترتیب دارای فراوانیها (وزن،ضریب) w1 , w2 ,..., wnباشند ،آنگاه میانگین آنها را باید به صورت وزنی و با کمک
رابطه زیر محاسبه کرد:
n
6
مثال :11درصدهای زیر نتیجهی دروس عمومی قنبر در کنکور سراسری میباشد .با توجه به ضرایب ،میانگین درصدها را به دست آورید.
مثال :13اگر میانگین نمرات یک کالس 31نفری 11و میانگین یک کالس 11نفری 16باشد ،میانگین نمرات این 51دانشآموز چقدر است؟
مثال :14از یک کالس 17نفری 4 ،نفر با نمرات 11و13و17و 11خارج میشوند .اگر میانگین نفرات باقیمانده با میانگین اولیه کالس برابر باشد،
میانگین کالس چقدر است؟
مثال :15میانگین دادههای 171و 166و 161و 159و 167را به دست آورید.
مثال :16اگر میانگین دادههای زیر برابر 17باشد ،درصد فراوانی نسبی داده 11چقدر است؟
7 11 17 11 17داده
7
مثال :17با توجه به نمودار فراوانی زیر ،میانگین دادهها را به دست آورید.
نكات تكمیلی:
.1اگر دادهها تشکیل دنباله حسابی بدهند ،میانگین آنها برابر میانگین جمله اول و آخر است.
اثبات:
n
i 1
( xi x ) .1انحراف از میانگین :مجموع تفاضل دادهها از میانگین برابر صفر است.
اثبات:
مثال :19جدول زیر انحراف دادهها از میانگین را به همراه فراوانی نشان میدهد .مقدار مجهول چقدر است؟
8
میانه (داده وسط)
دادهها را مرتب میکنیم .داده وسط (یا میانگین دو داده وسط) میانه است.
مثال :11در یک آزمون نمرات به این صورت است 4 ، 7 ، 7 ، 3 ، 11 ، 11 ، 17 ، 15 ، 14 ، 19 ، 14 ، 11 ،9 ، 5 :میانه این نمرات چقدر است؟
مثال :11با توجه به نمودار میلهای زیر ،میانه و میانگین را به دست آورید.
چاركها
برای یافتن چارک اول و چارک سوم ،پس از مرتب کردن دادهها ،میانه را پیدا میکنیم و کنار میگذاریم .سپس برای دادههای قبل و بعد از میانه،
میانه پیدا میکنیم.
مثال :13در دادههای زیر اعداد کمتر از چارک اول و بیشتر از چارک سوم را حذف میکنیم .میانگین دادههای باقیمانده چقدر است؟
31 34 35 37 37 37 39 41 41 44 45 45 46 51 53 56 56 57
9
نمودار جعبهای
نمودار جعبهای نموداری است که پراکندگی دادهها را نشان میدهد و بر اساس پنج مقدار زیر که به ترتیب از چپ به راست روی محور افقی
نمایش داده میشوند ،رسم میشود.
مثال :14تعداد تصادفات اتومبیل در شهری در 15روز تعطیالت نوروز عبارتند از :
19و 31و 15و 17و 31و 43و 41و 34و 16و 17و 14و 13و 15و 11و 11
مثال :15نمودار زیر را در نظر گرفته و میانه ،چارکها ،دامنه تغییرات و دامنه میان چارکی ( )IQRرا به دست آورید.
1 2 3 4 5 6 7 8 9 10 11 12
دامنه تغییرات:
مثال :16نمودار جعبهای زیر را در نظر بگیرید .در کدام قسمت از جامعه ،دادهها از تراکم بیشتری برخوردارند؟ چرا؟
10
مد (نما) :دادهای که بیشترین فراوانی را دارد.
مثال :17چه عددی به دادههای 63،71،66،51،77،65،64اضافه شود تا میانگین ،مد و میانه دادههای جدید ،برابر شوند؟
تذکر :مد منحصر به فرد نیست .ضمناً اگر همه دادهها برابر بودند ،مد نداریم.
دادههای دور افتاده :دادههایی که تفاوت زیادی با سایر دادهها دارند .اینها میانگین را تحت تأثیر قرار میدهند ولی بر میانه و مد اثری ندارند.
مثال :17مدت زمان استفاده مبینا از گوشی تلفن همراه در روزهای هفته به صورت زیر بودهاست .میانگین و میانه این داده ها را به دست آورید و
تحلیل کنید کدامیک معیار بهتری هستند.
11
درس سوم :معیارهای پراکندگی
واریانس
مثال :19در چهار کالس الف ،ب ،ج و د آزمونکی 11نمرهای برگزار کردهایم که نمرات آن به این صورت است .کدام کالس نمرات پراکندهتر و
کدام کالس نمرات متمرکزتری دارد؟
الف 4،5،6:
ب1،5،9 :
ج1،4،4،5،5،5،5،6،6،9 :
د4,4،4،4،4،6،6،6،6،6 :
واریانس معیاری برای نشان دادن پراکندگی دادههاست که از رابطه زیر به دست میآید:
n
مثال :31تعداد ساعاتی که 4دانشآموز در طول هفته به ورزش اختصاص دادهاند ،در زیر آمده است .واریانس این دادهها را حساب کنید.
9و7و5و1
12
مثال :31اگر میانگین دادههای زیر برابر 16باشد ،واریانس آنها چقدر است؟
11 14 16 17 11داده
فراوانی 5 7 11 a 3
مثال :33در 15داده آماری ،میانگین و واریانس به ترتیب 31و 64میباشند .اگر دادههای ناجور 15،11،45و 51را از میان آنها حذف کنیم،
واریانس دادههای باقیمانده چقدر است؟
مثال :34اگر دادههای 13،11،11،17،11،11،11،9،17،16،11،7،17را با نمودار جعبهای نمایش دهیم ،واریانس دادههای داخل جعبه چقدر است؟
نكات تكمیلی:
.1اگر همه دادهها با هم برابر باشند ،واریانس آنها صفر است و برعکس.
اثبات:
x i
2
2 x12 x22 ... xn2 2
x2 i 1
x x
n n
مثال :35در 51داده آماری مجموع تمام دادهها برابر 111و مجموع مجذور این دادهها برابر 171میباشد .واریانس دادهها چقدر است؟
.3میانگین هم واحد دادهها است ولی واحد واریانس مجذور واحد دادهها است.
13
انحراف معیار)standard deviation( :
مثال :36نمرات ادبیات دانش آموزی در ده آزمون به صورت زیر است .با حذف دو نمره بیشترین و کمترین ،انحراف معیار چقدر است؟
14و11و15و9و14و15و16و15و11و11
نكات تكمیلی:
.1اگر تمام دادهها با هم برابر باشند ،آنگاه انحراف معیار آنها صفر است و برعکس.
مثال :37انحراف معیار 11داده آماری صفر است .اگر دادههای 16 ،14و 16به آنها اضافه شوند ،میانگین آنها تغییر نمیکند .انحراف معیار این 14
داده چقدر است؟
مثال :37جدول زیر انحراف دادهها از میانگین را به همراه فراوانی نشان میدهد .انحراف معیار دادهها چقدر است؟
14
ضریب تغییرات(coefficient of variation) :
CV
x
ضریب تغییرات نسبت انحراف معیار به میانگین است.
مثال :39ضریب تغییرات دو دسته دادههای زیر را حساب کنید .چه نتیجهای میگیرید؟
تذکر :ضریب تغییرات بدون واحد است .بنابراین امکان مقایسه دادههای غیر همواحد را فراهم میسازد .مثالً اگر بخواهیم پراکندگی قد و وزن
دانشآموزان را مقایسه کنیم ،از این شاخص استفاده میکنیم.
2
) مثال :41ضریب تغییرات دادههای 5،7،7،7،7،11،11را به دست آورید0 / 534 ( .
7
مثال :41نمرات مهارت برای کارگر 16،15،14،13،11 : Aو برای کارگر 16/5 ،16 ،15/5 ،13 ،11/5 : Bبوده است .دقت عمل کدامیک بیشتر
است؟
15
مثال :41ضریب تغییرات دادههای زیر را به دست آورید.
7
فراوانی
5
4
مثال :43در 15داده آماری مجموع اختالفات دادهها از 11برابر صفر و مجموع مربعات اختالفات دادهها از 11برابر 411است .ضریب تغییرات این
دادهها چقدر است؟
مثال :44میزان بارندگی یک استان در ده سال گذشته به صورت زیر است .اگر آنها را با نمودار جعبهای نمایش دهیم ،ضریب تغییرات دادههای
درون جعبه چقدر است؟
46،51،54،37،41،57،31،59،39،56
دادههای جدید ( ) ax1 b , ax2 b ,..., axn b دادههای قدیمی ( ) x1 , x2 ,..., xn شاخص
ax b x میانگین
aM b M میانه ،مد،چارکها
a 2 2 2 واریانس
| a | انحراف معیار
16
مثال :45اگر میانگین nداده x1 , x2 ,..., xnبرابر 7باشد ،میانگین nداده ) ( 3 x1 2), ( 3 x2 2 ),..., ( 3 xn 2را به دست آورید.
مثال :46اگر انحراف معیار x1 , x2 ,..., xnبرابر 1باشد ،انحراف معیار دادههای ) ( 3 x1 1), ( 3 x2 1),..., ( 3 xn 1را به دست
آورید.
مثال :47در 61داده آماری میانگین 3و انحراف معیار 1/1محاسبه شده است .اگر به تمام دادهها 9واحد اضافه شود ،ضریب تغییرات دادههای
جدید چقدر است؟
مثال :47اگر 11دادۀ آماری را دو برابر کرده و سپس 7واحد از هرکدام کم کنیم ،ضریب تغییرات داده های جدید 1/5 ،برابر ضریب تغییرات
داده های قبلی میشود .مجموع داده های قبلی چقدر است؟
17
آمار استنباطی
.1در دسترس نبودن تمام اعضای جامعه .مانند :مطالعه بر روی تمام ماهیهای یک دریا
.1از بین رفتن اعضای جامعه .مانند :طول عمر المپ
.3هزینهبر بودن
.4وقتگیر بودن
انواع نمونهگیری
. 1احتمالی :همه واحدهای آماری شانس انتخاب شدن داشته باشند و واحدهای نمونه به صورت تصادفی انتخاب شوند.
.1غیر احتمالی
مثالً در نمونهگیری از یک قفس بزرگ خرگوش های آزمایشگاهی ،خرگوشهایی را برداریم که به دستمان میخورند.
برای فهمیدن اینکه وضع مالی ساکنان یک شهر چگونه است سراغ کسانی برویم که حاضر به پاسخگویی میشوند.
.1نمونهگیری تصادفی ساده :همه واحدهای آماری برای انتخاب شدن در نمونه شانس یکسانی دارند.
معایب :دشواری دسترسی به فهرست اعضای جامعه ،هزینهبر بودن ،چند بخشی بودن جامعه
18
.2نمونهگیری خوشهای :گروهها (خوشهها) به صورت تصادفی انتخاب میشوند .سپس تمام اعضای خوشههای انتخاب شده بررسی میشوند .مثالً
از 31استان کشور 4 ،استان را انتخاب میکنیم و تعداد مبتالیان به کرونا را در آنها بررسی میکنیم.
.3نمونهگیری طبقهای :جامعه به چند زیرجامعه مجزا (طبقه) افراز میشود .سپس از هر دسته یک نمونه تصادفی ساده انتخاب میشود.
توجه :از هر دسته ،متناسب با تعداد اعضای دسته انتخاب میکنیم تا شانس واحدهای آماری جامعه یکسان شود.
مثال :1دبیرستانی 31دانشآموز ریاضی 11 ،دانش آموز تجربی و 11دانشآموز انسانی دارد .میخواهیم 11نفر به روش نمونهگیری طبقهای
انتخاب کنیم .سهم هر رشته چقدر است؟
.4نمونهگیری سیستماتیک (سامانمند) :نمونهگیری طبقهای که اندازه طبقات برابر است .از طبقه اول ،به تصادف انتخاب میکنیم و با همان
رویه از طبقات دیگر انتخاب میکنیم.
مثال :1برای کنترل کیفیت محصوالت یک خط تولید ،میخواهیم از بین 511محصول تولیدی در هر روز 11 ،محصول را به روش سامانمند
نمونهگیری کنیم .اگر اولین نمونه ،شانزدهمین محصول تولید شده امروز باشد ،آخرین نمونه چندمین محصول تولید شده است؟
مثال :3شهری 31111نفر جمعیت دارد .آمارگیری میخواهد بداند در این شهر خانوادهها چند نفرهاند .او به روش نمونهگیری تصادفی ساده صد
نفر را انتخاب میکند و از آنها میپرسد « :خانواده شما چند نفره است؟»
19
ب) فرض کنید در این شهر آمار واقعی خانوادهها به این صورت باشد:
ج) تعداد خانوادههای دو نفره ،چند برابر خانوادههای پنجنفره است؟ با روش نادرست نمونهگیری به چه نتیجهای میرسیم؟
نمونهگیری اریب :نمونهگیری که به سمتی خاص انحراف پیدا کند و از نمونهگیری ایدهآل فاصله بگیرد.
مثالً میخواهیم سرانه ورزش مردم شهر تهران را محاسبه کنیم .برای اینکار سوال زیر را از نمونهای 111نفره میپرسیم
.4پرسیدن سؤال و ضبط مصاحبه جهت پخش در اخبار ساعت 11شبکه یک سیما
مثالً میخواهیم میزان آالیندگی خودروهای شهر شیراز را بررسی کنیم .اگر نمونهگیری را از خودروهایی که در تعمیرگاهها هستند انجام دهیم،
نمونهگیری ما اریب است.
20
آمارگیری :گردآوری دادهها به یکی از روشهای ممکن
.1مشاهده و ثبت وقایع :گردآوری داده ها بدون نیاز به فرد پاسخگو .مانند شمارش خودروهای عبوری از یک خیابان ،اندازهگیری وزن میوههای یک
باغ ،سنجش میزان آلودگی هوا
. 4دادگان :استفاده از اطالعات ذخیره شده (بانک اطالعات) مانند مطالعه روی نمرات سال گذشته درس آمار و احتمال یک مدرسه ،تعداد
مدالهای ایران در مسابقات المپیک
پارامتر :مشخصهای عددی که توصیفکننده جنبهای از جامعه است و در صورتی قابل محاسبه است که دادههای کل جامعه در اختیار باشد.
آماره :مشخصهای عددی که توصیفکننده جنبهای از نمونه است و از دادههای نمونه به دست میآید.
7 1 1 3 7 5
الف) پارامتر میانگی ن جامعه را به دست آورید .آماره نمونه را برای یک نمونه سه نفری دلخواه محاسبه کنید.
ب) خط فقر را در این جامعه چقدر است؟ (خط فقر برابر نصف میانگین درآمد افراد جامعه است).
21
درس دوم :برآورد
آمار استنباطی :فرآیند نتیجهگیری درباره پارامترهای جامعه بر اساس نمونه
انواع برآورد:
.2برآورد بازهای:
مثال :5کالسی از 5نفر تشکیل شدهاست که نمرات آزمونک آنها به این صورت است.
نام E D C B A
نمره 1 4 1 1 1
الف) میخواهیم میانگین جامعه را براساس نمونه 1نفره برآورد کنیم .جدول زیر را کامل کنید.
اعضای نمونه
3 1/5 1 1/5 1 1/5 x
احتمال
ب) نمودار احتمال بر حسب میانگین نمونهها را رسم کنید .نتیجهگیری زیر را تکمیل کنید.
22
ج) میخواهیم میانگین جامعه را بر اساس نمونه 3نفره برآورد کنیم .جدول زیر را کامل کنید.
اعضای نمونه
7 5 4 2
1 1 x
3 3 3 3
احتمال
د) نمودار احتمال بر حسب میانگین نمونهها را رسم کنید .نتیجهگیری زیر را تکمیل کنید.
مثال :6با انتخاب نمونههای سه تایی از 1،3،5،7،9،11با چه احتمالی میانگین 7برآورد میشود؟
برآورد بازهای
به جای معرفی یک عدد به عنوان پارامتر ،بازهای را به همراه احتمال مطرح میکنیم .مثالً میگوییم با احتمال 71درصد میانگین در بازه
] [7, 7 / 5است .بازه معرفی شده را بازه اطمینان و احتمال ذکر شده را درصد اطمینان یا ضریب اطمینان میگوییم.
در شرایطی که جامعه نرمال باشد و تعداد اعضای نمونه به اندازه کافی بزرگ باشد ،با اطمینان بیش از 95درصد میگوییم میانگین جامعه در بازه
2 2
[ x قرار دارد .به عبارت دیگر : ,x ]
n n
2 2
x x
n n
23
مثال :7در یک نمونه تصادفی 36تایی از دانش آموزان یک مدرسه ،میانگین مدت استفاده آنان از تلفن همراه 11ساعت در هفته با انحراف معیار
1 / 2به دست آمد .بازهای را که با اطمینان %95میانگین همه دانشآموزان را دربر داشته باشد ،تعیین کنید.
مثال :7مطالعه ای به منظور تعیین طول مدت بستری بیماران مبتال به زخم اثنی عشر با همکاری چند بیمارستان صورت گرفت .در یک نمونه
تصادفی 64تایی از این بیماران میانگین مدت بستری 15روز با انحراف معیار 4به دست آمد .فاصلهای که با اطمینان %95میانگین واقعی را در بر
داشته باشد ،تعیین کنید.
مثال :9حداقل اندازه نمونه چقدر باشد تا طول بازه اطمینان 95درصد برای برآورد میانگین جامعهای با انحراف معیار 3از 1بیشتر نشود؟
مثال :11بازه اطمینان 95درصد برای میانگین قد دانشآموزان یک دبیرستان از روی یک نمونه 36تایی [156,164] ،به دست آمدهاست .انحراف
معیار قد این دانشآموزان چقدر است؟
تذکر :رابطه با فرض نرمال بودن جامعه و نسبتاً بزرگ بودن نمونه ( ) n 30به دست آمدهاست .اما در کتاب درسی آمار و احتمال و کتب
کمکدرسی متأسفانه به این موضوع توجه نشدهاست .به عنوان نمونه ،مثال صفحه 111کتاب درسی را مشاهده کنید.
x
n
نتیجه :با افزایش تعداد اعضای نمونه ،انحراف معیار میانگینها کاهش مییابد .یعنی میانگینهای به دست آمده از نمونههای مختلف به هم نزدیک
میشوند.
24
مثال :11مطالعات درباره گوسفندان یک دامداری نشان میدهد که انحراف معیار وزن آنها 3کیلوگرم است .اگر نمونهای 36تایی از گوسفندان این
دامداری انتخاب کنیم ،انحراف معیار میانگین وزن آنها چقدر است؟
مثال :11اگر انحراف معیار یک جامعه آماری 5باشد ،برای آنکه انحراف معیار برآورد میانگین کمتر از 0 / 4باشد ،نمونهای با حداقل چند عضو باید
انتخاب کنیم؟
مثال :31انحراف معیار برآورد میانگین برای یک نمونه 46نفری چند برابر انحراف معیار با نمونه 311نفری است؟
25