فصل 4

‫فصل چهارم‬
‫‪1‬‬
‫شاخص هاي پراكندگي‬
‫‪Dr Mohammad Kazemi‬‬

‫شاخص های پراکندگی‬
‫‪2‬‬
‫معرفي شاخص هاي پراكندگي‬ ‫‪(1‬‬

‫دامنه تغييرات‬ ‫‪(2‬‬
‫دامنه ميان چاركي‬ ‫‪(3‬‬
‫واريانس‬ ‫‪(4‬‬
‫انحراف معيار‬ ‫‪(5‬‬
‫ضريب تغييرات‬ ‫‪(6‬‬
‫داده هاي استاندارد‬ ‫‪(7‬‬
‫چولگي و كشيدگي‬ ‫‪(8‬‬
‫ضريب چولگي پيرسن‬ ‫‪(9‬‬
‫ضريب چولگي گشتاوري‬ ‫‪(10‬‬
‫ضريب برجستگي‬ ‫‪(11‬‬

‫‪3‬‬
‫با وجود اینکه در بسیاری از موارد‪ ،‬شاخصهای مرکزی توصیف نسبتا کاملی از داده ها ارائه می دهند‪ ،‬ولی گاهی‬
‫وجود اطالعات بیشتر در مورد داده ها ضروری است‪ .‬یک مفهوم مهم در ارتباط با داده های آماری‪ ،‬میزان تغیرات‬
‫آنهاست‪ ،‬بدینمعنی که اندازه گیری ها تا چه اندازه از فردی به فردی دیگر یا شیئی به شیئی دیگر تغییر می کنند‪.‬‬
‫برای بررسی و محاسبه تغییرات از شاخص های پراکندگی استفاده می کنیم‪.‬‬
‫شاخص هاي‬
‫شاخص هاي عددي هستند كه ميزا ن پراكندگي داده ها حول مركز را اندازه مي گيرند‪.‬‬ ‫پراكندگي‬
‫مهمترين شاخصهاي‬ ‫ضريب‬ ‫انحراف‬ ‫دامنه میان‬ ‫دامنه‬

‫پراكندگي‬ ‫واريانس‬
‫تغییرات‬ ‫معیار‬ ‫چارکی‬ ‫تغییرات‬
‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪4‬‬
‫‪Xi fi‬‬ ‫‪Yi fi‬‬ ‫مثال‪ :‬دو گروه از دانشجویان را از نظر مطالعه تعداد کتاب های غیر درسی در‬
‫‪2‬‬ ‫‪2‬‬ ‫‪4‬‬ ‫‪5‬‬ ‫سال اخیر مورد بررسی قرار داده ایم که نتایج در دو جدول زیر آمده است‪.‬‬
‫‪3‬‬ ‫‪3‬‬ ‫‪5‬‬ ‫‪10‬‬
‫‪4‬‬ ‫‪15‬‬ ‫‪6‬‬ ‫‪70‬‬
‫‪5‬‬ ‫‪10‬‬ ‫‪7‬‬ ‫‪10‬‬ ‫براي اين دو گروه‪ ،‬ميانگين‪ ،‬ميانه و نما يكسان و برابر ‪ 6‬است‬
‫‪6‬‬ ‫‪40‬‬ ‫‪8‬‬ ‫‪5‬‬
‫‪7‬‬ ‫‪10‬‬
‫‪8‬‬ ‫‪15‬‬
‫‪9‬‬ ‫‪3‬‬ ‫اما در این دو مجموعه داده‪ ،‬تفاوتهایی وجود دارد‬
‫‪10‬‬ ‫‪2‬‬ ‫که با شاخصهای مرکزی قابل بیان نیستند‪.‬‬
‫برای توصیف بیشتر و مقایسه این دو گروه‪ ،‬الزم‬

‫است از شاخص های پراکندگی استفاده کنیم‪.‬‬

‫‪5‬‬
‫این شاخص حدود تغییرات صفت را معلوم می کند و از رابطه زیر بدست می آید‬ ‫دامنه تغييرات‬
‫‪R  X max  X min‬‬
‫این شاخص مانند دامنه تغییرات است و حدود تغییرات بین چارك های اول و سوم را‬ ‫دامنه میان چارکی‬
‫‪𝐼𝑄𝑅 = 𝑄3 − 𝑄1‬‬ ‫معین می کند‬
‫مثال‪ :‬در دادههای زیر دامنه تغییرات و دامنه میان چارکی را بدست آورید‪..‬‬
‫‪1‬‬ ‫‪12‬‬ ‫‪14‬‬ ‫‪15‬‬ ‫‪17‬‬ ‫‪20‬‬ ‫‪25‬‬ ‫‪28‬‬ ‫‪30‬‬
‫دامنه تغییرات داده ها‬
‫‪R  X max  X min  30  1  29‬‬
‫‪𝑝 = 0.25 ⇒ (𝑛 + 1) × 𝑝 = 10 × 0.25 = 2.5‬‬ ‫چارك اول وسوم دادهها را حساب میکنیم‪.‬‬
‫‪𝑄1 = 0. 5 × 12 + 0. 5 × 14= 13‬‬ ‫دامنه میان چارکی‬

‫‪𝑝 = 0.75 ⇒ (𝑛 + 1) × 𝑝 = 10 × 0.75 = 7.5‬‬
‫‪𝑄3 = 0.5 × 25 + 0.5 × 28= 26.5‬‬ ‫‪𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 26.5 − 13 = 13.5‬‬
‫واریانس‬
‫‪6‬‬
‫واریانس یکی از مهمترین شاخص های پراکندگی است که قادر است پراکندگی دادهها نسبت‬ ‫واريانس‬
‫به میانگین را به خوبی بیان کند‪ .‬واریانس از روابط زیر محاسبه می شود‪.‬‬
‫‪1‬‬ ‫‪n‬‬
‫‪S ‬‬ ‫)‪ (x i  x ) (1‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪n‬‬ ‫‪i 1‬‬ ‫‪1‬‬ ‫‪n‬‬

‫میانگین توان دوم داده ها را به صورت‬
‫‪x ‬‬ ‫‪xi‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪n‬‬ ‫‪1‬‬
‫‪2‬‬ ‫تعریف می شود‪ .‬بنابراین واریانس را می توان به طور معادل از‬

‫‪s  x x‬‬
‫‪2‬‬ ‫‪2‬‬
‫)‪(2‬‬ ‫فرمول (‪ )2‬نیز حساب کرد‪ .‬فرمول های ‪ 1‬و ‪ 2‬معادل اند‪( .‬؟)‬
‫‪3 2 4 3 6 3 5‬‬ ‫مثال‪ :‬واریانس دادههای زیر را بدست آورید‪.‬‬

‫ابتدا میانگین دادهها را حساب می کنیم و سپس از فرمول (‪ )1‬واریانس را محاسبه می کنیم‪ ،‬داریم‪:‬‬
‫‪1‬‬
‫‪S 2  [( 3  4)2  (2  4)2  (4  4)2  ( 3  4)2  (6  4)2‬‬
‫‪1‬‬ ‫‪32‬‬ ‫‪8‬‬
‫‪x  ( 3  2  4  3  6  3  5  6)   4‬‬
‫‪8‬‬ ‫‪8‬‬ ‫‪1‬‬
‫‪ ( 3  4)2  (5  4)2  (6  4)2 ]  (16)  2‬‬
‫‪8‬‬
‫توجه کنید که در این مثال داده ها دسته بندی نیستند‪.‬‬

‫‪7‬‬
‫‪1‬‬ ‫‪n‬‬
‫‪S ‬‬ ‫)‪ f i (x i  x ) (1‬‬
‫‪2‬‬ ‫‪2‬‬
‫مثال‪ :‬در جدول توزیع فراوانی زیر واریانس را محاسبه کنید‪.‬‬
‫‪n‬‬ ‫‪i 1‬‬
‫‪2‬‬ ‫‪1‬‬ ‫‪n‬‬ ‫‪2‬‬

‫‪s  x x‬‬
‫‪2‬‬ ‫‪2‬‬
‫)‪(2‬‬ ‫‪x‬‬
‫‪2‬‬
‫‪‬‬ ‫‪fix‬‬
‫‪2‬‬
‫‪i‬‬ ‫‪Xi‬‬ ‫‪fi‬‬ ‫‪fixi‬‬ ‫‪fixi‬‬
‫‪n‬‬ ‫‪1‬‬
‫‪0‬‬ ‫‪3‬‬ ‫‪0‬‬ ‫‪3× 0 =0‬‬
‫‪1‬‬ ‫‪7‬‬ ‫‪7‬‬ ‫‪7×1 =7‬‬
‫‪2‬‬ ‫‪21‬‬ ‫‪42‬‬ ‫‪21×4 =84‬‬
‫ابتدا با تشکیل دو ستون آخر جدول‪ ،‬مقادیر زیر را‬ ‫‪3‬‬ ‫‪6‬‬ ‫‪18‬‬ ‫‪6×9 =54‬‬
‫بدست می آوریم‬ ‫‪4‬‬ ‫‪7‬‬ ‫‪28‬‬ ‫‪7×16 =112‬‬
‫‪125‬‬ ‫‪2‬‬ ‫‪407‬‬ ‫‪5‬‬ ‫‪6‬‬ ‫‪30‬‬ ‫‪6×25 =150‬‬
‫‪x ‬‬ ‫‪ 2.5‬‬ ‫‪x ‬‬ ‫‪ 8.14‬‬ ‫‪ 50‬جمع‬ ‫‪125‬‬ ‫‪407‬‬
‫‪50‬‬ ‫‪50‬‬
‫سپس واریانس از فرمول (‪ )2‬بدست می آید‪.‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪S  8.14  (2.5)  1.89‬‬ ‫توجه کنید که در این مثال داده ها گسسته و دسته بندی شده اند‪.‬‬

‫‪8‬‬
‫مثال‪ :‬برای دادههای جدول توزیع فراوانی زیر‪ ،‬واریانس را محاسبه کنید‬
‫‪2‬‬
‫حدود طبقات‬ ‫‪fi‬‬ ‫‪x 'i‬‬ ‫‪f i .x ' i‬‬ ‫‪f i .x ' i‬‬
‫‪7 -11‬‬ ‫‪2‬‬ ‫‪9‬‬ ‫‪18‬‬ ‫‪162‬‬ ‫برای محاسبه واریانس در داده های‬
‫‪11 -15‬‬ ‫‪3‬‬ ‫‪13‬‬ ‫‪39‬‬ ‫‪507‬‬ ‫پیوسته‪ ،‬مشابه مثال قبل عمل می کنیم‪،‬‬
‫‪15 -19‬‬ ‫‪5‬‬ ‫‪17‬‬ ‫‪85‬‬ ‫‪1445‬‬ ‫با این تفاوت که به جای 𝑖𝑥 از نماینده‬
‫‪19 -23‬‬ ‫‪10‬‬ ‫‪21‬‬ ‫‪210‬‬ ‫‪4410‬‬ ‫طبقات ( 𝑖‪ )𝑥′‬استفاده می کنیم‪.‬‬
‫‪23 -27‬‬ ‫‪2‬‬ ‫‪25‬‬ ‫‪50‬‬ ‫‪1250‬‬
‫‪22‬‬ ‫‪402‬‬ ‫‪7774‬‬
‫‪1‬‬
‫‪x ‬‬ ‫‪402)  18.27 ‬‬
‫‪22‬‬ ‫‪2‬‬ ‫‪2‬‬
‫‪‬‬ ‫‪S  353.36  (18.27 )  19.57‬‬
‫‪2‬‬ ‫‪1‬‬
‫‪x ‬‬ ‫‪( 7774)  353.36‬‬
‫‪22‬‬

‫‪9‬‬
‫خواص واريانس‬
‫‪2‬‬
‫‪x 1  x 2  ...  x n  S x  0‬‬ ‫‪ -1‬اگر همه دادهها باهم برابر باشند واریانس دادهها صفر است و برعکس‬
‫‪2‬‬
‫‪S 0‬‬ ‫‪ -2‬واریانس دادهها مقداری نامنفی است‪.‬‬
‫‪ -3‬اگر به دادهها عدد ثابتی مانند ‪ a‬را اضافه یا کم کنیم‪ ،‬واریانس تغییری نمیکند‪.‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪Y i  a  X i  SY  S x‬‬
‫‪2‬‬ ‫‪2 2‬‬

‫‪Y i  ax i  SY  a S x‬‬
‫‪ -4‬اگر دادهها را در عدد ثابتی مانند ‪ a‬ضرب کنیم‪ ،‬واریانس آنها در مجذور ‪a‬‬
‫ضرب میشود‪.‬‬
‫‪2‬‬
‫‪Yi ‬‬
‫‪Xi‬‬ ‫‪2‬‬
‫‪ SY ‬‬
‫‪Sx‬‬
‫‪2‬‬
‫به همین صورت در مورد تقسیم بر عدد ثابتی مانند ‪ ،a‬داریم‪:‬‬
‫‪a‬‬ ‫‪a‬‬

‫‪10‬‬
‫باشد مطلوب است‪:‬‬ ‫مثال‪ :‬جدول توزیع فراوانی زیر را در نظر بگیرید‪ .‬اگر ‪ Y i  X i  5‬و ‪Z i  3 X i‬‬
‫‪Xi‬‬ ‫‪0‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪S y ,Sz ,Sx‬‬
‫‪2‬‬
‫?‬ ‫‪fi‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪8‬‬ ‫‪4‬‬

‫حل‪ :‬ابتدا واریانس ‪ x‬را به دست می آوریم سپس از خواص ‪ 3‬و ‪ 4‬واریانس استفاده می کنیم‪.‬‬
‫‪2‬‬
‫‪Xi‬‬ ‫‪fi‬‬ ‫‪fi xi‬‬ ‫‪X i2‬‬ ‫‪fi xi‬‬
‫‪30‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪0‬‬ ‫‪0‬‬ ‫‪0‬‬ ‫‪x ‬‬ ‫‪ 2‬‬
‫‪2‬‬ ‫‪15‬‬ ‫‪70‬‬
‫‪1‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪S x2 ‬‬ ‫‪ 4  0 / 66‬‬
‫‪2‬‬ ‫‪8‬‬ ‫‪16‬‬ ‫‪4‬‬ ‫‪32‬‬ ‫‪70‬‬ ‫‪15‬‬
‫‪x2 ‬‬
‫‪3‬‬ ‫‪4‬‬ ‫‪12‬‬ ‫‪9‬‬ ‫‪36‬‬ ‫‪15‬‬
‫جمع‬ ‫‪15‬‬ ‫‪30‬‬ ‫‪14‬‬ ‫‪70‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪S y  S x  0 / 66‬‬ ‫بنابر این واریانس ‪ y‬و ‪ z‬به این صورت به دست می آید‪.‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪S z  9 S x  9 0 / 66  5 / 94‬‬
‫انحراف معیار‬
‫‪11‬‬
‫ازآنجا که واریانس توان دوم انحرافات از میانگین داده ها را‬

‫نشان می دهد‪ ،‬انحراف معیار می تواند به عنوان یک معیار‬
‫پایهای برای تعیین میزان پراکندگی داده ها به کار رود‬
‫انحراف معیار‬
‫‪2‬‬ ‫انحراف معیار عبارت است از جذر واریانس و آن را با ‪ S‬نشان می دهیم‪:‬‬

‫‪S ‬‬ ‫‪S‬‬
‫‪S ‬‬ ‫‪19 / 57  4 / 42‬‬ ‫مثال‪ :‬در مثال قبل انحراف معیار را به دست آورید‬

‫ضریب تغییرات‬
‫‪12‬‬
‫از آنجایی که واریانس به واحد اندازهگیری بستگی دارد به طوری که اگر واحد اندازهگیری‬
‫طول یک نقطه را از سانتیمتر به اینچ تغییر دهیم‪ ،‬واریانس آن تغییرخواهد کرد‪ .‬بنابراین الزم‬
‫است از معیار دیگری که به واحد اندازهگیری بستگی نداشته باشد‪ ،‬استفاده کنیم‪.‬‬
‫ضریب تغییرات داده ها که آن را با ‪ C.V‬نشان می دهیم از نسبت انحراف معیار به میانگین به دست می آید‪.‬‬
‫عموماّ ضریب تغییر را به صورت درصد بیان می کنند‪.‬‬
‫‪S‬‬
‫‪C .V ‬‬
‫‪x‬‬
‫مثال‪ :‬اگر در یک نمونه‪ ،‬میانگین دادهها ‪ 5‬و واریانس داده ها ‪ 4‬باشد؛ ضریب تغییرات دادهها را بدست آورید‪.‬‬
‫‪2‬‬
‫‪C .V ‬‬ ‫‪ 0.40‬‬ ‫‪%‬‬ ‫‪C .V ‬‬ ‫ي ا‬
‫‪40‬‬
‫‪5‬‬
‫‪13‬‬
‫ويژگي هاي ضريب تغييرات‬
‫‪ -1‬به واحد اندازه گيري بستگي ندارد‪.‬‬

‫‪ -2‬براي مقايسه دو صفت از يك جامعه با واحدهاي اندازه گيري متفاوت مورد استفاده قرار مي گيرد‪.‬‬
‫‪ -3‬در مقايسه‪ ،‬هر اندازه که ضريب تغيير يك محموعه از داده ها کمتر باشد‪ ،‬ويژگي آن مجموعه از داده ها بهتر‬
‫ارزيابي مي شود ( داده ها از همگني بيشتري برخوردار هستند)‪.‬‬
‫مثال‪ :‬کارخانه ای دو نوع الستیک اتومبیل تولید می کند‪ .‬برای نوع ‪ A‬میانگین عمر ‪ 20000‬کیلومتر با انحراف معیار‬
‫‪ 2000‬کیلومتر و برای نوع ‪ B‬میانگین عمر ‪ 18000‬کیلومتر با انحراف معیار ‪ 200‬کیلومتر می باشد‪ .‬کدام نوع الستیک‬
‫برای خرید مناسب تر است؟‬
‫‪2000‬‬ ‫‪200‬‬
‫‪C .V A ‬‬ ‫‪ 0 .1‬‬ ‫‪C .V B ‬‬ ‫‪ 0.01‬‬
‫‪20000‬‬ ‫‪18000‬‬
‫اگرچه ميانگين طول عمر الستيك نوع ‪ A‬بيشتر است‪ ،‬اما با توجه به اينکه ضريب تغيير الستيك نوع ‪ B‬کمتر است‪،‬‬
‫الستيك نوع ‪ B‬براي خريد به صرفه تر است‪.‬‬

‫استانداردسازی داده ها‬
‫‪14‬‬
‫داده های استاندارد‬
‫فرض کنیم ‪ x n ,..., x 1‬مجموعه داده های خام با میانگین 𝑥 و انحراف معیار 𝑠 باشند‪ .‬اگر هر داده را از 𝑥 کم کرده و‬
‫‪x x‬‬ ‫بر𝑠 تقسیم کنیم‪ ،‬داده های استاندارد بدست می آیند‪ ،‬یعنی اگر‬
‫‪zi  i‬‬ ‫‪,‬‬ ‫‪i=1,...,n‬‬
‫‪s‬‬
‫آنگاه ‪ z n ,..., z 1‬را داده های استاندارد گوییم‪ .‬به سادگی می توان نشان داد که داده های استاندارد دارای میانگین ‪ 0‬و‬
‫انحراف استاندارد ‪ 1‬می باشند و به واحد اندازه گیری بستگی ندارند (؟؟)‪.‬‬
‫مثال‪ :‬نمره دانش آموزان یک کالس در آزمون ریاضی‪ ،‬دارای میانگین ‪ 72‬و انحراف معیار ‪ ،15‬و در آزمون فیزیک‪ ،‬دارای‬
‫میانگین ‪ 50‬و انحراف معیار ‪ 20‬می باشند‪ .‬اگر نمره علی در درس ریاضی ‪ 60‬و در درس فیزیک ‪ 35‬باشد‪ ،‬معلومات علی‬
‫در کدام درس بیشتر است؟‬
‫حل‪ :‬چون این دو آزمون با مقیاس های مختلف به عمل آمده اند‪ ،‬مقایسه اعداد ‪ 60‬و ‪ 35‬مفهومی ندارد و تنها بعد از‬
‫‪60  72‬‬
‫استاندارد کردن می توان آنها را با هم مقایسه کرد‪.‬‬
‫‪z1 ‬‬ ‫‪ 0.8‬‬ ‫نمره استاندارد ریاضی‬
‫‪15‬‬
‫‪35  50‬‬
‫‪z2 ‬‬ ‫‪ 0.75‬‬ ‫نمره استاندارد فیزیک‬
‫‪20‬‬
‫پس علی در درس فیزیک بهتر است‪ ،‬چون نمره استاندارد فیزیک بزرگتر است‪.‬‬
‫تقارن و کشیدگی‬
‫‪15‬‬
‫ممکن است دو مجموعه داده‪ ،‬از لحاظ گرایش به مرکز و پراکندگی تفاوت چندانی با هم نداشته باشند ولی از نظر تقارن و کشیدگی با‬
‫یکدیگر متفاوت باشند‪ .‬از این رو الزم است تا شاخص های دیگری برای اندازه گیری میزان تقارن و کشیدگی داده ها معرفی شوند‪.‬‬
‫چولگی عبارت از میزان و درجه انحراف از تقارن منحنی فراوانی است‪ .‬برای اندازه گیری میزان چولگی‬
‫چولگی‬
‫از ضریب چولگی استفاده می کنیم‪ .‬در این بخش دو نوع ضریب چولگی را معرفی می کنیم‪ :‬ضریب‬
‫چولگی پیرسن و ضریب چولگی گشتاوری‬
‫عدم تقارن (چولگي)‬

‫تقارن در توزيع داده ها‬
‫در توزيعهاي كامال‬

‫متقارن تک نمايي‪،‬‬ ‫منحني نرمال‬
‫ميانگين‪ ،‬ميانه و نما‬
‫بر هم منطبق اند‪.‬‬
‫‪M x  m‬‬

‫چولگی‬
‫‪16‬‬
‫ضريب چولگي پيرسن‬
‫یکی از شاخص های اندازه گیری میزان تقارن و عدم تقارن داده ها‪ ،‬ضریب چولگی پیرسن است‪.‬‬
‫اگر ‪ x‬میانگین‪ M ،‬نما‪ m ،‬میانه و ‪ S‬انحراف معیار یک مجموعه داده باشند‪ ،‬دو ضریب چولگی که‬
‫هر دو منسوب به پیرسن است‪ ،‬از رابطه های زیر بدست میآیند‪:‬‬
‫) ‪(x  M‬‬
‫‪SK ‬‬ ‫ضریب چولگی نوع اول‬
‫‪S‬‬
‫) ‪3(x  m‬‬
‫‪SK ‬‬ ‫ضریب چولگی نوع دوم‬
‫‪S‬‬
‫برای منحنی های فراوانی تک نمایی که چولگی آن شدید نباشد‪ ،‬رابطه تجربی زیر بین معیارهای مرکزی‬ ‫نکته‬
‫برقرار است‪:‬‬
‫)𝑚 ‪𝑥 − 𝑀 = 3(𝑥 −‬‬

‫چولگی‬
‫‪17‬‬
‫تفسير ضريب چولگي‬
‫ضریب چولگی ممکن است مقداری منفی‪ ،‬مثبت یا صفر باشد‪ .‬بر این اساس وضعیت قرار گرفتن سه شاخص مهم‬
‫مرکزی‪ ،‬میانگین‪ ،‬میانه و نما را در حالت های مختلف ببینید‪.‬‬
‫منحني نرمال‬
‫چولگي منفي‬ ‫چولگي مثبت‬
‫‪xm‬‬ ‫‪M‬‬ ‫‪x m M‬‬ ‫‪M‬‬ ‫‪m‬‬ ‫‪x‬‬

‫‪SK  0‬‬ ‫‪SK  0‬‬ ‫‪SK  0‬‬
‫در این صورت توزیع دادهها‬ ‫در این صورت توزیع دادهها‬
‫در این صورت توزیع دادهها‬ ‫متقارن است و شاخصهای‬ ‫نامتقارن است و ميگوییم‬
‫نامتقارن است و ميگوییم‬ ‫میانه‪ ،‬میانگین و نما بر هم‬ ‫دادهها چوله به راست‬
‫دادهها چوله به چپ هستند‪.‬‬ ‫منطبق اند‪.‬‬ ‫هستند‪.‬‬

‫چولگی‬
‫‪18‬‬
‫براي محاسبات به اين ستونها نياز داريم‬

‫مثال‪ :‬درجدول توزیع فراوانی زیر‪ ،‬ضرایب چولگی پیرسن‬
‫را محاسبه کنید‪.‬‬
‫‪2‬‬
‫حدود طبقات‬ ‫‪fi‬‬ ‫‪x 'i‬‬ ‫‪f i .x 'i‬‬ ‫‪f i .x 'i‬‬ ‫‪Fi‬‬
‫‪7 -11‬‬ ‫‪2‬‬ ‫‪9‬‬ ‫‪18‬‬ ‫‪162‬‬ ‫‪2‬‬ ‫برای محاسبه ضرایب چولگی پیرسن‪ ،‬ابتدا‬
‫‪11-15‬‬ ‫‪3 13‬‬ ‫‪39‬‬ ‫‪507‬‬ ‫‪5‬‬ ‫سه شاخص میانگین‪ ،‬میانه‪ ،‬نما و انحراف‬
‫‪15-19‬‬ ‫‪5 17‬‬ ‫‪85‬‬ ‫‪1445‬‬ ‫‪10‬‬ ‫معیار داده ها را به دست می آوریم‪.‬‬
‫‪19-23‬‬ ‫‪10 21‬‬ ‫‪210‬‬ ‫‪4410‬‬ ‫‪20‬‬
‫‪23-27‬‬ ‫‪2 25‬‬ ‫‪50‬‬ ‫‪1250‬‬ ‫‪22‬‬ ‫‪n p  Fi 1‬‬
‫‪m  Li ‬‬ ‫‪C‬‬
‫‪22‬‬ ‫‪402‬‬ ‫‪7774‬‬ ‫‪fi‬‬
‫‪11  10‬‬
‫‪402‬‬ ‫‪ 19 ‬‬ ‫‪ 4  19  0 / 4  19 / 4‬‬
‫‪x ‬‬ ‫‪ 18 / 27‬‬ ‫‪10‬‬
‫‪22‬‬
‫‪7774‬‬ ‫‪D1‬‬
‫‪M  li ‬‬ ‫‪C‬‬
‫‪2‬‬
‫‪x ‬‬ ‫‪ 353 / 36‬‬
‫‪22‬‬ ‫‪D1  D 2‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪S  253 / 36  (18 / 27)  19 / 57  S  19 / 57  4 / 42‬‬ ‫‪ 19 ‬‬
‫‪5‬‬
‫‪ 4  20 / 54‬‬
‫‪5 8‬‬

‫چولگی‬
‫‪19‬‬
‫‪x M‬‬ ‫‪18 / 27  20 / 54‬‬ ‫با توجه به عالمت ضریب چولگی‪،‬‬

‫‪Sk ‬‬ ‫‪‬‬ ‫‪ 0 / 51‬‬ ‫ضریب چولگی اول پیرسن‬
‫توزیع داده ها چوله به چپ است‪.‬‬
‫‪S‬‬ ‫‪4 / 42‬‬
‫) ‪3(x  m‬‬ ‫)‪3 (18 / 27  19 / 4‬‬ ‫با توجه به عالمت ضریب چولگی‪،‬‬
‫‪Sk ‬‬ ‫‪‬‬ ‫ضریب چولگی دوم پیرسن ‪ 0 / 77‬‬ ‫توزیع داده ها چوله به چپ است‪.‬‬
‫‪S‬‬ ‫‪4 / 42‬‬

‫چولگی‬
‫‪20‬‬
‫ضريب چولگي گشتاوري‬
‫روش دیگر برای تعیین میزان تقارن و چولگی داده ها‪ ،‬استفاده از ضریب چولگی گشتاوری است‪.‬‬
‫‪m 3‬‬
‫‪SK ‬‬ ‫‪3‬‬
‫‪S‬‬
‫که ‪ 𝑚3′‬گشتاور مرکزی سوم داده ها است و به صورت زیر محاسبه می شود‬
‫𝑛‬
‫‪1‬‬
‫= ‪𝑚3′‬‬ ‫𝑥 ‪𝑥𝑖 −‬‬ ‫‪3‬‬
‫𝑛‬
‫‪𝑖=1‬‬
‫‪50‬‬ ‫‪3‬‬
‫‪ .‬ضریب چولگی گشتاوری داده ها‬ ‫‪𝑖=1‬‬
‫‪𝑥𝑖 − 15‬‬ ‫‪= 24‬‬ ‫مثال‪ :‬در ‪ 50‬داده آماری با میانگین ‪ 15‬و واریانس ‪ 4‬داریم‬
‫را به دست آورید‪.‬‬
‫‪n‬‬
‫‪1‬‬
‫‪ (x i‬‬
‫‪3‬‬
‫) ‪-x‬‬ ‫‪24‬‬
‫‪n‬‬ ‫با توجه به عالمت ضریب چولگی‪ ،‬توزیع داده ها‬
‫‪i 1‬‬ ‫‪50‬‬
‫‪SK ‬‬ ‫‪‬‬ ‫‪ 0 / 06‬‬
‫‪s‬‬
‫‪3‬‬ ‫‪3‬‬
‫‪2‬‬
‫اندکی چوله به راست است‪.‬‬

‫کشیدگی‬
‫‪21‬‬
‫تمرین‪ :‬در جدول فراوانی مثال قبل‪ ،‬ضریب چولگی گشتاوری را محاسبه کنید‪.‬‬
‫میزان کشیدگی یا پَخی منحنی فراوانی داده ها در مقایسه با منحنی نرمال را برجستگی گویند‪ .‬ضریب‬ ‫برجستگی‬
‫برجستگی (ضریب کشیدگی) از رابطه زیر محاسبه می شود‪.‬‬
‫‪m 4‬‬
‫‪K ‬‬ ‫‪4‬‬
‫‪3‬‬
‫‪S‬‬
‫که ‪ 𝑚4′‬گشتاور مرکزی چهارم داده ها است و به صورت زیر بدست می آید‬
‫𝑛‬
‫‪1‬‬
‫= ‪𝑚4′‬‬ ‫𝑥 ‪𝑥𝑖 −‬‬ ‫‪4‬‬
‫𝑛‬
‫‪𝑖=1‬‬

‫کشیدگی‬
‫‪22‬‬
‫تفسير ضريب برجستگي‬
‫ضریب برجستگی ممکن است مقداری منفی‪ ،‬مثبت یا صفر باشد‪ .‬در نتیجه منحنی فراوانی به یکی از سه حالت زیر خواهد بود‪.‬‬
‫منحني نرمال‬
‫دارای برجستگي‬
‫دارای پخي‬
‫‪K 0‬‬ ‫‪K 0‬‬ ‫‪K 0‬‬

‫در این صورت منحني‬ ‫در این صورت میزان‬ ‫در این صورت منحني‬
‫فراواني در مقایسه با‬ ‫برجستگي صفر است و‬ ‫فراواني در مقایسه با‬
‫منحني نرمال دارای‬ ‫منحني فراواني بر منحني‬ ‫منحني نرمال دارای پخي‬
‫برجستگي است‪.‬‬ ‫نرمال منطبق است‪.‬‬ ‫است‪.‬‬

‫کشیدگی‬
‫‪23‬‬
‫مثال‪ :‬دستمزد هفتگی ‪ 100‬کارگر در یک کارخانه به صورت جدول زیر ثبت شده است‪ .‬میزان برجستگی دستمزد‬
‫‪2‬‬
‫کارگران را محاسبه کنید‪.‬‬
‫دستمزد کارگران‬ ‫‪f‬‬ ‫‪i‬‬
‫‪x 'i‬‬ ‫‪f i .x 'i x 'i  x‬‬ ‫) ‪(x 'i  x‬‬
‫‪1‬‬ ‫‪n‬‬ ‫‪2875‬‬
‫‪x ‬‬ ‫‪f ix ‬‬ ‫‪ 28 / 75‬‬
‫'‬
‫‪12/5 -17/5‬‬ ‫‪12‬‬ ‫‪15‬‬ ‫‪180‬‬ ‫‪-13/75‬‬ ‫‪189/06‬‬ ‫‪i‬‬
‫‪n‬‬ ‫‪i 1‬‬ ‫‪100‬‬
‫‪17/5 -22/5‬‬ ‫‪16‬‬ ‫‪20‬‬ ‫‪320‬‬ ‫‪-8/75‬‬ ‫‪76/56‬‬
‫‪1‬‬ ‫‪n‬‬
‫‪22/5 -27/5‬‬ ‫‪25‬‬ ‫‪25‬‬ ‫‪625‬‬ ‫‪-3/75‬‬ ‫‪14/06‬‬ ‫‪S ‬‬ ‫‪ f i (x 'i  x )  92 / 68‬‬
‫‪2‬‬ ‫‪2‬‬
‫‪27/5 -32/5‬‬ ‫‪14‬‬ ‫‪30‬‬ ‫‪420‬‬ ‫‪1/25‬‬ ‫‪1/56‬‬ ‫‪n‬‬ ‫‪i 1‬‬
‫‪32/5-37/5‬‬ ‫‪13‬‬ ‫‪35‬‬ ‫‪455‬‬ ‫‪6/25‬‬ ‫‪39/06‬‬ ‫‪n‬‬
‫‪ f i (x 'i  x )  21822 / 72‬‬
‫'‬ ‫‪1‬‬ ‫‪4‬‬
‫‪37/5-42/5‬‬ ‫‪10‬‬ ‫‪40‬‬ ‫‪400‬‬ ‫‪11/25‬‬ ‫‪126/56‬‬ ‫‪m4‬‬ ‫‪‬‬
‫‪n‬‬ ‫‪i 1‬‬
‫‪42/5-47/5‬‬ ‫‪6‬‬ ‫‪45‬‬ ‫‪270‬‬ ‫‪16/25‬‬ ‫‪264/06‬‬
‫‪47/5-52/5‬‬ ‫‪3‬‬ ‫‪50‬‬ ‫‪150‬‬ ‫‪21/25‬‬ ‫‪451/56‬‬
‫‪52/5-57/5‬‬ ‫‪1‬‬ ‫‪55‬‬ ‫‪55‬‬ ‫‪26/25‬‬ ‫‪689/06‬‬
‫جمع‬ ‫‪100‬‬ ‫‪2875‬‬ ‫‪m 4‬‬ ‫‪21822 / 72‬‬
‫‪K ‬‬ ‫‪4‬‬
‫‪3 ‬‬ ‫‪ 3  0.459‬‬
‫‪S‬‬ ‫‪8590 / 97‬‬
‫با توجه به عالمت ضریب برجستگي‪ ،‬منحني فراواني در مقایسه با منحني نرمال دارای پخي است‪.‬‬

‫کشیدگی‬
‫‪24‬‬
‫مثال‪ :‬در بررسی طول عمر ‪ 100‬باطری اتومبیل‪ ،‬اگر میانگین‪ ،‬میانه‪ ،‬انحراف معیار و ضریب برجستگی به ترتیب ‪،3/5‬‬
‫‪ -1/75 ،1/65 ،3/48‬باشد‪ ،‬در مورد شکل منحنی فراوانی آن چه می توان گفت؟‬
‫حل‪ :‬با اطالعات داده شده‪ ،‬ضریب چولگی دوم پیرسن به صورت زیر بدست می آید‪:‬‬
‫) ‪3(x  m‬‬ ‫) ‪3 ( 3 / 5  3 / 48‬‬

‫‪Sk ‬‬ ‫‪‬‬ ‫‪ 0 / 036‬‬
‫‪S‬‬ ‫‪1 / 65‬‬
‫با توجه به مقدار ضریب چولگی‪ ،‬منحنی فراوانی طول عمر باطری ها اندکی چوله به راست است (مقدار چولگی خفیف‬
‫است)‪ .‬از طرفی با توجه به مقدار ضریب برجستگی‪ ،‬منحنی فراوانی طول عمر باطری ها نسبت به منحنی نرمال دارای‬
‫پخی است‪.‬‬

‫محدوده تجربی مشاهدات‬
‫‪25‬‬
‫اگر دادهها تقریباً متقارن باشند‪ ،‬در صورتی که میانگین و انحراف معیار را در اختیار داشته باشیم‪ ،‬میتوان به‬
‫طور تجربی‪ ،‬فاصلههای زیر را برای دادهها در نظر گرفت‪:‬‬
‫در حدود ‪ 68‬درصد دادهها در فاصله ) ‪ ( x  s , x  s‬قرار دارند‪.‬‬
‫در حدود ‪ 95‬درصد دادهها در فاصله ) ‪ ( x  2s , x  2s‬قرار دارند‪.‬‬
‫در حدود ‪ 99.7‬درصد دادهها در فاصله ) ‪ ( x  3 s , x  3s‬قرار دارند‪.‬‬
‫مثال‪ :‬توزیع فشار خون بیماران دیابتی تقریبا متقارن است‪ .‬اگر میانگین فشار سیستولیک آنها ‪ 15‬و واریانس ‪2.25‬‬
‫باشد‪ ،‬تقریبا ‪ 68‬درصد این بیماران فشار خونشان در چه حدودی است؟‬
‫حل‪ :‬تقریباً ‪ 68‬درصد فشار خون در فاصله )‪ 13.5‬و ‪ (16.5‬قرار دارند‪ ،‬زیرا‪:‬‬
‫)‪(x  S , x  S )  (15  1.5,15  1.5)  (13.5 , 16.5‬‬

26
Dr Mohammad Kazemi
‫نمودار جعبه ای‬
‫‪27‬‬
‫نمودار جعبه اي‪:‬‬
‫این نمودار برای نشان دادن نحوه پراکندگی داده ها بسیار سودمند است‪ .‬این نمودار همچنین به نمودار جعبه و شاخک یا‬
‫خالصه ‪ 5‬عددی نیز معروف است‪.‬‬
‫ابتدا داده ها را به ترتیب غیرنزولی به صورت )𝑛(𝑥 ≤ ⋯ ≤ )‪𝑥(1) ≤ 𝑥(2‬مرتب می کنیم‪ .‬سپس داده ها را در ‪ 5‬عدد‬
‫زیر را خالصه می کنیم‪:‬‬
‫‪ -1‬کوچکترین داده یعنی )‪𝑥(1‬‬
‫‪ -2‬بزرگترین داده یعنی )𝑛(𝑥‬
‫‪-3‬میانه داده ها یعنی ‪m‬‬
‫‪ -4‬چارك اول داده ها یعنی ‪𝑄1‬‬
‫‪ -5‬چارك سوم داده ها یعنی ‪𝑄3‬‬

‫‪28‬‬
‫سپس با استفاده از ‪ 5‬عدد فوق نمودار جعبه ای را به صورت زیر رسم می کنیم‪:‬‬
‫) ‪Min(𝑥i‬‬ ‫چارک اول‬ ‫ميانه‬ ‫چارک سوم‬ ‫) ‪Max(𝑥i‬‬

‫‪Whisker‬‬ ‫‪Whisker‬‬
‫‪Box‬‬
‫‪IQR‬‬
‫‪R‬‬

‫‪29‬‬
‫چه نتايجي از نمودار جعبه اي مي توان كسب كرد؟‬
‫‪ -1‬مركز داده ها‪ :‬میانه مرکز داده ها را نشان می دهد‪.‬‬
‫‪ -2‬پراكندگي داده ها‪ :‬دامنه تغییرات و دامنه میان چارکی پراکندگی داده ها رانشان می دهند‪.‬‬
‫‪ -3‬تقارن و عدم تقارن‪ :‬مکان نسبی جعبه و طول شاخک ها تقارن یا چولگی داده ها را نشان می دهد‪:‬‬
‫‪ o‬اگر جعبه وسط نمودار و میانه وسط جعبه قرار دارد‪ ،‬داده ها متقارن هستند‪.‬‬
‫‪ o‬اگر جعبه اگر جعبه سمت چپ نمودار قرار دارد (شاخک راست دراز است) داده ها چوله به راست هستند‪.‬‬
‫‪ o‬اگر جعبه سمت راست نمودار قرار دارد (شاخک چپ دراز است) داده ها چوله به چپ هستند‪.‬‬

30
Dr Mohammad Kazemi
‫‪31‬‬
‫‪ -4‬نقاط دور افتاده يا پرت‪ :‬منظور داده هایی است که نسبت به بقیه داده ها بسیار کوچک یا بسیار بزرگ‬
‫هستند‪ .‬با استفاده از ‪ IQR‬می توان نقاط پرت را تشخیص داد‪ .‬مقادیری که کوچکتر از 𝑅𝑄𝐼 ‪𝑄1 − 1.5‬‬
‫یا بزرگتر از 𝑅𝑄𝐼 ‪ 𝑄3 + 1.5‬باشند‪ ،‬به عنوان نقاط پرت شناخته می شوند‪.‬‬
‫نكته‪ :‬در صورت وجود نقاط پرت‪ ،‬ابتدا آن نقاط را کنار گذاشته و نمودار را رسم می کنیم‪ .‬سپس نقاط‬
‫پرت را با عالمت * روی نمودار نشان می دهیم‪ .‬این نمودار را نمودار جعبه ای اصالح شده گویند‪.‬‬

‫‪32‬‬
‫مثال‪ :‬داده های زیر نمرات یک آزمون ‪ 100‬تستی در یک کالس ‪ 40‬نفری هستند که به ترتیب غیرنزولی‬
‫فرست شده اند‪ .‬نمودار جعبه ای این داده ها را رسم کنید‪.‬‬
‫‪10 38 38 39 39 40 40 41 42 45 47 48 49 49 50 51 51 53 53 61 61 63‬‬
‫‪63 65 65 70 72 73 74 75 76 76 78 78 80 80 83 85 92 98‬‬

‫‪33‬‬
‫‪min 𝑥𝑖 = 10, max 𝑥𝑖 = 98, 𝑚 = 61‬‬

‫‪𝑄1 : 𝑛 + 1 ∗ 𝑝 = 41 × 0.25 = 10.25‬‬
‫‪𝑄1 = 0.75 ∗ 𝑥 10 + 0.25 ∗ 𝑥 11‬‬
‫‪=0.75 ∗ 45 + 0.25 ∗ 47 = 45.5‬‬
‫‪𝑄3 : 𝑛 + 1 ∗ 𝑝 = 41 × 0. 75 = 30.75‬‬
‫‪𝑄3 = 0.25 ∗ 𝑥 30 + 0.75 ∗ 𝑥 31‬‬
‫‪= 0.25 ∗ 75 + 0.75 ∗ 76 = 75.75‬‬
‫‪𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 75.75 − 45.5 = 30.25‬‬

‫‪𝐿 = 𝑄1 − 1.5𝐼𝑄𝑅 = 45.5 − 45.375 = 0.125‬‬
‫‪𝑈 = 𝑄3 + 1.5𝐼𝑄𝑅 = 75.75 + 45.375 = 121.125‬‬
‫با توجه به مقادیر ‪ L‬و ‪ u‬داده پرت وجود ندارد‪.‬‬

34
Dr Mohammad Kazemi
‫‪35‬‬
‫مثال‪ :‬تعداد تصادفات اتومبیل در یک شهر در ‪ 15‬روز اول تابستان به شرح زیر است‪ .‬نمودار جعبه ای این‬
‫داده ها را رسم کنید‪.‬‬
‫‪12‬‬ ‫‪2‬‬ ‫‪15‬‬ ‫‪23‬‬ ‫‪14‬‬ ‫‪27‬‬ ‫‪16‬‬ ‫‪34‬‬ ‫‪41‬‬ ‫‪60‬‬ ‫‪32‬‬ ‫‪18‬‬ ‫‪25‬‬ ‫‪31 19‬‬
‫‪min 𝑥𝑖 = 2,‬‬ ‫‪max 𝑥𝑖 = 60, 𝑚 = 23‬‬

‫‪𝑄1 : 𝑛 + 1 ∗ 𝑝 = 16 × 0.25 = 4‬‬
‫‪𝑄1 = 𝑥 4 = 15‬‬
‫‪𝑄3 : 𝑛 + 1 ∗ 𝑝 = 16 × 0. 75 = 12‬‬
‫‪𝑄3 = 𝑥 12 = 32‬‬
‫‪𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 32 − 15 = 17‬‬
‫‪𝐿 = 𝑄1 − 1.5𝐼𝑄𝑅 = −10.5‬‬ ‫عدد ‪ 60‬داده پرت است‬
‫‪𝑈 = 𝑄3 + 1.5𝐼𝑄𝑅 = 57.5‬‬

36
Dr Mohammad Kazemi
‫تمرین‬
‫‪37‬‬
‫‪ -1‬نشان دهید که ضریب تغییر به واحد اندازه گیری بستگی ندارد‪ ،‬یعنی اگر داده ها را در عدد مثبت ‪ b‬ضرب کنیم‪،‬‬
‫ضریب تغییر ثابت می ماند‪.‬‬
‫‪ -2‬نشان دهید که برای داده های استاندارد‪ ،‬میانگین صفر و واریانس یک می باشد‪.‬‬
‫‪ -3‬ثابت کنید اگر به هریک از داده ها مقدار ثابت ‪ a‬را اضافه کنیم‪ ،‬ضرایب چولگی و برجستگی تغییر نمی کنند‪.‬‬
‫‪𝑛2 −1‬‬ ‫‪𝑛+1‬‬

‫است‪.‬‬ ‫و‬ ‫‪ -4‬نشان دهید میانگین حسابی و واریانس نخستین ‪ n‬عدد طبیعی به ترتیب‬
‫‪12‬‬ ‫‪2‬‬
‫‪ -5‬اگر در یک مطالعه‪ ،‬میانگین و واریانس دادهها به ترتیب ‪ 15‬و ‪ 16‬باشند و سپس دادهها را با عدد ‪ 3‬جمع کرده و بر ‪2‬‬
‫تقسیم کنیم؛‬
‫الف‪ -‬کدامیک از این شاخصها تغییر نمیکنند؟ میانه ‪ -‬دامنه تغییرات‪ -‬ضریب تغییرات – نما‪.‬‬
‫ب‪ -‬میانگین و واریانس جدید را به دست آورید‪.‬‬

‫تمرین‬
‫‪38‬‬
‫‪ -6‬یک دسته از دانشجویان در در دو امتحان شرکت کرده اند و خالصه نتایج آزمون ها به شرح زیر است‪:‬‬
‫ماكزيمم نمره‬ ‫انحراف معيار‬ ‫ميانگين‬
‫‪100‬‬ ‫‪6‬‬ ‫‪60‬‬ ‫آزمون ‪1‬‬
‫‪1000‬‬ ‫‪7‬‬ ‫‪700‬‬ ‫آزمون ‪2‬‬
‫الف) چگونه این دو آزمون را با هم مقایسه و ارزیابی می کنید‪.‬‬

‫ب) اگر دانشجویی در آزمون اول نمره ‪ 65‬و در آزمون دوم نمره ‪ 720‬را کسب کرده باشد‪ ،‬وضعیت دانشجو در کدام‬
‫آزمون مطلوب تر است؟‬
‫سطح هموگلوبین‬ ‫فراوانی‬ ‫‪ -7‬جدول زیر سطح هموگلوبین در ‪ 25‬زن تحت مطالعه را نشان می دهد‪.‬‬
‫‪7 - 9‬‬ ‫‪4‬‬ ‫الف‪ -‬میانگین و واریانس سطح هموگلوبین در بین زنان چقدر است؟‬
‫‪9 - 11‬‬ ‫‪7‬‬ ‫ب‪ -‬ضریب تغییرپذیری سطح هموگلوبین زنان چند درصد است؟‬
‫ج‪ -‬ضریب چولگی داده ها را به دست آورده و تفسیر کنید‪.‬‬
‫‪11 - 13‬‬ ‫‪11‬‬
‫د‪ -‬ضریب کشیدگی داده ها را بدست آورده و تفسیر کنید‪.‬‬
‫‪13 - 15‬‬ ‫‪3‬‬

‫تمرین‬
‫‪39‬‬
‫‪ -8‬ضریب هوشی دانشجویی در سال اول ‪ 87‬و میانگین و انحراف معیار ضریب هوشی در همان سال به‬
‫ترتیب ‪ x  83‬و ‪ s  8‬بوده است‪ .‬پس از یک آزمون در سال آخر مشخص شد ضریب هوشی این دانشجو به ‪85‬‬
‫تغییر یافته و میانگین و انحراف معیار ضریب هوشی در سال آخر به ترتیب ‪ x  82‬و ‪ s  5‬به دست آمده است‪.‬‬
‫آیا وضعیت هوشی او بهتر شده است؟‬
‫‪ -9‬تعداد دندانهای ترمیمی ‪ 46‬بیمار مراجعه کننده به یک مرکز دندانپزشکی در یک روز به شرح زیر است‪.‬‬
‫‪2‬‬ ‫‪0‬‬ ‫‪3‬‬ ‫‪4 3 0 3 4 1‬‬ ‫‪1 2‬‬ ‫‪3‬‬ ‫‪5 3‬‬ ‫‪3‬‬ ‫‪4 1‬‬ ‫‪2 2‬‬ ‫‪0‬‬ ‫‪5 1‬‬ ‫‪3 4‬‬ ‫‪5‬‬ ‫‪2‬‬
‫‪1‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪2 1 2 8 0 5‬‬ ‫‪4 7‬‬ ‫‪1‬‬ ‫‪1 4‬‬ ‫‪1‬‬ ‫‪2 3‬‬ ‫‪4 5‬‬ ‫‪2‬‬
‫الف‪ -‬میانه و نمای داده ها را محاسبه کنید‪.‬‬

‫ب‪ -‬واریانس‪ ،‬انحراف معیار‪ ،‬ضریب چولگی و ضریب برجستگی را حساب کنید‪.‬‬
‫ج‪ -‬ضریب تغییرات داده ها چند درصد است؟‬

فصل 4

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

فصل 4

Uploaded by

Copyright:

Available Formats

‫فصل چهارم‬

‫شاخص هاي پراكندگي‬

‫‪Dr Mohammad Kazemi‬‬

‫معرفي شاخص هاي پراكندگي‬ ‫‪(1‬‬

‫‪Dr Mohammad Kazemi‬‬

‫مهمترين شاخصهاي‬ ‫ضريب‬ ‫انحراف‬ ‫دامنه میان‬ ‫دامنه‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫برای توصیف بیشتر و مقایسه این دو گروه‪ ،‬الزم‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪𝑄1 = 0. 5 × 12 + 0. 5 × 14= 13‬‬ ‫دامنه میان چارکی‬

‫‪n‬‬ ‫‪i 1‬‬ ‫‪1‬‬ ‫‪n‬‬

‫‪2‬‬ ‫تعریف می شود‪ .‬بنابراین واریانس را می توان به طور معادل از‬

‫‪3 2 4 3 6 3 5‬‬ ‫مثال‪ :‬واریانس دادههای زیر را بدست آورید‪.‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪2‬‬ ‫‪1‬‬ ‫‪n‬‬ ‫‪2‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪2‬‬ ‫‪2 2‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫?‬ ‫‪fi‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪8‬‬ ‫‪4‬‬

‫ازآنجا که واریانس توان دوم انحرافات از میانگین داده ها را‬

‫‪2‬‬ ‫انحراف معیار عبارت است از جذر واریانس و آن را با ‪ S‬نشان می دهیم‪:‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪ -1‬به واحد اندازه گيري بستگي ندارد‪.‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫عدم تقارن (چولگي)‬

‫در توزيعهاي كامال‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫ضريب چولگي پيرسن‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫تفسير ضريب چولگي‬

‫چولگي منفي‬ ‫چولگي مثبت‬

‫‪xm‬‬ ‫‪M‬‬ ‫‪x m M‬‬ ‫‪M‬‬ ‫‪m‬‬ ‫‪x‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫براي محاسبات به اين ستونها نياز داريم‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪x M‬‬ ‫‪18 / 27  20 / 54‬‬ ‫با توجه به عالمت ضریب چولگی‪،‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪K 0‬‬ ‫‪K 0‬‬ ‫‪K 0‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫) ‪3(x  m‬‬ ‫) ‪3 ( 3 / 5  3 / 48‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫در حدود ‪ 68‬درصد دادهها در فاصله ) ‪ ( x  s , x  s‬قرار دارند‪.‬‬

‫در حدود ‪ 95‬درصد دادهها در فاصله ) ‪ ( x  2s , x  2s‬قرار دارند‪.‬‬

‫در حدود ‪ 99.7‬درصد دادهها در فاصله ) ‪ ( x  3 s , x  3s‬قرار دارند‪.‬‬

‫‪Dr Mohammad Kazemi‬‬

‫‪ -1‬کوچکترین داده یعنی )‪𝑥(1‬‬

‫‪ -2‬بزرگترین داده یعنی )𝑛(𝑥‬

‫‪-3‬میانه داده ها یعنی ‪m‬‬

‫‪ -4‬چارك اول داده ها یعنی ‪𝑄1‬‬

‫‪ -5‬چارك سوم داده ها یعنی ‪𝑄3‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫) ‪Min(𝑥i‬‬ ‫چارک اول‬ ‫ميانه‬ ‫چارک سوم‬ ‫) ‪Max(𝑥i‬‬

‫‪Dr Mohammad Kazemi‬‬

‫چه نتايجي از نمودار جعبه اي مي توان كسب كرد؟‬

‫‪ -1‬مركز داده ها‪ :‬میانه مرکز داده ها را نشان می دهد‪.‬‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪Dr Mohammad Kazemi‬‬ ‫فهرست مطالب اين فصل‬

‫‪min 𝑥𝑖 = 10, max 𝑥𝑖 = 98, 𝑚 = 61‬‬

‫‪𝐼𝑄𝑅 = 𝑄3 − 𝑄1 = 75.75 − 45.5 = 30.25‬‬