You are on page 1of 21

‫العينات‬

‫المحاضرة رقم ‪:8‬‬


‫التقدير باستخدام عينة عشوائية بسيطة‬
‫تقدير المتوسط‬
‫متوسط المجتمع‬
‫إذا كان لدينا مجتمع مكون من 𝑁 مفردة‪ ،‬وكانت قيمة متغير معين‬
‫للمفردة رقم 𝑖 في المجتمع هي 𝑖𝑌 (مثال درجة الطالب الخامس في‬
‫كشف الطالب هي ‪)87‬‬

‫متوسط المجتمع أو الوسط الحسابي للمتغير محل االهتمام هو‪:‬‬


‫𝑁‪σ‬‬
‫‪𝑖=1‬‬ ‫𝑖𝑌‬
‫= ‪𝑌ത‬‬
‫𝑁‬
‫أي خارج قسمة مجموع قيم المجتمع على عدد مفرداته‬
‫‪2‬‬
‫تقدير متوسط المجتمع‬
‫قيم المجتمع مجهولة وبالتالي متوسط المجتمع أيضا مجهول‬

‫لتقدير قيمة متوسط المجتمع‪ ،‬نختار عينة من بين مفرداته‬

‫إذا اخترنا عينة مكونة من 𝑛 مفردة بأسلوب المعاينة العشوائية البسيطة‬


‫بدون إرجاع ووجدنا أن قيمة المفردة رقم 𝑗 في العينة هي 𝑗𝑦 ‪ ،‬فإن‬
‫𝑛‪σ‬‬
‫𝑗𝑦 ‪𝑗=1‬‬
‫= ‪ 𝑦ത‬يعتبر تقديرا لمتوسط المجتمع‬ ‫متوسط العينة‬
‫𝑛‬

‫ما هي خصائص هذا التقدير؟‬


‫‪3‬‬
‫بالعودة للمثال في محاضرة ‪4‬‬
‫𝑖𝑌‬ ‫االسم‬ ‫‪i‬‬ ‫𝑖𝑌‬ ‫االسم‬ ‫‪i‬‬
‫علياء ‪6000‬‬ ‫‪4‬‬ ‫‪8000‬‬ ‫أحمد‬ ‫‪1‬‬
‫سلمى ‪8000‬‬ ‫‪5‬‬ ‫مازن ‪10000‬‬ ‫‪2‬‬
‫نوران ‪6000‬‬ ‫‪6‬‬ ‫رئيف ‪4000‬‬ ‫‪3‬‬
‫متوسط الدخل في المجتمع‬
‫‪48000‬‬
‫= ‪𝑌ത‬‬ ‫‪= 7000‬‬
‫‪6‬‬
‫‪4‬‬
‫إذا اخترنا عينة عشوائية بسيطة بدون‬
‫إرجاع فالعينات الممكنة هي (محاضرة ‪)6‬‬
‫متوسط العينة‬ ‫العينة‬ ‫متوسط العينة‬ ‫العينة‬
‫‪8000‬‬ ‫مازن و نوران‬ ‫‪9000‬‬ ‫أحمد ومازن‬
‫‪5000‬‬ ‫رئيف و علياء‬ ‫‪6000‬‬ ‫أحمد ورئيف‬
‫‪6000‬‬ ‫رئيف و سلمى‬ ‫‪7000‬‬ ‫أحمد وعلياء‬
‫‪5000‬‬ ‫رئيف و نوران‬ ‫‪8000‬‬ ‫أحمد و سلمى‬
‫‪7000‬‬ ‫علياء و سلمى‬ ‫‪7000‬‬ ‫أحمد و نوران‬
‫‪6000‬‬ ‫علياء و نوران‬ ‫‪7000‬‬ ‫مازن و رئيف‬
‫‪7000‬‬ ‫سلمى و نوران‬ ‫‪8000‬‬ ‫مازن و علياء‬
‫‪105000‬‬ ‫المجموع‬ ‫‪9000‬‬ ‫مازن و سلمى‬
‫‪105000‬‬
‫‪= 7000‬‬ ‫المتوسطات = متوسط المجتمع‬
‫‪5‬‬
‫متوسط‬
‫‪15‬‬
5000 6000 7000 8000 9000

6
‫متوسط العينة العشوائية البسيطة كمقدر‬
‫لمتوسط المجتمع‬
‫هو متغير عشوائي‬

‫له توزيع احتمالي يقترب من التوزيع المعتاد إذا كبر حجم العينة‬

‫هو مقدر غير متحيز ‪ ،‬أي توقعه هو متوسط المجتمع‬

‫‪7‬‬
‫إثبات أن متوسط العينة العشوائية البسيطة‬
‫مقدر غير متحيز لمتوسط المجتمع‬
‫𝑗𝑦 ‪σ𝑛𝑗=1‬‬
‫(‪E 𝑦ത = E‬‬ ‫)‬
‫𝑛‬

‫للحصول على التوقع نحتاج أن نفصل الجزء العشوائي من 𝑗𝑦 عن الجزء غير‬


‫العشوائي‬
‫الجزء العشوائي ناتج عن االختيار العشوائي لمفردات العينة‪ ،‬فالمفردة رقم 𝑗 في‬
‫العينة هي إحدى مفردات المجتمع (أي تناظر مفردة رقم 𝑖 في المجتمع( تم‬
‫اختيارها عشوائيا في العينة‬
‫هذا االختيار العشوائي سنعبر عنه بمتغير عشوائي يعرف لكل مفردة من مفردات‬
‫المجتمع ليحدد ما إذا كانت ستختار في العينة أم ال‬

‫‪8‬‬
‫متغير االختيار العشوائي‬
‫لكل مفردة 𝑖 في المجتمع عرف المتغير العشوائي 𝑖𝜋 حيث‬

‫‪ 𝜋𝑖 = 1‬إذا كانت المفردة 𝑖 اختيرت في العينة‬

‫‪ 𝜋𝑖 = 0‬إذا كانت المفردة 𝑖 لم تختر في العينة‬

‫وكما ذكرنا في المحاضرة السابقة فإن احتمال اختيار أي مفردة من المجتمع في العينة هو مقدار‬
‫𝑛‬
‫ثابت هو نسبة المعاينة = 𝑓‬
‫𝑁‬
‫𝑓 ‪Pr 𝜋𝑖 = 1 = 𝑓, Pr 𝜋𝑖 = 0 = 1 −‬‬
‫𝑓 = 𝑖𝜋 ‪E‬‬
‫𝑓 ‪Var 𝜋𝑖 = 𝑓 1 −‬‬
‫)𝑓 ‪𝑓(1 −‬‬
‫𝑘𝜋 ‪Cov 𝜋𝑖 ,‬‬ ‫‪=−‬‬
‫‪𝑁−1‬‬

‫‪9‬‬
‫التفاصيل‬
• E 𝜋𝑖 = 1 × Pr 𝜋𝑖 = 1 + 0 × Pr 𝜋𝑖 = 0 = 𝑓
• E(𝜋𝑖 )2 = E 𝜋𝑖 = 𝑓 {12 = 1, 02 = 0}
• Var 𝜋𝑖 = E(𝜋𝑖 )2 − E 𝜋𝑖 2 = 𝑓 − 𝑓 2 = 𝑓(1 − 𝑓)
𝑁−2
• E 𝜋𝑖 𝜋𝑘 = 1 × Pr 𝜋𝑖 = 1&𝜋𝑘 = 1 + 0 = 𝑛−2
𝑁
𝑛
𝑛(𝑛−1) 𝑛−1
= = 𝑓
𝑁(𝑁−1) 𝑁−1
𝑛−1
• Cov 𝜋𝑖 , 𝜋𝑘 = E 𝜋𝑖 𝜋𝑘 − E 𝜋𝑖 E 𝜋𝑘 = 𝑓 − 𝑓2
𝑁−1
𝑛−1 𝑛 𝑁𝑛−𝑁−𝑁𝑛+𝑛 𝑁 1−𝑓
= 𝑓 − = 𝑓 = −𝑓
𝑁−1 𝑁 𝑁 𝑁−1 𝑁 𝑁−1
𝑓(1−𝑓)
= −
𝑁−1

10
‫استخدام االختيار العشوائي مع متوسط العينة‬
‫𝑗𝑦 ‪σ𝑛𝑗=1‬‬ ‫𝑁‪σ‬‬
‫𝑖𝜋 𝑖𝑌 ‪𝑖=1‬‬
‫= ‪𝑦ത‬‬ ‫=‬
‫𝑛‬ ‫𝑛‬
‫يالحظ أن المجموع في البسط لن تختلف قيمته بالرغم من أنه اآلن أصبح‬
‫معرف لجميع قيم المجتمع‪ ،‬حيث أن قيم المفردات التي لم تظهر في العينة‬
‫ستضرب في المقدار صفر وهو قيمة متغير االختيار العشوائي لها‬

‫أي أن المتغيرات العشوائية 𝑗𝑦 قسمت إلى جزئين‪ ،‬أحدهما 𝑖𝜋 عشوائي‬


‫واآلخر 𝑖𝑌 ثابت وليس عشوائيا (في المثال السابق دخل المفردة األولى في‬
‫المجتمع هو ثابت يساوي ‪ 8000‬ولكن دخل المفردة األولى في العينة متغير‬
‫تختلف قيمته من عينة ألخرى)‬
‫‪11‬‬
‫توقع متوسط العينة‬
‫𝑁‬
‫𝑁‪σ‬‬
‫𝑖𝜋 𝑖𝑌 ‪𝑖=1‬‬ ‫‪1‬‬
‫)𝑦(‪E‬‬
‫‪ത =E‬‬ ‫) 𝑖𝜋(‪= ෍ 𝑌𝑖 E‬‬
‫𝑛‬ ‫𝑛‬
‫‪𝑖=1‬‬

‫ألن توقع المجموع يساوي مجاميع التوقعات‪ ،‬كما أن توقع حاصل‬


‫ضرب ثابت في متغير يساوي حاصل ضرب الثابت في توقع المتغير‬
‫𝑁 ‪1‬‬ ‫𝑁 𝑛‪1‬‬ ‫𝑁‪σ‬‬
‫𝑖𝑌 ‪𝑖=1‬‬
‫= ‪E 𝑦ത‬‬ ‫𝑓 𝑖𝑌 ‪σ𝑖=1‬‬ ‫=‬ ‫𝑖𝑌 ‪σ𝑖=1‬‬ ‫=‬ ‫‪= 𝑌ത‬‬
‫𝑛‬ ‫𝑁𝑛‬ ‫𝑁‬

‫أي أن متوسط العينة العشوائية البسيطة هو مقدر غير متحيز لمتوسط‬


‫المجتمع‬
‫‪12‬‬
‫الخطأ المعياري لمتوسط العينة‬
‫يوفر متوسط العينة تقديرا بنقطة لمتوسط المجتمع‪ ،‬ولكننا نحتاج أيضا‬
‫لمعرفة حجم الخطأ المتوقع في هذا التقدير‬
‫نعرف أن ‪ %95‬من قيم المتغير المعتاد تقع حول توقعه في حدود قيمة‬
‫ال تتجاوز‪ ،‬تقريبا‪ ،‬ضعف قيمة االنحراف المعياري له‬
‫بالنسبة للمقدرات من العينة‪ ،‬يسمى االنحراف المعياري للمقدر بالخطأ‬
‫المعياري‬
‫الخطأ المعياري لمتوسط العينة هو‪:‬‬

‫= ‪S. E. 𝑦ത‬‬ ‫)𝑦(‪Var‬‬


‫‪ത‬‬
‫‪13‬‬
‫اشتقاق صيغة تباين متوسط العينة العشوائية‬
‫البسيطة‬
‫𝑁‪σ‬‬
‫𝑖𝜋 𝑖𝑌 ‪𝑖=1‬‬
‫‪Var 𝑦ത = Var‬‬
‫𝑛‬

‫وحيث أن تباين مجموع متغيرات عشوائية يساوي مجموع التباينات وضعف التغايرات كما أن‬
‫تباين حاصل ضرب ثابت في متغير يساوي مربع الثابت مضروب في تباين المتغير‪ ،‬وتغاير‬
‫حاصل ضرب ثابتين في متغيرين يساوي حاصل ضرب الثابتين في تغاير المتغيرين‪ ،‬فإن‬

‫𝑁‬ ‫𝑁‬
‫‪1‬‬
‫] 𝑘𝜋 ‪Var 𝑦ത = 2 [෍ 𝑌𝑖2 Var 𝜋𝑖 + 2 ෍ ෍ 𝑌𝑖 𝑌𝑘 Cov 𝜋𝑖 ,‬‬
‫𝑛‬
‫‪𝑖=1‬‬ ‫𝑖>𝑘 ‪𝑖=1‬‬

‫𝑁‬ ‫𝑁‬
‫‪1‬‬ ‫‪2‬‬ ‫𝑓 ‪2𝑓 1 −‬‬
‫‪= 2 [𝑓 1 − 𝑓 ෍ 𝑌𝑖 −‬‬ ‫] 𝑘𝑌 𝑖𝑌 ‪෍ ෍‬‬
‫𝑛‬ ‫‪𝑁−1‬‬
‫‪𝑖=1‬‬ ‫𝑖>𝑘 ‪𝑖=1‬‬

‫‪14‬‬
‫من المعروف أن‪:‬‬

‫𝑘𝑌 𝑖𝑌 ‪(෍ 𝑌𝑖 )2 = ෍ 𝑌𝑖2 + 2 ෍ ෍‬‬


‫𝑖‬ ‫𝑖‬ ‫𝑖‬ ‫𝑖>𝑘‬

‫وبالتالي‬

‫‪2‬‬
‫𝑁‬ ‫𝑁‬ ‫𝑁‬
‫‪1‬‬ ‫‪2‬‬ ‫𝑓‪𝑓 1−‬‬
‫)𝑦(‪Var‬‬
‫‪ത = 2 {𝑓 1 − 𝑓 ෍ 𝑌𝑖 −‬‬ ‫𝑖𝑌 ‪[ ෍‬‬ ‫}] ‪− ෍ 𝑌𝑖2‬‬
‫𝑛‬ ‫‪𝑁−1‬‬
‫‪𝑖=1‬‬ ‫‪𝑖=1‬‬ ‫‪𝑖=1‬‬

‫‪2‬‬
‫𝑁‬ ‫𝑁‬ ‫𝑛‬
‫)𝑓 ‪𝑓(1 −‬‬ ‫)𝑓 ‪(1 −‬‬ ‫𝑆‬ ‫‪2‬‬
‫‪= 2‬‬ ‫𝑖𝑌 ‪𝑁 ෍ 𝑌𝑖2 − ෍‬‬ ‫=‬ ‫𝑁‬ ‫)𝑓 ‪𝑁𝑆 2 = (1 −‬‬
‫)‪𝑛 (𝑁 − 1‬‬ ‫𝑛‬ ‫‪2‬‬ ‫𝑛‬
‫‪𝑖=1‬‬ ‫‪𝑖=1‬‬

‫‪15‬‬
‫حيث ‪ 𝑆 2‬هي تباين قيمة المتغير محل االهتمام في المجتمع‬

‫𝑁‬ ‫𝑁‬ ‫‪2‬‬


‫‪1‬‬ ‫𝑖𝑌 ‪σ𝑖=1‬‬ ‫𝑁‬
‫‪𝑆2‬‬ ‫=‬ ‫‪෍ 𝑌𝑖2 −‬‬ ‫=‬ ‫‪𝜎2‬‬
‫‪𝑁−1‬‬ ‫𝑁‬ ‫‪𝑁−1‬‬
‫‪𝑖=1‬‬

‫وبالتالي فإن الخطأ المعياري لمتوسط العينة هو‪:‬‬


‫𝑆‬
‫)𝑦( ‪S. E.‬‬
‫= ‪ത‬‬ ‫)𝑓 ‪(1 −‬‬
‫𝑛‬

‫‪16‬‬
‫تقدير الخطأ المعياري‬
‫‪𝑆2‬‬
‫)𝑓 ‪Var 𝑦ത = (1 −‬‬
‫𝑛‬
‫𝑆‬
‫= ‪S. E. 𝑦ത‬‬ ‫𝑓‪1−‬‬
‫𝑛‬
‫يمكن تقدير تباين متوسط العينة وخطأه المعياري باستخدام بيانات العينة ‪ ،‬وذلك بوضع قيمة تباين العينة ‪𝑠 2‬‬
‫مكان تباين المجتمع ‪𝑆 2‬‬

‫‪𝑠2‬‬
‫)𝑓 ‪var 𝑦ത = (1 −‬‬
‫𝑛‬
‫𝑠‬
‫= ‪s. e. 𝑦ത‬‬ ‫𝑓‪1−‬‬
‫𝑛‬

‫𝑛‬
‫𝑛‬ ‫‪2‬‬
‫‪1‬‬ ‫‪σ‬‬‫𝑗𝑦 ‪𝑗=1‬‬
‫= ‪𝑠2‬‬ ‫‪෍ 𝑦𝑗2 −‬‬ ‫= 𝑠‪,‬‬ ‫‪𝑠2‬‬
‫‪𝑛−1‬‬ ‫𝑛‬
‫‪𝑗=1‬‬

‫‪17‬‬
‫تقدير متوسط المجتمع بفترة ثقة‬
‫باستخدام الصيغ السابقة‪ ،‬وبافتراض أن حجم العينة كبيرا بدرجة كافية‬
‫الفتراض التوزيع المعتاد لمتوسط العينة‪ ،‬فإنه بدرجة ثقة ‪95%‬‬
‫نستطيع أن نقول أن متوسط المجتمع يتراوح بين القيمتين‬
‫𝑠‬
‫𝑓 ‪𝑦ത ± 1.96 1 −‬‬
‫𝑛‬
‫وبدرجة ثقة ‪ 99.7%‬أو شبه مؤكدة تتراوح قيمة متوسط المجتمع بين‬
‫القيمتين‬
‫𝑠‬
‫𝑓 ‪𝑦ത ± 3 1 −‬‬
‫𝑛‬
‫‪18‬‬
‫معنى درجة الثقة‬
‫إذا سحبنا جميع العينات الممكنة واستخدمنا كال منها لتقدير المتوسط بدرجة ثقة ‪ 95%‬فإن حوالي ‪ 95%‬من‬
‫فترات الثقة تلك سوف تتضمن داخلها قيمة متوسط المجتمع ‪ ،‬في حين أن حوالي ‪ 5%‬فقط لن تضم قيمة‬
‫متوسط المجتمع‬

‫فمثال في المثال التوضيحي السابق‪ ،‬حيث متوسط المجتمع هو ‪ 7000‬إذا اخترنا العينة (مازن و علياء) أي‬
‫)‪ ،(10000,6000‬فإن‬
‫‪𝑦ത = 8000, 𝑠 2 = 136000000 − 128000000 = 8000000, 𝑠 = 2828.427‬‬

‫أي بدرجة ثقة ‪95%‬‬

‫‪2 2828.427‬‬
‫) ‪𝑌ത = 8000 ± 1.96 (1 −‬‬ ‫)‪= 8000 ± 3200.67 = (4799.33,11200.67‬‬
‫‪6‬‬ ‫‪2‬‬

‫وفترة الثقة بالفعل تضم متوسط المجتمع‪.‬‬

‫وبنفس األسلوب يمكن حساب نسبة فترات الثقة التي تضم متوسط المجتمع في هذا المثال‪ ،‬والتي لن تكون‬
‫‪ 95%‬ألن العينة صغيرة الحجم‬
‫‪19‬‬
‫فترات الثقة لعينات المثال التوضيحي‬
‫العينة‬ ‫تضم المتوسط الحد األعلى الحد األدنى‬ ‫الحد األعلى الحد األدنى العينة‬ ‫تضم المتوسط‬
‫‪1‬‬ ‫ال ‪7399.667 10600.33‬‬ ‫‪9‬‬ ‫نعم ‪4799.333 11200.67‬‬
‫‪2‬‬ ‫نعم ‪2799.333 9200.667‬‬ ‫‪10‬‬ ‫ال ‪3399.667 6600.333‬‬
‫‪3‬‬ ‫نعم ‪5399.667 8600.333‬‬ ‫‪11‬‬ ‫نعم ‪2799.333 9200.667‬‬
‫‪4‬‬ ‫‪8000‬‬ ‫ال ‪8000‬‬ ‫‪12‬‬ ‫ال ‪3399.667 6600.333‬‬
‫‪5‬‬ ‫نعم ‪5399.667 8600.333‬‬ ‫‪13‬‬ ‫نعم ‪5399.667 8600.333‬‬
‫‪6‬‬ ‫نعم ‪2199 11801‬‬ ‫‪14‬‬ ‫‪6000‬‬ ‫ال ‪6000‬‬
‫‪7‬‬ ‫نعم ‪4799.333 11200.67‬‬ ‫‪15‬‬ ‫نعم ‪5399.667 8600.333‬‬
‫‪8‬‬ ‫ال ‪7399.667 10600.33‬‬ ‫‪60%‬‬ ‫نسبة نعم‬

‫‪20‬‬
‫معامل تصحيح المجتمعات المنتهية‬
‫في حالة المجتمعات غير المنتهية أو كبيرة الحجم جدا أي عندما‬

‫∞→𝑁‬

‫فإن‬
‫‪𝑆 2 ≅ 𝜎 2 , 𝑓 ≅ 0, 1 − 𝑓 = 1‬‬

‫وفي هذه الحالة أيضا ال تختلف المعاينة العشوائية البسيطة مع اإلرجاع مع المعاينة بدون إرجاع‬
‫(ألن احتمال ظهور المفردة أكثر من مرة يساوي الصفر تقريبا)‬

‫أما في حالة المجتمعات المنتهية‪ ،‬فإن المعاينة بدون إرجاع تكون أكثر كفاءة من المعاينة مع‬
‫اإلرجاع ألن األخيرة قد تهدر الموارد بظهور نفس المفردة أكثر من مرة فال تضاف معلومات‬
‫جديدة للعينة‬

‫ويقاس االرتفاع النسبي في كفاءة المعاينة بدون إرجاع من خالل المقدار )𝑓 ‪ (1 −‬والذي يسمى‬
‫بمعامل تصحيح المجتمعات المنتهية والذي يتسبب في انخفاض تباين المقدر في حالة المعاينة بدون‬
‫إرجاع عن تباينه في حالة المعاينة مع اإلرجاع‬
‫‪21‬‬

You might also like