Professional Documents
Culture Documents
ﺗﺄﻟﻴﻒ
دﻳﻔﻴﺪ ﺟﻴﻪ ﻫﺎﻧﺪ
ﺗﺮﺟﻤﺔ
أﺣﻤﺪ ﺷﻜﻞ
ﻣﺮاﺟﻌﺔ
ﻣﺤﻤﺪ ﻓﺘﺤﻲ ﺧﴬ
Statistics ﻋﻠﻢ اﻹﺣﺼﺎء
David J. Hand دﻳﻔﻴﺪ ﺟﻴﻪ ﻫﺎﻧﺪ
اﻟﻄﺒﻌﺔ اﻷ ﱃ ٢٠١٦
رﻗﻢ إﻳﺪاع ٢٠١٥ / ١٧٨٠٤
ﻟﻠﺘﻌﻠﻴﻢ اﻟﺜﻘﺎﻓﺔ ﺟﻤﻴﻊ اﻟﺤﻘﻮ ﻣﺤﻔﻮﻇﺔ ﻟﻠﻨﺎﴍ ﻣﺆﺳﺴﺔ ﻫﻨﺪا
املﺸﻬﺮة ﺑﺮﻗﻢ ٨٨٦٢ﺑﺘﺎرﻳﺦ ٢٠١٢ / ٨ / ٢٦
7 ﺗﻤﻬﻴﺪ
9 -١ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
27 -٢ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
41 -٣ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
59 -٤اﻻﺣﺘﻤﺎﻻت
77 -٥اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
93 -٦اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
109 -٧اﻟﺤﻮﺳﺒﺔ اﻹﺣﺼﺎﺋﻴﺔ
113 ﺗﻌﻠﻴﻘﺎت ﺧﺘﺎﻣﻴﺔ
115 ﻗﺮاءات إﺿﺎﻓﻴﺔ
119 ﻣﺼﺎدر اﻟﺼﻮر
ﲤﻬﻴﺪ
ﺗﻤﺜﱢﻞ اﻷﻓﻜﺎر اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ أﺳﺎس ﻛﻞ ﺟﻮاﻧﺐ اﻟﺤﻴﺎة اﻟﺤﺪﻳﺜﺔ ﺗﻘﺮﻳﺒﺎ .ﰲ ﺑﻌﺾ
ﻟﻜﻦ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎ ﺗﻜﻮ اﻷﻓﻜﺎر اﻷد ات ْ اﻷﺣﻴﺎ ﻳﻜﻮ د ْر اﻹﺣﺼﺎء اﺿﺤﺎ،
اﻹﺣﺼﺎﺋﻴﺔ ﻣﺨﺘﻔﻴﺔ ﰲ اﻟﺨﻠﻔﻴﺔ .ﰲ ﻛﻠﺘﺎ اﻟﺤﺎﻟﺘني ،ﺑﺴﺒﺐ اﻟﻮﺟﻮد اﻟﺸﺎﻣﻞ ﻟﻸﻓﻜﺎر
اﻹﺣﺼﺎﺋﻴﺔ ،ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻣﻦ املﻔﻴﺪ ﻟﻠﻐﺎﻳﺔ أ ﻧﻤﺘﻠﻚ ﺑﻌﺾ اﻟﻔﻬْ ﻢ ﻟﻬﺎ .اﻟﻬﺪ ﻣﻦ
ﻫﺬا اﻟﻜﺘﺎب ﻫﻮ ﺗﻘﺪﻳﻢ ﻣﺜﻞ ﻫﺬا اﻟﻔﻬﻢ.
ﻳﻌﺎﻧﻲ اﻹﺣﺼﺎء ﻣﻦ ﺳﻮء ﻓﻬْ ﻢ ﺟﻮﻫﺮ ﻣﺆﺳﻒ ﻳﻀ ﱢﻠﻞ اﻟﻨﺎس ﻋﻦ ﻃﺒﻴﻌﺘﻪ اﻷﺳﺎﺳﻴﺔ.
ﻫﺬا اﻻﻋﺘﻘﺎد اﻟﺨﺎﻃﺊ ﻫﻮ أﻧﻪ ﻳﺘﻄﻠﺐ ﻣﻬﺎرة ﺣﺴﺎﺑﻴﺔ ﻛﺒرية ﻣﻤ ﱠﻠﺔ ،أﻧﻪ ،ﻧﺘﻴﺠﺔ ﻟﺬﻟﻚ،
ﻣﺠﺎ ﺟﺎ ﱞ ﻣﻤ ﱞﻞ ﻳﺨﻠﻮ ﻣﻦ اﻟﺨﻴﺎ أ اﻹﺑﺪاع أ اﻹﺛﺎرة .ﺑﻴْﺪ أ ﻫﺬ ﺻﻮرة ﺧﺎﻃﺌﺔ ﺗﻤﺎﻣﺎ
ملﺠﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ؛ إذ إﻧﻬﺎ ﻣﺒﻨﻴﺔ ﻋﲆ ﺗﺼﻮر ﻳﺮﺟﻊ ﺗﺎرﻳﺨﻪ إﱃ أﻛﺜﺮ ﻣﻦ ﻧﺼﻒ
ﻗﺮ .ﺗﺤﺪﻳﺪا ،ﺗﺘﺠﺎﻫﻞ ﻫﺬ اﻟﺼﻮرة ﺗﻤﺎﻣﺎ ﺣﻘﻴﻘﺔ أ أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ ﻗﺪ ﻏريت ﺟﻪ
املﺠﺎ ﺗﻤﺎﻣﺎ؛ إذ ﺣﻮﱠﻟﺘْﻪ ﻣﻦ ﻣﺠﺎ ﻣﻌﺘﻤﺪ ﻋﲆ اﻟﺤﺴﺎب إﱃ ﻧﻈﺎ ﻗﺎﺋﻢ ﻋﲆ اﺳﺘﺨﺪا أد ات
ﺑﺮﻣﺠﻴﺔ ﻣﺘﻄﻮرة ﻟﺴ ْﱪ اﻟﺒﻴﺎﻧﺎت ﺑﺤﺜﺎ ﻋﻦ اﻟﻔﻬﻢ اﻟﺘﻨﻮﻳﺮ .ﻫﺬا ﻫﻮ ﻣﺎ ﻳﺘﻤﺤﻮر ﺣﻮﻟﻪ ﻣﺠﺎ
ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ؛ اﺳﺘﺨﺪا اﻷد ات ملﺴﺎﻋﺪة اﻹدرا ﺗﻮﻓري ﻛ ﱟﻞ ﻣﻦ ﺳﺎﺋﻞ ﺗﺴﻠﻴﻂ
اﻟﻀﻮء ،ﺳﺒﻞ اﻟﻔﻬْ ﻢ ،أد ات اﻟﺮﺻﺪ اﻟﺘﻮﺟﻴﻪ ،ﻧﻈﻢ املﺴﺎﻋﺪة ﰲ ﻋﻤﻠﻴﺔ ﺻﻨﻊ اﻟﻘﺮار .ﻛﻞ
ﻫﺬا — أﻛﺜﺮ — ﻳﻤﺜﱢﻞ ﺟﻮاﻧﺐ ﻣﺠﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ.
ﻳﻬﺪ ﻫﺬا اﻟﻜﺘﺎب إﱃ ﻣﻨْﺢ اﻟﻘﺎرئ ﻗﺪْرا ﻣﻦ اﻟﻔﻬْ ﻢ ملﺠﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ .ﻣﻦ
اﻟﻮاﺿﺢ أﻧﻪ ﰲ ﻛﺘﺎب ﻗﺼري ﻣﺜﻞ ﻫﺬا اﻟﻜﺘﺎب ﻻ أﺳﺘﻄﻴﻊ اﻟﺨﻮض ﰲ اﻟﺘﻔﺎﺻﻴﻞ؛ ﻟﺬا ﺑﺪﻻ
ﺑﺄﴎ ،ﰲ ﻣﺤﺎ ﻟﺔ ﻟﻠﺘﻌﺒري ﻋﻦ ﻃﺒﻴﻌﺔ ْ ﻣﻦ اﻟﺘﻔﺼﻴﻞ ،ﱠ
ﻓﻀﻠﺖ إ ْﻟﻘﺎء ﻧﻈﺮة ﻋﺎﻣﺔ ﻋﲆ املﺠﺎ
اﻟﻔﻠﺴﻔﺔ اﻷﻓﻜﺎر اﻷد ات اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ .آﻣﻞ أ ْ ﻳﻤﻨﺢ اﻟﻜﺘﺎب اﻟﻘﺎرئ ﻓﻬﻤﺎ
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻜﻴﻔﻴﺔ ﻋﻤﻞ ﻣﺠﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ،ﻣﺪ أﻫﻤﻴﺘﻪ ،أ ﻳﻌ ﱢﺮﻓﻪ — ﺑﺎﻟﻄﺒﻊ — اﻟﺴﺒﺐ
ﰲ أﻫﻤﻴﺘﻪ.
ﻳﻌﺮض اﻟﻔﺼﻞ اﻷ ﺑﻌﺾ اﻟﺘﻌﺮﻳﻔﺎت اﻷﺳﺎﺳﻴﺔ ،ﻣﻊ ﺗﻮﺿﻴﺤﺎت ﺗﻬﺪ ﻟﻠﺘﻌﺮﻳﻒ
ﺑﺒﻌﺾ ﻣﻦ ﻗﻮة اﻹﺣﺼﺎء أﻫﻤﻴﺘﻪ إﺛﺎرﺗﻪ .ﻳﻘﺪ اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ ﺑﻌﻀﺎ ﻣﻦ أﺑﺴﻂ
ﱠ
ﺑﺎملﻠﺨﺼﺎت اﻷﺳﺎﺳﻴﺔ اﻷﻓﻜﺎر اﻹﺣﺼﺎﺋﻴﺔ؛ اﻷﻓﻜﺎر اﻟﺘﻲ رﺑﻤﺎ ﻗﺎﺑﻠﻬﺎ اﻟﻘﺎرئ ﺑﺎﻟﻔﻌﻞ ،املﻌﻨﻴﺔ
ﻟﻠﺒﻴﺎﻧﺎت .ﻳﺤﺬرﻧﺎ اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ ﻣﻦ أ ﺻﺤﺔ أ اﺳﺘﻨﺘﺎﺟﺎت ﻧﺴﺘﻘﻴﻬﺎ ﺗﻌﺘﻤﺪ ﻛﺜريا ﻋﲆ
ﺟﻮدة اﻟﺒﻴﺎﻧﺎت اﻟﺨﺎ ،ﻳﻮﺿﺢ أﻳﻀﺎ اﺳﱰاﺗﻴﺠﻴﺎت ﻟﺠﻤﻊ اﻟﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ ﻛﻔﺎءة.
إذا ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت إﺣﺪ ﺳﺎﻗﻲ اﻹﺣﺼﺎء ،ﻓﺈ ﺳﺎﻗﻬﺎ اﻷﺧﺮ ﻫﻲ اﻻﺣﺘﻤﺎ .ﻳﻘﺪ اﻟﻔﺼﻞ
اﻟﺮاﺑﻊ املﻔﺎﻫﻴﻢ اﻷﺳﺎﺳﻴﺔ ﻟﻼﺣﺘﻤﺎ .اﺳﺘﻨﺎدا ﻋﲆ ﺳﺎﻗﻲ اﻟﺒﻴﺎﻧﺎت اﻻﺣﺘﻤﺎﻻت ،ﻳﺒﺪأ اﻹﺣﺼﺎء
ﰲ اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ املﴚ ،ﻣﻊ ﺻﻒ ﻛﻴﻔﻴﺔ اﺳﺘﻘﺎء املﺮء ﻟﻼﺳﺘﻨﺘﺎﺟﺎت اﻟﺘﻮﺻﻞ ﻻﺳﺘﺪﻻﻻت
ﻣﻦ اﻟﺒﻴﺎﻧﺎت .ﻳﻌﺮض اﻟﻔﺼﻞ اﻟﺴﺎدس ﻟﻤْ ﺤﺔ ﺧﺎﻃﻔﺔ ﻟﺒﻌﺾ اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ املﻬﻤﺔ،
ﻣﺒﻴﱢﻨﺎ ﻛﻴﻒ أﻧﻬﺎ ﺗﺸ ﱢﻜﻞ ﺟﺰءا ﻣﻦ ﺷﺒﻜﺔ ﻣﱰاﺑﻄﺔ ﻣﻦ اﻷﻓﻜﺎر اﻟﻄﺮ ﻻﺳﺘﺨﺮاج اﻟﻔﻬﻢ
ﻣﻦ اﻟﺒﻴﺎﻧﺎت .أﺧريا ،ﻳﺘﻨﺎ اﻟﻔﺼﻞ اﻟﺴﺎﺑﻊ ﺑﻌﺾ اﻟﻄﺮ اﻟﺘﻲ أﺛﱠﺮ ﺑﻬﺎ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻋﲆ
اﻹﺣﺼﺎء.
أ ﱡد أ ْ أﺷﻜﺮ إﻣﻴﲇ ﻛﻴﻨﻮا ،ﺷﻴﲇ ﺷﺎﻧﻮ ،ﻣﺎرﺗﻦ ﻛﺮ در ،ﻗﺎرﺋﺎ ﻣﺠﻬﻮﻻ؛ ﻋﲆ
ﺣﺴﻨﺖ ﺗﻌﻠﻴﻘﺎﺗﻬﻢ ﻫﺬا اﻟﻜﺘﺎب ﻛﺜريا ،ﺳﺎﻋﺪت ﻋﲆ اﻟﺘﻌﻠﻴﻖ ﻋﲆ ﻣﺴﻮﱠدات ﻫﺬا اﻟﻜﺘﺎب؛ إذ ﱠ
ﺗﺴﻮﻳﺔ اﻟﻐﻤﻮض ﰲ اﻟﺘﻔﺴريات .ﺑﺎﻟﻄﺒﻊ ،أ ﻏﻤﻮض ﺑﺎ ﻫﻮ ﺧﻄﺌﻲ أﻧﺎ ﺣﺪ .
دﻳﻔﻴﺪ ﺟﻴﻪ ﻫﺎﻧﺪ
إﻣﱪﻳﺎ ﻛﻮﻟﻴﺪج ،ﻟﻨﺪ
8
اﻟﻔﺼﻞ اﻷ
10
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
ﺗﺴﻠﺴﻞ اﻟﺠﻴﻨﺎت ﻛﻠﻬﺎ ﺗﻄﺒﻴﻘﺎت ﻟﻺﺣﺼﺎء ،ﻣﻊ ذﻟﻚ رﺑﻤﺎ ﺗﺘﻄﻠﺐ أﺳﺎﻟﻴﺐ أد ات ﻣﺨﺘﻠﻔﺔ
ﻟﻠﻐﺎﻳﺔ .ﺛﻤﺔ ﳾء ﺗﺠﺪر ﻣﻼﺣﻈﺘﻪ ﺣﻮ ﻫﺬ اﻟﺘﻌﺮﻳﻔﺎت؛ ﻫﻮ أﻧﻨﻲ ﺗﻌﻤﺪت اﺧﺘﻴﺎر ﻛﻠﻤﺔ
»ﺗﻜﻨﻮﻟﻮﺟﻴﺎ« ﺑﺪﻻ ﻣﻦ ﻋﻠﻢ؛ ﻓﺎﻟﺘﻜﻨﻮﻟﻮﺟﻴﺎ ﻫﻲ ﺗﻄﺒﻴﻖ ﻟﻠﻌﻠﻢ اﻛﺘﺸﺎﻓﺎﺗﻪ ،ﻫﺬا ﻫﻮ ﻣﺎﻫﻴﺔ
اﻹﺣﺼﺎء؛ ﺗﻄﺒﻴﻖ ﻓﻬْ ﻤﻨﺎ ﻟﻜﻴﻔﻴﺔ اﺳﺘﺨﺮاج املﻌﻠﻮﻣﺎت ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﻓﻬﻤﻨﺎ ﻟﻌﺪ اﻟﻴﻘني.
ﻣﻊ ذﻟﻚ ،ﻳﺸﺎر إﱃ اﻹﺣﺼﺎء أﺣﻴﺎﻧﺎ ﻋﲆ أﻧﻪ ﻋﻠﻢ .ﰲ اﻟﻮاﻗﻊ ،إﺣﺪ املﺠﻼت اﻹﺣﺼﺎﺋﻴﺔ
اﻷﻛﺜﺮ إﺛﺎرة ﺗﺸﻮﻳﻘﺎ ﺗﺴﻤﱠ ﻰ ﺑﺬﻟﻚ اﻻﺳﻢ ﻓﺤﺴﺐ» :اﻟﻌﻠﻮ اﻹﺣﺼﺎﺋﻴﺔ«.
ﺣﺘﻰ اﻵ ﰲ ﻫﺬا اﻟﻜﺘﺎب — ﻋﲆ ﺟﻪ اﻟﺨﺼﻮص ﰲ اﻟﻔﻘﺮة اﻟﺴﺎﺑﻘﺔ — ﺗﻨﺎ ﻟﺖ
»اﻹﺣﺼﺎء« ،ﻳﻮﺟﺪ ﳾء آﺧﺮ ﺳﻨﺘﻨﺎ ﻟﻪ ﰲ ﻫﺬا اﻟﻜﺘﺎب ﻫﻮ »اﻹﺣﺼﺎﺋﻴﺎت« ،اﻹﺣﺼﺎﺋﻴﺔ ﻫﻲ
ﺣﻘﻴﻘﺔ رﻗﻤﻴﺔ أ ﻣﻠﺨﺺ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻣﻠﺨﺺ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﺼﻒ ﺑﻌﺾ اﻟﺴﻜﺎ ؛
رﺑﻤﺎ ﺣﺠﻢ اﻟﺴﻜﺎ أ ﻣﻌ ﱠﺪ املﻮاﻟﻴﺪ أ ﻣﻌ ﱠﺪ اﻟﺠﺮﻳﻤﺔ؛ إذ ،ﻳﺪ ر ﻫﺬا اﻟﻜﺘﺎب — ﻣﻦ
ﻧﺎﺣﻴﺔ — ﺣﻮ اﻟﺤﻘﺎﺋﻖ اﻟﺮﻗﻤﻴﺔ اﻟﻔﺮدﻳﺔ .ﻟﻜﻦ ﺑﺎملﻌﻨﻰ اﻟﺤﻘﻴﻘﻲ ﻟﻠﻐﺎﻳﺔ ﻓﻬﻮ ﻳﺪ ر ﺣﻮ
ﻣﺎ ﻫﻮ أﻛﺜﺮ ﻣﻦ ذﻟﻚ ﺑﻜﺜري؛ ﻓﻬﻮ ﻳﺪ ر ﺣﻮ ﻛﻴﻔﻴﺔ ﺟﻤْ ﻊ ﻣﻌﺎﻟﺠﺔ ﺗﺤﻠﻴﻞ اﺳﺘﻨﺘﺎج أﺷﻴﺎء
ﻣﻦ ﻫﺬ اﻟﺤﻘﺎﺋﻖ اﻟﺮﻗﻤﻴﺔ .ﻫﻮ ﻳﺪ ر ﺣﻮ اﻟﺘﻜﻨﻮﻟﻮﺟﻴﺎ ﻧﻔﺴﻬﺎ؛ ﻫﺬا ﻳﻌﻨﻲ أ اﻟﻘﺎرئ
اﻵﻣﻞ ﰲ أ ﻳﺠﺪ ﺟﺪا أﻋﺪاد ﰲ ﻫﺬا اﻟﻜﺘﺎب )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ »إﺣﺼﺎﺋﻴﺎت رﻳﺎﺿﻴﺔ«(
ﻓﺴﻮ ﻳﺼﺎب ﺑﺨﻴﺒﺔ أﻣﻞ .ﻟﻜﻦ اﻟﻘﺎرئ اﻵﻣﻞ ﰲ اﻟﺘﻮﺻﻞ ﻟﻔﻬﻢ ﻛﻴﻔﻴﺔ اﺗﺨﺎذ اﻟﴩﻛﺎت
ﻟﻠﻘﺮارات ،ﻛﻴﻔﻴﺔ اﻛﺘﺸﺎ ﻋﻠﻤﺎء اﻟﻔﻠﻚ ﻷﻧﻮاع ﺟﺪﻳﺪة ﻣﻦ اﻟﻨﺠﻮ ،ﻛﻴﻔﻴﺔ ﺗﺤﺪﻳﺪ اﻟﺒﺎﺣﺜني
ﰲ ﻣﺠﺎ اﻟﻄﺐ ﻟﻠﺠﻴﻨﺎت املﺮﺗﺒﻄﺔ ﺑﻤﺮض ﻣﻌني ،ﻛﻴﻔﻴﺔ اﺗﺨﺎذ اﻟﺒﻨﻮ ﻗﺮارا ﺑﻤﻨﺢ أ ﻋﺪ
ﻣﻨﺢ ﺷﺨﺺ ﻣﺎ ﺑﻄﺎﻗﺔ اﺋﺘﻤﺎ ،ﻛﻴﻔﻴﺔ ﺗﺤﺪﻳﺪ ﴍﻛﺎت اﻟﺘﺄﻣني ﺗﻜﻠﻔﺔ اﻟﻘﺴﻂ ،ﻛﻴﻔﻴﺔ ﺑﻨﺎء
ﻣﺮﺷﺤﺎت اﻟﱪﻳﺪ املﺰﻋﺞ اﻟﺘﻲ ﺗﻤﻨﻊ اﻹﻋﻼﻧﺎت املﺰﻋﺠﺔ ﻣﻦ اﻟﻮﺻﻮ إﱃ ﺻﻨﺪ ﺑﺮﻳﺪ ﱢ
اﻹﻟﻜﱰ ﻧﻲ ،ﻣﺎ إﱃ ذﻟﻚ؛ ﻓﺈﻧﻪ ﺳﻮ ﻳﺠﺪ ﻣﺄرﺑﻪ.
ﻳﺒني اﻟﻔﺎر ﺑني املﺴﻤﱠ ْﻴني »اﻹﺣﺼﺎء« »اﻹﺣﺼﺎﺋﻴﺎت«؛ ﻓﺎﻹﺣﺼﺎء ﻫﻮ ﻛﻞ ﻣﺎ ﺳﺒﻖ ﱢ
اﻟﻌﻠﻢ اﻷﺳﺎﳼ اﻟﺸﺎﻣﻞ ،أﻣﺎ اﻹﺣﺼﺎﺋﻴﺎت ﻓﻴﻘﺼﺪ ﺑﻬﺎ اﻟﺤﻘﺎﺋﻖ اﻟﺮﻗﻤﻴﺔ أ املﻠﺨﺼﺎت املﻨﺪرﺟﺔ
ﺗﺤﺖ املﻈ ﱠﻠﺔ اﻟﻜﱪ ﻟﻌﻠﻢ اﻹﺣﺼﺎء.
اﺳﺘﺨﺪﻣﺖ ﰲ ﺗﻌﺮﻳﻔﻲ اﻷ ﻛﻠﻤﺔ »اﻟﺒﻴﺎﻧﺎت« .ﻛﻠﻤﺔ »ﺑﻴﺎﻧﺎت« ﰲ اﻹﻧﺠﻠﻴﺰﻳﺔ Data
ﻣﺸﺘﻘﺔ ﻣﻦ اﻟﻜﻠﻤﺔ اﻟﻼﺗﻴﻨﻴﺔ datumﺑﻤﻌﻨﻰ »ﳾء ﻣﻌﻄﻰ« املﺸﺘﻘﺔ ﻣﻦ dareﺑﻤﻌﻨﻰ
»ﻳﻌﻄﻲ« .ﻋﺎدة ﻣﺎ ﺗﻜﻮ اﻟﺒﻴﺎﻧﺎت أرﻗﺎﻣﺎ؛ ﻧﺘﺎﺋﺞ ﻗﻴﺎﺳﺎت أ ﺣﺴﺎﺑﺎت أ ﻏريﻫﺎ ﻣﻦ
اﻟﻌﻤﻠﻴﺎت .ﻳﻤﻜﻦ اﻟﻨﻈﺮ ملﺜﻞ ﻫﺬ اﻟﺒﻴﺎﻧﺎت ﻋﲆ أﻧﻬﺎ ﺗﻘ ﱢﺪ ﺗﻤﺜﻴﻼ ﻣﺒﺴﻄﺎ ملﺎ ﻧﺪرﺳﻪ.
ﻓﺈذا ﻛﻨﱠﺎ ﻣﻬﺘﻤﱢ ني ﺑﺄﻃﻔﺎ املﺪارس ،ﺑﺨﺎﺻﺔ ﻗﺪرﺗﻬﻢ اﻷﻛﺎدﻳﻤﻴﺔ ﻣﺪ ﻣﻼءﻣﺘﻬﻢ ﻷﻧﻮاع
11
ﻋﻠﻢ اﻹﺣﺼﺎء
املﻬﻦ املﺨﺘﻠﻔﺔ ،رﺑﻤﺎ ﻧﺨﺘﺎر دراﺳﺔ اﻷرﻗﺎ اﻟﺘﻲ ﺗﺼﻒ ﻧﺘﺎﺋﺠﻬﻢ ﰲ ﻣﺨﺘﻠﻒ اﻻﺧﺘﺒﺎرات
اﻻﻣﺘﺤﺎﻧﺎت.
رﺑﻤﺎ ﺗﻤﻨﺤﻨﺎ ﻫﺬ اﻷرﻗﺎ إﺷﺎرة ﺣﻴﺎ ﻗﺪراﺗﻬﻢ ﻣﻴﻮﻟﻬﻢ .ﺑﺎﻋﱰا اﻟﺠﻤﻴﻊ ،ﻟﻦ
ﻳﻜﻮ ﻫﺬا اﻟﺘﻤﺜﻴﻞ ﻣﺜﺎﻟﻴٍّﺎ؛ ﻓﺮﺑﻤﺎ ﺗﺸري اﻟﺪرﺟﺔ املﻨﺨﻔﻀﺔ ﺑﺒﺴﺎﻃﺔ إﱃ أ ﺷﺨﺼﺎ ﻣﺎ ﻛﺎ
ﻳﺸﻌﺮ ﺑﺎملﺮض أﺛﻨﺎء اﻻﻣﺘﺤﺎ .ﻋﺒﺎرة »ﻟﻢ ﻳﺤﴬ« ﻻ ﺗﺨﱪﻧﺎ ﺑﺎﻟﻜﺜري ﻋﻦ ﻗﺪرة اﻟﻄﻔﻞ،
ﻟﻜﻦ ﺗﺨﱪﻧﺎ ﻓﺤﺴﺐ أﻧﻪ ﻟﻢ ﻳﺨ ْﺾ اﻻﻣﺘﺤﺎ .ﺳﺄﺗﺤﺪث ﺑﺸﻜﻞ أﻛﺜﺮ اﺳﺘﻔﺎﺿﺔ ﻋﻦ »ﺟﻮدة
اﻟﺒﻴﺎﻧﺎت« ﰲ ﻗﺖ ﻻﺣﻖ ،ﻫﻲ ﻣﻬﻤﺔ ﺑﺴﺒﺐ املﺒﺪأ اﻟﻌﺎ )اﻟﺬ ﻳﻨﻄﺒﻖ ﻋﲆ ﺟﻤﻴﻊ ﺟﻮاﻧﺐ
اﻟﺤﻴﺎة ،ﻟﻴﺲ ﻓﻘﻂ ﰲ اﻹﺣﺼﺎﺋﻴﺎت( اﻟﻘﺎﴈ ﺑﺄﻧﻪ إذا ﻛﺎﻧﺖ املﺎدة اﻟﺨﺎ اﻟﺘﻲ ﺗﻌﻤﻞ ﻋﻠﻴﻬﺎ
ردﻳﺌﺔ ،ﻓﺈ اﻟﻨﺘﺎﺋﺞ ﺳﺘﻜﻮ ردﻳﺌﺔ .ﻳﺴﺘﻄﻴﻊ اﻹﺣﺼﺎﺋﻴﻮ ﻓﻬْ ﻢ أﺷﻴﺎء ﻛﺜرية ﻣﺬﻫﻠﺔ ﻣﻦ
اﻷرﻗﺎ ،ﻟﻜﻨﻬﻢ ﻻ ﻳﻤﻜﻦ أ ﻳﺼﻨﻌﻮا املﻌﺠﺰات.
ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ ،ﻳﺒﺪ أ ﺣﺎﻻت ﻛﺜرية ﻻ ﺗﻨﺘﺞ ﺑﻴﺎﻧﺎت رﻗﻤﻴﺔ ﻣﺒﺎﴍة؛ ﻓﺎﻟﻜﺜري ﻣﻦ
اﻟﺒﻴﺎﻧﺎت اﻟﺨﺎ ﻗﺪ ﺗﻜﻮ ﰲ ﺷﻜﻞ ﺻﻮر أ ﻛﻠﻤﺎت أ ﺣﺘﻰ أﺷﻴﺎء ﻣﺜﻞ إﺷﺎرات إﻟﻜﱰ ﻧﻴﺔ
أ ﺻﻮﺗﻴﺔ؛ ﻣﻦ ﺛﻢ ﻓﺈ ﺻﻮر اﻷﻗﻤﺎر اﻟﺼﻨﺎﻋﻴﺔ ﻟﻠﻤﺤﺎﺻﻴﻞ أ ﺗﻐﻄﻴﺔ اﻟﻐﺎﺑﺎت املﻄرية،
اﻷ ﺻﺎ اﻟﻠﻔﻈﻴﺔ ﻟﻶﺛﺎر اﻟﺠﺎﻧﺒﻴﺔ اﻟﺘﻲ ﺗﺤﺪث ﻋﻨﺪ ﺗﻨﺎ اﻟﺪ اء ،اﻷﺻﻮات املﻠﻔﻮﻇﺔ
ﻋﻨﺪ اﻟﺘﺤﺪث؛ ﻻ ﺗﺄﺧﺬ ﻣﻈﻬﺮ اﻷرﻗﺎ .ﻣﻊ ذﻟﻚ ،ﻳﻈﻬﺮ اﻟﻔﺤﺺ اﻟﺪﻗﻴﻖ أﻧﻪ ﻋﻨﺪﻣﺎ ﺗﻘﺎس
ﻫﺬ اﻷﺷﻴﺎء ﺗﺴﺠﱠ ﻞ ،ﻓﺈﻧﻬﺎ ﺗﱰﺟﻢ إﱃ ﺗﻤﺜﻴﻼت رﻗﻤﻴﺔ أ إﱃ ﺗﻤﺜﻴﻼت ﻳﻤﻜﻦ أ ﺗﱰﺟﻢ
ﺑﻌﺪ ذﻟﻚ إﱃ أرﻗﺎ ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺻﻮر اﻷﻗﻤﺎر اﻟﺼﻨﺎﻋﻴﺔ اﻟﺼﻮر اﻷﺧﺮ ﺗﻤﺜﱠﻞ
ﺑﻤﻼﻳني اﻟﻌﻨﺎﴏ اﻟﺼﻐرية اﻟﺘﻲ ﺗﺴﻤﱠ ﻰ ﺣﺪات اﻟﺒﻜﺴﻞ ،ﻛ ﱞﻞ ﻣﻨﻬﺎ ﻳﻮﺻﻒ ﻣﻦ ﺣﻴﺚ
اﻟﺸﺪة )اﻟﺮﻗﻤﻴﺔ( ﻟﻸﻟﻮا املﺨﺘﻠﻔﺔ اﻟﺘﻲ ﺗﺸ ﱢﻜﻠﻬﺎ .ﻳﻤﻜﻦ ﻣﻌﺎﻟﺠﺔ اﻟﻨﺺ ﰲ ﺻﻮرة ﺗﻌﺪاد
ﻟﻠﻜﻠﻤﺎت أ ﻣﻘﺎﻳﻴﺲ ﻟﻠﺘﺸﺎﺑﻪ ﺑني اﻟﻜﻠﻤﺎت اﻟﻌﺒﺎرات؛ ﻫﺬا ﻫﻮ ﻧﻮع اﻟﺘﻤﺜﻴﻞ املﺴﺘﺨﺪ
ﻣﻦ ﻗﺒﻞ ﻣﺤ ﱢﺮﻛﺎت اﻟﺒﺤﺚ ﻋﲆ ﺷﺒﻜﺔ اﻹﻧﱰﻧﺖ ﻣﺜﻞ ﺟﻮﺟﻞ .ﺗﻤﺜﱠﻞ اﻟﻜﻠﻤﺎت املﻨﻄﻮﻗﺔ ﻣﻦ
ﺧﻼ اﻟﻜﺜﺎﻓﺎت اﻟﺮﻗﻤﻴﺔ ﻟﻸﺷﻜﺎ املﻮﺟﻴﺔ اﻟﺘﻲ ﺗﺸ ﱢﻜﻞ اﻷﺟﺰاء املﻔﺮدة ﻣﻦ اﻟﻜﻼ .ﻋﲆ ﻧﺤﻮ
ﻋﺎ ،رﻏﻢ أﻧﻪ ﻟﻴﺴﺖ ﺟﻤﻴﻊ اﻟﺒﻴﺎﻧﺎت أرﻗﺎﻣﺎ ،ﻓﺈ ﻣﻌﻈﻢ اﻟﺒﻴﺎﻧﺎت ﺗﱰﺟﻢ إﱃ ﺷﻜﻞ رﻗﻤﻲ ﰲ
ﻣﺮﺣﻠﺔ ﻣﺎ .ﻣﻌﻈﻢ اﻹﺣﺼﺎﺋﻴﺎت ﺗﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ.
12
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
ﻟﺴﺎ اﻟﻌﺪﻳﺪ ﻣﻦ اﻷﺷﺨﺎص ﺗﴫﻳﺤﺎت ﻣﻤﺎﺛﻠﺔ؛ ﻣﻨﻬﺎ» :ﻋﲆ ﻏﺮار اﻷﺣﻼ ،اﻹﺣﺼﺎﺋﻴﺎت
ﻫﻲ ﺷﻜﻞ ﻣﻦ أﺷﻜﺎ ﺗﺤﻘﻴﻖ اﻟﺮﻏﺒﺎت« )ﺟﻮ ﺑﻮدرﻳﺎر ،ﰲ ﻛﺘﺎب »ذﻛﺮﻳﺎت ﺟﻤﻴﻠﺔ«،
ﻠﺖﱠت ﻋﲆ ﻧﺤﻮ ﺧﺎص إﱃ ﻧﺘﻴﺠﺔ ﻣﺆﺳﻔﺔ ﺗﻤﺜ ﱠ ْ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ( …» ،ﻋﺒﺎدة اﻹﺣﺼﺎﺋﻴﺎت أد ْ
ﰲ ﺟﻌﻞ ﻣﻬﻤﺔ اﻟﻜﺎذب اﻟﴫ أﺳﻬﻞ ﺑﻜﺜري« )ﺗﻮ ﺑﻮرﻧﺎ ،ﰲ ﻛﺘﺎب »ﻗﺎﻣﻮس اﻟﺘﻀﻠﻴﻞ«(،
»اﻹﺣﺼﺎﺋﻴﺎت ﻫﻲ »ﺧﺰﻋْ ﺒﻼت« ﻣﺪﻋﻮﻣﺔ ﺑﺎﻷرﻗﺎ « )أ در ﻫﺎﺑريا رﻳﺘﺸﺎرد ر ﻧﻴﻮ ،ﰲ
ﻛﺘﺎب »اﻹﺣﺼﺎﺋﻴﺎت اﻟﻌﺎﻣﺔ«(» ،اﻹﺟﺮاءات اﻟﻘﺎﻧﻮﻧﻴﺔ ﻣﺜﻞ اﻹﺣﺼﺎﺋﻴﺎت؛ إذا ﺗﻼﻋﺒﺖ ﺑﻬﺎ،
ﻳﻤﻜﻨﻚ أ ﺗﺜﺒﺖ أ ﱠ ﳾء« )آرﺛﺮ ﻫﻴﲇ ،ﰲ ر اﻳﺔ »املﻄﺎر«( ،ﻣﺎ إﱃ ذﻟﻚ.
ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻳﻮﺟﺪ ﻛﺜري ﻣﻦ اﻟﺸﻚ ﺣﻴﺎ اﻹﺣﺼﺎﺋﻴﺎت ،رﺑﻤﺎ ﻧﺘﺴﺎء أﻳﻀﺎ ﻣﺎ إذا
ﻛﺎ ﻫﻨﺎ ﻋﻨﴫ ﺧﻮ ﻣﻦ ﻫﺬا املﺠﺎ .ﻣﻦ املﺆﻛﺪ أ اﻹﺣﺼﺎﺋﻲ ﻏﺎﻟﺒﺎ ﻣﺎ ﻳﻠﻌﺐ د ر ﺷﺨﺺ
ﺗﻮﺧﻲ اﻟﺤﺬر ،رﺑﻤﺎ ﺣﺘﻰ ﻳﻜﻮ ﺣﺎﻣﻞ اﻷﺧﺒﺎر اﻟﺴﻴﺌﺔ .اﻹﺣﺼﺎﺋﻴﻮ اﻟﻌﺎﻣﻠﻮ ﻳﺠﺐ ﻋﻠﻴﻪ ﱢ
ﰲ اﻟﺒﻴﺌﺎت اﻟﺒﺤﺜﻴﺔ — ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ﰲ ﻛﻠﻴﺎت اﻟﻄﺐ أ اﻟﺴﻴﺎﻗﺎت اﻻﺟﺘﻤﺎﻋﻴﺔ — رﺑﻤﺎ
ﻳﻜﻮ ﻋﻠﻴﻬﻢ ﴍح أ اﻟﺒﻴﺎﻧﺎت ﻏري ﻛﺎﻓﻴﺔ ﻟﻺﺟﺎﺑﺔ ﻋﻦ ﺳﺆا ﻣﻌني ،أ أ اﻟﺠﻮاب ﺑﺒﺴﺎﻃﺔ
ﻟﻴﺲ ﻣﺎ أراد اﻟﺒﺎﺣﺚ ﺳﻤﺎﻋﻪ ،رﺑﻤﺎ ﻳﻜﻮ ﻫﺬا أﻣﺮا ﻣﺆﺳﻔﺎ ﻣﻦ ﺟﻬﺔ ﻧﻈﺮ اﻟﺒﺎﺣﺚ ،ﻟﻜﻦ
ﻟﻴﺲ ﻣﻦ اﻹﻧﺼﺎ إﻟﻘﺎء اﻟﻠﻮ ﻋﲆ ﺣﺎﻣﻞ اﻟﺮﺳﺎﻟﺔ اﻹﺣﺼﺎﺋﻴﺔ.
ﰲ ﻛﺜري ﻣﻦ اﻟﺤﺎﻻت ،ﺗﺘﻮ ﱠﻟﺪ اﻟﺸﻜﻮ ﺑﺴﺒﺐ أ ﻟﺌﻚ اﻟﺬﻳﻦ ﻳﺨﺘﺎر اﻹﺣﺼﺎﺋﻴﺎت اﻧﺘﻘﺎﺋﻴٍّﺎ.
ﻓﺈذا ﻛﺎ ﻫﻨﺎ أﻛﺜﺮ ﻣﻦ ﻃﺮﻳﻘﺔ ﻟﺘﻠﺨﻴﺺ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﺗﻨﺒﻊ ﻛ ﱞﻞ ﻣﻨﻬﺎ ﺑﺎﻟﻨﻈﺮ
ﰲ ﺟﻮاﻧﺐ ﻣﺨﺘﻠﻔﺔ ﻗﻠﻴﻼ ،ﻓﺈ اﻷﺷﺨﺎص املﺨﺘﻠﻔني ﺣﻴﻨﻬﺎ ﻳﻤﻜﻦ أ ﻳﺨﺘﺎر ا اﻟﱰﻛﻴﺰ ﻋﲆ
ﻣﻠﺨﺼﺎت ﻣﺨﺘﻠﻔﺔ .ﺛﻤﺔ ﻣﺜﺎ ﻣﺤﺪد ﰲ إﺣﺼﺎﺋﻴﺎت اﻟﺠﺮﻳﻤﺔ؛ ﻓﻔﻲ ﺑﺮﻳﻄﺎﻧﻴﺎ ،رﺑﻤﺎ ﻳﻌ ﱡﺪ
أﻫﻢ ﻣﺼﺪر ﻹﺣﺼﺎﺋﻴﺎت اﻟﺠﺮﻳﻤﺔ ﻫﻮ »اﺳﺘﻘﺼﺎء اﻟﺠﺮﻳﻤﺔ اﻟﱪﻳﻄﺎﻧﻴﺔ« ،ﻫﺬا اﻻﺳﺘﻘﺼﺎء
ﻳﻘﺪﱢر ﻣﺴﺘﻮ اﻟﺠﺮﻳﻤﺔ ﻋﻦ ﻃﺮﻳﻖ ﺳﺆا ﻋﻴﱢﻨﺔ ﻣﻦ اﻟﻨﺎس ﻣﺒﺎﴍة ﻋﻦ اﻟﺠﺮاﺋﻢ اﻟﺘﻲ ﻗﻌﻮا
ﺿﺤﺎﻳﺎ ﻟﻬﺎ ﺧﻼ اﻟﻌﺎ املﺎﴈ .ﰲ املﻘﺎﺑﻞ ،ﻓﺈ ﺳﻠﺴﻠﺔ »إﺣﺼﺎﺋﻴﺎت اﻟﺠﺮاﺋﻢ املﺴﺠﱠ ﻠﺔ«
ﺗﺸﻤﻞ ﺟﻤﻴﻊ اﻟﺠﺮاﺋﻢ املﺒ ﱠﻠﻎ ﻋﻨﻬﺎ إﱃ زارة اﻟﺪاﺧﻠﻴﺔ اﻟﺘﻲ ﺳﺠﱠ ﻠﺘْﻬﺎ اﻟﴩﻃﺔ .ﺑﻄﺒﻴﻌﺘﻬﺎ،
ﻻ ﺗﺸﻤﻞ ﻫﺬ اﻹﺣﺼﺎﺋﻴﺎت ﺑﻌﺾ اﻟﺠﺮاﺋﻢ اﻟﺒﺴﻴﻄﺔ ،أﻫﻢ ﻣﻦ ذﻟﻚ ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ أﻧﻬﺎ
ﺗﺴﺘﺜﻨﻲ اﻟﺠﺮاﺋﻢ اﻟﺘﻲ ﻟﻢ ﺗﺒ ﱠﻠﻎ ﻋﻨﻬﺎ اﻟﴩﻃﺔ ﰲ املﻘﺎ اﻷ .ﺑﻮﺟﻮد ﻣﺜﻞ ﻫﺬ اﻻﺧﺘﻼﻓﺎت،
ﻟﻴﺲ ﻣﻦ املﺴﺘﻐﺮب أ اﻷرﻗﺎ ﻳﻤﻜﻦ أ ﺗﺨﺘﻠﻒ ﺑني ﻣﺠﻤﻮﻋﺘﻲ اﻹﺣﺼﺎﺋﻴﺎت ،ﻟﺪرﺟﺔ أ
ﻓﺌﺎت ﻣﻌﻴﻨﺔ ﻣﻦ اﻟﺠﺮاﺋﻢ رﺑﻤﺎ ﺗﺒﺪ آﺧﺬة ﰲ اﻟﺘﻨﺎﻗﺺ ﻋﲆ ﻣﺮ اﻟﺰﻣﻦ ﻓﻘﺎ ﻹﺣﺪ ﻣﺠﻤﻮﻋﺘﻲ
اﻷرﻗﺎ ﻓﻴﻤﺎ ﺗﻜﻮ آﺧﺬة ﰲ اﻟﺘﺰاﻳﺪ ﻓﻘﺎ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻷﺧﺮ .
أرﻗﺎ إﺣﺼﺎﺋﻴﺎت اﻟﺠﺮﻳﻤﺔ ﺗﻮﺿﺢ أﻳﻀﺎ ﺳﺒﺒﺎ ﻣﺤﺘﻤﻼ آﺧﺮ ﻟﻠﺘﺸﻜﻚ ﰲ اﻹﺣﺼﺎﺋﻴﺎت؛
ﻓﻌﻨﺪ اﺳﺘﺨﺪا ﻣﻘﻴﺎس ﻣﻌني ﻛﻤﺆﴍ ﻷداء ﻧﻈﺎ ﻣﺎ ،رﺑﻤﺎ ﻳﺨﺘﺎر اﻷﺷﺨﺎص اﺳﺘﻬﺪا ﻫﺬا
13
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻜﻦ ﻋﲆ ﺣﺴﺎب ﺟﻮاﻧﺐ أﺧﺮ ﻣﻦ اﻟﻨﻈﺎ ؛ ﻣﻦ ﺛﻢ ﻳﺘﺤﺴﻦ ْ املﻘﻴﺎس ،ﻓﻴﺤﺴﻨﻮ ﻗﻴﻤﺘﻪ
املﻘﻴﺎس املﺨﺘﺎر ﻋﲆ ﻧﺤﻮ ﻏري ﻣﺘﻜﺎﻓﺊ ،ﻳﺼﺒﺢ ﻋﺪﻳﻢ اﻟﻔﺎﺋﺪة ﻛﻤﻘﻴﺎس ﻷداء اﻟﻨﻈﺎ ؛ ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻦ ﻟﻠﴩﻃﺔ أ ﺗﻘﻠﻞ ﻣﻦ ﻣﻌﺪ ﴎﻗﺔ املﺘﺎﺟﺮ ﻣﻦ ﺧﻼ ﺗﺮﻛﻴﺰ ﻛﻞ ﻣﻮاردﻫﺎ
ﻋﲆ ﺗﻠﻚ اﻟﺠﺮﻳﻤﺔ ،ﻋﲆ ﺣﺴﺎب اﻟﺴﻤﺎح ﺑﺰﻳﺎدة أﻧﻮاع أﺧﺮ ﻣﻦ اﻟﺠﺮﻳﻤﺔ؛ ﻧﺘﻴﺠﺔ ﻟﺬﻟﻚ،
ﻓﺈ ﻣﻌﺪ ﴎﻗﺔ املﺘﺎﺟﺮ ﻳﺼﺒﺢ ﻋﺪﻳﻢ اﻟﻔﺎﺋﺪة ﻛﻤﺆﴍ ﻋﲆ ﻣﻌﺪ اﻟﺠﺮﻳﻤﺔ .ﻗﺪ ﺳﻤﱢ ﻴﺖ
ﻫﺬ اﻟﻈﺎﻫﺮة ﺑﺎﺳﻢ »ﻗﺎﻧﻮ ﺟﻮدﻫﺎرت« ،ﺗﻴﻤﱡ ﻨﺎ ﺑﺘﺸﺎرﻟﺰ ﺟﻮدﻫﺎرت ،ﻫﻮ ﻛﺒري ﻣﺴﺘﺸﺎرﻳﻦ
ﺳﺎﺑﻘﺎ ﰲ »ﻣﴫ إﻧﺠﻠﱰا«.
اﻟﻬﺪ ﻣﻦ ﻛﻞ ذﻟﻚ ﻫﻮ أ املﺸﻜﻠﺔ ﻻ ﺗﻜﻤﻦ ﰲ اﻹﺣﺼﺎﺋﻴﺎت ﰲ ﺣﺪ ذاﺗﻬﺎ ،ﻟﻜﻦ ﰲ
اﺳﺘﺨﺪا ﺗﻠﻚ اﻹﺣﺼﺎﺋﻴﺎت ،ﺳﻮء ﻓﻬﻢ ﻛﻴﻔﻴﺔ إﻧﺘﺎج اﻹﺣﺼﺎﺋﻴﺎت ،ﻣﺎ ﺗﻌﻨﻴﻪ اﻹﺣﺼﺎﺋﻴﺎت
ٍّ
ﺣﻘﺎ .ﻟﻌﻞ ﻣﻦ اﻟﻄﺒﻴﻌﻲ ﺗﻤﺎﻣﺎ أ ﻧﻜﻮ ﻣﺘﺸ ﱢﻜﻜني ﺣﻴﺎ اﻷﺷﻴﺎء اﻟﺘﻲ ﻻ ﻧﻔﻬﻤﻬﺎ ،اﻟﺤﻞ ﻫﻮ
إزاﻟﺔ ﺳﻮء اﻟﻔﻬﻢ.
ﻣﻊ ذﻟﻚ ،ﺛﻤﺔ ﺳﺒﺐ آﺧﺮ ﻟﻠﺘﺸﻜﻚ ﻳﻨﺸﺄ أﺳﺎﺳﺎ ﻧﺘﻴﺠﺔ ﻟﻄﺒﻴﻌﺔ اﻟﺘﻘﺪ اﻟﻌﻠﻤﻲ؛ ﻣﻦ
ﺗﺒني أ ﻧﻮﻋﺎ ﻣﻌﻴﻨﺎ ﻣﻦ ﺛﻢﱠ ،رﺑﻤﺎ ﻧﻘﺮأ ﰲ ﻳﻮ ﻣﻦ اﻷﻳﺎ ﰲ ﺻﺤﻴﻔﺔ ﻣﺎ ﻋﻦ دراﺳﺔ ﻋﻠﻤﻴﺔ ﱢ
اﻟﻄﻌﺎ ﺿﺎ ﱞر ﻟﻨﺎ ،ﰲ اﻟﻴﻮ اﻟﺘﺎﱄ ﺗﺸري إﱃ أﻧﻪ ﻣﻔﻴﺪ .ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ ﻳﻮ ﱢﻟﺪ ذﻟﻚ ا ْﻟﺘﺒﺎﺳﺎ؛
أ ْ ﺷﻌﻮرا ﺑﺄ اﻟﻌﻠﻤﺎء ﻻ ﻳﻌﺮﻓﻮ اﻟﺠﻮاب ،رﺑﻤﺎ أﻧﻪ ﻻ ﻳﻤﻜﻦ اﻟﻮﺛﻮ ﺑﻬﻢ .ﺣﺘﻤﺎ ﻣﺜﻞ
ﻫﺬ اﻟﺘﺤﻘﻴﻘﺎت اﻟﻌﻠﻤﻴﺔ ﺗﺴﺘﺨﺪ اﻟﺘﺤﻠﻴﻼت اﻹﺣﺼﺎﺋﻴﺔ ﻋﲆ ﻧﺤﻮ ﻣﻜﺜﱠﻒ؛ ﻣﻦ ﺛﻢ ﻓﺈ
ﺑﻌﻀﺎ ﻣﻦ ﻫﺬ اﻟﺸﻜﻮ ﻳﻨﺘﻘﻞ إﱃ اﻹﺣﺼﺎﺋﻴﺎت .ﻟﻜﻦ ﺟﻮﻫﺮ اﻟﺘﻘﺪ اﻟﻌﻠﻤﻲ ﻫﻮ ﺗﺤﻘﻴﻖ
ﺗﻐري ﻓﻬﻤﻨﺎ؛ ﻓﺮﻏﻢ أﻧﻨﺎ ﻛﻨﱠﺎ ﻧﻈﻦ ﰲ املﺎﴈ أ اﻟﺪﻫﻮ اﻟﻐﺬاﺋﻴﺔ ﺿﺎرة اﻛﺘﺸﺎﻓﺎت ﺟﺪﻳﺪة ﱢ
ﻟﻨﺎ ،ﻓﻘﺪ دﻓﻌﻨﺎ ﻣﺰﻳﺪ ﻣﻦ اﻟﺪراﺳﺎت إﱃ إدرا أﻧﻪ ﻳﻮﺟﺪ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺪﻫﻮ ؛ ﺑﻌﻀﻬﺎ
ﻣﻔﻴﺪ ﺑﻌﻀﻬﺎ ﺿﺎر .إ اﻟﺼﻮرة أﻛﺜﺮ ﺗﻌﻘﻴﺪا ﻣﻤﺎ ﻛﻨﱠﺎ ﻧﻌﺘﻘﺪ ﰲ اﻟﺒﺪاﻳﺔ؛ ﻟﺬﻟﻚ ﻟﻴﺲ ﻣﻦ
املﺴﺘﻐﺮب أ ﺗﺆ ﱢد اﻟﺪراﺳﺎت اﻷ ﻟﻴﺔ إﱃ اﺳﺘﻨﺘﺎﺟﺎت ﺗﺒﺪ ﻣﺘﻀﺎرﺑﺔ ﻣﺘﻨﺎﻗﻀﺔ.
اﻟﺴﺒﺐ اﻟﺮاﺑﻊ ﻟﻠﺘﺸﻜﻚ ﻳﻨﺸﺄ ﻣﻦ ﺳﻮء ﻓﻬﻢ أ ﱄ ﱟ ملﺒﺎدئ اﻹﺣﺼﺎء .ﻛﺘﻤﺮﻳﻦ ،رﺑﻤﺎ
ﻳﺤﺎ اﻟﻘﺎرئ أ ﻳﺤﺪد ﻣﺎ ﻫﻮ ﻣﺜري ﻟﻠﺸﻜﻮ ﰲ ﻛ ﱟﻞ ﻣﻦ اﻟﻌﺒﺎرات اﻟﺘﺎﻟﻴﺔ )اﻷﺟﻮﺑﺔ ﻣﻮﺟﻮدة
ﰲ اﻟﺘﻌﻠﻴﻘﺎت اﻟﺨﺘﺎﻣﻴﺔ ﰲ آﺧﺮ اﻟﻜﺘﺎب(:
) (١ﻧﻘﺮأ ﰲ ﺗﻘﺮﻳﺮ ﻣﺎ أ اﻟﺘﺸﺨﻴﺺ املﺒ ﱢﻜﺮ ﻟﻠﻤﺮض ﻳﺆد إﱃ اﻟﺘﻤﺘﻊ ﺑﻤﻌﺪﻻت ﻋﻤﺮﻳﺔ
أﻃﻮ ؛ ﻟﺬﻟﻚ ﻓﺈ ﺑﺮاﻣﺞ اﻟﻔﺤﺺ ﻣﻔﻴﺪة.
) (٢ﻗﻴﻞ ﻟﻨﺎ إ اﻟﺴﻌﺮ املﻌﻠﻦ ﺧ ﱢﻔﺾ ﺑﺎﻟﻔﻌﻞ ﺑﻨﺴﺒﺔ ﺧﺼﻢ ٪٢٥ﻟﻠﻌﻤﻼء ﱠ
املﺆﻫﻠني ،ﻟﻜﻨﻨﺎ
ﻟﺴﻨﺎ ﱠ
ﻣﺆﻫﻠني؛ ﻟﺬﻟﻚ ﻋﻠﻴﻨﺎ دﻓﻊ ٪٢٥أﻛﺜﺮ ﻣﻦ اﻟﺴﻌﺮ املﻌﻠﻦ.
14
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
املﺘﻮﻗﻊ ﺳﻮ ﻳﺼﻞ إﱃ ١٥٠ﻋﺎﻣﺎ ﰲ اﻟﻘﺮ املﻘﺒﻞ،ﱠ ) (٣ﻧﺴﻤﻊ ﺗﻨﺒﺆا ﺑﺄ ﻣﺘﻮﺳﻂ اﻟﻌﻤﺮ
اﺳﺘﻨﺎدا إﱃ اﺳﺘﻘﺮاء ﺑﺴﻴﻂ ﻣﻦ اﻟﺰﻳﺎدات ﻋﲆ ﻣﺪ اﻟﺴﻨﻮات املﺎﺋﺔ املﺎﺿﻴﺔ.
) (٤ﻗﻴﻞ ﻟﻨﺎ» :ﻣﻨﺬ ﻋﺎ ،١٩٥٠ﺗﻀﺎﻋﻒ ﻛ ﱠﻞ ﻋﺎ ﻋﺪد اﻷﻃﻔﺎ اﻷﻣﺮﻳﻜﻴني اﻟﺬﻳﻦ ﺗﻌﺮﺿﻮا
ﻟﺤﺎدث إﻃﻼ ﻧﺎر«.
أﺣﻴﺎﻧﺎ ﻻ ﻳﻜﻮ ﺳﻮء اﻟﻔﻬﻢ أ ﻟﻴٍّﺎ ﻟﻠﻐﺎﻳﺔ ،أ ﻋﲆ اﻷﻗﻞ ،ﻳﻨﺸﺄ ﻋﻦ ﻣﻔﺎﻫﻴﻢ إﺣﺼﺎﺋﻴﺔ
ﻋﻤﻴﻘﺔ ﻧﺴﺒﻴٍّﺎ .ﺳﻴﻜﻮ ﻣﺴﺘﻐﺮﺑﺎ ﱠأﻻ ﻳﻮﺟﺪ ﺑﻌﺾ اﻷﻓﻜﺎر اﻟﻌﻤﻴﻘﺔ املﻨﺎﻗﻀﺔ ﻟﻠﺒﺪﻳﻬﺔ ﰲ
اﻹﺣﺼﺎء ﺑﻌﺪ أﻛﺜﺮ ﻣﻦ ﻗﺮ ﻣﻦ اﻟﺘﻄﻮر .ﺗﺘﻤﺜﻞ إﺣﺪ ﻫﺬ اﻷﻓﻜﺎر ﻓﻴﻤﺎ ﻳﻌﺮ ﺑﺎﺳﻢ
»ﻣﻐﺎﻟﻄﺔ املﺪﻋﻲ« ،ﺗﺼﻒ اﻟﺨﻠﻂ ﺑني اﺣﺘﻤﺎ أ ﺷﻴﺌﺎ ﻣﺎ ﺳﻮ ﻳﻜﻮ ﺻﺤﻴﺤﺎ )ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎ ،املﺘﻬﻢ ﻣﺬﻧﺐ( إذا ﻛﺎ ﻟﺪﻳﻚ ﺑﻌﺾ اﻷدﻟﺔ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻗﻔﺎزات املﺪﻋﻰ
ﻋﻠﻴﻪ ﰲ ﻣﴪح اﻟﺠﺮﻳﻤﺔ( ،ﻣﻊ اﺣﺘﻤﺎ اﻟﻌﺜﻮر ﻋﲆ ﻫﺬا اﻟﺪﻟﻴﻞ إذا ﻛﻨﺖ ﺗﻔﱰض أ املﺘﻬﻢ
ﻣﺬﻧﺐ .ﻫﺬا ﺧﻠﻂ ﺷﺎﺋﻊ — ﻟﻴﺲ ﰲ املﺤﺎﻛﻢ ﻓﺤﺴﺐ — ﺳﻮ ﻧﺘﻨﺎ ﻟﻪ ﻋﲆ ﻧﺤﻮ أ ﺛﻖ ﰲ
ﻗﺖ ﻻﺣﻖ.
إذا ﻛﺎ ﻫﻨﺎ ﺷﻚ ﻋﺪ ﺛﻘﺔ ﰲ اﻹﺣﺼﺎﺋﻴﺎت ،ﻓﻤﻦ اﻟﻮاﺿﺢ أ اﻟﻠﻮ ﻻ ﻳﻘﻊ ﻋﲆ
اﻹﺣﺼﺎﺋﻴﺎت أ ﻛﻴﻔﻴﺔ ﺣﺴﺎﺑﻬﺎ ،إﻧﻤﺎ ﻳﻘﻊ ﻋﲆ ﻃﺮﻳﻘﺔ اﺳﺘﺨﺪا ﺗﻠﻚ اﻹﺣﺼﺎﺋﻴﺎت .ﻟﻴﺲ
ﻣﻦ اﻟﻌﺪ إ ْﻟﻘﺎء اﻟﻠﻮ ﻋﲆ اﻟﻌﻠﻢ ،أ اﻹﺣﺼﺎﺋﻲ اﻟﺬ ﻳﺴﺘﺨﺮج املﻌﻨﻰ ﻣﻦ اﻟﺒﻴﺎﻧﺎت؛ ﺑﻞ إ
اﻟﻠﻮ ﻳﻘﻊ ﻋﲆ أ ﻟﺌﻚ اﻟﺬﻳﻦ ﻻ ﻳﻔﻬﻤﻮ ﻣﺎ ﺗﻘﻮﻟﻪ اﻷرﻗﺎ ،أ اﻟﺬﻳﻦ ﻳﺘﻌﻤﱠ ﺪ إﺳﺎءة اﺳﺘﺨﺪا
اﻟﻨﺘﺎﺋﺞ؛ ﻓﻨﺤﻦ ﻻ ﻧﻠﻮ اﻟﺒﻨﺪﻗﻴﺔ ﻋﲆ ﻗﺘْﻞ أﺣﺪﻫﻢ ،ﺑﻞ اﻟﺸﺨﺺ اﻟﺬ أﻃﻠﻖ اﻟﺮﺻﺎص ﻣﻦ
اﻟﺒﻨﺪﻗﻴﺔ ﻫﻮ املﻠﻮ .
) (4اﻟﺒﻴﺎﻧﺎت
رأﻳﻨﺎ أ اﻟﺒﻴﺎﻧﺎت ﻫﻲ املﺎدة اﻟﺨﺎ اﻟﺘﻲ ﺑﻨﻲ ﻋﻠﻴﻬﺎ اﻹﺣﺼﺎء ،ﻛﺬﻟﻚ ﻫﻲ املﺎدة اﻟﺨﺎ اﻟﺘﻲ
ﺗﺤﺴﺐ ﻣﻨﻬﺎ اﻹﺣﺼﺎﺋﻴﺎت اﻟﻔﺮدﻳﺔ ﻧﻔﺴﻬﺎ ،أ ﻫﺬ اﻟﺒﻴﺎﻧﺎت ﻋﺎدة ﻣﺎ ﺗﻜﻮ أرﻗﺎﻣﺎ .ﻣﻊ
ذﻟﻚ ،ﻓﺈ اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﻮاﻗﻊ أﻛﺜﺮ ﻣﻦ ﻣﺠﺮد أرﻗﺎ .ﻟﻜﻲ ﺗﻜﻮ ﻣﻔﻴﺪة — أ ْ ﺗﻤ ﱢﻜﻨﻨﺎ ﻣﻦ
اﻟﻘﻴﺎ ﺑﺒﻌﺾ اﻟﺘﺤﻠﻴﻼت اﻹﺣﺼﺎﺋﻴﺔ ذات املﻐﺰ — ﻳﺠﺐ أ ﺗﺮﺗﺒﻂ ﻫﺬ اﻷرﻗﺎ ﺑﻤﻌﻨﻰ؛
ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ ﻣﻌﺮﻓﺔ ﻣﺎ »ﺗﻘﻴﺴﻪ« اﻟﻘﻴﺎﺳﺎت ،ﻣﺎ ﺗﻢ ﻋ ﱡﺪ ﻋﻨﺪﻣﺎ ﻳﻌﺮض
ﻋﻠﻴﻨﺎ ﺗﻌﺪاد .ﻟﺘﺤﻘﻴﻖ ﻧﺘﺎﺋﺞ ﺻﺤﻴﺤﺔ دﻗﻴﻘﺔ ﻋﻨﺪﻣﺎ ﻧﻘﻮ ﺑﺘﻨﻔﻴﺬ ﺗﺤﻠﻴﻞ إﺣﺼﺎﺋﻲ ،ﻧﺤﺘﺎج
أﻳﻀﺎ أ ﻧﻌﺮ ﺷﻴﺌﺎ ﻋﻦ ﻛﻴﻔﻴﺔ اﻟﺤﺼﻮ ﻋﲆ ﻫﺬ اﻟﻘﻴﻢ .ﻫﻞ أﺟﺎب ﺟﻤﻴﻊ ﻣﻦ ﺳﺄﻟﻨﺎﻫﻢ
15
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻋﲆ اﻻﺳﺘﺒﻴﺎ ،أ أﺟﺎب ﺑﻌﺾ اﻷﺷﺨﺎص ﻓﺤﺴﺐ؟ إذا أﺟﺎب ﺑﻌﺾ اﻷﺷﺨﺎص ﻓﺤﺴﺐ،
ﻓﻬﻞ ﻫﻢ ﻳﻤﺜﱢﻠﻮ املﺠﻤﻮﻋﺔ اﻟﺘﻲ ﻧﻮ ﱡد أ ﻧﺪﱄ ﺑﺒﻴﺎ ﺣﻮﻟﻬﺎ ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ أ إ اﻟﻌﻴﻨﺔ
ﻣﺸﻮﱠﻫﺔ ﺑﻄﺮﻳﻘﺔ ﻣﺎ؟ ﻫﻞ ،ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺗﺴﺘﺒﻌﺪ ﻋﻴﱢﻨﺘﻨﺎ اﻟﺸﺒﺎب ﻋﲆ ﻧﺤﻮ ﻏري ﻣﺘﻜﺎﻓﺊ؟
ﺑﺎملﺜﻞ ،ﻓﺈﻧﻨﺎ ﺑﺤﺎﺟﺔ إﱃ ﻣﻌﺮﻓﺔ ﻣﺎ إذا اﻧﺴﺤﺐ ﻣﺮﴇ ﻣﻦ اﻟﺘﺠﺎرب اﻟﴪﻳﺮﻳﺔ ،ﻣﺎ إذا
ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت ﻣﺤﺪﱠﺛﺔ أ ﻻ .ﻧﺤﺘﺎج إﱃ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎﻧﺖ أداة اﻟﻘﻴﺎس ﻣﻮﺛﻮﻗﺎ ﺑﻬﺎ
أ ﻻ ،أ ﻫﻞ ﻛﺎﻧﺖ ﻟﺪﻳﻬﺎ ﻗﻴﻤﺔ ﻗﺼﻮ ﺗﺴﺠﱠ ﻞ ﻋﻨﺪﻣﺎ ﺗﻜﻮ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻣﺮﺗﻔﻌﺔ ﻋﲆ
ﻧﺤﻮ ﻣﻔﺮط .ﻫﻞ ﻟﻨﺎ أ ﻧﻔﱰض أ ﻣﻌﺪ اﻟﻨﺒﺾ اﻟﺬ ﺳﺠﱠ ﻠﺘْﻪ املﻤﺮﺿﺔ دﻗﻴﻖ أ إﻧﻪ ﻗﻴﻤﺔ
ﺗﻘﺮﻳﺒﻴﺔ ﻓﺤﺴﺐ؟ ﺛﻤﺔ ﻋﺪد ﻻ ﺣﴫ ﻟﻪ ﻣﻦ ﻣﺜﻞ ﻫﺬ اﻷﺳﺌﻠﺔ ﻳﻤﻜﻦ ﻃﺮﺣﻪ ،ﻧﺤﺘﺎج إﱃ
أ ﻧﻜﻮ ﻣﺘﻨﺒﱢﻬني ﻟﺘﻠﻚ اﻷﺳﺌﻠﺔ اﻟﺘﻲ ﻳﻤﻜﻦ أ ﺗﺆﺛﱢﺮ ﻋﲆ اﻟﻨﺘﺎﺋﺞ اﻟﺘﻲ ﻧﺴﺘﺨﻠﺼﻬﺎ .إذا ﻟﻢ
ﻧﻔﻌﻞ ذﻟﻚ ،ﻓﺴﺘﺼﺒﺢ اﻟﺸﻜﻮ ﻣﻦ اﻟﻨﻮع املﺬﻛﻮر آﻧﻔﺎ ﻣﴩ ﻋﺔ ﺗﻤﺎﻣﺎ.
ﺗﺘﻤﺜﱠﻞ إﺣﺪ ﻃﺮ اﻟﻨﻈﺮ إﱃ اﻟﺒﻴﺎﻧﺎت ﰲ اﻋﺘﺒﺎرﻫﺎ »أدﻟﺔ«؛ ﻓﺒﺪ ﺑﻴﺎﻧﺎت ،ﺗﺼﺒﺢ
ﺗﻮﻓﺮ اﻟﺒﻴﺎﻧﺎت ﻣﻌﺮﻓﺔ أﺳﺎﺳﻴﺔ ﺗﺮﺑﻂ ﱢ أﻓﻜﺎرﻧﺎ ﻧﻈﺮﻳﺎﺗﻨﺎ ﺣﻴﺎ اﻟﻌﺎﻟﻢ ﻣﺤﺾ ﺗﻜﻬﻨﺎت.
أﻓﻜﺎرﻧﺎ ﻧﻈﺮﻳﺎﺗﻨﺎ ﺑﺎﻟﻮاﻗﻊ ،ﺗﺴﻤﺢ ﻟﻨﺎ ﺑﺎﻟﺘﺤﻘﻖ ﻣﻦ ﺻﺤﺔ ﻓﻬﻤﻨﺎ اﺧﺘﺒﺎر .ﺑﻌﺪ ذﻟﻚ
ﺗﺴﺘﺨﺪ اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ ملﻘﺎرﻧﺔ اﻟﺒﻴﺎﻧﺎت ﻣﻊ أﻓﻜﺎرﻧﺎ ﻧﻈﺮﻳﺎﺗﻨﺎ ،ﻟﻨﺮ ﻣﺪ ﺗﻮاﻓﻖ
ﺑﻌﻀﻬﺎ ﻣﻊ ﺑﻌﺾ .ﺳﻮء اﻟﺘﻮاﻓﻖ ﻳﺪﻓﻌﻨﺎ إﱃ اﻟﺘﻔﻜري ﻣﺮة أﺧﺮ إﻋﺎدة ﺗﻘﻴﻴﻢ أﻓﻜﺎرﻧﺎ
إﻋﺎدة ﺻﻴﺎﻏﺘﻬﺎ ﻟﻜﻲ ﺗﺘﻄﺎﺑﻖ ﻋﲆ ﻧﺤﻮ أﻓﻀﻞ ﻣﻊ اﻟﻮاﻗﻊ املﺮﺻﻮد .ﻟﻜﻦ رﺑﻤﺎ ﻳﺠﺪر ﺿﻊ
ﻣﻼﺣﻈﺔ ﺗﺤﺬﻳﺮﻳﺔ ﻫﻨﺎ؛ ﻫﻲ أ ﺳﻮء اﻟﺘﻮاﻓﻖ ﻳﻤﻜﻦ أﻳﻀﺎ أ ﻳﻜﻮ ﻧﺎﺗﺠﺎ ﻋﻦ ﺳﻮء ﺟﻮدة
اﻟﺒﻴﺎﻧﺎت .ﻳﺠﺐ أ ﻧﻜﻮ ﻣﻨﺘﺒﻬني ﻟﻬﺬا اﻻﺣﺘﻤﺎ ؛ ﻓﺮﺑﻤﺎ ﺗﻜﻮ ﻧﻈﺮﻳﺎﺗﻨﺎ ﺳﻠﻴﻤﺔ ﻟﻜﻦ ﻗﺪ
ﺗﻜﻮ أد ات اﻟﻘﻴﺎس ﻣﻌﻴﺒﺔ ﺑﻄﺮﻳﻘﺔ ﻣﺎ .ﻣﻊ ذﻟﻚ ،ﻓﺎﻟﺘﻄﺎﺑﻖ اﻟﺠﻴﺪ ﺑني اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة
ﻣﺎ ﺗﻘﻮﻟﻪ ﻧﻈﺮﻳﺎﺗﻨﺎ ﻋﻤﱠ ﺎ ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ ﻋﻠﻴﻪ اﻟﺒﻴﺎﻧﺎت ﻳﺆﻛﺪ ﻋﻤﻮﻣﺎ ﻋﲆ أﻧﻨﺎ ﻋﲆ اﻟﻄﺮﻳﻖ
ﺣﻘﺎ ﺣﻘﻴﻘﺔ ﻣﺎ ﻳﺠﺮ .اﻟﺼﺤﻴﺢ .ذﻟﻚ ﻳﺆﻛﺪ ﻋﲆ أ أﻓﻜﺎرﻧﺎ ﺗﻌﻜﺲ ٍّ
ﻳﺴﺘﺘﺒﻊ ذﻟﻚ ﺿﻤﻨﺎ أﻧﻪ ﻟﻜﻲ ﺗﻜﻮ أﻓﻜﺎرﻧﺎ ﻧﻈﺮﻳﺎﺗﻨﺎ ذات ﻣﻐﺰ ،ﻳﺠﺐ أ ﺗﺴﻔﺮ ﻋﻦ
ﺗﻮﻗﻌﺎت ﻳﻤﻜﻦ ﻣﻘﺎرﻧﺘﻬﺎ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﻮﺟﻮدة ﻟﺪﻳﻨﺎ .ﻓﺈذا ﻟﻢ ﺗﺨﱪﻧﺎ اﻟﻨﻈﺮﻳﺎت ﺑﻤﺎ ﻳﻨﺒﻐﻲ
أ ﻧﺘﻮﻗﻊ ﻣﻼﺣﻈﺘﻪ ،أ إذا ﻛﺎﻧﺖ اﻟﺘﻮﻗﻌﺎت ﻋﺎﻣﺔ ﻟﻠﻐﺎﻳﺔ ﺑﺤﻴﺚ إ أ ﺑﻴﺎﻧﺎت ﺳﻮ ﺗﺘﻮاﻓﻖ
ﻣﻊ ﻧﻈﺮﻳﺎﺗﻨﺎ ،ﻓﺈﻧﻬﺎ ﻟﻦ ﺗﻜﻮ ذات ﻓﺎﺋﺪة ﻛﺒرية؛ ﻓﺄ ﺑﻴﺎﻧﺎت ﺳﺘﺘﻮاﻓﻖ ﻣﻌﻬﺎ .ﻗﺪ اﻧﺘﻘﺪ
اﻟﺘﺤﻠﻴﻞ اﻟﻨﻔﴘ اﻟﺘﻨﺠﻴﻢ ﻋﲆ ﻫﺬ اﻷﺳﺲ.
ﱠ
املﻌﻘﺪ؛ ﺑﺎﺗﺨﺎذ ﻗﺮارات ﺣﻮ ﻛﻤﺎ ﺗﺴﻤﺢ اﻟﺒﻴﺎﻧﺎت ﻟﻨﺎ ﺑﺘﺤﺴﺲ ﻃﺮﻳﻘﻨﺎ ﻋﱪ اﻟﻌﺎﻟﻢ
أﻓﻀﻞ اﻹﺟﺮاءات اﻟﺘﻲ ﻳﺠﺐ اﻟﻘﻴﺎ ﺑﻬﺎ؛ ﻓﻨﺤﻦ ﻧﺄﺧﺬ ﻗﻴﺎﺳﺎﺗﻨﺎ ،ﻧﺤﺴﺐ املﺠﺎﻣﻴﻊ اﻟﻜﻠﻴﺔ،
16
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
17
ﻋﻠﻢ اﻹﺣﺼﺎء
رأ ْﻫﺎ ﻓﺮﻋﺎ ﻣﻦ اﻟﺮﻳﺎﺿﻴﺎت )إﻧﻬﺎ ﺗﺘﻌﺎﻣﻞ ﻣﻊ اﻷرﻗﺎ ،أﻟﻴﺲ ﻛﺬﻟﻚ؟( ﺑﺎﻟﻔﻌﻞ ،ﻻ ﻳﺰا
اﻹﺣﺼﺎﺋﻴﻮ ﰲ اﻟﺠﺎﻣﻌﺔ ﻏﺎﻟﺒﺎ ﻣﺎ ﻳﺪرﺳﻮ اﻹﺣﺼﺎء داﺧﻞ أﻗﺴﺎ اﻟﺮﻳﺎﺿﻴﺎت .ﺷﻬﺪ اﻟﻨﺼﻒ
اﻟﺜﺎﻧﻲ ﻣﻦ اﻟﻘﺮ اﻟﻌﴩﻳﻦ ﻇﻬﻮر اﻟﻜﻤﺒﻴﻮﺗﺮ ،ﻛﺎ ﻫﺬا اﻟﺘﻐﻴري ﻫﻮ اﻟﺬ ارﺗﻘﻰ ﺑﺎﻹﺣﺼﺎء
ﻣﻦ ﻛﻮﻧﻬﺎ ﻋﻤﻼ ﺻﻌﺒﺎ إﱃ ﻋﻤﻞ ﻣﻤْ ﺘﻊ؛ ﻓﻘﺪ أزا اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﺤﺎﺟﺔ ﻻﻣﺘﻼ ﻣﻤﺎرﳼ اﻹﺣﺼﺎء
ملﻬﺎرات ﺣﺴﺎﺑﻴﺔ ﺧﺎﺻﺔ ،ﻓﻠﻢ ﻳﻌﻮد ا ﺑﺤﺎﺟﺔ ﻟﻘﻀﺎء ﺳﺎﻋﺎت ﻃﻮﻳﻠﺔ ﰲ ﻣﻌﺎﻟﺠﺔ اﻷرﻗﺎ .
ﻫﺬا ﻣﻤﺎﺛﻞ ﻟﻠﺘﻐﻴري ﻣﻦ اﻟﺤﺎﺟﺔ إﱃ املﴚ إﱃ ﻛﻞ ﻣﻜﺎ ﻟﻠﻘﺪرة ﻋﲆ ﻗﻴﺎدة اﻟﺴﻴﺎرة؛ ﻓﺎﻟﺮﺣﻼت
اﻟﺘﻲ ﻛﺎﻧﺖ ﺗﺴﺘﻐﺮ ﰲ اﻟﺴﺎﺑﻖ أﻳﺎﻣﺎ أﺻﺒﺤﺖ اﻵ ﺗﺴﺘﻐﺮ دﻗﺎﺋﻖ ،اﻟﺮﺣﻼت اﻟﺘﻲ ﻛﺎﻧﺖ
ﻃﻮﻳﻠﺔ ﻟﻠﻐﺎﻳﺔ ﻟﺪرﺟﺔ ﺗﻤﻨﻊ اﻟﺘﻔﻜري ﻓﻴﻬﺎ أﺻﺒﺤﺖ اﻵ ﻣﻤﻜﻨﺔ.
ﺷﻬﺪ اﻟﻨﺼﻒ اﻟﺜﺎﻧﻲ ﻣﻦ اﻟﻘﺮ اﻟﻌﴩﻳﻦ أﻳﻀﺎ ﻇﻬﻮر ﻣﺪارس أﺧﺮ ﻟﺘﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت،
ﻟﻜﻦ ملﺠﺎﻻت أﺧﺮ ،ﺧﺎﺻﺔ ﻋﻠﻮ اﻟﻜﻤﺒﻴﻮﺗﺮ. ْ ﻻ ﺗﻌﻮد أﺻﻮﻟﻬﺎ ﻟﻌﻠﻢ اﻹﺣﺼﺎء اﻟﻜﻼﺳﻴﻜﻲ
ﺗﺸﻤﻞ ﻫﺬ املﺪارس اﻟﺘﻌﻠﻢ اﻵﱄ اﻟﺘﻌﺮ ﻋﲆ اﻷﻧﻤﺎط اﻟﺘﻨﻘﻴﺐ ﻋﻦ اﻟﺒﻴﺎﻧﺎت .ﺑﻴﻨﻤﺎ
ﺗﻄﻮرت ﻫﺬ اﻟﺘﺨﺼﺼﺎت اﻷﺧﺮ ،ﻛﺎﻧﺖ ﺗﺤﺪث ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ﺗﻮﺗﺮات ﺑني ﻫﺬ املﺪارس
املﺨﺘﻠﻔﺔ اﻹﺣﺼﺎء .ﻣﻊ ذﻟﻚ ،ﻓﺎﻟﺤﻘﻴﻘﺔ ﻫﻲ أ ﺟﻬﺎت اﻟﻨﻈﺮ املﺘﻔﺎ ﺗﺔ اﻟﺘﻲ ﺗﻘﺪﱢﻣﻬﺎ ﻫﺬ
املﺪارس املﺨﺘﻠﻔﺔ ﺳﺎﻫﻤﺖ ﺟﻤﻴﻌﻬﺎ ﺑﴚء ﰲ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ،إﱃ ﺣ ﱢﺪ أ اﻹﺣﺼﺎﺋﻴني اﻟﺠﺪد
ﺗﻮﻓﺮﻫﺎ ﺟﻤﻴﻊ ﻫﺬ املﺠﺎﻻت .ﺳﺄذﻛﺮ ﰲ اﻟﻮﻗﺖ اﻟﺤﺎﱄ ﻳﺨﺘﺎر ﺑﺤﺮﻳﺔ ﻣﻦ اﻷد ات اﻟﺘﻲ ﱢ
ﺑﻌﺾ ﻫﺬ اﻷد ات ﰲ ﻗﺖ ﻻﺣﻖ .ﺑﻮﺿﻊ ﻫﺬا ﰲ اﻻﻋﺘﺒﺎر ،ﺳﻮ أﺗﺒﻨﱠﻰ ﰲ ﻫﺬا اﻟﻜﺘﺎب
ﺗﻌﺮﻳﻔﺎ اﺳﻌﺎ ﻟﻺﺣﺼﺎء ،ﻣﻬﺘﺪﻳﺎ ﺑﺘﻌﺮﻳﻒ »ﻋﻠﻢ اﻹﺣﺼﺎء اﻷﻋﻈﻢ« اﻟﺬ ﻗﺪﱠﻣﻪ اﻹﺣﺼﺎﺋﻲ
اﻟﺒﺎرز ﺟﻮ ﺗﺸﺎﻣﱪز ،اﻟﺬ ﻗﺎ » :ﻳﻤﻜﻦ ﺗﻌﺮﻳﻒ ﻋﻠﻢ اﻹﺣﺼﺎء اﻷﻋﻈﻢ ﺑﺒﺴﺎﻃﺔ — إ ْ
ﻛﺎ ﻋﲆ ﻧﺤﻮ ﻏري ﻣﺤﻜﻢ — ﺑﺄﻧﻪ ﻛﻞ ﻣﺎ ﻳﺘﻌﻠﻖ »ﺑﺎﻟﺘﻌﻠﻢ ﻣﻦ اﻟﺒﻴﺎﻧﺎت« ،ﻣﻦ اﻟﺘﺨﻄﻴﻂ أ
ﺿﻊ ﺣﺪ د ﺑني ﺗﺨﺼﺼﺎت اﻟﺠﻤﻊ اﻷ ﺣﺘﻰ اﻟﻌﺮض أ اﻟﺘﻘﺮﻳﺮ اﻷﺧري «.أﻣﺎ ﻣﺤﺎ ﻟﺔ ْ
ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت املﺨﺘﻠﻔﺔ ،ﻓﻬﻲ ﻋﻤﻠﻴﺔ ﻏري ﻣﺠﺪﻳﺔ ﻻ ﻃﺎﺋﻞ ﻣﻦ راﺋﻬﺎ.
إذ ،ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ﻻ ﻳﺪ ر ﺣﻮ اﻟﺤﺴﺎب ،إﻧﻤﺎ ﻳﺪ ر ﺣﻮ »اﻻﺳﺘﻘﺼﺎء«،
ﺑﻞ إ اﻟﺒﻌﺾ ﺻﻒ ﻋﻠﻢ اﻹﺣﺼﺎء ﺑﺄﻧﻪ »ﺗﻄﺒﻴﻖ اﻷﺳﻠﻮب اﻟﻌﻠﻤﻲ« .ﻣﻊ أﻧﻨﺎ ﻣﺎ زﻟﻨﺎ ﻧﺠﺪ
ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎ أ اﻟﻌﺪﻳﺪ ﻣﻦ اﻹﺣﺼﺎﺋﻴني ﻳﻌﻤﻠﻮ اﻧﻄﻼﻗﺎ ﻣﻦ أﻗﺴﺎ اﻟﺮﻳﺎﺿﻴﺎت ﰲ
اﻟﺠﺎﻣﻌﺎت ﻛﻤﺎ أﴍت آﻧﻔﺎ ،ﻓﺈﻧﻨﺎ ﻧﺠﺪﻫﻢ أﻳﻀﺎ ﰲ ﻛﻠﻴﺎت اﻟﻄﺐ أﻗﺴﺎ اﻟﻌﻠﻮ اﻻﺟﺘﻤﺎﻋﻴﺔ،
ﺑﻤﺎ ﰲ ذﻟﻚ اﻻﻗﺘﺼﺎد اﻟﻌﺪﻳﺪ ﻣﻦ اﻷﻗﺴﺎ اﻷﺧﺮ اﻟﺘﻲ ﺗﱰا ح ﺑني اﻟﻬﻨﺪﺳﺔ إﱃ ﻋﻠﻢ اﻟﻨﻔﺲ.
ﰲ ﺧﺎرج اﻟﺠﺎﻣﻌﺎت ،ﺗﻌﻤﻞ أﻋﺪاد ﻛﺒرية ﰲ اﻟﺤﻜﻮﻣﺔ اﻟﺼﻨﺎﻋﺔ ،ﰲ اﻟﻘﻄﺎع اﻟﺪ اﺋﻲ،
اﻟﺘﺴﻮﻳﻖ ،اﻻﺗﺼﺎﻻت ،اﻟﺨﺪﻣﺎت املﴫﻓﻴﺔ ،ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ املﺠﺎﻻت اﻷﺧﺮ ،ﻓﺠﻤﻴﻊ
18
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
»اﻟﱪﻳﺪ املﺰﻋﺞ« ﻫﻮ ﻣﺼﻄﻠﺢ ﻳﺴﺘﺨﺪ ﻟﻮﺻﻒ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰ ﻧﻲ ﻏري املﺮﻏﻮب ﻓﻴﻬﺎ
املﺮﺳﻠﺔ ﺗﻠﻘﺎﺋﻴٍّﺎ إﱃ اﻟﻌﺪﻳﺪ ﻣﻦ املﺘﺴ ﱢﻠﻤني؛ ﻋﺎدة ﻣﺎ ﻳﺼﻞ ﻋﺪدﻫﻢ إﱃ ﻣﻼﻳني املﺘﺴ ﱢﻠﻤني .ﻫﺬ
اﻟﺮﺳﺎﺋﻞ رﺳﺎﺋﻞ دﻋﺎﺋﻴﺔ ،ﻏﺎﻟﺒﺎ ﻣﺎ ﺗﻜﻮ ﻣﺰﻋﺠﺔ ،رﺑﻤﺎ ﺗﻜﻮ اﺟﻬﺎت ملﺤﺘﺎﻟني .ﻫﻲ
ﺗﺸﻤﻞ أﺷﻴﺎء ﻣﺜﻞ ﻋﺮ ض دﻣﺞ اﻟﺪﻳﻮ ،ﺧﻄﻂ اﻟﺜﺮاء اﻟﴪﻳﻊ ،اﻷد ﻳﺔ اﻟﺘﻲ ﻻ ﺗﴫ إﻻ
ﺑﻮﺻﻔﺔ ﻃﺒﻴﺔ ،ﻧﺼﺎﺋﺢ ﺣﻮ ﺳﻮ اﻷﺳﻬﻢ ،أد ات ﺟﻨﺴﻴﺔ ﻏﺮﻳﺒﺔ .املﺒﺪأ اﻷﺳﺎﳼ ﰲ ﻫﺬ
اﻟﺮﺳﺎﺋﻞ ﻫﻮ أﻧﻪ إذا راﺳﻠﺖ ﻋﺪدا ﻛﺎﻓﻴﺎ ﻣﻦ اﻟﻨﺎس ،ﻣﻦ املﺤﺘﻤﻞ أ ﻳﺼﺒﺢ ﺑﻌﻀﻬﻢ ﻣﻬﺘﻤٍّ ﺎ
— أ ﻳﻨﺨﺪع — ﺑﻌﺮﺿﻚ .ﻣﺎ ﻟﻢ ﺗﻜﻦ اﻟﺮﺳﺎﺋﻞ آﺗﻴﺔ ﻣﻦ ﻣﻨﻈﻤﺎت ﻃﻠﺐ ﻣﻨﻬﺎ ﻋﲆ ﺟﻪ
اﻟﺘﺤﺪﻳﺪ ﻣﻌﻠﻮﻣﺎت ،ﻓﺈ ﻣﻌﻈﻤﻬﺎ ﻟﻦ ﻳﻜﻮ ﻣﺜريا ﻟﻼﻫﺘﻤﺎ ،ﻟﻦ ﻳﺮﻏﺐ أﺣﺪ ﰲ ﺗﻀﻴﻴﻊ ﻗﺘﻪ
ﰲ ﻗﺮاءﺗﻬﺎ ﺣﺬﻓﻬﺎ .ﻫﻮ ﻣﺎ ﻳﻘﻮدﻧﺎ إﱃ ﻣﺮﺷﺤﺎت اﻟﱪﻳﺪ املﺰﻋﺞ؛ ﻫﻲ ﺑﺮاﻣﺞ ﺣﺎﺳﻮﺑﻴﺔ
ﺗﻔﺤﺺ ﺗﻠﻘﺎﺋﻴٍّﺎ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰ ﻧﻲ اﻟﻮاردة ﺗﺤﺪد اﻟﺮﺳﺎﺋﻞ اﻟﺘﻲ ﻣﻦ املﺤﺘﻤﻞ أ
ﺗﻜﻮ ﻏري ﻣﺮﻏﻮب ﻓﻴﻬﺎ .ﻳﻤﻜﻦ ﺑﺮﻣﺠﺔ املﺮﺷﺤﺎت ﺑﺤﻴﺚ ﻳﺤﺬ اﻟﱪﻧﺎﻣﺞ اﻟﺮﺳﺎﺋﻞ ﻏري
املﺮﻏﻮب ﻓﻴﻬﺎ ﺗﻠﻘﺎﺋﻴٍّﺎ ،أ ﻳﺮﺳﻠﻬﺎ إﱃ ﻣﺠﻠﺪ ﺗﺨﺰﻳﻦ ﻟﻠﻔﺤﺺ ﻻﺣﻘﺎ ،أ ﻳﺘﺨﺬ ﺑﻌﺾ اﻹﺟﺮاءات
19
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻷﺧﺮ املﻨﺎﺳﺒﺔ .ﺗﻮﺟﺪ ﺗﻘﺪﻳﺮات ﻣﺨﺘﻠﻔﺔ ﻟﻜﻤﻴﺔ اﻟﱪﻳﺪ املﺰﻋﺞ اﻟﺘﻲ ﺗﺮﺳﻞ ،ﻟﻜﻦ ﰲ ﻗﺖ
ﻛﺘﺎﺑﺔ ﻫﺬا اﻟﻜﺘﺎب ،ﻳﺸري أﺣﺪ اﻟﺘﻘﺪﻳﺮات إﱃ أﻧﻪ ﺗﺮﺳﻞ أﻛﺜﺮ ﻣﻦ ٩٠ﻣﻠﻴﺎر رﺳﺎﻟﺔ ﻣﻦ اﻟﱪﻳﺪ
ﻏري املﺮﻏﻮب ﻓﻴﻪ ﻛﻞ ﻳﻮ ؛ ﺑﻤﺎ أ ﻫﺬا اﻟﻌﺪد ﻳﺮﺗﻔﻊ ارﺗﻔﺎﻋﺎ ﻛﺒريا ﻛﻞ ﺷﻬﺮ ،ﻓﻤﻦ املﺮﺟﺢ
أ ﻳﻜﻮ أﻛﱪ ﺑﻜﺜري ﰲ ﻗﺖ ﻗﺮاءﺗﻚ ﻟﻬﺬا اﻟﻜﺘﺎب.
ﺛﻤﺔ ﺗﻘﻨﻴﺎت ﻋﺪﻳﺪة ملﻨﻊ اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ .ﺗﺘﺤﻘﻖ ﺑﻌﺾ اﻟﻄﺮ اﻟﺒﺴﻴﻄﺔ ﻟﻠﻐﺎﻳﺔ
ﻓﺤﺴﺐ ﻣﻦ ﺟﻮد ﻛﻠﻤﺎت أﺳﺎﺳﻴﺔ ﰲ اﻟﺮﺳﺎﻟﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا ﻛﺎﻧﺖ رﺳﺎﻟﺔ ﺗﺘﻀﻤﻦ
ﻛﻠﻤﺔ » viagraﻓﻴﺎﺟﺮا« ،رﺑﻤﺎ ﺗﺤﻈﺮ .ﻣﻊ ذﻟﻚ ،ﻓﺈ إﺣﺪ ﺧﺼﺎﺋﺺ رﺻﺪ اﻟﱪﻳﺪ املﺰﻋﺞ
ﻫﻲ أﻧﻬﺎ ﺗﺸﺒﻪ ﺳﺒﺎ اﻟﺘﺴﻠﺢ؛ ﻓﺒﻤﺠﺮد أ ﻳﺪر املﺴﺌﻮﻟﻮ ﻋﻦ اﻟﺮﺳﺎﺋﻞ أ رﺳﺎﺋﻠﻬﻢ ﺣﻈﺮت
ﺑﻄﺮﻳﻘﺔ ﻣﻌﻴﻨﺔ ،ﻳﺴﻌ ْﻮ إﱃ أﺳﺎﻟﻴﺐ ﻟﻼﻟﺘﻔﺎ ﺣﻮ ﻫﺬ اﻟﻄﺮﻳﻘﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ
ﻳﺘﻌﻤﺪ ﻛﺘﺎﺑﺔ viagraﻋﲆ ﻧﺤﻮ ﺧﺎﻃﺊ ﰲ ﺻﻮرة v1agraأ v-iagra؛ ﺑﺤﻴﺚ ﻳﻤﻜﻨﻚ
اﻟﺘﻌﺮ ﻋﻠﻴﻬﺎ ﻟﻜﻦ د أ ﻳﺘﻤﻜﻦ اﻟﱪﻧﺎﻣﺞ اﻟﺘﻠﻘﺎﺋﻲ ﻣﻦ اﻟﺘﻌﺮ ﻋﻠﻴﻬﺎ.
ﺗﺴﺘﻨﺪ أد ات رﺻﺪ اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ اﻷﻛﺜﺮ ﺗﻄﻮرا ﻋﲆ ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ
ﻟﻠﻤﺤﺘﻮ اﻟﻜﻼﻣﻲ ﻟﺮﺳﺎﺋﻞ اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﺗﺴﺘﺨﺪ
ﺗﻘﺪﻳﺮات ﻻﺣﺘﻤﺎﻻت ﺟﻮد ﻛﻠﻤﺎت ﻣﻌﻴﻨﺔ أ ﻣﺠﻤﻮﻋﺎت ﻣﻦ اﻟﻜﻠﻤﺎت اﻟﺘﻲ ﺗﻈﻬﺮ ﰲ رﺳﺎﺋﻞ
اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ .ﺑﻌﺪ ذﻟﻚ ،ﺗﺼﺒﺢ اﻟﺮﺳﺎﻟﺔ اﻟﺘﻲ ﺗﺤﺘﻮ ﻋﲆ اﻟﻜﺜري ﻣﻦ اﻟﻜﻠﻤﺎت
اﻟﻌﺎﻟﻴﺔ اﻻﺣﺘﻤﺎ ﻣﻮﺿﻊ ﺷ ﱟﻚ .ﺗﺒﻨﻲ اﻷد ات اﻷﻛﺜﺮ ﺗﻄﻮرا ﻧﻤﺎذج ﻻﺣﺘﻤﺎﻟﻴﺔ أ ﻛﻠﻤﺔ اﺣﺪة
ﺳﺘﺘﺒﻊ ﻛﻠﻤﺔ أﺧﺮ ﰲ ﺗﺴﻠﺴﻞ؛ ﻣﻦ ﺛ ﱠﻢ ﺗﺘﻤﻜﻦ ﻣﻦ رﺻﺪ اﻟﻌﺒﺎرات ﻣﺠﻤﻮﻋﺎت اﻟﻜﻠﻤﺎت
املﺸﺒﻮﻫﺔ .ﻋﻼ ة ﻋﲆ ذﻟﻚ ،ﺗﺴﺘﺨﺪ أﺳﺎﻟﻴﺐ أﺧﺮ ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ ﻟﻠﺼﻮر ﻟﺮﺻﺪ أﺷﻴﺎء
ﻣﺜﻞ ﻟﻮ اﻟﺒﴩة ﰲ اﻟﺼﻮرة املﺮﺳﻠﺔ ﻋﱪ اﻟﱪﻳﺪ اﻹﻟﻜﱰ ﻧﻲ.
20
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
21
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻓﺎرﻏﺔ ﺷﺎﺳﻌﺔ .ﻟﻜﻦ ﻛﻴﻒ اﻛﺘﺸﻒ ﻛﻞ ﻫﺬا؟ ﻓﺤﺘﻰ ﻟﻮ اﺳﺘﺨﺪﻣﻨﺎ ﺗﻠﺴﻜﻮﺑﺎت ﻗﻮﻳﺔ ﻟﻠﻨﻈﺮ
ﺧﺎرج اﻷرض ،ﻓﺈﻧﻨﺎ ﻧﺮ ﺑﺒﺴﺎﻃﺔ ﺳﻤﺎء ﻣﻠﻴﺌﺔ ﺑﺎﻟﻨﺠﻮ .اﻟﺠﻮاب ﻫﻮ أ اﺳﺘﻨﺘﺎج ﺟﻮد
ﻫﺬا اﻟﻬﻴﻜﻞ اﻟﻌﻨﻘﻮد — ﺑﻞ اﻛﺘﺸﺎﻓﻪ ﰲ املﻘﺎ اﻷ — ﺗﻄ ﱠﻠﺐ ﺗﻘﻨﻴﺎت إﺣﺼﺎﺋﻴﺔ .ﺗﺸﻤﻞ
إﺣﺪ ﻓﺌﺎت ﻫﺬ اﻟﺘﻘﻨﻴﺎت ﺣﺴﺎب املﺴﺎﻓﺎت ﺑني ﻛﻞ ﻧﺠﻢ ﻋﺪد ﻗﻠﻴﻞ ﻣﻦ اﻟﻨﺠﻮ اﻷﻗﺮب
ﻣﺘﻮﻗﻊ ﺗﻜﻮ اﻗﻌﺔ ﰲﱠ إﻟﻴﻪ .اﻟﻨﺠﻮ اﻟﺘﻲ ﻳﻜﻮ ﻋﺪد اﻟﻨﺠﻮ اﻟﻘﺮﻳﺒﺔ ﻣﻨﻬﺎ أﻛﱪ ﻣﻤﺎ ﻫﻮ
ﻣﻨﺎﻃﻖ ﻛﺜﻴﻔﺔ ﻣﺤﻠﻴٍّﺎ؛ أ إﻧﻬﺎ ﺗﺸ ﱢﻜﻞ ﻋﻨﺎﻗﻴﺪ ﻣﺤﻠﻴﺔ.
ﺑﺎﻟﻄﺒﻊ ،ﻳﺘﻌﻠﻖ اﻷﻣﺮ ﺑﺄﻛﺜﺮ ﻣﻦ ذﻟﻚ ﺑﻜﺜري؛ ﻓﺴﺤﺐ اﻟﻐﺒﺎر ﺑني اﻟﻨﺠﻮ ﺳﺘﺤﺠﺐ
رؤﻳﺔ اﻷﺷﻴﺎء اﻟﺒﻌﻴﺪة ،ﺳﺤﺐ اﻟﻐﺒﺎر ﻫﺬ ﻟﻴﺴﺖ ﻣﻮ ﱠزﻋﺔ ﻋﲆ ﻧﺤﻮ ﻣﻮﺣﱠ ﺪ ﰲ اﻟﻔﻀﺎء.
ﺑﺎملﺜﻞ ،ﻟﻦ ﺗﺮ اﻷﺟﺮا اﻟﺒﺎﻫﺘﺔ ﱠإﻻ إذا ﻛﺎﻧﺖ ﻗﺮﻳﺒﺔ ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻣﻦ اﻷرض .اﻟﺨﻴﻂ
اﻟﺮﻓﻴﻊ ﻣﻦ املﺠﺮات اﻟﺬ ﺗﺮ ﻧﻬﺎﻳﺘﻪ ﻣﻦ اﻷرض ﻳﻤﻜﻦ أ ﻳﺒﺪ ﻛﻌﻨﻘﻮد ﻛﺜﻴﻒ ،ﻫﻜﺬا.
ﻳﻨﺒﻐﻲ ﺗﻄﺒﻴﻖ ﺗﺼﺤﻴﺤﺎت إﺣﺼﺎﺋﻴﺔ ﻣﺘﻄﻮرة ﺣﺘﻰ ﻧﺘﻤﻜﻦ ﻣﻦ ﺗﻤﻴﻴﺰ اﻟﺤﻘﻴﻘﺔ اﻟﻜﺎﻣﻨﺔ
ﻣﻦ اﻟﺘﻮزﻳﻌﺎت اﻟﻈﺎﻫﺮﻳﺔ ﻟﻸﺟﺮا اﻟﺴﻤﺎ ﻳﺔ.
إ ﻓﻬْ ﻢ ﺑﻨﻴﺔ اﻟﻜﻮ ﻳﻠﻘﻲ اﻟﻀﻮء ﻋﲆ ﻛﻴﻔﻴﺔ ﺗﺸ ﱡﻜﻠﻪ ،ﻋﲆ ﺗﻄﻮﱡر املﺴﺘﻘﺒﲇ.
22
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
ﺗﺒني ﺟﻮدة اﻟﺒﻮﻟﻴﻤﺮ ﻋﻨﺪ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ ﻗﻴﻢ املﺘﻐريات اﻟﺜﻼﺛﺔ ،ﻳﻤﻜﻨﻨﺎ ﺑﻌﺪ ذﻟﻚ اﻟﺘﻲ ﱢ
اﺧﺘﻴﺎر اﻟﻘﻴﻢ اﻟﺜﻼث املﺤﺪدة اﻟﺘﻲ ﺗﺰﻳﺪ اﻟﺠﻮدة إﱃ اﻟﺤﺪ اﻷﻗﴡ.
ﻟﻜﻦ ﻣﺎذا ﻟﻮ ﻛﺎﻧﺖ ﻋﻤﻠﻴﺔ اﻟﺘﺼﻨﻴﻊ ﻣﻦ اﻟﻨﻮع اﻟﺬ ﻳﺴﺘﻐﺮ ﻋﺪة أﻳﺎ ﻟﺼﻨﻊ ﻛﻞ
ﻛﻤﻴﺔ؟ إ ﺻﻨﻊ اﻟﻌﺪﻳﺪ ﻣﻦ ﻫﺬ اﻟﻜﻤﻴﺎت ملﺠﺮد اﻟﺘﻮﺻﻞ إﱃ أﻓﻀﻞ ﻃﺮﻳﻘﺔ ﻟﻠﻘﻴﺎ ﺑﺬﻟﻚ
رﺑﻤﺎ ﻳﻜﻮ أﻣﺮا ﺻﻌﺐ اﻟﺘﻨﻔﻴﺬ؛ ﻓﺼﻨﻊ ﻣﺎﺋﺔ ﻛﻤﻴﺔ ،ﻳﺴﺘﻐﺮ ﺻﻨﻊ ﻛ ﱟﻞ ﻣﻨﻬﺎ ﺛﻼﺛﺔ أﻳﺎ ،
ﺳﻴﺴﺘﻐﺮ اﻟﺠﺰء اﻷﻛﱪ ﻣﻦ ﻋﺎ ﻛﺎﻣﻞ .ﻟﺤﺴﻦ اﻟﺤﻆ ،اﻟﺘﺠﺎرب املﺼﻤﱠ ﻤﺔ ﺑﺬﻛﺎء ﺗﺴﻤﺢ ﻟﻨﺎ
ﺑﺎﺳﺘﺨﺮاج املﻌﻠﻮﻣﺎت ﻧﻔﺴﻬﺎ ﻣﻦ ﻣﺠﻤﻮﻋﺎت ﻣﺨﺘﺎرة ﺑﻌﻨﺎﻳﺔ ﻣﻦ اﻟﻘﻴﻢ ﻋﺪدﻫﺎ أﻗ ﱡﻞ ﺑﻜﺜري.
ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ﻳﻤﻜﻦ ﻟﻨﺴﺒﺔ ﺿﺌﻴﻠﺔ ﻣﻦ اﻟﻜﻤﻴﺎت أ ﺗﻤﻨﺤﻨﺎ ﻣﻌﻠﻮﻣﺎت ﻛﺎﻓﻴﺔ ﻟﺘﺤﺪﻳﺪ
أﻓﻀﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ ،ﴍﻳﻄﺔ أ ﺗﺨﺘﺎر ﺗﻠﻚ اﻟﻜﻤﻴﺎت ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ.
23
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻣﺜﺎ :٧اﻟﺘﻀﺨﻢ
إﻧﻨﺎ ﺟﻤﻴﻌﺎ ﻧﺄﻟﻒ ﻓﻜﺮة أ اﻷﺷﻴﺎء ﺗﺰداد ﻏﻼء ﺑﻤﺮ ر اﻟﻮﻗﺖ .ﻟﻜﻦ ﻛﻴﻒ ﻳﻤﻜﻨﻨﺎ ﻣﻘﺎرﻧﺔ
ﺗﻜﺎﻟﻴﻒ املﻌﻴﺸﺔ اﻟﻴﻮ ﺑﺘﻜﺎﻟﻴﻒ املﻌﻴﺸﺔ أﻣﺲ؟ ﻟﻠﻘﻴﺎ ﺑﺬﻟﻚ ،ﻧﺤﺘﺎج إﱃ ﻣﻘﺎرﻧﺔ اﻷﺷﻴﺎء
ﻧﻔﺴﻬﺎ اﻟﺘﻲ اﺷﱰﻳﻨﺎﻫﺎ ﰲ اﻟﻴﻮﻣني .ﻟﻜﻦ ﻟﻸﺳﻒ ،ﺗﻮﺟﺪ ﺗﻌﻘﻴﺪات؛ ﻓﺎملﺤﻼت اﻟﺘﺠﺎرﻳﺔ املﺨﺘﻠﻔﺔ
ﺗﺤﺪد أﺳﻌﺎرا ﻣﺨﺘﻠﻔﺔ ﻟﻸﺷﻴﺎء ﻧﻔﺴﻬﺎ ،اﻷﺷﺨﺎص املﺨﺘﻠﻔﻮ ﻳﺸﱰ أﺷﻴﺎء ﻣﺨﺘﻠﻔﺔ،
ﻳﻐري اﻷﺷﺨﺎص أﻧﻔﺴﻬﻢ أﻧﻤﺎط ﴍاﺋﻬﻢ ،ﺗﻈﻬﺮ ﻣﻨﺘﺠﺎت ﺟﺪﻳﺪة ﰲ اﻟﺴﻮ ﺗﺨﺘﻔﻲ
24
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎ
ﻣﻨﺘﺠﺎت ﻗﺪﻳﻤﺔ ،ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ .ﻛﻴﻒ ﻧﻀﻊ ﻣﺜﻞ ﻫﺬ اﻟﺘﻐﻴريات ﰲ اﻻﻋﺘﺒﺎر ﻋﻨﺪ ﺗﺤﺪﻳﺪ ﻣﺎ
إذا ﻛﺎﻧﺖ اﻟﺤﻴﺎة أﻛﺜﺮ ﺗﻜﻠﻔﺔ ﻫﺬ اﻷﻳﺎ أ ﻻ؟
أﻧﺸﺄ اﻹﺣﺼﺎﺋﻴﻮ اﻻﻗﺘﺼﺎدﻳﻮ ﻣﺆﴍات ﻣﺜﻞ »ﻣﺆﴍ أﺳﻌﺎر اﻟﺘﺠﺰﺋﺔ« »ﻣﺆﴍ
أﺳﻌﺎر املﺴﺘﻬﻠﻚ« ﻟﻘﻴﺎس ﺗﻜﺎﻟﻴﻒ املﻌﻴﺸﺔ .ﺗﺴﺘﻨﺪ ﻫﺬ املﺆﴍات إﱃ »ﺳ ﱠﻠﺔ« اﻓﱰاﺿﻴﺔ
ﻟﻠﺴﻠﻊ )ﻣﺌﺎت ﻣﻨﻬﺎ( اﻟﺘﻲ ﻳﺸﱰﻳﻬﺎ اﻟﻨﺎس ،إﺿﺎﻓﺔ إﱃ دراﺳﺎت اﺳﺘﻘﺼﺎﺋﻴﺔ ﻻﻛﺘﺸﺎ
اﻷﺳﻌﺎر اﻟﺘﻲ ﻳﺒﺎع ﺑﻬﺎ ﻛﻞ ﻋﻨﴫ ﰲ اﻟﺴﻠﺔ .ﺗﺴﺘﺨﺪ ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ ﻣﺘﻄﻮرة ﻟﺠﻤﻊ
أﺳﻌﺎر اﻟﻌﻨﺎﴏ املﺨﺘﻠﻔﺔ ﻟﺘﻘﺪ رﻗﻤﺎ إﺟﻤﺎﻟﻴٍّﺎ اﺣﺪا ﻳﻤﻜﻦ ﻣﻘﺎرﻧﺘﻪ ﻋﲆ ﻣﺪار اﻟﺰﻣﻦ.
ﺑﺎﻹﺿﺎﻓﺔ إﱃ ﻛﻮﻧﻬﺎ ﻣﺆﴍا ﻋﲆ اﻟﺘﻀﺨﻢ ،ﺗﺴﺘﺨﺪ ﻫﺬ املﺆﴍات أﻳﻀﺎ ﻟﻀﺒﻂ ﺣﺪ د
اﻹﻋﻔﺎء اﻟﴬﻳﺒﻲ اﻟﺮ اﺗﺐ املﺮﺗﺒﻄﺔ ﺑﺎملﺆﴍ املﻌﺎﺷﺎت اﻟﺘﻘﺎﻋﺪﻳﺔ ،ﻣﺎ إﱃ ذﻟﻚ.
ﺧﺎﺗﻤﺔ
رﻏﻢ أ ﻫﺬا ﻗﺪ ﻻ ﻳﺒﺪ اﺿﺤﺎ داﺋﻤﺎ ﻟﻠﻌني ﻏري اﻟﺨﺒرية ،ﻓﺈ ﻋﻠﻢ اﻹﺣﺼﺎء اﻷﺳﺎﻟﻴﺐ
اﻹﺣﺼﺎﺋﻴﺔ ﻳ ْﻜﻤﻨﺎ ﰲ ﻗﻠﺐ اﻻﻛﺘﺸﺎ اﻟﻌﻠﻤﻲ ،اﻟﻌﻤﻠﻴﺎت اﻟﺘﺠﺎرﻳﺔ اﻟﺤﻜﻮﻣﻴﺔ ،اﻟﺴﻴﺎﺳﺔ
اﻻﺟﺘﻤﺎﻋﻴﺔ ،اﻟﺘﺼﻨﻴﻊ ،اﻟﻄﺐ ،ﻣﻌﻈﻢ ﺟﻮاﻧﺐ اﻟﻨﺸﺎط اﻹﻧﺴﺎﻧﻲ اﻷﺧﺮ .ﻋﻼ ة ﻋﲆ
ذﻟﻚ ،ﻛﻠﻤﺎ ﺗﻘﺪ اﻟﻌﺎﻟﻢ ،زادت أﻫﻤﻴﺔ ﻫﺬا اﻟﺪ ر أﻛﺜﺮ أﻛﺜﺮ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻣﻨﺬ ﻗﺖ
ﻃﻮﻳﻞ ﺗﻄﻮﻳﺮ أد ﻳﺔ ﺟﺪﻳﺪة ﻳﺸﱰط ،ﻗﺎﻧﻮﻧﺎ ،ﻣﺸﺎرﻛﺔ اﻹﺣﺼﺎﺋﻴني ،ﳾء ﻣﻦ ﻫﺬا اﻟﻘﺒﻴﻞ
ﻳﺤﺪث اﻵ ﰲ اﻟﺼﻨﺎﻋﺔ املﴫﻓﻴﺔ؛ ﺣﻴﺚ إ اﻻﺗﻔﺎﻗﺎت اﻟﺪ ﻟﻴﺔ اﻟﺠﺪﻳﺪة ﺗﺘﻄﻠﺐ ﺿﻊ ﻧﻤﺎذج
إﺣﺼﺎﺋﻴﺔ ﻟﻠﻤﺨﺎﻃﺮ .ﻧﻈﺮا ﻟﻬﺬا اﻟﺪ ر املﺤﻮر ،ﻣﻦ املﻬﻢ ﺑﻮﺿﻮح أ ﻳﻜﻮ أ ﻣﻮاﻃﻦ
ﻣﺴﺘﻨري ﻋﲆ ﻋﻠﻢ ﺑﺎملﺒﺎدئ اﻹﺣﺼﺎﺋﻴﺔ اﻷﺳﺎﺳﻴﺔ.
ﻳﻤ ﱢﻜﻨﻨﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ،اﻟﺬ ﻳﺴﺘﺨﺪ اﻟﱪﻣﺠﻴﺎت املﺘﻄﻮرة ﻟﺪراﺳﺔ اﻟﺒﻴﺎﻧﺎت،
ﻣﻦ اﻟﻘﻴﺎ ﺑﺮﺣﻼت اﺳﺘﻜﺸﺎ ﻣﺸﺎﺑﻬﺔ ﻟﺘﻠﻚ اﻟﺘﻲ ﻗﺎ ﺑﻬﺎ املﺴﺘﻜﺸﻔﻮ ﻗﺒﻞ اﻟﻘﺮ
اﻟﻌﴩﻳﻦ؛ إذ اﺳﺘﻘﺼﻮْا درﺳﻮا ﻋﻮاﻟﻢ ﺟﺪﻳﺪة ﻣﺜرية .ﻫﺬا اﻹدرا — أ ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﺤﻘﻴﻘﻲ ﻳﺘﻤﺤﻮر ﺣﻮ اﺳﺘﻜﺸﺎ املﺠﻬﻮ ،ﻻ ﻳﺘﻤﺤﻮر ﺣﻮ ﻋﻤﻠﻴﺎت ﺣﺴﺎﺑﻴﺔ ﻣﻤ ﱠﻠﺔ —
أﺳﺎﳼ ﰲ ﺗﻘﺪﻳﺮ ﻗﻴﻤﺔ ﻫﺬا اﻟﻌﻠﻢ اﻟﺤﺪﻳﺚ.
ﱞ
25
اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻣﻘﺪﻣﺔ
أﻫﺪ ﰲ ﻫﺬا اﻟﻔﺼﻞ إﱃ ﺗﻘﺪﻳﻢ ﺑﻌﺾ املﻔﺎﻫﻴﻢ اﻷد ات اﻷﺳﺎﺳﻴﺔ اﻟﺘﻲ ﺗﺸﻜﻞ أﺳﺎس ﻋﻠﻢ
اﻹﺣﺼﺎء ،اﻟﺘﻲ ﺗﻤ ﱢﻜﻨﻪ ﻣﻦ ﻟﻌﺐ أد ار ﻛﺜرية.
أﴍت ﰲ اﻟﻔﺼﻞ اﻷ إﱃ أ ﱠ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ﻋﺎﻧﻰ ﻣﻦ ﻛﺜري ﻣﻦ املﻔﺎﻫﻴﻢ
اﻟﺨﺎﻃﺌﺔ ﺳﻮء اﻟﻔﻬﻢ .ﻣﻊ ذﻟﻚ ،ﻳﺮ ﱠج ﺳﻮء ﻓﻬﻢ آﺧﺮ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎ )رﺑﻤﺎ ﻋﻦ ﻏري
ﻗﺼﺪ( ﻋﻦ ﻃﺮﻳﻖ اﻟﻜﺘﺐ اﻟﺘﻲ ﺗﴩح اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ ﻟﻠﺨﱪاء ﰲ ﺗﺨﺼﺼﺎت أﺧﺮ ؛
ﻫﻮ أ اﻹﺣﺼﺎء ﻋﺒﺎرة ﻋﻦ ﺣﻘﻴﺒﺔ ﻣﻦ اﻷد ات ،ﻳﺘﻤﺜﻞ د ر اﻹﺣﺼﺎﺋﻲ أ ﻣﺴﺘﺨﺪ
اﻹﺣﺼﺎء ﰲ اﺧﺘﻴﺎر أداة اﺣﺪة ﺗﺘﻨﺎﺳﺐ ﻣﻊ ﻣﺴﺄﻟﺘﻪ ،ﺛﻢ ﺗﻄﺒﻴﻘﻬﺎ.
ﺗﺘﻤﺜﻞ ﻣﺸﻜﻠﺔ ﻫﺬ اﻟﻨﻈﺮة ﻟﻺﺣﺼﺎء ﰲ أﻧﻬﺎ ﺗﻌﻄﻲ اﻧﻄﺒﺎﻋﺎ ﺑﺄ ﻣﺠﺎ اﻹﺣﺼﺎء
ﺑﺒﺴﺎﻃﺔ ﻋﺒﺎرة ﻋﻦ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻄﺮ املﻨﻔﺼﻠﺔ ملﻌﺎﻟﺠﺔ اﻷرﻗﺎ ؛ ﻓﻬﻲ ﺗﻔﺸﻞ ﰲ ﻧﻘﻞ
ﺣﻘﻴﻘﺔ أ اﻹﺣﺼﺎء ﻛ ﱞﻞ ﻣﺘﺼﻞ ،ﻣﺒﻨﻲ ﻋﲆ ﻣﺒﺎدئ ﻓﻠﺴﻔﻴﺔ ﻋﻤﻴﻘﺔ ،ﺑﺤﻴﺚ ﺗﻜﻮ أد ات
ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ﻣﺮﺗﺒﻄﺔ ﻣﺘﺼﻠﺔ؛ ﻓﺒﻌﻀﻬﺎ ﻗﺪ ﻳﺒﺪ ﺷﺎﻣﻼ ﻣﻘﺎرﻧﺔ ﺑﻐري ،رﺑﻤﺎ ﻳﺒﺪ
اﻟﺒﻌﺾ اﻵﺧﺮ ﻣﺨﺘﻠﻔﺎ ﺑﺒﺴﺎﻃﺔ ﻷﻧﻪ ﻳﺘﻌﺎﻣﻞ ﻣﻊ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﻋﲆ اﻟﺮﻏﻢ
ﻣﻦ أ ﻫﺬ اﻷد ات ﺗﺒﺤﺚ ﻋﻦ اﻟﻨﻮع ﻧﻔﺴﻪ ﻣﻦ اﻟﺒﻨﻰ ،ﻣﺎ إﱃ ذﻟﻚ .أﻇﻦ أ اﻧﻄﺒﺎع
ﻣﺠﻤﻮﻋﺔ اﻟﻄﺮ املﻌﺰ ﻟﺔ ﻫﺬا رﺑﻤﺎ ﻳﻜﻮ ﺳﺒﺒﺎ آﺧﺮ ﻳﺪﻓﻊ املﺴﺘﺠﺪﱢﻳﻦ ﰲ ﻣﺠﺎ اﻹﺣﺼﺎء
إﱃ اﻻﻋﺘﻘﺎد ﺑﺄ ﻫﺬا املﺠﺎ ﻣﻤ ﱞﻞ ﻧﻮﻋﺎ ﻣﺎ ﺻﻌﺐ اﻟﺘﻌﻠﻢ )ﺑﴫ اﻟﻨﻈﺮ ﻋﻦ أ ﺧﻮ ﻣﻦ
اﻷرﻗﺎ ﻗﺪ ﻳﻜﻮ ﻟﺪﻳﻬﻢ(؛ ﻓﺘﻌﻠﻢ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻄﺮ املﻨﻔﺼﻠﺔ اﻟﺘﻲ ﺗﺒﺪ ﺷﺪﻳﺪة اﻟﺘﺒﺎﻳﻦ
أﺻﻌﺐ ﺑﻜﺜري ﻣﻦ ﺗﻌﻠﻢ ﻫﺬ اﻟﻄﺮ ﻣﻦ ﺧﻼ اﺷﺘﻘﺎﻗﻬﺎ ﻣﻦ املﺒﺎدئ اﻷﺳﺎﺳﻴﺔ ﻧﻔﺴﻬﺎ.
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻷﻣﺮ ﻳﺸﺒﻪ ﰲ ﺻﻌﻮﺑﺘﻪ ﺗﻌ ﱡﻠﻢ ﻣﺠﻤﻮﻋﺔ ﻋﺸﻮاﺋﻴﺔ ﻣﻦ اﻟﻜﻠﻤﺎت ﻏري املﺮﺗﺒﻄﺔ ،ﻣﻘﺎرﻧﺔ ﺑﺘﻌﻠﻢ
ﻛﻠﻤﺎت ﺟﻤﻠﺔ ذات ﻣﻌﻨﻰ .ﻟﻘﺪ ﺳﻌﻴﺖ — ﰲ ﻫﺬا اﻟﻔﺼﻞ ﻋﲆ ﻣﺪار اﻟﻜﺘﺎب — ﻟﻠﺘﻌﺒري ﻋﻦ
اﻟﻌﻼﻗﺎت ﺑني اﻷﻓﻜﺎر اﻹﺣﺼﺎﺋﻴﺔ ،ﻣﻦ أﺟﻞ إﻳﻀﺎح أ ﻣﺠﺎ اﻹﺣﺼﺎء ﰲ اﻟﺤﻘﻴﻘﺔ ﺣﺪة
ﻣﺘﻜﺎﻣﻠﺔ ﻣﱰاﺑﻄﺔ.
28
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻧﻈﺎﻣﻬﻢ اﻟﻐﺬاﺋﻲ ﻧﻤﻮﱠﻫﻢ اﻟﺒﺪﻧﻲ ،ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ رﺑﻤﺎ ﺗﺘﻤﺜﻞ اﻟﺨﺼﺎﺋﺺ ﰲ ﻃﻮ اﻷﻃﻔﺎ
زﻧﻬﻢ ،أ رﺑﻤﺎ ﺗﻜﻮ ﻫﺬ اﻟﻜﺎﺋﻨﺎت ﻣﻮا ﱠد ﻣﺎدﻳﺔ ،أﻣﺎ اﻟﺨﺼﺎﺋﺺ ذات اﻷﻫﻤﻴﺔ ﻓﻬﻲ
ﺳﻤﺎﺗﻬﺎ اﻟﻜﻬﺮﺑﺎﺋﻴﺔ املﻐﻨﺎﻃﻴﺴﻴﺔ .ﻣﻦ اﻟﺸﺎﺋﻊ ﰲ ﻣﺠﺎ اﻹﺣﺼﺎء ﺗﺴﻤﻴﺔ ﻫﺬ اﻟﺨﺼﺎﺋﺺ
»ﻣﺘﻐريات« ،ﺑﺤﻴﺚ ﻳﻤﺘﻠﻚ ﻛﻞ ﻛﺎﺋﻦ ﻣﻨﻬﺎ »ﻗﻴﻤﺔ« ﻟﻠﻤﺘﻐري )درﺟﺔ اﻟﻄﻔﻞ ﰲ اﺧﺘﺒﺎر اﻹﻣﻼء
ﺗﻤﺜﻞ ﻗﻴﻤﺔ ﻣﺘﻐري اﻻﺧﺘﺒﺎر ،ﻛﻤﻴﺔ اﻟﺘﻮﺻﻴﻞ اﻟﻜﻬﺮﺑﻲ ﻟﻠﻤﺎدة ﺗﻤﺜﻞ ﻗﻴﻤﺔ ﻣﺘﻐري اﻟﻘﺪرة ﻋﲆ
ﺗﻮﺻﻴﻞ اﻟﺘﻴﺎر ،ﻣﺎ إﱃ ذﻟﻚ( .ﰲ ﻣﺠﺎﻻت ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت اﻷﺧﺮ ،ﺗﺴﺘﺨﺪ ﻛﻠﻤﺎت ﺑﺪﻳﻠﺔ
ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ )ﻣﺜﻞ »ﻣﻴﺰة« أ »ﺳﻤﺔ« أ »ﺧﺎﺻﻴﺔ«( ،ﻟﻜﻦ ﻋﻨﺪ ﻣﻨﺎﻗﺸﺔ اﻟﺠﻮاﻧﺐ
اﻟﺘﻘﻨﻴﺔ ،ﺳﺄﻟﺘﺰ ﻋﺎدة ﺑﻜﻠﻤﺔ »ﻣﺘﻐري«.
ﰲ اﻟﻮاﻗﻊ ،ﰲ أ دراﺳﺔ ،رﺑﻤﺎ ﻧﻜﻮ ﻣﻬﺘﻤني ﺑﺄﻧﻮاع ﻣﺘﻌﺪدة ﻣﻦ اﻟﻜﺎﺋﻨﺎت .ﻓﺮﺑﻤﺎ
ﻻ ﻧﺮﻏﺐ ﰲ اﻟﻔﻬﻢ ﺗﻘﺪﻳﻢ اﻟﻨﺘﺎﺋﺞ ﻋﻦ أﻃﻔﺎ املﺪارس ﻓﺤﺴﺐ ،ﻟﻜﻦ أﻳﻀﺎ ﻋﻦ املﺪارس
ﻧﻔﺴﻬﺎ رﺑﻤﺎ ﻋﻦ املﻌﻠﻤني أﺳﺎﻟﻴﺐ اﻟﺘﺪرﻳﺲ اﻷﻧﻮاع املﺨﺘﻠﻔﺔ ﻟﻬﻴﺎﻛﻞ اﻹدارة املﺪرﺳﻴﺔ،
ﻛﻞ ذﻟﻚ ﰲ دراﺳﺔ اﺣﺪة .ﻋﻼ ة ﻋﲆ ذﻟﻚ ،ﻋﺎدة ﻟﻦ ﻧﻜﻮ ﻣﻬﺘﻤني ﺑﺴﻤﺔ اﺣﺪة ﻟﻠﻜﺎﺋﻨﺎت
اﻟﺘﻲ ﺗﺨﻀﻊ ﻟﻠﺪراﺳﺔ ،إﻧﻤﺎ ﺑﺎﻟﻌﻼﻗﺎت ﺑني اﻟﺴﻤﺎت ،رﺑﻤﺎ ﺑﺎﻟﻔﻌﻞ ﺑﺎﻟﻌﻼﻗﺎت ﺑني ﺳﻤﺎت
ﻣﺘﻮﻗﻊ ،ﻧﺠﺪ أ اﻷﻣﻮر ﱠ اﻟﻜﺎﺋﻨﺎت ﻣﻦ اﻷﻧﻮاع املﺨﺘﻠﻔﺔ ﻋﲆ املﺴﺘﻮﻳﺎت املﺨﺘﻠﻔﺔ .ﻛﻤﺎ ﻫﻮ
ﱠ
ﻣﻌﻘﺪة ﻟﻠﻐﺎﻳﺔ؛ ﻧﻈﺮا ﻟﺘﻌﻘﻴﺪ املﻮﺿﻮﻋﺎت اﻟﺘﻲ ﻧﺪرﺳﻬﺎ. ﻏﺎﻟﺒﺎ ﻣﺎ ﺗﻜﻮ
ﻳﻘﺎ ﻛﺜري ﻣﻦ اﻟﻨﺎس ﻓﻜﺮة أﻧﻪ ﻳﻤﻜﻦ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ أ ﺗﻨﻘﻞ ﺟﻤﺎ اﻟﻌﺎﻟﻢ
اﻟﺤﻘﻴﻘﻲ؛ ﻓﻴﺸﻌﺮ ﺑﺄ ﺗﺤﻮﻳﻞ اﻷﺷﻴﺎء إﱃ أرﻗﺎ ﻳﺰﻳﻞ ﺑﻄﺮﻳﻘﺔ أ ﺑﺄﺧﺮ ﻋﻨﻬﺎ ﺳﺤﺮﻫﺎ.
ﰲ اﻟﻮاﻗﻊ ،ﻫﻢ ﻣﺨﻄﺌﻮ ﺣﺘﻰ اﻟﻨﺨﺎع؛ ﻓﺎﻷرﻗﺎ ﻟﺪﻳﻬﺎ اﻟﻘﺪرة ﻋﲆ اﻟﺴﻤﺎح ﻟﻨﺎ ﺑﺈدرا
ﺣﻖ ﻗﺪْر .ﻫﺬا اﻟﺠﻤﺎ — ﻫﺬا اﻟﺴﺤﺮ — ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ ﺿﻮﺣﺎ أﻛﺜﺮ ﻋﻤﻘﺎ ،ﺗﻘﺪﻳﺮ ﱠ
ﺑﺎﻋﱰا اﻟﺠﻤﻴﻊ ،رﺑﻤﺎ ﻳﺰا »اﻟﻐﻤﻮض« ﻋﻦ ﻃﺮﻳﻖ ﺻﻒ اﻷﺷﻴﺎء ﺑﺼﻮرة رﻗﻤﻴﺔ؛ ﻓﺈذا
ﻗﻠﺖ إﻧﻪ ﻳﻮﺟﺪ أرﺑﻌﺔ أﺷﺨﺎص ﰲ اﻟﻐﺮﻓﺔ ،ﻓﺈﻧﻚ ﺗﻌﺮ ﺑﺎﻟﻀﺒﻂ ﻣﺎ أﻋﻨﻴﻪ ،ﰲ ﺣني أﻧﻨﻲ إذا
ﻗﻠﺖ إ ﺷﺨﺼﺎ ﻣﺎ ﺟﺬﱠاب ،رﺑﻤﺎ ﻻ ﺗﻜﻮ ﻣﺘﺄﻛﺪا ﺗﻤﺎﻣﺎ ﻣﻤﱠ ﺎ أﻋﻨﻴﻪ .رﺑﻤﺎ ﺗﺨﺘﻠﻒ ﺣﺘﻰ ﻣﻊ
ﺟﻬﺔ ﻧﻈﺮ ﰲ أ ﺛﻤﺔ ﺷﺨﺼﺎ ﺟﺬﱠاﺑﺎ ﰲ اﻟﻐﺮﻓﺔ ،ﻟﻜﻦ ﻣﻦ ﻏري املﺮﺟﱠ ﺢ أ ﺗﺨﺘﻠﻒ ﻣﻊ
ﺟﻬﺔ ﻧﻈﺮ ﺑﺄ ﻫﻨﺎ أرﺑﻌﺔ أﺷﺨﺎص ﰲ اﻟﻐﺮﻓﺔ )ﺑﺎﺳﺘﺜﻨﺎء أﺧﻄﺎء اﻟﻌ ﱢﺪ ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ ،
ﻟﻜﻦ ﻫﺬا أﻣﺮ ﻣﺨﺘﻠﻒ( .اﻷرﻗﺎ ﻣﻔﻬﻮﻣﺔ ﻋﲆ ﻧﺤﻮ ﻋﺎملﻲ ،ﺑﻐﺾ اﻟﻨﻈﺮ ﻋﻦ اﻟﺠﻨﺴﻴﺔ أ
اﻟﺪﻳﻦ أ اﻟﺠﻨﺲ أ اﻟﻌﻤﺮ أ أ ﺳﻤﺔ ﺑﴩﻳﺔ أﺧﺮ .ﻳﻤﻜﻦ أ ﺗﻜﻮ إزاﻟﺔ اﻟﻐﻤﻮض
— ﻣﻌﻬﺎ إزاﻟﺔ ﺧﻄﺮ ﺳﻮء اﻟﻔﻬﻢ — ﻣﻔﻴﺪة ﻋﻨﺪﻣﺎ ﻧﺤﺎ أ ﻧﻔﻬﻢ ﺷﻴﺌﺎ؛ ﻋﻨﺪﻣﺎ ﻧﺤﺎ
ﻓﻬﻤﻪ ﺗﻤﺎﻣﺎ.
29
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻳﺮﺗﺒﻂ اﻓﺘﻘﺎد اﻟﻐﻤﻮض ﻫﺬا ﰲ ﺗﻔﺴري اﻷرﻗﺎ ارﺗﺒﺎﻃﺎ ﺛﻴﻘﺎ ﺑﺤﻘﻴﻘﺔ أ »اﻷرﻗﺎ
ﺗﻤﺘﻠﻚ ﺳﻤﺔ اﺣﺪة ﻓﻘﻂ«؛ ﻧﻌﻨﻲ ﺑﻬﺬا ﻗﻴﻤﺘﻬﺎ أ ﺣﺠﻤﻬﺎ .ﻓﻌﲆ اﻟﻨﻘﻴﺾ ﻣﻤﺎ ﻗﺪ ﻳﺪﻓﻌﻨﺎ
اﻟﻌﺮاﻓﻮ إﱃ اﻹﻳﻤﺎ ﺑﻪ ،ﻓﺈ اﻷرﻗﺎ ﻟﻴﺴﺖ ﺟﺎﻟﺒﺔ ﻟﻠﺤﻆ اﻟﺠﻴﺪ أ اﻟﺴﻴﺊ؛ ﺗﻤﺎﻣﺎ ﻛﻤﺎ أ
اﻷرﻗﺎ ﻻ ﺗﻤﺘﻠﻚ ﻟﻮﻧﺎ أ ﻧﻜﻬﺔ أ راﺋﺤﺔ ،ﻓﻠﻴﺲ ﻟﺪﻳﻬﺎ ﺳﻤﺎت ﻏري ﻗﻴﻤﺘﻬﺎ اﻟﺮﻗﻤﻴﺔ اﻟﺬاﺗﻴﺔ.
)ﻻ ﻳﻤﻜﻦ إﻧﻜﺎر أ ﺑﻌﺾ اﻷﺷﺨﺎص ﻳﻤﺘﻠﻜﻮ »اﻟﺤﺲ املﺮاﻓﻖ« ،اﻟﺬ ﻓﻴﻪ ﻳﺮﺑﻄﻮ ﻟﻮﻧﺎ
ﻣﻌﻴﻨﺎ أ إﺣﺴﺎﺳﺎ ﺑﺄرﻗﺎ ﻣﻌﻴﻨﺔ .ﻣﻊ ذﻟﻚ ،ﻓﺈ اﻷﺣﺎﺳﻴﺲ املﺮﺗﺒﻄﺔ ﺗﺘﺒﺎﻳﻦ ﺑﺎﺧﺘﻼ
اﻷﺷﺨﺎص ،ﻻ ﻳﻤﻜﻦ اﻋﺘﺒﺎرﻫﺎ ﺳﻤﺎت ﺧﺎﺻﺔ ﺑﺎﻷرﻗﺎ ﻧﻔﺴﻬﺎ(.
ﺗﻘ ﱢﺪ اﻟﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ ﻟﻨﺎ ﺻﻠﺔ ﻣﺒﺎﴍة ﻓﻮرﻳﺔ ﺑﺎﻟﻈﻮاﻫﺮ اﻟﺘﻲ ﻧﺪرﺳﻬﺎ أﻛﺜﺮ ﻣﻤﺎ
ﺗﻘﺪﱢﻣﻪ اﻟﻜﻠﻤﺎت؛ ﻷ اﻟﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ ﺗﻨﺘﺞ ﻋﺎدة ﻋﻦ ﻃﺮﻳﻖ أد ات ﻗﻴﺎس ﺗﺘﺼﻞ اﺗﺼﺎﻻ
ﻣﺒﺎﴍا ﺑﺘﻠﻚ اﻟﻈﻮاﻫﺮ ﺑﺪرﺟﺔ أﻛﱪ ﻣﻦ اﺗﺼﺎﻟﻬﺎ ﺑﺎﻟﻜﻠﻤﺎت؛ ﻓﺎﻷرﻗﺎ ﺗﺄﺗﻲ ﻣﺒﺎﴍة ﻣﻦ
اﻷﺷﻴﺎء اﻟﺘﻲ ﺗﺠﺮ دراﺳﺘﻬﺎ ،ﰲ ﺣني أ اﻟﻜﻠﻤﺎت ﺗﺨﻀﻊ ﻟﻠﱰﺷﻴﺢ ﻋﻦ ﻃﺮﻳﻖ اﻟﻌﻘﻞ
اﻟﺒﴩ .ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ ،ﻓﺈ اﻷﺷﻴﺎء ﺗﻜﻮ أﻛﺜﺮ ﺗﻌﻘﻴﺪا إذا ﺗﻤﱠ ْﺖ إﺟﺮاءات ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت
ﺑﻮاﺳﻄﺔ اﻟﻜﻠﻤﺎت )ﻛﻤﺎ ﻫﻲ اﻟﺤﺎ إذا ﺟﻤﻌﺖ اﻟﺒﻴﺎﻧﺎت ﻋﻦ ﻃﺮﻳﻖ اﻻﺳﺘﺒﻴﺎﻧﺎت( ،ﻟﻜﻦ
ﻻ ﻳﺰا املﺒﺪأ ﺻﺎﻟﺤﺎ .ﺑﻴﻨﻤﺎ ﻗﺪ ﻻ ﺗﻜﻮ أد ات اﻟﻘﻴﺎس ﻣﺜﺎﻟﻴﺔ ،ﻓﺈ اﻟﺒﻴﺎﻧﺎت ﺗﻜﻮ ﺗﻤﺜﻴﻼ
ﺣﻘﻴﻘﻴٍّﺎ ﻟﻨﺘﺎﺋﺞ ﺗﻄﺒﻴﻖ ﺗﻠﻚ اﻷد ات ﻋﲆ اﻟﻈﺎﻫﺮة ﻗﻴﺪ اﻟﺪراﺳﺔ .أﺣﻴﺎﻧﺎ أﻟﺨﺺ ذﻟﻚ ﻣﻦ
ﺧﻼ اﻟﺘﻌﻠﻴﻖ املﻮﺟﻮد ﰲ ﺑﺪاﻳﺔ ﻫﺬا اﻟﻔﺼﻞ» :اﻟﺒﻴﺎﻧﺎت ﻫﻲ أدﻟﺔ اﻟﻄﺒﻴﻌﺔ ،اﻟﺘﻲ ﺗﺮ ﻣﻦ
ﺧﻼ ﻋﺪﺳﺔ أداة اﻟﻘﻴﺎس«.
ﻓﻮ ﻛﻞ ﻫﺬا ،ﻟﻸرﻗﺎ ﻧﺘﺎﺋﺞ ﻋﻤﻠﻴﺔ ﻣﻦ ﺣﻴﺚ اﻟﺘﻘﺪ املﺠﺘﻤﻌﻲ؛ ﻓﻘﺪرة اﻟﻌﺎﻟﻢ
املﺘﺤﴬ ﻋﲆ ﻣﻌﺎﻟﺠﺔ ﺗﻤﺜﻴﻼت اﻟﻮاﻗﻊ اﻟﺘﻲ ﺗﻘﺪﱢﻣﻬﺎ اﻷرﻗﺎ ﻫﻲ اﻟﺘﻲ أدﱠت إﱃ ﻣﺜﻞ ﻫﺬا ﱢ
اﻟﺘﻘﺪ املﺎد املﺬﻫﻞ ﰲ اﻟﻘﺮ اﻟﻘﻠﻴﻠﺔ املﺎﺿﻴﺔ.
ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أ اﻷرﻗﺎ ﻟﻬﺎ ﺳﻤﺔ اﺣﺪة ﻓﻘﻂ — ﻗﻴﻤﺘﻬﺎ اﻟﺮﻗﻤﻴﺔ — ﻓﺮﺑﻤﺎ ﻧﺨﺘﺎر
اﺳﺘﺨﺪا ﺗﻠﻚ اﻟﺴﻤﺔ ﺑﻄﺮ ﻣﺨﺘﻠﻔﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻋﻨﺪ اﺗﺨﺎذ ﻗﺮار ﺑﺸﺄ ﺟﺪارة
اﻟﻄﻼب ﰲ اﻟﺼﻒ اﻟﺪراﳼ ،رﺑﻤﺎ ﻧﺼﻨﱢﻔﻬﻢ ﻓﻘﺎ ﻟﺪرﺟﺎت اﻻﻣﺘﺤﺎ ؛ أ إﻧﻨﺎ رﺑﻤﺎ ﻻ ﻧﻬﺘ ﱡﻢ
ﱠإﻻ ﺑﻤﺎ إذا ﻛﺎﻧﺖ ﻧﺘﻴﺠﺔ ﻣﺎ أﻋﲆ ﻣﻦ أﺧﺮ ،ﻻ ﻧﻬﺘ ﱡﻢ ﺑﺎﻟﻔﺎر اﻟﻌﺪد اﻟﺪﻗﻴﻖ .ﻋﻨﺪﻣﺎ
ﻧﻬﺘﻢ ﻓﻘﻂ »ﺑﱰﺗﻴﺐ« اﻟﻘﻴﻢ ﺑﻬﺬ اﻟﻄﺮﻳﻘﺔ ﻧﻘﻮ إﻧﻨﺎ ﻧﻌﺎﻟﺞ اﻟﺒﻴﺎﻧﺎت ﺑﻮﺿﻌﻬﺎ ﻋﲆ ﻣﻘﻴﺎس
»ﺗﺮﺗﻴﺒﻲ« .ﻣﻦ ﻧﺎﺣﻴﺔ أﺧﺮ ،ﻋﻨﺪﻣﺎ ﻳﻘﻴﺲ املﺰارع ﻛﻤﻴﺔ اﻟﺬرة اﻟﺘﻲ أﻧﺘﺠﻬﺎ ،ﻓﻼ ﻳﺮﻳﺪ
ﺑﺒﺴﺎﻃﺔ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎ ﻗﺪ أﻧﺘﺞ أﻛﺜﺮ ﻣﻤﺎ أﻧﺘﺞ ﰲ اﻟﻌﺎ املﺎﴈ أ ﻻ ،ﻛﻤﺎ أﻧﻪ ﻳﺮﻳﺪ
أﻳﻀﺎ أ ﻳﻌﺮ ﻣﻘﺪار ﻣﺎ أﻧﺘﺠﻪ؛ أ اﻟﻮز اﻟﻔﻌﲇ؛ ﻓﻌﲆ أ ﺣﺎ ،ﺳﻮ ﺗﺒﺎع اﻟﺬرة ﰲ
30
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
اﻟﺴﻮ ﻋﲆ ﻫﺬا اﻷﺳﺎس .ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﻳﻘﺎر املﺰارع ﻓﻌﻠﻴٍّﺎ ز اﻟﺬرة اﻟﺘﻲ أﻧﺘﺠﻬﺎ
ﺑﻮز ﻣﻌﻴﺎر ﻣﺜﻞ اﻟﻄﻦ ،ﺣﺘﻰ ﻳﺴﺘﻄﻴﻊ ﻣﻌﺮﻓﺔ ﻛﻢ ﻃﻨٍّﺎ ﻣﻦ اﻟﺬرة أﻧﺘﺠﻪ .ﻳﺘﻀﻤﻦ ذﻟﻚ
اﺣﺘﺴﺎب ﻧﺴﺒﺔ ز اﻟﺬرة اﻟﺘﻲ أﻧﺘﺠﻬﺎ املﺰارع ﻟﻮز اﻟﻄﻦ اﻟﻮاﺣﺪ ﻣﻦ اﻟﺬرة؛ ﻟﻬﺬا اﻟﺴﺒﺐ،
ﻋﻨﺪﻣﺎ ﻧﺴﺘﺨﺪ اﻟﻘﻴﻢ ﻋﲆ ﻫﺬا اﻟﻨﺤﻮ ،ﻓﺈﻧﻨﺎ ﻧﻘﻮ إﻧﻨﺎ ﻧﻌﺎﻟﺞ اﻟﺒﻴﺎﻧﺎت ﺑﻮﺿﻌﻬﺎ ﻋﲆ
ﻆ أﻧﻪ ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ﻳﻤﻜﻨﻨﺎ اﺧﺘﻴﺎر ﺗﻐﻴري ﺣﺪة اﻟﻘﻴﺎس اﻷﺳﺎﺳﻴﺔ؛ ﻣﻘﻴﺎس »ﻧﺴﺒﻲ« .ﻻﺣ ْ
إذ ﻳﻤﻜﻨﻨﺎ ﺣﺴﺎب اﻟﻮز ﺑﺎﻟﺮﻃﻞ أ اﻟﻜﻴﻠﻮﺟﺮا ﺑﺪﻻ ﻣﻦ اﻟﻄﻦ .ﻣﺎ دﻣﻨﺎ ﻧﺸري إﱃ اﻟﻮﺣﺪة
اﻟﺘﻲ اﺳﺘﺨﺪﻣﻨﺎﻫﺎ ،ﻓﺈﻧﻪ ﻣﻦ اﻟﺴﻬﻞ ﻋﲆ أ ﺷﺨﺺ آﺧﺮ إﻋﺎدة ﺗﺤﻮﻳﻠﻬﺎ ﻣﺮة أﺧﺮ ،أ
ﺗﺤﻮﻳﻠﻬﺎ إﱃ أ ﺣﺪة ﻳﺴﺘﺨﺪﻣﻬﺎ ﻋﺎدة.
ﰲ ﺣﺎﻟﺔ أﺧﺮ ،رﺑﻤﺎ ﻧﺮﻏﺐ ﰲ ﻣﻌﺮﻓﺔ ﻋﺪد املﺮﴇ اﻟﺬﻳﻦ ﻋﺎﻧﻮْا ﻣﻦ أﺛﺮ ﺟﺎﻧﺒﻲ ﻣﻌني
ﻟﺪ اء ﻣﺎ .إذا ﻛﺎ اﻟﻌﺪد ﻛﺒريا ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻓﺈﻧﻨﺎ ﻗﺪ ﻧﺮﻏﺐ ﰲ ﺳﺤْ ﺐ اﻟﺪ اء ﻣﻦ اﻟﺴﻮ
ﻋﲆ أﺳﺎس أﻧﻪ ﻳﻨﻄﻮ ﻋﲆ ﻣﺨﺎﻃﺮة ﻛﺒرية ﻟﻠﻐﺎﻳﺔ .ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﻓﺈﻧﻨﺎ ﺑﺒﺴﺎﻃﺔ ﻧﺤﴢ
اﻟﻮﺣﺪات املﻨﻔﺼﻠﺔ اﻟﻮاﺿﺤﺔ املﻌﺎﻟﻢ )املﺮﴇ( .ﻟﻦ ﺗﻜﻮ إﻋﺎدة اﻟﻘﻴﺎس ﻋﻦ ﻃﺮﻳﻖ ﺗﻐﻴري
اﻟﻮﺣﺪات ذات ﻣﻐﺰ )ﻓﻠﻦ ﻧﻔ ﱢﻜﺮ ﰲ إﺣﺼﺎء ﻋﺪد »ﻧﺼﻒ املﺮﴇ«!( ﻟﺬﻟﻚ ﻧﻘﻮ إﻧﻨﺎ ﻧﻌﺎﻟﺞ
اﻟﺒﻴﺎﻧﺎت ﺑﻮﺿﻌﻬﺎ ﰲ املﻘﻴﺎس »املﻄﻠﻖ«.
ﱠ
املﻠﺨﺼﺎت اﻹﺣﺼﺎﺋﻴﺔ اﻟﺒﺴﻴﻄﺔ )(2
ﰲ ﺣني أ اﻷرﻗﺎ اﻟﺒﺴﻴﻄﺔ ﺗﺸﻜﻞ »ﻋﻨﺎﴏ« اﻟﺒﻴﺎﻧﺎت ،ﻓﺈﻧﻪ ﻣﻦ أﺟﻞ أ ﺗﻜﻮ ﻣﻔﻴﺪة ،ﻓﺈﻧﻨﺎ
ﻧﺤﺘﺎج إﱃ أ ْ ﻧﻨﻈﺮ ﰲ اﻟﻌﻼﻗﺎت ﺑﻴﻨﻬﺎ ،رﺑﻤﺎ ﻧﺠﻤﻊ ﺑﻴﻨﻬﺎ ﺑﻄﺮﻳﻘﺔ ﻣﺎ ،ﻫﻨﺎ ﻳﺄﺗﻲ د ْر
اﻹﺣﺼﺎء .ﺳﻮ ﺗﺴﺘﻜﺸﻒ اﻟﻔﺼﻮ اﻟﻼﺣﻘﺔ ﻃﺮﻗﺎ أﻛﺜﺮ ﺗﻌﻘﻴﺪا ملﻘﺎرﻧﺔ اﻷرﻗﺎ اﻟﺠﻤﻊ
ﺑﻴﻨﻬﺎ ،ﻟﻜﻦ ﺳﻴﻜﻮ ﻫﺬا اﻟﻔﺼﻞ ﺑﻤﻨﺰﻟﺔ ﻣﻘﺪﻣﺔ ﻟﻸﻓﻜﺎر .ﺳﻨﻠﻘﻲ ﻫﻨﺎ ﻧﻈﺮة ﻋﲆ ﺑﻌﺾ
أﻛﺜﺮ اﻟﻄﺮ ﻣﺒﺎﴍة؛ ﻓﻠﻦ ﻧﺴﺘﻜﺸﻒ اﻟﻌﻼﻗﺎت ﺑني املﺘﻐريات املﺨﺘﻠﻔﺔ ﰲ ﻫﺬا اﻟﻔﺼﻞ ،ﻟﻜﻦ
ﺑﺒﺴﺎﻃﺔ ﺳﻨﺮ املﻌﻠﻮﻣﺎت اﻟ ﱡﺮؤ اﻟﺘﻲ ﻳﻤﻜﻦ اﺳﺘﺨﻼﺻﻬﺎ ﻣﻦ اﻟﻌﻼﻗﺎت ﺑني اﻟﻘﻴﻢ املﻘﻴﺴﺔ
ْﻓﻖ املﺘﻐري ﻧﻔﺴﻪ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻧﻜﻮ ﻗﺪ ﺳﺠﱠ ﻠﻨﺎ أﻋﻤﺎر املﺘﻘﺪﱢﻣني ﻟﻠﺤﺼﻮ ﻋﲆ
ﻣﻨﺼﺐ ﰲ اﻟﺠﺎﻣﻌﺔ ،أ درﺟﺔ ﺳﻄﻮع اﻟﻨﺠﻮ ﰲ ﻋﻨﻘﻮد ﻣﺠ ﱢﺮ ﱟ ﻣﺎ ،أ اﻟﻨﻔﻘﺎت اﻟﺸﻬﺮﻳﺔ
ﻟﻸﴎ ﰲ ﻣﺪﻳﻨﺔ ﻣﺎ ،أ أ زا أﺑﻘﺎر ﰲ ﻗﻄﻴﻊ ﰲ ﻗﺖ إرﺳﺎﻟﻬﺎ إﱃ اﻟﺴﻮ ،ﻣﺎ إﱃ ذﻟﻚ.
ﰲ ﻛﻞ ﺣﺎﻟﺔ ،ﺗﺴﺠﱠ ﻞ ﻗﻴﻤﺔ رﻗﻤﻴﺔ اﺣﺪة ﻟﻜﻞ »ﻛﺎﺋﻦ« ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﻜﺎﺋﻨﺎت.
ﻋﻨﺪﻣﺎ ﺗﺆﺧﺬ ﻣﻌﺎ ،ﻳﻘﺎ إ اﻟﻘﻴﻢ اﻟﻔﺮدﻳﺔ ﰲ املﺠﻤﻮﻋﺔ ﺗﺸ ﱢﻜﻞ »ﺗﻮزﻳﻌﺎ« ﻟﻠﻘﻴﻢ .ﺗﻌ ﱡﺪ
املﻠﺨﺼﺎت اﻹﺣﺼﺎﺋﻴﺔ ﺳﺒﻼ ﻟﺘﻤﻴﻴﺰ ﻫﺬا اﻟﺘﻮزﻳﻊ؛ أ ﻗﻮ ﻣﺎ إذا ﻛﺎﻧﺖ اﻟﻘﻴﻢ ﻣﺘﺸﺎﺑﻬﺔ
31
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺟﺪٍّا ،ﻣﺎ إذا ﻛﺎﻧﺖ ﺗﻮﺟﺪ ﺑﻌﺾ اﻟﻘﻴﻢ اﻟﻜﺒرية أ اﻟﺼﻐرية ﻋﲆ ﻧﺤﻮ اﺳﺘﺜﻨﺎﺋﻲ ،ﺗﺤﺪﻳﺪ
اﻟﻘﻴﻤﺔ »اﻟﻨﻤﻮذﺟﻴﺔ« … إﻟﺦ.
32
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
اﻷ ،ﻳﺴﻤﱠ ﻰ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ )ﻟﻸرﻗﺎ ﻧﺴﺨﺔ ﻟﺘﺼﻞ إﱃ املﺠﻤﻮع ﻧﻔﺴﻪ ﻛﻤﺎ ﰲ اﻟﺠﺪ
ﰲ اﻟﺠﺪ اﻷ (.
اﻟﺴﺒﻞ ﻟﺤﺴﺎب املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ ﻫﻲ ﻣﻦ ﺧﻼ ﻗﺴﻤﺔ ﻣﺠﻤﻮع ﰲ اﻟﻮاﻗﻊ ،أﺳﻬﻞ ﱡ
اﻷرﻗﺎ املﻠﻴﻮ ﰲ اﻟﺠﺪ اﻷ ﻋﲆ ﻣﻠﻴﻮ .ﻋﻤﻮﻣﺎ ،ﻳﺘﻢ إﻳﺠﺎد املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ ملﺠﻤﻮﻋﺔ
ﻣﻦ اﻷرﻗﺎ ﺑﺠﻤﻊ ﺟﻤﻴﻊ اﻷرﻗﺎ ﻗﺴﻤﺔ املﺠﻤﻮع ﻋﲆ ﻋﺪدﻫﺎ .إﻟﻴﻚ ﻣﺜﺎﻻ آﺧﺮ :ﰲ اﺧﺘﺒﺎر
ﻣﺎ ،ﻛﺎﻧﺖ اﻟﻨﺴﺒﺔ املﺌﻮﻳﺔ ﻟﻨﺘﺎﺋﺞ ﺧﻤﺴﺔ ﻃﻼب ﰲ اﻟﺼﻒ ﻫﻲ .٥٥ ،٩١ ،٥٣ ،٦٣ ،٧٨ :ﻳﺒﻠﻎ
ﻣﺠﻤﻮع ﻫﺬ اﻷرﻗﺎ .٣٤٠ = ٥٥ + ٩١ + ٥٣ + ٦٣ + ٧٨ :ﻳﺄﺗﻲ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ
ﺑﺒﺴﺎﻃﺔ ﻋﻦ ﻃﺮﻳﻖ ﻗﺴﻤﺔ ٣٤٠ﻋﲆ ٥؛ ﻫﻮ .٦٨ﻛﻨﺎ ﺳﻨﺤﺼﻞ ﻋﲆ املﺠﻤﻮع ﻧﻔﺴﻪ
) (٣٤٠إذا ﺣﺼﻞ ﺟﻤﻴﻊ اﻟﻄﻼب اﻟﺨﻤﺴﺔ ﻋﲆ اﻟﻘﻴﻤﺔ املﺘﻮﺳﻄﺔ .٦٨
ﻳﻤﺘﻠﻚ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﺨﺼﺎﺋﺺ اﻟﺠﺬاﺑﺔ؛ ﻓﺪاﺋﻤﺎ ﻣﺎ ﻳﺄﺧﺬ ﻗﻴﻤﺔ ﺑني
أﻛﱪ اﻟﻘﻴﻢ أﺻﻐﺮﻫﺎ ﰲ ﻣﺠﻤﻮﻋﺔ اﻷرﻗﺎ .ﻋﻼ ة ﻋﲆ ذﻟﻚ ،ﻓﺈﻧﻪ ﻳﻮاز ﺑني اﻷرﻗﺎ ﰲ
املﺠﻤﻮﻋﺔ؛ ﺑﻤﻌﻨﻰ أ ﻣﺠﻤﻮع اﻟﻔﺮ ﺑني املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ اﻟﻘﻴﻢ اﻷﻛﱪ ﻣﻨﻪ ﻳﺴﺎ
ﺑﺎﻟﻀﺒﻂ ﻣﺠﻤﻮع اﻟﻔﺮ ﺑني املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ اﻟﻘﻴﻢ اﻷﺻﻐﺮ ﻣﻨﻪ .ﺑﻬﺬا املﻌﻨﻰ،
ﻫﻮ ﻗﻴﻤﺔ »ﻣﺮﻛﺰﻳﺔ« .اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻳﻤﻠﻜﻮ ﺗﻔﻜريا ﻣﻴﻜﺎﻧﻴﻜﻴٍّﺎ ﻗﺪ ﻳﺮﻏﺒﻮ ﰲ ﺗﺼﻮر
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﺛﻘﺎ زﻧﺔ اﻟﻮاﺣﺪ ﻣﻨﻬﺎ ﻛﻴﻠﻮﺟﺮا اﺣﺪ ﻣﻮﺿﻮﻋﺔ ﰲ ﻣﻮاﻗﻊ ﻣﺨﺘﻠﻔﺔ ﻋﲆ
ﻃﻮ ﻟﻮح ﺧﺸﺒﻲ )ﻋﺪﻳﻢ اﻟﻮز ( .ﻣﺴﺎﻓﺎت اﻷ زا ﻣﻦ أﺣﺪ ﻃﺮﰲ اﻟﻠﻮح ﺗﻤﺜﱢﻞ اﻟﻘﻴﻢ ﰲ
ﻣﺠﻤﻮﻋﺔ اﻷرﻗﺎ .املﺘﻮﺳﻂ ﻫﻮ املﺴﺎﻓﺔ اﻟﺘﻲ ﺗﻔﺼﻞ اﻟﻄﺮ ﻋﻦ ﻣﺤﻮر ارﺗﻜﺎز ﻳﺘﻮاز
ﻓﻴﻪ ﻟﻮح اﻟﺨﺸﺐ ﺗﻤﺎﻣﺎ.
املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ ﻫﻮ »إﺣﺼﺎﺋﻴﺔ« ،ﻫﻮ ﻳﻠﺨﺺ ﻣﺠﻤﻮﻋﺔ ﻛﺎﻣﻠﺔ ﻣﻦ اﻟﻘﻴﻢ ﰲ
ﻣﺠﻤﻮﻋﺘﻨﺎ ﰲ ﺻﻮرة ﻗﻴﻤﺔ اﺣﺪة .ﻳﺘﺒﻊ ذﻟﻚ أﻧﻪ ﻳﻬﻤﻞ أﻳﻀﺎ ﻣﻌﻠﻮﻣﺎت؛ ﻓﻴﺠﺐ ﱠأﻻ ﱠ
ﻧﺘﻮﻗﻊ
أ ﻧﻤﺜﱢﻞ ﻣﻠﻴﻮ رﻗﻢ ﻣﺨﺘﻠﻒ )أ ﺧﻤﺴﺔ ،أ أﻳٍّﺎ ﻛﺎ ﻋﺪدﻫﺎ( ﻋﻦ ﻃﺮﻳﻖ رﻗﻢ اﺣﺪ د
ْ
ﻟﻜﻦ ﻧﻈﺮا ﻷﻧﻪ اﻟﺘﻀﺤﻴﺔ ﺑﴚء ﻣﺎ ،ﺳﻨﻌﻤﻞ ﻋﲆ اﺳﺘﻜﺸﺎ ﻫﺬ اﻟﺘﻀﺤﻴﺔ ﰲ ﻗﺖ ﻻﺣﻖ.
ﻗﻴﻤﺔ ﻣﺮﻛﺰﻳﺔ ﺑﺎملﻌﻨﻰ امل ﱠﺒني أﻋﻼ ،ﻓﺈﻧﻪ ﻳﻤﻜﻦ أ ﻳﻜﻮ ﻣﻠﺨﺼﺎ ﻣﻔﻴﺪا؛ ﻓﻴﻤﻜﻨﻨﺎ ﻣﻘﺎرﻧﺔ
ﻣﺘﻮﺳﻄﺎت ﺣﺠﻢ اﻟﻔﺼﻞ ﰲ املﺪارس املﺨﺘﻠﻔﺔ ،أ ﻣﺘﻮﺳﻂ درﺟﺔ اﺧﺘﺒﺎر ﻃﻼب ﻣﺨﺘﻠﻔني،
أ ﻣﺘﻮﺳﻂ اﻟﻮﻗﺖ اﻟﺬ ﻳﺴﺘﻐﺮﻗﻪ ﻣﺨﺘﻠﻒ اﻟﻨﺎس ﻟﻠﻮﺻﻮ إﱃ اﻟﻌﻤﻞ ،أ ﻣﺘﻮﺳﻂ درﺟﺔ
اﻟﺤﺮارة اﻟﻴﻮﻣﻴﺔ ﰲ ﺳﻨﻮات ﻣﺨﺘﻠﻔﺔ ،ﻣﺎ إﱃ ذﻟﻚ.
املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ إﺣﺼﺎﺋﻴﺔ ﻣﻬﻤﺔ؛ ﻓﻬﻮ ﻣﻠﺨﺺ ملﺠﻤﻮﻋﺔ ﻣﻦ اﻷرﻗﺎ .ﺛﻤﺔ ﻣﻠﺨﺺ
آﺧﺮ ﻣﻬﻢ ﻫﻮ »اﻟﻮﺳﻴﻂ« .ﻛﺎ املﺘﻮﺳﻂ ﻫﻮ اﻟﻘﻴﻤﺔ املﺤﻮرﻳﺔ؛ ﻧﻮﻋﺎ ﻣﻦ اﻟﻨﻘﻄﺔ املﺮﻛﺰﻳﺔ
33
ﻋﻠﻢ اﻹﺣﺼﺎء
املﻮازﻧﺔ ملﺠﻤﻮع اﻟﻔﺮ ﺑﻴﻨﻪ ﺑني اﻷرﻗﺎ ﰲ املﺠﻤﻮﻋﺔ .أﻣﺎ اﻟﻮﺳﻴﻂ ﻓﻴﻮاز املﺠﻤﻮﻋﺔ
ﺑﻄﺮﻳﻘﺔ أﺧﺮ ؛ ﻓﻬﻮ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﻜﻮ ﻧﺼﻒ اﻷرﻗﺎ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت أﻛﱪ ﻣﻨﻬﺎ
اﻟﻨﺼﻒ اﻵﺧﺮ أﺻﻐﺮ ﻣﻨﻬﺎ .ﺑﺎﻟﻌﻮدة إﱃ اﻟﺼﻒ املﻜ ﱠﻮ ﻣﻦ ﺧﻤﺴﺔ ﻃﻼب املﺬﻛﻮر أﻋﻼ ،
ﻓﺈ ﻧﺘﺎﺋﺠﻬﻢ ﺑﺎﻟﱰﺗﻴﺐ ﻣﻦ اﻷﺻﻐﺮ إﱃ اﻷﻛﱪ ﻫﻲ .٩١ ،٧٨ ،٦٣ ،٥٥ ،٥٣ :اﻟﻨﺘﻴﺠﺔ
اﻟﻮﺳﻄﻰ ﻫﻨﺎ ﻫﻲ ،٦٣ﻟﺬﻟﻚ ﻫﺬا ﻫﻮ اﻟﻮﺳﻴﻂ.
ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﺳﺘﻈﻬﺮ ﺑﻌﺾ اﻟﺘﻌﻘﻴﺪات إذا ﺟﺪت ﻗﻴﻢ ﻣﺘﺴﺎ ﻳﺔ ﰲ ﻣﺠﻤﻮﻋﺔ
اﻟﺒﻴﺎﻧﺎت )ﻟﻨﻔﱰض ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ أﻧﻬﺎ ﺗﺘﻜﻮ ﻣﻦ ٩٩ﻧﺴﺨﺔ ﻣﻦ اﻟﻘﻴﻤﺔ ٠ﻧﺴﺨﺔ
اﺣﺪة ﻣﻦ اﻟﻘﻴﻤﺔ ،(١ﻟﻜﻦ ﻳﻤﻜﻦ اﻟﺘﻐﻠﺐ ﻋﲆ ذﻟﻚ .ﻋﲆ أ ﺣﺎ ،ﻣﺮة أﺧﺮ اﻟﻮﺳﻴﻂ
ﻫﻮ ﻗﻴﻤﺔ ﺗﻤﺜﻴﻠﻴﺔ ﺑﻤﻌﻨﻰ ﻣﺎ ،إ ﻛﺎ ﻳﺨﺘﻠﻒ ﻋﻦ املﺘﻮﺳﻂ .ﺑﺴﺒﺐ ﻫﺬا اﻻﺧﺘﻼ ،ﻟﻨﺎ أ
ﻧﺘﻮﻗﻊ أﻧﻪ ﺳﻴﺄﺧﺬ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ ﻋﻦ املﺘﻮﺳﻂ .ﻣﻦ اﻟﻮاﺿﺢ أ اﻟﻮﺳﻴﻂ أﺳﻬﻞ ﰲ اﻟﺤﺴﺎب
ﻣﻦ املﺘﻮﺳﻂ .ﻓﻠﻴﺲ ﻋﻠﻴﻨﺎ ﺟﻤﻊ أ ﻗﻴﻢ ﻟﻠﻮﺻﻮ إﻟﻴﻪ ،ﻓﻀﻼ ﻋﻦ اﻟﻘﺴﻤﺔ ﻋﲆ ﻋﺪد اﻟﻘﻴﻢ
ﰲ املﺠﻤﻮﻋﺔ؛ ﻛﻞ ﻣﺎ ﻋﻠﻴﻚ اﻟﻘﻴﺎ ﺑﻪ ﻫﻮ ﺗﺮﺗﻴﺐ اﻷرﻗﺎ ،ﺗﺤﺪﻳﺪ ﻣﻮﻗﻊ اﻟﺮﻗﻢ املﻮﺟﻮد ﰲ
اﻟﻮﺳﻂ .ﻟﻜﻦ ﰲ اﻟﻮاﻗﻊ ﻫﺬ املﻴﺰة اﻟﺤﺴﺎﺑﻴﺔ أﺳﺎﺳﺎ ﻏري ذات ﺻﻠﺔ ﺑﻌﴫ اﻟﻜﻤﺒﻴﻮﺗﺮ؛
ﻓﻔﻲ اﻟﺘﺤﻠﻴﻼت اﻹﺣﺼﺎﺋﻴﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻳﻘﻮ اﻟﻜﻤﺒﻴﻮﺗﺮ ﺑﻌﻤﻠﻴﺎت املﻌﺎﻟﺠﺔ اﻟﺤﺴﺎﺑﻴﺔ املﻤﻠﺔ.
ﺑﻮﺟﻮد ﻫﺬﻳﻦ املﻠﺨﺼني اﻹﺣﺼﺎﺋﻴني ،ﻛﻼﻫﻤﺎ ﻳﻘ ﱢﺪ ﻗﻴﻤﺎ ﺗﻤﺜﻴﻠﻴﺔ ،ﻛﻴﻒ ﻟﻨﺎ أ ﻧﺤﺪد
أﻳﻬﻤﺎ ﺳﻨﺴﺘﺨﺪ ﰲ أ ﻣﻮﻗﻒ ﻣﻌني؟ ﺑﻤﺎ أﻧﻬﻤﺎ ﻳﻌ ﱠﺮﻓﺎ ﻋﲆ ﻧﺤﻮ ﻣﺨﺘﻠﻒ — ﻳﺠﻤﻌﺎ
اﻟﻘﻴﻢ اﻟﺮﻗﻤﻴﺔ ﻋﲆ ﻧﺤﻮ ﻣﺨﺘﻠﻒ — ﻓﻤﻦ املﺮﺟﱠ ﺢ أ ﻳﻨﺘﺠﺎ ﻗﻴﻤﺎ ﻣﺨﺘﻠﻔﺔ؛ ﻟﺬﻟﻚ رﺑﻤﺎ ﺗﻜﻮ
أ اﺳﺘﻨﺘﺎﺟﺎت ﺗﺴﺘﻨﺪ إﻟﻴﻬﻤﺎ ﻣﺨﺘﻠﻔﺔ ﻟﻠﻐﺎﻳﺔ .اﻟﺠﻮاب اﻟﻜﺎﻣﻞ ملﺴﺄﻟﺔ أﻳﻬﻤﺎ ﺗﺨﺘﺎر ﺳﻮ
ﻳﺪﺧﻠﻨﺎ ﰲ أﻣﻮر ﻓﻨﻴﺔ ﺗﺘﺠﺎ ز ﻣﺴﺘﻮ ﻫﺬا اﻟﻜﺘﺎب ،ﻟﻜﻦ اﻟﺠﻮاب اﻟﻘﺼري ﻫﻮ أ اﻻﺧﺘﻴﺎر
ﺳﻴﻌﺘﻤﺪ ﻋﲆ اﻟﺘﻔﺎﺻﻴﻞ اﻟﺪﻗﻴﻘﺔ ﻟﻠﺴﺆا اﻟﺬ ﻳﺮﻏﺐ املﺮء ﰲ اﻹﺟﺎﺑﺔ ﻋﻨﻪ.
إﻟﻴﻚ ﻣﺜﺎﻻ :ﻟﻨﻔﱰض أ ﴍﻛﺔ ﺻﻐرية ﻟﺪﻳﻬﺎ ﺧﻤﺲ ﻣﺠﻤﻮﻋﺎت ﻣﻦ املﻮﻇﻔني ،ﻟﻜ ﱟﻞ
ﻣﻨﻬﺎ درﺟﺔ ﻣﺮﺗﺐ ﻣﺨﺘﻠﻔﺎ ؛ ﻫﻲ ﻋﲆ اﻟﱰﺗﻴﺐ ١٠٠٠٠ :د ﻻر ١٠٠٠١ ،د ﻻر١٠٠٠٢ ،
د ﻻر ١٠٠٠٣ ،د ﻻرات ٩٩٩٩٩ ،د ﻻرا .ﻣﺘﻮﺳﻂ ﻫﺬ اﻟﻘﻴﻢ ﻫﻮ ٢٨٠٠١د ﻻر ،ﰲ ﺣني
أ اﻟﻮﺳﻴﻂ ﻫﻮ ١٠٠٠٢د ﻻر .اﻵ ﻟﻨﻔﱰض أ اﻟﴩﻛﺔ ﺗﻌﺘﺰ ﺗﻮﻇﻴﻒ ﺧﻤﺴﺔ ﻣﻮﻇﻔني
ﺟﺪد؛ اﺣﺪ ﻟﻜﻞ درﺟﺔ .رﺑﻤﺎ ﻳﺸري ﺻﺎﺣﺐ اﻟﻌﻤﻞ إﱃ أﻧﻪ ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﺳﻴﻀﻄﺮ »ﰲ
املﺘﻮﺳﻂ« ﻟﺪﻓﻊ راﺗﺐ إﺟﻤﺎﱄ ﻟﻠﻘﺎدﻣني اﻟﺠﺪد اﻟﺨﻤﺴﺔ ﻛﻠﻬﻢ ﻳﺒﻠﻎ ٢٨٠٠١د ﻻر؛ ﻣﻦ
ﺛﻢ ﻳﻜﻮ ﻫﺬا ﻫﻮ ﻣﺘﻮﺳﻂ اﻟﺮاﺗﺐ اﻟﺬ ﻳﺬﻛﺮ ﰲ اﻹﻋﻼ .ﻟﻜﻦ رﺑﻤﺎ ﻳﺸﻌﺮ املﻮﻇﻔﻮ أ
ﻫﺬا ﺗﺤﺎﻳﻞ؛ ﻷ ﻋﺪد املﻮﻇﻔني اﻟﺬﻳﻦ ﺳﻴﺪﻓﻊ ﻟﻬﻢ أﻗﻞ ﻣﻦ ١٠٠٠٢د ﻻرات ﺳﻴﺴﺎ ﻋﺪد
34
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
املﻮﻇﻔني اﻟﺬﻳﻦ ﺳﻴﺪﻓﻊ ﻟﻬﻢ ﻣﺒﻠﻎ أﻛﺜﺮ ﻣﻦ ١٠٠٠٢د ﻻرات .رﺑﻤﺎ ﻳﺸﻌﺮ أﻧﻪ ﻣﻦ
اﻷﻛﺜﺮ ﺻﺪﻗﺎ ﺿﻊ ﻫﺬا اﻟﺮﻗﻢ ﰲ اﻹﻋﻼ .أﺣﻴﺎﻧﺎ ﻳﺘﻄﻠﺐ ﺗﺤﺪﻳﺪ أ املﻘﻴﺎﺳني ﻫﻮ املﻨﺎﺳﺐ
ﻳﺒني ﺷﻜﻞ 1-2ﺗﻮزﻳﻊ ﺗﻔﻜريا ﻣﺘﺄﻧﱢﻴﺎ ) .ﰲ ﺣﺎ ﻛﻨﺖ ﺗﻌﺘﻘﺪ أ ﻫﺬ اﻟﺤﺠﺔ ﻣﺒﺘﺪﻋﺔ ،ﱢ
ر اﺗﺐ ﻻﻋﺒﻲ اﻟﺒﻴﺴﺒﻮ اﻷﻣﺮﻳﻜﻲ ﻗﺒﻞ اﻹﴐاب ﰲ ﻋﺎ .١٩٩٤ﻛﺎ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ
١٫٢ﻣﻠﻴﻮ د ﻻر ،ﻟﻜﻦ ﻛﺎ اﻟﻮﺳﻴﻂ ٠٫٥ﻣﻠﻴﻮ د ﻻر(.
ﻳﻮﺿﺢ ﻫﺬا املﺜﺎ أﻳﻀﺎ اﻟﺘﺄﺛري اﻟﻨﺴﺒﻲ ﻟﻠﻘﻴﻢ املﺘﻄ ﱢﺮﻓﺔ ﻋﲆ املﺘﻮﺳﻂ اﻟﻮﺳﻴﻂ.
ْ
ﻟﻜﻦ ﰲ ﻣﺜﺎ املﺮﺗﺒﺎت أﻋﻼ ،ﻳﺴﺎ املﺘﻮﺳﻂ ﻣﺎ ﻳﻘﺮب ﻣﻦ ﺛﻼﺛﺔ أﺿﻌﺎ اﻟﻮﺳﻴﻂ.
ﻟﻨﻔﱰض أ أﻛﱪ ﻗﻴﻤﺔ ﻛﺎﻧﺖ ١٠٠٠٤د ﻻرات ﺑﺪﻻ ﻣﻦ ٩٩٩٩٩د ﻻرا ،ﺣﻴﻨﻬﺎ ﺳﻴﻈﻞ
)ﻧﺼﻒ اﻟﻘﻴﻢ أﻋﻼ ﻧﺼﻔﻬﺎ أدﻧﺎ ( ،ﱠإﻻ أ املﺘﻮﺳﻂ ﺳﻴﺘﻘ ﱠﻠﺺ
اﻟﻮﺳﻴﻂ ١٠٠٠٢د ﻻرات ْ
إﱃ ١٠٠٠٢د ﻻرات .إ ﺣﺠﻢ ﻗﻴﻤﺔ اﺣﺪة ﻓﻘﻂ ﻳﻤﻜﻦ أ ﻳﻜﻮ ﻟﻪ ﺗﺄﺛري ﻛﺒري ﻋﲆ
املﺘﻮﺳﻂ ،ﻟﻜﻨﻪ ﻻ ﻳﺆﺛﺮ ﻋﲆ اﻟﻮﺳﻴﻂ .ﺣﺴﺎﺳﻴﺔ املﺘﻮﺳﻂ ﺗﻠﻚ ﺣﻴﺎ اﻟﻘﻴﻢ املﺘﻄﺮﻓﺔ ﻫﻲ
أﺣﺪ اﻷﺳﺒﺎب اﻟﺘﻲ ﺗﺠﻌﻞ اﻟﻮﺳﻴﻂ أﺣﻴﺎﻧﺎ ﻣﻔﻀﻼ ﰲ اﻻﺧﺘﻴﺎر ﻋﻦ املﺘﻮﺳﻂ.
ﱠ
املﻠﺨﺼني اﻟﻮﺣﻴﺪﻳﻦ ﻟﻠﻘﻴﻢ اﻟﺘﻤﺜﻴﻠﻴﺔ؛ ﻓﺜﻤﺔ ﻣﻠﺨﺺ آﺧﺮ ﻟﻴﺲ املﺘﻮﺳﻂ اﻟﻮﺳﻴﻂ
ﻣﻬﻢ ﻫﻮ »املﻨﻮا «؛ ﻫﻮ أﻛﺜﺮ اﻟﻘﻴﻢ ﺗﻜﺮارا ﰲ اﻟﻌﻴﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻟﻨﻔﱰض أﻧﻨﻲ
أﺣﴢ ﻋﺪد اﻷﻃﻔﺎ ﰲ اﻷﴎة ﰲ ﻣﺠﻤﻮﻋﺔ ﺳﻜﺎﻧﻴﺔ ﻣﻌﻴﻨﺔ .رﺑﻤﺎ أﺟﺪ أ ﺑﻌﺾ اﻷﴎ ﻟﺪﻳﻬﺎ
ﻃﻔﻞ اﺣﺪ ،ﺑﻌﻀﻬﺎ ﻟﺪﻳﻬﺎ ﻃﻔﻼ ،ﺑﻌﻀﻬﺎ ﺛﻼﺛﺔ ،ﻣﺎ إﱃ ذﻟﻚ ،رﺑﻤﺎ أﺟﺪ ﻋﲆ ﺟﻪ
اﻟﺨﺼﻮص أ ﻋﺪد اﻷﴎ اﻟﺘﻲ ﻟﺪﻳﻬﺎ ﻃﻔﻼ أﻛﱪ ﻣﻦ أ ﻗﻴﻤﺔ أﺧﺮ .ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ،
ﺳﻴﻜﻮ ﻣﻨﻮا ﻋﺪد اﻷﻃﻔﺎ ﻟﻜﻞ أﴎة ﻫﻮ اﺛﻨني.
) (2-2اﻟﺘﺸﺘﺖ
35
ﻋﻠﻢ اﻹﺣﺼﺎء
٤٠٠
٣٠٠
ﻣﻌﺪل اﻟﺘﻜﺮار
٢٠٠
١٠٠
٠
٠ ١ ٢ ٣ ٤ ٥ ٦
اﻟﺮواﺗﺐ ﺑﺎملﻠﻴﻮن دوﻻر
اﻟﻘﻴﻤﺔ ﻟﻴﺴﺖ ﻗﻴﻤﺔ »ﺗﻤﺜﻴﻠﻴﺔ« ﺟﻴﺪة ﻟﻠﻤﺠﻤﻮﻋﺔ .ﻓﻌﲆ ﻃﺮﰲ املﺠﻤﻮﻋﺔ ،ﺛﻤﺔ ﻗﻴﻤﺔ اﺣﺪة
أﻛﱪ ﺑﻨﺼﻒ ﻣﻠﻴﻮ ﻗﻴﻤﺔ اﺣﺪة أﺻﻐﺮ ﺑﻨﺼﻒ ﻣﻠﻴﻮ ﻣﻦ املﺘﻮﺳﻂ ) اﻟﻮﺳﻴﻂ(.
إ ﻣﺎ ﻧﻔﺘﻘﺪ ﻋﻨﺪﻣﺎ ﻧﻌﺘﻤﺪ ﻓﻘﻂ ﻋﲆ املﺘﻮﺳﻂ ﻟﺘﻠﺨﻴﺺ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻫﻮ
ﺑﻌﺾ املﺆﴍات ﺣﻮ ﻣﺪ اﻧﺘﺸﺎر اﻟﺒﻴﺎﻧﺎت ﺣﻮ ﻫﺬا املﺘﻮﺳﻂ؛ ﻫﻞ ﺑﻌﺾ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت
أﻛﱪ ﺑﻜﺜري ﻣﻦ املﺘﻮﺳﻂ؟ ﻫﻞ ﺑﻌﻀﻬﺎ أﺻﻐﺮ ﻣﻨﻪ ﺑﻜﺜري؟ أ إﻧﻬﺎ ﻣﺘﺠﻤﻌﺔ ﰲ ﺗﻘﺎرب ﺣﻮ
املﺘﻮﺳﻂ؟ ﻋﻤﻮﻣﺎ ،ﻣﺎ ﻣﺪ اﺧﺘﻼ اﻟﻘﻴﻢ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ﺑﻌﻀﻬﺎ ﻋﻦ ﺑﻌﺾ؟ ﺗﻘ ﱢﺪ
املﻘﺎﻳﻴﺲ اﻹﺣﺼﺎﺋﻴﺔ ﻟﻠﺘﺸﺘﺖ ﻫﺬ املﻌﻠﻮﻣﺎت ﺑﺪﻗﺔ ،ﻛﻤﺎ ﻫﻲ اﻟﺤﺎ ﻣﻊ املﺘﻮﺳﻂ ،ﻳﻮﺟﺪ
أﻛﺜﺮ ﻣﻦ ﻣﺠﺮد ﻣﻘﻴﺎس اﺣﺪ.
36
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
أﺑﺴﻂ ﻣﻘﺎﻳﻴﺲ اﻟﺘﺸﺘﺖ ﻫﻮ »املﺪ «؛ اﻟﺬ ﻳﻌ ﱠﺮ ﺑﺄﻧﻪ اﻟﻔﺮ ﺑني أﻛﱪ أﺻﻐﺮ
اﻟﻘﻴﻢ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت .ﰲ ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎﺗﻨﺎ املﻜﻮﻧﺔ ﻣﻦ ﻣﻠﻴﻮ رﻗﻢ اﺣﺪ ،املﺪ
ﻫﻮ .١٠٠٠٠٠٠ = ٠ − ١٠٠٠٠٠٠ :ﰲ ﻣﺜﺎ اﻟﺮ اﺗﺐ اﻟﺨﻤﺴﺔ ،املﺪ ﻫﻮ٩٩٩٩٩ :
ﻳﺒني ﻫﺬا املﺜﺎﻻ — اﻟﻠﺬا ﻳﻤﺘﻠﻜﺎ ﻣﺪ ﻛﺒريا — أﻧﻪ ﻳﻮﺟﺪ ﱢ .٨٩٩٩٩ = ١٠٠٠٠ −
اﺧﺘﻼ ﻛﺒري ﻋﻦ املﺘﻮﺳﻂ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا ﻛﺎ املﻮﻇﻔﻮ ﻳﺘﻘﺎﺿ ْﻮ ر اﺗﺐ ﺗﺒﻠﻎ
٢٧٩٩٩د ﻻرا ٢٨٠٠٠ ،د ﻻر ٢٨٠٠١ ،د ﻻر ٢٨٠٠٢ ،د ﻻر ٢٨٠٠٣ ،د ﻻرات ،ﻓﺈ
املﺘﻮﺳﻂ ﺳﻴﻜﻮ أﻳﻀﺎ ٢٨٠٠١د ﻻر ،ﻟﻜﻦ ﺳﻴﻜﻮ املﺪ ٤د ﻻرات ﻓﻘﻂ .ﻫﺬا ﻳﺮﺳﻢ
ﺻﻮرة ﻣﺨﺘﻠﻔﺔ ﺟﺪٍّا ﺗﺨﱪﻧﺎ أ املﻮﻇﻔني ﻣﻊ ﻫﺬ اﻟﺮ اﺗﺐ اﻟﺠﺪﻳﺪة ﺳﻴﺘﻘﺎﺿ ْﻮ اﻷﺟﺮ
ﻧﻔﺴﻪ ﺗﻘﺮﻳﺒﺎ .أﻣﺎ املﺪ اﻟﻜﺒري ﻣﻦ املﺜﺎ اﻟﺴﺎﺑﻖ — اﻟﺒﺎﻟﻎ ٨٩٩٩٩د ﻻرا — ﻓﻴﺨﱪﻧﺎ ﻋﲆ
اﻟﻔﻮر أﻧﻪ ﺗﻮﺟﺪ اﺧﺘﻼﻓﺎت ﺿﺨﻤﺔ.
املﺪ ﻣﻘﻴﺎس ﻣﻼﺋﻢ ﻟﻠﻐﺎﻳﺔ ﻟﻪ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﺨﺼﺎﺋﺺ اﻟﺠﺬاﺑﺔ ﻛﻤﻘﻴﺎس ﻟﻠﺘﺸﺘﺖ ،ﻣﻦ
أﻫﻤﻬﺎ ﺑﺴﺎﻃﺘﻪ إﻣﻜﺎﻧﻴﺔ ﺗﻔﺴري اﻟﺴﻬﻠﺔ .ﻣﻊ ذﻟﻚ ،ﻣﻦ املﻤﻜﻦ أ ﻧﺸﻌﺮ أﻧﻪ ﻟﻴﺲ ﻣﺜﺎﻟﻴٍّﺎ؛
ﻓﻬﻮ رﻏﻢ ﻛﻞ ﳾء ﻳﺘﺠﺎﻫﻞ ﻣﻌﻈﻢ اﻟﺒﻴﺎﻧﺎت؛ ﺣﻴﺚ ﻳﻌﺘﻤﺪ ﻓﻘﻂ ﻋﲆ أﻛﱪ اﻟﻘﻴﻢ أﺻﻐﺮﻫﺎ.
ﻟﻠﺘﻮﺿﻴﺢ ،ﺗﺨﻴﱠ ْﻞ ﻣﺠﻤﻮﻋﺘني ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﺗﺘﺄﻟﻒ ﻛ ﱞﻞ ﻣﻨﻬﻤﺎ ﻣﻦ أﻟﻒ ﻗﻴﻤﺔ .ﺗﺘﻀﻤﻦ إﺣﺪ
املﺠﻤﻮﻋﺘني ﻗﻴﻤﺔ اﺣﺪة ﺗﺒﻠﻎ ٩٩٨ ،٠ﻗﻴﻤﺔ ﺗﺒﻠﻎ ،٥٠٠ﻗﻴﻤﺔ اﺣﺪة ﺗﺒﻠﻎ .١٠٠٠
ﺗﺘﻀﻤﻦ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت اﻷﺧﺮ ٥٠٠ﻗﻴﻤﺔ ﺗﺒﻠﻎ ٥٠٠ ،٠ﻗﻴﻤﺔ ﺗﺒﻠﻎ .١٠٠٠ﻣﺪ
ﻛﻠﺘﺎ ﻣﺠﻤﻮﻋﺘﻲ اﻟﺒﻴﺎﻧﺎت ﻫﻮ ) ١٠٠٠ﺑﺎملﺼﺎدﻓﺔ ،ﻟﻜﻞ ﻣﻨﻬﻤﺎ أﻳﻀﺎ ﻣﺘﻮﺳﻂ ﻳﺒﻠﻎ ،(٥٠٠
ﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ أﻧﻬﻤﺎ ﻣﺨﺘﻠﻔﺘﺎ ﻟﻠﻐﺎﻳﺔ ﰲ ﻃﺒﻴﻌﺘﻬﻤﺎ؛ ﻓﺒﺎﻟﱰﻛﻴﺰ ﻓﻘﻂ ﻋﲆ أﻛﱪ اﻟﻘﻴﻢ
أﺻﻐﺮﻫﺎ ،ﻓﺸﻞ املﺪ ﰲ ﻛﺸﻒ ﺣﻘﻴﻘﺔ أ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت اﻷ ﱃ ﺗﱰﻛﺰ ﻏﺎﻟﺒﺎ ﺑﻜﺜﺎﻓﺔ
ﺣﻮ املﺘﻮﺳﻂ.
ﻳﻤﻜﻦ اﻟﺘﻐﻠﺐ ﻋﲆ ﻫﺬا اﻟﻘﺼﻮر ﺑﺎﺳﺘﺨﺪا ﻣﻘﻴﺎس ﻟﻠﺘﺸﺘﺖ ﻳﻀﻊ اﻟﻘﻴﻢ »ﻛﻠﻬﺎ« ﰲ
اﻻﻋﺘﺒﺎر.
إﺣﺪ اﻟﻄﺮ اﻟﺸﺎﺋﻌﺔ ﻟﻠﻘﻴﺎ ﺑﺬﻟﻚ ﻫﻲ أ ﺗﺤﺴﺐ اﻟﻔﺮ ﺑني املﺘﻮﺳﻂ )اﻟﺤﺴﺎﺑﻲ(
ﻛﻞ رﻗﻢ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ،ﺗﻘﻮ ﺑﱰﺑﻴﻊ ﻫﺬ اﻟﻔﺮ ؛ ﻣﻦ ﺛﻢ ﺗﺤﺴﺐ ﻣﺘﻮﺳﻂ
ﻫﺬ اﻻﺧﺘﻼﻓﺎت املﺮﺑﻌﺔ) .ﺗﺮﺑﻴﻊ اﻟﻔﺮ ﻳﺠﻌﻞ اﻟﻘﻴﻢ ﺟﻤﻴﻌﻬﺎ ﻣﻮﺟﺒﺔ .ﻓﺒﺨﻼ ذﻟﻚ،
ﺳﻮ ﺗﻠﻐﻲ اﻟﻔﺮ املﻮﺟﺒﺔ اﻟﺴﺎﻟﺒﺔ ﺑﻌﻀﻬﺎ ﺑﻌﻀﺎ ﻋﻨﺪﻣﺎ ﻧﻘﻮ ﺑﺤﺴﺎب املﺘﻮﺳﻂ(.
إذا ﻛﺎ املﺘﻮﺳﻂ اﻟﻨﺎﺗﺞ ﻋﻦ اﻟﻔﺮ املﺮﺑﻌﺔ ﺻﻐريا ،ﻓﺈﻧﻪ ﻳﺨﱪﻧﺎ ﰲ اﻟﻌﺎدة أ اﻷرﻗﺎ
ﻟﻴﺴﺖ ﻣﺨﺘﻠﻔﺔ ﻛﺜريا ﻋﻦ ﻣﺘﻮﺳﻄﻬﺎ؛ ﻫﺬا ﻳﻌﻨﻲ أﻧﻬﺎ ﻟﻴﺴﺖ ﻣﺸﺘﺘﺔ ﻋﲆ ﻧﻄﺎ اﺳﻊ.
37
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻳﺴﻤﱠ ﻰ ﻣﻘﻴﺎس ﻣﺘﻮﺳﻂ اﻟﻔﺮ املﺮﺑﻌﺔ »ﺗﺒﺎﻳﻦ« اﻟﺒﻴﺎﻧﺎت؛ أ ﻳﺴﻤﱠ ﻰ ﰲ ﺑﻌﺾ اﻟﺘﺨﺼﺼﺎت
»ﻣﺘﻮﺳﻂ ﻣﺮﺑﻌﺎت اﻧﺤﺮاﻓﺎت اﻟﻘﻴﻢ« .ﺳﻨﻮﺿﺢ اﻷﻣﺮ ﺑﺎﺳﺘﺨﺪا درﺟﺎت اﻟﻄﻼب اﻟﺨﻤﺴﺔ
ﰲ اﻻﺧﺘﺒﺎر اﻟﺘﻲ ﻛﺎﻧﺖ ،٥٥ ،٩١ ،٥٣ ،٦٣ ،٧٨ﻛﺎ ﻣﺘﻮﺳﻄﻬﺎ .٦٨اﻟﻔﺎر املﺮﺑﻊ ﺑني
اﻟﻨﺘﻴﺠﺔ اﻷ ﱃ املﺘﻮﺳﻂ ﻫﻮ ) ،١٠٠ = ٢ (٦٨ − ٧٨ﻫﻜﺬا .ﻣﺠﻤﻮع اﻟﻔﺮ املﺮﺑﻌﺔ ﻫﻮ
١٠٤٨ = ١٦٩ + ٥٢٩ + ٢٢٥ + ٢٥ + ١٠٠؛ ﻣﻦ ﺛﻢ ﻓﺈ ﻣﺘﻮﺳﻂ ﻣﺮﺑﻌﺎت اﻧﺤﺮاﻓﺎت
اﻟﻘﻴﻢ ﻫﻮ .٢٠٩٫٦ = ٥ ÷ ١٠٤٨ﻫﺬا ﻫﻮ اﻟﺘﺒﺎﻳﻦ.
ﻳﻨﺸﺄ ﺗﻌﻘﻴﺪ ﻃﻔﻴﻒ ﻣﻦ ﺣﻘﻴﻘﺔ أ اﻟﺘﺒﺎﻳﻦ ﻳﻨﻄﻮ ﻋﲆ ﻗﻴﻢ ﻣﺮﺑﻌﺔ؛ ﻫﺬا ﻳﻌﻨﻲ أ
اﻟﺘﺒﺎﻳﻦ ﻧﻔﺴﻪ ﻳﻘﺎس ﺑ » ﺣﺪات ﻣﺮﺑﻌﺔ« .ﻓﺈذا ﻛﻨﺎ ﻧﻘﻴﺲ إﻧﺘﺎﺟﻴﺔ املﺰارع ﻣﻦ ﺣﻴﺚ أﻃﻨﺎ
اﻟﺬرة ،ﻓﺈ ﺗﺒﺎﻳﻦ اﻟﻘﻴﻢ ﻳﻘﺎس ﺑ »اﻟﻄﻦ املﺮﺑﻊ« .ﻟﻴﺲ ﺗﺄﺛري ﻫﺬا اﻷﻣﺮ اﺿﺤﺎ ،ﺑﺴﺒﺐ ﻫﺬ
اﻟﺼﻌﻮﺑﺔ ،ﻣﻦ اﻟﺸﺎﺋﻊ أ ﻧﺤﺴﺐ اﻟﺠﺬر اﻟﱰﺑﻴﻌﻲ ﻟﻠﺘﺒﺎﻳﻦ .ﻫﺬا ﻳﻌﻴﺪ ﺣﺪات اﻟﻘﻴﺎس إﱃ
ﺻﻮرﺗﻬﺎ اﻷﺻﻠﻴﺔ ،ﻳﻨﺘﺞ ﻣﻘﻴﺎﺳﺎ ﻟﻠﺘﺸﺘﺖ ﻳﺴﻤﱠ ﻰ »اﻻﻧﺤﺮا املﻌﻴﺎر « .ﰲ املﺜﺎ اﻟﺴﺎﺑﻖ،
ﻳﺘﻤﺜﻞ اﻻﻧﺤﺮا املﻌﻴﺎر ﻟﺪرﺟﺎت اﻟﻄﻼب ﰲ اﻻﺧﺘﺒﺎر ﰲ اﻟﺠﺬر اﻟﱰﺑﻴﻌﻲ ﻟﻠﻌﺪد ،٢٠٩٫٦
ﻫﻮ .١٤٫٥
ﻳﺘﻐﻠﺐ اﻻﻧﺤﺮا املﻌﻴﺎر ﻋﲆ املﺸﻜﻠﺔ اﻟﺘﻲ ﺟﺪﻧﺎﻫﺎ ﻣﻊ املﺪ ؛ ﻓﻬﻮ ﻳﺴﺘﺨﺪ
اﻟﺒﻴﺎﻧﺎت ﻛﺎﻓﺔ .ﻓﺈذا ﺗﺠﻤﻌﺖ ﻣﻌﻈﻢ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ ﺛﻴﻖ ﺟﺪٍّا ﻣﻌﺎ ،ﻣﻊ ﺟﻮد
ﻋﺪد ﻗﻠﻴﻞ ﻣﻦ اﻟﻨﻘﺎط اﻟﻨﺎﺋﻴﺔ ،ﻓﺴﻴﻌﻨﻲ ذﻟﻚ أ اﻻﻧﺤﺮا املﻌﻴﺎر ﺻﻐري .ﰲ املﻘﺎﺑﻞ،
إذا ﻛﺎﻧﺖ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت ﺗﺘﺨﺬ ﻗﻴﻤﺎ ﻣﺨﺘﻠﻔﺔ ﻟﻠﻐﺎﻳﺔ ،ﺣﺘﻰ إذا ﻛﺎﻧﺖ ﺗﺘﺨﺬ اﻟﻘﻴﻢ اﻷﻛﱪ
اﻷﺻﻐﺮ ﻧﻔﺴﻬﺎ ،ﻓﺈ اﻻﻧﺤﺮا املﻌﻴﺎر ﺳﻴﻜﻮ أﻛﱪ ﺑﻜﺜري.
) (3-2اﻻﻟﺘﻮاء
ﺗﺨﱪﻧﺎ ﻣﻘﺎﻳﻴﺲ اﻟﺘﺸﺘﺖ ﺑﻤﺪ اﻧﺤﺮا اﻟﻘﻴﻢ املﻔﺮدة ﺑﻌﻀﻬﺎ ﻋﻦ ﺑﻌﺾ ،ﻟﻜﻨﻬﺎ ﻻ ﺗﺨﱪﻧﺎ
ﺑﻄﺮﻳﻘﺔ اﻧﺤﺮاﻓﻬﺎ .ﺑﺎﻟﺘﺤﺪﻳﺪ ﻻ ﺗﺨﱪﻧﺎ ﻣﺎ إذا ﻛﺎﻧﺖ اﻻﻧﺤﺮاﻓﺎت اﻷﻛﱪ ﺗﻤﻴﻞ إﱃ أ ﺗﻜﻮ
ﻟﺪ اﻟﻘﻴﻢ اﻟﻜﱪ أ اﻟﻘﻴﻢ اﻟﺼﻐﺮ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت .ﺗﺬ ﱠﻛ ْﺮ ﻣﺜﺎﻟﻨﺎ ﻋﻦ ﻣﻮﻇﻔﻲ اﻟﴩﻛﺔ
اﻟﺨﻤﺴﺔ ،اﻟﺬ ﻳﺤﺼﻞ ﻓﻴﻪ أرﺑﻌﺔ ﻣﻮﻇﻔني ﻋﲆ ﺣﻮاﱄ ١٠٠٠٠د ﻻر ﺳﻨﻮﻳٍّﺎ ،ﺑﻴﻨﻤﺎ ﻳﺤﺼﻞ
ﻣﻮﻇﻒ اﺣﺪ ﻋﲆ ﺣﻮاﱄ ﻋﴩة أﺿﻌﺎ ذﻟﻚ .ﻣﻦ ﺷﺄ أ ﻣﻘﻴﺎس ﻟﻠﺘﺸﺘﺖ )اﻻﻧﺤﺮا
املﻌﻴﺎر ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ( أ ﻳﺨﱪﻧﺎ أ اﻟﻘﻴﻢ ﻣﺸﺘﺘﺔ ﻋﲆ ﻧﻄﺎ اﺳﻊ ﺟﺪٍّا ،ﻟﻜﻨﻪ ﻟﻦ
ﻳﺨﱪﻧﺎ أ إﺣﺪ اﻟﻘﻴﻢ أﻛﱪ ﺑﻜﺜري ﻣﻦ اﻟﻘﻴﻢ اﻷﺧﺮ .ﺑﺎﻟﻔﻌﻞ ،ﻓﺈ اﻻﻧﺤﺮا املﻌﻴﺎر
38
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻟﻠﻘﻴﻢ اﻟﺨﻤﺴﺔ ٩٠٠٠٠د ﻻر ٨٩٩٩٩ ،د ﻻرا ٨٩٩٩٨ ،د ﻻرا ٨٩٩٩٧ ،د ﻻرا ١ ،د ﻻر؛
ﻫﻮ ﺑﺎﻟﻀﺒﻂ ﻧﻔﺴﻪ ﻟﻠﻘﻴﻢ اﻟﺨﻤﺴﺔ اﻷﺻﻠﻴﺔ .املﺨﺘﻠﻒ ﻫﻨﺎ ﻫﻮ أ اﻟﻘﻴﻤﺔ اﻟﺸﺎذة )ﻗﻴﻤﺔ
١د ﻻر( اﻵ ﺻﻐرية ﺟﺪٍّا ﺑﺪﻻ ﻣﻦ ﻛﻮﻧﻬﺎ ﻛﺒرية ﺟﺪٍّا .ﻟﺮﺻﺪ ﻫﺬا اﻻﺧﺘﻼ ،ﻧﺤﺘﺎج إﱃ
إﺣﺼﺎﺋﻴﺔ أﺧﺮ ﻟﺘﻠﺨﻴﺺ اﻟﺒﻴﺎﻧﺎت ،إﺣﺼﺎﺋﻴﺔ ﺗﻀﻊ ﰲ اﻻﻋﺘﺒﺎر ﺗﻘﻴﺲ »ﻋﺪ اﻟﺘﻨﺎﻇﺮ« ﰲ
ﺗﻮزﻳﻊ اﻟﻘﻴﻢ .ﻳﺴﻤﱠ ﻰ أﺣﺪ أﻧﻮاع ﻋﺪ اﻟﺘﻨﺎﻇﺮ ﰲ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ »اﻻﻟﺘﻮاء« .ﻳﻌﺪ ﻣﺜﺎﻟﻨﺎ اﻷﺻﲇ
ﻟﺮ اﺗﺐ املﻮﻇﻔني ،اﻟﺬ ﻳﻤﺘﻠﻚ ﻗﻴﻤﺔ اﺣﺪة ﻛﺒرية ﻋﲆ ﻧﺤﻮ ﺷﺎذ ﺗﺒﻠﻎ ٩٩٩٩٩د ﻻرا،
»أﻳﻤﻦ اﻻﻟﺘﻮاء« )أ ﻣﻮﺟﺐ اﻻﻟﺘﻮاء(؛ ﻷ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ ﻳﻤﺘﻠﻚ »ذﻳﻼ« ﻃﻮﻳﻼ ﻳﻤﺘﺪ إﱃ ﻗﻴﻤﺔ
اﺣﺪة ﻛﺒرية ﻟﻠﻐﺎﻳﺔ ﻫﻲ ٩٩٩٩٩د ﻻرا .ﻟﻬﺬا اﻟﺘﻮزﻳﻊ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻘﻴﻢ اﻟﺼﻐﺮ ﻋﺪد
ﻗﻠﻴﻞ ﻟﻠﻐﺎﻳﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﻜﱪ .ﰲ املﻘﺎﺑﻞ ،ﻓﺈ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﺬﻛﻮر ﺳﺎﺑﻘﺎ ،اﻟﺬ ﻳﺘﻀﻤﻦ
ﺷﺬ ذا ﻋﻨﺪ ﻗﻴﻤﺔ ١د ﻻر ،ﻳﻜﻮ »أﻳﴪ اﻻﻟﺘﻮاء« )أ ﺳﺎﻟﺐ اﻻﻟﺘﻮاء(؛ ﻷ اﻟﺠﺰء اﻷﻛﱪ ﻣﻦ
اﻟﻘﻴﻢ ﻳﱰاﻛﻢ ﻣﻌﺎ ،ﻳﻮﺟﺪ ذﻳﻞ ﻃﻮﻳﻞ ﻳﻤﺘﺪ ﻟﻸﺳﻔﻞ ﻧﺤﻮ اﻟﻘﻴﻤﺔ املﻔﺮدة اﻟﺼﻐرية ﺟﺪٍّا.
اﻟﺘﻮزﻳﻌﺎت املﻮﺟﺒﺔ اﻻﻟﺘﻮاء ﺷﺎﺋﻌﺔ ﻛﺜريا ،املﺜﺎ اﻟﻜﻼﺳﻴﻜﻲ ﻋﻠﻴﻬﺎ ﻫﻮ ﺗﻮزﻳﻊ اﻟﺜﺮ ة،
اﻟﺬ ﻳﻤﺘﻠﻚ ﻓﻴﻪ اﻟﻌﺪﻳﺪ ﻣﻦ اﻷﻓﺮاد ﻣﺒﺎﻟﻎ ﺻﻐرية ﻓﻴﻤﺎ ﻳﻤﺘﻠﻚ ﻋﺪد ﻗﻠﻴﻞ ﻓﺤﺴﺐ ﻣﻦ
اﻷﻓﺮاد ﻣﻠﻴﺎرات ﻋﺪة ﻣﻦ اﻟﺪ ﻻرات .ﻳﻌ ﱡﺪ ﺗﻮزﻳﻊ ر اﺗﺐ ﻻﻋﺒﻲ اﻟﺒﻴﺴﺒﻮ ﰲ اﻟﺸﻜﻞ 1-2
ﺗﻮزﻳﻌﺎ ﻣﻮﺟﺐ اﻻﻟﺘﻮاء ﺑﺸﺪة.
39
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﺒﻴﺎﻧﺎت إﱃ ﴍاﺋﺢ ﻣﺌﻮﻳﺔ( .ﻫﻜﺬا ﻳﻤﻜﻦ ﺻﻒ ﺷﺨﺺ ﺑﺄﻧﻪ ﺣﻘﻖ ﻧﺘﻴﺠﺔ ﻓﻮ املﺆ ﱢ
اﻟﺨﺎﻣﺲ اﻟﺘﺴﻌني؛ ﻫﺬا ﻳﻌﻨﻲ أﻧﻪ ﰲ أﻋﲆ ٪٥ﻣﻦ ﻣﺠﻤﻮﻋﺔ اﻟﻨﺘﺎﺋﺞ .املﺼﻄﻠﺢ اﻟﻌﺎ —
اﻟﺬ ﻳﺘﻀﻤﻦ اﻟ ﱡﺮﺑﻴْﻊ اﻟﻌﺸ ْري املﺆ ﱠ ﻏريﻫﺎ ﻛﺤﺎﻻت ﺧﺎﺻﺔ — ﻫﻮ »املﻘﺎﻳﻴﺲ اﻟﺘﺠﺰﻳﺌﻴﺔ«.
40
اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ
اﻟﺒﻴﺎﻧﺎت اﻟﺨﺎ ﻣﺜﻞ اﻟﺒﻄﺎﻃﺲ اﻟﺨﺎ ؛ ﻋﺎدة ﻣﺎ ﺗﺘﻄﻠﺐ ﺗﻨﻈﻴﻔﺎ ﻗﺒﻞ اﻻﺳﺘﺨﺪا .
ر ﻧﺎﻟﺪ إﻳﻪ ﺛﻴﺴﺘﺪ
ﱢ
ﺗﻮﻓﺮ اﻟﺒﻴﺎﻧﺎت ﻧﺎﻓﺬة ﻋﲆ اﻟﻌﺎﻟﻢ ،ﻟﻜﻦ ﻣﻦ املﻬﻢ أ ﺗﻤﻨﺤﻨﺎ رؤﻳﺔ اﺿﺤﺔ .إ اﻟﻨﺎﻓﺬة
اﻟﺘﻲ ﺗﻌﺎﻧﻲ ﻣﻦ اﻟﺨﺪ ش أ اﻟﺘﺸﻮﻫﺎت أ ﺟﻮد ﻋﻼﻣﺎت ﻋﲆ زﺟﺎﺟﻬﺎ ﻣﻦ املﺮﺟﱠ ﺢ أ
ﺗﻀ ﱢﻠﻠﻨﺎ ﺣﻴﺎ ﻣﺎ ﻳﻜﻤﻦ راءﻫﺎ ،ﻳﻨﻄﺒﻖ اﻷﻣﺮ ﻧﻔﺴﻪ ﻋﲆ اﻟﺒﻴﺎﻧﺎت .ﻓﺈذا ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت
ﻣﺸﻮﱠﻫﺔ أ ﺗﺎﻟﻔﺔ ﺑﻄﺮﻳﻘﺔ ﻣﺎ ،ﻳﻤﻜﻦ ﺑﺴﻬﻮﻟﺔ أ ﺗﻨﺸﺄ ﻋﻨﻬﺎ اﺳﺘﻨﺘﺎﺟﺎت ﺧﺎﻃﺌﺔ .ﻋﻤﻮﻣﺎ،
ﻟﻴﺴﺖ ﻛﻞ اﻟﺒﻴﺎﻧﺎت ذات ﺟﻮدة ﻋﺎﻟﻴﺔ .ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻨﻨﻲ أ أﺗﻌﻤﻖ أﻛﺜﺮ أﺷري إﱃ أﻧﻪ
ﻣﻦ اﻟﻨﺎدر أ ﺗﻘﺎﺑﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻟﻴﺲ ﺑﻬﺎ ﻣﺸﺎﻛﻞ ﰲ اﻟﺠﻮدة ﻣﻦ أ ﻧﻮع ،رﺑﻤﺎ
إﱃ ﺣﺪ أﻧﻚ إذا ﻗﺎﺑﻠﺖ ﻣﺠﻤﻮﻋﺔ ﻣﻦ ﻣﺜﻞ ﻫﺬ اﻟﺒﻴﺎﻧﺎت »املﺜﺎﻟﻴﺔ« ﻓﻼ ﺑﺪ أ ﺗﺸﻚ ﻓﻴﻬﺎ.
رﺑﻤﺎ ﻳﺠﺐ ﻋﻠﻴﻚ ﻗﺘﻬﺎ أ ﺗﺴﺄ ﻋﻦ ﻋﻤﻠﻴﺎت اﻹﻋﺪاد اﻟﺘﻲ ﺧﻀﻌﺖ ﻟﻬﺎ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت،
اﻟﺘﻲ ﺗﺠﻌﻠﻬﺎ ﺗﺒﺪ ﻣﺜﺎﻟﻴﺔ .ﺳﻮ ﻧﻌﻮد إﱃ ﻣﺴﺄﻟﺔ اﻹﻋﺪاد ﻻﺣﻘﺎ.
ﺗﻤﻴﻞ اﻟﺘﻮﺻﻴﻔﺎت اﻟﻘﻴﺎﺳﻴﺔ ﻟﻸﻓﻜﺎر اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ املﻮﺟﻮدة ﰲ اﻟﻜﺘﺐ إﱃ
اﻓﱰاض أ اﻟﺒﻴﺎﻧﺎت ﻟﻴﺲ ﺑﻬﺎ ﻣﺸﺎﻛﻞ ) ﻫﻨﺎ ﻳﺼﻒ ﺧﱪاء اﻹﺣﺼﺎء اﻟﺒﻴﺎﻧﺎت ﺑﺄﻧﻬﺎ
»ﻧﻈﻴﻔﺔ« ،ﰲ ﻣﻘﺎﺑﻞ اﻟﺒﻴﺎﻧﺎت »املﻠﻮﺛﺔ« أ »اﻟﻔﻮﺿﻮﻳﺔ«( .ﻫﺬا أﻣﺮ ﻣﻔﻬﻮ ؛ ﻷ اﻟﻬﺪ ﻣﻦ
ﻫﺬ اﻟﻜﺘﺐ ﻫﻮ ﺻﻒ اﻟﻄﺮ ،ﻳﻨﺘﻘﺺ ﻣﻦ ﺿﻮح اﻟﻮﺻﻒ ﻗﻮ ﻣﺎ ﻳﺠﺐ اﻟﻘﻴﺎ ﺑﻪ إذا
ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت ﻟﻴﺴﺖ ﻛﻤﺎ ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ .ﻣﻊ ذﻟﻚ ،ﻓﺈ ﻫﺬا اﻟﻜﺘﺎب ﻣﺨﺘﻠﻒ إﱃ ﺣ ﱟﺪ
ﻧﻘﻞ ﻧﻜﻬﺔ املﺠﺎﻣﺎ؛ ﻓﺎﻟﻬﺪ ﻫﻨﺎ ﻟﻴﺲ ﺗﻌﻠﻴﻢ آﻟﻴﺎت اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ ،إﻧﻤﺎ ﺗﻘﺪﻳﻢ ْ
اﻟﺤﻘﻴﻘﻲ .ﻣﺠﺎ اﻹﺣﺼﺎء اﻟﺤﻘﻴﻘﻲ ﻳﻨﺒﻐﻲ أ ﻳﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﻠﻮﺛﺔ.
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻣﻦ أﺟﻞ ﺗﻮﺳﻴﻊ ﻣﻨﺎﻗﺸﺘﻨﺎ ،ﻧﺤﺘﺎج إﱃ ﻓﻬﻢ ﻣﺎ ﻳﻤﻜﻦ أ ﺗﻌﻨﻴﻪ »اﻟﺒﻴﺎﻧﺎت اﻟﻔﺎﺳﺪة«،
ﻛﻴﻔﻴﺔ اﻟﺘﻌﺮ ﻋﻠﻴﻬﺎ ،ﻣﺎذا ﻧﻔﻌﻞ ﺣﻴﺎﻟﻬﺎ .ﻟﺴﻮء اﻟﺤﻆ ،اﻟﺒﻴﺎﻧﺎت ﻣﺜﻞ اﻟﻨﺎس؛ ﻓﻴﻤﻜﻦ أ
»ﺗﻔﺴﺪ« ﺑﻌﺪد ﻏري ﻣﺤﺪ د ﻣﻦ اﻟﻄﺮ املﺨﺘﻠﻔﺔ .ﻣﻊ ذﻟﻚ ،ﻳﻤﻜﻦ ﺗﺼﻨﻴﻒ اﻟﻌﺪﻳﺪ ﻣﻦ ﻫﺬ
اﻟﻄﺮ ﻋﲆ أﻧﻬﺎ »ﻧﺎﻗﺼﺔ« أ »ﻏري ﺻﺤﻴﺤﺔ«.
42
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﻋﺎ ١٩٣٦ﰲ اﻟﻮﻻﻳﺎت املﺘﺤﺪة ﺑﺄﻏﻠﺒﻴﺔ ﺳﺎﺣﻘﺔ .ﻟﺴﻮء اﻟﺤﻆ ،ﻛﺎﻧﺖ اﻻﺳﺘﺒﻴﺎﻧﺎت ﻗﺪ أرﺳﻠﺖ
ﻓﻘﻂ ﻟﻸﺷﺨﺎص اﻟﺬﻳﻦ ﻟﺪﻳﻬﻢ ﻫﺎﺗﻒ ﺳﻴﺎرة ،ﰲ ﻋﺎ ١٩٣٦ﻛﺎ ﻫﺆﻻء اﻷﺷﺨﺎص أﻛﺜﺮ
ﺛﺮاء ﰲ املﺘﻮﺳﻂ ﻣﻦ إﺟﻤﺎﱄ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .ﻓﻜﺎ اﻷﺷﺨﺎص اﻟﺬﻳﻦ أرﺳﻠﺖ
إﻟﻴﻬﻢ اﻻﺳﺘﺒﻴﺎﻧﺎت ﻻ ﻳﻤﺜﻠﻮ ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ ﻛﻞ املﺠﻤﻮﻋﺔ املﻄﻠﻮﺑﺔ .ﻛﻤﺎ اﺗﻀﺢ ،اﻟﺠﺰء
اﻷﻛﱪ ﻣﻦ ﻏريﻫﻢ أﻳﱠﺪ ا ر زﻓﻠﺖ.
ﺛﻤﺔ ﻧﻮع آﺧﺮ ﻣﺨﺘﻠﻒ ﻣﻦ ﺣﺎﻟﺔ اﻻﺳﺘﻨﺘﺎﺟﺎت ﻏري اﻟﺼﺤﻴﺤﺔ اﻟﻨﺎﺷﺌﺔ ﻋﻦ ﻋﺪ ﻣﺮاﻋﺎة
اﻟﺒﻴﺎﻧﺎت املﻔﻘﻮدة ،اﻟﺬ أﺻﺒﺢ ﺣﺎﻟﺔ إﺣﺼﺎﺋﻴﺔ ﻛﻼﺳﻴﻜﻴﺔ ﺛﺎﻧﻮﻳﺔ .ﻫﺬ اﻟﺤﺎﻟﺔ ﻫﻲ ﺣﺎﻟﺔ
ﻣﻜﻮ اﻟﻔﻀﺎء »ﺗﺸﺎﻟﻨﺠﺮ« ،اﻟﺬ اﻧﻔﺠﺮ ﻋﻨﺪ إﻃﻼﻗﻪ ﰲ ﻋﺎ ١٩٨٦؛ ﻣﻤﺎ أﺳﻔﺮ ﻋﻦ ﻣﻘﺘﻞ
ﺟﻤﻴﻊ ﻣﻦ ﻛﺎﻧﻮا ﻋﲆ ﻣﺘْﻨﻪ .ﰲ اﻟﻠﻴﻠﺔ اﻟﺘﻲ ﺳﺒﻘﺖ اﻹﻃﻼ ،ﻋﻘﺪ اﺟﺘﻤﺎع ملﻨﺎﻗﺸﺔ ﻣﺎ إذا ﻛﺎ
ﻳﻨﺒﻐﻲ املﴤ ﻗﺪﻣﺎ ﰲ اﻹﻃﻼ أ ﻻ؛ ﺣﻴﺚ إ ﺗﻮﻗﻌﺎت درﺟﺔ اﻟﺤﺮارة ﰲ ﻣﻮﻋﺪ اﻹﻃﻼ
ﺗﺒني أﻧﻪ ﻋﲆ ﻣﺎ ﻳﺒﺪ ﻻ ﺗﻮﺟﺪ أﺷﺎرت إﱃ أﻧﻬﺎ ﻣﻨﺨﻔﻀﺔ ﻋﲆ ﻧﺤﻮ ﻛﺒري .أﻧﺘﺠﺖ ﺑﻴﺎﻧﺎت ﱢْ
ﻋﻼﻗﺔ ﺑني درﺟﺔ ﺣﺮارة اﻟﻬﻮاء اﻷﴐار اﻟﺘﻲ ﻟﺤﻘﺖ ﺑﺒﻌﺾ أرﺑﻄﺔ اﻟﺼﻮارﻳﺦ املﺴﺎﻋﺪة.
ﻣﻊ ذﻟﻚ ،ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت ﻏري ﻣﻜﺘﻤﻠﺔ ،ﻟﻢ ﺗﺸﻤﻞ ﺟﻤﻴﻊ ﻋﻤﻠﻴﺎت اﻹﻃﻼ اﻟﺘﻲ ﻟﻢ ﺗﻘﻊ
ﺑﻬﺎ »أ « أﴐار .ﻛﺎ ﻫﺬا ﻏري ﻣﻼﺋﻢ ﻷ ﻋﻤﻠﻴﺎت اﻹﻃﻼ اﻟﺘﻲ ﻟﻢ ﺗﻘﻊ ﻓﻴﻬﺎ أ أﴐار
أﺟﺮﻳﺖ ﰲ اﻟﻐﺎﻟﺐ ﰲ درﺟﺎت ﺣﺮارة أﻋﲆ .ﻛﺎ اﻟﺠﺪ املﺤﺘﻮ ﻋﲆ اﻟﺒﻴﺎﻧﺎت »ﻛﺎﻓﺔ«
ﺳﻴﻈﻬﺮ ﻋﻼﻗﺔ اﺿﺤﺔ؛ زﻳﺎدة اﺣﺘﻤﺎﻟﻴﺔ ﻗﻮع اﻟﴬر ﰲ درﺟﺎت اﻟﺤﺮارة اﻷﻗﻞ.
ﻛﻤﺜﺎ أﺧري ،اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻳﺘﻘﺪﻣﻮ ﺑﻄﻠﺒﺎت ﻟﻠﺤﺼﻮ ﻋﲆ ﻗﺮ ض ﻣﴫﻓﻴﺔ
ﺑﻄﺎﻗﺎت اﻻﺋﺘﻤﺎ ،ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ ،ﻳﺠﺮ ﺣﺴﺎب »ﻣﺠﻤﻮع اﻟﻨﻘﺎط اﻻﺋﺘﻤﺎﻧﻴﺔ« ﻟﻬﻢ؛ ﻫﻲ
ﺗﻠﻌﺐ د را أﺳﺎﺳﻴٍّﺎ ﰲ ﺗﻘﺪﻳﺮ اﺣﺘﻤﺎﻟﻴﺔ ﻋﺠْ ﺰﻫﻢ ﻋﻦ اﻟﺴﺪاد .ﺗﺴﺘﻤﺪ ﻫﺬ اﻟﺘﻘﺪﻳﺮات ﻣﻦ
اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ املﺒﻨﻴﺔ )ﻛﻤﺎ ﻫﻮ ﻣﻮﺿﺢ ﰲ اﻟﻔﺼﻞ اﻟﺴﺎدس( ﺑﺎﺳﺘﺨﺪا ﺑﻴﺎﻧﺎت ﻣﻦ
اﻟﻌﻤﻼء اﻟﺴﺎﺑﻘني اﻟﺬﻳﻦ ﺳﺪد ا دﻳﻮﻧﻬﻢ ﺑﺎﻟﻔﻌﻞ أ ﻋﺠﺰ ا ﻋﻦ اﻟﺴﺪاد .ﻟﻜﻦ ﺗﻮﺟﺪ ﻣﺸﻜﻠﺔ؛
ﻓﺎﻟﻌﻤﻼء اﻟﺴﺎﺑﻘﻮ ﻟﻴﺴﻮا ﻣﻤﺜﻠني ﻟﺠﻤﻴﻊ اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﺗﻘﺪﻣﻮا ﺑﻄﻠﺒﺎت ﻟﻠﺤﺼﻮ ﻋﲆ
ﻗﺮض .ﻓﺮﻏﻢ ﻛﻞ ﳾء ،اﺧﺘري اﻟﻌﻤﻼء اﻟﺴﺎﺑﻘﻮ ﻷﻧﻪ ﻛﺎ ﻳﻌﺘﻘﺪ أﻧﻬﻢ ﻣﺨﺎﻃﺮة ﻣﺄﻣﻮﻧﺔ.
ﻓﻠﻮ ﻛﺎ ﻫﺆﻻء املﺘﻘﺪﻣﻮ ﻋ ﱡﺪ ا ﻣﺨﺎﻃﺮة ﻏري ﻣﺄﻣﻮﻧﺔ ﰲ ﺣﺪ ذاﺗﻬﻢ ﻛﺎ ﻣﻦ املﺮﺟﺢ
أ ﻳﻌﺠﺰ ا ﻋﻦ اﻟﺴﺪاد ،ﻣﺎ ﻛﺎﻧﻮا ﻟﻴﻘﺒﻠﻮا ﰲ املﻘﺎ اﻷ ؛ ﻣﻦ ﺛ ﱠﻢ ﻟﻢ ﻳﻜﻮﻧﻮا ﻟﻴﺪﺧﻠﻮا ﰲ
اﻟﺒﻴﺎﻧﺎت .إ أ ﻧﻤﻮذج إﺣﺼﺎﺋﻲ ﻻ ﻳﺄﺧﺬ ﺑﻌني اﻻﻋﺘﺒﺎر ﻫﺬا اﻟﺘﺸﻮﻳﻪ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت
ﻣﻦ املﺮﺟﱠ ﺢ أ ﻳﺆ ﱢد إﱃ اﺳﺘﻨﺘﺎﺟﺎت ﺧﺎﻃﺌﺔ .ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﻳﻤﻜﻦ أ ﻳﻌﻨﻲ ﻫﺬا اﻧﻬﻴﺎر
اﻟﺒﻨﻚ.
43
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻛﺎﻧﺖ ﺑﻌﺾ اﻟﻘﻴﻢ ﻓﺤﺴﺐ ﻧﺎﻗﺼﺔ ﻟﻜﻞ ﺳﺠﻞ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ﺑﻌﺾ اﻹﺟﺎﺑﺎت ْ إذا
ﻋﲆ اﻻﺳﺘﺒﻴﺎ ( ،ﻳﻮﺟﺪ ﻧﻬﺠﺎ أﺳﺎﺳﻴﺎ ﺷﺎﺋﻌﺎ ﻟﻠﺘﺤﻠﻴﻞ .ﻳﺘﻤﺜﻞ أﺣﺪ اﻟﻨﻬﺠني ﺑﺒﺴﺎﻃﺔ ﰲ
ﻧﺒﺬ أ ﺳﺠﻼت ﻏري ﻣﻜﺘﻤﻠﺔ؛ ﻫﺬا ﻳﺘﻀﻤﻦ ﻧﻘﻄﺘﻲ ﺿﻌﻒ ﻣﺤﺘﻤﻠﺘني ﺧﻄريﺗني؛ أ ﻻﻫﻤﺎ:
أﻧﻪ ﻳﻤﻜﻦ أ ﻳﺆد ﻟﺘﺸﻮﻫﺎت ﻳﺴﺒﺒﻬﺎ اﻟﺘﺤﻴﺰ ﰲ اﻻﺧﺘﻴﺎر ﻣﻦ اﻟﻨﻮع اﻟﺬ ﻧﻮﻗﺶ آﻧﻔﺎ؛ ﻓﺈذا
ﻛﺎﻧﺖ ﺳﺠﻼت ﻣﻦ ﻧﻮع ﻣﻌني أﻛﺜﺮ ﻋﺮﺿﺔ ﻷ ﻳﻜﻮ ﺑﻌﺾ ﻗﻴﻤﻬﺎ ﻧﺎﻗﺼﺔ ،ﻓﺈ ﺣﺬ
ﻫﺬ اﻟﺴﺠﻼت ﺳﻮ ﻳﱰ ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎت ﻣﺸﻮﻫﺔ .ﻧﻘﻄﺔ اﻟﻀﻌﻒ اﻟﺨﻄرية اﻟﺜﺎﻧﻴﺔ ﻫﻲ
أﻧﻪ ﻳﻤﻜﻦ أ ﻳﺆد إﱃ اﻧﺨﻔﺎض ﻫﺎﺋﻞ ﰲ ﺣﺠﻢ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت املﺘﺎﺣﺔ ﻟﻠﺘﺤﻠﻴﻞ؛ ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎ ،ﻟﻨﻔﱰض أ اﺳﺘﺒﻴﺎﻧﺎ ﻳﺤﺘﻮ ﻋﲆ ﻣﺎﺋﺔ ﺳﺆا ،ﻣﻦ املﻤﻜﻦ ﺗﻤﺎﻣﺎ ﱠأﻻ ﻳﺠﻴﺐ
أ ﻣﺸﺎر ﰲ اﻟﺪراﺳﺔ ﻋﲆ »ﻛﻞ« ﺳﺆا ؛ ﻣﻦ ﺛﻢ ﻓﺈ »ﺟﻤﻴﻊ« اﻟﺴﺠﻼت ﺳﺘﺘﻀﻤﻦ ﺷﻴﺌﺎ
ﻧﺎﻗﺼﺎ؛ ﻫﺬا ﻳﻌﻨﻲ أ ﻧﺒﺬ اﻟﺮد د ﻏري املﻜﺘﻤﻠﺔ ﻣﻦ ﺷﺄﻧﻪ أ ﻳﺆد إﱃ ﻧﺒﺬ ﻛﺎﻓﺔ اﻟﺒﻴﺎﻧﺎت.
اﻟﻨﻬﺞ اﻟﺸﺎﺋﻊ اﻟﺜﺎﻧﻲ ملﻌﺎﻟﺠﺔ اﻟﻘﻴﻢ اﻟﻨﺎﻗﺼﺔ ﻫﻮ إدﺧﺎ ﻗﻴﻢ ﺑﺪﻳﻠﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،
ﻟﻨﻔﱰض أ ﺑﻨﺪ اﻟﻌﻤﺮ ﻧﺎﻗﺺ ﻣﻦ ﺑﻌﺾ اﻟﺴﺠﻼت ،ﻳﻤﻜﻨﻨﺎ ﺣﻴﻨﻬﺎ اﺳﺘﺒﺪا ﻣﺘﻮﺳﻂ
اﻷﻋﻤﺎر املﺴﺠﻠﺔ ﺑﺎﻟﻘﻴﻢ املﻔﻘﻮدة .ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أ ﻫﺬا ﻳﻨﺘﺞ ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎت ﻛﺎﻣﻠﺔ
)ﺳﻮاء أﻛﻤﻠﻬﺎ املﺸﺎرﻛﻮ ﰲ اﻟﺪراﺳﺔ أ أﻛﻤﻠﻨﺎﻫﺎ ﻧﺤﻦ( ،ﻓﺈﻧﻪ ﻟﻪ ﻋﻴﻮب أﻳﻀﺎ؛ ﻓﻔﻲ ﻫﺬ
اﻟﺤﺎﻟﺔ ﻧﻜﻮ ﻗﺪ اﺧﺘﻠﻘﻨﺎ اﻟﺒﻴﺎﻧﺎت ﰲ اﻷﺳﺎس.
إذا ﻛﺎ ﻫﻨﺎ ﺳﺒﺐ ﻟﻠﺸﻚ ﰲ أ ﻏﻴﺎب ﻋﺪد ﻣﻌني إﻧﻤﺎ ﻳﺮﺗﺒﻂ ﺑﺎﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻛﺎ
ﺳﻴﻤﺘﻠﻜﻬﺎ ﻟﻮ ﻛﺎ ﺣﺎﴐا )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا ﻛﺎ ﻛﺒﺎر اﻟﺴﻦ أﻗﻞ ﰲ اﺣﺘﻤﺎﻟﻴﺔ اﻟﺘﻌﺮﻳﻒ
ﺑﺴﻨﱢﻬﻢ( ،ﻓﺜﻤﺔ ﺣﺎﺟﺔ إﱃ ﺟﻮد أﺳﺎﻟﻴﺐ إﺣﺼﺎﺋﻴﺔ أﻛﺜﺮ ﺗﻔﺼﻴﻼ .ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ ﺑﻨﺎء
ﻧﻤﻮذج إﺣﺼﺎﺋﻲ ﻻﺣﺘﻤﺎﻟﻴﺔ ﻧﻘﺼﺎ اﻟﺒﻴﺎﻧﺎت — رﺑﻤﺎ ﻣﻦ اﻟﻨﻮع اﻟﺬ ﻳﺘﻨﺎ ﻟﻪ اﻟﻔﺼﻞ
اﻟﺴﺎدس — ﻛﺬﻟﻚ ﻟﻠﻌﻼﻗﺎت اﻷﺧﺮ املﻮﺟﻮدة داﺧﻞ اﻟﺒﻴﺎﻧﺎت.
ﻣﻦ اﻟﺠﺪﻳﺮ ﺑﺎﻟﺬﻛﺮ أﻧﻪ ﻣﻦ اﻟﴬ ر ﻗﺒﻮ ﺣﻘﻴﻘﺔ أﻧﻪ ﻟﻴﺴﺖ ﻛﻞ اﻟﻘﻴﻢ ﻗﺪ ﺳﺠﱢ ﻠﺖ.
ﻣﻦ املﻤﺎرﺳﺎت اﻟﺸﺎﺋﻌﺔ اﺳﺘﺨﺪا رﻣﺰ ﺧﺎص ﻟﻺﺷﺎرة إﱃ أ اﻟﻘﻴﻤﺔ ﻧﺎﻗﺼﺔ؛ ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎ ،ﻣﻦ اﻟﺸﺎﺋﻊ اﺳﺘﺨﺪا رﻣﺰ N/Aاﺧﺘﺼﺎرا ﻟﻌﺒﺎرة Not Availableﺑﻤﻌﻨﻰ »ﻏري
ﻣﺘﺎح« ،ﻟﻜﻦ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ﻳﺘﻢ اﺳﺘﺨﺪا رﻣﻮز رﻗﻤﻴﺔ ﻣﺜﻞ ٩٩٩٩ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻌﻤﺮ.
ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،اﻹﺧﻔﺎ ﰲ ﺟﻌﻞ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ ﻳﺪر أ ٩٩٩٩ﻳﻤﺜﻞ اﻟﻘﻴﻢ اﻟﻨﺎﻗﺼﺔ
ﻳﻤﻜﻦ أ ﻳﺆد إﱃ ﻧﺘﻴﺠﺔ ﻏري دﻗﻴﻘﺔ إﱃ ﺣ ﱟﺪ ﻛﺒري .ﺗﺨﻴﱠ ْﻞ ﻣﺎ ﺳﻴﻜﻮ ﻋﻠﻴﻪ ﻣﺘﻮﺳﻂ اﻟﻌﻤﺮ
املﻘﺪﱠر ﻋﻨﺪﻣﺎ ﻳﺪﺧﻞ ﻋﺪد ﻛﺒري ﻣﻦ اﻟﻘﻴﻢ ٩٩٩٩ﰲ ﻋﻤﻠﻴﺔ اﻟﺤﺴﺎب.
44
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﱠ
ﻣﺘﻮﻗﻌﺎ ،ﻻ ﻳﻮﺟﺪ ﺣ ﱞﻞ ﻣﺜﺎﱄ ﻟﻠﺒﻴﺎﻧﺎت اﻟﻨﺎﻗﺼﺔ؛ ﻋﻤﻮﻣﺎ ،ﻟﻌﻞ ﻫﺬا ﻳﻨﺒﻐﻲ أ ﻳﻜﻮ
ﻓﺠﻤﻴﻊ ﻃﺮ اﻟﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ ﺗﺘﻄﻠﺐ إﻗﺤﺎ ﻧﻮع ﻣﻦ اﻻﻓﱰاﺿﺎت اﻹﺿﺎﻓﻴﺔ ،اﻟﺤﻞ اﻷﻓﻀﻞ
ﻫﻮ ﺗﻘﻠﻴﻞ املﺸﻜﻠﺔ أﺛﻨﺎء ﻣﺮﺣﻠﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت.
45
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺗﺼﻠﻪ أﺧﻄﺎء اﻟﺘﺴﺠﻴﻞ ،ﻳﻤﻜﻦ أ ﺗﻌﻜﺲ اﻷرﻗﺎ ) ،٢٨ﺑﺪﻻ ﻣﻦ ،(٨٢أ ﻳﻤﻜﻦ اﻟﺨﻠﻂ
ﺑني اﻟﺮﻗﻢ ٧املﻜﺘﻮب ﺑﺨﻂ اﻟﻴﺪ ﻣﻊ اﻟﺮﻗﻢ ) ١ﻫﺬا أﻗﻞ اﺣﺘﻤﺎﻻ ﰲ أ ر ﺑﺎ؛ ﺣﻴﺚ إ ٧
ﻳﻜﺘﺐ ،(٧أ ﻗﺪ ﺗﻮﺿﻊ اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﻌﻤﻮد اﻟﺨﻄﺄ ﰲ اﻟﻨﻤﻮذج ،ﺑﻬﺬا ﺗﺘﻀﺎﻋﻒ اﻟﻘﻴﻢ
ﻣﺼﺎدﻓﺔ ﺑﻤﻘﺪار ﻋﴩة أﺿﻌﺎ ،أ رﺑﻤﺎ ﻳﺤﺪث ﺧﻠﻂ ﺑني اﻟﻨﻤﻂ اﻷﻣﺮﻳﻜﻲ ﻟﻜﺘﺎﺑﺔ اﻟﺘﺎرﻳﺦ
)ﺷﻬﺮ/ﻳﻮ /ﺳﻨﺔ( ﻧﻤﻂ املﻤﻠﻜﺔ املﺘﺤﺪة )ﻳﻮ /ﺷﻬﺮ/ﺳﻨﺔ( ،أ اﻟﻌﻜﺲ ،ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ.
ﰲ ﻋﺎ ،١٧٩٦ﻃﺮد اﻟﻔﻠﻜﻲ املﻠﻜﻲ ﻧﻴﻔﻴﻞ ﻣﺎﺳﻜﻴﻠني ﻣﺴﺎﻋﺪ دﻳﻔﻴﺪ ﻛﻴﻨﱪ ﻋﲆ أﺳﺎس
أ ﻣﺸﺎﻫﺪات اﻷﺧري ﻟﻸ ﻗﺎت اﻟﺘﻲ ﻳﻌﱪ ﻓﻴﻬﺎ ﻧﺠﻢ ﻣﺨﺘﺎر ﻟﺨﻂ اﻟﺰ ا ﻋﻦ ﻃﺮﻳﻖ أﺣﺪ
اﻟﺘﻠﺴﻜﻮﺑﺎت ﰲ ﺟﺮﻳﻨﺘﺶ ﻟﻢ ﺗﻜﻦ دﻗﻴﻘﺔ ﺟﺪٍّا .ﻛﺎ ﻫﺬا اﻷﻣﺮ ﻣﻬﻤٍّ ﺎ ﻷ دﻗﺔ اﻟﺴﺎﻋﺔ ﰲ
ﺟﺮﻳﻨﺘﺶ ﺗﺘﻮﻗﻒ ﻋﲆ اﻟﻘﻴﺎﺳﺎت اﻟﺪﻗﻴﻘﺔ ﻷ ﻗﺎت اﻟﻌﺒﻮر ،ﺗﻘﺪﻳﺮات ﺧﻄﻮط اﻟﻄﻮ ﻟﺪ
ﺳﻔﻦ اﻟﺪ ﻟﺔ ﺗﻌﺘﻤﺪ ﻋﲆ اﻟﺴﺎﻋﺔ ،اﻹﻣﱪاﻃﻮرﻳﺔ اﻟﱪﻳﻄﺎﻧﻴﺔ ﺗﻌﺘﻤﺪ ﻋﲆ ﺳﻔﻨﻬﺎ .ﻣﻊ ذﻟﻚ،
ﺗﺄﺧﺮ رد اﻟﻔﻌﻞ اﻟﻨﻔﴘ ﻇﺎﻫﺮة ﻓﴪ اﻟﺒﺎﺣﺜﻮ ﺑﻌﺪ ذﻟﻚ أﺳﺒﺎب ﻋﺪ اﻟﺪﻗﺔ ﻫﺬ ﰲ ﺿﻮء ﱡ ﱠ
اﻟﺘﻘﺮﻳﺐ اﻟﻼ اﻋﻲ املﺬﻛﻮرة أﻋﻼ .ﻛﻤﺜﺎ أﺧري ﻣﻦ ﺑني ﻛﺜري ﻣﻦ اﻷﻣﺜﻠﺔ اﻟﺘﻲ ﻛﺎ ﻳﻤﻜﻦ
أ أﺧﺘﺎرﻫﺎ ،أﺷﺎر ﺗﻌﺪاد اﻟﻮﻻﻳﺎت املﺘﺤﺪة ﻟﻌﺎ ١٩٧٠إﱃ ﺟﻮد ٢٨٩ﻓﺘﺎة رﻣﱢ ﻠﺖ ﻃ ﱢﻠﻘﺖ
ﰲ اﻟﻮﻗﺖ ﻧﻔﺴﻪ ﰲ ﺳﻦ .١٤ﻳﺠﺐ أ ﻧﻼﺣﻆ أﻳﻀﺎ ﻧﻘﻄﺔ ﻋﺎﻣﺔ ،ﻫﻲ أﻧﻪ ﻛﻠﻤﺎ زاد
ﺣﺠﻢ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ،زاد ﻋﺪد املﺸﺎرﻛني ﰲ ﺗﺠﻤﻴﻌﻬﺎ ،ﻛﻠﻤﺎ زادت املﺮاﺣﻞ املﺸﺎرﻛﺔ
ﰲ ﻣﻌﺎﻟﺠﺘﻬﺎ ،زاد اﺣﺘﻤﺎ اﺣﺘﻮاﺋﻬﺎ ﻋﲆ أﺧﻄﺎء.
ﻛﺜريا ﻣﺎ ﺗﻨﺸﺄ أﻣﺜﻠﺔ أﺧﺮ ﻷﺧﻄﺎء اﻟﺒﻴﺎﻧﺎت ﻣﻦ املﺴﺘﻮ اﻷدﻧﻰ ﻣﻦ ﺣﺪات اﻟﻘﻴﺎس،
ﻣﺜﻞ ﺗﺴﺠﻴﻞ اﻟﻄﻮ ﺑﺎملﱰ ﺑﺪﻻ ﻣﻦ اﻟﻘﺪ ،أ اﻟﻮز ﺑﺎﻟﺮﻃﻞ ﺑﺪﻻ ﻣﻦ اﻟﻜﻴﻠﻮﺟﺮا .ﰲ ﻋﺎ
،١٩٩٩ﻓﻘﺪ »ﻣﺴﺒﺎر ﻣﻨﺎخ املﺮﻳﺦ« ﻋﻨﺪﻣﺎ ﻓﺸﻞ ﰲ دﺧﻮ اﻟﻐﻼ اﻟﺠﻮ ﻟﻠﻤﺮﻳﺦ ﺑﺎﻟﺰا ﻳﺔ
اﻟﺼﺤﻴﺤﺔ ﺑﺴﺒﺐ اﻟﺨﻠﻂ ﺑني ﻗﻴﺎﺳﺎت اﻟﻀﻐﻂ ﺑﻮﺣﺪﺗﻲ اﻟﺮﻃﻞ اﻟﻨﻴﻮﺗﻦ .ﰲ ﻣﺜﺎ آﺧﺮ
ﻟﻠﺨﻠﻂ ﺑني ﺣﺪات اﻟﻘﻴﺎس — ﻫﺬ املﺮة ﰲ ﺳﻴﺎ ﻃﺒﻲ — ﻛﺎﻧﺖ ﻣﺴﺘﻮﻳﺎت اﻟﻜﺎﻟﺴﻴﻮ
ﰲ اﻟﺪ ﻋﻨﺪ ﺳﻴﺪة ﻣﺴﻨﱠﺔ ﻋﺎدة ﻣﺴﺘﻮﻳﺎت ﻋﺎدﻳﺔ ،ﰲ ﻧﻄﺎ ٨٫٦ﺣﺘﻰ ،٩٫١ﻟﻜﻦ ْ
ﺑﺪت
ﻓﺠﺄة أﻧﻬﺎ اﻧﺨﻔﻀﺖ إﱃ ﻗﻴﻤﺔ أﻗ ﱠﻞ ﻣﻦ ذﻟﻚ ﺑﻜﺜري ﺗﺒﻠﻎ .٤٫٨ﻛﺎﻧﺖ املﻤﺮﺿﺔ املﺴﺌﻮﻟﺔ
ﻋﲆ ﺷﻚ أ ﺗﺒﺪأ ﰲ ﺣﻘﻨﻬﺎ ﺑﺎﻟﻜﺎﻟﺴﻴﻮ ﻋﻨﺪﻣﺎ اﻛﺘﺸﻒ اﻟﺪﻛﺘﻮر ﺳﻠﻔﺎﺗﻮر ﺑﻴﻨﻔﻴﻨﺠﺎ
أ اﻻﻧﺨﻔﺎض اﻟﻈﺎﻫﺮ ﻛﺎ ﺑﺒﺴﺎﻃﺔ ﺑﺴﺒﺐ أ املﺨﺘﱪ ﻏري ﺣﺪات اﻟﻘﻴﺎس اﻟﺘﻲ ﻛﺎ
ﻣﲇﻳﺴﺘﺨﺪﻣﻬﺎ ﰲ ﺗﻘﺪﻳﻢ ﺗﻘﺎرﻳﺮ اﻟﻨﺘﺎﺋﺞ )ﻣﻦ ﻣ ﱢﻠﻴﺠﺮا ﻟﻜﻞ دﻳﺴﻴﻠﱰ )ﻋ ْﴩ اﻟﻠﱰ( إﱃ ﱢ
ﻣﻜﺎﻓﺊ ﻟﻜﻞ ﻟﱰ(.
46
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
) (4اﻹﻋﺪاد
ﻛﻤﺎ ﻳﺠﺐ أ ﻳﻜﻮ اﺿﺤﺎ ﻣﻦ اﻷﻣﺜﻠﺔ اﻟﺴﺎﺑﻘﺔ ،ﻓﺈ ﻋﻨﴫا أﺳﺎﺳﻴٍّﺎ أ ﻟﻴٍّﺎ ﰲ أ ﺗﺤﻠﻴﻞ
إﺣﺼﺎﺋﻲ ﻳﺘﻤﺜﻞ ﰲ اﻟﻔﺤﺺ اﻟﺪﻗﻴﻖ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺘﺤﻘﻖ ﻣﻦ ﺟﻮد اﻷﺧﻄﺎء ﺗﺼﺤﻴﺤﻬﺎ إ ْ
أﻣﻜﻦ .ﰲ ﺑﻌﺾ اﻟﺴﻴﺎﻗﺎت ،ﻳﻤﻜﻦ أ ﺗﺴﺘﻐﺮ ﻫﺬ املﺮﺣﻠﺔ اﻷ ﻟﻴﺔ ﻗﺘﺎ أﻃﻮ ﻣﻦ ﻣﺮاﺣﻞ
اﻟﺘﺤﻠﻴﻞ اﻟﻼﺣﻘﺔ.
ﺛﻤﺔ ﻣﻔﻬﻮ رﺋﻴﴘ ﰲ ﺗﻨﻈﻴﻒ اﻟﺒﻴﺎﻧﺎت ﻫﻮ »اﻟﻘﻴﻤﺔ اﻟﺸﺎذة« .اﻟﻘﻴﻤﺔ اﻟﺸﺎذة ﻫﻲ
ﻗﻴﻤﺔ ﺗﺨﺘﻠﻒ ﻛﺜريا ﻋﻦ اﻟﻘﻴﻢ اﻷﺧﺮ ،أ ﻋﻤﺎ ﻫﻮ ﻣﺘﻮﻗﻊ ،ﺗﻜﻮ ﺧﺎرﺟﺔ ﻋﻦ ذﻳﻞ اﻟﺘﻮزﻳﻊ.
أﺣﻴﺎﻧﺎ ﺗﺤﺪث ﻫﺬ اﻟﻘﻴﻢ املﺘﻄﺮﻓﺔ ﺑﻔﻌﻞ املﺼﺎدﻓﺔ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أ
ﻣﻌﻈﻢ ﺣﺎﻻت اﻟﻄﻘﺲ ﺗﻜﻮ ﻣﻌﺘﺪﻟﺔ إﱃ ﺣ ﱟﺪ ﻣﺎ ،ﻓﺈ اﻟﻌﻮاﺻﻒ اﻟﺸﺪﻳﺪة ﺗﺤﺪث ﺑﺎﻟﻔﻌﻞ ﰲ
ﺑﻌﺾ اﻷﺣﻴﺎ .ﻟﻜﻦ ﰲ ﺣﺎﻻت أﺧﺮ ﻳﻨﺸﺄ اﻟﺸﺬ ذ ﺑﺴﺒﺐ أﻧﻮاع اﻷﺧﻄﺎء املﻮﺿﺤﺔ ﺳﺎﺑﻘﺎ،
ﻣﺜﻞ ﻣﻘﻴﺎس ﺷﺪة اﻟﺮﻳﺢ اﻟﺬ ﻳﺸري ﻇﺎﻫﺮﻳٍّﺎ إﱃ ﻋﺎﺻﻔﺔ ﺿﺨﻤﺔ ﻣﻔﺎﺟﺌﺔ ﻣﻦ اﻟﺮﻳﺎح ﰲ
ﻛﻞ ﻣﻨﺘﺼﻒ ﻟﻴﻞ ،ﺗﺰاﻣﻨﺎ ﻣﻊ اﻟﻮﻗﺖ ﻧﻔﺴﻪ اﻟﺬ ﻳﻌﻴﺪ ﻓﻴﻪ ﺗﻠﻘﺎﺋﻴٍّﺎ ﻣﻌﺎﻳﺮة ﻧﻔﺴﻪ؛ ﻟﺬﻟﻚ
ﻳﻌﺪ اﻟﺒﺤﺚ ﻋﻦ اﻟﻘﻴﻢ اﻟﺸﺎذة اﺳﱰاﺗﻴﺠﻴﺔ ﻋﺎﻣﺔ ﺟﻴﺪة ﻟﻠﻜﺸﻒ ﻋﻦ اﻷﺧﻄﺎء ﰲ اﻟﺒﻴﺎﻧﺎت،
اﻟﺘﻲ ﻳﻤﻜﻦ ﺑﻌﺪ ذﻟﻚ اﻟﺘﺤﻘﻖ ﻣﻨﻬﺎ ﻋﻦ ﻃﺮﻳﻖ ﺷﺨﺺ ﻣﺎ .رﺑﻤﺎ ﺗﻜﻮ ﻫﺬ اﻟﻘﻴﻢ ﻗﻴﻤﺎ
47
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺷﺎذة ﺧﺎﺻﺔ ﺑﻤﺘﻐريات ﻣﻔﺮدة )ﻣﺜﻞ اﻟﺮﺟﻞ اﻟﺒﺎﻟﻎ ﻣﻦ اﻟﻌﻤﺮ ٢١٠ﺳﻨﻮات( ،أ ﻣﺘﻐريات
ﻣﺘﻌﺪدة ،ﻟﻴﺲ أ ﱞ ﻣﻨﻬﺎ ﻗﻴﻤﺔ ﺷﺎذة ﰲ ﺣﺪ ذاﺗﻪ )ﻣﺜﻞ اﻟﻔﺘﺎة اﻟﺒﺎﻟﻐﺔ ﻣﻦ اﻟﻌﻤﺮ ٥ﺳﻨﻮات
ﻟﺪﻳﻬﺎ ٣أﻃﻔﺎ (.
ﺣﻼ ﺷﺎﻣﻼ ﻟﻠﻜﺸﻒ ﻋﻦ اﻷﺧﻄﺎء ﰲ ﻛﺸﻒ اﻟﻘﻴﻤﺔ اﻟﺸﺎذة ﻟﻴﺲ ٍّﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ ْ ،
اﻟﺒﻴﺎﻧﺎت؛ ﻓﺮﻏﻢ ﻛﻞ ﳾء ،ﻳﻤﻜﻦ اﻟﻮﻗﻮع ﰲ أﺧﻄﺎء ﺗﺆد إﱃ ﻗﻴﻢ ﺗﻈﻬﺮ ﻃﺒﻴﻌﻴﺔ ﺗﻤﺎﻣﺎ.
ﻓﺮﺑﻤﺎ ﻳﺪرج ﺟﻨﺲ ﺷﺨﺺ ﻣﺎ ﻋﻦ ﻃﺮﻳﻖ اﻟﺨﻄﺄ ﻋﲆ أﻧﻪ أﻧﺜﻰ ﺑﺪﻻ ﻣﻦ ﻛﻮﻧﻪ ذﻛﺮا .أﻓﻀﻞ
ﺣﻞ ﻫﻮ ﺗﺒﻨﱢﻲ ﻣﻤﺎرﺳﺎت إدﺧﺎ ﺑﻴﺎﻧﺎت ﺗﻘﻠﻞ ﻣﻦ ﻋﺪد ﻣﻦ اﻷﺧﻄﺎء .ﺳﻨﺘﻨﺎ ﻫﺬا اﻷﻣﺮ
ﺑﺎﻟﺘﻔﺼﻴﻞ ﰲ ﺟﺰء ﺗﺎ .
إذا اﻛﺘﺸﻒ ﺧﻄﺄ اﺿﺢ ،ﺗﻮاﺟﻬﻨﺎ ﻣﺸﻜﻠﺔ ﻣﺎ ﻳﺠﺐ اﻟﻘﻴﺎ ﺑﻪ ﺣﻴﺎﻟﻪ .ﻳﻤﻜﻦ أ ﻧﺤﺬ
اﻟﻘﻴﻤﺔ ،ﻣﻌﺘﱪﻳﻦ أﻧﻬﺎ ﻗﻴﻤﺔ ﻧﺎﻗﺼﺔ ،ﺛﻢ ﻧﺤﺎ اﺳﺘﺨﺪا أﺣﺪ إﺟﺮاءات اﻟﻘﻴﻢ اﻟﻨﺎﻗﺼﺔ
املﺬﻛﻮرة ﺳﺎﺑﻘﺎ .أﺣﻴﺎﻧﺎ ﻳﻤﻜﻨﻨﺎ ﺿﻊ ﺗﺨﻤني ذﻛﻲ ملﺎ ﻛﺎ ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ ﻋﻠﻴﻪ ﻫﺬ
اﻟﻘﻴﻤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻟﻨﻔﱰض أﻧﻪ ﺧﻼ ﺗﺴﺠﻴﻞ أﻋﻤﺎر ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻄﻼب ،ﺣﺼﻞ
اﻟﺸﺨﺺ ﻋﲆ ﺳﻠﺴﻠﺔ اﻟﻘﻴﻢ .٢٣ ،١٨ ،١٨ ،٢١٠ ،١٩ ،٢٣ ،٢١ ،١٧ ،١٩ ،١٨ﺑﺪراﺳﺔ
ﻫﺬ اﻟﻘﻴﻢ ،رﺑﻤﺎ ﻧﻌﺘﻘﺪ أﻧﻪ ﻣﻦ املﺮﺟﺢ أ اﻟﻘﻴﻤﺔ ٢١٠ﻗﺪ دﺧﻠﺖ ﰲ اﻟﻌﻤﻮد اﻟﺨﻄﺄ ،أﻧﻪ
ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ .٢١ﺑﺎملﻨﺎﺳﺒﺔ ،ﻻﺣﻆ ﻋﺒﺎرة »ﺗﺨﻤني ذﻛﻲ« املﺴﺘﺨﺪﻣﺔ أﻋﻼ .ﻓﻜﻤﺎ
ﻫﻲ اﻟﺤﺎ ﻣﻊ ﻛﻞ ﺗﺤﻠﻴﻼت اﻟﺒﻴﺎﻧﺎت اﻹﺣﺼﺎﺋﻴﺔ ،ﻓﺈ اﻟﺘﻔﻜري املﺘﺄﻧﻲ أﻣﺮ ﺑﺎﻟﻎ اﻷﻫﻤﻴﺔ.
ﻓﻠﻴﺲ اﻷﻣﺮ ﻣﺠﺮد ﻣﺴﺄﻟﺔ اﺧﺘﻴﺎر ﻃﺮﻳﻘﺔ إﺣﺼﺎﺋﻴﺔ ﻣﻌﻴﻨﺔ ﺗﺮ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻟﻴﻘﻮ ﺑﺎﻟﻌﻤﻞ؛
ﻓﺎﻟﻜﻤﺒﻴﻮﺗﺮ ﻻ ﻳﻘﻮ إﻻ ﺑﺎﻟﻌﻤﻠﻴﺎت اﻟﺤﺴﺎﺑﻴﺔ ﺣﺴﺐ.
ﻛﺎ ﻣﺜﺎ أﻋﻤﺎر اﻟﻄﻼب ﰲ اﻟﻔﻘﺮة اﻟﺴﺎﺑﻘﺔ ﺻﻐريا ﻟﻠﻐﺎﻳﺔ؛ إذ ﻛﺎ ﻳﺤﺘﻮ ﻓﺤﺴﺐ
ﻋﲆ ﻋﴩة أرﻗﺎ ؛ ﻟﺬﻟﻚ ﻛﺎ ﻣﻦ اﻟﺴﻬﻞ اﻟﻨﻈﺮ ﻓﻴﻬﺎ ﺗﺤﺪﻳﺪ اﻟﻘﻴﻤﺔ اﻟﺸﺎذة ،ﺿﻊ
ﺗﺨﻤني ذﻛﻲ ﺣﻮ ﻣﺎ ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ ﻋﻠﻴﻪ ﻫﺬ اﻟﻘﻴﻤﺔ .ﻟﻜﻨﻨﺎ ﻧﻮاﺟﻪ ﻋﲆ ﻧﺤﻮ ﻣﺘﺰاﻳﺪ
ﻣﺠﻤﻮﻋﺎت ﺑﻴﺎﻧﺎت أﻛﱪ أﻛﱪ .إ ﻣﺠﻤﻮﻋﺎت اﻟﺒﻴﺎﻧﺎت املﻜﻮﻧﺔ ﻣﻦ ﻋﺪة ﻣﻠﻴﺎرات ﻣﻦ اﻟﻘﻴﻢ
ﺷﺎﺋﻌﺔ ﰲ اﻟﻮﻗﺖ اﻟﺤﺎﴐ ﰲ اﻟﺘﻄﺒﻴﻘﺎت اﻟﻌﻠﻤﻴﺔ )ﻣﺜﻞ ﺗﺠﺎرب اﻟﺠﺴﻴﻤﺎت( ،اﻟﺘﻄﺒﻴﻘﺎت
اﻟﺘﺠﺎرﻳﺔ )ﻣﺜﻞ اﻻﺗﺼﺎﻻت( ،ﻏريﻫﺎ ﻣﻦ املﺠﺎﻻت اﻷﺧﺮ .ﻏﺎﻟﺒﺎ ﻣﺎ ﺳﻴﻜﻮ ﻣﺴﺘﺤﻴﻼ ﺗﻤﺎﻣﺎ
اﺳﺘﻜﺸﺎ ﻛﻞ اﻟﻘﻴﻢ ﻳﺪ ﻳٍّﺎ ،ﻳﻜﻮ ﻋﻠﻴﻨﺎ أ ﻧﻌﺘﻤﺪ ﻋﲆ اﻟﻜﻤﺒﻴﻮﺗﺮ .ﻃﻮﱠر اﻹﺣﺼﺎﺋﻴﻮ
إﺟﺮاءات آﻟﻴﺔ ﻟﻠﻜﺸﻒ ﻋﻦ اﻟﻘﻴﻢ اﻟﺸﺎذة ،ﻟﻜﻨﻬﺎ ﻻ ﺗﺤﻞ املﺸﻜﻠﺔ ﺗﻤﺎﻣﺎ .رﺑﻤﺎ ﺗﻠﻔﺖ
اﻹﺟﺮاءات اﻵﻟﻴﺔ اﻻﻧﺘﺒﺎ ﻧﺤﻮ أﻧﻮاع ﻣﻌﻴﻨﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﻐﺮﻳﺒﺔ ،ﻟﻜﻨﻬﺎ ﺳﺘﺘﺠﺎﻫﻞ ﺳﻤﺎت
اﻟﻐﺮاﺑﺔ اﻟﺘﻲ ﻟﻢ ﺗﺨﱪ ﻋﻨﻬﺎ .ﺛﻢ ﻫﻨﺎ ﻣﺴﺄﻟﺔ ﻣﺎ ﻳﺠﺐ اﻟﻘﻴﺎ ﺑﻪ ﺣﻴﺎ اﻟﺸﺬ ذ اﻟﻈﺎﻫﺮ
48
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
اﻟﺬ ﻛﺸﻔﻪ اﻟﻜﻤﺒﻴﻮﺗﺮ .ﻻ ﺑﺄس ﰲ ﻫﺬا إذا ﻛﺎ رﻗﻤﺎ اﺣﺪا ﻣﻦ ﻫﺬ املﻠﻴﺎر رﻗﻢ ﻫﻮ
اﻟﺬ ﻛﺎ ﻣﻮﺿﻊ ﺷﻚ ،ﻟﻜﻦ ﻣﺎذا ﻟﻮ ﻛﺎ ﻣﺎﺋﺔ أﻟﻒ رﻗﻢ ﰲ ﻣﻮﺿﻊ ﺷﻚ؟ ﻣﺮة أﺧﺮ ،
اﻟﻔﺤﺺ اﻟﺘﺼﺤﻴﺢ ﻋﻦ ﻃﺮﻳﻖ اﻷﺷﺨﺎص ﻏري ﻋﻤﲇ .ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ ﻣﺜﻞ ﻫﺬ اﻟﺤﺎﻻت،
ﻃﻮﱠر اﻹﺣﺼﺎﺋﻴﻮ ﻣﺮة أﺧﺮ إﺟﺮاءات آﻟﻴﺔ ،ﻃﻮرت ﺑﻌﺾ ﻣﻦ أﻗﺪ أﺳﺎﻟﻴﺐ اﻟﺘﺤﺮﻳﺮ
اﻟﺘﺼﺤﻴﺢ اﻵﻟﻴﺔ ﺗﻠﻚ ﰲ ﺳﻴﺎ اﻟﺘﻌﺪادات اﻟﺪراﺳﺎت املﺴﺤﻴﺔ اﻟﻜﺒرية ،ﻟﻜﻨﻬﺎ دراﺳﺎت
ﻟﻴﺴﺖ ﻣﻌﺼﻮﻣﺔ ﻣﻦ اﻟﺨﻄﺄ .ﺧﻼﺻﺔ اﻟﻘﻮ أ اﻹﺣﺼﺎﺋﻴني ﻻ ﻳﺴﺘﻄﻴﻌﻮ — ﻟﻸﺳﻒ —
ﺻﻨﻊ املﻌﺠﺰات .إ ﺟﻮد ﺑﻴﺎﻧﺎت ردﻳﺌﺔ اﻟﺠﻮدة ﻳﺠﻌﻠﻨﺎ ﰲ ﺧﻄﺮ اﻟﺤﺼﻮ ﻋﲆ ﻧﺘﺎﺋﺞ
ردﻳﺌﺔ اﻟﺠﻮدة )ﺑﻤﻌﻨﻰ ﻏري دﻗﻴﻘﺔ ﺧﺎﻃﺌﺔ ﻋﺮﺿﺔ ﻟﻠﺨﻄﺄ( .أﻓﻀﻞ اﺳﱰاﺗﻴﺠﻴﺔ ﻟﺘﺠﻨﺐ
ذﻟﻚ ﻫﻲ اﻟﺤﺮص ﻋﲆ اﻟﺤﺼﻮ ﻋﲆ ﺑﻴﺎﻧﺎت ذات ﺟﻮدة ﻋﺎﻟﻴﺔ ﻣﻦ اﻟﺒﺪاﻳﺔ.
ﻃﻮرت اﻟﻌﺪﻳﺪ ﻣﻦ اﻻﺳﱰاﺗﻴﺠﻴﺎت ﻟﺘﺠﻨﺐ اﻷﺧﻄﺎء ﰲ اﻟﺒﻴﺎﻧﺎت ﰲ املﻘﺎ اﻷ ،ﻫﻲ
ﺗﺘﻨﻮع ﻓﻘﺎ ملﺠﺎ اﻟﺘﻄﺒﻴﻖ ﻃﺮﻳﻘﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻋﻨﺪﻣﺎ ﺗﻨﺴﺦ ﺑﻴﺎﻧﺎت
اﻟﺘﺠﺎرب اﻟﴪﻳﺮﻳﺔ ﻣﻦ اﺳﺘﻤﺎرات ﺳﺠﻞ اﻟﺤﺎﻟﺔ املﻜﺘﻮﺑﺔ ﺑﺎﻟﻴﺪ ،ﻳﻮﺟﺪ اﺣﺘﻤﺎ ﺣﺪ ث
أﺧﻄﺎء ﰲ ﻣﺮﺣﻠﺔ اﻟﻨﺴﺦ .ﺗﻘﻠﻞ ﻫﺬ اﻷﺧﻄﺎء ﻋﻦ ﻃﺮﻳﻖ ﺗﺮﺗﻴﺐ ﺗﻜﺮار إدﺧﺎ اﻟﺒﻴﺎﻧﺎت
ﻣﺮﺗني ﻋﻦ ﻃﺮﻳﻖ ﺷﺨﺼني ﻣﺨﺘﻠﻔني ﻳﻌﻤﻼ ﻋﲆ ﻧﺤﻮ ﻣﺴﺘﻘﻞ ،ﺛﻢ اﻟﺘﺤﻘﻖ ﻣﻦ ﺟﻮد
أ اﺧﺘﻼﻓﺎت .ﻋﻨﺪ اﻟﺘﻘﺪ ﻟﻠﺤﺼﻮ ﻋﲆ ﻗﺮض ،ﻓﺈ ﺑﻴﺎﻧﺎت اﻟﻄﻠﺐ )ﻣﺜﻞ اﻟﻌﻤﺮ اﻟﺪﺧﻞ
اﻟﺪﻳﻮ اﻷﺧﺮ ،ﻣﺎ إﱃ ذﻟﻚ( ﻳﻤﻜﻦ إدﺧﺎﻟﻬﺎ ﻣﺒﺎﴍة إﱃ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ ،ﻳﻤﻜﻦ
ﻟﱪاﻣﺞ اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﺘﻔﺎﻋﻠﻴﺔ اﻟﺘﺤﻘﻖ ﻣﻦ اﻷﺟﻮﺑﺔ ﺑﻴﻨﻤﺎ ﻳﺘﻢ إدﺧﺎﻟﻬﺎ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا
ﻛﺎ اﻟﺸﺨﺺ ﻣﺎﻟﻜﺎ ملﻨﺰ ،ﻓﻬﻞ ﺗﺸﻤﻞ دﻳﻮﻧﻪ اﻟﺮﻫﻦ اﻟﻌﻘﺎر ؟( ﻋﻤﻮﻣﺎ ،ﻳﺠﺐ ﺗﺼﻤﻴﻢ
اﻻﺳﺘﻤﺎرات ﻋﲆ ﻧﺤﻮ ﻳﻘﻠﻞ اﻷﺧﻄﺎء؛ ﻓﻼ ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ ﻣﻌﻘﺪة ﻋﲆ ﻧﺤﻮ ﻣﻔﺮط ،ﻳﺠﺐ
أ ﺗﻜﻮ ﺟﻤﻴﻊ اﻷﺳﺌﻠﺔ اﺿﺤﺔ .ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻣﻦ اﻷﻓﻜﺎر اﻟﺠﻴﺪة إﺟﺮاء دراﺳﺔ
ﻣﺴﺤﻴﺔ ﺗﺠﺮﻳﺒﻴﺔ ﺻﻐرية ﻟﻠﺘﻌﺮ ﻋﲆ أﻳﺔ ﻣﺸﻜﻼت ﰲ ﻋﻤﻠﻴﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ﻗﺒﻞ اﻻﻧﺘﻘﺎ
ﻟﻠﺘﻨﻔﻴﺬ اﻟﻔﻌﲇ.
ﺑﺎملﻨﺎﺳﺒﺔ ،ﺗﻌﺪ ﻋﺒﺎرة »ﺧﻄﺄ ﺣﺎﺳﻮﺑﻲ« ﻋﺒﺎرة ﻣﺄﻟﻮﻓﺔ ،ﻳﻌﺪ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻛﺒﺶ ﻓﺪاء
ﺷﺎﺋﻊ ﻋﻨﺪﻣﺎ ﺗﺤﺪث أﺧﻄﺎء ﰲ اﻟﺒﻴﺎﻧﺎت .ﻟﻜﻦ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻳﻔﻌﻞ ﻓﺤﺴﺐ ﻣﺎ ﻳﻘﺎ ﻟﻪ،
ﻣﺴﺘﺨﺪﻣﺎ اﻟﺒﻴﺎﻧﺎت املﻘﺪﱠﻣﺔ ﻟﻪ .ﻋﻨﺪﻣﺎ ﺗﺤﺪث اﻷﺧﻄﺎء ،ﻓﻠﻴﺲ ﻫﺬا ﺻﻨﻴﻌﺔ ﻳﺪ اﻟﻜﻤﺒﻴﻮﺗﺮ.
49
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﺘﻲ ﻻ ﻳﺴﺘﻄﻴﻊ املﺮء ﻓﻴﻬﺎ أ ﻳﺘﺪﺧﻞ ﰲ ﻋﻤﻠﻴﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ
اﺳﺘﻄﻼع ﺣﻮ اﻟﺘﻮﺟﻬﺎت اﻟﺬﻫﻨﻴﺔ ﻟﻸﺷﺨﺎص ﺣﻴﺎ اﻟﺴﻴﺎﺳﻴني )اﻧﻈﺮ أدﻧﺎ ( ،ﺗﺴﺄ ﻋﻴﻨﺔ
ﻣﻨﺎﺳﺒﺔ ﻣﻦ اﻷﺷﺨﺎص ﻋﻦ ﺷﻌﻮرﻫﻢ ،أ ﰲ دراﺳﺔ ﻟﺨﺼﺎﺋﺺ املﺠﺮات اﻟﺒﻌﻴﺪة ،ﺳﻮ
ﺗﺨﻀﻊ ﻫﺬ اﻟﺨﺼﺎﺋﺺ ﻟﻠﺮﺻﺪ اﻟﺘﺴﺠﻴﻞ .ﰲ ﻫﺬﻳﻦ املﺜﺎﻟني ،اﺧﺘﺎر اﻟﺒﺎﺣﺜﻮ ﺑﺒﺴﺎﻃﺔ
اﻷﺷﺨﺎص أ اﻷﺷﻴﺎء اﻟﺘﻲ ﺳﻴﺪرﺳﻮﻧﻬﺎ ﺛﻢ ﺳﺠﻠﻮا ﺧﺼﺎﺋﺺ ﻫﺆﻻء اﻷﺷﺨﺎص أ اﻷﺷﻴﺎء.
ﻻ ﺟﻮد ﻫﻨﺎ ﻟﻔﻜﺮة اﻟﻘﻴﺎ ﺑﴚء ﻣﺎ ﻟﻸﺷﺨﺎص أ املﺠﺮات ﻗﺒﻞ ﻗﻴﺎﺳﻬﺎ .ﰲ املﻘﺎﺑﻞ،
ﰲ اﻟﺪراﺳﺔ اﻟﺘﺠﺮﻳﺒﻴﺔ ﻳﺘﻼﻋﺐ اﻟﺒﺎﺣﺜﻮ ﻓﻌﻠﻴٍّﺎ ﺑﻌﻨﺎﴏ اﻟﺪراﺳﺔ ﺑﻄﺮﻳﻘﺔ ﻣﺎ؛ ﻋﲆ ﺳﺒﻴﻞ
أﺧﺬ اﻟﻘﻴﺎﺳﺎت .ﰲ املﺜﺎ ،ﰲ ﺗﺠﺮﺑﺔ ﴎﻳﺮﻳﺔ رﺑﻤﺎ ﻳﻌ ﱢﺮﺿﻮ املﺘﻄﻮﱢﻋني ﻟﺪ اء ﻣﻌني ﻗﺒﻞ ْ
ﺗﺠﺮﺑﺔ ﺗﺼﻨﻴﻌﻴﺔ ﻹﻳﺠﺎد اﻟﻈﺮ اﻟﺘﻲ ﺗﺴﻔﺮ ﻋﻦ أﻗﻮ ﻣﻨﺘﺞ ﻧﻬﺎﺋﻲ ،ﺳﻴﺠ ﱢﺮﺑﻮ ﻇﺮ ﻓﺎ
ﻣﺨﺘﻠﻔﺔ.
ﻳﺘﻤﺜﱠﻞ أﺣﺪ اﻟﻔﺮ اﻟﺠﻮﻫﺮﻳﺔ ﺑني اﻟﺪراﺳﺎت اﻟﺮﺻﺪﻳﺔ اﻟﺘﺠﺮﻳﺒﻴﺔ ﰲ أ اﻟﺪراﺳﺎت
اﻟﺘﺠﺮﻳﺒﻴﺔ أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ ﺑﻜﺜري ﰲ ﺗﺤﺪﻳﺪ اﻟﺴﺒﺐ املﺴﺒﺐ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻧﺨﻤﻦ
أ ﻃﺮﻳﻘﺔ ﻣﻌﻴﻨﺔ ﻟﺘﻌﻠﻴﻢ اﻷﻃﻔﺎ اﻟﻘﺮاءة )اﻟﻄﺮﻳﻘﺔ »أ« ﻣﺜﻼ( أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ ﻣﻦ ﻃﺮﻳﻘﺔ
أﺧﺮ )اﻟﻄﺮﻳﻘﺔ »ب«( .ﰲ دراﺳﺔ ﺻﻔﻴﺔ ،ﺳﻮ ﻧﻨﻈﺮ ﻟﻸﻃﻔﺎ اﻟﺬﻳﻦ ﺧﻀﻌﻮا ﻟﻠﺘﻌﻠﻴﻢ
ﺑﺎﺳﺘﺨﺪا إﺣﺪ اﻟﻄﺮﻳﻘﺘني ﻧﻘﺎر ﻗﺪرﺗﻬﻢ ﻋﲆ اﻟﻘﺮاءة .ﻟﻜﻨﻨﺎ ﻟﻦ ﻧﻜﻮ ﻗﺎدرﻳﻦ ﻋﲆ
اﻟﺘﺪﺧﻞ ﰲ ﺗﻮزﻳﻊ اﻷﻃﻔﺎ اﻟﺬﻳﻦ ﻳﺨﻀﻌﻮ ﻟﻠﻄﺮﻳﻘﺔ »أ« اﻟﺬﻳﻦ ﻳﺨﻀﻌﻮ ﻟﻠﻄﺮﻳﻘﺔ »ب«؛
ﻓﻬﺬا ﻳﺘﺤﺪد ﻣﻦ ﻗﺒﻞ ﺷﺨﺺ آﺧﺮ .ﻳﺴﺒﺐ ذﻟﻚ ﻣﺸﻜﻠﺔ ﻣﺤﺘﻤﻠﺔ؛ إذ ﻳﻌﻨﻲ أﻧﻪ ﻣﻦ املﻤﻜﻦ
أ ﺗﻮﺟﺪ اﺧﺘﻼﻓﺎت أﺧﺮ ﺑني ﻣﺠﻤﻮﻋﺘﻲ ﺗﻌ ﱡﻠﻢ اﻟﻘﺮاءة ،ﻓﻀﻼ ﻋﻦ ﻃﺮﻳﻘﺔ اﻟﺘﺪرﻳﺲ؛ ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎ ،ﻟﺘﻘﺪﻳﻢ ﺗﻮﺿﻴﺢ ﺻﺎرخ ،رﺑﻤﺎ ﻳﻠﺤﻖ املﺪ ﱢرس ﺟﻤﻴﻊ اﻷﻃﻔﺎ اﻟﺬﻳﻦ ﻳﺘﻌ ﱠﻠﻤﻮ
ﻋﲆ ﻧﺤﻮ أﴎع ﺑﺎﻟﻄﺮﻳﻘﺔ »أ«؛ أ رﺑﻤﺎ ﻛﺎ اﻷﻃﻔﺎ أﻧﻔﺴﻬﻢ ﻣﺴﻤﻮﺣﺎ ﻟﻬﻢ ﺑﺎﻻﺧﺘﻴﺎر،
ﻣﺎ أ ﻟﺌﻚ اﻷﻛﺜﺮ ﺗﻘﺪﻣﺎ ﺑﺎﻟﻔﻌﻞ ﰲ اﻟﻘﺮاءة إﱃ اﺧﺘﻴﺎر اﻟﻄﺮﻳﻘﺔ »أ« .إذا ﻛﻨﱠﺎ أﻛﺜﺮ ﺗﻤﺮﺳﺎ ﰲ
ﻣﺠﺎ اﻹﺣﺼﺎء ،ﻓﺮﺑﻤﺎ ﻧﺴﺘﺨﺪ أﺳﺎﻟﻴﺐ إﺣﺼﺎﺋﻴﺔ ﰲ ﻣﺤﺎ ﻟﺔ ﻟﻠﺴﻴﻄﺮة ﻋﲆ أ اﺧﺘﻼﻓﺎت
ﻣﻮﺟﻮدة ﻣﺴﺒﻘﺎ ﺑني اﻷﻃﻔﺎ ،ﻛﺬﻟﻚ اﻟﻌﻮاﻣﻞ اﻷﺧﺮ اﻟﺘﻲ ﻧﻌﺘﻘﺪ أﻧﻬﺎ ﻣﻦ املﺮﺟﱠ ﺢ أ ﺗﺆﺛﱢﺮ
ﻋﲆ ﻣﺪ ﴎﻋﺔ ﺗﻌﻠﻤﻬﻢ اﻟﻘﺮاءة .ﻟﻜﻦ ﺗﻈﻞ ﻫﻨﺎ داﺋﻤﺎ اﺣﺘﻤﺎﻟﻴﺔ ﺟﻮد ﺗﺄﺛريات أﺧﺮ
ﻟﻢ ﻧﻔ ﱢﻜﺮ ﻓﻴﻬﺎ ،اﻟﺘﻲ ﺗﺴﺒﺐ اﻟﻔﺮ .
ﺗﺘﻐﻠﺐ اﻟﺪراﺳﺎت اﻟﺘﺠﺮﻳﺒﻴﺔ ﻋﲆ ﻫﺬا اﻻﺣﺘﻤﺎ ﻋﻦ ﻃﺮﻳﻖ اﻻﺧﺘﻴﺎر املﺘﻌﻤﱠ ﺪ ﻟﻜﻞ ﻃﻔﻞ
ﻟﻠﻄﺮﻳﻘﺔ اﻟﺘﻲ ﻳﺪرس ﺑﻬﺎ؛ ﻓﺈذا ﻛﻨﱠﺎ ﻧﻌﺮ ﺑﺎﻟﻔﻌﻞ ﻛﻞ اﻟﻌﻮاﻣﻞ املﻤﻜﻨﺔ ،ﺑﺎﻹﺿﺎﻓﺔ إﱃ
ﻃﺮﻳﻘﺔ اﻟﺘﺪرﻳﺲ — اﻟﺘﻲ ﻳﻤﻜﻦ أ ﺗﺆﺛﱢﺮ ﻋﲆ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة — ﻳﻤﻜﻨﻨﺎ اﻟﺘﺄﻛﺪ ﻣﻦ
50
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﻧﻈﻦ أﱡ أ اﻟﺘﻮزﻳﻊ ﻋﲆ ﻃﺮﻳﻘﺘﻲ اﻟﺘﺪرﻳﺲ ﻛﺎ »ﻣﺘﻮازﻧﺎ«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا ﻛﻨﱠﺎ
اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة ﺗﺘﺄﺛﺮ ﺑﺎﻟﻌﻤﺮ ،ﻳﻤﻜﻨﻨﺎ ﺗﻮزﻳﻊ اﻟﻌﺪد ﻧﻔﺴﻪ ﻣﻦ اﻷﻃﻔﺎ اﻟﺼﻐﺎر ﻋﲆ ﻛﻞ
ﻃﺮﻳﻘﺔ .ﻫﻜﺬا ،ﻓﺈ أ اﺧﺘﻼﻓﺎت ﰲ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة ﻧﺎﺷﺌﺔ ﻋﻦ اﻟﻌﻤﺮ ﻟﻦ ﻳﻜﻮ ﻟﻬﺎ
أ ﺗﺄﺛري ﻋﲆ اﻟﻔﺮ ﺑني ﻣﺠﻤﻮﻋﺘﻴﻨﺎ؛ أ إﻧﻪ إذا ﻛﺎ ﻟﻠﻌﻤﺮ ﺗﺄﺛري ﻋﲆ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة،
ﻓﺈ اﻟﺘﺄﺛري ﺳﻴﻜﻮ ﻧﻔﺴﻪ ﰲ ﻛﻠﺘﺎ املﺠﻤﻮﻋﺘني .ﻣﻊ ذﻟﻚ ،ﺗﻤﺘﻠﻚ اﻟﺪراﺳﺎت اﻟﺘﺠﺮﻳﺒﻴﺔ
ﺳﻴﻠﺔ أﻛﺜﺮ ﻗﻮة ﰲ اﺧﺘﻴﺎر أ ﻃﻔﻞ ﻳﺨﻀﻊ ﻷ ﻃﺮﻳﻘﺔ ،اﻟﺘﻲ ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ »اﻟﺘﻮزﻳﻊ
اﻟﻌﺸﻮاﺋﻲ« ،ﺳﻮ أﺗﻨﺎ ذﻟﻚ ﻓﻴﻤﺎ ﻳﲇ:
ﻧﺘﻴﺠﺔ ﻫﺬا أﻧﻪ ﰲ اﻟﺪراﺳﺔ اﻟﺘﺠﺮﻳﺒﻴﺔ ﻳﻤﻜﻦ أ ﻧﻜﻮ أﻛﺜﺮ ﺛﻘﺔ ﺣﻴﺎ ﺳﺒﺐ أ
ﺗﺄﺛري ﻣﺮﺻﻮد .ﰲ ﺗﺠﺮﺑﺔ ﻣﻘﺎرﻧﺔ ﺗﻌﻠﻴﻢ اﻟﻘﺮاءة ،ﻳﻤﻜﻨﻨﺎ أ ﻧﻜﻮ أﻛﺜﺮ ﺛﻘﺔ أ أ ﻓ ْﺮ
ﰲ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة ﺑني املﺠﻤﻮﻋﺘني ﻫﻮ ﻧﺘﻴﺠﺔ ﻟﻄﺮﻳﻘﺔ اﻟﺘﻌﻠﻴﻢ ،ﻟﻴﺲ ﻧﺘﻴﺠﺔ ﻋﺎﻣﻞ
آﺧﺮ.
ﻟﻸﺳﻒ ،ﻟﻴﺲ ﻣﻦ املﻤﻜﻦ داﺋﻤﺎ إﺟﺮاء اﻟﺘﺠﺎرب ﺑﺪﻻ ﻣﻦ اﻟﺪراﺳﺎت اﻟﺮﺻﺪﻳﺔ .ﻓﻼ
ﻳﻤﻜﻨﻨﺎ ﻣﺜﻼ ﺗﻌﺮﻳﺾ املﺠﺮات املﺨﺘﻠﻔﺔ ﻟﻈﺮ ﻣﺨﺘﻠﻔﺔ! ﻋﲆ أ ﺣﺎ ،رﺑﻤﺎ ﻳﻜﻮ ﻣﻦ
املﻀ ﱢﻠﻞ ﰲ ﺑﻌﺾ اﻷ ﻗﺎت اﺳﺘﺨﺪا املﻨﻬﺞ اﻟﺘﺠﺮﻳﺒﻲ؛ ﻓﻔﻲ ﻛﺜري ﻣﻦ اﻟﺪراﺳﺎت املﺴﺤﻴﺔ
اﻻﺟﺘﻤﺎﻋﻴﺔ ،ﻳﺘﻤﺜﻞ اﻟﻬﺪ ﰲ ﻣﻌﺮﻓﺔ ﺣﺎ اﻟﺴﻜﺎ اﻟﺤﻘﻴﻘﻲ ،ﻻ ﰲ »ﻣﺎذا ﺳﻴﻜﻮ اﻟﺘﺄﺛري
اﻟﻨﺎﺗﺞ إذا ﻓﻌﻠﻨﺎ ﻛﺬا ﻛﺬا؟« ﻣﻊ ذﻟﻚ ،إذا ﻛﻨﱠﺎ ﻧﺮﻳﺪ ﺑﺎﻟﻔﻌﻞ أ ﻧﻌﺮ ﻣﺎذا ﺳﻴﻜﻮ ﺗﺄﺛري أ
ﺗﺪﺧﻞ ﻣﺤﺘﻤﻞ ،ﻓﺈ اﻟﺪراﺳﺎت اﻟﺘﺠﺮﻳﺒﻴﺔ ﺗﻌ ﱡﺪ اﺳﱰاﺗﻴﺠﻴﺔ أﻓﻀﻞ .ﻫﺬا اﻟﻨﻮع ﻣﻦ اﻟﺪراﺳﺎت ﱡ
اﺳﻊ اﻻﻧﺘﺸﺎر ﰲ ﻗﻄﺎع اﻟﺼﻨﺎﻋﺎت اﻟﺪ اﺋﻴﺔ اﻟﻄﺐ ﻋﻠﻢ اﻟﻨﻔﺲ ،ﻣﺠﺎ اﻟﺘﺼﻨﻴﻊ
اﻟﺼﻨﺎﻋﺎت اﻟﺘﺤﻮﻳﻠﻴﺔ ،ﻛﻤﺎ ﻳﺴﺘﺨﺪ ﻋﲆ ﻧﺤﻮ ﻣﺘﺰاﻳﺪ ﰲ ﺗﻘﻴﻴﻢ اﻟﺴﻴﺎﺳﺔ اﻻﺟﺘﻤﺎﻋﻴﺔ ﰲ
ﻣﺠﺎﻻت ﻣﺜﻞ إدارة ﻗﻴﻤﺔ اﻟﻌﻤﻼء.
ﻋﻤﻮﻣﺎ ،ﻋﻨﺪ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ﺑﻬﺪ إﺟﺎﺑﺔ أ اﺳﺘﻜﺸﺎ ﺑﻌﺾ اﻷﺳﺌﻠﺔ ،ﻛﻠﻤﺎ زادت
اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﺠﻤﻊ ،زادت دﻗﺔ اﻹﺟﺎﺑﺔ اﻟﺘﻲ ﻳﻤﻜﻦ اﻟﺤﺼﻮ ﻋﻠﻴﻬﺎ؛ ﻫﺬا ﻧﺘﻴﺠﺔ ﻟ »ﻗﺎﻧﻮ
اﻷﻋﺪاد اﻟﻜﺒرية« ،اﻟﺬ ﺳﻴﻨﺎﻗﺶ ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ .ﻟﻜﻦ ﺟﻤﻊ املﺰﻳﺪ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻳﻔﺮض
ﺗﻜﻠﻔﺔ أﻛﱪ .ﻟﺬﻟﻚ ﻓﻤﻦ اﻟﴬ ر اﻟﺘﻮﺻﻞ إﱃ ﺣ ﱟﻞ ﺳﻂ ﻣﻨﺎﺳﺐ ﺑني ﻛﻤﻴﺔ اﻟﺒﻴﺎﻧﺎت
اﻟﺘﻲ ﺗﺠﻤﻊ ﺗﻜﻠﻔﺔ ﺟﻤﻌﻬﺎ .ﺗﻘﺒﻊ ﺗﺨﺼﺼﺎت ﻓﺮﻋﻴﺔ ﻣﺘﻌﺪدة ﻣﻦ اﻹﺣﺼﺎء ﰲ ﻗﻠﺐ ﻫﺬ
اﻟﻌﻤﻠﻴﺔ ،ﻋﲆ ﺟﻪ اﻟﺨﺼﻮص ،ﻳﻌ ﱡﺪ »اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ« »ﻣﺴﺢ اﻟﻌﻴﻨﺎت« ﻧﻮﻋني ﻣﻦ
اﻟﺘﺨﺼﺼﺎت اﻟﺮﺋﻴﺴﻴﺔ.
51
ﻋﻠﻢ اﻹﺣﺼﺎء
52
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﺗﺮﻣﻴﺰﻫﺎ ﺑﺒﺴﺎﻃﺔ ﺑﺎﻟﺤﺮﻓني »س« »ص« د اﻹﺷﺎرة إﱃ ﻣﺎﻫﻴﺔ اﻟﻌﻼج .ﰲ ﻗﺖ ﻻﺣﻖ
ﻓﺤﺴﺐ — ﺑﻌﺪ أ ﻳﻜﺸﻒ اﻟﺘﺤﻠﻴﻞ أ »س« أﻓﻀﻞ ﻣﻦ »ص« — ﺗﻔﻚ ﺷﻔﺮة اﻟﱰﻣﻴﺰ،
ﻟﺘﻮﺿﻴﺢ أ »س« ﻫﻮ ﰲ ﺣﻘﻴﻘﺘﻪ اﻟﻌﻼج »أ« أ »ب«.
إ اﻟﺘﺠﺮﺑﺔ اﻟﴪﻳﺮﻳﺔ اﻟﺜﻨﺎﺋﻴﺔ املﺠﻤﻮﻋﺔ اﻟﺘﻲ ﺗﺴﺘﺨﺪ ﻋﻴﻨﺎت ﻋﺸﻮاﺋﻴﺔ ﺑﺴﻴﻄﺔ ﺟﺪٍّا،
ﻟﻬﺎ ﺻﻮر ﻣﻮﺳﻌﺔ اﺿﺤﺔ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ اﻟﺘﻮﺳﻊ ﻓﻴﻬﺎ ﻋﲆ اﻟﻔﻮر إﱃ أﻛﺜﺮ
ﱢ
أﻏري اﻷﻣﺜﻠﺔ .ﻳﺮﻏﺐ ﻣﺰارع ﰲ ﻣﻦ ﻣﺠﻤﻮﻋﺘﻲ ﻋﻼج .ﻣﻊ ذﻟﻚ ،ﻣﻦ أﺟﻞ اﻟﺘﻨﻮﻳﻊ ،ﺳﻮ
ﻣﻌﺮﻓﺔ أ ﱟ ﻣﻦ ﻣﺴﺘﻮﻳﺎت املﺎء املﻨﺨﻔﻀﺔ أ اﻟﻌﺎﻟﻴﺔ أﻓﻀﻞ ﻓﻴﻤﺎ ﻳﺨﺺ إﻧﺘﺎج ﻏﻠﺔ أﻛﱪ ﻣﻦ
املﺤﺎﺻﻴﻞ .ﻳﻤﻜﻨﻪ إﺟﺮاء ﺗﺠﺮﺑﺔ ﺑﺴﻴﻄﺔ ﺛﻨﺎﺋﻴﺔ املﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻨﻮع املﺬﻛﻮر ﺳﺎﺑﻘﺎ ﻟﺘﺤﺪﻳﺪ
ﻣﺘﻮﻗﻌﺔ ﺗﻤﺎﻣﺎ ،ﻓﺴﻮ ﻳﺮﻳﺪ ﺗﻌﺮﻳﺾ أﻛﺜﺮ ﻣﻦ ﱠ ﻫﺬا .ﺑﻤﺎ أﻧﻨﺎ ﻧﻌﻠﻢ أ اﻟﻨﺘﺎﺋﺞ ﻟﻴﺴﺖ
ﺻﻮﺑﺔ اﺣﺪة ملﺴﺘﻮ ﻣﻴﺎ ﻣﻨﺨﻔﺾ ،أﻛﺜﺮ ﻣﻦ ﺻﻮﺑﺔ اﺣﺪة ملﺴﺘﻮ ﻋﺎ ،ﺛﻢ ﻳﺤﺴﺐ
ﻣﺘﻮﺳﻂ اﻟﻐ ﱠﻠﺔ ﰲ ﻛﻞ ﻣﺴﺘﻮ ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻳﻘﺮر اﺳﺘﺨﺪا أرﺑﻊ ﺻﻮﺑﺎت ﻟﻜﻞ
ﻣﺴﺘﻮ .ﻫﺬا ﻫﻮ ﺑﺎﻟﻀﺒﻂ ﻧﻮع اﻟﺘﺼﻤﻴﻢ ﻧﻔﺴﻪ ﻛﻤﺎ ﰲ دراﺳﺔ ﻃﺮ اﻟﺘﺪرﻳﺲ اﻟﺴﺎﺑﻘﺔ.
ﻟﻜﻦ ﻟﻨﻔﱰض اﻵ أ املﺰارع ﻳﺮﻳﺪ أﻳﻀﺎ أ ﻳﻌﺮ أ ﱞ ﻣﻦ ﻣﺴﺘﻮﻳﺎت اﻷﺳﻤﺪة
املﻨﺨﻔﻀﺔ اﻟﻌﺎﻟﻴﺔ أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ .اﻟﴚء اﻟﺒﺪﻳﻬﻲ اﻟﻘﻴﺎ ﺑﻪ ﻫﻮ إﺟﺮاء ﺗﺠﺮﺑﺔ أﺧﺮ ﺛﻨﺎﺋﻴﺔ
ﺗﺘﻠﻘﻰ ﻣﺴﺘﻮ ﻣﻨﺨﻔﻀﺎ ﻣﻦ اﻷﺳﻤﺪة أرﺑﻌﺔ املﺠﻤﻮﻋﺔ؛ ﻫﺬ املﺮة ﺑﺎﺳﺘﺨﺪا أرﺑﻊ ﺻﻮﺑﺎت ﱠ
ﱠ
ﺗﺘﻠﻘﻰ ﻣﺴﺘﻮ ﻋﺎﻟﻴﺎ .ﻫﺬا ﺟﻴﺪ ﺟﺪٍّا ،ﻟﻜﻦ اﻹﺟﺎﺑﺔ ﻋﲆ ﻛﻼ اﻟﺴﺆاﻟني — اﻟﺴﺆا ﻋﻦ ﻣﺴﺘﻮ
املﺎء اﻟﺴﺆا ﻋﻦ ﻣﺴﺘﻮ اﻷﺳﻤﺪة — ﺗﺘﻄﻠﺐ ﻣﺎ ﻣﺠﻤﻮﻋﻪ ﺳﺖ ﻋﴩة ﺻﻮﺑﺔ .إذا ﻛﺎ
املﺰارع ﻣﻬﺘﻤٍّ ﺎ أﻳﻀﺎ ﺑﻔﻌﺎﻟﻴﺔ ﻣﺴﺘﻮﻳﺎت اﻟﺮﻃﻮﺑﺔ املﻨﺨﻔﻀﺔ اﻟﻌﺎﻟﻴﺔ ،درﺟﺔ اﻟﺤﺮارة،
ﺳﺎﻋﺎت اﻟﺘﻌﺮض ﻟﻀﻮء اﻟﺸﻤﺲ ،ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ؛ ﻓﺴﻨﺮ أﻧﻪ ﺳﻴﻜﻮ ﺑﺤﺎﺟﺔ ﻟﻌﺪد ﻛﺒري
ﻟﻠﻐﺎﻳﺔ ﻣﻦ اﻟﺼﻮﺑﺎت.
ﺗﻮﺟﺪ ﻃﺮﻳﻘﺔ ذﻛﻴﺔ ﻟﻠﻐﺎﻳﺔ ﻟﻼﻟﺘﻔﺎ ﺣﻮ ذﻟﻚ؛ ﻫﻲ ﺑﺎﺳﺘﺨﺪا ﻣﻔﻬﻮ ﺗﺼﻤﻴﻢ
اﻟﺘﺠﺎرب »اﻟﻌﺎﻣﻠﻴﺔ«؛ ﻓﺒﺪﻻ ﻣﻦ ﺗﻨﻔﻴﺬ ﺗﺠﺮﺑﺘني ﻣﻨﻔﺼﻠﺘني ،اﺣﺪة ﻟﻠﻤﻴﺎ اﺣﺪة ﻟﻸﺳﻤﺪة،
ﻳﺴﺘﻄﻴﻊ املﺰارع ﻣﻌﺎﻟﺠﺔ ﺻﻮﺑﺘني ﺑﺎﺳﺘﺨﺪا »أﺳﻤﺪة ﻣﻨﺨﻔﻀﺔ ،ﻣﺎء ﻣﻨﺨﻔﺾ« ،اﺛﻨﺘني
»ﻣﻨﺨﻔﻀﺔ ،ﻋﺎ « ،اﺛﻨﺘني »ﻋﺎﻟﻴﺔ ﻣﻨﺨﻔﺾ« ،اﺛﻨﺘني »ﻋﺎﻟﻴﺔ ،ﻋﺎ « .ﻫﺬا ﻳﺘﻄﻠﺐ ﻓﻘﻂ
ﺛﻤﺎﻧﻲ ﺻﻮﺑﺎت زراﻋﻴﺔ ،ﻣﻊ ذﻟﻚ ﻧﻈﻞ ﻧﻌﺎﻟﺞ أرﺑﻌﺎ ﻣﻨﻬﺎ ﺑﻤﺴﺘﻮ ﻣﻴﺎ ﻣﻨﺨﻔﺾ أرﺑﻌﺎ
ﺑﻤﺴﺘﻮ ﻣﻴﺎ ﻋﺎ ،ﻛﺬﻟﻚ أرﺑﻊ ﺻﻮﺑﺎت ﺑﻤﺴﺘﻮ أﺳﻤﺪة ﻣﻨﺨﻔﺾ أرﺑﻌﺎ ﺑﻤﺴﺘﻮ
أﺳﻤﺪة ﻋﺎ ؛ ﻣﻦ ﺛﻢ ﻓﺈ ﻧﺘﺎﺋﺞ اﻟﺘﺤﻠﻴﻞ ﺳﻮ ﺗﻜﻮ دﻗﻴﻘﺔ ﺗﻤﺎﻣﺎ ﻛﻤﺎ ﻟﻮ ﻛﻨﱠﺎ أﺟﺮﻳْﻨﺎ
ﺗﺠﺮﺑﺘني ﻣﻨﻔﺼﻠﺘني.
53
ﻋﻠﻢ اﻹﺣﺼﺎء
ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﺘﻠﻚ ﻫﺬا اﻟﺘﺼﻤﻴﻢ اﻟﻌﺎﻣﲇ )املﻴﺎ اﻷﺳﻤﺪة ﻛﻼﻫﻤﺎ »ﻋﺎﻣﻞ«( ﻣﻴﺰة إﺿﺎﻓﻴﺔ
ﺟﺬاﺑﺔ؛ ﻓﻬﻮ ﻳﺘﻴﺢ ﻟﻨﺎ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎ ﺗﺄﺛري ﻣﺴﺘﻮ اﻟﺴﻤﺎد ﻣﺨﺘﻠﻔﺎ ﻋﻨﺪ ﻣﺴﺘﻮﻳﻲ املﻴﺎ ؛
ﻓﺮﺑﻤﺎ ﻳﺨﺘﻠﻒ اﻟﻔﺮ ﺑني املﺤﺼﻮ ﻣﻊ ﻣﺴﺘﻮﻳﻲ اﻷﺳﻤﺪة املﻨﺨﻔﺾ اﻟﻌﺎﱄ ﰲ ﺣﺎﻟﺔ
اﺧﺘﻼ ﻣﺴﺘﻮ املﻴﺎ .ﻫﺬا ﻳﺴﻤﱠ ﻰ »ﺗﺄﺛري اﻟﺘﻔﺎﻋﻞ« ،ﻻ ﻳﻤﻜﻦ ﻓﺤْ ﺼﻪ ﰲ ﻧﻬْ ﺞ إﺟﺮاء
ﺗﺠﺮﺑﺘني ﻣﻨﻔﺼﻠﺘني.
ﺟﺮ اﻟﺘﻮﺳﻊ ﰲ ﻫﺬ اﻟﻔﻜﺮة اﻷﺳﺎﺳﻴﺔ ﺑﻄﺮ ﻋﺪﻳﺪة ﻹﻧﺘﺎج أد ات ﻗﻮﻳﺔ ﻟﻠﻐﺎﻳﺔ
ﻟﻠﺤﺼﻮ ﻋﲆ ﻣﻌﻠﻮﻣﺎت دﻗﻴﻘﺔ ﻣﻦ أﺟْ ﻞ اﻟﻮﺻﻮ ﻟﻠﺤ ﱢﺪ اﻷدﻧﻰ ﻣﻦ اﻟﺘﻜﻠﻔﺔ .ﻋﻨﺪ ﺿﻤﱢ ﻬﺎ
إﱃ ﻏريﻫﺎ ﻣﻦ أد ات اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ ،ﻣﺜﻞ اﻟﺘﻮاز اﻟﺘﻮزﻳﻊ اﻟﻌﺸﻮاﺋﻲ اﻟﺴﻴﻄﺮة ﻋﲆ
اﻟﺘﺄﺛريات املﻌﺮ ﻓﺔ ،ﻧﺘﺠﺖ ﺑﻌﺾ اﻟﺘﺼﺎﻣﻴﻢ اﻟﺘﺠﺮﻳﺒﻴﺔ املﺘﻄﻮرة ﻟﻠﻐﺎﻳﺔ.
أﺣﻴﺎﻧﺎ ﰲ اﻟﺘﺠﺎرب ﺗﻜﻮ اﻷﻣﻮر ﻏري اﻹﺣﺼﺎﺋﻴﺔ ﻣﻬﻤﱠ ﺔ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ اﻟﺘﺠﺎرب
اﻟﴪﻳﺮﻳﺔ اﻟﺪراﺳﺎت اﻟﻄﺒﻴﺔ دراﺳﺎت اﻟﺴﻴﺎﺳﺔ اﻻﺟﺘﻤﺎﻋﻴﺔ اﻷﺧﺮ ،رﺑﻤﺎ ﺗﻜﻮ اﻷﻣﻮر
اﻷﺧﻼﻗﻴﺔ ذات ﺻﻠﺔ؛ ﻓﻔﻲ ﺗﺠﺮﺑﺔ ﴎﻳﺮﻳﺔ ﺗﻘﺎر ﻋﻼﺟﺎ ﺟﺪﻳﺪا ﻣﻘﱰﺣﺎ ﻣﻊ ﻋﻼج ﻫﻤﻲ
ﱠ
ﺳﻴﺘﻠﻘ ْﻮ ﺷﻴﺌﺎ ﻟﻴﺲ ﻟﻪ ﻧﺼﻒ املﺮﴇ املﺘﻄﻮﱢﻋني )ﻏري ﻧﺸﻂ( ،ﺳﻨﻜﻮ ﻋﲆ ﻣﻌﺮﻓﺔ ﺑﺄ ﱠ ْ
أ ﺗﺄﺛري ﺑﻴﻮﻟﻮﺟﻲ .ﻫﻞ ﻫﺬا ﻣﻨﺎﺳﺐ؟ ﻫﻞ ﻳﻮﺟﺪ ﺧﻄﺮ أ ﻳﻌﺎﻧﻲ أ ﻟﺌﻚ اﻟﺬﻳﻦ ﻳﺘﻨﺎ ﻟﻮ
اﻟﻌﻼج اﻟﺠﺪﻳﺪ املﻘﱰح ﻣﻦ آﺛﺎر ﺟﺎﻧﺒﻴﺔ؟ ﻣﺜﻞ ﻫﺬ اﻷﺷﻴﺎء ﻳﺠﺐ أ ﺗﻜﻮ ﻣﺘﻮازﻧﺔ ﻣﻊ
ﺣﻘﻴﻘﺔ أ أﻋﺪادا ﻻ ﺗﺤﴡ ﻣﻦ املﺮﴇ ﰲ املﺴﺘﻘﺒﻞ ﺳﻮ ﻳﺴﺘﻔﻴﺪ ﻣﻤﱠ ﺎ ﻳﺘﻢ ﻣﻌﺮﻓﺘﻪ
ﺧﻼ اﻟﺘﺠﺮﺑﺔ.
ﺗﺨﻴﻞ أﻧﻪ ﻣﻦ أﺟﻞ إدارة اﻟﺒﻼد ﻋﲆ ﻧﺤﻮ ﻓﻌﺎ ،ﻧﻮ ﱡد أ ﻧﻌﺮ ﻣﺘﻮﺳﻂ اﻟﺪﺧﻞ ملﻠﻴﻮ
ﺷﺨﺺ ﻋﺎﻣﻞ ﻣﻦ اﻟﺮﺟﺎ اﻟﻨﺴﺎء ﰲ ﺑﻠﺪة ﻣﻌﻴﻨﺔ .ﻇﺎﻫﺮﻳٍّﺎ ،ﻳﻤﻜﻨﻨﺎ ﺗﺤﺪﻳﺪ ﻫﺬا ﻋﻦ ﻃﺮﻳﻖ
ﺳﺆا ﻛ ﱟﻞ ﻣﻨﻬﻢ ﻋﻦ دﺧﻠﻪ ،ﺣﺴﺎب ﻣﺘﻮﺳﻂ اﻟﻨﺘﺎﺋﺞ .أﻣﺎ ﻋﻤﻠﻴٍّﺎ ،ﻓﺈ ﻫﺬا ﺳﻴﻜﻮ ﺻﻌﺒﺎ
ﻟﻠﻐﺎﻳﺔ ،ﻳﻜﺎد ﻳﻜﻮ ﻣﺴﺘﺤﻴﻼ .ﻓﻀﻼ ﻋﻦ أ ﳾء آﺧﺮ ،ﻣﻦ املﺮﺟﱠ ﺢ أ ﻳﺘﻐري اﻟﺪﺧﻞ
ﻋﲆ ﻣﺪ اﻟﻮﻗﺖ اﻟﺬ ﺳﻴﺴﺘﻐﺮﻗﻪ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻓﺮﺑﻤﺎ ﻳﱰ ﺑﻌﺾ اﻟﻨﺎس ﻇﺎﺋﻔﻬﻢ أ
ﱡ
ﺗﻌﻘﺐ ﻳﺘﻠﻘﻰ اﻟﺒﻌﺾ اﻵﺧﺮ ﻋﻼ ات ،ﻣﺎ إﱃ ذﻟﻚ .ﻋﻼ ة ﻋﲆ ذﻟﻚ ،ﻓﺈ ﻳﻐري ﻧﻬﺎ ،رﺑﻤﺎ ﱠ
ﻛﻞ ﺷﺨﺺ ﺳﻴﻜﻮ ﻣﻜ ﱢﻠﻔﺎ ﻟﻠﻐﺎﻳﺔ .رﺑﻤﺎ ﻧﺤﺎ ﺧﻔﺾ اﻟﺘﻜﺎﻟﻴﻒ ﻣﻦ ﺧﻼ اﻻﻋﺘﻤﺎد ﻋﲆ
ْ
ﻟﻜﻦ ﻛﻤﺎ رأﻳْﻨﺎ ﺳﺎﺑﻘﺎ ﰲ اﻟﺤﺎﻟﺔ املﺘﻄ ﱢﺮﻓﺔ ﻟﻼﻧﺘﺨﺎﺑﺎت اﻟﻬﺎﺗﻒ ،ﻻ املﻘﺎﺑﻼت اﻟﺸﺨﺼﻴﺔ،
54
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
اﻟﺮﺋﺎﺳﻴﺔ ﰲ اﻟﻮﻻﻳﺎت املﺘﺤﺪة ﻟﻌﺎ ،١٩٣٦ﻳﻮﺟﺪ ﺧﻄﺮ ﻛﺒري ﺑﺄﻧﻨﺎ ﺳﻮ ﻧﻐﻔﻞ ﻋﻦ ﴍاﺋﺢ
ﻣﻬﻤﺔ ﻣﻦ اﻟﺴﻜﺎ .
ﻣﺎ ﻧﺤﺘﺎﺟﻪ ﻫﻮ ﻃﺮﻳﻘﺔ ﻣﺎ ﻟﺘﻘﻠﻴﻞ ﺗﻜﻠﻔﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ﻟﻜﻨﻬﺎ ﰲ ﻧﻔﺲ اﻟﻮﻗﺖ ﺗﺠﻌﻞ
اﻟﻌﻤﻠﻴﺔ أﴎع ،ﺗﺠﻌﻠﻬﺎ — إذا أﻣﻜﻦ — أﻛﺜﺮ دﻗﺔ أﻳﻀﺎ .ﺑﺼﻴﺎﻏﺔ اﻷﻣﺮ ﺑﻬﺬ اﻟﻄﺮﻳﻘﺔ،
ﺷﺎﻗﺔ ،ﻟﻜﻦ اﻷﻓﻜﺎر اﻷد ات اﻹﺣﺼﺎﺋﻴﺔ اﻟﺘﻲ ﺗﺘﻤﺘﻊ ﺑﻬﺬ رﺑﻤﺎ ﻳﺒﺪ اﻷﻣﺮ ﻛﺄﻧﻪ ﻣﻬﻤﺔ ﱠ
اﻟﺨﺼﺎﺋﺺ ﻣﻮﺟﻮدة .اﻟﻔﻜﺮة اﻟﺮﺋﻴﺴﻴﺔ ﻫﻲ ﻓﻜﺮة ﻗﺎﺑﻠﻨﺎﻫﺎ ﻋﺪة ﻣﺮات ﻣﻦ ﻗﺒﻞ؛ ﻫﻲ
ﻓﻜﺮة اﻟﻌﻴﱢﻨﺔ.
ﻟﻨﻔﱰض أﻧﻪ ﺑﺪﻻ ﻣﻦ ﻣﻌﺮﻓﺔ ﻣﺎ ﻳﺤﺼﻞ ﻋﻠﻴﻪ ﻛﻞ اﺣﺪ ﻣﻦ املﻠﻴﻮ ﻣﻮﻇﻒ ،ﺳﺄﻟﻨﺎ
ﺑﺒﺴﺎﻃﺔ أﻟﻒ ﻣﻮﻇﻒ ﻣﻨﻬﻢ .ﻟﻜﻦ ﻋﻠﻴﻨﺎ ﺑﻮﺿﻮح اﻵ أ ﻧﻜﻮ ﺣﺬرﻳﻦ ﺑﺸﺄ اﻷﻟﻒ
ﻣﻮﻇﻒ اﻟﺬﻳﻦ ﻧﺴﺄﻟﻬﻢ ﺑﺎﻟﻀﺒﻂ .أﺳﺒﺎب ذﻟﻚ ﻫﻲ ﰲ اﻷﺳﺎس اﻷﺳﺒﺎب ﻧﻔﺴﻬﺎ اﻟﺘﻲ دﻋﺘْﻨﺎ
ﻋﻨﺪﻣﺎ ﻛﻨﱠﺎ ﻧﺼﻤﱢ ﻢ اﻟﺘﺠﺮﺑﺔ اﻟﺜﻨﺎﺋﻴﺔ املﺠﻤﻮﻋﺔ اﻟﺒﺴﻴﻄﺔ إﱃ اﺗﺨﺎذ ﺧﻄﻮات ﻟﻀﻤﺎ أ اﻟﻔﺮ
ﺗﺘﻠﻘﻰ اﻟﻌﻼج »ب«؛ ﻟﺬاﱠ اﻟﻮﺣﻴﺪ ﺑني املﺠﻤﻮﻋﺘني ﻛﺎ أ اﺣﺪة ﱠ
ﺗﺘﻠﻘﻰ اﻟﻌﻼج »أ« اﻷﺧﺮ
ﻋﻠﻴﻨﺎ اﻵ أ ﻧﺘﺄﻛﺪ أ اﻷﺷﺨﺎص اﻷﻟﻒ املﺤﺪدﻳﻦ اﻟﺬﻳﻦ ﻧﺘﻮاﺻﻞ ﻣﻌﻬﻢ ﻳﻤﺜﻠﻮ املﻮﻇﻔني
املﻠﻴﻮ ﻋﲆ ﻧﺤﻮ ﺗﺎ .
ﱢ
ﻣﺎ اﻟﺬ ﻧﻌﻨﻴﻪ ﺑﻜﻠﻤﺔ »ﻣﻤﺜﻞ«؟ ﻋﲆ ﻧﺤﻮ ﻣﺜﺎﱄ ،ﻳﻨﺒﻐﻲ أ ﺗﻜﻮ ﻋﻴﱢﻨﺘﻨﺎ املﻜﻮﱠﻧﺔ ﻣﻦ
أﻟﻒ ﻣﻮﻇﻒ ﺗﺤﺘﻮ ﻋﲆ ﻧﺴﺒﺔ اﻟﺮﺟﺎ ﻧﻔﺴﻬﺎ املﻮﺟﻮدة ﰲ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ
ﻟﻠﺪراﺳﺔ ،اﻟﻨﺴﺒﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﺸﺒﺎب ،اﻟﻨﺴﺒﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﻌﺎﻣﻠني ﺑﺪ ا ﺟﺰﺋﻲ ،ﻣﺎ إﱃ
ذﻟﻚ .ﻧﺴﺘﻄﻴﻊ ﺿﻤﺎ ذﻟﻚ إﱃ ﺣ ﱟﺪ ﻣﺎ ﻣﻦ ﺧﻼ اﺧﺘﻴﺎر أﻟﻒ ﻣﻮﻇﻒ ﺑﺤﻴﺚ ﺗﻜﻮ ﻧﺴﺒﺔ
اﻟﺮﺟﺎ — ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ — ﺻﺤﻴﺤﺔ .ﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻳﻮﺟﺪ ﻗﻴﺪ ﻋﻤﲇ ملﺎ ﻳﻤﻜﻨﻨﺎ
ﻣﻮازﻧﺘﻪ ﻋﻤﺪا ﺑﻬﺬ اﻟﻄﺮﻳﻘﺔ.
ﺷﺎﻫﺪﻧﺎ ﻛﻴﻔﻴﺔ اﻟﺘﻌﺎﻣﻞ ﻣﻊ ﻫﺬ اﻟﺼﻌﻮﺑﺔ ﻋﻨﺪﻣﺎ ﺗﻨﺎ ﻟﻨﺎ اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ؛ ذﻟﻚ
ﻣﻦ ﺧﻼ »اﻟﺘﻮزﻳﻊ اﻟﻌﺸﻮاﺋﻲ« ﻟﻠﻤﺮﴇ ﻋﲆ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ املﺠﻤﻮﻋﺘني .ﰲ ﺣﺎﻟﺘﻨﺎ ﻫﺬ
ﺳﻨﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ ﻋﻦ ﻃﺮﻳﻖ »أﺧﺬ ﻋﻴﻨﺔ ﻋﺸﻮاﺋﻴﺔ« ﻣﻦ أﻟﻒ ﺷﺨﺺ ﻣﻦ ﻣﺠﻤﻮﻋﺔ املﻮﻇﻔني
اﻟﻜﻠﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .ﻣﺮة أﺧﺮ ،رﻏﻢ أ ﻫﺬا ﻻ ﻳﻀﻤﻦ أ اﻟﻌﻴﻨﺔ ﺳﺘﻜﻮ ﻣﺸﺎﺑﻬﺔ
ﰲ ﺗﻜﻮﻳﻨﻬﺎ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ،ﻓﺈ اﻻﺣﺘﻤﺎﻟﻴﺔ اﻷﺳﺎﺳﻴﺔ ﺗﺨﱪﻧﺎ أ ﻓﺮﺻﺔ
اﻟﺤﺼﻮ ﻋﲆ ﻋﻴﱢﻨﺔ ﻣﺨﺘﻠﻔﺔ ﻛﺜريا ﺿﺌﻴﻠﺔ ﺟﺪٍّا .ﺗﺤﺪﻳﺪا ،ﻳﱰﺗﺐ ﻋﲆ ذﻟﻚ أ اﺣﺘﻤﺎﻟﻴﺔ
أ ﺗﻜﻮ ﺗﻘﺪﻳﺮاﺗﻨﺎ ملﺘﻮﺳﻂ اﻟﺪﺧﻞ ،املﺴﺘﻤﺪﱠة ﻣﻦ اﻟﻌﻴﻨﺔ ،ﻣﺨﺘﻠﻔﺔ ﻛﺜريا ﻋﻦ ﻣﺘﻮﺳﻂ
اﻟﺪﺧﻞ ﰲ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ؛ ﺿﻌﻴﻔﺔ ﻟﻠﻐﺎﻳﺔ .ﰲ اﻟﻮاﻗﻊ ،ﺛﻤﺔ ﺧﺎﺻﻴﺘﺎ
55
ﻋﻠﻢ اﻹﺣﺼﺎء
56
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﺑﺬﻟﻚ؛ ﻓﺒﺪﻻ ﻣﻦ اﺧﺘﻴﺎر أﻟﻒ ﺷﺨﺺ ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﻋﺸﻮاﺋﻴٍّﺎ ،ﻓﺈ ﻫﺬا
اﻟﻨﻬﺞ ﻳﺨﺘﺎر )ﻣﺜﻼ( ﻋﴩ ﻣﺠﻤﻮﻋﺎت ﺗﺘﻜﻮ ﻛ ﱞﻞ ﻣﻨﻬﺎ ﻣﻦ ﻣﺎﺋﺔ ﺷﺨﺺ ،ﺑﺤﻴﺚ ﻳﻌﻴﺶ ﻛﻞ
اﻷﺷﺨﺎص ﰲ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﺑﻌﻀﻬﻢ ﺑﺎﻟﻘﺮب ﻣﻦ ﺑﻌﺾ .ﺑﺎملﺜﻞ ،ﻳﻤﻜﻨﻨﺎ اﻟﺘﺄﻛﺪ ﻣﻦ ﺗﺤﻘﻴﻖ
اﻟﺘﻮاز ﰲ ﺑﻌﺾ اﻟﻌﻮاﻣﻞ ،ﺑﺪﻻ ﻣﻦ ﻣﺠﺮد اﻻﻋﺘﻤﺎد ﻋﲆ إﺟﺮاء أﺧﺬ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ ،إذا
ﻓﺮﺿﻨﺎ اﻟﺘﻮاز ﻋﲆ ﻃﺮﻳﻘﺔ اﺧﺘﻴﺎر اﻟﻌﻴﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ أ ﻧﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ
ﻋﺪدا ﻣﻦ اﻟﻨﺴﺎء ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ،ﻧﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ ﻋﲆ ﻧﺤﻮ ﻣﻨﻔﺼﻞ
ﻋﺪدا ﻣﻦ اﻟﺮﺟﺎ ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ؛ ﺣﻴﺚ ﻳﺘﻢ اﺧﺘﻴﺎر اﻷﻋﺪاد ﺑﺤﻴﺚ ﺗﻜﻮ
ﻧﺴﺐ اﻟﺬﻛﻮر اﻹﻧﺎث ﻫﻲ ﻧﻔﺴﻬﺎ ﻛﻤﺎ ﻫﻲ اﻟﺤﺎ ﰲ املﺠﻤﻮﻋﺔ اﻹﺟﻤﺎﻟﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ.
ﻳﻘﺴﻢ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ ﻳﻌﺮ ﻫﺬا اﻹﺟﺮاء ﺑﺄﻧﻪ »اﻟﻄﺮﻳﻘﺔ اﻟﴩاﺋﺤﻴﺔ ﻷﺧﺬ اﻟﻌﻴﻨﺎت«؛ ﻷﻧﻪ ﱢ
اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ املﺪرﺟﺔ ﰲ إﻃﺎر اﻟﻌﻴﻨﺔ إﱃ ﴍاﺋﺢ )اﻟﺮﺟﺎ اﻟﻨﺴﺎء ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ(.
إذا ﻛﺎ املﺘﻐري املﺴﺘﺨﺪ ﰲ اﻟﴩاﺋﺢ )اﻟﺠﻨﺲ ﰲ ﻫﺬا املﺜﺎ ( ﻳﺮﺗﺒﻂ ارﺗﺒﺎﻃﺎ ﻗﻮﻳٍّﺎ ﺑﺎملﺘﻐري
اﻟﺬ ﻧﻬﺘﻢ ﺑﻪ )اﻟﺪﺧﻞ ﻫﻨﺎ( ،ﻳﻤﻜﻦ أ ﻳﺴﻔﺮ ﻫﺬا ﻋﻦ ﺗﺤﺴﻦ ﰲ اﻟﺪﻗﺔ ﻟﺤﺠﻢ اﻟﻌﻴﻨﺔ ﻧﻔﺴﻪ.
ﻋﻤﻮﻣﺎ ،ﰲ ﻋﻤﻠﻴﺔ املﻌﺎﻳﻨﺔ ،ﻧﻜﻮ ﻣﺤﻈﻮﻇني ﻟﻠﻐﺎﻳﺔ إذا ﺣﺼﻠﻨﺎ ﻋﲆ رد د ﻣﻦ ﺟﻤﻴﻊ
اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻧﺘﻮاﺻﻞ ﻣﻌﻬﻢ .ﻳﻮﺟﺪ داﺋﻤﺎ ﻣﻘﺪار ﻣﻦ ﻋﺪ اﻻﺳﺘﺠﺎﺑﺔ ،ﻫﺬا ﻳﻌﻮد ﺑﻨﺎ
إﱃ ﻣﺸﻜﻠﺔ اﻟﺒﻴﺎﻧﺎت اﻟﻨﺎﻗﺼﺔ اﻟﺘﻲ ﻧﺎﻗﺸﻨﺎﻫﺎ ﺳﺎﺑﻘﺎ ،ﻛﻤﺎ رأﻳﻨﺎ ،ﻳﻤﻜﻦ ﻟﻠﺒﻴﺎﻧﺎت اﻟﻨﺎﻗﺼﺔ
أ ﺗﺆد إﱃ ﻋﻴﻨﺔ ﻣﺘﺤﻴﺰة اﺳﺘﻨﺘﺎﺟﺎت ﻏري ﺻﺤﻴﺤﺔ .ﻓﺈذا رﻓﺾ اﻟﺬﻳﻦ ﻳﺤﺼﻠﻮ ﻋﲆ
ر اﺗﺐ ﻛﺒرية املﺸﺎرﻛﺔ ﰲ اﻟﺪراﺳﺔ ،ﻓﺴﻮ ﻧﺒﺨﺲ ﺗﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ اﻟﺪﺧﻞ ﰲ املﺠﻤﻮﻋﺔ
اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .ﺑﺴﺒﺐ ﻫﺬا ،ﻃﻮر ﺧﱪاء اﻟﺪراﺳﺎت املﺴﺤﻴﺔ ﻣﺠﻤﻮﻋﺔ ﻣﺘﻨﻮﻋﺔ ﻣﻦ
ﺳﺎﺋﻞ ﺗﻘﻠﻴﻞ ﺿﺒﻂ ﻋﺪ اﻻﺳﺘﺠﺎﺑﺔ ،ﺑﻤﺎ ﰲ ذﻟﻚ ﺗﻜﺮار اﻟﺘﻮاﺻﻞ ﻣﻊ ﻏري املﺴﺘﺠﻴﺒني
إﺟﺮاءات إﻋﺎدة اﻟﺘﻘﻴﻴﻢ اﻹﺣﺼﺎﺋﻲ.
ﺧﺎﺗﻤﺔ
ﺗﻨﺎ ﻫﺬا اﻟﻔﺼﻞ املﻮاد اﻟﺨﺎ ﻟﻺﺣﺼﺎﺋﻴﺎت؛ ﻫﻲ اﻟﺒﻴﺎﻧﺎت .ﻗﺪ ﺻﻴﻐﺖ ﺗﻘﻨﻴﺎت ﺟﻤﻊ
ﺑﻴﺎﻧﺎت ﻣﺘﻄﻮرة ﻋﲆ ﻳﺪ اﻹﺣﺼﺎﺋﻴني ﻟﻠﺤﺼﻮ ﻋﲆ أﻗﴡ ﻗﺪر ﻣﻦ املﻌﻠﻮﻣﺎت ﺑﺎﻟﺤﺪ اﻷدﻧﻰ
ﻣﻦ اﻟﺘﻜﻠﻔﺔ ،ﻟﻜﻦ ﺳﻴﻜﻮ ﻣﻦ اﻟﺴﺬاﺟﺔ اﻻﻋﺘﻘﺎد ﺑﺄﻧﻪ ﻳﻤﻜﻦ ﻋﺎدة اﻟﺤﺼﻮ ﻋﲆ ﺑﻴﺎﻧﺎت
ﻣﺜﺎﻟﻴﺔ .إ اﻟﺒﻴﺎﻧﺎت اﻧﻌﻜﺎس ﻟﻠﻌﺎﻟﻢ اﻟﺤﻘﻴﻘﻲ ،اﻟﻌﺎﻟﻢ اﻟﺤﻘﻴﻘﻲ ﱠ
ﻣﻌﻘﺪ .إدراﻛﺎ ﻟﻬﺬا،
ْ
ﻟﻜﻦ ﻣﻦ املﻬﻢ ﻃﻮر اﻹﺣﺼﺎﺋﻴﻮ أﻳﻀﺎ أد ات ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت ذات اﻟﺠﻮدة اﻟﺮدﻳﺌﺔ.
أ ﻧﺪر أ اﻹﺣﺼﺎﺋﻴني ﻟﻴﺴﻮا ﺳﺤﺮة .ﻳﻨﻄﺒﻖ اﻟﻘﻮ املﺄﺛﻮر اﻟﻘﺪﻳﻢ» :ﻣﺪﺧﻼت ﻋﺪﻳﻤﺔ
اﻟﻨﻔﻊ ﺗﺴﺎ ﻧﺘﺎﺋﺞ ﻋﺪﻳﻤﺔ اﻟﻨﻔﻊ« ﺗﻤﺎﻣﺎ ﻋﲆ اﻹﺣﺼﺎﺋﻴﺎت ﻛﻤﺎ ﻳﻨﻄﺒﻖ ﻋﲆ ﻛﻞ ﳾء آﺧﺮ.
57
اﻟﻔﺼﻞ اﻟﺮاﺑﻊ
اﻻﺣﺘﲈﻻت
أﻗﻮ ﻣﺎ إذا ﻛﺎﻧﺖ اﻟﻌﻤﻠﺔ ﺳﺘﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة أ اﻟﻜﺘﺎﺑﺔ ﺑﻌﺪ أ ﻋﻤﻠﻴﺔ إﻟﻘﺎء ﻣﻨﻔﺮدة،
ﻳﻤﻜﻨﻨﻲ أ أﻗﻮ ﺑﺜﻘﺔ ﻛﺒرية إﻧﻪ إذا أﻟﻘﻴﺖ اﻟﻌﻤﻠﺔ ﻋﺪة ﻣﺮات ﻓﺈﻧﻬﺎ ﺳﺘﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة
ﰲ ﺣﻮاﱄ ﻧﺼﻒ ﻋﺪد املﺮات ﺟﻪ اﻟﻜﺘﺎﺑﺔ ﰲ ﺣﻮاﱄ ﻧﺼﻒ ﻋﺪد املﺮات) .أﻓﱰض ﻫﻨﺎ أ
اﻟﻌﻤﻠﺔ »ﻋﻤﻠﺔ ﻣﺘﺰﻧﺔ« ،أﻧﻪ ﻻ ﺗﺴﺘﺨﺪ أ ﺧﺪﻋﺔ ﺑﺎﻷﻳﺪ أﺛﻨﺎء إﻟﻘﺎﺋﻬﺎ (.ﺛﻤﺔ ﻣﺜﺎ آﺧﺮ
ﰲ ﻫﺬا اﻟﻨﻄﺎ ﻫﻮ ﺗﺤﺪﻳﺪ ﻣﺎ إذا ﻛﺎ املﻮﻟﻮد ذﻛﺮا أ أﻧﺜﻰ؛ ﻓﺘﺤﺪﻳﺪ اﻟﺠﻨﺲ ﺧﻼ ﻋﻤﻠﻴﺔ
اﻟﺤﻤﻞ أﻣﺮ ﺧﺎﺿﻊ ﻟﻠﻤﺼﺎدﻓﺔ اﻟﺒﺤﺘﺔ ﻻ ﻳﻤﻜﻦ اﻟﺘﻨﺒﺆ ﺑﻪ .ﻟﻜﻨﻨﺎ ﻧﻌﺮ أﻧﻪ ﻋﲆ ﻣﺪار
اﻟﻌﺪﻳﺪ ﻣﻦ ﺣﺎﻻت اﻟﻮﻻدة ﻓﺈ أﻛﺜﺮ ﻣﻦ ﻧﺼﻒ ﻋﺪد املﻮاﻟﻴﺪ ﺑﻘﻠﻴﻞ ﺳﻴﻜﻮﻧﻮ ذﻛﻮرا.
ﺗﻌ ﱡﺪ ﻫﺬ اﻟﺴﻤﺔ اﻟﻄﺒﻴﻌﻴﺔ اﻟﻘﺎﺑﻠﺔ ﻟﻠﻤﻼﺣﻈﺔ ﻣﺜﺎﻻ ﻟﻠﻘﻮاﻧني اﻟﺘﻲ ﺗﺤﻜﻢ ﻋﺪ اﻟﻴﻘني،
ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ »ﻗﺎﻧﻮ اﻷﻋﺪاد اﻟﻜﺒرية« ﺑﺴﺒﺐ ﺣﻘﻴﻘﺔ أ اﻟﻨﺴﺒﺔ ﺗﻘﱰب أﻛﺜﺮ أﻛﺜﺮ
ﻣﻦ ﻗﻴﻤﺔ ﻣﻌﻴﻨﺔ )اﻟﻨﺼﻒ ﰲ ﺣﺎﻻت اﻟﻌﻤﻠﺔ املﺘﺰﻧﺔ ﻧﻮع ﺟﻨﺲ املﻮاﻟﻴﺪ( ﻛﻠﻤﺎ زاد ﻋﺪد
اﻟﺤﺎﻻت اﻟﺘﻲ ﻧﻨﻈﺮ ﻓﻴﻬﺎ .ﻟﻬﺬا اﻟﻘﺎﻧﻮ ﺗﺒﻌﺎت ﻣﺘﻌﺪدة ،ﻫﻮ اﺣﺪ ﻣﻦ أﻗﻮ اﻷد ات
اﻹﺣﺼﺎﺋﻴﺔ ﰲ ﺗﺮ ﻳﺾ ﻋﺪ اﻟﻴﻘني اﻟﺴﻴﻄﺮة ﻋﻠﻴﻪ اﻟﺴﻤﺎح ﻟﻨﺎ ﺑﺎﻻﺳﺘﻔﺎدة ﻣﻨﻪ .ﺳﻨﻌﻮد
إﻟﻴﻪ ﻻﺣﻘﺎ ﰲ ﻫﺬا اﻟﻔﺼﻞ ،ﻋﲆ ﻧﺤﻮ ﻣﺘﻜﺮر ﺧﻼ اﻟﻜﺘﺎب.
60
اﻻﺣﺘﻤﺎﻻت
ٍّ
ﻛﺎﻣﻼ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﺪﻳﻬﻴﺎت اﻟﺘﻲ ﻗﺪﻣﺖ »ﺣﺴﺎﺑﺎ« رﻳﺎﺿﻴٍّﺎ رﺳﻤﻴٍّﺎ ﻛﻮملﻮﺟﻮر
ﻟﻼﺣﺘﻤﺎﻻت .ﻣﻨﺬ ذﻟﻚ اﻟﺤني ،اﻋﺘﻤﺪ ﻧﻈﺎ اﻟﺒﺪﻳﻬﻴﺎت ﻫﺬا ﻋﺎملﻴٍّﺎ ﺗﻘﺮﻳﺒﺎ.
ﺗﻮﻓﺮ ﺑﺪﻳﻬﻴﺎت ﻛﻮملﻮﺟﻮر آﻟﻴﺔ ﻳﻤﻜﻦ ﻣﻦ ﺧﻼﻟﻬﺎ اﻟﺘﻌﺎﻣﻞ ﻣﻊ اﻻﺣﺘﻤﺎﻻت ،ﻟﻜﻨﻬﺎ ﱢ
ﺑﻨﻴﺔ رﻳﺎﺿﻴﺔ .ﻻﺳﺘﺨﺪا ﻫﺬ اﻟﺒﻨﻴﺔ ﻟﺘﻘﺪﻳﻢ ﺑﻴﺎﻧﺎت ﺣﻮ اﻟﻌﺎﻟﻢ اﻟﺤﻘﻴﻘﻲ ،ﻣﻦ اﻟﴬ ر
اﻹﺷﺎرة إﱃ ﻣﺎ ﺗﻤﺜﱢﻠﻪ اﻟﺮﻣﻮز املﻮﺟﻮدة ﰲ اﻵﻟﻴﺔ اﻟﺮﻳﺎﺿﻴﺔ املﻮﺟﻮدة ﰲ ﻫﺬا اﻟﻌﺎﻟﻢ؛ أ إﻧﻨﺎ
ﺑﺤﺎﺟﺔ إﱃ ﻗﻮ ﻣﺎ »ﺗﻌﻨﻴﻪ« اﻟﺮﻳﺎﺿﻴﺎت.
ﻳﻌني ﺣﺴﺎب اﻻﺣﺘﻤﺎﻻت أرﻗﺎﻣﺎ ﺑني ١ ٠ﻟﻸﺣﺪاث ﻏري املﺆﻛﺪة ﻟﺘﻤﺜﻴﻞ اﺣﺘﻤﺎﻟﻴﺔ
ﺣﺪ ﺛﻬﺎ .ﻳﻌﻨﻲ اﻻﺣﺘﻤﺎ ١أ ﻫﺬا اﻟﺤﺪث ﻣﺆﻛﺪ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،اﺣﺘﻤﺎ أﻧﻪ ﻟﻮ أ
أﺣﺪﻫﻢ ﻧﻈﺮ ﻣﻦ ﻧﺎﻓﺬة ﺣﺠﺮة ﻣﻜﺘﺒﻲ ﺑﻴﻨﻤﺎ ﻛﻨﺖ أﻛﺘﺐ ﻫﺬا اﻟﻜﺘﺎب ،ﻟﺮآﻧﻲ ﺟﺎﻟﺴﺎ إﱃ
ﻣﻜﺘﺒﻲ( .اﻻﺣﺘﻤﺎ ٠ﻳﻌﻨﻲ أ اﻟﺤﺪث ﻣﺴﺘﺤﻴﻞ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،اﺣﺘﻤﺎ أ ﺷﺨﺼﺎ
ﻣﺎ ﺳﻮ ﻳﻨﻬﻲ ﺳﺒﺎ ﻣﺎراﺛﻮ ﰲ ﻋﴩ دﻗﺎﺋﻖ( .ﺑﺎﻟﻨﺴﺒﺔ ﻟﺤﺪث ﻣﺎ »ﻳﻤﻜﻦ« أ ﻳﺤﺪث
ﻟﻜﻨﻪ ﻟﻴﺲ ﻣﺆﻛﺪا ﻻ ﻣﺴﺘﺤﻴﻼ ،ﻓﺈ رﻗﻤﺎ ﺑني ١ ٠ﻳﻤﺜﻞ »اﺣﺘﻤﺎ « ﺣﺪ ﺛﻪ.
إﺣﺪ ﻃﺮ اﻟﻨﻈﺮ إﱃ ﻫﺬا اﻟﺮﻗﻢ ﻫﻲ أﻧﻪ ﻳﻤﺜﻞ »درﺟﺔ اﻋﺘﻘﺎد« املﺮء أ اﻟﺤﺪث
ﺳﻮ ﻳﺤﺪث .ﺳﻮ ﻳﻤﺘﻠﻚ اﻷﺷﺨﺎص املﺨﺘﻠﻔﻮ ﻣﻌﻠﻮﻣﺎت أﻛﺜﺮ أ أﻗﻞ ﻣﺘﻌﻠﻘﺔ ﺑﻜﻮ
اﻟﺤﺪث ﺳﻴﻘﻊ أ ﻻ؛ ﻟﺬﻟﻚ رﺑﻤﺎ ﻳﺘﻮﻗﻊ أ ﻳﻤﺘﻠﻚ اﻷﺷﺨﺎص املﺨﺘﻠﻔﻮ درﺟﺎت ﻣﺨﺘﻠﻔﺔ ﻣﻦ
اﻻﻋﺘﻘﺎد؛ ﻫﺬا ﻳﻌﻨﻲ اﺣﺘﻤﺎﻻت ﻣﺨﺘﻠﻔﺔ ﻟﻬﺬا اﻟﺤﺪث .ﻟﻬﺬا اﻟﺴﺒﺐ ،ﺗﺴﻤﱠ ﻰ ﺟﻬﺔ اﻟﻨﻈﺮ
ﺗﻠﻚ ﺣﻴﺎ اﻻﺣﺘﻤﺎ اﻻﺣﺘﻤﺎ »اﻟﺬاﺗﻲ« أ »اﻟﺸﺨﴢ«؛ ﻓﻬﻲ ﺗﻌﺘﻤﺪ ﻋﲆ ﻣﻦ ﻳﻘﻴﱢﻢ اﻻﺣﺘﻤﺎ .
ﻣﻦ اﻟﻮاﺿﺢ أﻳﻀﺎ أ اﻻﺣﺘﻤﺎ ﻟﺪ اﻟﺸﺨﺺ رﺑﻤﺎ ﻳﺘﻐري ﻣﻊ ﺗﻮاﻓﺮ املﺰﻳﺪ ﻣﻦ املﻌﻠﻮﻣﺎت.
ﻓﺮﺑﻤﺎ ﺗﺒﺪأ ﺑﺎﺣﺘﻤﺎ — درﺟﺔ اﻋﺘﻘﺎد — ﺗﺒﻠﻎ ٢ / ١أ ﻋﻤﻠﺔ ﻣﻌﻴﻨﺔ ﺳﻮ ﺗﺴﺘﻘﺮ ﺟﻪ
اﻟﺼﻮرة ﻷﻋﲆ )ﻋﲆ أﺳﺎس ﺗﺠﺮﺑﺘﻚ اﻟﺴﺎﺑﻘﺔ ﻣﻊ ﻗﺬ ﻋﻤﻼت ﻣﻌﺪﻧﻴﺔ أﺧﺮ ( ،ﻟﻜﻦ ﺑﻌﺪ
ﻣﺮاﻗﺒﺔ اﺳﺘﻘﺮار اﻟﻌﻤﻠﺔ ﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ ١٠٠ﻣﺮة ﻣﺘﺘﺎﻟﻴﺔ د اﺳﺘﻘﺮارﻫﺎ ﻋﲆ ﺟﻪ
اﻟﻜﺘﺎﺑﺔ ﻗﻂ ،رﺑﻤﺎ ﺗﺼﺒﺢ ﻣﺘﺸﻜﻜﺎ ﺗﻐري اﺣﺘﻤﺎﻻﺗﻚ اﻟﺸﺨﺼﻴﺔ ﺑﺄ ﺗﺴﺘﻘﺮ ﻫﺬ اﻟﻌﻤﻠﺔ
ﻋﲆ ﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ.
ﻗﺪ ﻃﻮرت أد ات ﻟﺘﻘﺪﻳﺮ اﻻﺣﺘﻤﺎﻻت اﻟﺬاﺗﻴﺔ ﻟﻸﻓﺮاد ﻋﲆ أﺳﺎس اﺳﱰاﺗﻴﺠﻴﺎت
املﺮاﻫﻨﺔ ،ﻟﻜﻦ ﻛﻤﺎ ﻫﻲ اﻟﺤﺎ ﻣﻊ أ إﺟﺮاء ﻟﻠﻘﻴﺎس ،ﺛﻤﺔ ﻗﻴﻮد ﻋﻤﻠﻴﺔ ﻋﲆ ﻣﺪ دﻗﺔ
ﺗﻘﺪﻳﺮ اﻻﺣﺘﻤﺎﻻت.
ﺗﺘﻤﺜﻞ ﺟﻬﺔ ﻧﻈﺮ ﻣﺨﺘﻠﻔﺔ ﻻﺣﺘﻤﺎﻻت ﻗﻮع ﺣﺪث ﻣﺎ ﰲ أﻧﻬﺎ ﻋﺪد ﻣﺮات ﻗﻮع ﻫﺬا
اﻟﺤﺪث إذا ﺗﻜﺮرت اﻟﻈﺮ ﻋﲆ ﻧﺤﻮ ﻣﺘﻄﺎﺑﻖ ﻟﻌﺪد ﻻ ﻧﻬﺎﺋﻲ ﻣﻦ املﺮات .ﻳﻌ ﱡﺪ ﻣﺜﺎ
61
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻗﺬ اﻟﻌﻤﻠﺔ املﺘﺰﻧﺔ اﻟﺴﺎﺑﻖ ﺗﻮﺿﻴﺤﺎ ﻟﻬﺬا؛ ﻓﻘﺪ رأﻳﻨﺎ أﻧﻪ ﺑﻴﻨﻤﺎ ﺗﻘﺬ اﻟﻌﻤﻠﺔ ،ﻓﺈ ﻧﺴﺒﺔ
ﻇﻬﻮر اﻟﺼﻮرة ﺗﻘﱰب أﻛﺜﺮ أﻛﺜﺮ ﻣﻦ ﻗﻴﻤﺔ ﻣﺤﺪدة .ﺗﻌ ﱠﺮ ﻫﺬ اﻟﻘﻴﻤﺔ ﻋﲆ أﻧﻬﺎ اﺣﺘﻤﺎ
اﺳﺘﻘﺮار اﻟﻌﻤﻠﺔ ﻋﲆ ﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ ﰲ أ ﻋﻤﻠﻴﺔ ﻗﺬ اﺣﺪة .ﻧﻈﺮا ﻟﺪ ر اﻟﺘﻜﺮارات،
أ ﻋﺪد املﺮات ،ﰲ ﺗﺤﺪﻳﺪ ﻫﺬا اﻟﺘﻔﺴري ﻟﻼﺣﺘﻤﺎﻻت ،ﻓﺈﻧﻪ ﻳﺴﻤﻰ اﻟﺘﻔﺴري »اﻟﺘﻜﺮار «.
ﺗﻤﺎﻣﺎ ﻛﻤﺎ ﻫﻲ اﻟﺤﺎ ﻣﻊ اﻟﻨﻬﺞ اﻟﺬاﺗﻲ ،ﺗﻮﺟﺪ ﻗﻴﻮد ﻋﻤﻠﻴﺔ ﺗﻤﻨﻌﻨﺎ ﻣﻦ إﻳﺠﺎد
ﺣﻘﺎ ﻇﺮ ﻓﺎاﻻﺣﺘﻤﺎﻻت اﻟﺘﻜﺮارﻳﺔ ﺑﺎﻟﻀﺒﻂ؛ ﻓﻌﻤﻠﻴﺘﺎ ﻗﺬ ﻟﻌﻤﻠﺔ ﻣﺎ ﻻ ﻳﻤﻜﻦ أ ﺗﻤﺘﻠﻜﺎ ٍّ
ﻣﺘﻄﺎﺑﻘﺔ ﺗﻤﺎﻣﺎ؛ ﻓﺴﻮ ﺗﺒﲆ ﺑﻌﺾ اﻟﺠﺰﻳﺌﺎت ﻣﻦ اﻟﻌﻤﻠﺔ ﰲ اﻟﺮﻣﻴﺔ اﻷ ﱃ ،ﺳﺘﺨﺘﻠﻒ
ﻤﺎس ﻣﻊ اﻷﺻﺎﺑﻊ ﰲ املﺮة ﺗﻴﺎرات اﻟﻬﻮاء ،ﺳﱰﺗﻔﻊ درﺟﺔ ﺣﺮارة اﻟﻌﻤﻠﺔ ﻗﻠﻴﻼ ﺟﺮاء اﻟﺘﱠ ﱢ
اﻷ ﱃ .ﻋﲆ أ ﺣﺎ ﺳﻴﻜﻮ ﻋﻠﻴﻨﺎ ﻗﻒ ﻗﺬ اﻟﻌﻤﻠﺔ ﰲ ﻗﺖ ﻣﺎ؛ ﻟﺬﻟﻚ ﻻ ﻳﻤﻜﻨﻨﺎ ﻗﺬﻓﻬﺎ
ﻓﻌﻠﻴٍّﺎ ﻟﻌﺪد ﻻ ﻧﻬﺎﺋﻲ ﻣﻦ املﺮات.
ﻫﺬا اﻟﺘﻔﺴريا املﺨﺘﻠﻔﺎ ملﺎ ﺗﻌﻨﻴﻪ اﻻﺣﺘﻤﺎﻻت ﻟﻬﻤﺎ ﺧﺼﺎﺋﺺ ﻣﺨﺘﻠﻔﺔ .ﻓﻴﻤﻜﻦ
اﺳﺘﺨﺪا اﻟﻨﻬﺞ اﻟﺬاﺗﻲ ﻟﺘﻌﻴني اﺣﺘﻤﺎ ﻣﻌني ﻟﺤﺪث ﻓﺮﻳﺪ ﻣﻦ ﻧﻮﻋﻪ؛ ﺣﺪث ﻳﻜﻮ اﻟﺘﻔﻜري
ﰲ ﺗﻜﺮار ﰲ ﻇﻞ ﻇﺮ ﻣﻤﺎﺛﻠﺔ ﻟﻌﺪد ﻻ ﻧﻬﺎﺋﻲ — أ ﺣﺘﻰ ﻋﺪد ﻛﺒري — ﻣﻦ املﺮات
ﻻ ﻣﻌﻨﻰ ﻟﻪ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻟﻴﺲ ﻫﻨﺎ ﻣﻌﻨﻰ ﻻﻗﱰاح ﻋﻤﻞ ﺳﻠﺴﻠﺔ ﻻ ﻧﻬﺎﺋﻴﺔ ﻣﻦ
املﺤﺎ ﻻت املﺘﻄﺎﺑﻘﺔ ﻻﻏﺘﻴﺎ اﻟﺮﺋﻴﺲ املﻘﺒﻞ ﻟﻠﻮﻻﻳﺎت املﺘﺤﺪة ،ﺑﺤﻴﺚ ﻳﺆد ﺑﻌﻀﻬﺎ ﻟﻨﺘﻴﺠﺔ
ﻣﺎ اﻟﺒﻌﺾ اﻵﺧﺮ ﻟﻨﺘﻴﺠﺔ أﺧﺮ ؛ ﻟﺬﻟﻚ ﻳﺒﺪ ﻣﻦ اﻟﺼﻌﺐ ﺗﻄﺒﻴﻖ اﻟﺘﻔﺴري اﻟﺘﻜﺮار ﻋﲆ
ﻣﺜﻞ ﻫﺬا اﻟﺤﺪث .ﻣﻦ ﻧﺎﺣﻴﺔ أﺧﺮ ،ﻓﺈ اﻟﻨﻬﺞ اﻟﺬاﺗﻲ ﻳﻨﻘﻞ اﻻﺣﺘﻤﺎﻻت ﻣﻦ ﻛﻮﻧﻬﺎ ﺧﺎﺻﻴﺔ
ﻣﻮﺿﻮﻋﻴﺔ ﻟﻠﻌﺎﻟﻢ اﻟﺨﺎرﺟﻲ )ﻣﺜﻞ اﻟﻜﺘﻠﺔ أ اﻟﻄﻮ ( إﱃ ﻛﻮﻧﻬﺎ ﺧﺎﺻﻴﺔ ﻟﻠﺘﻔﺎﻋﻞ ﺑني اﻟﺮاﺻﺪ
اﻟﻌﺎﻟﻢ؛ ﻓﺎﻻﺣﺘﻤﺎﻻت اﻟﺬاﺗﻴﺔ ﺗﺠﻌﻞ اﻟﺮاﺻﺪ ﻫﻮ اﻷﺳﺎس .ﻗﺪ ﻳﺸﻌﺮ اﻟﺒﻌﺾ أ ﻫﺬا ﻧﻘﻄﺔ
ﺿﻌﻒ؛ ﻓﻬﺬا ﻳﻌﻨﻲ أ اﻷﺷﺨﺎص املﺨﺘﻠﻔني ﻳﻤﻜﻨﻬﻢ اﺳﺘﺨﻼص اﺳﺘﻨﺘﺎﺟﺎت ﻣﺨﺘﻠﻔﺔ ﻣﻦ
اﻟﺘﺤﻠﻴﻞ ﻧﻔﺴﻪ ﻟﻠﺒﻴﺎﻧﺎت ﻧﻔﺴﻬﺎ .ﻗﺪ ﻳﻌﺘﱪ اﻟﺒﻌﺾ اﻵﺧﺮ ﻧﻘﻄﺔ ﻗﻮة؛ إذ إ اﻻﺳﺘﻨﺘﺎﺟﺎت
ﺗﺘﺄﺛﺮ ﺑﻤﻌﺮﻓﺘﻚ اﻟﺴﺎﺑﻘﺔ.
ﻣﻊ ذﻟﻚ ،ﺗﻮﺟﺪ ﺗﻔﺴريات أﺧﺮ ﻟﻼﺣﺘﻤﺎ ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻔﱰض اﻟﻨﻬﺞ
»اﻟﻜﻼﺳﻴﻜﻲ« أ ﺟﻤﻴﻊ اﻷﺣﺪاث ﺗﺘﻜﻮ ﻣﻦ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﺣﺪاث اﻻﺑﺘﺪاﺋﻴﺔ املﺘﺴﺎ ﻳﺔ
اﻻﺣﺘﻤﺎ ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﻣﻲ اﻟﻨﺮد ﻗﺪ ﻳﻨﺘﺞ اﻟﺮﻗﻢ ١أ ٢أ ٣أ ٤أ ٥أ
،٦ﺗﻤﺎﺛﻞ اﻟﻨﺮد ﻳﺸري إﱃ ﺗﺴﺎ اﺣﺘﻤﺎﻟﻴﺔ ﻇﻬﻮر ﻫﺬ اﻟﻨﺘﺎﺋﺞ اﻟﺴﺖ ،ﻫﻜﺬا ﻛﻞ رﻗﻢ
ﻟﺪﻳﻪ اﺣﺘﻤﺎ ﻳﺒﻠﻎ ) ٦ / ١ﻳﺠﺐ أ ﻳﻜﻮ ﻣﺠﻤﻮﻋﻬﺎ ،١ﻧﻈﺮا ﻷﻧﻪ ﻣﻦ »املﺆﻛﺪ« أ اﺣﺪا
ﻣﻦ اﻷرﻗﺎ ١أ ٢أ ٣أ ٤أ ٥أ ٦ﺳﻮ ﻳﻈﻬﺮ( .اﺣﺘﻤﺎ اﻟﺤﺼﻮ ﻋﲆ ﻋﺪد
62
اﻻﺣﺘﻤﺎﻻت
63
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻓﻴﻤﺎ ﻳﻘﺮب ﻣﻦ ﻧﺼﻒ ﻣﺮات ﻗﺬﻓﻬﺎ ،أﻧﻪ ﻣﻦ ﺑني ﻫﺬ اﻟﺤﺎﻻت ،ﺳﻮ ﺗﺴﺘﻘﺮ اﻟﻘﻄﻌﺔ
اﻟﻨﻘﺪﻳﺔ ﰲ اﻟﻴﺪ اﻟﻴﻤﻨﻰ ﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ ﻓﻴﻤﺎ ﻳﻘﺮب ﻣﻦ ﻧﺼﻒ ﻣﺮات ﻗﺬﻓﻬﺎ ﻷ ﻧﺘﺎﺋﺞ
ﻋﻤﻠﻴﺔ اﻟﻘﺬ اﻷ ﱃ ﻻ ﺗﺆﺛﺮ ﻋﲆ اﻟﺜﺎﻧﻴﺔ .ﺑﻮﺟﻪ ﻋﺎ ،ﻓﺈ ﺣﻮاﱄ ٤ / ١ﻋﺪد ﻣﺮات اﻟﻘﺬ
املﺰد ج ﻣﻦ ﺷﺄﻧﻪ أ ﻳﻨﺘﺞ ﻋﻨﻪ ﺻﻮرة .ﺑﺎملﺜﻞ ،ﻓﺈ ﺣﻮاﱄ ٤ / ١ﻋﺪد املﺮات ﺳﻴﻨﺘﺞ
ﻋﻨﻪ ﻛﺘﺎﺑﺔ ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﴪ ،ﺻﻮرة ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﻤﻨﻰ ،ﺣﻮاﱄ ٤ / ١ﻋﺪد املﺮات
ﺳﻴﻨﺘﺞ ﻋﻨﻪ ﺻﻮرة ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﴪ ،ﻛﺘﺎﺑﺔ ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﻤﻨﻰ ،ﺣﻮاﱄ ٤ / ١ﻋﺪد
املﺮات ﺳﻴﻨﺘﺞ ﻋﻨﻪ ﻛﺘﺎﺑﺔ ﰲ ﻛﻠﺘﺎ اﻟﻌﻤﻠﺘني.
ٍّ
ﻣﺴﺘﻘﻼ ﻋﻤﱠ ﺎ إذا ﰲ املﻘﺎﺑﻞ ،ﻓﺈ اﺣﺘﻤﺎ اﻟﺘﻌﺜﺮ اﻟﺴﻘﻮط ﰲ اﻟﺸﺎرع ﺑﺎﻟﺘﺄﻛﻴﺪ ﻟﻴﺲ
ﻄﻰ ﺑﺎﻟﺜﻠﻮج أ ﻻ؛ ﻓﻬﺬا اﻟﺤﺪﺛﺎ »ﻏري ﻣﺴﺘﻘﻠني« .رأﻳﻨﺎ ﻣﺜﺎﻻ آﺧﺮ ﻛﺎ اﻟﺸﺎرع ﻣﻐ ٍّ
ﻟﻸﺣﺪاث ﻏري املﺴﺘﻘﻠﺔ ﰲ اﻟﻔﺼﻞ اﻷ ؛ ﰲ ﺣﺎﻟﺔ ﻟﺴﺎﱄ ﻛﻼر املﺄﺳﺎ ﻳﺔ اﻟﺘﻲ ﺗﻮﰲ ﻓﻴﻬﺎ
ﻃﻔﻼ ﰲ اﻷﴎة ﻧﻔﺴﻬﺎ .ﻋﻨﺪﻣﺎ ﻳﻜﻮ اﻟﺤﺪﺛﺎ ﻏري ﻣﺴﺘﻘﻠني ،ﻓﺈﻧﻨﺎ ﻻ ﻧﺴﺘﻄﻴﻊ ﺣﺴﺎب
اﺣﺘﻤﺎ ﻗﻮع ﻛ ﱟﻞ ﻣﻨﻬﻤﺎ ﺑﺒﺴﺎﻃﺔ ﻋﻦ ﻃﺮﻳﻖ ﴐب اﺣﺘﻤﺎﱄ ﻗﻮﻋﻬﻤﺎ املﻨﻔﺼﻠني ﻣﻌﺎ .ﰲ
اﻟﻮاﻗﻊ ،ﻛﺎ ﻫﺬا ﻫﻮ اﻟﺨﻄﺄ اﻟﺬ ﻛﺎ ﻳﻜﻤﻦ ﰲ ﺟﻮﻫﺮ ﻗﻀﻴﺔ ﺳﺎﱄ ﻛﻼر .ﻹدرا ذﻟﻚ،
دﻋﻨﺎ ﻧﺄﺧﺬ املﻮﻗﻒ اﻷﻛﺜﺮ ﺗﻄﺮﻓﺎ ﻟﺤﺪﺛني ﻏري ﻣﺴﺘﻘﻠني ﺗﻤﺎﻣﺎ؛ ﻫﻮ ﻋﻨﺪﻣﺎ »ﺗﺤﺪﱢد« ﻧﺘﺎﺋﺞ
أﺣﺪ اﻟﺤﺪﺛني »ﻋﲆ ﻧﺤﻮ ﺗﺎ « ﻧﺘﺎﺋﺞ اﻟﺤﺪث اﻵﺧﺮ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺗﺄﻣﱠ ْﻞ ﻋﻤﻠﻴﺔ ﻗﺬ
ﻋﻤﻠﺔ اﺣﺪة ،اﻟﺤﺪﺛﺎ » ﺟﻪ اﻟﺼﻮرة ﻟﻠﻌﻤﻠﺔ ﻷﻋﲆ« » ﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻟﻠﻌﻤﻠﺔ ﻷﺳﻔﻞ« .ﻛ ﱞﻞ
ﻣﻦ ﻫﺬﻳﻦ اﻟﺤﺪﺛني ﻟﺪﻳﻪ اﺣﺘﻤﺎ ﻳﺒﻠﻎ اﻟﻨﺼﻒ؛ ﻓﺎﺣﺘﻤﺎ أ اﻟﻌﻤﻠﺔ ﺳﻮ ﺗﺴﺘﻘﺮ ﺟﻪ
اﻟﺼﻮرة ﻷﻋﲆ ﻫﻮ ،٢ / ١اﺣﺘﻤﺎ أ اﻟﻌﻤﻠﺔ ﺳﻮ ﺗﺴﺘﻘﺮ ﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻷﺳﻔﻞ ﻫﻮ
.٢ / ١ﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ أﻧﻬﻤﺎ ﻟﻴﺴﺎ ﺣﺪﺛني ﻣﺴﺘﻘﻠني .ﰲ اﻟﻮاﻗﻊ ،ﻫﻤﺎ ﻣﺮﺗﺒﻄﺎ ارﺗﺒﺎﻃﺎ
ﺗﺎﻣٍّ ﺎ .ﻓﻌﲆ أ ﺣﺎ ،إذا ﻛﺎ اﻟﺤﺪث اﻷ ﺻﺤﻴﺤﺎ )اﻟﺼﻮرة ﻷﻋﲆ( »ﻳﺠﺐ« أ ﻳﻜﻮ
اﻟﺜﺎﻧﻲ ﺻﺤﻴﺤﺎ )اﻟﻜﺘﺎﺑﺔ ﻷﺳﻔﻞ( .ﻷﻧﻬﻤﺎ ﻣﺮﺗﺒﻄﺎ ارﺗﺒﺎﻃﺎ ﺗﺎﻣٍّ ﺎ ،ﻓﺈ اﺣﺘﻤﺎ أ ﻳﺤﺪث
ﻛﻼﻫﻤﺎ ﻳﺴﺎ ﺑﺒﺴﺎﻃﺔ اﺣﺘﻤﺎ ﺣﺪ ث اﻷ ؛ ﻫﻮ اﺣﺘﻤﺎ ﻳﺒﻠﻎ اﻟﻨﺼﻒ .ﻟﻴﺲ ﻫﺬا ﻣﺎ
ﻧﺤﺼﻞ ﻋﻠﻴﻪ إذا ﴐﺑﻨﺎ اﻻﺣﺘﻤﺎﻟني املﻨﻔﺼﻠني اﻟﺒﺎﻟﻎ ﻛ ﱞﻞ ﻣﻨﻬﻤﺎ ﻧﺼﻔﺎ ﻣﻌﺎ.
ﺑﺼﻔﺔ ﻋﺎﻣﺔ ،ﻳﻌﻨﻲ ﻋﺪ اﻻﺳﺘﻘﻼ ﺑني ﺣﺪﺛني أ اﺣﺘﻤﺎ أ أﺣﺪﻫﻤﺎ ﺳﻴﺤﺪث
ﻳﻌﺘﻤﺪ ﻋﲆ ﻛﻮ اﻵﺧﺮ ﻗﺪ ﺣﺪث أ ﻻ.
ﻳﻄﻠﻖ اﻹﺣﺼﺎﺋﻴﻮ ﻋﲆ اﺣﺘﻤﺎ ﻗﻮع ﺣﺪﺛني ﻣﻌﺎ اﺳﻢ »اﻻﺣﺘﻤﺎ املﺸﱰ « ﻟﻬﺬﻳﻦ
اﻟﺤﺪﺛني؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ أ ﻧﺘﺤﺪث ﻋﻦ اﻻﺣﺘﻤﺎ املﺸﱰ ﺑﺄﻧﻨﻲ ﺳﻮ أﻧﺰﻟﻖ
ﻄﻰ ﺑﺎﻟﺜﻠﻮج .اﻻﺣﺘﻤﺎ املﺸﱰ ﺑني ﺣﺪﺛني ﻳﺮﺗﺒﻂ ارﺗﺒﺎﻃﺎ ﺛﻴﻘﺎ ﺑﺎﺣﺘﻤﺎ أ اﻟﻄﺮﻳﻖ ﻣﻐ ٍّ
64
اﻻﺣﺘﻤﺎﻻت
أ ﻳﻘﻊ ﺣﺪث ﻣﺎ »إذا« ﻗﻊ ﺣﺪث آﺧﺮ .ﻫﺬا ﻳﺴﻤﻰ »اﻻﺣﺘﻤﺎ اﻟﴩﻃﻲ«؛ أ اﺣﺘﻤﺎ
أ ﺣﺪﺛﺎ ﻣﺎ ﺳﻮ ﻳﻘﻊ ﻧﻈﺮا ﻟﻮﻗﻮع ﺣﺪث آﺧﺮ .ﻫﻜﺬا ﻳﻤﻜﻨﻨﺎ أ ﻧﺘﺤﺪث ﻋﻦ اﻻﺣﺘﻤﺎ
اﻟﴩﻃﻲ ﺑﺄﻧﻨﻲ ﺳﻮ أﻧﺰﻟﻖ ﻷ اﻟﻄﺮﻳﻖ ﻣﻐ ٍّ
ﻄﻰ ﺑﺎﻟﺜﻠﻮج.
إ اﻻﺣﺘﻤﺎ )املﺸﱰ ( ﻟﻮﻗﻮع ﻛﻼ اﻟﺤﺪﺛني »أ« »ب« ﻫﻮ ﺑﺒﺴﺎﻃﺔ اﺣﺘﻤﺎ ﻗﻮع
اﻟﺤﺪث »أ« ﻣﴬ ﺑﺎ ﰲ اﺣﺘﻤﺎ ﻗﻮع اﻟﺤﺪث »ب« )املﴩ ط( ﻧﻈﺮا ﻟﻮﻗﻮع »أ«؛ ﻓﺎﻻﺣﺘﻤﺎ
)املﺸﱰ ( أ اﻟﺜﻠﻮج ﺗﺘﺴﺎﻗﻂ أﻧﻨﻲ ﺳﺄﻧﺰﻟﻖ ﻫﻮ اﺣﺘﻤﺎ أ اﻟﺜﻠﻮج ﺗﺘﺴﺎﻗﻂ ﻣﴬ ﺑﺎ ﰲ
اﻻﺣﺘﻤﺎ )املﴩ ط( أﻧﻨﻲ ﺳﺄﻧﺰﻟﻖ إذا ﻛﺎﻧﺖ اﻟﺜﻠﻮج ﻗﺪ ﺗﺴﺎﻗﻄﺖ.
ﻟﻠﺘﻮﺿﻴﺢ ،ﺗﺄﻣﱠ ْﻞ رﻣﻴﺔ اﺣﺪة ﻟﺤﺠﺮ ﻧﺮد ﺣﺪﺛني .اﻟﺤﺪث »أ« ﻫﻮ أ اﻟﺮﻗﻢ اﻟﻈﺎﻫﺮ
ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ،٢اﻟﺤﺪث »ب« ﻫﻮ أ اﻟﺮﻗﻢ اﻟﻈﺎﻫﺮ ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ .٣اﻻﺣﺘﻤﺎ
املﺸﱰ ﻟﻬﺬﻳﻦ اﻟﺤﺪﺛني »أ« »ب« ﻫﻮ اﺣﺘﻤﺎ أ ﻧﺤﺼﻞ ﻋﲆ ﻋﺪد ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ٢
،٣ﻫﺬا اﻻﺣﺘﻤﺎ ﻳﺒﻠﻎ ٦ / ١ﻓﻘﻂ؛ إذ إ اﺣﺪا ﻓﻘﻂ ﻣﻦ اﻷرﻗﺎ ٦ ،٥ ،٤ ،٣ ،٢ ،١ﻳﻘﺒﻞ
اﻟﻘﺴﻤﺔ ﻋﲆ ﻛﻞ ﻣﻦ .٣ ٢اﻻﺣﺘﻤﺎ املﴩ ط ﻟﻠﺤﺪث »ب« ﻧﻈﺮا ﻟﻮﻗﻮع »أ« ﻫﻮ اﺣﺘﻤﺎ
اﻟﺤﺼﻮ ﻋﲆ رﻗﻢ ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ٣ﻣﻦ ﺑني اﻷرﻗﺎ اﻟﺘﻲ ﺗﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ .٢ﺣﺴﻨﺎ،
ﻣﻦ ﺑني ﺟﻤﻴﻊ اﻷرﻗﺎ اﻟﺘﻲ ﺗﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ) ٢ﻫﺬا ﻳﻌﻨﻲ ،ﻣﻦ ﺑني (٦ ،٤ ،٢رﻗﻢ اﺣﺪ
ﻓﻘﻂ ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ،٣ﻟﺬﻟﻚ ﻳﺒﻠﻎ ﻫﺬا اﻻﺣﺘﻤﺎ اﻟﴩﻃﻲ .٣ / ١أﺧريا ،ﻓﺈ اﺣﺘﻤﺎ
اﻟﺤﺪث »أ« ﻫﻮ ) ٢ / ١ﻧﺼﻒ اﻷرﻗﺎ ٦ ،٥ ،٤ ،٣ ،٢ ،١ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ .(٢ﻣﻦ ﺛ ﱠﻢ
ﻧﺠﺪ أ اﺣﺘﻤﺎ »أ« ) (٢ / ١ﻣﴬ ﺑﺎ ﰲ اﻻﺣﺘﻤﺎ )اﻟﴩﻃﻲ( ﻟﻠﺤﺪث »ب« ﻧﻈﺮا ﻟﻮﻗﻮع
»أ« ) (٣ / ١ﻫﻮ .٦ / ١ﻫﻮ ﻳﺒﻠﻎ ﻧﻔﺲ ﻗﻴﻤﺔ اﻻﺣﺘﻤﺎ املﺸﱰ ﺑﺎﻟﺤﺼﻮ ﻋﲆ ﻋﺪد ﻳﻘﺒﻞ
اﻟﻘﺴﻤﺔ ﻋﲆ ﻛﻞ ﻣﻦ ٣ ٢؛ أ اﻻﺣﺘﻤﺎ املﺸﱰ ﻟﻮﻗﻮع اﻟﺤﺪﺛني »أ« »ب«.
ﰲ اﻟﻮاﻗﻊ ،ا ْﻟﺘﻘﻴْﻨﺎ ﺳﺎﺑﻘﺎ ﻣﻔﻬﻮ اﻻﺣﺘﻤﺎ اﻟﴩﻃﻲ ﰲ اﻟﻔﺼﻞ اﻷ ،ﰲ ﺻﻮرة
ﻣﻐﺎﻟﻄﺔ املﺪﻋﻲ .أﺷﺎر ﻫﺬا إﱃ أ اﺣﺘﻤﺎ ﻗﻮع اﻟﺤﺪث »أ« ﻧﻈﺮا إﱃ ﺣﺪ ث »ب« ﻟﻴﺲ
ﻫﻮ اﻻﺣﺘﻤﺎ ﻧﻔﺴﻪ ﺑﻮﻗﻮع اﻟﺤﺪث »ب« ﻧﻈﺮا ﻟﻮﻗﻮع »أ«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،اﺣﺘﻤﺎ أ
ﺷﺨﺼﺎ ﻣﺎ ﻳﺪﻳﺮ ﴍﻛﺔ ﻛﱪ ﻳﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ﻟﻴﺲ ﻫﻮ اﻻﺣﺘﻤﺎ ﻧﻔﺴﻪ ﺑﺄ اﻟﺸﺨﺺ
اﻟﺬ ﻳﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ﻳﺪﻳﺮ ﴍﻛﺔ ﻛﱪ .ﻫﺬا ﻳﻘﻮدﻧﺎ إﱃ ﻗﺎﻧﻮ آﺧﺮ ﻣﻬ ﱟﻢ ﻟﻠﻐﺎﻳﺔ ﻣﻦ
ﻗﻮاﻧني اﻻﺣﺘﻤﺎﻻت؛ ﻫﻮ »ﻣﱪﻫﻨﺔ ﺑﺎﻳﺰ« )أ »ﻗﺎﻋﺪة ﺑﺎﻳﺰ«( .ﺗﺴﺎﻋﺪﻧﺎ ﻣﱪﻫﻨﺔ ﺑﺎﻳﺰ ﰲ رﺑﻂ
ﻫﺬﻳﻦ اﻻﺣﺘﻤﺎﻟني اﻟﴩﻃﻴني؛ اﻻﺣﺘﻤﺎ اﻟﴩﻃﻲ ﻟﻠﺤﺪث »أ« ﻧﻈﺮا ﻟﻮﻗﻮع »ب« ،اﻻﺣﺘﻤﺎ
اﻟﴩﻃﻲ ﻟﻠﺤﺪث »ب« ﻧﻈﺮا ﻟﻮﻗﻮع »أ«.
رأﻳﻨﺎ ﻟﻠﺘ ﱢﻮ أ اﺣﺘﻤﺎ ﻗﻮع ﻛﻼ اﻟﺤﺪﺛني »أ« »ب« ﻳﺴﺎ اﺣﺘﻤﺎ أ »أ« ﺳﻴﻘﻊ
ﻣﴬ ﺑﺎ ﰲ اﻻﺣﺘﻤﺎ )املﴩ ط( ﺑﺄ »ب« ﺳﻴﻘﻊ ﻧﻈﺮا ﻟﻮﻗﻮع »أ« .ﻟﻜﻦ ﻳﻤﻜﻦ أﻳﻀﺎ
65
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻛﺘﺎﺑﺔ ﻫﺬا ﻋﲆ ﻧﺤﻮ ﻣﻌﻜﻮس؛ اﺣﺘﻤﺎ أ ﻛﻼ اﻟﺤﺪﺛني »أ« »ب« ﺳﻮ ﻳﻘﻌﺎ ﻳﺴﺎ
أﻳﻀﺎ اﺣﺘﻤﺎ أ »ب« ﺳﻴﻘﻊ ﻣﴬ ﺑﺎ ﰲ اﺣﺘﻤﺎ أ »أ« ﺳﻴﻘﻊ ﻧﻈﺮا ﻟﻮﻗﻮع »ب« .ﺗﻨﺺ
ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ )ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻪ ﻋﺎدة ﻣﺎ ﻳﻌﱪ ﻋﻦ ذﻟﻚ ﻋﲆ ﻧﺤﻮ ﻣﺨﺘﻠﻒ( ﻋﲆ أ ﻫﺎﺗني
اﻟﻄﺮﻳﻘﺘني ﺑﺒﺴﺎﻃﺔ ﻃﺮﻳﻘﺘﺎ ﺑﺪﻳﻠﺘﺎ ﻟﻜﺘﺎﺑﺔ اﻻﺣﺘﻤﺎ املﺸﱰ ﻟﻠﺤﺪﺛني »أ« »ب«؛ أ
إ اﺣﺘﻤﺎ »أ« ﻣﴬ ﺑﺎ ﰲ اﺣﺘﻤﺎ »ب« ﻧﻈﺮا ﻟﻮﻗﻮع اﻟﺤﺪث »أ« ﻳﺴﺎ اﺣﺘﻤﺎ »ب«
ﻣﴬ ﺑﺎ ﰲ اﺣﺘﻤﺎ »أ« ﻧﻈﺮا ﻟﻮﻗﻮع اﻟﺤﺪث »ب« .ﻛﻼﻫﻤﺎ ﻳﺴﺎ اﻻﺣﺘﻤﺎ املﺸﱰ
ﺑني »أ« »ب« .ﰲ ﻣﺜﺎ »رﺋﻴﺲ اﻟﴩﻛﺔ اﻟﺬ ﻳﻘﻮد ﺳﻴﺎرة« ،ﺗﻜﺎﻓﺊ ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ ﻗﻮ إ
اﺣﺘﻤﺎ إدارﺗﻚ ﻟﴩﻛﺔ ﻛﱪ ﻧﻈﺮا إﱃ أﻧﻚ ﺗﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ،ﻣﴬ ﺑﺎ ﰲ اﺣﺘﻤﺎ أ
ﺗﺘﻤﻜﻦ ﻣﻦ ﻗﻴﺎدة ﺳﻴﺎرة ،ﻳﺴﺎ اﺣﺘﻤﺎ أﻧﻚ ﺗﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ﻧﻈﺮا إﱃ أﻧﻚ رﺋﻴﺲ
ﴍﻛﺔ ،ﻣﴬ ﺑﺎ ﰲ اﺣﺘﻤﺎ ﻛﻮﻧﻚ رﺋﻴﺲ ﴍﻛﺔ .ﻛﻼﻫﻤﺎ ﻳﺴﺎ اﻻﺣﺘﻤﺎ املﺸﱰ ﻟﻜﻮﻧﻚ
رﺋﻴﺲ ﴍﻛﺔ ﻗﺎدرا ﻋﲆ ﻗﻴﺎدة ﺳﻴﺎرة.
ﻳﻨﺺ ﻗﺎﻧﻮ آﺧﺮ ﻟﻼﺣﺘﻤﺎﻻت ﻋﲆ أﻧﻪ إذا ﻛﺎ ﻳﻤﻜﻦ ﻗﻮع أﺣﺪ اﻟﺤﺪﺛني ،ﻟﻜﻦ
ﻻ ﻳﻤﻜﻦ أ ﻳﻘﻊ ﻛﻼﻫﻤﺎ ﻣﻌﺎ ،ﻓﺈ اﺣﺘﻤﺎ أ أﺣﺪﻫﻤﺎ ﺳﻴﻘﻊ ﻫﻮ ﻣﺠﻤﻮع اﻻﺣﺘﻤﺎﻟني
املﻨﻔﺼﻠني ﻟﻮﻗﻮع ﻛ ﱟﻞ ﻣﻨﻬﻤﺎ .إذا ﻗﺬﻓﺖ ﻋﻤﻠﺔ — ﻣﻦ املﺆﻛﺪ أﻧﻬﺎ ﻻ ﻳﻤﻜﻦ أ ﺗﻈﻬﺮ ﺟﻪ
اﻟﻜﺘﺎﺑﺔ اﻟﺼﻮرة ﰲ اﻟﻮﻗﺖ ذاﺗﻪ — ﻓﺈ اﺣﺘﻤﺎ ﻇﻬﻮر ﺟﻪ اﻟﺼﻮرة »أ « ﺟﻪ اﻟﻜﺘﺎﺑﺔ
ﻫﻮ ﻣﺠﻤﻮع اﺣﺘﻤﺎ أ ﺟﻪ اﻟﺼﻮرة ﺳﻮ ﻳﻈﻬﺮ اﺣﺘﻤﺎ أ ﺟﻪ اﻟﻜﺘﺎﺑﺔ ﺳﻮ ﻳﻈﻬﺮ.
إذا ﻛﺎﻧﺖ اﻟﻌﻤﻠﺔ ﻣﺘﺰﻧﺔ ،ﻓﺈ ﻛﻼ ﻫﺬﻳﻦ اﻻﺣﺘﻤﺎﻟني املﻨﻔﺼﻠني ﻫﻮ اﻟﻨﺼﻒ ،ﻫﻜﺬا ﻓﺈ
اﻻﺣﺘﻤﺎ اﻟﻜﲇ ﻟﻈﻬﻮر ﺟﻪ اﻟﺼﻮرة ﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻫﻮ .١ﻫﺬا اﻷﻣﺮ ﻳﺒﺪ ﻣﻌﻘﻮﻻ ﺗﻤﺎﻣﺎ؛
إذ ﻳﺘﻮاﻓﻖ اﻟﺮﻗﻢ ١ﻣﻊ اﻟﻴﻘني ،ﻣﻦ املﺆﻛﺪ أﻧﻪ ﻳﺠﺐ أ ﻳﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة أ ﺟﻪ
اﻟﻜﺘﺎﺑﺔ )أﻓﱰض أﻧﻪ ﻻ ﻳﻤﻜﻦ أ ﻳﻨﺘﻬﻲ اﻷﻣﺮ ﺑﻮﻗﻮ اﻟﻌﻤﻠﺔ ﻋﲆ ﺣﺎﻓﺘﻬﺎ!( ﺑﺎﻟﻌﻮدة إﱃ
ﻣﺜﺎ رﻣﻲ اﻟﻨﺮد :ﻛﺎ اﺣﺘﻤﺎ اﻟﺤﺼﻮ ﻋﲆ ﻋﺪد ز ﺟﻲ ﻫﻮ ﻣﺠﻤﻮع اﺣﺘﻤﺎﻻت اﻟﺤﺼﻮ
ﻋﲆ أ ﱟ ﻣﻦ اﻷرﻗﺎ ٢أ ٤أ ٦؛ ﻷﻧﻪ ﻻ ﻳﻤﻜﻦ أ ﻳﻘﻊ أ ﻣﻦ ﻫﺬ اﻷﺣﺪاث ﻣﻌﺎ ) ﻻ
ﺗﻮﺟﺪ أ ﻃﺮ أﺧﺮ ﻟﻠﺤﺼﻮ ﻋﲆ ﻋﺪد ز ﺟﻲ ﺑﺮﻣﻴﺔ اﺣﺪة ﻟﻠﻨﺮد(.
66
اﻻﺣﺘﻤﺎﻻت
أ ﺗﺤﺘﻮ إﻻ ﻋﲆ ﻋﺪد ﻣﺤﺪ د ﻣﻦ اﻟﻘﻴﻢ .ﻫﺬ املﺠﻤﻮﻋﺔ املﺤﺪ دة ﻗﺪ ﺗﻤﺜﻞ ﻗﻴﻢ ﻛﺎﻓﺔ
اﻷﺷﻴﺎء ﻣﻦ اﻟﻨﻮع اﻟﺬ ﻧﺨﻀﻌﻪ ﻟﻠﺪراﺳﺔ )ﻣﺜﻞ درﺟﺎت ﺟﻤﻴﻊ ﻻﻋﺒﻲ د ر ﻛﺮة اﻟﻘﺪ ﰲ
ﺳﻨﺔ ﻣﻌﻴﻨﺔ( أ ﻗﺪ ﺗﻤﺜﻞ ﻗﻴﻢ ﺑﻌﺾ اﻷﺷﻴﺎء ﻓﺤﺴﺐ؛ أ ْ إﻧﻬﺎ »ﻋﻴﻨﺔ« .رأﻳﻨﺎ أﻣﺜﻠﺔ ﻋﲆ
ﻫﺬا ﻋﻨﺪﻣﺎ ﺗﻨﺎ ﻟﻨﺎ ﻣﺴﺢ اﻟﻌﻴﻨﺎت.
اﻟﻌﻴﻨﺔ ﻫﻲ ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋﻴﺔ ﻣﻦ »ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﻢ« اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .ﰲ
ﺑﻌﺾ اﻟﺤﺎﻻت ،ﺗﻜﻮ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻏري اﺿﺤﺔ اﻟﺘﻌﺮﻳﻒ ،رﺑﻤﺎ ﺗﻜﻮ ﺿﺨﻤﺔ أ
ﺣﺘﻰ ﻻ ﻧﻬﺎﺋﻴﺔ؛ ﻟﺬﻟﻚ ﻻ ﻳﻜﻮ ﻟﺪﻳﻨﺎ ﺧﻴﺎر اﻟﻠﺠﻮء إﱃ ﻋﻴﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ ﺗﺠﺎرب
ﻗﻴﺎس ﴎﻋﺔ اﻟﻀﻮء ،ﰲ ﻛﻞ ﻣﺮة آﺧﺬ ﻓﻴﻬﺎ اﻟﻘﻴﺎس أﺗﻮﻗﻊ اﻟﺤﺼﻮ ﻋﲆ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ
ﻗﻠﻴﻼ؛ ذﻟﻚ ﺑﺒﺴﺎﻃﺔ ﺑﺴﺒﺐ ﻋﺪ اﻟﺪﻗﺔ ﰲ ﻋﻤﻠﻴﺔ اﻟﻘﻴﺎس .ﻳﻤﻜﻨﻨﻲ — ﻋﲆ اﻷﻗﻞ ﻣﻦ
ﺣﻴﺚ املﺒﺪأ — املﴤ ﻗﺪﻣﺎ ﰲ أﺧﺬ اﻟﻘﻴﺎﺳﺎت إﱃ اﻷﺑﺪ؛ ﻫﺬا ﻳﻌﻨﻲ أ ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﺎﺳﺎت
املﺤﺘﻤﻠﺔ اﻟﻜﺎﻣﻠﺔ ﻻ ﻧﻬﺎﺋﻴﺔ .ﺑﻤﺎ أ ﻫﺬا أﻣﺮ ﻣﺴﺘﺤﻴﻞ ،ﻳﺠﺐ أ أرﴇ ﺑﻌﻴﻨﺔ ﻣﺤﺪ دة ﻣﻦ
اﻟﻘﻴﺎﺳﺎت .ﺳﻮ ﺗﺴﺘﺨﺮج ﻫﺬ اﻟﻘﻴﺎﺳﺎت ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﻠﻘﻴﻢ اﻟﺘﻲ ﻳﺤﺘﻤﻞ أ
أﺣﺼﻞ ﻋﻠﻴﻬﺎ .ﰲ ﺣﺎﻻت أﺧﺮ ،ﺗﻜﻮ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﺤﺪ دة؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ
ﻟﻠﺴﻤْ ﻨﺔ ﺑني اﻟﺬﻛﻮر ﰲ ﺑﻠﺪة ﻣﻌﻴﻨﺔ ،ﺗﻜﻮ ﻣﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌني ﻟﻠﺪراﺳﺔ ﻣﺤﺪ دة، دراﺳﺔ ﱢ
رﻏﻢ أﻧﻨﻲ ﻣﻦ ﺣﻴﺚ املﺒﺪأ أﺳﺘﻄﻴﻊ ز ﻛﻞ اﺣﺪ ﻣﻨﻬﻢ ﰲ املﺪﻳﻨﺔ ،ﻓﻔﻲ املﻤﺎرﺳﺔ اﻟﻌﻤﻠﻴﺔ
رﺑﻤﺎ ﻟﻦ أرﻳﺪ ذﻟﻚ ،ﺳﻮ أﺳﺘﺨﺪ ﻋﻴﻨﺔ .ﻣﺮة أﺧﺮ ،ﻛﻞ ﻗﻴﻤﺔ ﰲ ﻋﻴﻨﺘﻲ ﻣﺄﺧﻮذة ﻣﻦ
املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﻠﻘﻴﻢ املﻤﻜﻨﺔ.
ﰲ ﻛ ﱟﻞ ﻣﻦ ﻫﺬ اﻷﻣﺜﻠﺔ ،ﻛﻞ ﻣﺎ أﻋﺮﻓﻪ ﻗﺒﻞ أ آﺧﺬ ﻛﻞ ﻗﻴﺎس ﻫﻮ أﻧﻪ ﺳﻴﻜﻮ ﻟﻪ
ﻗﻴﻤﺔ ﻣﺎ ﻣﻦ ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﻢ اﻟﻜﺎﻣﻠﺔ املﻤﻜﻨﺔ .ﺳﺘﺤﺪث ﻛﻞ ﻗﻴﻤﺔ ﺑﺎﺣﺘﻤﺎ ﻣﻌني ،ﻟﻜﻨﻲ
ﻻ أﺳﺘﻄﻴﻊ أ أﺣﺪد أﻛﺜﺮ ﻣﻦ ذﻟﻚ ،رﺑﻤﺎ ﻻ أﻋﺮ ﻣﺎ ﻫﻮ ﻫﺬا اﻻﺣﺘﻤﺎ .ﺑﺎﻟﺘﺄﻛﻴﺪ
ﻻ أﺳﺘﻄﻴﻊ أ أﺣﺪد ﺑﺎﻟﻀﺒﻂ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﺳﻮ أﺣﺼﻞ ﻋﻠﻴﻬﺎ ﰲ اﻟﻘﻴﺎس اﻟﺘﺎﱄ ﻟﴪﻋﺔ
اﻟﻀﻮء أ ﻣﺎذا ﺳﻴﻜﻮ ز اﻟﺮﺟﻞ اﻟﺘﺎﱄ اﻟﺬ ﺳﺄﻗﻴﺴﻪ .ﺑﺎملﺜﻞ ،ﰲ رﻣﻲ اﻟﻨﺮد ،أﻋﻠﻢ أ
اﻟﻨﺘﻴﺠﺔ ﻳﻤﻜﻦ أ ﺗﻜﻮ ١أ ٢أ ٣أ ٤أ ٥أ ،٦ﻫﻨﺎ أﻋﺮ أ ﻫﺬ اﻻﺣﺘﻤﺎﻻت
ﻣﺘﺴﺎ ﻳﺔ )ﻓﻨﺮد ﻣﻜﻌﺐ ﻣﺜﺎﱄ( ،ﻟﻜﻦ ﺑﺨﻼ ذﻟﻚ ﻻ أﺳﺘﻄﻴﻊ أ أﺣﺪد اﻟﻌﺪد اﻟﺬ
ﺳﻴﻈﻬﺮ .ﻋﲆ ﻏﺮار ﻗﻴﺎﺳﺎت اﻟﴪﻋﺔ اﻟﻮز ،ﻓﺈ اﻟﻨﺘﻴﺠﺔ ﻋﺸﻮاﺋﻴﺔ؛ ﻟﻬﺬا اﻟﺴﺒﺐ ﺗﺴﻤﱠ ﻰ
ﻫﺬ املﺘﻐريات »ﻣﺘﻐريات ﻋﺸﻮاﺋﻴﺔ«.
ا ْﻟﺘﻘﻴْﻨﺎ ﻣﻦ ﻗﺒﻞ ﺑﺎﻟﻔﻌﻞ ﻣﻔﻬﻮ املﻘﺎﻳﻴﺲ اﻟﺘﺠﺰﻳﺌﻴﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ ﺣﺎﻟﺔ
املﺆﻳﱠﺎت ،املﺆ ﱡ ٢٠ﻣﻦ اﻟﺘﻮزﻳﻊ ﻫﻮ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﻜﻮ ٪٢٠ﻣﻦ ﻗﻴﻢ اﻟﺒﻴﺎﻧﺎت أﺻﻐﺮ
67
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻣﻨﻬﺎ ،املﺆ ٨ﻫﻮ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﻜﻮ ٪٨ﻣﻦ ﻗﻴﻢ اﻟﺒﻴﺎﻧﺎت أﺻﻐﺮ ﻣﻨﻬﺎ ،ﻫﻜﺬا .ﻋﻤﻮﻣﺎ،
املﺆ ﱡ Kﻳﻜﻮ k%ﻣﻦ اﻟﻌﻴﻨﺔ أﺻﻐﺮ ﻣﻨﻪ .ﻳﻤﻜﻨﻨﺎ ﺗﺼﻮر ﺗﺤﺪﻳﺪ ﻣﺆﻳﱠﺎت ﻣﻤﺎﺛﻠﺔ ،ﻟﻴﺲ
ﻟﻠﻌﻴﻨﺔ اﻟﺘﻲ ﻧﺮﺻﺪﻫﺎ ﻓﺤﺴﺐ ،ﻟﻜﻦ ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﺘﻲ ﻳﻤﻜﻨﻨﺎ
رﺻﺪﻫﺎ .إذا ﻋﺮﻓﻨﺎ املﺆ ﱠ ٢٠ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﻦ اﻟﻘﻴﻢ ،ﺣﻴﻨﻬﺎ ﻓﺴﻨﻌﺮ أ اﻟﻘﻴﻤﺔ
املﺄﺧﻮذة ﻋﺸﻮاﺋﻴٍّﺎ ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﺪﻳﻬﺎ اﺣﺘﻤﺎ ٠٫٢٠أ ﺗﻜﻮ أﺻﻐﺮ ﻣﻦ ﻫﺬا
املﺆ ﱢ .ﻋﻤﻮﻣﺎ ،إذا ﻋﺮﻓﻨﺎ ﻛﻞ ﻣﺆﻳﱠﺎت املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ،ﻓﺴﻨﻌﺮ اﺣﺘﻤﺎ اﺳﺘﺨﺮاج ﻗﻴﻤﺔ
ﰲ آﺧﺮ ٪١٠أ ٪٢٥أ ٪١٦أ ٪٩٨أ أ ﻧﺴﺒﺔ ﻣﺌﻮﻳﺔ أﺧﺮ ﻧﻬﺘ ﱡﻢ ﺑﺎﺧﺘﻴﺎرﻫﺎ؛ ﻫﺬا
ﻳﻌﻨﻲ أﻧﻨﺎ ﺣﻴﻨﻬﺎ ﻧﻌﺮ ﻛﻞ ﳾء ﻋﻦ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﻤﻜﻨﺔ اﻟﺘﻲ ﻧﺴﺘﻄﻴﻊ اﻟﺤﺼﻮ ﻋﻠﻴﻬﺎ.
ﻟﻦ ﻧﻌﺮ ﻣﺎ اﻟﻘﻴﻤﺔ اﻟﺘﺎﻟﻴﺔ اﻟﺘﻲ ﺳﻨﺤﺼﻞ ﻋﻠﻴﻬﺎ ،ﻟﻜﻦ ﺳﻨﻌﺮ اﺣﺘﻤﺎ أﻧﻬﺎ ﺳﺘﻜﻮ ﰲ
أﺻﻐﺮ ٪١ﻣﻦ اﻟﻘﻴﻢ ﰲ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ،أ ﰲ أﺻﻐﺮ ،٪٢ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ.
ﻳﻮﺟﺪ اﺳﻢ ملﺠﻤﻮﻋﺔ ﻣﺆﻳﱠﺎت اﻟﺘﻮزﻳﻊ اﻟﻜﺎﻣﻠﺔ؛ إذ ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ »ﺗﻮزﻳﻊ اﻻﺣﺘﻤﺎ
اﻟﱰاﻛﻤﻲ« ،ﻫﻮ »ﺗﻮزﻳﻊ اﺣﺘﻤﺎ « ﻷﻧﻪ ﻳﺨﱪﻧﺎ »ﺑﺎﺣﺘﻤﺎ « اﻟﺤﺼﻮ ﻋﲆ ﻗﻴﻤﺔ أﻗﻞ ﻣﻦ أ
ﻗﻴﻤﺔ ﻧﺨﺘﺎرﻫﺎ ،ﻫﻮ »ﺗﺮاﻛﻤﻲ« ﻷﻧﻪ ﻣﻦ اﻟﻮاﺿﺢ أ اﺣﺘﻤﺎ اﻟﺤﺼﻮ ﻋﲆ ﻗﻴﻤﺔ أﻗﻞ ﻣﻦ
اﻟﻘﻴﻤﺔ »س« ﻳﺰداد ﻛﻠﻤﺎ زادت »س« .ﰲ ﻣﺜﺎ أ زا اﻟﺬﻛﻮر ،ﻟﻮ ﻛﻨﺖ أﻋﺮ أ اﺣﺘﻤﺎ
اﺧﺘﻴﺎر رﺟﻞ زﻧﻪ أﻗﻞ ﻣﻦ ٧٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ﻫﻮ ،٢ / ١ﻓﺈﻧﻨﻲ ﺣﻴﻨﻬﺎ ﺳﺄﻋﻠﻢ أ اﺣﺘﻤﺎ
اﺧﺘﻴﺎر رﺟﻞ زﻧﻪ أﻗﻞ ﻣﻦ ٨٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ﻫﻮ أﻛﺜﺮ ﻣﻦ ٢ / ١ﻷﻧﻪ ﻳﻤﻜﻨﻨﻲ أ أﺧﺘﺎر ﻣﻦ
ﺑني ﻛﻞ أ ﻟﺌﻚ اﻟﺬﻳﻦ ﻳﻘ ﱡﻞ زﻧﻬﻢ ﻋﻦ ٧٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ،ﻛﺬﻟﻚ أ ﻟﺌﻚ اﻟﺬﻳﻦ ﻳﻜﻮ زﻧﻬﻢ
ﺑني ٧٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ٨٠ﻛﻴﻠﻮﺟﺮاﻣﺎ .ﻋﻨﺪ اﻟﺤﺪ اﻷﻗﴡ ،ﻓﺈ اﺣﺘﻤﺎ اﻟﺤﺼﻮ ﻋﲆ ﻗﻴﻤﺔ
أﻗﻞ ﻣﻦ أ ﺗﺴﺎ أﻛﱪ ﻗﻴﻤﺔ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﻢ اﻟﻜﺎﻣﻠﺔ ﻫﻮ ١؛ أ إﻧﻪ ﺣﺪث ﻣﺆﻛﺪ.
ﺗﺘﻀﺢ ﻫﺬ اﻟﻔﻜﺮة ﰲ اﻟﺸﻜﻞ 1-4؛ ﻓﻔﻲ ﻫﺬا اﻟﺸﻜﻞ ،ﺗﻤﺜﱠﻞ ﻗﻴﻢ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ
)ﻓﻜﺮ ﰲ اﻟﻮز ( ﻋﲆ املﺤﻮر اﻷﻓﻘﻲ ،ﻳﻤﺜﱠﻞ اﺣﺘﻤﺎ اﻟﻘﻴﻢ اﻷﺻﻐﺮ ﻋﲆ املﺤﻮر اﻟﺮأﳼ.
ﻳﺒني املﻨﺤﻨﻰ اﺣﺘﻤﺎ أ ﺗﻜﻮ اﻟﻘﻴﻤﺔ املﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ — ﺑﺎﻟﻨﺴﺒﺔ ﻷ ﻗﻴﻤﺔ ﻣﻌﻴﻨﺔ
ﻟﻠﻤﺘﻐري اﻟﻌﺸﻮاﺋﻲ — أﺻﻐﺮ ﻣﻦ ﻫﺬ اﻟﻘﻴﻤﺔ املﻌﻴﻨﺔ.
ﻳﺨﱪﻧﺎ ﺗﻮزﻳﻊ اﻻﺣﺘﻤﺎ اﻟﱰاﻛﻤﻲ ملﺘﻐري ﻋﺸﻮاﺋﻲ ﺑﺎﺣﺘﻤﺎ أ ﺗﻜﻮ ﻗﻴﻤﺔ ﻣﺨﺘﺎرة
ﻋﺸﻮاﺋﻴٍّﺎ »أﻗﻞ« ﻣﻦ أ ﻗﻴﻤﺔ أﺧﺮ .اﻟﻄﺮﻳﻘﺔ اﻟﺒﺪﻳﻠﺔ ﻟﻠﻨﻈﺮ إﱃ اﻷﻣﻮر ﻫﻲ أ ﻧﻨﻈﺮ إﱃ
»ﺑني« أ ﻗﻴﻤﺘني ﻣﻌﻴﻨﺘني .ﺗﺘﻤﺜﻞ ﻫﺬ اﺣﺘﻤﺎ أ ﻗﻴﻤﺔ ﻣﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﺳﻮ ﺗﻘﻊ ْ
اﻻﺣﺘﻤﺎﻻت ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ ﰲ ﺳﻴﺎ اﻟﻨﻄﺎ اﻟﻮاﻗﻊ ﺑني ﻗﻴﻤﺘني ﺗﺤﺖ ﻣﻨﺤﻨﻰ »اﻟﻜﺜﺎﻓﺔ«
اﻻﺣﺘﻤﺎﻟﻴﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﺒني ﺷﻜﻞ 2-4ﻣﻨﺤﻨﻰ »اﻟﻜﺜﺎﻓﺔ اﻻﺣﺘﻤﺎﻟﻴﺔ« ،ﻳﺒني ﻣﻨﻄﻘﺔ
68
اﻻﺣﺘﻤﺎﻻت
اﻻﺣﺘﻤﺎل س
ص
ﻗﻴﻤﺔ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ
)ﻣﻈﻠﻠﺔ( ﺗﺤﺖ املﻨﺤﻨﻰ ﺑني ﻧﻘﻄﺘﻲ »أ« »ب« ﻣﻤﺜﻠﺔ اﺣﺘﻤﺎ أ ﻗﻴﻤﺔ ﻣﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ
ﺳﻮ ﺗﻘﻊ ﺑني »أ« »ب«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻋﻨﺪ اﺳﺘﺨﺪا ﻣﺜﻞ ﻫﺬا املﻨﺤﻨﻰ ﻟﺘﻮزﻳﻊ
أ زا اﻟﺮﺟﺎ ﰲ ﺑﻠﺪﺗﻨﺎ ،ﻳﻤﻜﻦ أ ﻧﺠﺪ اﺣﺘﻤﺎ أ ﻳﻘﻊ رﺟﻞ ﻣﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ ﺑني
٧٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ٨٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ،أ أ ز ج آﺧﺮ ﻣﻦ اﻟﻘﻴﻢ ،أ ﻓﻮ أ ﻗﻴﻤﺔ ﻧﺮﻳﺪﻫﺎ
أ ﺗﺤﺘﻬﺎ .ﻋﲆ ﻧﺤﻮ ﻋﺎ ،ﻣﻦ املﺮﺟﺢ أ ﺗﺤﺪث اﻟﻘﻴﻢ املﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﰲ املﻨﺎﻃﻖ
اﻟﺘﻲ ﺗﻜﻮ ﻓﻴﻬﺎ اﻻﺣﺘﻤﺎﻟﻴﺔ أﻛﺜﺮ ﻛﺜﺎﻓﺔ؛ أ ﺣﻴﺚ ﻳﻜﻮ ﻣﻨﺤﻨﻰ اﻟﻜﺜﺎﻓﺔ اﻻﺣﺘﻤﺎﻟﻴﺔ ﰲ
أﻋﻼ .
ﻻﺣﻆ أ املﺴﺎﺣﺔ اﻟﻜﻠﻴﺔ ﺗﺤﺖ املﻨﺤﻨﻰ ﰲ ﺷﻜﻞ 2-4ﻳﺠﺐ أ ﺗﻜﻮ — ١املﺘﻮاﻓﻖ
ﻣﻊ اﻟﻴﻘني — ﻳﺠﺐ أ ﺗﻜﻮ ﻟﻠﻘﻴﻤﺔ املﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﻗﻴﻤﺔ »ﺟﺰﺋﻴﺔ« ﻣﻨﻬﺎ.
ﺗﻤﺘﻠﻚ ﻣﻨﺤﻨﻴﺎت اﻟﺘﻮزﻳﻊ ﻟﻠﻤﺘﻐريات اﻟﻌﺸﻮاﺋﻴﺔ أﺷﻜﺎﻻ ﻣﺨﺘﻠﻔﺔ؛ ﻓﺎﺣﺘﻤﺎ أ اﻣﺮأة
ﻣﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﺳﻮ ﻳﻜﻮ زﻧﻬﺎ ﺑني ٧٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ٨٠ﻛﻴﻠﻮﺟﺮاﻣﺎ ﻋﺎدة ﻻ ﻳﻜﻮ
ﻫﻮ ﻧﻔﺴﻪ اﺣﺘﻤﺎ أ رﺟﻼ ﻣﺨﺘﺎرا ﻋﺸﻮاﺋﻴٍّﺎ ﺳﻴﻜﻮ زﻧﻪ ﺑني ﻫﺎﺗني اﻟﻘﻴﻤﺘني .رﺑﻤﺎ
ﻧﺘﻮﻗﻊ أ ﻣﻨﺤﻨﻰ ﺗﻮزﻳﻊ أ زا اﻟﻨﺴﺎء ﺳﻴﺄﺧﺬ ﻗﻴﻤﺎ ﻛﺒرية ﰲ اﻷ زا اﻷﺻﻐﺮ ﻣﻤﺎ ﻫﻲ ﱠ
اﻟﺤﺎ ﺑﺎﻟﻨﺴﺒﺔ ملﻨﺤﻨﻰ اﻟﺮﺟﺎ .
69
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻛﺜﺎﻓﺔ اﻻﺣﺘﻤﺎل
أ ب
ﻗﻴﻤﺔ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ
ﺗﻤﺘﻠﻚ ﺑﻌﺾ اﻷﺷﻜﺎ أﻫﻤﻴﺔ ﺧﺎﺻﺔ ،ﺗﻮﺟﺪ أﺳﺒﺎب ﻋﺪﻳﺪة ﻟﺬﻟﻚ؛ ﻓﻔﻲ ﺑﻌﺾ اﻟﺤﺎﻻت،
ﺗﻈﻬﺮ أﺷﻜﺎ ﻣﻌﻴﻨﺔ ،أ أﺷﻜﺎ ﻣﻘﺎرﺑﺔ ﻟﻠﻐﺎﻳﺔ ﻟﻬﺬ اﻷﺷﻜﺎ ،ﻋﲆ ﻧﺤﻮ ﻃﺒﻴﻌﻲ .ﺑﻴﻨﻤﺎ ﰲ
ﺣﺎﻻت أﺧﺮ ،ﺗﻨﺸﺄ اﻟﺘﻮزﻳﻌﺎت ﻛﻨﺘﺎﺋﺞ ﻟﻘﻮاﻧني اﻻﺣﺘﻤﺎﻻت.
ﻟﻌﻞ أﺑﺴﻂ اﻟﺘﻮزﻳﻌﺎت ﻫﻮ »ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ« .ﻫﺬا اﻟﺘﻮزﻳﻊ ﻳﻤﻜﻦ أ ﻳﺘﺨﺬ ﻗﻴﻤﺘني
ﻓﺤﺴﺐ ،ﻗﻴﻤﺔ ﻟﻬﺎ اﺣﺘﻤﺎ ،pﻣﺜﻼ ،اﻷﺧﺮ ﻟﻬﺎ اﺣﺘﻤﺎ .1−pﺑﻤﺎ أﻧﻪ ﻻ ﻳﻤﻜﻦ أ ﻳﺘﺨﺬ
ﱠإﻻ ﻗﻴﻤﺘني ﻓﻘﻂ ،ﻓﻤﻦ »املﺆﻛﺪ« أ إﺣﺪ اﻟﻘﻴﻤﺘني ﺳﻮ ﺗﻈﻬﺮ؛ ﻣﻦ ﺛ ﱠﻢ ﻓﺈ ﻣﺠﻤﻮع
اﺣﺘﻤﺎﻻت ﻫﺎﺗني اﻟﻨﺘﻴﺠﺘني ﻳﺴﺎ .١ﻟﺪﻳﻨﺎ ﺑﺎﻟﻔﻌﻞ أﻣﺜﻠﺔ أ ﺿﺤﺖ ملﺎذا ﻳﻌ ﱡﺪ ﻫﺬا اﻟﺘﻮزﻳﻊ
ﻣﻔﻴﺪا؛ ﻓﺎﻟﺤﺎﻻت اﻟﺘﻲ ﻻ ﻳﻨﺘﺞ ﻋﻨﻬﺎ إﻻ ﻧﺘﻴﺠﺘﺎ ﺷﺎﺋﻌﺔ ﺟﺪٍّا؛ ﻣﺜﻞ ﻗﺬ اﻟﻌﻤﻠﺔ اﻟﺘﻲ ﻳﻨﺘﺞ
ﻋﻨﻬﺎ إﻣﱠ ﺎ ﺟﻪ اﻟﺼﻮرة إﻣﱠ ﺎ ﺟْ ﻪ اﻟﻜﺘﺎﺑﺔ ،ﻋﻤﻠﻴﺔ اﻟﻮﻻدة اﻟﺘﻲ ﺗﻜﻮ ﻧﺘﻴﺠﺘﻬﺎ إﻣﺎ ذﻛﺮا إﻣﺎ
أﻧﺜﻰ .ﰲ ﻫﺎﺗني اﻟﺤﺎﻟﺘني ،ﺗﻤﺘﻠﻚ pﻗﻴﻤﺔ ٢ / ١أ ﻣﺎ ﻳﻘﺮب ﻣﻦ .٢ / ١ﻟﻜﻦ ﻳﻮﺟﺪ ﻋﺪد
ﻛﺒري ﻣﻦ اﻟﺤﺎﻻت اﻷﺧﺮ اﻟﺘﻲ ﻻ ﻳﻮﺟﺪ ﻟﻬﺎ ﺳﻮ ﻧﺘﻴﺠﺘني ﻣﺤﺘﻤﻠﺘني :ﻧﻌﻢ/ﻻ ،ﺟﻴﺪ/ﺳﻴﺊ،
اﻓﱰاﴈ أ ﻏري اﻓﱰاﴈ ،اﻧﻜﺴﺎر أ ﻋﺪ اﻧﻜﺴﺎر ،ﺗﻮﻗﻒ/ﺣﺮﻛﺔ ،ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ.
ﻳﻮﺳﻊ »اﻟﺘﻮزﻳﻊ ذ اﻟﺤﺪﻳﻦ« ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ؛ ﻓﺈذا ﻗﺬﻓﻨﺎ ﻋﻤﻠﺔ ﺛﻼث ﻣﺮات ،رﺑﻤﺎ ﻳﻈﻬﺮ
ﺟﻪ اﻟﺼﻮرة ﻣﺮة أ ﻣﺮﺗني أ ﺛﻼث ﻣﺮات أ ﻻ ﻳﻈﻬﺮ أﺑﺪا .إذا ﻛﺎ ﻟﺪﻳﻨﺎ ﺛﻼﺛﺔ ﻣﻮﻇﻔني
70
اﻻﺣﺘﻤﺎﻻت
ﰲ ﻣﺮﻛﺰ اﺗﺼﺎﻻت ﻳﺠﻴﺒﻮ ﻋﲆ ﻧﺤﻮ ﻣﺴﺘﻘ ﱟﻞ ﻋﲆ املﻜﺎملﺎت ﻋﻨﺪﻣﺎ ﺗﺮد ،ﻓﺈﻧﻪ ﻣﻦ املﻤﻜﻦ أ
ﻳﻜﻮ اﺣﺪ أ اﺛﻨﺎ أ اﻟﺜﻼﺛﺔ ﻣﺸﻐﻮﻟني أ ﻻ ﻳﻜﻮ أﺣﺪﻫﻢ ﻣﺸﻐﻮﻻ ﰲ أ ﻟﺤﻈﺔ ﻣﻌﻴﻨﺔ.
ﻳﺨﱪﻧﺎ اﻟﺘﻮزﻳﻊ ذ اﻟﺤﺪﻳﻦ ﺑﺎﺣﺘﻤﺎ ﺣﺼﻮﻟﻨﺎ ﻋﲆ ﻛﻞ رﻗﻢ ﻣﻦ ﻫﺬ اﻷرﻗﺎ ،٠أ ،١أ ،٢
أ .٣ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ ،ﻓﺈﻧﻪ ﻳﻄﺒﻖ ﻋﲆ ﻧﺤﻮ ﻋﺎ ،ﻟﻴﺲ ﻓﻘﻂ ﻋﲆ املﺠﻤﻮع اﻟﻜﲇ ﻟﺜﻼﺛﺔ
أﺣﺪاث .ﻓﺈذا ﻗﺬﻓﻨﺎ ﻋﻤﻠﺔ ﻣﺎﺋﺔ ﻣﺮة ،ﻓﺈ اﻟﺘﻮزﻳﻊ ذا اﻟﺤ ﱠﺪﻳْﻦ ﻳﺨﱪﻧﺎ أﻳﻀﺎ ﺑﺎﺣﺘﻤﺎﻻت أﻧﻨﺎ
ﺳﻨﺤﺼﻞ ﻋﲆ ﻛ ﱟﻞ ﻣﻦ ١٠٠ ،… ،٢ ،١ ،٠ﺟﻪ ﺻﻮرة.
ﺗﺼﻞ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰ ﻧﻲ إﱃ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﺨﺎص ﺑﻲ ﻋﺸﻮاﺋﻴٍّﺎ .ﺗﺼﻞ
ﺧﻼ اﻟﻌﻤﻞ اﻟﺼﺒﺎﺣﻲ — ﰲ املﺘﻮﺳﻂ — )ﻣﺜﻼ( ﺑﻤﻌﺪ ﺧﻤﺲ رﺳﺎﺋﻞ ﰲ اﻟﺴﺎﻋﺔ ،ﻟﻜﻦ
ﻋﺪد اﻟﺮﺳﺎﺋﻞ اﻟﺘﻲ ﺗﺼﻞ ﰲ ﻛﻞ ﺳﺎﻋﺔ ﻳﻤﻜﻦ أ ﻳﻨﺤﺮ ﻋﻦ ﻫﺬا املﻌﺪ ﻋﲆ ﻧﺤﻮ ﻛﺒري
ﺟﺪٍّا؛ إذ ﻳﺼﻞ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ﻋﴩ رﺳﺎﺋﻞ ،ﰲ أﺣﻴﺎ أﺧﺮ ﻻ ﺗﺼﻞ أ رﺳﺎﻟﺔ .ﻳﻤﻜﻦ
اﺳﺘﺨﺪا »ﺗﻮزﻳﻊ ﺑﻮاﺳﻮ « ﻟﻮﺻﻒ اﻟﺘﻮزﻳﻊ اﻻﺣﺘﻤﺎﱄ ﻟﻌﺪد رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰ ﻧﻲ اﻟﺘﻲ
ﺗﺼﻞ ﰲ ﻛﻞ ﺳﺎﻋﺔ .ﻳﻤﻜﻦ أ ﻳﺨﱪﻧﺎ ﺑﺎﺣﺘﻤﺎ )إذا ﻛﺎﻧﺖ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰ ﻧﻲ ﺗﺼﻞ
ﻋﲆ ﻧﺤﻮ ﻣﺴﺘﻘﻞ ﻛﺎ املﻌﺪ اﻟﻌﺎ ﻟﻮﺻﻮﻟﻬﺎ ﺛﺎﺑﺘﺎ( ﻋﺪ ﺻﻮ أ رﺳﺎﻟﺔ ،أ ﺻﻮ
رﺳﺎﻟﺔ اﺣﺪة ،أ رﺳﺎﻟﺘني ،ﻣﺎ إﱃ ذﻟﻚ .ﻫﺬا اﻟﺘﻮزﻳﻊ ﻳﺨﺘﻠﻒ ﻋﻦ اﻟﺘﻮزﻳﻊ ذ اﻟﺤﺪﻳﻦ؛
ﻷﻧﻪ ﻋﲆ اﻷﻗﻞ ﻣﻦ ﺣﻴﺚ املﺒﺪأ ﻻ ﻳﻮﺟﺪ ﺣﺪ أﻋﲆ ﻟﻠﻌﺪد اﻟﺬ ﻳﻤﻜﻦ أ ﻳﺼﻞ ﰲ أ ﺳﺎﻋﺔ.
ﻓﻔﻲ ﺣﺎﻟﺔ ﻗﺬ اﻟﻌﻤﻠﺔ ﻣﺎﺋﺔ ﻣﺮة ،ﻻ ﻳﻤﻜﻨﻨﺎ رؤﻳﺔ أﻛﺜﺮ ﻣﻦ ١٠٠ﺟﻪ ﺻﻮرة ،ﻟﻜﻦ ﻳﻤﻜﻦ
أ ﻳﺼﻠﻨﻲ )ﰲ ﻳﻮ ﺳﻴﺊ ﻟﻠﻐﺎﻳﺔ!( أﻛﺜﺮ ﻣﻦ ١٠٠رﺳﺎﻟﺔ ﺑﺮﻳﺪ إﻟﻜﱰ ﻧﻲ ﰲ ﺳﺎﻋﺔ اﺣﺪة.
ﺣﺘﻰ اﻵ ،ﻛﻞ اﻟﺘﻮزﻳﻌﺎت اﻻﺣﺘﻤﺎﻟﻴﺔ اﻟﺘﻲ ذﻛﺮﺗﻬﺎ ﻫﻲ ملﺘﻐريات ﻋﺸﻮاﺋﻴﺔ »ﻣﻨﻔﺼﻠﺔ«
)أ ﻣﺘﻘﻄﻌﺔ(؛ أ إ املﺘﻐريات اﻟﻌﺸﻮاﺋﻴﺔ ﻻ ﺗﺄﺧﺬ ﺳﻮ ﻗﻴﻢ ﻣﻌﻴﻨﺔ )ﻗﻴﻤﺘني ﰲ ﺣﺎﻟﺔ
ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ،ﻋﺪد ﻣﻦ اﻟﻘﻴﻢ ﻳﻌﺘﻤﺪ ﻋﲆ ﻋﺪد ﻣﺮات ﻗﺬ اﻟﻌﻤﻠﺔ/ﻋﺪد املﺸﻐﻠني ﰲ ﺣﺎﻟﺔ
اﻟﺘﻮزﻳﻊ ذ اﻟﺤﺪﻳﻦ ،اﻷﻋﺪاد اﻟﺼﺤﻴﺤﺔ … ،٣ ،٢ ،١ ،٠ﰲ ﺣﺎﻟﺔ ﺗﻮزﻳﻊ ﺑﻮاﺳﻮ ( .ﺛﻤﺔ
ﻣﺘﻐريات ﻋﺸﻮاﺋﻴﺔ أﺧﺮ »ﻣﺘﺼﻠﺔ« )أ ﻣﺴﺘﻤﺮة( ،ﻳﻤﻜﻦ أ ﺗﺄﺧﺬ أ ﻗﻴﻤﺔ ﻣﻦ اﻟﻨﻄﺎ ؛
ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،اﻟﻄﻮ ﻳﻤﻜﻦ أ ﻳﺄﺧﺬ أ ﻗﻴﻤﺔ داﺧﻞ ﻧﻄﺎ ﻣﻌني )رﻫﻨﺎ ﺑﺪﻗﺔ أداة
اﻟﻘﻴﺎس( ،ﻻ ﻳﻘﺘﴫ ،ﻣﺜﻼ ،ﻋﲆ ٤أ ٥أ ٦أﻗﺪا .
إذا ﻛﺎ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ ﻳﻤﻜﻦ أ ﻳﺄﺧﺬ ﻗﻴﻤﺎ ﺿﻤﻦ ﻓﱰة ﻣﺤﺪ دة ﻓﻘﻂ )ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎ ﺑني (١ ٠إذا ﻛﺎ »ﻣﻦ املﺤﺘﻤﻞ ﻋﲆ ﻧﺤﻮ ﻣﺘﺴﺎ « أ ﻳﺄﺧﺬ أ ﻗﻴﻤﺔ ﻣﻦ اﻟﻘﻴﻢ
ﰲ ﺗﻠﻚ اﻟﻔﱰة ،ﻳﻘﺎ إﻧﻪ ﻳﺘﺒﻊ »ﺗﻮزﻳﻌﺎ ﻣﻨﺘﻈﻤﺎ«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا ﻛﺎ ﺳﺎﻋﻲ اﻟﱪﻳﺪ
ﻳﺼﻞ داﺋﻤﺎ ﰲ اﻟﻔﱰة ﻣﻦ ١٠ﺻﺒﺎﺣﺎ ﺣﺘﻰ ١١ﺻﺒﺎﺣﺎ ،ﻟﻜﻦ ﺑﻄﺮﻳﻘﺔ ﻻ ﻳﻤﻜﻦ اﻟﺘﻨﺒﺆ ﺑﻬﺎ
71
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺗﻤﺎﻣﺎ )ﻓﻤﻦ املﺤﺘﻤﻞ أ ﻳﺼﻞ ﰲ اﻟﻔﱰة ﺑني ١٠ : ٠٥ﺣﺘﻰ ١٠ : ١٠ﺑﺎﻟﻘﺪر ﻧﻔﺴﻪ ﻻﺣﺘﻤﺎ
ﺻﻮﻟﻪ ﰲ أ ﻓﱰة ﺧﻤﺲ دﻗﺎﺋﻖ أﺧﺮ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ( ،ﻓﺈ ﺗﻮزﻳﻊ ﻗﺖ ﺻﻮﻟﻪ ﺧﻼ
ﻫﺬ اﻟﻔﱰة ﻳﻜﻮ ﻣﻨﺘﻈﻤﺎ.
ﻳﻤﻜﻦ ﻟﺒﻌﺾ املﺘﻐريات اﻟﻌﺸﻮاﺋﻴﺔ أ ﺗﺄﺧﺬ أ ﻗﻴﻤﺔ ﻣﻮﺟﺒﺔ؛ ﺷﺄ املﺪة اﻟﺰﻣﻨﻴﺔ
ﻟﻈﺎﻫﺮة ﻣﺎ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ .ﻟﺘﻮﺿﻴﺢ ذﻟﻚ ،ﺗﺄﻣﱠ ﻞ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ اﻟﺘﻲ ﺗﻈ ﱡﻞ ﻓﻴﻬﺎ املﺰﻫﺮﻳﺎت
اﻟﺰﺟﺎﺟﻴﺔ ﺳﻠﻴﻤﺔ ﻗﺒﻞ أ ﺗﻨﻜﴪ .املﺰﻫﺮﻳﺎت اﻟﺰﺟﺎﺟﻴﺔ ﻻ ﺗﺘﻘﺪ ﰲ اﻟﻌﻤﺮ ،ﻟﺬﻟﻚ ﻟﻴﺲ ﻣﻦ
املﻔﻀﻠﺔ ﻟﺪﻳﻚ ﰲ اﻟﻌﺎ املﻘﺒﻞ إذا ﻛﺎ ﻋﻤﺮﻫﺎ ٨٠ ﱠ املﺮﺟﺢ ﺑﺪرﺟﺔ أﻛﱪ أ ﺗﻨﻜﴪ املﺰﻫﺮﻳﺔ
ﺳﻨﺔ ،ﻣﻦ أ ﺗﻨﻜﴪ ﰲ اﻟﻌﺎ املﻘﺒﻞ إذا ﻛﺎ ﻋﻤﺮﻫﺎ ١٠ﺳﻨﻮات ﻓﻘﻂ )ﰲ ﺣﺎﻟﺔ ﺗﺴﺎ
ﻛﻞ اﻟﻌﻮاﻣﻞ اﻷﺧﺮ ( .ﻗﺎر ْ ذﻟﻚ ﻣﻊ اﺣﺘﻤﺎ ﻓﺎة ﺷﺨﺺ ﻳﺒﻠﻎ ﻣﻦ اﻟﻌﻤﺮ ٨٠ﺳﻨﺔ ﰲ
اﻟﻌﺎ املﻘﺒﻞ ﰲ ﻣﻘﺎﺑﻞ اﺣﺘﻤﺎ ﻓﺎة ﺷﺨﺺ ﻳﺒﻠﻎ ﻣﻦ اﻟﻌﻤﺮ ١٠ﺳﻨﻮات ﰲ اﻟﻌﺎ املﻘﺒﻞ.
ﻄﻢ ﰲ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ ،tﻓﺈ اﺣﺘﻤﺎ أ ﺗﺘﺤﻄﻢ ﰲ ﺑﺎﻟﻨﺴﺒﺔ ملﺰﻫﺮﻳﺔ زﺟﺎﺟﻴﺔ ،إذا ﻟﻢ ﺗﺘﺤ ﱠ
اﻟﻠﺤﻈﺔ اﻟﺘﺎﻟﻴﺔ ﻫﻮ اﻻﺣﺘﻤﺎ ﻧﻔﺴﻪ ،ﻣﻬﻤﺎ ﻛﺎﻧﺖ ﻗﻴﻤﺔ ) tﻣﺮة أﺧﺮ ،ﻛﻞ اﻟﻌﻮاﻣﻞ اﻷﺧﺮ
ﻣﺘﺴﺎ ﻳﺔ( .ﻳﻘﺎ ﻫﻨﺎ إ ﻋﻤﺮ املﺰﻫﺮﻳﺎت اﻟﺰﺟﺎﺟﻴﺔ ﻳﺘﺒﻊ »ﺗﻮزﻳﻌﺎ أ ﱢﺳﻴٍّﺎ« .ﰲ اﻟﻮاﻗﻊ ،ﺗﻮﺟﺪ
أﻋﺪاد ﻫﺎﺋﻠﺔ ﻣﻦ ﺗﻄﺒﻴﻘﺎت اﻟﺘﻮزﻳﻌﺎت اﻷ ﱢﺳﻴﱠﺔ ،ﻟﻴﺲ أﻋﻤﺎر املﺰﻫﺮﻳﺎت اﻟﺰﺟﺎﺟﻴﺔ ﻓﺤﺴﺐ!
ﻟﻌﻞ اﻷﻛﺜﺮ ﺷﻬﺮة ﺑني اﻟﺘﻮزﻳﻌﺎت املﺴﺘﻤﺮة ﻫﻮ »اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ« أ »ﺗﻮزﻳﻊ
ﺟﺎ س« .ﻏﺎﻟﺒﺎ ﻣﺎ ﻳﻮﺻﻒ ﻋﲆ ﻧﺤﻮ ﻋﺎ ﰲ ﺳﻴﺎ ﺷﻜﻠﻪ اﻟﻌﺎ » :ﺷﻜﻞ اﻟﺠﺮس« ،ﻛﻤﺎ ﻫﻮ
ﻣﺒني ﰲ اﻟﺸﻜﻞ .3-4ﻫﺬا ﻳﻌﻨﻲ أ اﺣﺘﻤﺎ ﺣﺪ ث اﻟﻘﻴﻢ املﻮﺟﻮدة ﰲ اﻟﻮﺳﻂ أﻛﱪ ﻣﻦ
اﺣﺘﻤﺎ ﺣﺪ ث اﻟﻘﻴﻢ ﰲ اﻟﻄﺮﻓني اﻟﺒﻌﻴﺪﻳﻦ ﻋﻦ اﻟﻮﺳﻂ .ﻳﻮﻓﺮ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ ﺗﻘﺮﻳﺒﺎ
ﺟﻴﺪا ﻟﻜﺜري ﻣﻦ اﻟﺘﻮزﻳﻌﺎت اﻟﺘﻲ ﺗﺤﺪث ﻃﺒﻴﻌﻴٍّﺎ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺗﻮزﻳﻊ أﻃﻮا ﻋﻴﻨﺔ
ﻋﺸﻮاﺋﻴﺔ ﻣﻦ اﻟﺮﺟﺎ اﻟﺒﺎﻟﻐني ﻳﺘﺒﻊ ﺗﻮزﻳﻌﺎ ﻃﺒﻴﻌﻴٍّﺎ ﺗﻘﺮﻳﺒﺎ.
ﻳﻈﻬﺮ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ أﻳﻀﺎ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎ ﺑﻤﻈﻬﺮ اﻟﻨﻤﻮذج اﻟﺠﻴﺪ ﻟﺸﻜﻞ
ﺗﻮزﻳﻊ إﺣﺼﺎﺋﻴﺎت اﻟﻌﻴﻨﺔ )ﻣﺜﻞ املﻠﺨﺼﺎت اﻹﺣﺼﺎﺋﻴﺔ املﺬﻛﻮرة ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ( ﻋﻨﺪﻣﺎ
ﺗﻨﻄﻮ ﻋﲆ ﻋﻴﻨﺎت ﻛﺒرية .ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻟﻨﻔﱰض أﻧﻨﺎ أﺧﺬﻧﺎ ﻋﲆ ﻧﺤﻮ ﻣﺘﻜﺮر ﻋﻴﻨﺎت
ﻋﺸﻮاﺋﻴﺔ ﻣﻦ ﺗﻮزﻳﻊ ﻣﺎ ،ﺣﺴﺒﻨﺎ ﻣﺘﻮﺳﻂ ﻛﻞ ﻋﻴﻨﺔ ﻣﻦ ﻫﺬ اﻟﻌﻴﻨﺎت .ﺑﻤﺎ أ ﻛﻞ ﻋﻴﻨﺔ
ﻣﺨﺘﻠﻔﺔ ،ﻓﺈﻧﻨﺎ ﻧﺘﻮﻗﻊ أ ﻳﻜﻮ ﻛﻞ ﻣﺘﻮﺳﻂ ﻣﺨﺘﻠﻔﺎ؛ أ ﺳﻴﻜﻮ ﻟﺪﻳﻨﺎ ﺗﻮزﻳﻊ ﻟﻠﻤﺘﻮﺳﻄﺎت.
إذا ﻛﺎﻧﺖ ﻛﻞ ﻋﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ،ﻓﺴﻴﺘﻀﺢ أ ﻫﺬا اﻟﺘﻮزﻳﻊ ﻟﻠﻤﺘﻮﺳﻄﺎت ﻫﻮ
ﺗﻮزﻳﻊ ﻃﺒﻴﻌﻲ ﺗﻘﺮﻳﺒﺎ.
أﴍت ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ إﱃ أ اﻹﺣﺼﺎء ﻟﻴﺲ ﻣﺠﺮد ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷد ات املﻌﺰ ﻟﺔ،
ﻟﻜﻨﻪ ﻟﻐﺔ ﻣﺘﺼﻠﺔ .ﺗﻨﻄﺒﻖ ﻧﻘﻄﺔ ﻣﻤﺎﺛﻠﺔ ﻋﲆ اﻟﺘﻮزﻳﻌﺎت اﻻﺣﺘﻤﺎﻟﻴﺔ .ﻓﻌﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻨﻲ
72
اﻻﺣﺘﻤﺎﻻت
٠٫٤
٠٫٣
٠٫٢
٠٫١
٠
٣− ٢− ١− ٠ ١ ٢ ٣
ﻛﻼ ﻋﲆ ﺣﺪة آﻧﻔﺎ ،ﻓﺈ اﻟﺤﻘﻴﻘﺔ ﻫﻲ أ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻳﻤﻜﻦ اﻋﺘﺒﺎر ﺣﺎﻟﺔ ﺧﺎﺻﺔ ذﻛﺮﺗﻬﺎ ٍّ
ﻣﻦ اﻟﺘﻮزﻳﻊ ذ اﻟﺤ ﱠﺪﻳْﻦ )ﻓﻬﻮ ﺗﻮزﻳﻊ ذ ﺣ ﱠﺪﻳْﻦ ﻋﻨﺪﻣﺎ ﻻ ﻳﻮﺟﺪ ﺳﻮ ﻧﺘﻴﺠﺘني ﻣﺤﺘﻤﻠﺘني
ﻄﻰ ﺣﺠﻢ ﻓﺤﺴﺐ( .ﺑﺎملﺜﻞ ،ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أ اﻟﻌﻤﻠﻴﺎت اﻟﺮﻳﺎﺿﻴﺔ اﻟﺘﻲ ﺗﻈﻬﺮ ﻫﺬا ﺗﺘﺨ ﱠ
ﻫﺬا اﻟﻜﺘﺎب ،ﻓﺈ ﺗﻮزﻳﻊ ﺑﻮاﺳﻮ ﻳﻤﺜﱢﻞ ﺣﺎﻟﺔ ﻣﺘﻄ ﱢﺮﻓﺔ ﻣﻦ اﻟﺘﻮزﻳﻊ ذ اﻟﺤ ﱠﺪﻳْﻦ ،ﻳﺸ ﱢﻜﻞ
ﺗﻮزﻳﻊ ﺑﻮاﺳﻮ اﻟﺘﻮزﻳﻊ اﻷ ﱢﳼ ز ﺟﺎ ﻃﺒﻴﻌﻴٍّﺎ ،ﻳﺼﺒﺢ اﻟﺘﻮزﻳﻊ ذ اﻟﺤﺪﻳﻦ أﻛﺜﺮ أﻛﺜﺮ
ﺷﺒﻬﺎ ﺑﺎﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ ﻛﻠﻤﺎ زاد اﻟﺤﺪ اﻷﻗﴡ ﻟﻌﺪد اﻷﺣﺪاث ،ﻫﻜﺬا .ﻫﺬ اﻟﺘﻮزﻳﻌﺎت
ﰲ ﺣﻘﻴﻘﺘﻬﺎ ﺟﺰء ﻣﻦ ﺣﺪة رﻳﺎﺿﻴﺔ ﻛﺎﻣﻠﺔ ﻣﺘﻜﺎﻣﻠﺔ.
ﻟﻘﺪ ﺻﻔﺖ اﻟﺘﻮزﻳﻌﺎت اﻟﺴﺎﺑﻘﺔ ﺑﺎﻟﻘﻮ إ ﻟﻬﺎ أﺷﻜﺎﻻ ﻣﺨﺘﻠﻔﺔ .ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻦ
ﺻﻒ ﻫﺬ اﻷﺷﻜﺎ ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ .ﻓﺮأﻳْﻨﺎ أ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻳﺘﻤﻴﺰ ﺑﻮﺟﻮد اﻟﻘﻴﻤﺔ .p
ﻫﺬا ﻳﺨﱪﻧﺎ ﺑﺎﺣﺘﻤﺎ أﻧﻨﺎ ﺳﻮ ﻧﺤﺼﻞ ﻋﲆ ﻧﺘﻴﺠﺔ ﻣﻌﻴﻨﺔ .ﺗﺘﻮاﻓﻖ ﻗﻴﻢ pاملﺨﺘﻠﻔﺔ ﻣﻊ
ﺗﻮزﻳﻌﺎت ﺑﺮﻧﻮﱄ ﻣﺨﺘﻠﻔﺔ؛ ﻓﻴﻤﻜﻨﻨﺎ ﺻﻴﺎﻏﺔ ﻧﺘﺎﺋﺞ ﻗﺬ ﻋﻤﻠﺔ ﻋﻦ ﻃﺮﻳﻖ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻣﻊ
اﺣﺘﻤﺎ ﻇﻬﻮر ﺟﻪ اﻟﺼﻮرة — — pﻣﺴﺎ ﻳﺎ اﻟﻨﺼﻒ ،ﺻﻴﺎﻏﺔ اﺣﺘﻤﺎ ﻗﻮع ﺣﺎدث
73
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻗﻴﻤﺔ ﺻﻐرية ﺟﺪٍّا )ﻛﻤﺎ ﻟﺴﻴﺎرة ﰲ رﺣﻠﺔ اﺣﺪة ﺑﻮاﺳﻄﺔ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻣﻊ pﺗﺴﺎ
آﻣﻞ!( .ﰲ ﻣﺜﻞ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﺗﺴﻤﻰ » pﻣﻌْ ﻠﻤﺔ« )أ ﺑﺎراﻣﱰا(.
ﺗﺘﻤﻴﺰ اﻟﺘﻮزﻳﻌﺎت اﻷﺧﺮ أﻳﻀﺎ ﺑﻮﺟﻮد ﻣﻌﻠﻤﺎت ﺗﺆد اﻟﺪ ر ﻧﻔﺴﻪ؛ إذ ﺗﻌﺮﻓﻨﺎ
ﺑﺎﻟﻀﺒﻂ ﺑﻌﻀﻮ ﻋﺎﺋﻠﺔ اﻟﺘﻮزﻳﻌﺎت اﻟﺬ ﻧﺘﺤﺪث ﻋﻨﻪ .ﻟﻨﺮ ﻛﻴﻔﻴﺔ ذﻟﻚ ،دﻋْ ﻨﺎ ﻧﻌ ْﺪ ﺧﻄﻮة
إﱃ اﻟﻮراء ﻧﺘﺬﻛﺮ ﻗﺎﻧﻮ اﻷﻋﺪاد اﻟﻜﺒرية .ﻳﻨﺺ ﻫﺬا اﻟﻘﺎﻧﻮ ﻋﲆ أﻧﻨﺎ إذا ﻗﻤﻨﺎ ﺑﻤﻼﺣﻈﺎت
ﻣﺴﺘﻘ ﱠﻠﺔ ﻣﺘﻜﺮرة ﻟﺤﺪث ﻟﻪ ﻧﺘﻴﺠﺔ Aﺑﺎﺣﺘﻤﺎ pﻧﺘﻴﺠﺔ Bﺑﺎﺣﺘﻤﺎ ،1 − pﻓﺈﻧﻨﺎ ﻳﺠﺐ
أ ﻧﺘﻮﻗﻊ أ ﻧﺴﺒﺔ ﻣﺮات ﻣﻼﺣﻈﺔ اﻟﻨﺘﻴﺠﺔ Aﺗﻘﱰب أﻛﺜﺮ أﻛﺜﺮ ﻣﻦ pﻛﻠﻤﺎ زاد ﻋﺪد
املﻼﺣﻈﺎت اﻟﺘﻲ ﻧﻘﻮ ﺑﻬﺎ .ﺗﻌﻤﱠ ﻢ ﻫﺬ اﻟﺴﻤﺔ ﺑﻄﺮ ﻣﻬﻤﺔ .ﻓﻌﲆ ﺟﻪ اﻟﺨﺼﻮص ،ﻟﻨﻔﱰض
أﻧﻪ ﺑﺪﻻ ﻣﻦ ﻣﻼﺣﻈﺔ ﺣﺪث ﻟﻪ ﻧﺘﻴﺠﺘﺎ ﻣﺤﺘﻤﻠﺘﺎ ﻓﺤﺴﺐ ،ﻻﺣﻈﻨﺎ ﺣﺪﺛﺎ ﻳﻤﻜﻦ أ ﻳﺄﺧﺬ
أ ﻗﻴﻤﺔ ﻣﻦ ﺗﻮزﻳﻊ ﻋﲆ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻳﺄﺧﺬ أ ﻗﻴﻤﺔ ﰲ اﻟﻔﱰة
] .[١ ،٠ﻟﻨﻔﱰض أﻧﻨﺎ أﺧﺬﻧﺎ ﻣﺠﻤﻮﻋﺎت ﻣﻦ اﻟﻘﻴﺎﺳﺎت nﻣﻦ ﻣﺜﻞ ﻫﺬا اﻟﺘﻮزﻳﻊ ﻋﲆ ﻧﺤﻮ
ﻣﺘﻜﺮر .ﻳﺨﱪﻧﺎ ﻗﺎﻧﻮ اﻷﻋﺪاد اﻟﻜﺒرية أﻳﻀﺎ أﻧﻪ ﻳﻨﺒﻐﻲ ﻟﻨﺎ أ ﻧﺘﻮﻗﻊ أ ﻳﻘﱰب ﻣﺘﻮﺳﻂ
اﻟﻘﻴﺎﺳﺎت nﻣﻦ ﻗﻴﻤﺔ ﺛﺎﺑﺘﺔ ﻛﻠﻤﺎ ﻛﺎﻧﺖ nأﻛﱪ .ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻨﻨﺎ ﺗﺼﻮر زﻳﺎدة nد
ﺣﺪ ،ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ﻣﻦ املﻨﻄﻘﻲ أ ﻧﺘﺤﺪث ﻋﻦ ﻣﺘﻮﺳﻂ ﻋﻴﻨﺔ ﻏري ﻣﺤﺪ دة ﻣﺴﺘﻤﺪة
ﻣﻦ اﻟﺘﻮزﻳﻊ؛ ﺑﻞ ﺣﺘﻰ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ ﻧﻔﺴﻪ .ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺑﺎﺳﺘﺨﺪا ﻫﺬ اﻟﻔﻜﺮة
ﻳﻤﻜﻦ أ ﻧﺘﺤﺪث ﻋﻦ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ اﻷ ﱢﳼ ﻧﻔﺴﻪ ﻟﻴﺲ ﻋﻦ ﻣﺘﻮﺳﻂ »ﻋﻴﻨﺔ ﻣﺄﺧﻮذة
ﻣﻦ اﻟﺘﻮزﻳﻊ اﻷﳼ« ﻓﺤﺴﺐ .ﺗﻤﺎﻣﺎ ﻛﻤﺎ ﺳﺘﻤﺘﻠﻚ ﺗﻮزﻳﻌﺎت ﺑﺮﻧﻮﱄ املﺨﺘﻠﻔﺔ ﻣﻌﻠﻤﺎت p
ﻣﺨﺘﻠﻔﺔ ،ﻓﺈ اﻟﺘﻮزﻳﻌﺎت اﻷﺳﻴﺔ املﺨﺘﻠﻔﺔ ﺳﻮ ﺗﻤﺘﻠﻚ ﻣﺘﻮﺳﻄﺎت ﻣﺨﺘﻠﻔﺔ .ﺣﻴﻨﻬﺎ ﻳﻜﻮ
املﺘﻮﺳﻂ ﻣﻌﻠﻤﺔ ﻟﻠﺘﻮزﻳﻊ اﻷﳼ.
رأﻳﻨﺎ ﰲ ﻣﺜﺎ ﺳﺎﺑﻖ أ اﻟﺘﻮزﻳﻊ اﻷﳼ ﻛﺎ ﻧﻤﻮذﺟﺎ ﻣﻌﻘﻮﻻ »ﻟﻌﻤﺮ« املﺰﻫﺮﻳﺎت
اﻟﺰﺟﺎﺟﻴﺔ )ﺗﺤﺖ ﻇﺮ ﻣﻌﻴﻨﺔ( ،اﻵ ﻳﻤﻜﻨﻨﺎ أ ﻧﺘﺼﻮر أ ﻟﺪﻳﻨﺎ ﻣﺠﻤﻮﻋﺘني ﻣﻦ ﻫﺬ
املﺰﻫﺮﻳﺎت؛ ﻣﺠﻤﻮﻋﺔ ﺗﺘﻜﻮ ﻣﻦ ﻣﺰﻫﺮﻳﺎت ﺻﻠﺒﺔ ﻣﺼﻨﻮﻋﺔ ﻣﻦ زﺟﺎج ﺳﻤﻴﻚ ﻟﻠﻐﺎﻳﺔ،
ﻣﺠﻤﻮﻋﺔ ﺛﺎﻧﻴﺔ ﺗﺘﻜﻮ ﻣﻦ ﻣﺰﻫﺮﻳﺎت ﻫ ﱠﺸﺔ ﻣﺼﻨﻮﻋﺔ ﻣﻦ زﺟﺎج رﻗﻴﻖ ﻟﻠﻐﺎﻳﺔ .ﻣﻦ اﻟﻮاﺿﺢ
أﻧﻪ ﰲ املﺘﻮﺳﻂ ،ﻣﺰﻫﺮﻳﺎت املﺠﻤﻮﻋﺔ اﻷ ﱃ ﻣﻦ املﺮﺟﺢ أ ﺗﻌﻴﺶ ﻟﻔﱰة أﻃﻮ ﻣﻦ ﻣﺰﻫﺮﻳﺎت
املﺠﻤﻮﻋﺔ اﻟﺜﺎﻧﻴﺔ .ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ املﺠﻤﻮﻋﺘني ﻟﻬﺎ ﻣﻌﻠﻤﺔ ﻣﺨﺘﻠﻔﺔ.
ﻳﻤﻜﻨﻨﺎ ﺗﺤﺪﻳﺪ املﻌﻠﻤﺎت اﻟﺨﺎﺻﺔ ﺑﺎﻟﺘﻮزﻳﻌﺎت اﻷﺧﺮ ﻋﲆ ﻧﺤﻮ ﻣﺸﺎﺑﻪ؛ ﻓﻨﺘﺼﻮر
ﺣﺴﺎب ﻣﻠﺨﺼﺎت إﺣﺼﺎﺋﻴﺔ ﻟﻌﻴﻨﺎت ﺑﺤﺠﻢ ﻻ ﻧﻬﺎﺋﻲ ﻣﺴﺘﻤﺪة ﻣﻦ اﻟﺘﻮزﻳﻌﺎت؛ ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ أ ﻧﺘﺼﻮر ﺣﺴﺎب ﻣﺘﻮﺳﻄﺎت ﻋﻴﻨﺎت ﻛﺒرية ﻻ ﻧﻬﺎﺋﻴﺔ ﻣﺴﺘﻤﺪة ﻣﻦ أﻋﻀﺎء
74
اﻻﺣﺘﻤﺎﻻت
اﻷﴎة اﻟﻌﺎدﻳﺔ ﻟﻠﺘﻮزﻳﻌﺎت .إﻻ أ اﻷﻣﻮر أﻛﺜﺮ ﺗﻌﻘﻴﺪا ﻗﻠﻴﻼ ﻫﻨﺎ؛ ﻷ أﻋﻀﺎء ﻫﺬ اﻷﴎة
ﻣﻦ اﻟﺘﻮزﻳﻌﺎت ﻻ ﺗﺘﺤﺪﱠد ﻋﲆ ﻧﺤﻮ ﻓﺮﻳﺪ ﺑﻮاﺳﻄﺔ ﻣﻌﻠﻤﺔ اﺣﺪة؛ ﻓﻬﻲ ﺗﺘﻄﻠﺐ ﻣﻌﻠﻤﺘني .ﰲ
ْ
ﻛﺎﻓﻴني؛ إذ ﺳﻴﻌﻤﻼ ﻣﻌﺎ ﻋﲆ اﻟﻮاﻗﻊ ،املﺘﻮﺳﻂ اﻻﻧﺤﺮا املﻌﻴﺎر ﻟﻠﺘﻮزﻳﻌﺎت ﺳﻴﻜﻮﻧﺎ
ﺗﺤﺪﻳﺪ أ أﻋﻀﺎء اﻟﻌﺎﺋﻠﺔ ﻧﺘﺤﺪث ﻋﻨﻪ ﻋﲆ ﻧﺤﻮ ﻓﺮﻳﺪ.
ﻧ ﱢﻘﺢ ﻗﺎﻧﻮ اﻷﻋﺪاد اﻟﻜﺒرية أﻛﺜﺮ ﻣﻦ ذﻟﻚ .ﺗﺨﻴﱠﻞ اﺳﺘﺨﺮاج اﻟﻌﺪﻳﺪ ﻣﻦ ﻣﺠﻤﻮﻋﺎت اﻟﻘﻴﻢ
ﻣﻦ ﺗﻮزﻳﻊ ﻣﺎ ،ﺑﺤﻴﺚ ﺗﻜﻮ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﺑﺎﻟﺤﺠﻢ ،nاﺣﺴﺐ املﺘﻮﺳﻂ ﻟﻜﻞ ﻣﺠﻤﻮﻋﺔ.
ﺣﻴﻨﻬﺎ ﺳﺘﻜﻮ املﺘﻮﺳﻄﺎت ﻧﻔﺴﻬﺎ ﻋﻴﻨﺔ ﻣﻦ اﻟﺘﻮزﻳﻊ؛ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﺤﺘﻤﻠﺔ ملﺘﻮﺳﻂ ﻋﻴﻨﺔ
ﺑﺎﻟﺤﺠﻢ .nﺗﺨﱪﻧﺎ »ﻣﱪﻫﻨﺔ اﻟﻨﻬﺎﻳﺔ املﺮﻛﺰﻳﺔ« أ ﺗﻮزﻳﻊ ﻫﺬ املﺘﻮﺳﻄﺎت ﻧﻔﺴﻬﺎ ﻳﺘﺒﻊ
ﺗﻘﺮﻳﺒﺎ ﺗﻮزﻳﻌﺎ ﻃﺒﻴﻌﻴٍّﺎ ،ﻫﺬا اﻟﺘﻘﺮﻳﺐ ﻳﺰداد أﻛﺜﺮ أﻛﺜﺮ ﻛﻠﻤﺎ زادت ﻗﻴﻤﺔ .nﰲ اﻟﻮاﻗﻊ،
إﻧﻬﺎ ﺗﺨﱪﻧﺎ أﻛﺜﺮ ﻣﻦ ﻫﺬا؛ إذ ﺗﺨﱪﻧﺎ أﻳﻀﺎ أ ﻣﺘﻮﺳﻂ ﺗﻮزﻳﻊ املﺘﻮﺳﻄﺎت ﻫﺬا ﻳﺘﻄﺎﺑﻖ
ﻓﻘﻂ 1/n ﻣﻊ ﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﻠﻘﻴﻢ ،أ اﻟﺘﺒﺎﻳﻦ ﰲ ﺗﻮزﻳﻊ املﺘﻮﺳﻄﺎت ﻳﺴﺎ
ﺿﻌﻒ ﺣﺠﻢ ﺗﺒﺎﻳﻦ ﺗﻮزﻳﻊ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ .ﻳﺘﻀﺢ أ ﻫﺬا ﻣﻔﻴﺪ ﻟﻠﻐﺎﻳﺔ ﰲ اﻹﺣﺼﺎء؛
ﻷﻧﻪ ﻳﻌﻨﻲ أﻧﻨﺎ ﻳﻤﻜﻨﻨﺎ ﺗﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﺑﺄﻛﱪ ﻗﺪر ﻣﻦ اﻟﺪﻗﺔ ﻧﺮﻏﺐ ﻓﻴﻪ
ﻓﻘﻂ ﻋﻦ ﻃﺮﻳﻖ أﺧﺬ ﻋﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻳﻜﻔﻲ )أﺧﺬ nﻛﺒرية ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ(؛ ﺣﻴﺚ ﺗﺨﱪﻧﺎ
ﻣﱪﻫﻨﺔ اﻟﻨﻬﺎﻳﺔ املﺮﻛﺰﻳﺔ ﻣﺪ ﺣﺠﻢ اﻟﻌﻴﻨﺔ اﻟﺬ ﻳﺠﺐ أ ﻧﺼﻞ إﻟﻴﻪ ﻟﺘﺤﻘﻴﻖ اﺣﺘﻤﺎ
ﻛﺒري ﻟﻠﻮﺻﻮ ﻟﻬﺬ اﻟﺪﻗﺔ .ﺑﺸﻜﻞ أﻋﻢ ،ﻳﻌ ﱡﺪ املﺒﺪأ اﻟﻘﺎﺋﻞ ﺑﺄﻧﻨﺎ ﻧﺴﺘﻄﻴﻊ اﻟﺤﺼﻮ ﻋﲆ
ﺗﻘﺪﻳﺮات أﻓﻀﻞ أﻓﻀﻞ ﻣﻦ ﺧﻼ أﺧﺬ ﻋﻴﻨﺎت أﻛﱪ ﻣﺒﺪأ ﻗﻮﻳٍّﺎ ﻟﻠﻐﺎﻳﺔ .ﻗﺪ رأﻳﻨﺎ ﺑﺎﻟﻔﻌﻞ
إﺣﺪ اﻟﻄﺮ اﻟﺘﻲ ﺗﺴﺘﺨﺪ ﻓﻴﻬﺎ ﻫﺬ اﻟﻔﻜﺮة ﻋﲆ ﻧﺤﻮ ﻋﻤﲇ ﺣني ﺗﻨﺎ ﻟﻨﺎ ﻣﻮﺿﻮع ﻣﺴﺢ
اﻟﻌﻴﻨﺎت ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ.
إﻟﻴﻚ ﻣﺜﺎﻻ آﺧﺮ .ﰲ ﻋﻠﻢ اﻟﻔﻠﻚ ،ﺗﻜﻮ اﻷﺟﺮا اﻟﺴﻤﺎ ﻳﺔ اﻟﺒﻌﻴﺪة ﺧﺎﻓﺘﺔ ﺟﺪٍّا ،ﺗﻜﻮ
ﻣﻌﻘﺪة ﺑﺴﺒﺐ اﻟﺘﻘﻠﺒﺎت اﻟﻌﺸﻮاﺋﻴﺔ ﰲ اﻹﺷﺎرات .ﻣﻊ ذﻟﻚ ،إذا أﺧﺬﻧﺎ اﻟﻌﺪﻳﺪ املﺸﺎﻫﺪات ﱠ
ﻣﻦ اﻟﺼﻮر ﻟﻠﺠﺮ ﻧﻔﺴﻪ راﻛﺒْﻨﺎﻫﺎ ﺑﻌﻀﻬﺎ ﻓﻮ ﺑﻌﺾ ،ﻓﺈ اﻷﻣﺮ ﻳﺸﺒﻪ ﺣﺴﺎب ﻣﺘﻮﺳﻂ
اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻘﻴﺎﺳﺎت ﻟﻠﴚء ﻧﻔﺴﻪ ،ﻛﻞ ﻗﻴﺎس ﻣﺴﺘﻤﺪ ﻣﻦ اﻟﺘﻮزﻳﻊ ﻧﻔﺴﻪ ﻟﻜﻦ ﺑﻮﺟﻮد
ﻣﻜ ﱢﻮ ﻋﺸﻮاﺋﻲ إﺿﺎﰲ .ﺑﺎﺳﺘﺨﺪا ﻗﻮاﻧني اﻻﺣﺘﻤﺎﻻت املﺬﻛﻮرة ﺳﺎﺑﻘﺎ ﻳﺘﻢ اﻟﺘﺨﻠﺺ ﻣﻦ
اﻟﻌﺸﻮاﺋﻴﺔ ،ﺗﺒﻘﻰ رؤﻳﺔ اﺿﺤﺔ ﻟﻺﺷﺎرة اﻷﺳﺎﺳﻴﺔ؛ أ اﻟﺠﺮ اﻟﺴﻤﺎ .
75
اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
78
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
79
ﻋﻠﻢ اﻹﺣﺼﺎء
80
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
املﻘﱰﺣﺔ ﻗﻴﻢ اﻟﻌﻴﻨﺔ اﻟﻔﺮدﻳﺔ .اﺧﺘﻴﺎر املﻌﻠﻤﺔ ﻟﻠﺤﺪ ﻣﻦ ﻫﺬا املﻘﻴﺎس ﻳﻌﻨﻲ اﻟﺤﺼﻮ ﻋﲆ
»أﻓﻀﻞ« ﺗﻘﺪﻳﺮ ،ﰲ ﺳﻴﺎ أﺻﻐﺮ ﻣﺠﻤﻮع ﻟﻠﻔﺮ املﺮﺑﻌﺔ .ﰲ اﻟﻮاﻗﻊ ،ﻫﺬ ﻃﺮﻳﻘﺔ ﺷﺎﺋﻌﺔ
ﻟﻠﻐﺎﻳﺔ ﻟﻠﺘﻘﺪﻳﺮ ،ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ — ﻷﺳﺒﺎب اﺿﺤﺔ — »ﺗﻘﺪﻳﺮ املﺮﺑﻌﺎت اﻟﺼﻐﺮ «.
أﺣﻴﺎﻧﺎ ﻳﻜﻮ ﻟﺪﻳﻨﺎ أﻓﻜﺎر ﻗﺒﻞ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ﻋﻦ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻧﺘﻮﻗﻊ أ ﺗﻜﻮ ﻋﻠﻴﻬﺎ
املﻌﻠﻤﺔ .ﻣﺜﻞ ﻫﺬ اﻷﻓﻜﺎر ﻗﺪ ﺗﺄﺗﻲ ﻣﻦ اﻟﺨﱪات أ اﻟﺘﺠﺎرب اﻟﺴﺎﺑﻘﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،
ﺑﻨﺎء ﻋﲆ ﺧﱪﺗﻨﺎ اﻟﺴﺎﺑﻘﺔ ﰲ ﻗﺬ اﻟﻘﻄﻊ اﻟﻨﻘﺪﻳﺔ ،رﺑﻤﺎ ﻧﻌﺘﻘﺪ أ املﻌﻠﻤﺔ ،pاﻟﺘﻲ ﺗﻌﻄﻲ
اﺣﺘﻤﺎ أ اﻟﻌﻤﻠﺔ املﻘﺬ ﻓﺔ ﺳﻮ ﺗﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة ،ﺗﻘﱰب ﻣﻦ ،٢ / ١أﻧﻪ ﻣﻦ ﻏري
املﺤﺘﻤﻞ ﺟﺪٍّا أ ﺗﻜﻮ ﺑﻌﻴﺪة ﻋﻦ .٢ / ١ﻧﻘﻮ إ ﻟﺪﻳﻨﺎ »ﺗﻮزﻳﻌﺎ ﻗﺒﻠﻴٍّﺎ« ﻹﻳﻤﺎﻧﻨﺎ ﺑﺄ
املﻌﻠﻤﺔ املﺠﻬﻮﻟﺔ ﺗﺄﺧﺬ ﻗﻴﻤﺎ ﻣﺨﺘﻠﻔﺔ .ﻳﻤﺜﻞ ﻫﺬا اﻟﺘﻮزﻳﻊ إﻳﻤﺎﻧﺎ ذاﺗﻴٍّﺎ ﺣﻴﺎ ﻗﻴﻤﺔ املﻌﻠﻤﺔ؛
ﻛﻤﺎ ﻫﻲ اﻟﺤﺎ ﻣﻊ اﻟﺘﻔﺴري اﻟﺬاﺗﻲ ﻟﻼﺣﺘﻤﺎ املﺬﻛﻮر ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ .ﰲ ﻣﺜﻞ ﻫﺬ
اﻟﺤﺎﻻت ،ﺑﺪﻻ ﻣﻦ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ﺑﻤﻌﺰ ﻻﺳﺘﺨﺮاج ﺗﻘﺪﻳﺮ ﻟﻘﻴﻤﺔ املﻌﻠﻤﺔ ،ﻣﻦ املﻨﻄﻘﻲ
اﻟﺠﻤﻊ ﺑني اﻟﺒﻴﺎﻧﺎت إﻳﻤﺎﻧﻨﺎ اﻟﺴﺎﺑﻖ ﻻﺳﺘﺨﺮاج »ﺗﻮزﻳﻊ ﺑﻌﺪ « ملﻌﺘﻘﺪاﺗﻨﺎ ﺣﻮ اﻟﻘﻴﻢ
املﺤﺘﻤﻠﺔ ﻟﻠﻤﻌﻠﻤﺔ .ﻫﺬا ﻳﻌﻨﻲ أﻧﻨﺎ ﻧﺒﺪأ ﺑﺘﻮزﻳﻊ ﻳﺼﻒ ﻣﻌﺘﻘﺪاﺗﻨﺎ ﺣﻮ اﻟﻘﻴﻢ املﺤﺘﻤﻠﺔ
ﻟﻠﻤﻌﻠﻤﺔ ،ﻧﻌﺪﱢﻟﻪ ﻓﻘﺎ ملﺎ ﻧﻼﺣﻈﻪ ﰲ اﻟﺒﻴﺎﻧﺎت؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺗﻮزﻳﻌﻨﺎ اﻟﻘﺒﲇ ﻻﺣﺘﻤﺎ
أ اﻟﻌﻤﻠﺔ ﺳﺘﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة رﺑﻤﺎ ﻳﻜﻮ ﻣﺮ ﱠﻛﺰا ﻟﻠﻐﺎﻳﺔ ﺣﻮ ﻗﻴﻤﺔ ٢ / ١؛ ﻓﻨﻌﺘﻘﺪ
أﻧﻪ ﻣﻦ املﺤﺘﻤﻞ ﺟﺪٍّا أ ﺗﻘﱰب ﻣﻦ .٢ / ١ﻣﻊ ذﻟﻚ ،إذا ﻗﺬﻓﺖ اﻟﻌﻤﻠﺔ ﻣﺎﺋﺔ ﻣﺮة ،ﻇﻬﺮ
ﰲ ﺛﻼث ﻣﺮات ﻓﺤﺴﺐ ﻣﻦ أﺻﻞ ﻣﺎﺋﺔ ﻣﺮة ﺟﻪ اﻟﺼﻮرة ،ﻓﺮﺑﻤﺎ ﻧﺮﻏﺐ ﰲ ﺿﺒﻂ ﻫﺬا
اﻟﺘﻮزﻳﻊ؛ ﺑﺤﻴﺚ ﺗﻌﺘﱪ اﻟﻘﻴﻢ اﻷﺻﻐﺮ ﻟﻼﺣﺘﻤﺎ أﻛﺜﺮ ﺗﺮﺟﻴﺤﺎ اﻟﻘﻴﻢ اﻷﻗﺮب ﻟﻠﻘﻴﻤﺔ ٢ / ١
أﻗﻞ ﺗﺮﺟﻴﺤﺎ.
ﰲ اﻟﻮاﻗﻊ ،ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ — املﺬﻛﻮرة ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ — ﻫﻲ اﻟﺘﻲ ﺗﻤﻜﻨﻨﺎ ﻣﻦ اﻟﺠﻤﻊ
ﺑني املﻌﺘﻘﺪات اﻟﻘﺒﻠﻴﺔ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة ﻹﻧﺘﺎج املﻌﺘﻘﺪات اﻟﺒﻌﺪﻳﺔ .ﻟﻬﺬا اﻟﺴﺒﺐ ،ﻳﻄﻠﻖ
ﻋﲆ ﻫﺬ اﻟﻄﺮﻳﻘﺔ ﻟﻠﺘﻘﺪﻳﺮ ﻃﺮﻳﻘﺔ »اﻟﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰ « .ﺗﺬﻛﺮ أ ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ ﺗﺮﺑﻂ اﺛﻨني
ﻣﻦ اﻻﺣﺘﻤﺎﻻت اﻟﴩﻃﻴﺔ :اﺣﺘﻤﺎ ﺣﺪ ث »أ« ﻧﻈﺮا ﻟﻮﻗﻮع »ب« ،اﺣﺘﻤﺎ ﺣﺪ ث »ب«
ﻧﻈﺮا ﻟﻮﻗﻮع »أ« .ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﻧﺴﺘﺨﺪ اﻟﻨﻈﺮﻳﺔ ﻟﺮﺑﻂ اﺣﺘﻤﺎ أ املﻌﻠﻤﺔ ﻟﻬﺎ ﻗﻴﻤﺔ
ﻣﺎ ﻧﻈﺮا ﻟﻠﺒﻴﺎﻧﺎت اﻟﺘﻲ ﻧﻼﺣﻈﻬﺎ ،ﻣﻊ اﺣﺘﻤﺎ ﻣﻼﺣﻈﺔ ﻫﺬ اﻟﺒﻴﺎﻧﺎت ﻧﻈﺮا ﻟﻘﻴﻤﺔ ﻣﻌﻴﻨﺔ
ﻟﻠﻤﻌﻠﻤﺔ .اﻵ ،اﻻﺣﺘﻤﺎ اﻟﺜﺎﻧﻲ ﻣﻦ ﻫﺬﻳﻦ اﻻﺣﺘﻤﺎﻟني — اﺣﺘﻤﺎ ﻣﻼﺣﻈﺔ ﻫﺬ اﻟﺒﻴﺎﻧﺎت
ﻧﻈﺮا ﻟﻘﻴﻤﺔ ﻣﻌﻴﻨﺔ ﻟﻠﻤﻌﻠﻤﺔ — ﻫﻮ ﺑﺒﺴﺎﻃﺔ داﻟﺔ اﻹﻣﻜﺎ ؛ ﻣﻦ ﺛ ﱠﻢ ﺗﺴﺘﺨﺪ ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ
إﻣﻜﺎﻧﻴﺔ اﻟﺒﻴﺎﻧﺎت ﻟﺘﻌﺪﻳﻞ ﻣﻌﺘﻘﺪاﺗﻨﺎ اﻟﻘﺒﻠﻴﺔ ،ﻣﻦ أﺟﻞ إﻧﺘﺎج ﻣﻌﺘﻘﺪاﺗﻨﺎ اﻟﺒﻌﺪﻳﺔ.
81
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻻﺣﻆ أ ﻫﻨﺎ ﻓﺮﻗﺎ دﻗﻴﻘﺎ — ﻟﻜﻨﻪ ﻣﻬﻢ — ﺑني ﻫﺬ اﻟﻄﺮﻳﻘﺔ اﻟﻄﺮ اﻷﺧﺮ
املﺬﻛﻮرة ﺳﺎﺑﻘﺎ )اﻟﺘﻲ ﻏﺎﻟﺒﺎ ﻣﺎ ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﻟﻄﺮ »اﻟﺘﻜﺮارﻳﺔ« أ »اﻟﻜﻼﺳﻴﻜﻴﺔ«(؛ ﺣﻴﺚ
إﻧﻨﺎ ﻧﻔﱰض ﻓﻴﻬﺎ أ املﻌﻠﻤﺔ املﺠﻬﻮﻟﺔ ﻟﻬﺎ ﻗﻴﻤﺔ ﺛﺎﺑﺘﺔ ﻟﻜﻨﻬﺎ ﻣﺠﻬﻮﻟﺔ .ﻣﻊ ذﻟﻚ ،ﺑﺎﻟﻨﺴﺒﺔ
ﻟﻠﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰ ،اﻓﱰﺿﻨﺎ أ املﻌﻠﻤﺔ املﺠﻬﻮﻟﺔ ﻟﻬﺎ ﺗﻮزﻳﻊ ﻋﱪ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ املﻤﻜﻨﺔ،
ﻣﻘﺪ ﰲ اﻟﺒﺪاﻳﺔ ﻣﻦ ﺧﻼ اﻟﺘﻮزﻳﻊ اﻟﻘﺒْﲇ ،ﺛﻢ ﺑﻌﺪ ذﻟﻚ — ﻋﻨﺪ ﺗﺤﺪﻳﺜﻪ ﺑﻮاﺳﻄﺔ املﻌﻠﻮﻣﺎت
ﰲ اﻟﺒﻴﺎﻧﺎت — ﻣﻦ ﺧﻼ اﻟﺘﻮزﻳﻊ اﻟﺒﻌْ ﺪ .ﻳﻘﺮ اﻟﺒﺎﺣﺚ ﺑﺄ املﻌﻠﻤﺔ ﻳﻤﻜﻦ أ ﻳﻜﻮ ﻟﻬﺎ
ﻗﻴﻢ ﻣﺨﺘﻠﻔﺔ ،ﻳﺴﺘﺨﺪ اﻟﺘﻮزﻳﻊ اﻻﺣﺘﻤﺎﱄ ﻟﻠﺘﻌﺒري ﻋﻦ ﻣﻌﺘﻘﺪ ﺣﻴﺎ ﻛﻞ ﻗﻴﻤﺔ.
ﻻ ﻳﺨﻠﻮ ﻣﻔﻬﻮ اﻟﺘﻮزﻳﻊ اﻟﻘﺒﲇ ﻣﻦ اﻟﺠﻮاﻧﺐ املﺜرية ﻟﻠﺠﺪ .ﻓﻌﲆ أﻗﻞ ﺗﻘﺪﻳﺮ ،اﻷﺷﺨﺎص
ﱠ
املﺘﻮﻗﻊ أ ﻳﻤﺘﻠﻜﻮا ﺗﻮزﻳﻌﺎت املﺨﺘﻠﻔﻮ ذ اﻟﺨﱪة اﻟﺴﺎﺑﻘﺔ املﺨﺘﻠﻔﺔ ،رﺑﻤﺎ ﻳﻜﻮ ﻣﻦ
ﻗﺒﻠﻴﺔ ﻣﺨﺘﻠﻔﺔ ،ﻫﺬ اﻟﺘﻮزﻳﻌﺎت ﺳﺘﺠﻤﻊ ﻣﻊ اﻟﺒﻴﺎﻧﺎت ﻹﻧﺘﺎج ﺗﻮزﻳﻌﺎت ﺑﻌﺪﻳﺔ ﻣﺨﺘﻠﻔﺔ،
رﺑﻤﺎ اﺳﺘﻨﺘﺎﺟﺎت ﻣﺨﺘﻠﻔﺔ .ﻫﻜﺬا ﺗﻢ اﻟﺘﻀﺤﻴﺔ ﺑﺄ ﺗﻈﺎﻫﺮ ﺑﺎملﻮﺿﻮﻋﻴﺔ .ﻛﻤﺎ ﺗﻮﺟﺪ أﻳﻀﺎ
ﺻﻌﻮﺑﺔ ﻋﻤﻠﻴﺔ؛ ﻓﻔﻲ ﺣني أ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ املﻌﻠﻤﺔ pﰲ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻟﻬﻤﺎ
ﺗﻔﺴريات اﺿﺤﺔ ﻣﺒﺎﴍة ،ﻓﻠﻴﺴﺖ اﻟﺤﺎ داﺋﻤﺎ أ ﺗﻤﺘﻠﻚ ﻣﻌﻠﻤﺎت اﻟﺘﻮزﻳﻌﺎت ﺗﻔﺴريات
اﺿﺤﺔ .ﻳﻤﻜﻦ أ ﻳﻜﻮ أﺣﻴﺎﻧﺎ ﻣﻦ اﻟﺼﻌﺐ ﻟﻠﻐﺎﻳﺔ اﻟﻮﺻﻮ ﻟﺘﻮزﻳﻌﺎت ﻗﺒﻠﻴﺔ ﻣﻌﻘﻮﻟﺔ
ﺗﻌﻜﺲ ﻣﻌﺮﻓﺘﻨﺎ املﺴﺒﻘﺔ.
ﻋﻨﺪ ﻫﺬ اﻟﻨﻘﻄﺔ ﰲ ﴍﺣﻨﺎ ﻟﻄﺮﻳﻘﺔ اﻟﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰ ﺻﻠﻨﺎ إﱃ اﻟﺘﻮزﻳﻊ اﻟﺒﻌﺪ ؛
ﻫﻮ ﺗﻮزﻳﻊ ﻳﻠﺨﺺ اﻋﺘﻘﺎد اﻟﺒﺎﺣﺚ ﺑﺸﺄ ﻛﻞ ﻗﻴﻤﺔ ﺗﺄﺧﺬﻫﺎ املﻌﻠﻤﺔ ﺑﻌﺪ رؤﻳﺔ اﻟﺒﻴﺎﻧﺎت.
ﻳﻤﻜﻨﻨﺎ ،إذا أردﻧﺎ ،ﺗﻘﻠﻴﺺ ﻫﺬا اﻟﺘﻮزﻳﻊ ﺑﺄﻛﻤﻠﻪ ﻟﺘﻘﺪﻳﺮ ﻧﻘﻄﺔ اﺣﺪة ﻋﻦ ﻃﺮﻳﻖ اﺳﺘﺨﺪا
ﻣﻠﺨﺺ إﺣﺼﺎﺋﻲ ﻟﻠﺘﻮزﻳﻊ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ أ ﻧﺴﺘﺨﺪ املﺘﻮﺳﻂ أ املﻨﻮا
اﻟﺨﺎص ﺑﻪ.
ﻛﻴﻒ ﻳﻤﻜﻨﻨﺎ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎﻧﺖ ﻃﺮﻳﻘﺔ ﺗﻘﺪﻳﺮ اﻟﻨﻘﻄﺔ ﻓﻌﺎﻟﺔ أ ﻻ ،أ ﻣﻘﺪﱢر ﻫﻮ
اﻷﻓﻀﻞ؟ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﺑﻴﻨﻤﺎ ﻗﺪ أﺧﺘﺎر ﺗﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ ﺑﺎﺳﺘﺨﺪا ﻣﺘﻮﺳﻂ
ﻋﻴﻨﺔ ﻣﺄﺧﻮذة ﻣﻦ ﻫﺬا اﻟﺘﻮزﻳﻊ ،ﺛﻤﺔ ﺑﺪﻳﻞ ﻳﺘﻤﺜﻞ ﰲ إﺳﻘﺎط أﻛﱪ اﻟﻘﻴﻢ أﺻﻐﺮﻫﺎ ﻣﻦ اﻟﻌﻴﻨﺔ
ﻗﺒﻞ اﺣﺘﺴﺎب املﺘﻮﺳﻂ .ﻋﻤﻮﻣﺎ ،ﺗﺘﺴﻢ أﻛﱪ اﻟﻘﻴﻢ أﺻﻐﺮﻫﺎ ﺑﺎﻟﻘﺪْر اﻷﻛﱪ ﻣﻦ اﻟﺘﻔﺎ ت
ﻣﻦ ﻋﻴﻨﺔ ﻷﺧﺮ ؛ ﻟﺬﻟﻚ رﺑﻤﺎ ﻳﻨﺘﺞ اﻟﺘﻐﺎﴈ ﻋﻨﻬﺎ ﺗﻘﺪﻳﺮا أﻛﺜﺮ ﻣﻮﺛﻮﻗﻴﺔ أﻗ ﱠﻞ ﺗﻔﺎ ﺗﺎ.
82
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻄﺮﻳﻘﺔ اﻟﺘﻜﺮارﻳﺔ ﻟﻠﺘﻘﺪﻳﺮ ،اﻟﺘﻲ ﺗﻔﱰض ﺟﻮد ﻗﻴﻤﺔ ﺣﻘﻴﻘﻴﺔ ﺛﺎﺑﺘﺔ —
ﻟﻜﻨﻬﺎ ﻣﺠﻬﻮﻟﺔ — ﻟﻠﻤﻌﻠﻤﺔ اﻟﺠﺎر ﺗﻘﺪﻳﺮﻫﺎ ،ﻧﻮ ﱡد ﰲ اﻟﺤﺎﻟﺔ املﺜﺎﻟﻴﺔ أ ﻧﻌﺮ أ ﱞ ﻣﻦ
ﻫﺎﺗني اﻟﻄﺮﻳﻘﺘني ﺗﻌﻄﻲ ﺗﻘﺪﻳﺮا أﻗﺮب إﱃ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ .ﻟﻸﺳﻒ ،ﺑﻤﺎ أ اﻟﻘﻴﻤﺔ
اﻟﺤﻘﻴﻘﻴﺔ ﻣﺠﻬﻮﻟﺔ )ﺑﻴﺖ اﻟﻘﺼﻴﺪ ﻫﻨﺎ ﻫﻮ ﺗﻘﺪﻳﺮﻫﺎ!( ﻓﻼ ﻳﻤﻜﻦ أﺑﺪا أ ﻧﻌﺮ اﻹﺟﺎﺑﺔ .ﻣﻦ
ﻧﺎﺣﻴﺔ أﺧﺮ ،ﻣﺎ »ﻳﻤﻜﻨﻨﺎ« أ ﻧﺄﻣﻞ ﰲ أ ﻧﻌﺮﻓﻪ ﻫﻮ ﻋﺪد املﺮات اﻟﺘﻲ ﻗﺪ ﱠ
ﻧﺘﻮﻗﻊ ﻓﻴﻬﺎ أ
ﺗﻜﻮ اﻟﻘﻴﻤﺔ املﻘﺪﱠرة ﻗﺮﻳﺒﺔ ﻣﻦ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ إذا ﺣﺪث أ ﻛﺮرﻧﺎ ﻋﻤﻠﻴﺔ أ ْﺧﺬ ﻋﻴﻨﺔ ﻣﻦ
اﻟﻘﻴﺎﺳﺎت اﺣﺘﺴﺎب اﻟﺘﻘﺪﻳﺮ .ﻓﺮﻏﻢ ﻛﻞ ﳾء ،ﺑﻤﺎ أ اﻟﻘﻴﻤﺔ املﻘﺪرة ﺗﺴﺘﻨﺪ ﻋﲆ ﻋﻴﻨﺔ ،ﻓﻤﻦ
املﺮﺟﱠ ﺢ أ اﻟﻘﻴﻤﺔ املﻘﺪرة ﺳﺘﻜﻮ ﻣﺨﺘﻠﻔﺔ إذا أﺧﺬت ﻋﻴﻨﺔ ﻣﺨﺘﻠﻔﺔ؛ ﻫﺬا ﻳﻌﻨﻲ أ اﻟﺘﻘﺪﻳﺮ
ﰲ ﺣ ﱢﺪ ذاﺗﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ ،ﻳﺨﺘﻠﻒ ﻣﻦ ﻋﻴﻨﺔ ﻟﻌﻴﻨﺔ أﺧﺮ .ﺑﻤﺎ أﻧﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ،
ﻓﺈ ﻟﻪ ﺗﻮزﻳﻌﺎ .إذا ﻋﻠﻤﻨﺎ أ ﻫﺬا اﻟﺘﻮزﻳﻊ ﻣﺘﺠﻤﻊ ﺑﺈﺣﻜﺎ ﺣﻮ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ،ﻓﺮﺑﻤﺎ
ﻧﻌﺘﱪ ﻃﺮﻳﻘﺔ اﻟﺘﻘﺪﻳﺮ ﻃﺮﻳﻘﺔ ﺟﻴﺪة .ﺑﻌﺒﺎرة أﺧﺮ ،إذا ﻛﻨﱠﺎ ﻧﻌﺮ أ ﻃﺮﻳﻘﺔ ﻣﺎ »ﻋﺎدة«
ﻣﺎ ﺗﺴﻔﺮ ﻋﻦ ﺗﻘﺪﻳﺮ ﻳﻜﻮ ﻗﺮﻳﺒﺎ ﻟﻠﻐﺎﻳﺔ ﻣﻦ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻟﻠﻤﻌﻠﻤﺔ ،ﻓﺮﺑﻤﺎ ﻧﻌﺘﱪﻫﺎ
ﻃﺮﻳﻘﺔ ﺟﻴﺪة ﻟﻠﺘﻘﺪﻳﺮ .ﻣﻊ أ ﻫﺬا ﻻ ﻳﺨﱪﻧﺎ ﺷﻴﺌﺎ ﻋﻦ ﺣﺎﻟﺘﻨﺎ املﺤﺪدة ،ﻓﺈﻧﻪ ﺳﻴﻜﻮ ﻟﺪﻳﻨﺎ
ﺛﻘﺔ ﰲ اﻟﻄﺮﻳﻘﺔ ﻋﲆ ﻧﺤﻮ ﻣﱪر .ﻓﻌﲆ أ ﺣﺎ ،إذا ﻛﻨﺖ ﻋﲆ ﻋﻠﻢ ﺑﺄ ﺷﺨﺼﺎ ﻣﺎ ﻳﺘﻨﺒﱠﺄ
ﺗﻨﺒﺆا ﺻﺤﻴﺤﺎ ﰲ ٩٩٩ﻣﻦ ﻛﻞ ١٠٠٠ﻣﺮة ،ﻓﺈﻧﻚ ﺑﺎﻟﺘﺄﻛﻴﺪ ﺳﺘﻤﻴﻞ إﱃ اﻟﻮﺛﻮ ﺑﻪ ﰲ أ
ﺣﺎﻟﺔ ﻣﻌﻴﻨﺔ .أﻧﺖ ﺗﻔﻌﻞ ذﻟﻚ ﻣﻊ ﺳﺎﺋﻘﻲ اﻟﻘﻄﺎرات اﻟﻄﻴﺎرﻳﻦ املﻄﺎﻋﻢ ،ﻣﺎ إﱃ ذﻟﻚ؛
ﻓﺄﻧﺖ ﺗﻌﺮ أ اﻟﺴﺎﺋﻖ اﻟﻄﻴﺎر ﻧﺎدرا ﻣﺎ ﻳﻘﻊ ﰲ ﺣﺎدث ،املﻄﻌﻢ ﻧﺎدرا ﻣﺎ ﻳﻘﺪ ﻃﻌﺎﻣﺎ
ﻣﺴﻤﱠ ﻤﺎ ،ﻟﺬﻟﻚ ﺗﻜﻮ ﺳﻌﻴﺪا ﺑﺎملﺨﺎﻃﺮة ﺑﺄﻧﻪ »ﰲ ﻫﺬ املﺮة« ﺳﺘﻜﻮ اﻷﻣﻮر ﻋﲆ ﻣﺎ ﻳﺮا .
ﺑﺎﺳﺘﺨﺪا ﻫﺬا املﺒﺪأ ،ﻃﻮﱢرت ﻋﺪة ﻣﻘﺎﻳﻴﺲ ﻣﺨﺘﻠﻔﺔ ﻟﺘﻘﻴﻴﻢ ﻃﺮ اﻟﺘﻘﺪﻳﺮ اﻟﺘﻜﺮارﻳﺔ
اﻟﺒﺪﻳﻠﺔ .ﻳﺘﻤﺜﻞ أﺣﺪ ﻫﺬ املﻘﺎﻳﻴﺲ ﰲ »اﻟﺘﺤﻴﺰ« ،ﻫﺬا ﻳﺨﱪﻧﺎ ﺑﻤﺪ ﺣﺠﻢ اﻟﻔﺎر ﺑني
اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻟﻠﻤﻌﻠﻤﺔ اﻟﻘﻴﻤﺔ املﺘﻮﺳﻄﺔ ﻟﺘﻮزﻳﻊ اﻟﻘﻴﻢ املﻘﺪرة .ﻋﲆ ﺟﻪ اﻟﺘﺤﺪﻳﺪ ،إذا
ﻛﺎ ﻫﺬا اﻟﻔﺎر ﻳﺴﺎ ﺻﻔﺮا )أ إذا ﻛﺎ ﻣﺘﻮﺳﻂ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﻘﺪرة ﻳﺴﺎ اﻟﻘﻴﻤﺔ
اﻟﺤﻘﻴﻘﻴﺔ( ،ﻳﻘﺎ إ املﻘﺪﱢر »ﻏري ﻣﺘﺤﻴﺰ«.
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻧﺴﺒﺔ ﻇﻬﻮر ﺟﻪ اﻟﺼﻮرة ﻧﺘﻴﺠﺔ ﻗﺬ اﻟﻌﻤﻠﺔ ﻋﺪة ﻣﺮات ﺗﻜﻮ
ﻣﻘﺪﱢرا ﻏري ﻣﺘﺤﻴﺰ ﻻﺣﺘﻤﺎ أ اﻟﻌﻤﻠﺔ ﺳﺘﺴﺘﻘﺮ ﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ؛ إذ إ اﻟﻘﻴﻤﺔ
املﺘﻮﺳﻄﺔ ﻟﺘﻮزﻳﻊ ﻫﺬ اﻟﻨﺴﺒﺔ ﰲ اﻟﺘﺠﺎرب املﺘﻜﺮرة ﺗﺴﺎ اﻻﺣﺘﻤﺎ اﻟﺼﺤﻴﺢ ﻟﻈﻬﻮر
ﺟﻪ اﻟﺼﻮرة .ﻟﻠﺘﻮﺿﻴﺢ ،اﻓﱰض أ اﻻﺣﺘﻤﺎ اﻟﺤﻘﻴﻘﻲ ﻻﺳﺘﻘﺮار اﻟﻌﻤﻠﺔ ﺟﻪ اﻟﺼﻮرة
ﻷﻋﲆ ﻫﻮ ٠٫٥٥؛ ﻫﻮ أﻣﺮ ﻣﺠﻬﻮ ﺑﺎﻟﻨﺴﺒﺔ ﻟﻨﺎ ،أﻧﻨﺎ ﻗﺬﻓﻨﺎ اﻟﻌﻤﻠﺔ ﻋﴩ ﻣﺮات ،ﻗﺪرﻧﺎ
83
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻫﺬا اﻻﺣﺘﻤﺎ ﻋﻦ ﻃﺮﻳﻖ ﻧﺴﺒﺔ ﻇﻬﻮر ﺟﻪ اﻟﺼﻮرة .رﺑﻤﺎ ﺗﺴﻔﺮ اﻟﻘﺬﻓﺎت اﻟﻌﴩ ﻋﻦ ﺳﺖ
ﻣﺮات ﻟﻈﻬﻮر ﺟﻪ اﻟﺼﻮرة؛ ﻫﻲ ﻧﺴﺒﺔ ﺗﺒﻠﻎ ،٠٫٦أ ﺛﻼث ﻣﺮات؛ ﻫﻲ ﻧﺴﺒﺔ ﺗﺒﻠﻎ ،٠٫٣
أ ﺧﻤﺲ ﻣﺮات؛ ﻫﻲ ﻧﺴﺒﺔ ﺗﺒﻠﻎ ،٠٫٥ﻫﻜﺬا .ﰲ املﺘﻮﺳﻂ )ﻣﺘﻮﺳﻂ ﻳﺤﺴﺐ ﻣﻦ ﺧﻼ
ﺗﻜﺮارات ﺧﻴﺎﻟﻴﺔ ﻟﻠﻘﺬﻓﺎت اﻟﻌﴩ( ﺳﺘﻜﻮ اﻟﻨﺴﺒﺔ ٠٫٥٥ﻷ ﻧﺴﺒﺔ ﻇﻬﻮر ﺟﻪ اﻟﺼﻮرة
ﻫﻲ ﻣﻘﺪﱢر ﻏري ﻣﺘﺤﻴﺰ ﻻﺣﺘﻤﺎ أ اﻟﻌﻤﻠﺔ ﺳﻮ ﺗﺴﺘﻘﺮ ﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ.
ﻋﻤﻮﻣﺎ ،املﻘﺪر ذ اﻟﺘﺤﻴﺰ اﻟﻜﺒري ﻟﻦ ﻳﻨﻈﺮ إﻟﻴﻪ ﻋﲆ ﻧﺤﻮ ﻣﻔﻀﻞ ﻣﺜﻞ املﻘﺪر ﻏري
املﺘﺤﻴﺰ .ﰲ املﺘﻮﺳﻂ ،ﻣﻦ ﺧﻼ ﺗﻜﺮار اﻟﺘﺠﺮﺑﺔ ،ﻓﺈ املﻘﺪر ذا اﻟﺘﺤﻴﺰ اﻟﻜﺒري ﺳﻮ ﻳﺴﻔﺮ
ﻋﻦ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ ﻛﺜريا ﻋﻦ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ.
ﺛﻤﺔ ﻣﻘﻴﺎس آﺧﺮ ﻟﺘﺤﺪﻳﺪ ﺟﻮدة املﻘﺪر ﻫﻮ »ﻣﺘﻮﺳﻂ ﻣﺮﺑﻊ اﻟﺨﻄﺄ«؛ ﻓﺒﺎﻟﻨﺴﺒﺔ ﻷ
ﻗﻴﻤﺔ ﻣﻘﺪﱠرة ﻣﻌﻴﻨﺔ ﻳﻤﻜﻨﻨﺎ — إذا ﻋﺮﻓﻨﺎ ﻗﻴﻤﺔ املﻌﻠﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ — ﺣﺴﺎب ﻣﺮﺑﻊ اﻟﻔﺎر
)أ »ﻣﺮﺑﻊ اﻟﺨﻄﺄ«( ﺑني اﻟﺘﻘﺪﻳﺮ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ .اﻟﱰﺑﻴﻊ ﻣﻔﻴﺪ ﻟﺴﺒﺐ اﺣﺪ؛ ﻫﻮ أﻧﻪ
ﻳﺠﻌﻞ ﻛﻞ اﻷرﻗﺎ ﻣﻮﺟﺒﺔ .ﺑﻤﺎ أ اﻟﺘﻘﺪﻳﺮ ﻧﻔﺴﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ ﻳﺨﺘﻠﻒ ﻣﻦ ﻋﻴﻨﺔ ﻟﻌﻴﻨﺔ
أﺧﺮ ،ﻓﺈ ﻣﺮﺑﻊ اﻟﺨﻄﺄ ﻫﻮ أﻳﻀﺎ ﻛﺬﻟﻚ .ﺑﻤﺎ أﻧﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ ،ﻓﺈ ﻟﺪﻳﻪ ﺗﻮزﻳﻌﺎ،
»ﻣﺘﻮﺳﻂ« ﻣﺮﺑﻊ اﻟﺨﻄﺄ ﺑﺒﺴﺎﻃﺔ ﻫﻮ ﻣﺘﻮﺳﻂ ﻫﺬا اﻟﺘﻮزﻳﻊ .ﻣﺘﻮﺳﻂ ﻣﺮﺑﻊ اﻟﺨﻄﺄ اﻟﺼﻐري
ﻳﻌﻨﻲ أ ﱠ — ﰲ املﺘﻮﺳﻂ — ﻣﺮﺑﻊ اﻟﻔﺎر ﺑني اﻟﻘﻴﻤﺔ املﻘﺪﱠرة اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﺻﻐري .ﻻ
ﱠ
ﻣﻔﻀﻠﺔ ﻣﺜﻞ ذﻟﻚ ﻳﻨﻈﺮ إﱃ املﻘﺪﱢر اﻟﺬ ﻳﻌﺮ أ ﻟﺪﻳﻪ ﻣﺘﻮﺳﻂ ﻣﺮﺑﻊ ﺧﻄﺄ ﻛﺒريا ﺑﻨﻈﺮة
اﻟﺬ ﻟﺪﻳﻪ ﻣﺘﻮﺳﻂ ﻣﺮﺑﻊ ﺧﻄﺄ ﺻﻐري؛ إذ ﻟﻦ ﻳﺜﻖ املﺮء ﻛﺜريا ﰲ أ ﻗﻴﻤﺘﻪ ﻗﺮﻳﺒﺔ ﻣﻦ اﻟﻘﻴﻤﺔ
اﻟﺤﻘﻴﻘﻴﺔ.
84
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
ﻣﻦ اﻟﻘﻴﻢ — أ »ﻓﱰة« — ﻧﺜﻖ ﰲ أﻧﻬﺎ ﺗﺤﺘﻮ ﻋﲆ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ .دﻋﻨﺎ ﻧﻌ ْﺪ إﱃ ﺻﻔﻘﺔ
اﻟﻌﴩة/اﻟﺨﻤﺴﺔ ﺟﻨﻴﻬﺎت اﻟﺘﻲ ﻋﺮﺿﻬﺎ ﺻﺪﻳﻘﻲ .ﺳﻌﻴْﻨﺎ ﺳﺎﺑﻘﺎ ﻟﻠﻮﺻﻮ إﱃ أﻓﻀﻞ ﺗﻘﺪﻳﺮ
ﺣﻴﺪ ﻻﺣﺘﻤﺎ أ ﻗﺬﻓﺔ اﻟﻌﻤﻠﺔ ﺳﺘﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة .ﺑﺪﻻ ﻣﻦ ذﻟﻚ ،ﻳﻤﻜﻦ أ ﻧﺴﻌﻰ
ﻟﻠﻮﺻﻮ إﱃ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﺘﻲ ﻧﺜﻖ ﰲ أﻧﻬﺎ ﺗﺸﻤﻞ اﻻﺣﺘﻤﺎ اﻟﺤﻘﻴﻘﻲ .رﺑﻤﺎ ﻳﻤﻜﻨﻨﺎ
أ ﻧﻜﻮ اﺛﻘني ﻟﻠﻐﺎﻳﺔ ﰲ أ اﻻﺣﺘﻤﺎ اﻟﺤﻘﻴﻘﻲ ﻳﻜﻤﻦ ﺑني ،٥ / ٢ ٤ / ١ﻣﺜﻼ .ﻫﺬا
ﻣﺜﺎ ﻋﲆ »ﺗﻘﺪﻳﺮ اﻟﻔﱰة«.
ﺑﻤﺎ أ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻣﺠﻬﻮﻟﺔ ،ﻓﻼ ﻧﺴﺘﻄﻴﻊ أ ﻧﻘﻮ ﻋﲆ ﺟﻪ اﻟﻴﻘني إذا ﻛﺎﻧﺖ
أ ﻓﱰة ﻣﻌﻴﻨﺔ ﺳﻮ ﺗﺸﺘﻤﻞ ﰲ اﻟﻮاﻗﻊ ﻋﲆ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ أ ﻻ .ﻟﻜﻦ ﺗﺨﻴﱠ ْﻞ ﺗﻜﺮار
اﻟﺘﻤﺮﻳﻦ ﻣﺮارا ﺗﻜﺮارا ﺑﺎﺳﺘﺨﺪا ﻋﻴﻨﺎت ﻋﺸﻮاﺋﻴﺔ ﻣﺨﺘﻠﻔﺔ )ﺗﻤﺎﻣﺎ ﻛﻤﺎ ﺗﺨﻴﻠﻨﺎ ﻋﻨﺪﻣﺎ ﺣﺪدﻧﺎ
اﻟﺘﺤﻴﺰ ﺳﺎﺑﻘﺎ( .ﻳﻤﻜﻨﻨﺎ ﺣﺴﺎب ﺗﻘﺪﻳﺮ اﻟﻔﱰة ﻟﻜﻞ ﻋﻴﻨﺔ ﻣﻦ ﻫﺬ اﻟﻌﻴﻨﺎت ،إذا أﻧﺸﺌﺖ
اﻟﻔﱰات ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ ،ﻓﻤﻦ املﻤﻜﻦ أ ﻧﻘﻮ إ ﻧﺴﺒﺔ ﻣﻌﻴﻨﺔ ﻣﻦ اﻟﻔﱰات )ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎ ٪٩٥أ ٪٩٩أ ﻣﺎ ﻧﺨﺘﺎر( ﺗﺸﻤﻞ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ املﺠﻬﻮﻟﺔ.
ﺑﺎﻟﻌﻮدة إﱃ ﻋﻤﻠﺔ ﺻﺪﻳﻘﻲ ،ﻻ ﻧﺴﺘﻄﻴﻊ أ ﻧﻘﻮ ﻋﲆ ﺟﻪ اﻟﻴﻘني إ أ ﻓﱰة ﻣﻌﻴﻨﺔ،
ﻣﺤﺴﻮﺑﺔ ﻷ ﻋﻴﻨﺔ ﺑﻴﺎﻧﺎت ﻣﻌﻴﻨﺔ ،ﺳﺘﺤﺘﻮ ﻋﲆ اﻻﺣﺘﻤﺎ اﻟﺼﺤﻴﺢ ﺑﺄ اﻟﻌﻤﻠﺔ ﺳﻮ
ﺗﻈﻬﺮ ﺟﻪ اﻟﺼﻮرة .ﻟﻜﻦ ﻳﻤﻜﻨﻨﺎ اﻟﻘﻮ إ ) ٪٩٥أ ﻣﺎ ﻧﺨﺘﺎر( ﻣﻦ اﻟﻔﱰات ﺳﺘﺤﺘﻮ
ﻋﲆ اﻻﺣﺘﻤﺎ اﻟﺤﻘﻴﻘﻲ .ﺑﻤﺎ أ ٪٩٥ﻣﻦ اﻟﻔﱰات ﺳﻮ ﺗﺤﺘﻮ ﻋﲆ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ،
ﻓﺈﻧﻨﺎ ﻳﻤﻜﻦ أ ﻧﺜﻖ ﻋﲆ ﻧﺤﻮ ﻛﺒري أ اﻟﻔﱰة اﻟﻮاﺣﺪة اﻟﺘﻲ ﺣﺴﺒﻨﺎﻫﺎ ،اﺳﺘﻨﺎدا إﱃ اﻟﻌﻴﻨﺔ
اﻟﺘﻲ ﺣﺼﻠﻨﺎ ﻋﻠﻴﻬﺎ ﻓﻌﻼ )ص – – ص – – – ﰲ املﺜﺎ ( ﺳﺘﺸﻤﻞ اﻟﻘﻴﻤﺔ
اﻟﺤﻘﻴﻘﻴﺔ؛ ﻟﻬﺬا اﻟﺴﺒﺐ ،ﺗﺴﻤﻰ ﻫﺬ اﻟﻔﱰات »ﻓﱰات اﻟﺜﻘﺔ«.
ﺑﺎﻟﺘﺤﻮ إﱃ ﻃﺮ اﻟﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰ ،رأﻳﻨﺎ أ ﻧﺘﻴﺠﺔ اﻟﺘﺤﻠﻴﻞ اﻟﺒﺎﻳﺰ ﻫﻲ ﺗﻮزﻳﻊ
ﺑﻌﺪ ﱞ ﻛﺎﻣﻞ ﻟﻠﻘﻴﻢ ،ﻫﺬا اﻟﺘﻮزﻳﻊ ﻳﺨﱪﻧﺎ ﺑﻘﻮة اﻋﺘﻘﺎدﻧﺎ ﰲ أ املﻌﻠﻤﺔ ﻟﺪﻳﻬﺎ أ ﻗﻴﻤﺔ ﻣﻌﻴﻨﺔ.
ﻳﻤﻜﻦ أ ﻧﱰ اﻷﻣﻮر ﻋﻨﺪ ﻫﺬا اﻟﺤﺪ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا ﻛﺎ ﻟﻠﺘﻮزﻳﻊ اﻧﺤﺮا ﻣﻌﻴﺎر
ﺻﻐري ﻓﺈ ﻫﺬا ﻳﻌﻨﻲ أﻧﻨﺎ ﻛﻨﱠﺎ ﻋﲆ ﺛﻘﺔ ﻛﺒرية ﺑﺄ ﻗﻴﻤﺔ املﻌﻠﻤﺔ ﺗﻜﻤﻦ ﰲ ﻧﻄﺎ ﺿﻴﻖ.
ﻟﻜﻦ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ،ﻣﻦ املﺮﻳﺢ ﺗﻠﺨﻴﺺ اﻷﻣﻮر ﺑﻄﺮﻳﻘﺔ ﻣﻤﺎﺛﻠﺔ ﻟﻔﱰات اﻟﺜﻘﺔ أﻋﻼ ،
ﺗﻘﺪﻳﻢ ﻓﱰة ﻣﺤﺪدة ﺑﺄﻛﱪ أﺻﻐﺮ ﻗﻴﻤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ إﻳﺠﺎد ﻓﱰة ﺗﺤﺘﻮ ﻋﲆ
٪٩٥ﻣﻦ املﺴﺎﺣﺔ املﻮﺟﻮدة ﺗﺤﺖ اﻟﺘﻮزﻳﻊ اﻻﺣﺘﻤﺎﱄ اﻟﺒﻌﺪ داﺧﻠﻬﺎ .ﺑﻤﺎ أ اﻟﺘﻮزﻳﻌﺎت
ﺗﻤﺘﻠﻚ درﺟﺔ ﻣﻦ ﺗﻔﺴري املﻌﺘﻘﺪ ،ﻓﺈ ﻫﺬ اﻟﻔﱰات ﻳﻤﻜﻦ ﺗﻔﺴريﻫﺎ ﻋﲆ أﻧﻬﺎ ﺗﻌﻄﻲ اﺣﺘﻤﺎ
أ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﺗﻜﻤﻦ ﰲ داﺧﻠﻬﺎ .ﻟﺘﻤﻴﻴﺰﻫﺎ ﻋﻦ ﻓﱰات اﻟﺜﻘﺔ اﻟﺘﻜﺮارﻳﺔ ،ﺗﺴﻤﱠ ﻰ ﻫﺬ
اﻟﻔﱰات »ﻓﱰات املﺼﺪاﻗﻴﺔ«.
85
ﻋﻠﻢ اﻹﺣﺼﺎء
) (4اﻻﺧﺘﺒﺎر
86
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
ﻫﺬا ﻳﻌﻨﻲ أﻧﻨﺎ ﻳﻤﻜﻦ اﺳﺘﺨﺪا ﺣﺪ — tﻣﺜﻼ — ﺑﺤﻴﺚ ﻟﻮ ﻻﺣﻈﻨﺎ أ ﻧﺴﺒﺔ اﻟﺸﻔﺎء
ﰲ اﻟﻌﻴﻨﺔ أﻗﻞ ﻣﻦ tﺳﻮ ﻧﺮﺟﺢ ﻓﺮﺿﻴﺔ ،٪٥٠إذا ﻻﺣﻈﻨﺎ ﻧﺴﺒﺔ ﺷﻔﺎء ﰲ اﻟﻌﻴﻨﺔ أﻛﱪ
ﻣﻦ ،tﻓﺴﻮ ﻧﺮﺟﺢ ﻓﺮﺿﻴﺔ .٪٨٠ﰲ اﻟﺤﺎﻟﺔ اﻟﺜﺎﻧﻴﺔ ،ﻧﻘﻮ إ إﺣﺼﺎﺋﻴﺎت اﻟﻌﻴﻨﺔ ﺗﻘﻊ
ﰲ »ﻣﻨﻄﻘﺔ اﻟﺮﻓﺾ« أ »املﻨﻄﻘﺔ اﻟﺤﺮﺟﺔ«؛ ﺣﻴﺚ إ ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﻟﻠﻌﻼج املﻌﻴﺎر —
— ٪٥٠ﻗﺪ »رﻓﻀﺖ«.
ﺑﺎﻟﻘﻴﺎ ﺑﺬﻟﻚ ،ﻓﺈﻧﻨﺎ ﻧﺨﺎﻃﺮ ﺑﺎﻟﻮﻗﻮع ﰲ أﺣﺪ ﻧﻮﻋني ﻣﻦ اﻷﺧﻄﺎء؛ ﻓﻘﺪ ﻧﻘﺮر أ اﻟﺪ اء
اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٨٠ﻣﻦ املﺮﴇ ﰲ ﻣﺠﻤﻮﻋﺔ املﺮﴇ اﻟﺨﺎﺿﻌني ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﻢ ﰲ ﺣني
أﻧﻪ ﰲ اﻟﺤﻘﻴﻘﺔ ﻳﺸﻔﻲ ٪٥٠ﻓﻘﻂ ،أ ﻗﺪ ﻧﻘﺮر أ اﻟﺪ اء اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٥٠ﻣﻦ املﺮﴇ ﰲ
ﻣﺠﻤﻮﻋﺔ املﺮﴇ اﻟﺨﺎﺿﻌني ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﻢ ﰲ ﺣني أﻧﻪ ﰲ اﻗﻊ اﻷﻣﺮ ﻳﺸﻔﻲ .٪٨٠ﺗﺮﺗﱢﺐ
ﻃﺮﻳﻘﺔ ﺗﺴﻤﻰ ﻃﺮﻳﻘﺔ »ﻧﻴﻤﺎ -ﺑريﺳﻮ « ﻻﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺔ اﻷﻣﻮر ﺑﺤﻴﺚ ﻳﻜﻮ اﺣﺘﻤﺎ
اﻟﻮﻗﻮع ﰲ ﻛﻼ ﻫﺬﻳﻦ اﻟﻨﻮﻋني ﻣﻦ اﻷﺧﻄﺎء ﻣﻌﺮ ﻓﺎ ،ﺻﻐريا ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻟﻴﻌﻄﻴﻨﺎ ﺛﻘﺔ
ﰲ اﻟﻨﺘﺎﺋﺞ.
إﻟﻴﻚ ﻛﻴﻔﻴﺔ ﻋﻤﻞ ذﻟﻚ :ﻧﺒﺪأ ﺑﻮﺿﻊ اﻓﱰاض؛ إذ ﻧﻔﱰض أ اﻟﺪ اء اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٥٠
ﻓﻘﻂ ﻣﻦ املﺮﴇ ،ﻳﺴﻤﻰ ﻫﺬا اﻻﻓﱰاض »ﻓﺮﺿﻴﺔ اﻟﻌﺪ « .ﺗﻨﺺ ﻓﺮﺿﻴﺔ أﺧﺮ ﺗﺴﻤﱠ ﻰ
»اﻟﻔﺮﺿﻴﺔ اﻟﺒﺪﻳﻠﺔ« ﻋﲆ أ اﻟﺪ اء اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٨٠ﻣﻦ املﺮﴇ .ﺑﺎﺳﺘﺨﺪا ﺣﺴﺎﺑﺎت
اﻻﺣﺘﻤﺎ اﻷﺳﺎﺳﻴﺔ ﻧﺘﻤﻜﻦ ﻣﻦ ﻣﻌﺮﻓﺔ ﻧﺴﺒﺔ اﻟﻌﻴﻨﺎت اﻟﺘﻲ ﺳﻮ ﺗﻈﻬﺮ ﻧﺴﺒﺔ ﺷﻔﺎء —
ﻋﻦ ﻃﺮﻳﻖ املﺼﺎدﻓﺔ — أﻛﱪ ﻣﻦ أ tﻣﺨﺘﺎرة ،إذا ﻛﺎ اﻓﱰاض ) ٪٥٠ﻓﺮﺿﻴﺔ اﻟﻌﺪ (
ﺣﻘﻴﻘﻴٍّﺎ .ﻋﺎدة ﻣﺎ ﺗﺨﺘﺎر tﺑﺤﻴﺚ إﻧﻪ إذا ﻛﺎﻧﺖ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ﺣﻘﻴﻘﻴﺔ ،ﻓﺈ ٪٥أ ٪١
ﻓﻘﻂ ﻣﻦ املﺮات ﺗﺘﺠﺎ ز ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﰲ اﻟﻌﻴﻨﺔ .t
ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ،ﻋﻨﺪﻣﺎ ﺗﻜﻮ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ﺣﻘﻴﻘﻴﺔ )أ إذا ﻛﺎ ٪٥٠ﻓﻘﻂ ﻣﻦ
املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ ﺳﻴﺸﻔﻰ( ﺣﺼﻠﻨﺎ ﰲ اﻟﻮاﻗﻊ ﻋﲆ ﻧﺴﺒﺔ ﺷﻔﺎء ﰲ
اﻟﻌﻴﻨﺔ أﻛﱪ ﻣﻦ — tﻣﻤﺎ ﻳﺆد ﺑﻨﺎ إﱃ اﺗﺨﺎذ ﻗﺮار ﻟﺼﺎﻟﺢ ﻧﺴﺒﺔ اﻟﺸﻔﺎء اﻟﻜﲇ اﻟﺒﺎﻟﻐﺔ ٪٨٠
— ﻓﺮﺑﻤﺎ ﻧﻜﻮ اﻗﻌني ﰲ اﻟﻨﻮع اﻷ ﻣﻦ اﻷﺧﻄﺎء املﺬﻛﻮرة آﻧﻔﺎ ) ﻫﻮ ﻣﺎ ﻳﺴﻤﻰ ﺗﻘﻠﻴﺪﻳٍّﺎ
»ﺧﻄﺄ ﻣﻦ اﻟﻨﻮع اﻷ «( .ﻋﺎدة ﻣﺎ ﻳﺴﺘﺨﺪ اﻟﺮﻣﺰ ∝ ﻟﺘﻤﺜﻴﻞ اﺣﺘﻤﺎ ﺣﺪ ث ﺧﻄﺄ ﻣﻦ
اﻟﻨﻮع اﻷ .ﻳﻌﻨﻲ اﺧﺘﻴﺎرﻧﺎ ﻟﻘﻴﻤﺔ tﰲ املﺜﺎ أ ∝ ﺛﺎﺑﺘﺔ ﻟﺪﻳﻨﺎ ﻋﻨﺪ ٠٫٠٥أ ٠٫٠١أ
أ ﻗﻴﻤﺔ ﻧﺨﺘﺎرﻫﺎ.
إذا ﻻﺣﻈﻨﺎ ﻧﺴﺒﺔ ﺷﻔﺎء ﰲ اﻟﻌﻴﻨﺔ أﻛﱪ ﻣﻦ ،tﺣﻴﻨﻬﺎ إﻣﺎ أ ﺗﻜﻮ ﻓﺮﺿﻴﺔ اﻟﻌﺪ
ﺣﻘﻴﻘﻴﺔ )اﻟﻨﺴﺒﺔ اﻟﺤﻘﻴﻘﻴﺔ اﻟﺒﺎﻟﻐﺔ ،(٪٥٠ﻳﻜﻮ ﺣﺪث ذ اﺣﺘﻤﺎ ﺿﻌﻴﻒ )ﻣﻌﺪ
87
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﻌﻴﻨﺔ أﻋﲆ ﻣﻦ ،tﻳﺤﺪث ﺑﺎﺣﺘﻤﺎ ∝( ﻗﺪ ﻗﻊ ،أ ﺗﻜﻮ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ﻏري ﺣﻘﻴﻘﻴﺔ.
ﻫﺬا ﻫﻤﺎ اﻻﺣﺘﻤﺎﻻ اﻟﻮﺣﻴﺪا املﻤﻜﻨﺎ ،ﻫﺬا ﻫﻮ ﺟﻮﻫﺮ ﻃﺮﻳﻘﺔ ﻧﻴﻤﺎ -ﺑريﺳﻮ ﻻﺧﺘﺒﺎر
اﻟﻔﺮﺿﻴﺔ؛ ﻓﻌﻦ ﻃﺮﻳﻖ اﺧﺘﻴﺎر tﺑﺤﻴﺚ ﻳﻜﻮ ∝ ﺻﻐريا ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ) ﻳﻌﺘﻘﺪ ﻋﻤﻮﻣﺎ
أ ٠٫٠١ ٠٫٠٥ﺻﻐريا ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ( ،ﻧﺸﻌﺮ ﻋﲆ ﻧﺤﻮ ﻣﻌﻘﻮ ﺑﺎﻟﺜﻘﺔ ﻋﻨﺪ اﻹﺷﺎرة
إﱃ أ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ﻟﻴﺴﺖ ﺣﻘﻴﻘﻴﺔ؛ ﻷﻧﻪ ﻟﻮ ﻛﺎﻧﺖ ﺣﻘﻴﻘﺔ ﻟﻮﻗﻊ ﺣﺪث ﻏري ﻣﺮﺟﺢ.
أﻣﺎ اﻟﻨﻮع اﻟﺜﺎﻧﻲ ﻣﻦ اﻷﺧﻄﺎء )ﻳﺴﻤﻰ ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎ »ﺧﻄﺄ ﻣﻦ اﻟﻨﻮع اﻟﺜﺎﻧﻲ«(
ﻓﻴﻨﺸﺄ ﻋﻨﺪﻣﺎ ﺗﻜﻮ اﻟﻔﺮﺿﻴﺔ اﻟﺒﺪﻳﻠﺔ ﺣﻘﻴﻘﻴﺔ )ﻧﺴﺒﺔ ٪٨٠ﰲ املﺜﺎ ( ،ﻟﻜﻦ ﻧﺴﺒﺔ اﻟﺸﻔﺎء
املﺮﺻﻮدة ﰲ اﻟﻌﻴﻨﺔ أﻗﻞ ﻣﻦ .tﺑﻤﺎ أﻧﻨﺎ اﺧﱰﻧﺎ tﻟﻠﺴﻴﻄﺮة ﻋﲆ اﺣﺘﻤﺎ اﻟﻮﻗﻮع ﰲ اﻟﺨﻄﺄ
ﻣﻦ اﻟﻨﻮع اﻷ ،ﻻ ﻳﻤﻜﻨﻨﺎ أ ﻧﺨﺘﺎر tأﻳﻀﺎ ﻟﻠﺴﻴﻄﺮة ﻋﲆ اﺣﺘﻤﺎ اﻟﻮﻗﻮع ﰲ اﻟﺨﻄﺄ ﻣﻦ
اﻟﻨﻮع اﻟﺜﺎﻧﻲ .ﻣﻊ ذﻟﻚ ،ﻳﻤﻜﻨﻨﺎ أ ﻧﺠﻌﻞ اﺣﺘﻤﺎ اﻟﻮﻗﻮع ﰲ اﻟﺨﻄﺄ ﻣﻦ اﻟﻨﻮع اﻟﺜﺎﻧﻲ
ﺻﻐريا ﻛﻤﺎ ﻧﺸﺎء ﻋﻦ ﻃﺮﻳﻖ أﺧﺬ ﻋﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻳﻜﻔﻲ .ﻫﺬا ﻣﺮة أﺧﺮ ﻫﻮ ﺗﺄﺛري
ﻗﺎﻧﻮ اﻷﻋﺪاد اﻟﻜﺒرية؛ ﻓﺰﻳﺎدة ﺣﺠﻢ اﻟﻌﻴﻨﺔ ﻳﻘﻠﻞ ﻣﻦ ﻧﻄﺎ اﻟﺘﻔﺎ ت ﰲ ﺗﻘﺪﻳﺮ اﻟﻌﻴﻨﺔ؛
ﻣﻦ ﺛ ﱠﻢ ﻳﻘﻠﻞ ﻣﻦ اﺣﺘﻤﺎ أ ﻳﻜﻮ ﺗﻘﺪﻳﺮ اﻟﻌﻴﻨﺔ أﻗﻞ ﻣﻦ tﻋﻨﺪﻣﺎ ﺗﻜﻮ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ
ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ أﻋﲆ؛ أ ﻋﻨﺪ ﻗﻴﻤﺔ .٪٨٠ﺑﺎﻟﺘﺤﺪﻳﺪ ،ﻣﻦ ﺧﻼ
ﺟﻌﻞ اﻟﻌﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻳﻜﻔﻲ ﻳﻤﻜﻨﻨﺎ أ ﻧﻘ ﱢﻠﻞ ﻣﻦ اﺣﺘﻤﺎ ﺣﺪ ث اﻟﺨﻄﺄ ﻣﻦ اﻟﻨﻮع اﻟﺜﺎﻧﻲ
إﱃ أ ﻗﻴﻤﺔ ﻧﺮاﻫﺎ ﻣﻨﺎﺳﺒﺔ .ﻋﺎدة ﻣﺎ ﻳﺴﺘﺨﺪ اﻟﺮﻣﺰ βﻟﺘﻤﺜﻴﻞ اﺣﺘﻤﺎ ﺣﺪ ث اﻟﺨﻄﺄ ﻣﻦ
اﻟﻨﻮع اﻟﺜﺎﻧﻲ ،ﻳﺴﺘﺨﺪ ﻣﺼﻄﻠﺢ »اﻟﻘﻮة« ﻟﺘﻤﺜﻴﻞ 1 − β؛ ﻫﻮ اﺣﺘﻤﺎ اﺧﺘﻴﺎر اﻟﻔﺮﺿﻴﺔ
اﻟﺒﺪﻳﻠﺔ ﻋﻨﺪﻣﺎ ﺗﻜﻮ ﺣﻘﻴﻘﻴﺔ.
إ ﻣﻮﻗﻒ اﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺎت املﺬﻛﻮر ﻫﻨﺎ ﻳﺸﺒﻪ املﻮﻗﻒ ﰲ املﺤﻜﻤﺔ ،ﺣﻴﺚ ﻳﻔﱰض
ﰲ اﻟﺒﺪاﻳﺔ أ املﺘﻬﻢ ﺑﺮ ء )ﻓﺮﺿﻴﺔ اﻟﻌﺪ ( ،ﻫﻨﺎ ﻳﻜﻮ ﻣﻦ املﻤﻜﻦ ﺣﺪ ث ﻧﻮﻋني ﻣﻦ
اﻷﺧﻄﺎء :اﻟﺤﻜﻢ ﻋﲆ ﺷﺨﺺ ﺑﺮ ء ﺑﺄﻧﻪ ﻣﺬﻧﺐ )اﻟﻨﻮع اﻷ ( أ اﻟﺤﻜﻢ ﻋﲆ ﺷﺨﺺ ﻣﺬﻧﺐ
ﺑﺄﻧﻪ ﺑﺮ ء )اﻟﻨﻮع اﻟﺜﺎﻧﻲ(.
ﻻﺣﻆ أ اﻟﻔﺮﺿﻴﺘني ﺗﺪﺧﻼ ﰲ ﻃﺮﻳﻘﺔ ﻧﻴﻤﺎ -ﺑريﺳﻮ ﻻﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺔ :ﻓﺮﺿﻴﺔ
اﻟﻌﺪ اﻟﻔﺮﺿﻴﺔ اﻟﺒﺪﻳﻠﺔ .ﰲ »اﺧﺘﺒﺎر اﻟﺪﻻﻟﺔ« ،ﺗﺨﻀﻊ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ﻓﻘﻂ ﻟﻼﺧﺘﺒﺎر؛
ﻓﺎﻟﻬﺪ ﻫﻮ »رﻓﺾ« ﻓﺮﺿﻴﺔ اﻟﻌﺪ إذا ﻛﺎﻧﺖ اﻟﻘﻴﻤﺔ اﻹﺣﺼﺎﺋﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻼﺧﺘﺒﺎر
)ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﰲ اﻟﻌﻴﻨﺔ ﰲ املﺜﺎ اﻟﺴﺎﺑﻖ( ﻣﺨﺘﻠﻔﺔ ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻋﻤﱠ ﺎ ﻳﻤﻜﻦ ﱡ
ﺗﻮﻗﻌﻪ ﰲ
ﻇﻞ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ،أ »اﻟﻔﺸﻞ ﰲ رﻓﻀﻬﺎ« إذا ﻟﻢ ﺗﻜﻦ اﻟﻘﻴﻤﺔ ﻣﺘﻄﺮﻓﺔ ﻟﻠﻐﺎﻳﺔ .ﻓﻼ ﺗﻮﺟﺪ
أ ﻓﺮﺿﻴﺔ ﺑﺪﻳﻠﺔ ﻣﺬﻛﻮرة ﺑﻮﺿﻮح .ﻳﺴﺘﺨﺪ املﺼﻄﻠﺢ »ﻗﻴﻤﺔ «pﻟﻮﺻﻒ اﺣﺘﻤﺎ أ
88
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
ﻧﺮﺻﺪ ﻗﻴﻤﺔ إﺣﺼﺎﺋﻴﺔ ﺧﺎﺿﻌﺔ ﻟﻼﺧﺘﺒﺎر ﻣﺘﻄﺮﻓﺔ ﻣﺜﻞ ﺗﻠﻚ املﺮﺻﻮدة ﰲ اﻟﻮاﻗﻊ ،أ أﻛﺜﺮ
ﺗﻄﺮﻓﺎ إذا ﻛﺎﻧﺖ ﻓﺮﺿﻴﺔ اﻟﻌﺪ ﺣﻘﻴﻘﻴﺔ.
ﺿﻌﺖ ﻓﻜﺮﺗﺎ ﻓﺮﺿﻴﺔ اﻟﻌﺪ اﺧﺘﺒﺎر اﻟﺪﻻﻟﺔ ﻣﻦ أﺟﻞ ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ املﺸﺎﻛﻞ،
ﻓﺜﻤﺔ اﺧﺘﺒﺎرات ﻣﻌﻴﻨﺔ ﻃﻮﱢرت ﺳﻤﱢ ﻴﺖ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎ ﺑﺎﺳﻢ أﺣﺪ ﻣﻄﻮﱢرﻳﻬﺎ اﻷﺻﻠﻴني
)ﻣﺜﻞ اﺧﺘﺒﺎر اﻟﺪ ،اﺧﺘﺒﺎر ﻣﺎ ﻳﺘﻨﻲ( ،أ ﺳﻤﱢ ﻴﺖ ﺗﻴﻤﱡ ﻨﺎ ﺑﺘﻮزﻳﻊ اﻹﺣﺼﺎﺋﻴﺔ املﻌﻨﻴﺔ
اﻟﺨﺎﺿﻌﺔ ﻟﻼﺧﺘﺒﺎر )ﻣﺜﻞ اﺧﺘﺒﺎر ،tاﺧﺘﺒﺎر ﻣﺮﺑﻊ ﻛﺎ (.
ﺗﻌ ﱡﺪ اﺧﺘﺒﺎرات اﻟﻔﺮﺿﻴﺎت اﻟﺒﺎﻳﺰﻳﺔ — ﻇﺎﻫﺮﻳٍّﺎ ﻋﲆ اﻷﻗﻞ — أﻛﺜﺮ ﺿﻮﺣﺎ؛ ْ
ﻓﻮﻓﻖ
ﻣﱪﻫﻨﺔ ﺑﺎﻳﺰ ،ﻟﺪﻳﻨﺎ اﺣﺘﻤﺎﻻت ﺑﻌﺪﻳﺔ ﺑﺄ ﻛﻞ ﻓﺮﺿﻴﺔ ﺣﻘﻴﻘﻴﺔ؛ ﻣﻦ ﺛﻢ ﻧﺴﺘﻄﻴﻊ اﺳﺘﺨﺪاﻣﻬﺎ
ﻻﺧﺘﻴﺎر إﺣﺪ اﻟﻔﺮﺿﻴﺎت .ﰲ املﻤﺎرﺳﺔ اﻟﻌﻤﻠﻴﺔ ،ﻓﺈ اﻷﻣﻮر ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ﺗﻜﻮ أﻛﺜﺮ
ﺗﻌﻘﻴﺪا.
89
ﻋﻠﻢ اﻹﺣﺼﺎء
إﻟﻴﻚ ﻣﺜﺎﻻ ﻋﲆ ذﻟﻚ .رﺑﻤﺎ ﺗﺮﻏﺐ ﴍﻛﺔ ﻣﺎ ﰲ ﻣﻌﺮﻓﺔ أ ﱡ ﻣﺴﺎر ﻟﻠﻌﻤﻞ — إرﺳﺎ
رﺳﺎﻟﺔ أ إﺟﺮاء ﻣﻜﺎملﺔ ﻫﺎﺗﻔﻴﺔ — ﻫﻮ اﻷﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ ﰲ ﺗﺸﺠﻴﻊ ﻋﻤﻼﺋﻬﺎ ﻋﲆ ﴍاء أﺣﺪث
ﻣﻨﺘﺠﺎﺗﻬﺎ .ﺳﻴﻜﻮ ﻣﻦ ﻏري اﻟﻮاﻗﻌﻲ أ ﻧﺘﺼﻮر أ اﻹﺟﺮاء ﻧﻔﺴﻪ ﺳﻴﻜﻮ أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ
ﻟﺠﻤﻴﻊ أﻧﻮاع اﻟﻌﻤﻼء؛ ﻓﺴﻴﺴﺘﺠﻴﺐ ﺑﻌﺾ اﻟﻌﻤﻼء ﻋﲆ ﻧﺤﻮ أﻓﻀﻞ ﻟﻠﺮﺳﺎﻟﺔ ،ﺳﻴﺴﺘﺠﻴﺐ
اﻟﺒﻌﺾ أﻓﻀﻞ ﻟﻠﻤﻜﺎملﺔ اﻟﻬﺎﺗﻔﻴﺔ ،ﻟﻜﻨﻨﺎ ﻻ ﻧﻌﺮ اﻟﻮﺳﻴﻠﺔ اﻷﻓﻀﻞ ﻟﻜﻞ ﻋﻤﻴﻞ .ﻟﻜﻦ رﺑﻤﺎ
ﺗﻤﺘﻠﻚ اﻟﴩﻛﺔ ﺑﻴﺎﻧﺎت ﺣﻮ ﻛﻞ ﻋﻤﻴﻞ؛ ﻫﻲ املﻌﻠﻮﻣﺎت اﻟﺘﻲ ﻗﺪﱠﻣﻬﺎ اﻟﻌﻤﻴﻞ ﻋﻨﺪﻣﺎ اﺷﱰ
ﻣﻨﻬﺎ ﻷ ﻣﺮة؛ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﺼﻒ ﻣﺸﱰﻳﺎﺗﻪ اﻟﺴﺎﺑﻘﺔ ،ﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ .ﺑﺎﺳﺘﺨﺪا ﻫﺬ
اﻟﺒﻴﺎﻧﺎت ،ﻳﻤﻜﻨﻨﺎ ﺻﻴﺎﻏﺔ ﻗﻮاﻋﺪ ﻻﺗﺨﺎذ اﻟﻘﺮار ،اﻟﺘﻲ ﺗﺨﱪﻧﺎ ﺑﺄﻣﻮر ﻣﺜﻞ »إذا ﻛﺎ اﻟﻌﻤﻴﻞ
ﻳﺒﻠﻎ ﻣﻦ اﻟﻌﻤﺮ أﻗﻞ ﻣﻦ ٢٥ﻋﺎﻣﺎ ،ﻟﺪﻳﻪ ﻧﻤﻂ ﺳﺎﺑﻖ ﻣﻦ املﺸﱰﻳﺎت اﻟﻌﺎدﻳﺔ ﻓﻘ ْﻢ ﺑﺈﺟﺮاء
»ﻣﻜﺎملﺔ ﻫﺎﺗﻔﻴﺔ«؛ ﺧﻼ ذﻟﻚ ﻗ ْﻢ ﺑﺈرﺳﺎ »اﻟﺮﺳﺎﻟﺔ« «.ﻳﻤﻜﻦ ﺻﻴﺎﻏﺔ اﻟﻌﺪﻳﺪ ﻣﻦ ﻗﻮاﻋﺪ
اﺗﺨﺎذ اﻟﻘﺮار املﺤﺘﻤﻠﺔ ﺗﻠﻚ .ﺑﺎﻟﻨﺴﺒﺔ ﻟﻜﻞ إﺟﺮاء — ﻣﻜﺎملﺔ ﻫﺎﺗﻔﻴﺔ أ رﺳﺎﻟﺔ — ﻓﺈﻧﻨﺎ
ﻧﺴﺘﻄﻴﻊ ﺗﻘﺪﻳﺮ اﻟﺮﺑﺢ ،رﺑﻤﺎ ﺣﺘﻰ ﻣﻦ اﻟﻨﺎﺣﻴﺔ اﻟﻨﻘﺪﻳﺔ ،إذا ﻗﻤﻨﺎ ﺑﻬﺬا اﻹﺟﺮاء اﺗﻀﺢ أ
اﻟﻌﻤﻴﻞ ﻣﻦ اﻟﻨﻮع اﻟﺬ ﻳﺴﺘﺠﻴﺐ )أ ﻻ ﻳﺴﺘﺠﻴﺐ( ﺟﻴﺪا ﻟﻬﺬا اﻹﺟﺮاء؛ ﻣﻦ ﺛﻢ ﻳﻤﻜﻦ أ
ﻧﺨﺘﺎر ﻗﺎﻋﺪة اﺗﺨﺎذ اﻟﻘﺮار اﻟﺘﻲ ﺗﺠﻌﻞ اﻟﺤﺪ اﻷدﻧﻰ ﻟﻠﺮﺑﺢ أﻛﱪ .أ ﻳﻤﻜﻨﻨﺎ ﺣﺴﺎب ﻣﺘﻮﺳﻂ
ﺗﻮزﻳﻊ اﻟﻌﻤﻼء ﻣﻦ ﻛﻞ ﻧﻮع ،ﻹﻧﺘﺎج ﻣﺘﻮﺳﻂ رﺑﺢ ﻟﻜﻞ ﻗﺎﻋﺪة اﺗﺨﺎذ ﻗﺮار ،ﺛﻢ اﺧﺘﻴﺎر
اﻟﻘﺎﻋﺪة اﻟﺘﻲ ﺗﺆد إﱃ أﻛﱪ ﻣﺘﻮﺳﻂ رﺑﺢ.
90
اﻟﺘﻘﺪﻳﺮ اﻻﺳﺘﺪﻻ
أﺧﺬ ﻋﻴﻨﺎت ﻣﺘﻜﺮرة« )ﻳﻨﺒﻐﻲ ﺗﻘﻴﻴﻢ اﻹﺟﺮاءات اﻹﺣﺼﺎﺋﻴﺔ ﻋﲆ أﺳﺎس ﻛﻴﻒ ﺳﺘﺘﴫ »ﰲ
املﺘﻮﺳﻂ« إذا ﻃﺒﻘﺖ ﻋﲆ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻌﻴﻨﺎت املﺘﻜﺮرة(» ،ﻣﺒﺪأ اﻟﻜﻔﺎﻳﺔ« )املﻌﻨﻲ ﺑﺘﻠﺨﻴﺺ
اﻟﺒﻴﺎﻧﺎت ﺑﺤﻴﺚ ﻳﺘﻢ إﺑﻘﺎء ﻣﻌﻠﻮﻣﺎت ﻛﺎﻓﻴﺔ ﻟﺘﻘﺪﻳﺮ أ ﻣﻌﻠﻤﺔ( .ﻳﺒﺪ ﻛﻞ ﻣﺒﺪأ ﻣﻦ ﻫﺬ
املﺒﺎدئ ﻣﻌﻘﻮﻻ ﺗﻤﺎﻣﺎ ،ﻟﻜﻨﻬﺎ رﺑﻤﺎ ﺗﺘﻌﺎرض أﺣﻴﺎﻧﺎ.
ﻛﺎﻧﺖ اﻷﺳﺎﻟﻴﺐ اﻟﺘﻜﺮارﻳﺔ اﻟﻜﻼﺳﻴﻜﻴﺔ ﻟﺴﻨﻮات ﻋﺪﻳﺪة ﻫﻲ اﻟﻄﺮ اﻷﻛﺜﺮ اﺳﺘﺨﺪاﻣﺎ
ﰲ اﻻﺳﺘﺪﻻ ،ﻟﻜﻦ اﻛﺘﺴﺒﺖ اﻷﺳﺎﻟﻴﺐ اﻟﺒﺎﻳﺰﻳﺔ ﺷﻌﺒﻴﺔ ﻛﺒرية ﰲ اﻟﺴﻨﻮات اﻷﺧرية .ﻛﺎ
ﻫﺬا ﻧﺘﻴﺠﺔ ﻣﺒﺎﴍة ﻟﺘﻄﻮﻳﺮ أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﻘﻮﻳﺔ أﺳﺎﻟﻴﺐ اﻟﺤﻮﺳﺒﺔ اﻟﺬﻛﻴﺔ ،ﻓﻀﻼ
ﻋﻦ اﻟﱰ ﻳﺞ ﺑﺤﻤﺎس ملﺜﻞ ﻫﺬ اﻷﺳﺎﻟﻴﺐ ﻣﻦ ﻗﺒﻞ ﻣﺆﻳﺪﻳﻬﺎ؛ ﻓﺎﻟﻌﻠﻮ ﺗﻤﺎرس ﰲ ﺳﻴﺎ
اﺟﺘﻤﺎﻋﻲ ،اﻟﺠﻮاﻧﺐ اﻹﻧﺴﺎﻧﻴﺔ املﺘﻌﻠﻘﺔ ﺑﻜﻴﻔﻴﺔ اﻧﺘﺸﺎر ﺗﺮاﺟﻊ ﻫﻴﻤﻨﺔ اﻷﻓﻜﺎر املﺨﺘﻠﻔﺔ
ﻟﻼﺳﺘﺪﻻ ﻋﲆ ﻣﺪ اﻟﻌﻘﻮد اﻟﻘﻠﻴﻠﺔ املﺎﺿﻴﺔ ﺗﻌﺪ ﻗﺼﺔ راﺋﻌﺔ.
ﺛﻤﺔ ﻧﻘﻄﺔ أﺧرية؛ آﻣﻞ أ أﻛﻮ ﻗﺪ أ ﺿﺤﺖ ﰲ ﻫﺬا اﻟﻔﺼﻞ أ ﻫﻨﺎ ﺟﻮاﻧﺐ ﻣﺨﺘﻠﻔﺔ
ﻟﻼﺳﺘﺪﻻ .ﺗﺤﺪﻳﺪا ،رﺑﻤﺎ ﻧﻜﻮ ﻣﻬﺘﻤﱢ ني ﺑﻤﺤﺎ ﻟﺔ اﻟﻌﺜﻮر ﻋﲆ إﺟﺎﺑﺎت ﻷﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ
اﻷﺳﺌﻠﺔ .ﺗﺸﺘﻤﻞ ﻫﺬ اﻷﺳﺌﻠﺔ ﻋﲆ أﺳﺌﻠﺔ ﻣﺜﻞ :ﺑﻢ ﺗﺨﱪﻧﻲ اﻟﺒﻴﺎﻧﺎت؟ ﻣﺎذا ﻳﻨﺒﻐﻲ ﻋﲇ ﱠ
أ أ ﻣﻦ ﺑﻪ؟ ﻣﺎذا ﻳﻨﺒﻐﻲ أ أﻓﻌﻞ؟ ﻣﺎ إﱃ ذﻟﻚ .ﺗﺘﻼء ﻃﺮ اﻻﺳﺘﺪﻻ املﺨﺘﻠﻔﺔ ﻣﻊ
اﻷﻧﻮاع املﺨﺘﻠﻔﺔ ﻣﻦ اﻷﺳﺌﻠﺔ.
91
اﻟﻔﺼﻞ اﻟﺴﺎدس
املﻤﻜﻨﺔ ﰲ اﻟﻌﺎﻟﻢ اﻟﺤﻘﻴﻘﻲ .ﻫﺬا املﻨﻈﻮر ﻫﻮ اﻟﺬ دﻓﻊ اﻹﺣﺼﺎﺋﻲ اﻟﺒﺎرز ﺟﻮرج ﺑﻮﻛﺲ
ﻟﻠﺘﺄﻛﻴﺪ ﻋﲆ أ »ﺟﻤﻴﻊ اﻟﻨﻤﺎذج ﺧﺎﻃﺌﺔ ،إ ﻛﺎ ﺑﻌﻀﻬﺎ ﻣﻔﻴﺪا «.إﻧﻨﺎ ﻧﺒﻨﻲ ﻧﻤﺎذج ﻟﺴﺒﺐ؛
ﻫﻮ ﻣﺴﺎﻋﺪﺗﻨﺎ ﰲ اﻟﻔﻬﻢ اﻟﺘﻨﺒﺆ اﺗﺨﺎذ اﻟﻘﺮار ،ﻣﺎ إﱃ ذﻟﻚ .رﻏﻢ أﻧﻨﺎ ﻧﺪر أ ﻧﻤﺎذﺟﻨﺎ
ﺗﻤﺜﻞ ﺗﺒﺴﻴﻄﺎ ﴐ رﻳٍّﺎ ﻟﻠﺘﻌﻘﻴﺪ اﻟﺮﻫﻴﺐ ﻟﻠﻌﺎﻟﻢ ،ﻓﺈﻧﻨﺎ إذا ﻣﺎ اﺧﱰﻧﺎﻫﺎ ﺟﻴﺪا ﻓﺴﻮ ﺗﻤﻜﻨﻨﺎ
ﻣﻦ اﻟﻘﻴﺎ ﺑﻬﺬ اﻷﻣﻮر .أﻣﺎ إذا اﺧﱰﻧﺎﻫﺎ ﻋﲆ ﻧﺤﻮ ﺳﻴﺊ ،ﻓﻠﻦ ﻧﻔﻬﻢ ،ﺳﻮ ﺗﺨﻔﻖ
ﺗﻮﻗﻌﺎﺗﻨﺎ ،ﺳﻮ ﺗﺆد ﻗﺮاراﺗﻨﺎ إﱃ أﺧﻄﺎء؛ إذ ،ﻫﺪﻓﻨﺎ ﻫﻮ ﺑﻨﺎء ﻧﻤﺎذج ﺟﻴﺪة ﺑﻤﺎ ﻓﻴﻪ ﱡ
اﻟﻜﻔﺎﻳﺔ ﻟﺘﺤﻘﻴﻖ ﻏﺮﺿﻨﺎ.
ﻳﻤﻜﻦ ﺗﻘﺴﻴﻢ اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ إﱃ ﻧﻮﻋ ْني ،ﻳﺴﻤﱠ ﻴﺎ ﻏﺎﻟﺒﺎ »اﻟﻨﻤﺎذج
اﻵﻟﻴﺔ« »اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ« .ﻳﺴﺘﻨﺪ اﻟﻨﻤﻮذج اﻵﱄ ﻋﲆ ﺑﻌﺾ اﻟﻨﻈﺮﻳﺎت اﻷﺳﺎﺳﻴﺔ اﻟﺼﻠﺒﺔ
ﻟﻜﻴﻔﻴﺔ ارﺗﺒﺎط اﻷﺷﻴﺎء؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﺗﺨﱪﻧﺎ ﻧﻈﺮﻳﺔ ﻣﺎ ﰲ اﻟﻔﻴﺰﻳﺎء ﻛﻴﻒ أ
ﴎﻋﺔ ﺳﻘﻮط اﻷﺟﺴﺎ ﺗﺰﻳﺪ ﻣﻊ زﻳﺎدة اﻟﺰﻣﻦ اﻟﺬ ﺗﻘﻊ ﻓﻴﻪ .أ رﺑﻤﺎ ﺗﺨﱪﻧﺎ ﻧﻈﺮﻳﺔ أﺧﺮ
ﺣﻮ ﻛﻴﻔﻴﺔ اﻧﺘﺸﺎر اﻟﻌﻘﺎﻗري ﰲ أﻧﺤﺎء اﻟﺠﺴﻢ .ﰲ ﻛﻠﺘﺎ ﻫﺎﺗني اﻟﺤﺎﻟﺘني ،ﺳﻮ ﺗﺴﺘﻨﺪ
اﻟﻨﻤﺎذج إﱃ ﻧﻈﺮﻳﺎت ﺣﻮ ﻛﻴﻔﻴﺔ ﻋﻤﻞ اﻷﺷﻴﺎء ﻓﻌﻠﻴٍّﺎ؛ ﰲ اﻟﻮاﻗﻊ ،ﺳﻮ ﺗﺴﺘﻨﺪ اﻟﻨﻤﺎذج ﻋﲆ
املﻌﺎدﻻت اﻟﺮﻳﺎﺿﻴﺔ اﻟﺘﻲ ﺗﺼﻒ ﻫﺬ اﻟﻨﻈﺮﻳﺎت ،اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﻧﺠﻤﻌﻬﺎ ﻟﺘﻘﻴﻴﻢ ﻧﻤﺎذﺟﻨﺎ
ﺳﻮ ﺗﻜﻮ ﻗﻴﻢ املﺘﻐريات املﺴﺘﺨﺪﻣﺔ ﰲ ﻫﺬ اﻟﻨﻈﺮﻳﺎت ،ﻣﺜﻞ اﻟﴪﻋﺔ اﻟﺰﻣﻦ )ﰲ ﺣﺎﻟﺔ
ﺳﻘﻮط اﻟﴚء( اﻟﱰﻛﻴﺰ اﻟﺰﻣﻦ )ﰲ ﺣﺎﻟﺔ اﻧﺘﺸﺎر اﻟﻌﻘﺎﻗري(؛ ﻣﻦ ﺛ ﱠﻢ اﻟﻨﻤﺎذج اﻵﻟﻴﺔ ﻫﻲ
ﻃﺮ رﻳﺎﺿﻴﺔ ﻣﺒﺎﴍة ﻟﻮﺻﻒ اﻟﻨﻈﺮﻳﺎت.
ﰲ املﻘﺎﺑﻞ ،اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ ﻫﻲ ﻣﺠﺮد ﻣﺤﺎ ﻻت ﻟﺘﻮﻓري ﻣﻠﺨﺼﺎت ﻣﻼﺋﻤﺔ ﻟﻠﺠﻮاﻧﺐ
املﻬﻤﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة .ﻗﺪ ﻻ ﻳﻜﻮ ﻟﺪﻳﻨﺎ أ ﻧﻈﺮﻳﺔ ﺗﻘﻮ إ اﻷﺟﺴﺎ اﻟﺴﺎﻗﻄﺔ
ﺗﺰﻳﺪ ﴎﻋﺘﻬﺎ ﻣﻊ ﻣﺮ ر اﻟﺰﻣﻦ ،ﻟﻜﻨﻨﺎ ﻗﺪ ﻧﻼﺣﻆ ﺟﻮد ﻋﻼﻗﺔ ﺑني اﻟﺰﻣﻦ اﻟﴪﻋﺔ ،ﻋﲆ
أﺳﺎس ﻫﺬا ،ﻧﺨﻤﱢ ﻦ ﺟﻮد ﻋﻼﻗﺔ ﻃﺮدﻳﺔ .إذا ﻟﻢ ﻳﻮﺟﺪ أ ﻗﺎﻋﺪة ﻧﻈﺮﻳﺔ أﺳﺎﺳﻴﺔ ﻟﻬﺬ
اﻟﻌﻼﻗﺔ املﻘﱰﺣﺔ ،ﻓﺈ اﻟﻨﻤﻮذج ﻳﻜﻮ ﻧﻤﻮذﺟﺎ ﺗﺠﺮﻳﺒﻴٍّﺎ.
اﻟﻨﻤﺎذج اﻵﻟﻴﺔ اﺳﻌﺔ اﻻﻧﺘﺸﺎر ﰲ اﻟﻌﻠﻮ اﻟﻔﻴﺰﻳﺎﺋﻴﺔ ﰲ ﻣﺠﺎﻻت ﻣﺜﻞ اﻟﻬﻨﺪﺳﺔ ،ﻓﻴﻤﺎ
ﺗﻤﻴﻞ اﻟﻌﻠﻮ اﻻﺟﺘﻤﺎﻋﻴﺔ اﻟﺴﻠﻮﻛﻴﺔ إﱃ اﻻﺳﺘﻔﺎدة ﻋﲆ ﻧﺤﻮ أﻛﱪ ﻣﻦ اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ.
ﻣﻊ ذﻟﻚ ﻓﻤﻦ اﻟﻮاﺿﺢ ﺟﻮد ﺗﺪاﺧﻞ ﻛﺒري؛ إذ إ ﻃﺒﻴﻌﺔ اﻟﻨﻤﻮذج ﺗﻌﺘﻤﺪ ﻋﲆ ﻣﺎ ﻳﺠﺮ
ﻧﻤْ ﺬﺟﺘﻪ ﻣﺪ ﺳﻬﻮﻟﺔ ﻓﻬﻤﻪ؛ ﻓﺎﻻﻗﺘﺼﺎد — اﻟﺬ ﻳﻌ ﱡﺪ ﻋﻠﻤﺎ اﺟﺘﻤﺎﻋﻴٍّﺎ — ﻣﲇء ﺑﺎﻟﻨﻤﺎذج
اﻵﻟﻴﺔ املﻌﺘﻤﺪة ﻋﲆ ﻧﻈﺮﻳﺎت ﺣﻮ ﻛﻴﻔﻴﺔ ارﺗﺒﺎط اﻟﻌﻮاﻣﻞ اﻻﻗﺘﺼﺎدﻳﺔ .ﻋﻤﻮﻣﺎ ،رﺑﻤﺎ ﻣﻦ
اﻹﻧﺼﺎ اﻟﻘﻮ إﻧﻪ ﰲ املﺮاﺣﻞ اﻷ ﻟﻴﺔ ﻻﺳﺘﻜﺸﺎ ﻇﺎﻫﺮة ﻣﺎ ،ﻓﺈ اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ
94
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﺗﻜﻮ أﻛﺜﺮ ﺷﻴﻮﻋﺎ؛ إذ إ املﺮء ﻳﺒﺤﺚ ﻋﻦ اﻻﺗﺴﺎ اﻷﻧﻤﺎط ﰲ ﻣﺠﻤﻮﻋﺔ املﻼﺣﻈﺎت .ﰲ
ﻣﺮاﺣﻞ ﻻﺣﻘﺔ ،ﻋﻨﺪﻣﺎ ﻳﻜﻮ اﻟﻔﻬﻢ ﻗﺪ ازداد ،ﺗﺼﺒﺢ اﻟﻨﻤﺎذج اﻵﻟﻴﺔ أﻛﺜﺮ أﻫﻤﻴﺔ .ﻋﲆ أ
ﺣﺎ ،ﻛﻤﺎ ﺗﻮﺿﺢ ﻧﻤﺎذﺟﻨﺎ ﻟﻸﺟﺴﺎ اﻟﺴﺎﻗﻄﺔ ،ﻳﻤﻜﻦ ﺑﻨﺎء ﻧﻤﻮذج ﻣﻌني ﻋﲆ أﻧﻪ ﻧﻤﻮذج
ﺗﺠﺮﻳﺒﻲ ﺛﻢ ﻳﺼﺒﺢ آﻟﻴٍّﺎ ﻋﻨﺪﻣﺎ ﻳﺰداد ﻓﻬﻤﻨﺎ ﻟﻠﻈﺎﻫﺮة.
أﺣﻴﺎﻧﺎ ﻣﺎ ﻳﻜﻮ ﻣﻦ املﻔﻴﺪ اﻟﺘﻤﻴﻴﺰ ﺑني ﻣﺨﺘﻠﻒ اﻻﺳﺘﺨﺪاﻣﺎت املﻤﻜﻨﺔ ﻟﻠﻨﻤﺎذج
اﻹﺣﺼﺎﺋﻴﺔ .أﺣﺪ أﻣﺜﻠﺔ ﻫﺬا اﻟﺘﻤﻴﻴﺰ ﻳﻜﻮ ﺑني »اﻻﺳﺘﻜﺸﺎ « »اﻟﺘﺄﻛﻴﺪ«؛ ﻓﻔﻲ اﻻﺳﺘﻜﺸﺎ ،
ﻧﺒﺤﺚ ﻋﻦ اﻟﻌﻼﻗﺎت أ اﻷﻧﻤﺎط؛ ﺑﻴﻨﻤﺎ ﰲ اﻟﺘﺄﻛﻴﺪ ،ﻧﻬﺪ إﱃ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت
ﺗﺪﻋﻢ ﺗﻔﺴريا ﻣﻘﱰﺣﺎ أ ﻻ؛ ﻟﺬﻟﻚ ،ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ دراﺳﺔ اﺳﺘﻜﺸﺎﻓﻴﺔ رﺑﻤﺎ ﻧﺒﺤﺚ
ﻋﻦ املﺘﻐريات اﻟﺘﻲ ﺗﺮﺗﺒﻂ ﻣﻌﺎ ارﺗﺒﺎﻃﺎ ﺛﻴﻘﺎ .ﻓﺮﺑﻤﺎ ﻳﺄﺧﺬ ﻣﺘﻐري اﺣﺪ ﻗﻴﻤﺔ ﻋﺎﻟﻴﺔ ﻛﻠﻤﺎ
ﻓﻌﻞ ذﻟﻚ ﻣﺘﻐري آﺧﺮ ،أ رﺑﻤﺎ ﺗﺄﺧﺬ ﻣﺠﻤﻮﻋﺎت ﻣﻦ املﺘﻐريات ﻗﻴﻤﺎ ﻣﺘﺸﺎﺑﻬﺔ ﺟﺪٍّا ﻣﻊ
أﺷﻴﺎء ﻣﺨﺘﻠﻔﺔ ،ﻣﺎ إﱃ ذﻟﻚ .ﻣﻦ ﻧﺎﺣﻴﺔ أﺧﺮ ،رﺑﻤﺎ ﻧﺴﺘﺨﺪ اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﺪراﺳﺎت
اﻟﺘﺄﻛﻴﺪﻳﺔ ﻟﺘﻘﺪﻳﺮ ﻣﻌﻠﻤﺎت ﻧﻤﻮذج إﺣﺼﺎﺋﻲ ﻣﻘﱰح إﺟﺮاء اﺧﺘﺒﺎر إﺣﺼﺎﺋﻲ ملﻌﺮﻓﺔ ﻣﺎ إذا
ﻛﺎ اﻟﺘﻘﺪﻳﺮ ﻗﺮﻳﺒﺎ ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻣﻤﱠ ﺎ ﺗﻮﻗﻌﺘْﻪ ﻧﻈﺮﻳﺘﻨﺎ .أﺻﺒﺤﺖ اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﻻﺳﺘﻜﺸﺎ اﻟﺒﻴﺎﻧﺎت ذات أﻫﻤﻴﺔ ﻣﺘﺰاﻳﺪة ﰲ اﻟﺴﻨﻮات اﻷﺧرية ،ﻣﻊ ﺗﺮاﻛﻢ ﻣﺠﻤﻮﻋﺎت ﻣﻦ
اﻟﺒﻴﺎﻧﺎت أﻛﱪ أﻛﱪ .ﻳﻨﻄﺒﻖ ﻫﺬا ﻋﲆ اﻟﺘﻄﺒﻴﻘﺎت اﻟﻌﻠﻤﻴﺔ )ﻣﺜﻞ ﻓﻴﺰﻳﺎء اﻟﺠﺴﻴﻤﺎت ﻋﻠﻢ
اﻟﻔﻠﻚ( ،ﻛﺬﻟﻚ اﻟﺘﻄﺒﻴﻘﺎت اﻟﺘﺠﺎرﻳﺔ )ﻣﺜﻞ ﻗﻮاﻋﺪ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﺤﺘﻮ ﻋﲆ ﺗﻔﺎﺻﻴﻞ
املﺸﱰﻳﺎت ﻣﻦ املﺘﺎﺟﺮ ،أ املﻜﺎملﺎت اﻟﻬﺎﺗﻔﻴﺔ ،أ ﺑﻴﺎﻧﺎت ﺗﺪﻓﻖ اﻟﻨﻘﺮ ﻋﲆ اﻹﻧﱰﻧﺖ(.
ﺛﻤﺔ ﺗﻤﻴﻴﺰ آﺧﺮ ﻣﻬﻢ ﰲ اﻟﻨﻤﺬﺟﺔ اﻹﺣﺼﺎﺋﻴﺔ ﺑني »اﻟﻮﺻﻒ« »اﻟﺘﻨﺒﺆ«؛ ﻓﻌﻨﺪ ﺻﻒ
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﻳﺘﻤﺜﻞ اﻟﻬﺪ ﰲ ﺗﻠﺨﻴﺼﻬﺎ ﺑﻄﺮﻳﻘﺔ ﻣﺮﻳﺤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،إذا
ﻛﺎﻧﺖ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ﺗﺘﻜﻮ ﻣﻦ ﻣﻼﺣﻈﺎت ﻟﻌﴩة ﻣﺘﻐريات )اﻟﻄﻮ اﻟﻮز اﻟﺰﻣﻦ
املﺴﺘﻐﺮ ﰲ اﻟﺘﻮﺟﻪ ﻟﻠﻌﻤﻞ ،ﻣﺎ إﱃ ذﻟﻚ( ﻟﻜﻞ ﺷﺨﺺ ﻣﻦ ﻣﻠﻴﻮ ﺷﺨﺺ ،ﻓﺴﻨﺤﺘﺎج ﻟﻜﻲ
ﻧﺒﺪأ ﰲ ﻓﻬﻤﻬﺎ إﱃ ﺗﻘﻠﻴﻞ ﺣﺠﻤﻬﺎ إﱃ ﺣﺠﻢ ﻣﻌﻘﻮ ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﻜﻨﻨﺎ ﺗﻠﺨﻴﺼﻬﺎ ﻣﻦ
ﺧﻼ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ اﻻﻧﺤﺮاﻓﺎت املﻌﻴﺎرﻳﺔ ﻟﻜﻞ ﻣﺘﻐري ،ﻛﺬﻟﻚ ﻋﻦ ﻃﺮﻳﻖ ﻗﻴﺎﺳﺎت
ﻣﺪ ﺗﺮاﺑﻄﻬﺎ .ﺣﻴﻨﻬﺎ ﺳﻴﻜﻮ ﻟﺪﻳﻨﺎ ﺑﻌﺾ اﻷﻣﻞ ﰲ ﻓﻬْ ﻢ ﻣﺎ ﻳﺠﺮ ﺣﻴﺚ إﻧﻨﺎ ﺻﻔﻨﺎ
اﻟﺨﺼﺎﺋﺺ اﻟﻌﺎﻣﺔ ﻟﻠﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ ﻣﺮﻳﺢ .ﺑﺎﻹﺷﺎرة إﱃ ﻫﺬا ،ﻛﻤﺎ رأﻳﻨﺎ ﰲ اﻟﻔﺼﻞ
اﻟﺜﺎﻧﻲ ،ﻓﺈ ﻫﺬ املﻠﺨﺼﺎت اﻟﻮﺻﻔﻴﺔ ﻻ ﺗﺨﻠﻮ ﻣﻦ املﺨﺎﻃﺮ .ﻓﺈﻧﻬﺎ ،ﺑﺤﻜﻢ ﻃﺒﻴﻌﺘﻬﺎ ،ﺗﺒﺴﻂ
اﻟﺘﻌﻘﻴﺪ اﻟﻬﺎﺋﻞ ملﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ﺑﺄﻛﻤﻠﻬﺎ؛ ﻟﺬﻟﻚ ﻳﺠﺐ أ ﻧﻨﺘﺒﻪ ﻻﺣﺘﻤﺎ أ ﱠ ﺻﻔﻨﺎ املﻮﺟﺰ
أﻏﻔﻞ ﺷﻴﺌﺎ ﻣﻬﻤٍّ ﺎ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻓﺸﻞ ﻧﻤﻮذﺟﻨﺎ ﰲ اﻟﻮﺿﻊ ﰲ اﻻﻋﺘﺒﺎر ﺣﻘﻴﻘﺔ
95
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺟﻮد ﻣﺠﻤﻮﻋﺘني راﺛﻴﺘني ﻣﺘﻤﻴﺰﺗني ﰲ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ؛ ﻟﺬﻟﻚ ﻳﻠﺰ
ﺟﻮد ﻧﻤﻮذج أﻛﺜﺮ ﺗﻔﺼﻴﻼ ﻟﺘﻤﺜﻴﻞ ذﻟﻚ.
أﻣﺎ ﻫﺪﻓﻨﺎ ﰲ اﻟﺘﻨﺒﺆ ﻓﻬﻮ اﺳﺘﺨﺪا ﺑﻌﺾ املﺘﻐريات ﻟﻠﺘﻨﺒﺆ ﺑﻘﻴﻢ ﻣﺘﻐريات أﺧﺮ ؛ ﻋﲆ
ﺗﺒني ﺗﻔﺎﺻﻴﻞ اﻟﻨﻈﺎ اﻟﻐﺬاﺋﻲ ﺳﺒﻴﻞ املﺜﺎ ،ﻗﺪ ﻳﻜﻮ ﻟﺪﻳﻨﺎ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﱢ
ﰲ اﻟﻄﻔﻮﻟﺔ ﻟﻌﻴﻨﺔ ﻣﻦ اﻷﺷﺨﺎص ﻃﻮﻟﻬﻢ ﺑﻌﺪ اﻟﺒﻠﻮغ .ﻳﻤﻜﻨﻨﺎ ﺑﺎﺳﺘﺨﺪا ﻫﺬ اﻟﺒﻴﺎﻧﺎت
ﺑﻨﺎء ﻧﻤﻮذج ﻳﺮﺑﻂ اﻟﻄﻮ ﺑﻌﺪ اﻟﺒﻠﻮغ ﺑﺎﻟﻨﻈﺎ اﻟﻐﺬاﺋﻲ ﰲ اﻟﻄﻔﻮﻟﺔ ،ﺛﻢ ﻧﺴﺘﺨﺪ اﻟﻨﻤﻮذج
ﻟﻠﺘﻨﺒﺆ ﺑﺎﻟﻄﻮ املﺴﺘﻘﺒﲇ املﺤﺘﻤﻞ ﻟﻄﻔﻞ ﻳﺘﺒﻊ ﻧﻈﺎﻣﺎ ﻏﺬاﺋﻴٍّﺎ ﻣﻌﻴﻨﺎ .ﻻﺣﻆ أ ﺟﺎﻧﺒﺎ أﺳﺎﺳﻴٍّﺎ
ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻻز ﻟﻬﺬ اﻟﻨﻤﺎذج؛ إذ إﻧﻨﺎ ﻧﺤﺘﺎج ﻟﻘﻴﻢ ﻟﻜ ﱟﻞ ﻣﻦ املﺘﻐريات املﺘﻨﺒﱢﺌﺔ املﺘﻐري
املﺘﻨﺒﱠﺄ ﺑﻪ ﻣﻦ ﻋﻴﻨﺘﻨﺎ .ﺳﻮ ﻳﺘﻀﺢ أ ﻫﺬا ﺗﻤﻴﻴﺰ ﻣﻬﻢ ﺟﺪٍّا ﺑني اﻟﻨﻤﺎذج اﻟﺘﻨﺒﱡﺌﻴﺔ اﻟﻨﻤﺎذج
اﻟﻮﺻﻔﻴﺔ ،ﻛﻤﺎ ﺳﻨﺮ ﻓﻴﻤﺎ ﻳﲇ:
ﻣﺮة أﺧﺮ ،ﻟﻴﺲ اﻟﺘﻤﻴﻴﺰ اﺿﺤﺎ داﺋﻤﺎ ﺿﻮح اﻟﺸﻤﺲ ،ﻓﺮﺑﻤﺎ ﻧﻜﻮ ﺑﺒﺴﺎﻃﺔ
ﻣﻬﺘﻤﱢ ني ﺑﻮﺻﻒ اﻟﻌﻼﻗﺔ ﺑني اﻟﻨﻈﺎ اﻟﻐﺬاﺋﻲ ﰲ اﻟﻄﻔﻮﻟﺔ اﻟﻄﻮ ﺑﻌﺪ اﻟﺒﻠﻮغ ،ﻣﻊ ﻋﺪ
ﺟﻮد ﻧﻴﺔ ﻻﺳﺘﺨﺪا اﻟﻨﻤﻮذج ﻟﻠﺘﻨﺒﺆ ﺑﺄﺣﺪﻫﻤﺎ ﻋﻦ ﻃﺮﻳﻖ اﻵﺧﺮ.
ﻳﻮﺟﺪ ﻧﻮع آﺧﺮ ﻣﻬﻢ ﻣﻦ اﻟﺘﻨﺒﺆ ﻫﻮ »اﻟﺘﻮﻗﻊ« ،ﻓﻴﻪ ﻧﺴﺘﺨﺪ ﺑﻴﺎﻧﺎت ﻣﻦ املﺎﴈ
ﻟﺒﻨﺎء ﻧﻤﻮذج ﻳﻤﻜﻦ اﺳﺘﺨﺪاﻣﻪ ﻛﺄﺳﺎس ﻟﻠﺘﻨﺒﺆ ﺑﺎﻟﻘﻴﻢ املﺤﺘﻤﻠﺔ ملﻼﺣﻈﺎت ﻟﻢ ﺗﺮﺻﺪ ﺑﻌﺪ؛
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻧﻔﺤﺺ اﻟﻨﻤﻂ اﻟﺸﻬﺮ ملﺒﻴﻌﺎت أﺟﻬﺰة اﻟﺘﻠﻔﺎز ﻋﲆ ﻣﺪ اﻟﺴﻨﻮات
ﺗﻮﻗﻊاﻟﺨﻤﺲ املﺎﺿﻴﺔ ،ﻧﻘﺪﱢر اﺳﺘﻘﺮاﺋﻴٍّﺎ ﻧﺰﻋﺔ املﺒﻴﻌﺎت اﻟﺘﻔﺎ ت املﻮﺳﻤﻲ ﻣﻦ أﺟْ ﻞ ﱡ
املﺒﻴﻌﺎت املﺤﺘﻤﻠﺔ ﺧﻼ اﻻﺛﻨﻲ ﻋﴩ ﺷﻬﺮا اﻟﺘﺎﻟﻴﺔ.
ﻟﻠﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ اﺳﺘﺨﺪاﻣﺎت أﺧﺮ أﻳﻀﺎ .ﺗﻌﺮﻓﻨﺎ ﴎﻳﻌﺎ ﻋﲆ د رﻫﺎ ﰲ اﺗﺨﺎذ
اﻟﻘﺮار ﰲ اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ ،ﻛﻤﺎ رأﻳﻨﺎ أﻳﻀﺎ ﰲ اﻟﻔﺼﻞ ﻋﻴﻨﻪ ﻛﻴﻒ ﻗﺪﱢرت ﻣﻌﻠﻤﺎت اﻟﺘﻮزﻳﻌﺎت.
ﻳﺘﻢ ذﻟﻚ ﻋﻦ ﻃﺮﻳﻖ ﺗﺤﺪﻳﺪ ﻣﻘﻴﺎس ﻟﻠﺘﻨﺎﻗﺾ ﺑني اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة اﻟﺘﻮزﻳﻊ اﻟﻨﻈﺮ ،
ﺛﻢ اﺧﺘﻴﺎر ﻗﻴﻤﺔ املﻌﻠﻤﺔ املﻘﺪﱠرة اﻟﺘﻲ ﺗﻘﻠﻞ ﻗﻴﺎس اﻟﺘﻨﺎﻗﺾ ﻷدﻧﻰ ﺣﺪ .ﻳﺴﺘﻤﺪ ﻣﻘﻴﺎس
ﺷﺎﺋﻊ ﻟﻠﺘﻨﺎﻗﺾ ﻣﻦ اﻹﻣﻜﺎ ،اﻟﺬ ﻳﻘﻴﺲ ﻣﺪ اﺣﺘﻤﺎ أ ﺑﻴﺎﻧﺎت ﻣﺜﻞ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة
ﺳﺘﻨﺸﺄ إذا أﺧﺬت املﻌﻠﻤﺎت ﻗﻴﻤﺎ ﻣﺨﺘﻠﻔﺔ ﻣﺘﻌﺪدة .اﻵ ،ﺑﻤﺎ أ اﻟﺘﻮزﻳﻌﺎت ﻫﻲ أﺷﻜﺎ
ﺑﺴﻴﻄﺔ ﻓﺤﺴﺐ ﻣﻦ اﻟﻨﻤﻮذج ،ﻓﺈ املﺒﺎدئ ﻧﻔﺴﻬﺎ ﺑﺎﻟﻀﺒﻂ ﺗﻨﻄﺒﻖ ﻋﻨﺪ ﺗﺠﺮﺑﺔ ﻧﻤﺎذج أﻛﺜﺮ
ﺗﻔﺼﻴﻼ )ﻣﺜﻞ ﺗﻠﻚ املﺬﻛﻮرة ﻓﻴﻤﺎ ﻳﲇ( .ﻣﻊ ذﻟﻚ ،ﺗﻨﺸﺄ ﻇﺎﻫﺮة ﻏﺮﻳﺒﺔ ﺑﻴﻨﻤﺎ ﺗﺼﺒﺢ اﻟﻨﻤﺎذج
أﻛﺜﺮ ﺗﻔﺼﻴﻼ.
ﺳﺄذﻛﺮ ﻣﺜﺎﻻ ﺑﺴﻴﻄﺎ ﻟﻠﺘﻮﺿﻴﺢ؛ ﻟﻨﻔﱰض أﻧﻨﺎ ﻧﺮﻳﺪ ﺑﻨﺎء ﻧﻤﻮذج ﻟﻠﺘﻨﺒﺆ ﺑﺎﻟﺮ اﺗﺐ اﻷ ﱃ
ﻟﻠﺨﺮﻳﺠني ،اﺳﺘﻨﺎدا إﱃ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﺼﻒ دراﺳﺘﻬﻢ ،املﻮاد اﻟﺘﻲ درﺳﻮﻫﺎ ﰲ اﻟﺠﺎﻣﻌﺔ،
96
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﻧﺘﺎﺋﺞ اﻣﺘﺤﺎﻧﺎﺗﻬﻢ ،أﻳﻀﺎ ﻋﻮاﻣﻞ ﻣﺜﻞ اﻟﻌﻤﺮ اﻟﺠﻨﺲ ﻣﻜﺎ اﻹﻗﺎﻣﺔ ،ﻣﺎ إﱃ ذﻟﻚ.
اﻓﱰض أﻧﻨﺎ ﺟﻤﻌﻨﺎ ﻋﻴﻨﺔ ﻣﻜﻮﻧﺔ ﻣﻦ ﻣﺎﺋﺔ ﻣﻦ اﻟﺨﺮﻳﺠني اﻟﺠﺪد ﺟﻤﻌﻨﺎ اﻟﺒﻴﺎﻧﺎت ﻣﻨﻬﺎ.
ﻋﻤﻮﻣﺎ ،إذا ﺣﺎ ﻟﻨﺎ أ ﻧﺒﻨﻲ ﺗﻮﻗﻌﺎﺗﻨﺎ ﻋﲆ ﻋﺪد ﻗﻠﻴﻞ ﺟﺪٍّا ﻣﻦ املﺘﻐريات )ﻣﺜﻞ اﻟﻌﻤﺮ ﻓﻘﻂ(
ﻓﺈﻧﻨﺎ ﻟﻦ ﻧﺤﺼﻞ ﻋﲆ ﺗﻨﺒﺆات دﻗﻴﻘﺔ ﻟﻠﻐﺎﻳﺔ؛ ﻓﺎﻟﻌﻤﺮ ،ﰲ ﺣﺪ ذاﺗﻪ ،ﺣﺪ ﻻ ﻳﺤﺘﻮ ﻋﲆ
ﻣﻌﻠﻮﻣﺎت ﻛﺎﻓﻴﺔ ﻟﻠﺴﻤﺎح ﻟﻨﺎ ﺑﺄ ﻧﻌﺮ ﻛﻢ ﺳﻴﻜﻮ راﺗﺐ اﻟﺸﺨﺺ املﺘﺨ ﱢﺮج ﰲ اﻟﺠﺎﻣﻌﺔ
ﺑﺪﻗﺔ ﻣﺘﻨﺎﻫﻴﺔ .ﻟﺘﺤﺴني دﻗﺔ اﻟﺘﻨﺒﺆ ﻓﺈﻧﻨﺎ ﺑﺤﺎﺟﺔ إﱃ إﺿﺎﻓﺔ املﺰﻳﺪ ﻣﻦ اﻟﻌﻮاﻣﻞ املﺘﻨﺒﱢﺌﺔ )ﻣﺜﻞ
اﺳﺘﺨﺪا اﻟﻌﻤﺮ ﻣﺠﺎ اﻟﺪراﺳﺔ درﺟﺎت اﻻﻣﺘﺤﺎ ﻟﻠﺘﻨﺒﺆ ﺑﺮاﺗﺐ اﻟﺸﺨﺺ املﺘﺨﺮج( .ﻣﻊ
ذﻟﻚ — ﻫﻨﺎ ﺗﱪز املﻌﻀﻠﺔ — إذا أﺿﻔﻨﺎ ﻋﺪدا أﻛﱪ ﻣﻤﺎ ﻳﻠﺰ ﻣﻦ املﺘﻐريات املﺘﻨﺒﱢﺌﺔ ﻓﺈ
دﻗﺔ اﻟﺘﻨﺒﺆ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺳﺘﻘﻞ؛ ﻓﻌﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻨﺎ ﻧﺴﺘﺨﺪ
ﻣﺰﻳﺪا ﻣﻦ املﻌﻠﻮﻣﺎت ﺣﻮ اﻟﺨﺮﻳﺠني ،ﻓﺈ ﻧﻤﻮذﺟﻨﺎ ﻟﻴﺲ ﺟﻴﺪا.
ﻳﺒﺪ ﻫﺬا ﻣﻨﺎﻗﻀﺎ ﻟﻠﻤﻨﻄﻖ؛ ﻓﻜﻴﻒ ﻳﻤﻜﻦ ﻹﺿﺎﻓﺔ »ﻣﺰﻳﺪ« ﻣﻦ املﻌﻠﻮﻣﺎت أ ﺗﺆد إﱃ
ﺗﻨﺒﺆات »أﺳﻮأ«؟
ﻌﱪ »اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ«. اﻟﺠﻮاب ﻣﺮا غ ،ﻳﻄﻠﻖ ﻋﻠﻴﻪ أﺳﻤﺎء ﻣﺨﺘﻠﻔﺔ ،ﻣﻨﻬﺎ اﻻﺳﻢ امل ﱢ
ﻟﻔﻬﻢ ذﻟﻚ ،دﻋﻨﺎ ﻧﱰاﺟﻊ ﺧﻄﻮة إﱃ اﻟﻮراء ﻧﺘﺪﺑﺮ ﻫﺪﻓﻨﺎ اﻟﺤﻘﻴﻘﻲ .إ ﻫﺪﻓﻨﺎ »ﻟﻴﺲ«
اﻟﺤﺼﻮ ﻋﲆ أﻓﻀﻞ اﻟﺘﻨﺒﺆات املﻤﻜﻨﺔ ﻟﻠﺨﺮﻳﺠني املﺎﺋﺔ ﰲ ﻋﻴﱢﻨﺘﻨﺎ؛ ﻓﻨﺤﻦ ﻧﻌﻠﻢ ﺑﺎﻟﻔﻌﻞ
ﻟﻜﻦ ﻫﺪﻓﻨﺎ ﻫﻮ اﻟﺤﺼﻮ ﻋﲆ أﻓﻀﻞ اﻟﺘﻨﺒﺆات املﻤﻜﻨﺔ ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﺨﺮﻳﺠني ﱠ ر اﺗﺒﻬﻢ اﻷ ﱃ،
اﻵﺧﺮﻳﻦ؛ أ إ ﻫﺪﻓﻨﺎ ﻫﻮ »اﻟﺘﻌﻤﻴﻢ« ﻣﻦ اﻟﻌﻴﻨﺔ املﻮﺟﻮدة ﻟﺪﻳﻨﺎ .اﻵ ،ﺑﺈﺿﺎﻓﺔ املﺰﻳﺪ
املﺰﻳﺪ ﻣﻦ املﺘﻐريات املﺘﻨﺒﱢﺌﺔ ،ﻓﺈﻧﻨﺎ ﺑﺎﻟﺘﺄﻛﻴﺪ ﻧﻀﻴﻒ ﻣﻌﻠﻮﻣﺎت ﺳﻮ ﺗﻤ ﱢﻜﻨﻨﺎ ﻣﻦ اﻟﺘﻨﺒﺆ
ﺑﺮ اﺗﺐ اﻷﺷﺨﺎص املﻮﺟﻮدﻳﻦ ﰲ ﻋﻴﻨﺘﻨﺎ ﺑﺎﻟﻔﻌﻞ ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ دﻗﺔ .ﻟﻜﻦ اﻟﻌﻴﻨﺔ ﻟﻴﺴﺖ
ﺳﻮ ﻋﻴﻨﺔ؛ أ إﻧﻬﺎ ﻻ ﺗﻤﺜﻞ ر اﺗﺐ املﺠﻤﻮﻋﺔ ﺑﺄﻛﻤﻠﻬﺎ ﻋﲆ ﻧﺤﻮ ﻛﺎﻣﻞ .ﺑﻌﺪ ﻓﱰة
ﻣﻦ اﻟﻮﻗﺖ ،ﺑﻴﻨﻤﺎ ﻧﻮاﺻﻞ إﺿﺎﻓﺔ املﺰﻳﺪ ﻣﻦ املﺘﻐريات املﺘﻨﺒﺌﺔ ،ﻧﺒﺪأ ﰲ اﻟﺘﻨﺒﺆ ﺑﺠﻮاﻧﺐ
ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﺧﺎﺻﺔ ﺑﺎﻟﻌﻴﻨﺔ ﺣﺪﻫﺎ؛ ﻓﻬﻲ ﻟﻴﺴﺖ ﺳﻤﺎت ﺗﻨﻄﺒﻖ ﻋﲆ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ
ﺑﺄﻛﻤﻠﻬﺎ.
ﺗﻨﻄﺒﻖ ﻫﺬ اﻟﻈﺎﻫﺮة ﻋﲆ ﺟﻤﻴﻊ اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ؛ ﻓﺎﻟﻨﻤﺎذج ﻳﻤﻜﻦ أ ﺗﻜﻮ
ﻣﻔﺮﻃﺔ ﰲ اﻟﺘﻌﻘﻴﺪ ،ﺑﺤﻴﺚ ﺗﺘﻄﺎﺑﻖ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة ﺟﻴﺪا ﺟﺪٍّا ﺑﺎﻟﻔﻌﻞ ،ﻟﻜﻨﻬﺎ
ﺗﻔﺸﻞ ﰲ اﻟﺘﻌﻤﻴﻢ ﻋﲆ أﺷﻴﺎء أﺧﺮ ﻣﺴﺘﻤﺪﱠة ﻣﻦ اﻟﺘﻮزﻳﻊ ﻧﻔﺴﻪ؛ ﻫﺬا ﻳﻌﻨﻲ أﻧﻪ ﻻ ﺑﺪ
ﻣﻦ ﺿﻊ اﺳﱰاﺗﻴﺠﻴﺎت ﻻﺧﺘﻴﺎر ﻧﻤﺎذج ﺑﺪرﺟﺔ ﺗﻌﻘﻴﺪ ﻣﻨﺎﺳﺒﺔ؛ ﻓﺈذا ﻛﺎﻧﺖ اﻟﻨﻤﺎذج ﻣﻔﺮﻃﺔ
اﻟﺘﺒﺴﻴﻂ ،ﻓﺈﻧﻨﺎ ﻧﺨﺎﻃﺮ ﺑﻔﻘﺪا ﻗﺪرﺗﻬﺎ ﻋﲆ اﻟﺘﻨﺒﺆ ،إذا ﻛﺎﻧﺖ ﻣﻔﺮﻃﺔ اﻟﺘﻌﻘﻴﺪ ،ﻓﺈﻧﻨﺎ
97
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻧﺨﺎﻃﺮ ﺑﺎﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ .ﻳﺸﻜﻞ ﻫﺬا املﻔﻬﻮ أﺳﺎس ﻣﺒﺪأ »ﺷﻔﺮة أ ﻛﺎ « ،اﻟﺬ ﻳﻨﺺ
ﻋﲆ أ »اﻟﻨﻤﺎذج ﻳﻨﺒﻐﻲ ﱠأﻻ ﺗﻜﻮ أﻛﺜﺮ ﺗﻌﻘﻴﺪا ﻣﻤﺎ ﻫﻮ ﴐ ر « )ﻳﻨﺴﺐ إﱃ اﻟﺮاﻫﺐ
اﻟﻔﺮﻧﺴﻴﺴﻜﺎﻧﻲ ﻳﻠﻴﺎ اﻷ ﻛﺎﻣﻲ ﻣﻦ اﻟﻘﺮ اﻟﺮاﺑﻊ ﻋﴩ(.
ملﺸﻜﻠﺔ اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ أﻫﻤﻴﺔ ﺧﺎﺻﺔ ﰲ ﻣﺠﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ؛ ﻓﻘﺒﻞ
ﻇﻬﻮر أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ ،ﻗﺒﻞ أ ﻳﺼﺒﺢ ﻣﺄﻟﻮﻓﺎ ﻣﻄﺎﺑﻘﺔ اﻟﻨﻤﺎذج املﻌﻘﺪة ﻣﻊ أﻋﺪاد ﻛﺒرية
ﻣﻦ املﻌﻠﻤﺎت ،ﻛﺎ ﺧﻄﺮ اﻟﻮﻗﻮع ﰲ اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ أﻗﻞ.
98
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﺛﻤﺔ رﻗﻢ اﺣﺪ ﻳﻤﻜﻦ اﺳﺘﺨﺪاﻣﻪ ﻟﺘﻤﺜﻴﻞ ﻗﻮة اﻻرﺗﺒﺎط ،ﻫﻮ »ﻣﻌﺎﻣﻞ اﻻرﺗﺒﺎط« .ﻳﻮﺟﺪ
اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻄﺮ اﻟﺘﻲ ﻳﻤﻜﻦ ﻗﻴﺎس ﻫﺬ اﻟﻘﻮة ﺑﻬﺎ ،ﺗﻤﺎﻣﺎ ﻣﺜﻠﻤﺎ رأﻳﻨﺎ أﻧﻪ ﺗﻮﺟﺪ ﻃﺮ
ﻣﺨﺘﻠﻔﺔ ﻟﺘﻌﺮﻳﻒ »املﺘﻮﺳﻂ« »اﻟﺘﺸﺘﺖ« .ﻣﻊ ذﻟﻚ ،ﻳﻮﺟﺪ ﻣﻌﻴﺎر ﻋﺎ ملﻌﺎﻣﻼت اﻻرﺗﺒﺎط
ﺑﺄﻧﻬﺎ ﺗﻘﻊ ﺑني ١+ ١−؛ ﺑﺤﻴﺚ ﻳﻌﻨﻰ ٠أﻧﻪ ﻻ ﻳﻮﺟﺪ ارﺗﺒﺎط ،ﻳﻌﻨﻰ ١+ﺟﻮد ارﺗﺒﺎط
إﻳﺠﺎﺑﻲ ﺗﺎ ،ﻳﻌﻨﻲ ١−ﺟﻮد ارﺗﺒﺎط ﺳﻠﺒﻲ ﺗﺎ .ﻳﻌﻨﻲ اﻻرﺗﺒﺎط »اﻟﺘﺎ « ﺑني ﻣﺘﻐريﻳﻦ
»س« »ص« أﻧﻚ إذا ﻛﻨﺖ ﺗﻌﺮ ﻗﻴﻤﺔ »س« ﻓﺈﻧﻚ ﺗﻌﺮ ﻗﻴﻤﺔ »ص« ﺑﺎﻟﻀﺒﻂ.
اﻻرﺗﺒﺎط ﻋﻼﻗﺔ ﻣﺘﻨﺎﻇﺮة؛ ﻓﺈذا ﻛﺎ اﻟﻄﻮ ﻳﺮﺗﺒﻂ ﺑﺎﻟﻮز ،ﻓﺈ اﻟﻮز ﻳﺮﺗﺒﻂ ﺑﺎﻟﻄﻮ ،
ﻗﻮة ﻫﺬا اﻻرﺗﺒﺎط ﺗﻈﻞ ﻧﻔﺴﻬﺎ ﻣﻬْ ﻤﺎ ﻛﺎﻧﺖ اﻟﻨﺎﺣﻴﺔ اﻟﺘﻲ ﻧﻨﻈﺮ إﻟﻴﻬﺎ ﻣﻨﻬﺎ .ﰲ املﻘﺎﺑﻞ،
ﻧﻬﺘﻢ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎ ﺑﺎﻟﻌﻼﻗﺎت ﻏري املﺘﻨﺎﻇﺮة ﺑني املﺘﻐريات؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ
ﻧﺮﻏﺐ ﰲ ﻣﻌﺮﻓﺔ ﻣﻘﺪار اﻟﻔﺮ ﰲ اﻟﻮز — ﰲ املﺘﻮﺳﻂ — اﻟﺬ ﻳﺮﺗﺒﻂ ﺑﻮﺟﻮد ﻓﺎر ﰲ
اﻟﻄﻮ ﻳﺒﻠﻎ ﻋﴩة ﺳﻨﺘﻴﻤﱰات .اﻹﺟﺎﺑﺔ ﻋﲆ ﻫﺬا اﻟﻨﻮع ﻣﻦ اﻷﺳﺌﻠﺔ ﺗﺄﺗﻲ ﻣﻦ ﺧﻼ ﻃﺮﻳﻘﺔ
إﺣﺼﺎﺋﻴﺔ ﺗﺴﻤﻰ »ﺗﺤﻠﻴﻞ اﻻﻧﺤﺪار« .ﻳﺨﱪﻧﺎ ﻧﻤﻮذج اﻻﻧﺤﺪار ﺑﻤﺘﻮﺳﻂ ﻗﻴﻤﺔ املﺘﻐري »ص«
ﻟﻜﻞ ﻗﻴﻤﺔ ﻟﻠﻤﺘﻐري »س« .ﰲ املﺜﺎ اﻟﺴﺎﺑﻖ» ،اﻧﺤﺪار اﻟﻮز ﻋﲆ اﻟﻄﻮ « ﺳﻴﺨﱪﻧﺎ ﺑﻤﺘﻮﺳﻂ
اﻟﻮز اﻟﺬ ﺳﻴﺼﻞ إﻟﻴﻪ اﻷﺷﺨﺎص ﻋﻨﺪ ﻛﻞ ﻃﻮ .ﻳﺘﻀﺢ ﻫﺬا ﰲ اﻟﺸﻜﻞ 1-6؛ ﺣﻴﺚ
ﻳﻤﺜﱠﻞ اﻟﻮز ﻋﲆ املﺤﻮر اﻟﺮأﳼ ،اﻟﻄﻮ ﻋﲆ املﺤﻮر اﻷﻓﻘﻲ .ﺗﻮﺿﺢ ﻛﻞ ﻧﻘﻄﺔ ﺳﻮداء
ز ج اﻟﻮز /اﻟﻄﻮ ﻟﺸﺨﺺ ﻣﻦ اﻟﻌﻴﻨﺔ .ﻳﺒﺪ اﺿﺤﺎ اﻵ ﻣﻦ ﻫﺬا اﻟﺸﻜﻞ أﻧﻨﺎ ﻟﻢ ﻧﺮﺻﺪ
ﻗﻴﻤﺎ ﻟﺠﻤﻴﻊ اﻷﻃﻮا املﻤﻜﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻻ ﻳﻮﺟﺪ أ ﻧﻘﻄﺔ ﺑﻴﺎﻧﺎت ﻋﻨﺪ اﻟﻄﻮ اﻟﺬ
ﻳﺒﻠﻎ ﺑﺎﻟﻀﺒﻂ ٦أﻗﺪا .إﺣﺪ ﻃﺮ اﻟﺘﻐﻠﺐ ﻋﲆ ﻫﺬ اﻟﺼﻌﻮﺑﺔ — ﺑﻨﺎء ﻧﻤﻮذج ﻳﻌﻄﻴﻨﺎ
ﻣﺘﻮﺳﻂ ز ﻟﻜﻞ ﻗﻴﻤﺔ ﻣﻦ اﻟﻄﻮ — ﻫﻲ أ ﻧﻔﱰض ﺟﻮد ﻋﻼﻗﺔ ﺑﺴﻴﻄﺔ ﺑني اﻟﻄﻮ
ﻣﺘﻮﺳﻂ اﻟﻮز .ﻫﺬ اﻟﻌﻼﻗﺔ اﻟﺒﺴﻴﻄﺔ ﺟﺪٍّا ﻫﻲ ﻋﻼﻗﺔ ﺧﻂ ﻣﺴﺘﻘﻴﻢ؛ ﻳﺮد ﻣﺜﺎ ﻟﻬﺬا
اﻟﺨﻂ ﰲ اﻟﺸﻜﻞ .ﺑﺎﻟﻨﺴﺒﺔ ﻷ ﻃﻮ ﻣﻌني ،ﻳﺴﻤﺢ ﻟﻨﺎ ﻫﺬا اﻟﺨﻂ ﺑﺎﻟﺒﺤﺚ ﻋﻦ اﻟﻘﻴﻤﺔ
املﻘﺎﺑﻠﺔ ﻣﻦ ﻣﺘﻮﺳﻂ اﻟﻮز ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻋﲆ ﺟﻪ اﻟﺘﺤﺪﻳﺪ ،ﻓﺈﻧﻪ ﻳﻌﻄﻴﻨﺎ ﻗﻴﻤﺔ
ملﺘﻮﺳﻂ ز اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻳﺒﻠﻎ ﻃﻮﻟﻬﻢ ٦أﻗﺪا .
ﺛﻤﺔ ﻋﺪة ﻧﻘﺎط ﻳﻨﺒﻐﻲ ﺗﻮﺿﻴﺤﻬﺎ ﻓﻴﻤﺎ ﻳﺨﺺ ﻫﺬ اﻟﻄﺮﻳﻘﺔ.
أ ﻻ :إﻧﻬﺎ ﺗﻌﻄﻲ »ﻣﺘﻮﺳﻂ« اﻷ زا ﻋﻨﺪ ﻛﻞ ﻃﻮ .ﻫﺬا أﻣﺮ ﻣﻌﻘﻮ ؛ إذ إﻧﻪ ﰲ اﻟﺤﻴﺎة
اﻟﻮاﻗﻌﻴﺔ ،ﺣﺘﻰ اﻷﺷﺨﺎص ذ اﻟﻄﻮ ﻧﻔﺴﻪ ﻳﻤﻜﻦ أ ﺗﺘﺒﺎﻳﻦ أ زاﻧﻬﻢ.
ﺛﺎﻧﻴﺎ :ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ إﻳﺠﺎد ﻃﺮﻳﻘﺔ ﻣﺎ ﻟﺘﺤﺪﻳﺪ اﻟﺨﻂ اﻟﺬ ﻧﺘﺤﺪث ﻋﻨﻪ ﺑﺎﻟﻀﺒﻂ.
ﻄﺎ اﺣﺪا ،ﻟﻜﻦ ﻛﻴﻒ اﺧﱰﻧﺎ ﻫﺬا اﻟﺨﻂ ﻟﻴﺲ ﻏري ؟ ﺗﺘﺤﺪد اﻟﺨﻄﻮط ﻳﺘﻀﻤﻦ اﻟﺸﻜﻞ ﺧ ٍّ
99
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﻮزن ١٠أﺣﺠﺎر
٨أﺣﺠﺎر
ﻋﲆ ﻧﺤﻮ ﻓﺮﻳﺪ ﻋﻦ ﻃﺮﻳﻖ ﻣﻌﻠﻤﺘني — ﺗﻘﺎﻃﻌﻬﻤﺎ )ﰲ ﻫﺬا اﻟﺸﻜﻞ ﻗﻴﻤﺔ اﻟﻮز اﻟﺘﻲ ﻳﺘﻘﺎﻃﻊ
ﻋﻨﺪﻫﺎ اﻟﺨﻂ ﻣﻊ ﻣﺤﻮر اﻟﻮز ( ﻣﻴﻠﻬﻤﺎ — ﻟﺬﻟﻚ ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ إﻳﺠﺎد ﺳﻴﻠﺔ ﻻﺧﺘﻴﺎر
ﻫﺎﺗني املﻌﻠﻤﺘني أ ﺗﻘﺪﻳﺮﻫﻤﺎ .ﻧﻌﺮ ﺑﺎﻟﻔﻌﻞ ﻃﺮﻳﻘﺔ ﺗﻘﺪﻳﺮ املﻌﻠﻤﺔ؛ ﻓﻘﺪ ﺗﻨﺎ ﻟﻨﺎﻫﺎ ﰲ
اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ .ﻟﺘﻘﺪﻳﺮ املﻌﻠﻤﺎت ﻧﺨﺘﺎر ﺗﻠﻚ اﻟﻘﻴﻢ اﻟﺘﻲ ﺗﻘﻠﻞ ﻣﻦ ﻗﺪر اﻟﺘﻨﺎﻗﺾ ﺑني
اﻟﻨﻤﻮذج اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة .ﺑﺎﻟﻨﺴﺒﺔ ﻷ ز ج ﻣﻌني )اﻟﻮز اﻟﻄﻮ ( ﻣﻦ اﻟﺒﻴﺎﻧﺎت،
ﻓﺈ أﺣﺪ ﻣﻘﺎﻳﻴﺲ اﻟﺘﻨﺎﻗﺾ ﻫﻮ ﻣﺮﺑﻊ اﻟﻔﺮ )ﻣﺮة أﺧﺮ ،اﻟﺴﺒﺐ ﰲ ﻛﻮﻧﻪ ﻣﺮﺑﻌﺎ ﻫﻮ
ﺟﻌﻞ اﻷرﻗﺎ ﻣﻮﺟﺒﺔ( ﺑني اﻟﻮز املﺮﺻﻮد اﻟﻮز املﺘﻮﻗﻊ ﻋﻨﺪ ﻫﺬا اﻟﻄﻮ .ﻳﺘﻤﺜﻞ
ﻣﻘﻴﺎس اﻟﺘﻨﺎﻗﺾ اﻟﻜﲇ املﻌﺘﻤﺪ ﻋﲆ ﻫﺬا ﰲ ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت اﻟﻔﺮ ﺑني اﻷ زا املﺮﺻﻮدة
ﱠ
املﺘﻮﻗﻌﺔ ﻋﻨﺪ اﻷﻃﻮا اﻟﻮاردة ﰲ اﻟﺒﻴﺎﻧﺎت .ﺑﻌﺪ ذﻟﻚ ﻧﻘﺪر اﻟﺘﻘﺎﻃﻊ اﻻﻧﺤﺪار اﻷ زا
ﺑﺎﺧﺘﻴﺎر ﺗﻠﻚ اﻟﻘﻴﻢ اﻟﺘﻲ ﺗﻘﻠﻞ ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت اﻟﻔﺮ ﻷدﻧﻰ درﺟﺔ .ﺑﻤﺎ أﻧﻬﺎ ﺗﻘﻠﻞ
)ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت( اﻟﻔﺮ ﺑني اﻟﻘﻴﻢ املﺮﺻﻮدة املﺘﻮﻗﻌﺔ ﻟﻸ زا ﰲ اﻟﺒﻴﺎﻧﺎت ،ﻓﺈ »ﺧﻂ
اﻧﺤﺪار املﺮﺑﻌﺎت اﻟﺼﻐﺮ « ﻫﺬا ﻳﻨﺘﺞ أﻓﻀﻞ ﺗﻨﺒﺆ ملﺘﻮﺳﻂ اﻟﻮز ﻋﻨﺪ أ ﻗﻴﻤﺔ ﻟﻠﻄﻮ
ﻧﺨﺘﺎرﻫﺎ.
100
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
اﻟﻨﻘﻄﺔ اﻟﺜﺎﻟﺜﺔ :ﻫﻲ أﻧﻪ ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أ ﻫﺬا اﻻﻓﱰاض ﺑﻮﺟﻮد ﻋﻼﻗﺔ ﺧﻂ ﻣﺴﺘﻘﻴﻢ
ﻄﺎ ﻣﺴﺘﻘﻴﻤﺎ ،ﻟﻴﺲ ﺧ ٍّ
ﻄﺎ ﻗﺪ ﻳﺒﺪ اﻋﺘﺒﺎﻃﻴٍّﺎ إﱃ ﺣ ﱟﺪ ﻣﺎ ،ﻓﺈﻧﻪ ﻣﱪﱠر ﻗﻠﻴﻼ .ملﺎذا ﻧﺨﺘﺎر ﺧ ٍّ
ﻣﻨﺤﻨﻴﺎ؟ د اﻟﺨﻮض ﰲ اﻟﺘﻔﺎﺻﻴﻞ ﻫﻨﺎ ،ﻣﻦ املﻤﻜﻦ ﺗﻘﺪﻳﻢ ﻣﻨﺤﻨﻴﺎت ﺑﺪرﺟﺎت ﻣﺘﻔﺎ ﺗﺔ
ﺑﺤﻴﺚ ﻳﻤﻜﻦ أ ﻳﻜﻮ ﻟﻠﺨﻂ اﻟﺬ ﻳﺒني اﻟﻌﻼﻗﺔ ﺑني اﻟﻄﻮ ﻣﺘﻮﺳﻂ اﻟﻮز أﺷﻜﺎ أﻛﺜﺮ
ﺗﻌﻘﻴﺪا؛ ﻓﺮﺑﻤﺎ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ﻳﺰداد ﺑﴪﻋﺔ أﻛﱪ ﻋﻨﺪ اﻷﻃﻮا اﻷدﻧﻰ ﻣﻦ ازدﻳﺎد ﻋﻨﺪ
اﻷﻃﻮا اﻷﻋﲆ .ﻧﻔﻌﻞ ذﻟﻚ ﻣﻦ ﺧﻼ ﺟﻌﻞ اﻟﻨﻤﻮذج أﻛﺜﺮ ﺗﻌﻘﻴﺪا ،ﻋﻦ ﻃﺮﻳﻖ إدﺧﺎ
ﻣﻌﻠﻤﺎت إﺿﺎﻓﻴﺔ ﺑﺎﻹﺿﺎﻓﺔ إﱃ اﻟﺘﻘﺎﻃﻊ املﻴﻞ.
ﺳﻌﻰ ﻣﺜﺎ اﻧﺤﺪار اﻟﻄﻮ /اﻟﻮز ﻟﻠﺘﻨﺒﺆ ﺑﻤﺘﻮﺳﻂ اﻟﻮز ﻣﻦ ﺧﻼ ﻣﺘﻐري ﻣﺘﻨﺒﺊ
اﺣﺪ ﻓﻘﻂ ﻫﻮ اﻟﻄﻮ ،ﻟﻜﻦ ﻳﻤﻜﻨﻨﺎ أﻳﻀﺎ إدﺧﺎ ﻋﻮاﻣﻞ ﻣﺘﻨﺒﺌﺔ ﻣﺤﺘﻤﻠﺔ أﺧﺮ ﻣﻦ أﺟﻞ
ﺗﺤﻘﻴﻖ ﺗﻮﻗﻌﺎت أﻛﺜﺮ دﻗﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﻳﻤﺘﻠﻚ اﻟﺮﺟﺎ اﻟﻨﺴﺎء أﺷﻜﺎ ﺟﺴﻢ ﻣﺨﺘﻠﻔﺔ،
ﺑﺤﻴﺚ إﻧﻪ ﻋﻨﺪ ﻃﻮ ﻣﻌني ،رﺑﻤﺎ ﻳﻜﻮ اﻻﺧﺘﻼ ﰲ اﻷ زا ﺑﺴﺒﺐ ﻧﻮع اﻟﺠﻨﺲ ﻋﲆ
ﻧﺤﻮ ﻛﺒري؛ ﻟﺬا ﻳﻤﻜﻨﻨﺎ ﺗﻀﻤني ﻧﻮع اﻟﺠﻨﺲ أﻳﻀﺎ ﺑﺎﻋﺘﺒﺎر ﻋﺎﻣﻼ ﻣﺘﻨﺒﺌﺎ .ﻳﻤﻜﻨﻨﺎ ﻣﻮاﺻﻠﺔ
ﺗﻀﻤني ﻣﺘﻐريات أﺧﺮ ﻧﻈﻦ أﻧﻪ ﻣﻦ املﺮﺟﺢ أ ﺗﺮﺗﺒﻂ ﺑﺎﻟﻮز .ﻟﻜﻦ ﻻ ﻳﻨﺒﻐﻲ أ ﻧﺘﻤﺎد
ﻛﺜريا إذا ﻛﺎﻧﺖ املﻼﺣﻈﺎت ﺗﺘﻌﻠﻖ ﺑﻌﺪد ﻣﺤﺪد ﻣﻦ اﻷﺷﺨﺎص ﻓﺤﺴﺐ ،ﱠإﻻ ﻓﺴﻮ ﻳﺘﻤﻴﺰ
ﻧﻤﻮذﺟﻨﺎ ﻣﺮة أﺧﺮ ﺑﺎﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ ﻣﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻟﺬا ﻓﺈﻧﻨﺎ ﻗﺪ ﻻ ﻧﺮﻏﺐ ﰲ ﺗﻀﻤني
ﻛﺎﻓﺔ املﺘﻐريات اﻟﺘﻲ ﻳﻤﻜﻦ أ ﻧﻔﻜﺮ ﻓﻴﻬﺎ ،إﻧﻤﺎ ﻧﺪرج ﺣﺴﺐ ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋﻴﺔ ﻣﻨﻬﺎ.
ﺑﺼﻔﺔ ﻋﺎﻣﺔ ،ﺛﻤﺔ أﺳﺒﺎب أﺧﺮ أﻳﻀﺎ ﻗﺪ ﺗﺪﻓﻌﻨﺎ إﱃ اﻟﺮﻏﺒﺔ ﰲ ﺗﻀﻤني ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋﻴﺔ
ﻓﻘﻂ ﻣﻦ املﺘﻐريات املﺘﻨﺒﺌﺔ املﺤﺘﻤﻠﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻳﻜﻮ ﻗﻴﺎس املﺘﻐريات املﺘﻨﺒﺌﺔ
اﻹﺿﺎﻓﻴﺔ ﻣﻜﻠﻔﺎ ،أ ﻳﺴﺘﻐﺮ ﻗﺘﺎ ﻃﻮﻳﻼ؛ ﻟﺬا ﻓﺈﻧﻨﺎ ﺳﻮ ﻧﺮﻳﺪ أ ﻧﺒﻘﻲ اﻟﻌﺪد ﻋﻨﺪ أدﻧﻰ
ﺣﺪ ﻣﻤﻜﻦ .ﻟﻬﺬ اﻷﺳﺒﺎب ﻏريﻫﺎ ،ﻃﻮر اﻹﺣﺼﺎﺋﻴﻮ ﻃﺮﻗﺎ ﻟﻠﻌﺜﻮر ﻋﲆ ﻣﺠﻤﻮﻋﺎت ﻓﺮﻋﻴﺔ
ﺟﻴﺪة ﻣﻦ املﺘﻐريات؛ ﺣﻴﺚ ﺗﻌﻨﻲ ﻛﻠﻤﺔ »ﺟﻴﺪة« أﻧﻬﺎ ﺗﻨﺘﺞ أﻓﻀﻞ اﻟﺘﻨﺒﺆات.
ﺗﺮﺑﻂ ﻧﻤﺎذج اﻻﻧﺤﺪار ﻣﺘﻐري ﻧﺎﺗﺞ أ ﻣﺘﻐري إﺟﺎﺑﺔ ﺑﻮاﺣﺪ أ أﻛﺜﺮ ﻣﻦ املﺘﻐريات
املﺘﻨﺒﱢﺌﺔ .ﻫﺬا ﻧﻮع ﺷﺎﺋﻊ ﺟﺪٍّا ﻣﻦ املﺸﻜﻼت ،ﻃﻮرت ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ أﺧﺮ ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ
ﺣﺎﻻت ﻣﻤﺎﺛﻠﺔ ﺗﺨﺘﻠﻒ ﰲ ﺑﻌﺾ اﻟﻨﻮاﺣﻲ ﻋﻦ ﺣﺎﻟﺔ اﻻﻧﺤﺪار املﺴﺘﻘﻴﻢ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،
ﰲ »ﺗﺤﻠﻴﻞ اﻟﺒﻘﺎء« ﺗﻌﺮ ﻗﻴﻤﺔ ﻣﺘﻐري اﻹﺟﺎﺑﺔ ﻟﺒﻌﺾ اﻟﺤﺎﻻت ﻓﻘﻂ ،ﻳﻌﺮ ﻓﻘﻂ أ
ﻗﻴﻤﺘﻬﺎ ﻟﺤﺎﻻت أﺧﺮ ﺗﺘﺠﺎ ز ﻗﻴﻤﺔ ﻣﺎ .ﻳﻨﺸﺄ ﻫﺬا ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ ﺷﻴﻮﻋﺎ )ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻪ
ﻟﻴﺲ ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ﺣﺴﺐ( ﻋﻨﺪﻣﺎ ﻳﻜﻮ ﻣﺘﻐري اﻹﺟﺎﺑﺔ ﻓﱰة زﻣﻨﻴﺔ؛ ﻣﻦ ﺛﻢﱠ ،ﻓﺈﻧﻨﺎ ﻗﺪ
ﻧﺮﻏﺐ ﰲ ﻣﻌﺮﻓﺔ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ اﻟﺘﻲ ﺳﻴﻈﻞ ﻓﻴﻬﺎ املﺮﻳﺾ ﻋﲆ ﻗﻴﺪ اﻟﺤﻴﺎة ) ﻣﻦ ﻫﻨﺎ ﺟﺎء
101
ﻋﻠﻢ اﻹﺣﺼﺎء
اﺳﻢ ﻫﺬ اﻟﺘﻘﻨﻴﺔ( أ ﻃﻮ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ اﻟﺘﻲ ﺳﻴﺒﻘﻰ ﻓﻴﻬﺎ ﻣﻜﻮ ﻣﻦ اﻟﻨﻈﺎ ﻗﺒﻞ أ
ﻳﺤﺘﺎج إﱃ اﻻﺳﺘﺒﺪا .ﺑﺄﺧﺬ اﻟﺤﺎﻟﺔ اﻷ ﱃ ﻛﻤﺜﺎ ﻟﻠﺘﻮﺿﻴﺢ ،رﺑﻤﺎ ﺗ ﱢﺒني ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت
املﺘﻮﻓﺮة ﻟﺪﻳﻨﺎ أ أﺣﺪ املﺮﴇ ﻋﺎش ﺧﻤﺴﺔ أﺷﻬﺮ ،ﻋﺎش آﺧﺮ ﺷﻬﺮﻳﻦ ﻓﻘﻂ ،ﻋﺎش ﺛﻼﺛﺔ ﱢ
آﺧﺮ أﺣﺪ ﻋﴩ ﺷﻬﺮا ،ﻫﻜﺬا .ﻣﻊ ذﻟﻚ ،رﺑﻤﺎ ﻟﻢ ﻧﺘﻤﻜﻦ ﻷﺳﺒﺎب ﻋﻤﻠﻴﺔ ﻣﻦ اﻻﻧﺘﻈﺎر
ﺣﺘﻰ ﻳﻤﻮت آﺧﺮ ﻣﺮﻳﺾ ﰲ اﻟﺪراﺳﺔ )اﻟﻔﱰة اﻟﺘﻲ ﻗﺪ ﺗﺼﻞ إﱃ أﻋﻮا (؛ ﻟﺬﻟﻚ ﺗﻮﻗﻔﻨﺎ
ﻋﻦ ﺗﺴﺠﻴﻞ املﻼﺣﻈﺎت .ﻛﻞ ﻣﺎ ﻧﻌﺮﻓﻪ ﻋﻦ ﺑﻌﺾ املﺮﴇ ﻫﻮ أﻧﻬﻢ ﻋﺎﺷﻮا ﻓﱰة »أﻃﻮ «
ﻣﻦ اﻟﻮﻗﺖ ﺑني ﺑﺪء رﺻﺪ املﻼﺣﻈﺎت اﻟﺘﻮﻗﻒ ﻋﻦ رﺻﺪﻫﺎ .ﺗﻮﺻﻒ ﻫﺬ اﻟﺒﻴﺎﻧﺎت ﺑﺄﻧﻬﺎ
»ﻣﺒﺘﻮرة« ،ﻟﺘﻮﺿﻴﺢ اﻟﺘﻌﻘﻴﺪات اﻟﺘﻲ ﺗﺴﺒﺒﻬﺎ ،ﺗﺄﻣﱠ ْﻞ ﻃﺮﻳﻘﺔ ﺣﺴﺎب ﻣﺘﻮﺳﻂ ﻓﱰة اﻟﺒﻘﺎء
ﻋﲆ ﻗﻴﺪ اﻟﺤﻴﺎة؛ ﻓﻠﺤﺴﺎب املﺘﻮﺳﻂ ،ﻧﺤﺘﺎج إﱃ ﺟﻤﻊ اﻟﻔﱰات اﻟﺰﻣﻨﻴﺔ املﺮﺻﻮدة اﻟﻘﺴﻤﺔ
ﻋﲆ اﻟﻌﺪد املﻮﺟﻮد .إﻧﻨﺎ ﻟﻢ ﻧﺮﺻﺪ ﰲ اﻟﻮاﻗﻊ ﻓﱰات اﻟﺒﻘﺎء ﻋﲆ ﻗﻴﺪ اﻟﺤﻴﺎة ﻟﻠﻤﺮﴇ املﺒﺘﻮرة
ﺑﻴﺎﻧﺎﺗﻬﻢ ،ﻻ ﻳﻤﻜﻨﻨﺎ ﺗﻀﻤﻴﻨﻬﻢ ﰲ اﻟﺤﺴﺎب .ﻟﻜﻦ إذا أﻏﻔﻠﻨﺎﻫﻢ ،ﻓﺈﻧﻨﺎ ﺳﻮ ﻧﻐﻔﻞ ﻋﲆ
ﺟﻪ اﻟﺘﺤﺪﻳﺪ اﻟﻘﻴﻢ اﻷﻛﱪ؛ ﻟﺬﻟﻚ ﺳﻮ ﻳﻜﻮ ﺗﻘﺪﻳﺮﻧﺎ ﻣﺘﺤﻴﺰا إﱃ اﻷﺳﻔﻞ .ﻋﲆ اﻟﻨﻘﻴﺾ،
إذا ﺿﻤﱠ ﻨﱠﺎﻫﻢ ،ﺑﺎﺳﺘﺨﺪا ﻓﱰات املﻼﺣﻈﺔ ،ﻓﺈ اﻟﻨﺘﻴﺠﺔ ﺗﻌﺘﻤﺪ ﻋﲆ ﻗﺖ اﺧﺘﻴﺎرﻧﺎ ﻟﻠﺘﻮﻗﻒ
ﻋﻦ رﺻﺪ املﻼﺣﻈﺎت .ﺑﻤﺎ أ ﻫﺬا ﻏري ﻣﻼﺋﻢ أﻳﻀﺎ ،ﻓﻘﺪ ﺿﻌﺖ أﺳﺎﻟﻴﺐ أﻛﺜﺮ ﺗﻄﻮرا
ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﺒﺘﻮرة.
ﺛﻤﺔ ﻧﺴﺨﺔ أﺧﺮ ﻣﻦ ﻣﺸﻜﻠﺔ ﺟﻮد ﻣﺘﻐري ﻧﺎﺗﺞ اﺣﺪ ﻣﺮﺗﺒﻂ ﺑﻮاﺣﺪ أ أﻛﺜﺮ ﻣﻦ
املﺘﻐريات املﺘﻨﺒﺌﺔ ﺗﺤﺪث ﰲ »ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ« .ﻳﺴﺘﺨﺪ ﻫﺬا اﻟﺘﺤﻠﻴﻞ ﻋﲆ ﻧﻄﺎ اﺳﻊ ﰲ
ﻣﺠﺎ اﻟﺰراﻋﺔ ،ﻋﻠﻢ اﻟﻨﻔﺲ ،ﻣﺮاﻗﺒﺔ اﻟﺠﻮدة اﻟﺼﻨﺎﻋﻴﺔ اﻟﺘﺼﻨﻴﻊ ،ﻏريﻫﺎ ﻣﻦ املﺠﺎﻻت.
ﻛﻼ ﻣﻨﻬﺎ ﻳﺘﺨﺬ ﺑﻀﻊ ﰲ ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ ،ﺗﻜﻮ املﺘﻐريات املﺘﻨﺒﺌﺔ ﴏﻳﺤﺔ؛ ﻫﺬا ﻳﻌﻨﻲ أ ٍّ
ﻗﻴﻢ ﻓﺤﺴﺐ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،ﰲ ﺗﺼﻨﻴﻊ ﺑﻌﺾ املﻮاد اﻟﻜﻴﻤﻴﺎﺋﻴﺔ رﺑﻤﺎ ﻧﻜﻮ ﻗﺎدرﻳﻦ ﻋﲆ
اﻟﺴﻴﻄﺮة ﻋﲆ درﺟﺔ اﻟﺤﺮارة اﻟﻀﻐﻂ املﺪة ،ﻳﻜﻮ ﻟﺪﻳﻨﺎ ﺛﻼﺛﺔ إﻋﺪادات ﻟﻜ ﱟﻞ ﻣﻨﻬﺎ:
ﻣﻨﺨﻔﻀﺔ ﻣﺘﻮﺳﻄﺔ ﻋﺎﻟﻴﺔ .ﻗﺎﺑﻠﻨﺎ ﻣﺜﻞ ﻫﺬا املﻮﻗﻒ ﻋﻨﺪﻣﺎ ﻧﺎﻗﺸﻨﺎ اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ ﰲ
اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ ،ﻏﺎﻟﺒﺎ ﻣﺎ ﻳﺴﺘﺨﺪ ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ ﻟﺘﺤﻠﻴﻞ اﻟﺘﺠﺎرب .رﻏﻢ ﺗﻘﺪﻳﻤﻪ ﻋﺎدة
ﻋﲆ أﻧﻪ ﻣﺨﺘﻠﻒ ﻋﻦ ﺗﺤﻠﻴﻞ اﻻﻧﺤﺪار ،ﻓﺈﻧﻪ ﻣﻦ املﻤﻜﻦ إﻋﺎدة ﺻﻴﺎﻏﺘﻪ ﰲ ﺻﻮرة ﻧﻤﻮذج
اﻧﺤﺪار .ﻛﻼﻫﻤﺎ ﺣﺎﻟﺘﺎ ﺧﺎﺻﺘﺎ ﻣﻦ ﻓﺌﺔ أﻛﱪ ﻣﻦ اﻟﻨﻤﺎذج ﺗﺴﻤﱠ ﻰ »اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ«.
ﱢﺳﻌﺖ اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ ﻧﻔﺴﻬﺎ ﺑﻄﺮ ﻣﺨﺘﻠﻔﺔ .أﺣﺪ اﻟﺘﻌﻤﻴﻤﺎت املﻬﻤﺔ ﻟﻠﻐﺎﻳﺔ ﻳﺘﻤﺜﻞ
ﻓﻴﻤﺎ ﻳﺴﻤﻰ »اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ املﻌﻤﱠ ﻤﺔ« .ﰲ اﻻﻧﺤﺪار ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ ،ﻳﻜﻮ اﻟﻬﺪ ﻫﻮ
ﺗﻮﺳﻊ اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ ﱢ اﻟﺘﻨﺒﺆ ﺑﺎﻟﻘﻴﻤﺔ املﺘﻮﺳﻄﺔ ﻟﻺﺟﺎﺑﺔ ﻋﻨﺪ ﻛﻞ ﻗﻴﻤﺔ ﻋﺎﻣﻞ ﻣﺘﻨﺒﺊ.
102
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
املﻌﻤﻤﺔ ﻫﺬا ﻣﻦ ﺧﻼ اﻟﺴﻤﺎح ﺑﻜﻮ ﻏريﻫﺎ ﻣﻦ ﻣﻌﻠﻤﺎت ﺗﻮزﻳﻊ اﻹﺟﺎﺑﺔ ،ﻟﻴﺲ املﺘﻮﺳﻂ
ﻓﻘﻂ ،ﺧﺎﺿﻌﺔ ﻟﻠﺘﻨﺒﺆ.
ﻣﻊ ذﻟﻚ ،ﺗﻈﻬﺮ ﻧﺴﺨﺔ أﺧﺮ ﻣﻦ ﺑﻨﻴﺔ اﻟﻨﺎﺗﺞ/املﺘﻨﺒﺊ ﻋﻨﺪﻣﺎ ﺗﻜﻮ اﻹﺟﺎﺑﺔ ﻧﻔﺴﻬﺎ
ﻗﺎﻃﻌﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﺗﻜﻮ اﻹﺟﺎﺑﺔ ﻋﺒﺎرة ﻋﻦ ﻗﺎﺋﻤﺔ ﻣﻦ اﻟﺘﺸﺨﻴﺼﺎت اﻟﻄﺒﻴﺔ
املﻤﻜﻨﺔ ،رﺑﻤﺎ ﺗﻜﻮ اﻟﻌﻮاﻣﻞ املﺘﻨﺒﺌﺔ ﻣﺰﻳﺠﺎ ﻣﻦ اﻷﻋﺮاض )ﻗﺪ ﺗﻜﻮ ﻣﺪرﺟﺔ ﻋﲆ أﻧﻬﺎ
ﺣﺎﴐة أ ﻏﺎﺋﺒﺔ( ﻧﺘﺎﺋﺞ اﻟﺘﺤﺎﻟﻴﻞ اﻟﻄﺒﻴﺔ .ﺗﻨﺪرج ﻫﺬ اﻷﺳﺎﻟﻴﺐ ﺗﺤﺖ اﺳﻢ ﻋﺎ
ﻫﻮ »اﻟﺘﺼﻨﻴﻒ املﺮاﻗﺐ« .ﺗﺤﺪث اﻟﺤﺎﻟﺔ اﻟﺨﺎﺻﺔ اﻷﻫﻢ ﻣﻦ ﻫﺬ اﻟﻨﻤﺎذج ﻋﻨﺪﻣﺎ ﻳﻜﻮ
ﻣﺘﻐري اﻹﺟﺎﺑﺔ ﺛﻨﺎﺋﻴٍّﺎ؛ أ ﻳﺄﺧﺬ ﻗﻴﻤﺘني ﻣﻤﻜﻨﺘني ﻓﺤﺴﺐ؛ ﻣﺜﻞ ﻣﺮﻳﺾ/ﺻﺤﻴﺢ ،ﻣﺨﺎﻃﺮة
ﺟﻴﺪة/ﻣﺨﺎﻃﺮة ﺳﻴﺌﺔ ،ﻣﺮﺑﺢ/ﻋﺪﻳﻢ اﻟﺠﺪ ،اﻟﻜﻠﻤﺔ املﻨﻄﻮﻗﺔ »ﻧﻌﻢ«/اﻟﻜﻠﻤﺔ املﻨﻄﻮﻗﺔ
»ﻻ« )ﰲ ﺑﺮاﻣﺞ اﻟﺘﻌﺮ ﻋﲆ اﻟﻜﻼ ( ،ﺑﺼﻤﺔ ﻣﴫح ﺑﻬﺎ/ﺑﺼﻤﺔ ﻏري ﻣﴫح ﺑﻬﺎ )ﰲ
أﻧﻈﻤﺔ املﻘﺎﻳﻴﺲ اﻟﺤﻴﻮﻳﺔ ﻟﻠﺘﻌﺮ ﻋﲆ اﻷﺷﺨﺎص( ،ﺻﻔﻘﺔ اﺣﺘﻴﺎﻟﻴﺔ/ﺻﻔﻘﺔ ﴍﻋﻴﺔ ،ﻣﺎ
ﺷﺎﺑﻪ ذﻟﻚ .ﰲ ﻛﻞ ﺣﺎ ،ﻓﺈ اﻟﻬﺪ ﺳﻴﻜﻮ ﺑﻨﺎء ﻧﻤﻮذج ﻳﻤ ﱢﻜﻨﻨﺎ ﻣﻦ ﺗﺤﺪﻳﺪ اﻟﻔﺌﺔ اﻷﻛﺜﺮ
اﺣﺘﻤﺎﻻ ﻟﻠﺤﺎﻻت اﻟﺠﺪﻳﺪة ،ﻣﺴﺘﺨﺪﻣﺎ ﻓﺤﺴﺐ املﻌﻠﻮﻣﺎت ﰲ املﺘﻐريات املﺘﻨﺒﺌﺔ.
ﻃﻮر ﻋﺪد ﻛﺒري ﻣﻦ اﻷد ات اﻹﺣﺼﺎﺋﻴﺔ ملﺜﻞ ﻫﺬ اﻟﺤﺎﻻت .ﻛﺎ ﻣﻦ ﺑني أ
اﻷد ات »ﺗﺤﻠﻴﻞ اﻟﺘﻤﺎﻳﺰ اﻟﺨﻄﻲ« ،اﻟﺬ ﻃﻮر ﰲ ﺛﻼﺛﻴﻨﻴﺎت اﻟﻘﺮ اﻟﻌﴩﻳﻦ ،ﻟﻜﻨﻪ ﻻ ﻳﺰا
ﻣﺴﺘﺨﺪﻣﺎ ﻋﲆ ﻧﻄﺎ اﺳﻊ ﻟﻠﻐﺎﻳﺔ ﺣﺘﻰ اﻟﻴﻮ ،ﺳﻮاء ﺑﺸﻜﻠﻪ اﻷﺳﺎﳼ أ ﺑﺘﻮﺳﻴﻌﺎﺗﻪ
اﻷﻛﺜﺮ ﺗﻔﺼﻴﻼ .ﺗﻮﺟﺪ ﻃﺮﻳﻘﺔ أﺧﺮ ﺗﺤﻈﻰ ﺑﺸﻌﺒﻴﺔ ﻛﺒرية ﰲ ﺑﻌﺾ املﺠﺎﻻت — ﻣﺜﻞ
اﻟﻄﺐ إدارة ﻗﻴﻤﺔ اﻟﻌﻤﻼء — ﻫﻲ »ﺗﺤﻠﻴﻞ اﻟﺘﻤﺎﻳﺰ اﻟﻠﻮﺟﺴﺘﻲ« .ﻫﺬا ﻧﺴﺨﺔ ﻣﻦ اﻻﻧﺤﺪار
اﻟﻠﻮﺟﺴﺘﻲ ،ﻫﻮ ﻧﻮع ﻣﻦ اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ املﻌﻤﻤﺔ؛ ﻟﺬﻟﻚ ﻳﻈﻬﺮ اﻟﺼﻠﺔ اﻟﻮﺛﻴﻘﺔ ﺑني ﻃﺒﻘﺎت
اﻷد ات .ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻦ اﻋﺘﺒﺎر اﻻﻧﺤﺪار اﻟﻠﻮﺟﺴﺘﻲ أﺑﺴﻂ أﻧﻮاع »اﻟﺸﺒﻜﺎت اﻟﻌﺼﺒﻴﺔ«.
ﺗﺴﻤﱠ ﻰ اﻟﺸﺒﻜﺎت اﻟﻌﺼﺒﻴﺔ ﺑﻬﺬا اﻻﺳﻢ ﻷﻧﻬﺎ ﻗﺪﱢﻣﺖ ﰲ اﻷﺻﻞ ﻛﻨﻤﺎذج ﻟﻄﺮﻳﻘﺔ ﻋﻤﻞ املﺦ؛ ﱠإﻻ
أﻧﻪ ﰲ اﻟﻮﻗﺖ اﻟﺤﺎﴐ ﺗﺮ ﱠﻛﺰ اﻟﻌﻤﻞ ﰲ ﻫﺬا املﺠﺎ ﻛﺜريا ﻋﲆ ﺧﺼﺎﺋﺼﻬﺎ اﻹﺣﺼﺎﺋﻴﺔ ﻛﻨﻈﻢ
ﻟﻠﺘﻨﺒﺆ ،ﺑﻐﺾ اﻟﻨﻈﺮ ﻋﻤﺎ إذا ﻛﺎﻧﺖ ﺗﺸ ﱢﻜﻞ ﻧﻤﺎذج ﺟﻴﺪة ﻟﻠﻨﻈﻢ اﻟﻄﺒﻴﻌﻴﺔ أ ﻻ.
ﺗﻮﺟﺪ ﻧﻤﺎذج أﺧﺮ ﻟﻠﺘﺼﻨﻴﻒ املﺮاﻗﺐ ﺗﺸﻤﻞ أﺳﻠﻮب »اﻟﺘﺼﻨﻴﻒ اﻟﺸﺠﺮ « ﻃﺮﻳﻘﺔ
ﻳﻘﺴﻢ اﻟﻨﻤﻮذج اﻟﺸﺠﺮ املﺘﻐريات إﱃ ﻧﻄﺎﻗﺎت ،ﻳﺼﻨﻒ ﻧﻘﺎﻃﺎ ﺟﺪﻳﺪة »اﻟﺠﺎر اﻷﻗﺮب« .ﱢ
ﻓﻘﺎ ملﺠﻤﻮﻋﺔ اﻟﻨﻄﺎﻗﺎت اﻟﺘﻲ ﺗﻘﻊ ﻓﻴﻬﺎ .ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻳﻈﻬﺮ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت
أ اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﺗﺰﻳﺪ أﻋﻤﺎرﻫﻢ ﻋﻦ ٥٠ﻋﺎﻣﺎ ﻳﻌﻴﺸﻮ ﻧﻤﻂ ﺣﻴﺎة ﻗﻠﻴﻞ اﻟﺤﺮﻛﺔ
ﻣﺆﴍ ﻛﺘﻠﺔ ﺟﺴﻢ أﻛﱪ ﻣﻦ ٢٥؛ ﻣﻌ ﱠﺮﺿﻮ ﻟﺨﻄﺮ اﻹﺻﺎﺑﺔ ﺑﺄﻣﺮاض اﻟﻘﻠﺐ .ﻣﺜﻞ ﻟﺪﻳﻬﻢ ﱢ
103
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻫﺬ اﻟﻨﻤﺎذج ﻳﻤﻜﻦ أ ﺗﻤﺜﱠﻞ ﰲ ﺻﻮرة ﺑﻨﻴﺔ ﺷﺠﺮﻳﺔ؛ ﻣﻦ ﻫﻨﺎ ﺟﺎءت اﻟﺘﺴﻤﻴﺔ .ﰲ أﺳﻠﻮب
اﻟﺠﺎر اﻷﻗﺮب ،ﻧﺠﺪ اﻟﻜﺎﺋﻨﺎت اﻟﻘﻠﻴﻠﺔ املﻮﺟﻮدة ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﻜﻮ أﻛﺜﺮ ﺷﺒﻬﺎ
)أ »أﻛﺜﺮ ﻗﺮﺑﺎ«( إﱃ اﻟﻜﺎﺋﻦ اﻟﺠﺪﻳﺪ اﻟﺨﺎﺿﻊ ﻟﻠﺘﺼﻨﻴﻒ؛ ﺣﻴﺚ ﻳﺘﺤﺪﱠد اﻟﺘﺸﺎﺑﻪ ﻣﻦ ﻧﺎﺣﻴﺔ
املﺘﻐريات املﺘﻨﺒﱢﺌﺔ .ﺑﻌﺪﻫﺎ ﻳﻮﺿﻊ اﻟﻜﺎﺋﻦ اﻟﺠﺪﻳﺪ ﺑﺒﺴﺎﻃﺔ ﰲ اﻟﻔﺌﺔ ﻧﻔﺴﻬﺎ ﻛﻤﺎ ﻫﻲ ﺣﺎ
ﻏﺎﻟﺒﻴﺔ ﻫﺬ اﻟﻜﺎﺋﻨﺎت املﺘﺸﺎﺑﻬﺔ ﻛﺜريا.
ﻳﺴﻤﻰ اﻟﺘﺼﻨﻴﻒ املﺮاﻗﺐ ﺑﻬﺬا اﻻﺳﻢ ﻷﻧﻪ ﻳﺤﺘﺎج ﺷﺨﺼﺎ )أ »ﻣﺮاﻗﺒﺎ«( ﻟﺘﺤﺪﻳﺪ
ﺗﺴﻤﻴﺎت ﻓﺌﺎت ﻋﻴﻨﺔ اﻟﺒﻴﺎﻧﺎت ،اﻟﺘﻲ ﻳﻤﻜﻨﻨﺎ ﻣﻦ ﺧﻼﻟﻬﺎ ﺑﻨﺎء ﻗﺎﻋﺪة اﻟﺘﺼﻨﻴﻒ ﻟﺘﻄﺒﻴﻘﻬﺎ
ﻋﲆ اﻟﻜﺎﺋﻨﺎت اﻟﺠﺪﻳﺪة .ﻣﻊ ذﻟﻚ ،ﻻ ﻳﻮﺟﺪ ﰲ ﻣﺴﺎﺋﻞ اﻟﺘﺼﻨﻴﻒ اﻷﺧﺮ أ ﺗﺴﻤﻴﺔ ﻟﻠﻔﺌﺎت،
اﻟﻬﺪ ﻫﻮ ﺑﺒﺴﺎﻃﺔ ﺗﻘﺴﻴﻢ اﻟﻜﺎﺋﻨﺎت إﱃ ﻓﺌﺎت ﻃﺒﻴﻌﻴﺔ ،أ رﺑﻤﺎ ﻓﺌﺎت ﻣﻼﺋﻤﺔ .ﻳﻤﻜﻨﻨﺎ
اﻟﻘﻮ إ اﻟﻬﺪ ﻣﻦ ذﻟﻚ ﻫﻮ ﺗﺤﺪﻳﺪ اﻟﻔﺌﺎت؛ ﻓﻔﻲ اﻟﻄﺐ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﺗﻜﻮ
ﻟﺪﻳﻨﺎ ﻋﻴﻨﺔ ﻣﻦ املﺮﴇ ﻟﻜ ﱟﻞ ﻣﻨﻬﻢ ﺗﻔﺎﺻﻴﻞ ﻋﻦ أﻧﻤﺎط اﻷﻋﺮاض ﻧﺘﺎﺋﺞ اﻟﺘﺤﺎﻟﻴﻞ ،رﺑﻤﺎ
ﻧﻈﻦ أ ﻋﺪة أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻷﻣﺮاض ﻣﻤﺜﻠﺔ ﰲ اﻟﻌﻴﻨﺔ .ﺳﻴﻜﻮ ﻫﺪﻓﻨﺎ ﺣﻴﻨﻬﺎ ﻣﻌﺮﻓﺔ
ﻣﺎ إذا ﻛﺎ املﺮﴇ ﻳﺸ ﱢﻜﻠﻮ ﻣﺠﻤﻮﻋﺎت ﻣﺨﺘﻠﻔﺔ ﻣﻦ ﻣﻨﻈﻮر اﻷﻋﺮاض ﻧﺘﺎﺋﺞ اﻟﺘﺤﺎﻟﻴﻞ.
ﻳﻄﻠﻖ ﻋﲆ اﻷد ات اﻹﺣﺼﺎﺋﻴﺔ ﻻﺳﺘﻜﺸﺎ ﻫﺬ اﻟﺘﺠﻤﻌﺎت اﺳﻢ »اﻟﺘﺤﻠﻴﻞ اﻟﻌﻨﻘﻮد «.
ﻛﺎ ﻟﻬﺬ اﻷﺳﺎﻟﻴﺐ ﻓﺎﺋﺪة ﻛﺒرية ﰲ ﺗﺤﺪﻳﺪ اﻟﻔﺮ ﺑني اﻻﻛﺘﺌﺎب اﻷﺣﺎد اﻟﻘﻄﺐ اﻟﺜﻨﺎﺋﻲ
اﻟﻘﻄﺐ ،ﺗﺴﺘﺨﺪ ﰲ ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ املﺠﺎﻻت اﻷﺧﺮ ،ﻣﻨﻬﺎ — ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ —
إدارة ﻗﻴﻤﺔ اﻟﻌﻤﻼء اﻟﺘﺴﻮﻳﻖ؛ ﺣﻴﺚ ﺗﻜﻤﻦ ﻓﺎﺋﺪﺗﻬﺎ ﰲ ﺗﺤﺪﻳﺪ ﻣﺎ إذا ﻛﺎ ﻳﻮﺟﺪ أﻧﻮاع
ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﻌﻤﻼء أ ﻻ.
ﰲ اﻟﺘﺤﻠﻴﻞ اﻟﻌﻨﻘﻮد ،ﻻ ﻳﻮﺟﺪ ﻣﺘﻐري »ﻧﺎﺗﺞ« ﻻ »إﺟﺎﺑﺔ« .ﺑﺪﻻ ﻣﻦ ذﻟﻚ ،ﻓﺈ اﻟﻬﺪ
ﻫﻮ ﻣﺠﺮد ﺻﻒ اﻟﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ ﺳﻬﻞ .ﺛﻤﺔ أد ات إﺣﺼﺎﺋﻴﺔ أﺧﺮ ﻟﻬﺎ اﻟﻬﺪ ﻧﻔﺴﻪ،
ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻬﺎ ﺗﺴﻌﻰ إﱃ ﺻﻒ ﻣﻦ ﻧﻮع ﻣﺨﺘﻠﻒ ﺗﻤﺎﻣﺎ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ » ،اﻟﻨﻤﻮذج
اﻟﺒﻴﺎﻧﻲ« ﻫﻮ ﺻﻒ ﻣﺒﺴﻂ ﻟﻠﻌﻼﻗﺎت ﺑني ﻋﺪة ﻣﺘﻐريات — رﺑﻤﺎ ﻋﺪد ﻛﺒري ﻣﻨﻬﺎ —
اﺳﺘﻨﺎدا إﱃ اﻓﱰاض أ اﻟﻌﻼﻗﺎت ﺑني اﻟﻌﺪﻳﺪ ﻣﻦ املﺘﻐريات ﺗﺴﺒﺒﻬﺎ ﻋﻼﻗﺎت ﺳﻴﻄﺔ ﻣﻊ
ﻣﺘﻐريات أﺧﺮ .ﻗﺪ رأﻳﻨﺎ ﻣﺜﺎﻻ ﺑﺴﻴﻄﺎ ﺟﺪٍّا ﻋﲆ ﻫﺬا ﺳﺎﺑﻘﺎ؛ ﻓﺮﺑﻤﺎ ﻛﺎ اﻻرﺗﺒﺎط اﻹﻳﺠﺎﺑﻲ
ﺑني اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة اﻟﻘﺪرة اﻟﺤﺴﺎﺑﻴﺔ ﻟﺪ اﻷﻃﻔﺎ ﻧﺘﻴﺠﺔ ﻟﻠﻌﻼﻗﺔ ﺑني ﻛﻼ ﻫﺬﻳﻦ
املﺘﻐريﻳﻦ اﻟﻌﻤﺮ.
ﻳﻤﻜﻦ اﻟﺘﻮﺳﻊ ﰲ ﻫﺬ اﻟﻨﻤﺎذج ﻣﻦ ﺧﻼ اﻓﱰاض أ ﺑﻌﺾ اﻟﻌﻼﻗﺎت ﺳﺒﺒﻬﺎ
املﺘﻐريات »اﻟﻜﺎﻣﻨﺔ« ﻏري املﻘﻴﺴﺔ اﻟﺘﻲ ﺗﺘﻌﻠﻖ ﺑﺒﻌﺾ املﺘﻐريات املﺮﺻﻮدة؛ ﻣﻦ ﺛ ﱠﻢ ﺗﺤﻔﺰ
104
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﻋﻼﻗﺔ اﺿﺤﺔ ﺑﻴﻨﻬﻤﺎ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎ ،رﺑﻤﺎ ﻧﻼﺣﻆ أ أﺳﻌﺎر أﺳﻬﻢ ﺑﻌﺾ اﻟﴩﻛﺎت
ﺗﺮﺗﻔﻊ أ ﺗﻨﺨﻔﺾ ﻣﻌﺎ .إﺣﺪ ﻃﺮ ﺗﻔﺴري ﻫﺬا ﻗﺪ ﺗﺘﻤﺜﻞ ﰲ ﺗﺨﻤني ﺟﻮد ﺑﻌﺾ املﺘﻐريات
اﻟﺨﻔﻴﺔ )ﺑﻌﺾ ﺟﻮاﻧﺐ اﻻﻗﺘﺼﺎد ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ( اﻟﺘﻲ ﺗﺮﺗﺒﻂ ﺑﻜﻞ ﺳﻌﺮ؛ ﻣﻦ ﺛ ﱠﻢ ﺗﺤﻔﺰ
اﻟﻌﻼﻗﺔ ﺑني ﻫﺬ اﻷﺳﻌﺎر؛ ﻓﻌﻨﺪﻣﺎ ﻳﺰﻳﺪ املﺘﻐري اﻟﺨﻔﻲ ،ﺗﺮﺗﻔﻊ ﻛﻞ اﻷﺳﻌﺎر .ﺗﺸﻜﻞ ﻫﺬ
اﻷﻓﻜﺎر أﺳﺎس ﻧﻤﺎذج »اﻟﺘﺤﻠﻴﻞ اﻟﻌﺎﻣﲇ« ،ﻏﺎﻟﺒﺎ ﻣﺎ ﻳﺴﻤﱠ ﻰ املﺘﻐري اﻟﻜﺎﻣﻦ ﺑﺎﺳﻢ »اﻟﻌﺎﻣﻞ
ﻔﴪ ﺳﻠﺴﻠﺔ اﻟﻜﺎﻣﻦ« .ﻛﻤﺎ أﻧﻬﺎ ﺗﺸﻜﻞ أﺳﺎس »ﻧﻤﺎذج ﻣﺎرﻛﻮ املﺨﻔﻴﺔ« ،اﻟﺘﻲ ﻓﻴﻬﺎ ﺗ ﱠ
ﻗﻴﻢ ﻣﺮﺻﻮدة ﰲ ﺳﻴﺎ ﺣﺎﻻت ﺧﻔﻴﺔ ﻟﻠﻨﻈﺎ ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،املﺮﴇ اﻟﺬﻳﻦ ﻳﻌﺎﻧﻮ ﻣﻦ
ﺑﻌﺾ اﻷﻣﺮاض ﻳﺘﻔﺎ ﺗﻮ ﻣﻦ ﺣﻴﺚ ﺟﻮدة اﻟﺤﻴﺎة ،ﻓﺄﺣﻴﺎﻧﺎ ﻳﻨﺘﻜﺴﻮ أﺣﻴﺎﻧﺎ ﻳﺸﻔ ْﻮ ﻋﲆ
ﻧﺤﻮ ﻣﺆﻗﺖ .ﻳﻤﻜﻦ ﻧﻤﺬﺟﺔ ﻫﺬا اﻟﺘﻌﺎﻗﺐ ﰲ ﺳﻴﺎ اﻟﺤﺎﻻت اﻷﺳﺎﺳﻴﺔ املﺘﻐرية.
إذا ﻛﺎﻧﺖ أﺳﺎﻟﻴﺐ اﻟﺘﺼﻨﻴﻒ ﺳﻤﱢ ﻴﺖ ﺗﻴﻤﱡ ﻨﺎ ﺑﺄﻧﻮاع املﺴﺎﺋﻞ املﺼﻤﱠ ﻤﺔ ﻟﺤﻠﻬﺎ ،ﻓﻘﺪ ﺳﻤﻴﺖ
أﺳﺎﻟﻴﺐ أﺧﺮ ﺗﻴﻤﻨﺎ ﺑﻄﺒﻴﻌﺔ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﻌﻤﻞ ﻋﻠﻴﻬﺎ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،أﺳﺎﻟﻴﺐ
»ﺗﺤﻠﻴﻞ اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨﻴﺔ« ﺗﻌﻤﻞ ﻋﲆ اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨﻴﺔ؛ أ املﻼﺣﻈﺎت املﺘﻜﺮرة ﻟﻠﻤﺘﻐري
أ املﺘﻐريات ﻧﻔﺴﻬﺎ ﻋﲆ ﻣﺪار ﺗﺴﻠﺴﻞ زﻣﻨﻲ .ﻫﻴﺎﻛﻞ اﻟﺒﻴﺎﻧﺎت ﺗﻠﻚ ﻣﻮﺟﻮدة ﰲ ﻛﻞ
ﻣﻜﺎ ؛ ﻓﻬﻲ ﺗﻮﺟﺪ ﰲ اﻻﻗﺘﺼﺎد )ﻣﺜﻞ ﻗﻴﺎﺳﺎت اﻟﺘﻀﺨﻢ اﻟﻨﺎﺗﺞ املﺤﲇ اﻹﺟﻤﺎﱄ اﻟﺒﻄﺎﻟﺔ(،
اﻟﻬﻨﺪﺳﺔ ،اﻟﻄﺐ )ﻣﺜﻞ ﺣﺪات اﻟﻌﻨﺎﻳﺔ املﺮﻛﺰة( ،ﰲ ﻛﺜري ﻣﻦ املﺠﺎﻻت اﻷﺧﺮ .ﰲ
ﺗﺤﻠﻴﻞ اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨﻴﺔ ،رﺑﻤﺎ ﻳﻜﻮ ﻫﺪﻓﻨﺎ ﻫﻮ ﻓﻬﻤﻬﺎ ،أ ﺗﺤﻠﻴﻠﻬﺎ إﱃ ﻣﻜﻮﻧﺎﺗﻬﺎ اﻟﺮﺋﻴﺴﻴﺔ
)ﻣﺜﻞ اﻟﻨﺰﻋﺔ املﻮﺳﻤﻴﺔ( ،أ رﺻﺪ ﻣﺘﻰ ﻳﺘﻐري ﺳﻠﻮ اﻟﻨﻈﺎ ،أ رﺻﺪ اﻟﺤﺎﻻت اﻟﺸﺎذة
)ﻣﺜﻞ اﻟﺘﻨﺒﺆ ﺑﺎﻟﺰﻻز ( ،أ ﺗﻮﻗﻊ اﻟﻘﻴﻢ املﺴﺘﻘﺒﻠﻴﺔ املﺤﺘﻤﻠﺔ ،أ ﻣﻦ أﺟﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ
اﻷﺳﺒﺎب اﻷﺧﺮ .ﻗﺪ ﻃﻮرت ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ اﻷﺳﺎﻟﻴﺐ ﻟﺘﺤﻠﻴﻞ ﻫﺬ اﻟﺒﻴﺎﻧﺎت.
105
ﻋﻠﻢ اﻹﺣﺼﺎء
١١٫٥
١٠٠ﻣﱰ
١١
٥٢
٥١
٥٠
٤٠٠ﻣﱰ
٤٩
٤٨
١٦
١٥
١٤
دﻓﻊ اﻟﺠُ ﻠﺔ ١٣
١٢
١١
١٠
٥٠
٤٥
٤٠
ﻗﺬف اﻟﻘﺮص
٣٥
٣٠
ﺷﻜﻞ » :2-6ﻣﺼﻔﻮﻓﺔ اﻟﺸﻜﻞ اﻻﻧﺘﺸﺎر « اﻟﺘﻲ ﺗ ﱢﺒني أ ﻗﺎت ﺳﺒﺎ اﻟﻌ ْﺪ ١٠٠ﻣﱰ ٤٠٠ﻣﱰ
)ﺑﺎﻟﺜﻮاﻧﻲ( ،املﺴﺎﻓﺎت )ﺑﺎﻷﻣﺘﺎر( ﻟﺪﻓﻊ اﻟﺠﻠﺔ ﻗﺬ اﻟﻘﺮص ﻟﻠﻤﻨﺎﻓﺴني ﰲ ﻋﺸﺎر اﻟﺮﺟﺎ ﰲ
ﱢ
ﻳﺒني ﻛﻞ ﻣﺮﺑﻊ اﻟﻌﻼﻗﺔ ﺑني اﺛﻨني ﻣﻦ املﺘﻐريات اﻷرﺑﻌﺔ. د رة اﻷﻟﻌﺎب اﻷ ملﺒﻴﺔ ﻋﺎ .١٩٨٨
اﻟﱰاﺑﻂ اﻟﻘﻮ ﺑني ﻧﺘﺎﺋﺞ ﺣﺪﺛﻲ اﻟﺮﻣﻲ اﺿﺢ ﻋﲆ ﻧﺤﻮ ﻣﺒﺎﴍ.
106
اﻟﻨﻤﺎذج اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
١٥٠٠٠
)ﺑﺎﻟﺠﻨﻴﻪ اﻹﺳﱰﻟﻴﻨﻲ(
اﻟﺴﺤﺐ اﻟﻨﻘﺪي
١٠٠٠٠
٥٠٠٠
٠
٠ ٥٠ ١٠٠ ١٥٠
ﻋﺪد اﻷﻳﺎم
ﺷﻜﻞ :3-6ﻣﺨﻄﻂ اﻟﺴﻠﺴﻠﺔ اﻟﺰﻣﻨﻴﺔ اﻟﺬ ﻳﺒني املﺒﻠﻎ املﺴﺤﻮب ﻣﻦ ﺟﻬﺎز ﴏا آﱄ ﻛﻞ
ﻳﻮ .ﻳﺒني اﻟﺸﻜﻞ ﺑﻮﺿﻮح ﺟﻮد د رات أﺳﺒﻮﻋﻴﺔ ﺷﻬﺮﻳﺔ ،أﻳﻀﺎ ﺟﻮد ﻧﺰﻋﺔ ﻣﺘﺰاﻳﺪة
ﺗﺪرﻳﺠﻴٍّﺎ ﻣﻊ ﻣﺮ ر اﻟﻮﻗﺖ .ﻳﺘﻀﺢ أﻳﻀﺎ ﺟﻮد ﻗﻴﻤﺔ ﻣﻨﺨﻔﻀﺔ ﻋﲆ ﻧﺤﻮ ﻣﻔﺎﺟﺊ ﺑﺎﻟﻘﺮب ﻣﻦ
ﻧﻬﺎﻳﺔ اﻟﻔﱰة.
٦٠
٤٠
١
٢٠
٠,٨
ﺗ
ﺸﺘﻴ
ﺖﺿ
٠,٦
٠٫٦
ﻮ
ء ﺑﺰ
٠٫٨
٠,٤
اوﻳﺔ
ﻣﺎﻣﻲ ١
ﺿﻮء أ
٩٠د
ﺸﺘﻴﺖ ١,٢
ﺗ ٠,٢
رﺟﺔ
ﺷﻜﻞ :4-6ﺗﻮزﻳﻊ ﻗﻴﻢ ﺗﺸﺘﻴﺖ اﻟﻀﻮء ﻣﻦ ﺧﻼﻳﺎ ﻋﻮاﻟﻖ ﻧﺒﺎﺗﻴﺔ ﻣﻦ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ .ﰲ اﻟﻮاﻗﻊ،
ﻳﻌﺮض ﺛﻼﺛﺔ أﻧﻮاع ﻫﻨﺎ ،ﻟﻜﻦ ﻳﻤﺘﻠﻚ اﺛﻨﺎ ﻣﻨﻬﺎ ﺗﻮزﻳﻌني ﻟﻠﻘﻴﻢ ﻣﺘﺸﺎﺑﻬني ﺟﺪٍّا؛ ﻟﺬﻟﻚ ﻳﺘﺠﻤﻊ
ﻫﺬا اﻟﺘﻮزﻳﻌﺎ ﻟﺘﻜﻮﻳﻦ ﻗﻤﺔ ﻋﺎﻟﻴﺔ اﺣﺪة.
107
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺧﺎﺗﻤﺔ
ﻗ ﱠﺪ ﻫﺬا اﻟﻔﺼﻞ ﻣﺮاﺟﻌﺔ ﴎﻳﻌﺔ ﻟﻌﺪد ﻗﻠﻴﻞ ﻣﻦ اﻷد ات اﻹﺣﺼﺎﺋﻴﺔ املﻬﻤﺔ ،ﻟﻜﻦ ﻳﻮﺟﺪ
اﻟﻌﺪﻳﺪ ﻣﻦ اﻷد ات اﻷﺧﺮ اﻟﺮاﺋﻌﺔ اﻟﺘﻲ ﻟﻢ أذﻛﺮﻫﺎ .ﺗﺘﻨﺎﺳﺐ اﻟﻨﻤﺎذج املﺨﺘﻠﻔﺔ ﻣﻊ
أﻧﻮاع املﺴﺎﺋﻞ املﺨﺘﻠﻔﺔ أﻧﻮاع اﻟﺒﻴﺎﻧﺎت املﺨﺘﻠﻔﺔ ،ﻳﻮﺟﺪ ﻋﺪد ﻻ ﻧﻬﺎﺋﻲ ﻣﻦ املﺴﺎﺋﻞ ﺑﻨﻰ
اﻟﺒﻴﺎﻧﺎت .ﻣﻦ املﻬﻢ أﻳﻀﺎ أ ﻧﺪر أ اﻟﻨﻤﺎذج ﻟﻴﺴﺖ ﻛﻴﺎﻧﺎت ﻣﻌﺰ ﻟﺔ؛ ﻓﺎﻟﺤﻘﻴﻘﺔ ﻫﻲ أ
اﻟﻨﻤﺎذج املﺨﺘﻠﻔﺔ ﺗﺮﺗﺒﻂ ﺑﻄﺮ ﻣﺘﻌﺪدة؛ ﻓﺮﺑﻤﺎ ﺗﻜﻮ اﻟﻨﻤﺎذج ﺗﻌﻤﻴﻤﺎ ﻷﻧﻮاع أﺧﺮ ﻣﻦ
اﻟﻨﻤﺎذج أ ﺗﻜﻮ ﺣﺎﻻت ﺧﺎﺻﺔ ﻣﻨﻬﺎ أ ﺗﺘﻜﻴﻒ ﻣﻊ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﺑﻴْﺪ أﻧﻬﺎ
ﻣﺪﻣﺠﺔ ﺟﻤﻴﻌﺎ ﰲ ﺷﺒﻜﺔ ﻏﻨﻴﺔ ﻣﻦ اﻟﻌﻼﻗﺎت.
108
اﻟﻔﺼﻞ اﻟﺴﺎﺑﻊ
اﳊﻮﺳﺒﺔ اﻹﺣﺼﺎﺋﻴﺔ
رأﻳﻨﺎ ﰲ املﻨﺎﻗﺸﺎت اﻟﺴﺎﺑﻘﺔ ﻛﻴﻒ أ اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ ﻳﻤﻜﻦ أ ﻳﻤﺜﻞ ﻣﺸﻜﻠﺔ ،ﻟﻜﻨﻨﺎ ﻟﻢ
ﻧﺘﻄﺮ أﻳﻀﺎ إﱃ اﻟﺤﻞ؛ إذ إﻧﻨﺎ ﺑﺒﺴﺎﻃﺔ أﴍﻧﺎ إﱃ أﻧﻪ ﻛﺎ ﻣﻦ اﻟﴬ ر اﺧﺘﻴﺎر ﻧﻤﺎذج
ﻟﻴﺴﺖ ﻣﻌﻘﺪة ﻟﻠﻐﺎﻳﺔ ﻻ ﺑﺴﻴﻄﺔ ﻟﻠﻐﺎﻳﺔ .ﺑﺪ اﻣﺘﻼ ﺧﱪة ﻛﺒرية ﰲ ﻣﺠﺎ اﻟﻨﻤﺬﺟﺔ
اﻹﺣﺼﺎﺋﻴﺔ ،ﻟﻴﺴﺖ ﻫﺬ ﻧﺼﻴﺤﺔ ﻣﻔﻴﺪة ﺟﺪٍّا ،ﺗﻮﺟﺪ ﺣﺎﺟﺔ إﱃ ﻣﺰﻳﺪ ﻣﻦ اﻟﻄﺮ املﻮﺿﻮﻋﻴﺔ.
ﱡ
»اﻟﺘﺤﻘﻖ املﺘﺒﺎد «. ﺗﺴﺘﻨﺪ إﺣﺪ ﻫﺬ اﻟﻄﺮ إﱃ ﻣﺒﺪأ
ﻛﻤﺎ رأﻳﻨﺎ أﻧﻪ — ﺑﺼﻔﺔ ﻋﺎﻣﺔ — ﺑﻴﻨﻤﺎ ﻳﺰداد ﺗﻌﻘﻴﺪ اﻟﻨﻤﻮذج ،ﺗﻮاﺻﻞ ﺟﻮدة ﻣﻄﺎﺑﻘﺘﻪ
ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﺘﺎﺣﺔ اﻟﺘﺤﺴﻦ ،ﱠإﻻ أ ﺟﻮدة ﻣﻄﺎﺑﻘﺘﻪ ﻣﻊ ﻋﻴﻨﺎت أﺧﺮ ﻣﺴﺘﻤﺪﱠة ﻣﻦ اﻟﺘﻮزﻳﻊ
ْ
ﻟﻜﻦ ﺑﻌﺪ ذﻟﻚ ﺗﺒﺪأ ﰲ اﻟﺘﺪﻫﻮر. ﻧﻔﺴﻪ )أ »أداﺋﻪ ﺧﺎرج اﻟﻌﻴﻨﺔ«( ﺗﺘﺤﺴﻦ ﻋﺎدة ﰲ اﻟﺒﺪاﻳﺔ،
ﻫﻨﺎ ﺗﻜﻮ »اﻟﻌﻴﻨﺎت اﻷﺧﺮ « ﺗﻤﺜﻴﻼ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺠﺪﻳﺪة ،ﻫﻲ ﻣﺎ ﻧﺤﻦ ﻣﻬﺘﻤﻮ ﺑﻪ ٍّ
ﺣﻘﺎ.
اﻟﻨﻘﻄﺔ اﻟﺘﻲ ﻳﻜﻮ ﻓﻴﻬﺎ اﻟﻨﻤﻮذج ﻣﻄﺎﺑﻘﺎ ﻋﲆ ﻧﺤﻮ أﻓﻀﻞ ﻣﻊ ﺑﻴﺎﻧﺎت »ﻋﻴﻨﺔ أﺧﺮ « ﻳﺒﺪ
أ ﻣﻦ ﺷﺄﻧﻬﺎ أ ﺗﻤﻨﺤﻨﺎ ﻧﻤﻮذﺟﺎ ذا ﻣﺴﺘﻮ ﻣﻨﺎﺳﺐ ﻣﻦ اﻟﺘﻌﻘﻴﺪ .ﻫﺬا ﻫﻮ ﻣﻔﺘﺎح اﻟﺤﻞ؛
ﻓﻴﺠﺐ ﻋﻠﻴﻨﺎ ﺗﻘﺪﻳﺮ ﻣﻌﻠﻤﺎت اﻟﻨﻤﻮذج ﺑﺎﺳﺘﺨﺪا ﻋﻴﻨﺔ اﺣﺪة ،ﺗﻘﻴﻴﻢ أداﺋﻪ ﺑﺎﺳﺘﺨﺪا
ﻋﻴﻨﺔ أﺧﺮ .
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻸﺳﻒ ،ﻋﺎدة ﻣﺎ ﻧﻤﺘﻠﻚ ﻋﻴﻨﺔ اﺣﺪة ﻓﻘﻂ .إﺣﺪ ﻃﺮ ﻣﻮاﺟﻬﺔ ذﻟﻚ ﺗﺘﻤﺜﻞ ﰲ
ﺗﻘﺴﻴﻢ ﻫﺬ اﻟﻌﻴﻨﺔ )ﻋﺸﻮاﺋﻴٍّﺎ( إﱃ ﻋﻴﻨﺘني ﻓﺮﻋﻴﺘني .ﺗﺴﺘﺨﺪ ﻋﻴﻨﺔ ﻓﺮﻋﻴﺔ اﺣﺪة )ﺗﺴﻤﱠ ﻰ
»ﻋﻴﻨﺔ اﻟﺘﺪرﻳﺐ« أ »ﻋﻴﻨﺔ اﻟﺘﺼﻤﻴﻢ«( ﻟﺘﻘﺪﻳﺮ املﻌﻠﻤﺔ ،ﺗﺴﺘﺨﺪ اﻷﺧﺮ )ﺗﺴﻤﱠ ﻰ »ﻋﻴﻨﺔ
اﻟﺘﺤﻘﻖ«( ﻟﺘﻘﻴﻴﻢ اﻷداء اﺧﺘﻴﺎر اﻟﻨﻤﻮذج .ﻫﺬا ﻫﻮ أﺳﻠﻮب اﻟﺘﺤﻘﻖ املﺘﺒﺎد .ﰲ اﻟﻌﺎدة،
ﻟﺘﺨﻔﻴﻒ أ ﻣﺸﺎﻛﻞ ﻧﺎﺟﻤﺔ ﻋﻦ ﻛﻮ اﻟﻌﻴﻨﺔ اﻟﻔﺮﻋﻴﺔ املﺴﺘﺨﺪﻣﺔ ﻟﺘﻘﺪﻳﺮ املﻌﻠﻤﺎت ﻟﻴﺴﺖ
ﻫﻲ ﻣﺠﻤﻞ اﻟﻌﻴﻨﺔ اﻷﺻﻠﻴﺔ ،ﻳﻜﺮر ﻫﺬا اﻹﺟﺮاء ﻋﺪة ﻣﺮات؛ ﻳﻌﻨﻲ ﻫﺬا أ اﻟﻌﻴﻨﺔ اﻷﺻﻠﻴﺔ
ﻘﺴﻢ ﻋﺸﻮاﺋﻴٍّﺎ إﱃ ﻋﻴﻨﺘني ،ﺗﻘﺪﱠر املﻌﻠﻤﺎت ﺑﺎﺳﺘﺨﺪا ﻋﻴﻨﺔ ﻓﺮﻋﻴﺔ اﺣﺪة ،ﻳﻘﻴﱠﻢ اﻟﻨﻤﻮذج ﺗ ﱠ
ﺑﺎﺳﺘﺨﺪا اﻷﺧﺮ .ﻳﻜ ﱠﺮر ﻫﺬا ﺑﺘﻘﺴﻴﻤﺎت ﻋﺸﻮاﺋﻴﺔ ﻣﺨﺘﻠﻔﺔ ﻟﻠﻌﻴﻨﺔ .أﺧريا ،ﻳﺤﺴﺐ
ﻣﺘﻮﺳﻂ ﻧﺘﺎﺋﺞ ﺗﻘﻴﻴﻢ ﻛﻞ اﻟﺘﻘﺴﻴﻤﺎت ،ﻟﻜﻲ ﻳﻨﺘﺞ ﻗﻴﺎس ﻋﺎ ﱞ ﻟﻸداء املﺴﺘﻘﺒﲇ املﺮﺟﺢ.
ﻳﻌ ﱡﺪ اﻟﺘﺤﻘﻖ املﺘﺒﺎد ﻣﺜﺎﻻ ﻋﲆ ﻧﻬﺞ »ﻣﻜﺜﱠﻒ ﺣﺎﺳﻮﺑﻴٍّﺎ«؛ ﺳﻤﱢ ﻲ ﻫﻜﺬا ﻟﻠﺴﺒﺐ اﻟﻮاﺿﺢ
املﺘﻤﺜﻞ ﰲ ﴐ رة ﺑﻨﺎء ﻧﻤﺎذج ﻣﺘﻌﺪدة .ﺗﻮﺟﺪ ﻓﺌﺔ أﺧﺮ ﻣﻬﻤﺔ ﻣﻦ ﻫﺬ اﻷﺳﺎﻟﻴﺐ ﻫﻲ
ﻟﻜﻦ أﺣﺪ ﱠ »ﺗﻘﻨﻴﺔ إﻋﺎدة املﻌﺎﻳﻨﺔ« ،ﻟﻬﺬ اﻟﻄﺮﻳﻘﺔ ﻣﺠﻤﻮﻋﺔ ﻣﺘﻨﻮﻋﺔ ﻣﻦ اﻻﺳﺘﺨﺪاﻣﺎت،
اﺳﺘﺨﺪاﻣﺎﺗﻬﺎ املﻬﻤﺔ ﻳﺘﻤﺜﻞ ﰲ ﺗﻘﺪﻳﺮ ﻋﺪ اﻟﻴﻘني املﺮﺗﺒﻂ ﺑﺎﻟﻨﻤﺎذج املﻌﻘﺪة؛ أ ﺗﺤﺪﻳﺪ ﻣﺪ
اﻻﺧﺘﻼ اﻟﺬ ﻳﻤﻜﻨﻨﺎ أ ﻧﺘﻮﻗﻊ أ ﻳﺼﺒﺢ ﻋﻠﻴﻪ اﻟﻨﻤﻮذج إذا ﻛﻨﱠﺎ ﻗﺪ أﺧﺬﻧﺎ ﻋﻴﻨﺔ ﺑﻴﺎﻧﺎت
ﻣﺨﺘﻠﻔﺔ .ﺗﻌﻤﻞ ﻃﺮ إﻋﺎدة املﻌﺎﻳﻨﺔ ﻣﻦ ﺧﻼ أﺧﺬ ﻋﻴﻨﺎت ﻓﺮﻋﻴﺔ ﻋﺸﻮاﺋﻴﺔ ﺑﺤﺠﻢ اﻟﻌﻴﻨﺔ
اﻷﺻﻠﻴﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﻌﻴﻨﺔ اﻷﺻﻠﻴﺔ ) ﻫﻮ ﻣﺎ ﻳﻌﻨﻲ أ ﺑﻌﺾ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت ﺳﺘﺴﺘﺨﺪ
أﻛﺜﺮ ﻣﻦ ﻣﺮة( .ﻳﺒﻨﻰ ﻧﻤﻮذج ﺟﺪﻳﺪ ،ﺑﺎﻟﺸﻜﻞ ﻧﻔﺴﻪ ﻟﻠﻨﻤﻮذج اﻟﺬ ﻳﺠﺮ ﺗﻘﻴﻴﻤﻪ ،ﻟﻜﻞ
ﻋﻴﻨﺔ ﻣﻦ ﻫﺬ اﻟﻌﻴﻨﺎت اﻟﻔﺮﻋﻴﺔ .ﻳﺒﺪ اﻷﻣﺮ ﻛﻤﺎ ﻟﻮ ﻛﺎ ﻟﺪﻳﻨﺎ ﻋﻴﻨﺎت ﻣﺘﻌﺪدة ،ﻛﻠﻬﺎ
ﺑﺎﻟﺤﺠﻢ ﻧﻔﺴﻪ ،ﻣﻦ اﻟﺘﻮزﻳﻊ اﻷﺻﲇ ،ﺗﻨﺘﺞ ﻛ ﱞﻞ ﻣﻨﻬﺎ ﻧﻤﻮذﺟﺎ ﻣﻘﺪﱠرا .ﻳﻤﻜﻦ ﺑﻌﺪ ذﻟﻚ
اﺳﺘﺨﺪا ﻣﺠﻤﻮﻋﺔ اﻟﻨﻤﺎذج ﺗﻠﻚ ملﻌﺮﻓﺔ ﻛﻴﻒ ﻛﺎ ﻳﻤﻜﻦ أ ﻳﺨﺘﻠﻒ ﻫﺬا اﻟﻨﻤﻮذج إذا ﻛﻨﱠﺎ
ﻗﺪ أﺧﺬﻧﺎ ﻋﻴﻨﺔ ﻣﺨﺘﻠﻔﺔ.
ﻏريت ﺑﻬﺎ ﻗﻮة اﻟﻜﻤﺒﻴﻮﺗﺮ ﻋﻠﻢ اﻹﺣﺼﺎء أﺣﺪ أﻗﻮ اﻷﻣﺜﻠﺔ اﻟﺘﻮﺿﻴﺤﻴﺔ ﻟﻠﻜﻴﻔﻴﺔ اﻟﺘﻲ ﱠ
اﻟﺤﺪﻳﺚ ،ﻳﻈﻬﺮ ﰲ ﺗﺄﺛري اﻷﺳﺎﻟﻴﺐ اﻟﻜﺜﻴﻔﺔ ﺣﺎﺳﻮﺑﻴٍّﺎ ﻋﲆ ﻃﺮ اﻻﺳﺘﺪﻻ اﻟﺒﺎﻳﺰﻳﺔ املﺬﻛﻮرة
ﰲ اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ .ﻓﻤﻦ أﺟْ ﻞ اﺳﺘﺨﺪا اﻟﻄﺮ اﻟﺒﺎﻳﺰﻳﺔ ﻋﻤﻠﻴٍّﺎ ،ﻣﻦ اﻟﴬ ر ﺣﺴﺎب
د ا ﱢ اﻟﺘﻮزﻳﻊ املﻌﻘﺪة )ﺑﻤﺼﻄﻠﺤﺎت رﻳﺎﺿﻴﺔ ،ﺗﻮﺟﺪ ﺣﺎﺟﺔ إﱃ ﺗﻜﺎﻣﻞ ﻋﺎﱄ اﻷﺑﻌﺎد( .ﻗﺪ
ﺳﺎﻋﺪت أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ ﻋﲆ ﺗﺠﻨﺐ ﻫﺬ املﺸﻜﻠﺔ؛ ﻓﺒﺪﻻ ﻣﻦ ﺗﻘﻴﻴﻢ اﻟﺘﻮزﻳﻌﺎت رﻳﺎﺿﻴٍّﺎ،
ﻳﺄﺧﺬ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ أﻋﺪادا ﻛﺒرية ﻣﻦ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ ﻣﻨﻬﺎ .ﻳﻤﻜﻦ ﺗﻘﺪﻳﺮ ﺧﺼﺎﺋﺺ
اﻟﺘﻮزﻳﻌﺎت ﻣﻦ ﻫﺬ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ ،ﺑﺎﻟﻄﺮﻳﻘﺔ ﻧﻔﺴﻬﺎ ﻻﺳﺘﺨﺪاﻣﻨﺎ ملﺘﻮﺳﻂ اﻟﻌﻴﻨﺔ
110
اﻟﺤﻮﺳﺒﺔ اﻹﺣﺼﺎﺋﻴﺔ
ﻟﺘﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ .أﺣﺪﺛﺖ ﻃﺮﻳﻘﺔ »ﻣﻮﻧﺖ ﻛﺎرﻟﻮ
املﺴﺘﻨﺪة إﱃ ﺳﻠﺴﻠﺔ ﻣﺎرﻛﻮ « ﺛﻮرة ﰲ ﻣﻤﺎرﺳﺔ اﻹﺣﺼﺎء اﻟﺒﺎﻳﺰﻳﺔ؛ إذ ﺣﻮﱠﻟﺘْﻬﺎ ﺟﻮﻫﺮﻳٍّﺎ ﻣﻦ
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﻓﻜﺎر اﻟﺠﺬﱠاﺑﺔ ﻣﻦ اﻟﻨﺎﺣﻴﺔ اﻟﻨﻈﺮﻳﺔ ،ﻟﻜﻨﻬﺎ ﻗﺎﴏة ﻋﲆ اﻟﻨﺤﻮ اﻟﻌﻤﲇ إﱃ
ﺗﻘﻨﻴﺔ ﻗﻮﻳﺔ ﻟﺘﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت.
ﻟﻔﺖ اﻟﻔﺼﻞ اﻟﺴﺎﺑﻖ اﻻﻧﺘﺒﺎ إﱃ ﻗﻮة اﻷﺳﺎﻟﻴﺐ اﻟﺮﺳﻮﻣﻴﺔ اﻟﺒﻴﺎﻧﻴﺔ ،ﻣﻦ أﺟﻞ اﻟﺘﻮﺿﻴﺢ
ﻟﻜﻦ ﻧﻘﻞ اﻟﻜﻤﺒﻴﻮﺗﺮ اﻷﺳﺎﻟﻴﺐ اﻟﺮﺳﻮﻣﻴﺔ اﻟﺒﻴﺎﻧﻴﺔ إﱃ ﻣﺴﺘﻮ ﺟﺪﻳﺪ ْ ﺗﻮﺻﻴﻞ اﻟﻔﻜﺮة،
ﺗﻤﺎﻣﺎ؛ ﻓﺒﻴﻨﻤﺎ ﻟﻢ ﻳﻜﻦ ﻟﺪﻳﻨﺎ ﰲ املﺎﴈ ﺳﻮ ﺻﻮر ﺛﺎﺑﺘﺔ ﺑﺎﻷﺑﻴﺾ اﻷﺳﻮد ،أﺻﺒﺢ ﻟﺪﻳﻨﺎ
اﻵ ﺻﻮرا ﻣﻠﻮﱠﻧﺔ ﻣﺘﺤﺮﻛﺔ ،ﺑﻞ أﻫﻢ ﻣﻦ ذﻟﻚ أﻧﻨﺎ ﻳﻤﻜﻨﻨﺎ اﻵ اﻟﺘﻔﺎﻋﻞ ﻣﺒﺎﴍة ﻣﻊ اﻟﺼﻮرة.
ﻛﻤﺜﺎ ﺑﺴﻴﻂ ﻓﺤﺴﺐ ،ﻣﻦ املﻤﻜﻦ ﻋﺮض أﺷﻜﺎ ﻣﺘﻌﺪدة ﰲ اﻟﻮﻗﺖ ذاﺗﻪ ،ﻳﺒني ﻛﻞ اﺣﺪ
ﻣﻨﻬﺎ اﻟﻌﻼﻗﺎت ﺑني أز اج ﻣﺨﺘﻠﻔﺔ ﻣﻦ املﺘﻐريات املﺮﺗﺒﻄﺔ ﺑﺎﻟﻜﺎﺋﻨﺎت ،ﻣﺜﻞ ﻣﺼﻔﻮﻓﺔ اﻟﺸﻜﻞ
اﻻﻧﺘﺸﺎر ﰲ اﻟﺸﻜﻞ ،2-6ﻟﻜﻦ ﰲ ﻫﺬ اﻟﺤﺎﻟﺔ ﺗﺮﺗﺒﻂ اﻷﺷﻜﺎ ﻣﻦ ﺧﻼ اﻟﻜﻤﺒﻴﻮﺗﺮ .ﰲ
ﻫﺬ اﻟﺤﺎﻟﺔ ،إ إﺑﺮاز أ ﺗﻐﻴري أ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻨﻘﺎط ﻳﻈﻬﺮ ﰲ اﻟﻮﻗﺖ ﻧﻔﺴﻪ ﰲ ﺟﻤﻴﻊ
اﻷﺷﻜﺎ .ﺗﺴﻤﺢ أد ات أﺧﺮ ﻟﻠﻤﺮء »ﺑﺎﻟﻄريا « ﻋﲆ ﻧﺤﻮ ﺗﻔﺎﻋﲇ ﺧﻼ ﻓﻀﺎء ﺑﻴﺎﻧﺎت
ﻋﺎﱄ اﻷﺑﻌﺎد ،ﻋﺎرﺿﺎ اﻟﺒﻴﺎﻧﺎت ﺑﻄﺮ ﻣﺘﻌﺪدة.
ﺑﻤﺎ أ اﻹﺣﺼﺎء ﻳﺴﺘﺨﺪ ﻋﲆ ﻣﺴﺘﻮ ﻋﺎملﻲ ،ﻷ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻳﻠﻌﺐ ﻣﺜﻞ ﻫﺬا اﻟﺪ ر
املﺤﻮر ،ﻓﺈﻧﻪ ﻟﻴﺲ ﻣﻦ املﺴﺘﻐﺮب أ ﺗﻄﻮﱠر ﺣﺰ ﺑﺮاﻣﺞ إﺣﺼﺎﺋﻴﺔ ﺳﻬﻠﺔ اﻻﺳﺘﻌﻤﺎ .
أﺻﺒﺤﺖ ﻣﻌﺎﻳري ﰲ ﻣﺠﺎﻻت ﺗﻄﺒﻴﻖ ﻣﻌﻴﻨﺔ .ﻟﻜﻦ ﻫﺬا ْ ﻳﻌ ﱡﺪ ﺑﻌﺾ ﻣﻨﻬﺎ ﻣﻬﻤٍّ ﺎ ﻟﺪرﺟﺔ أﻧﻬﺎ
ﻻ ﻳﻨﺒﻐﻲ أ ﻳﻨﺴﻴﻨﺎ أ اﻟﺘﻄﺒﻴﻖ اﻟﻔﻌﱠ ﺎ ﻟﻸد ات اﻹﺣﺼﺎﺋﻴﺔ ﻳﺘﻄﻠﺐ ﺗﻔﻜريا ﻣﺘﺄﻧﱢﻴﺎ؛ ﻓﻔﻲ
اﻟﻮاﻗﻊ ،ﰲ اﻷﻳﺎ اﻷ ﱃ ﻟﺘﻄﻮﻳﺮ اﻟﱪﻣﺠﻴﺎت اﻹﺣﺼﺎﺋﻴﺔ ،ﺧﴚ اﻟﺒﻌﺾ ﻣﻦ أ ﱠ ﺗﻮاﻓﺮ ﻣﺜﻞ ﻫﺬ
اﻷد ات ﻣﻦ ﺷﺄﻧﻪ أ ﻳﺰﻳﻞ اﻟﺤﺎﺟﺔ ﻟﻺﺣﺼﺎﺋﻴني؛ ﺣﻴﺚ إﻧﻪ »ﻳﻤﻜﻦ ﻷ ﺷﺨﺺ أ ﻳﻘﻮ
ﺑﺎﻟﺘﺤﻠﻴﻞ اﻹﺣﺼﺎﺋﻲ؛ ﻓﻜﻞ ﻣﺎ ﻋﻠﻴﻪ اﻟﻘﻴﺎ ﺑﻪ ﻫﻮ إﻋﻄﺎء اﻟﺘﻌﻠﻴﻤﺎت املﻨﺎﺳﺒﺔ ﻟﻠﻜﻤﺒﻴﻮﺗﺮ«.
ﻣﻊ ذﻟﻚ ،ﺛﺒﺖ أ اﻟﻌﻜﺲ ﺗﻤﺎﻣﺎ ﻫﻮ اﻟﺼﺤﻴﺢ؛ ﻫﻨﺎ ﻣﺰﻳﺪ ﻣﻦ اﻟﻄﻠﺐ ﻋﲆ اﻹﺣﺼﺎﺋﻴني
ﺑﻤﺮ ر اﻟﻮﻗﺖ .ﺗﻮﺟﺪ ﻋﺪة أﺳﺒﺎب ﻟﺬﻟﻚ.
أﺣﺪ اﻷﺳﺒﺎب ﻫﻮ أ اﻟﺒﻴﺎﻧﺎت ﺗﺴﺠﱠ ﻞ ﺗﻠﻘﺎﺋﻴٍّﺎ ﻋﲆ ﻧﺤﻮ ﻣﺘﺰاﻳﺪ؛ ﻓﻔﻲ اﻟﺤﻴﺎة اﻟﻴﻮﻣﻴﺔ،
ﰲ ﻛﻞ ﻣﺮة ﺗﻘﻮ ﻓﻴﻬﺎ ﺑﺈﺟﺮاء ﻋﻤﻠﻴﺔ ﴍاء ﺑﺒﻄﺎﻗﺔ اﻻﺋﺘﻤﺎ أ ﺗﺘﺴﻮ ﰲ ﻣﺘﺠﺮ ،ﺗﺨ ﱠﺰ
ﺗﻔﺎﺻﻴﻞ اﻟﻌﻤﻠﻴﺔ ﺗﻠﻘﺎﺋﻴٍّﺎ؛ ﰲ اﻟﻌﻠﻮ اﻟﻄﺒﻴﻌﻴﺔ ،ﺗﺴﺠﱢ ﻞ اﻷد ات اﻟﺮﻗﻤﻴﺔ اﻟﺨﻮاص اﻟﻔﻴﺰﻳﺎﺋﻴﺔ
اﻟﻜﻴﻤﻴﺎﺋﻴﺔ د اﻟﺤﺎﺟﺔ إﱃ ﺗﺪﺧﻞ ﺑﴩ ؛ ﰲ املﺴﺘﺸﻔﻴﺎت ،ﺗﺮاﻗﺐ اﻷﺟﻬﺰة اﻹﻟﻜﱰ ﻧﻴﺔ
املﺮﴇ ﺗﻠﻘﺎﺋﻴٍّﺎ؛ ﻣﺎ إﱃ ذﻟﻚ .إﻧﻨﺎ ﻧﻮاﺟﻪ ﺳﻴﻼ ﻣﻦ اﻟﺒﻴﺎﻧﺎت .ﻫﺬا ﻳﻤﺜﻞ ﻓﺮﺻﺔ ﻫﺎﺋﻠﺔ،
ﻟﻜﻦ ﻳﻠﺰ ﺟﻮد ﻣﻬﺎرات إﺣﺼﺎﺋﻴﺔ ﻟﻼﺳﺘﻔﺎدة ﻣﻨﻬﺎ. ْ
111
ﻋﻠﻢ اﻹﺣﺼﺎء
112
ﺗﻌﻠﻴﻘﺎت ﺧﺘﺎﻣﻴﺔ
) (١ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻛﻠﻤﺎ ﻛﺎ اﻛﺘﺸﺎ املﺮض ﰲ ﻗﺖ ﻣﺒﻜﺮ ،ﻃﺎﻟﺖ املﺪة اﻟﺘﻲ
ﺑﻐﺾ اﻟﻨﻈﺮ ﻋﻦ أ ﺗﺪﺧﻞ ﻃﺒﻲ؛ ﻓﺒﻄﺮﻳﻘﺔ أ ﺑﺄﺧﺮ ﻳﺤﺘﺎج ﻫﺬا إﱃ ﺳﻴﻌﻴﺸﻬﺎ املﺮﻳﺾ ،ﱢ
أ ﻳﺆﺧﺬ ﺑﻌني اﻻﻋﺘﺒﺎر.
ﱢ
) (٢ﻳﻌﻨﻲ اﻟﺘﺨﻔﻴﺾ ﺑﻨﺴﺒﺔ ٪٢٥أ اﻟﺴﻌﺮ ﺧﻔﺾ ﺑﻤﻘﺪار اﻟﺮﺑﻊ ،ﻟﻜﻦ ﻫﺬا ﻳﻌﻨﻲ أﻧﻪ
ﻟﻠﻌﻮدة إﱃ اﻟﺴﻌﺮ اﻷﺻﲇ ﻋﻠﻴﻚ زﻳﺎدة اﻟﺴﻌﺮ ﺑﻤﻘﺪار اﻟﺜﻠﺚ ) ،(٪٣٣ﻟﻴﺲ اﻟﺮﺑﻊ )(٪٢٥؛
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎ ،اﻟﺨﺼﻢ اﻟﺒﺎﻟﻎ ٪٢٥ﻋﲆ اﻟﺴﻌﺮ اﻷﺻﲇ ١٠٠ﺟﻨﻴﻪ اﺳﱰﻟﻴﻨﻲ ﻳﺆد إﱃ
اﻟﺴﻌﺮ املﻌﻠﻦ ٧٥ﺟﻨﻴﻬﺎ اﺳﱰﻟﻴﻨﻴٍّﺎ .ﻟﻠﻌﻮدة إﱃ اﻟﺴﻌﺮ اﻷﺻﲇ ﻋﻠﻴﻨﺎ زﻳﺎدة ﻫﺬا اﻟﺴﻌﺮ
ﺑﻤﺒﻠﻎ ٢٥ﺟﻨﻴﻬﺎ اﺳﱰﻟﻴﻨﻴٍّﺎ؛ أ ٪٣٣ﻣﻦ ٧٥ﺟﻨﻴﻬﺎ اﺳﱰﻟﻴﻨﻴٍّﺎ.
املﺘﻮﻗﻊ ﺳﻮ ﻳﺴﺘﻤﺮ ﰲ اﻟﺰﻳﺎدة ﺑﺎملﻌﺪ ﻧﻔﺴﻪ ﱠ ) (٣ﻫﺬا ﻳﻔﱰض أ ﻣﺘﻮﺳﻂ اﻟﻌﻤﺮ
ﻟﺰﻳﺎدﺗﻪ ﰲ املﺎﴈ.
) (٤إذا ﻛﺎ ﻃﻔﻞ اﺣﺪ ﻗﺪ ﻗﺘﻞ ﰲ ﻋﺎ ،١٩٥٠ﻓﺈ اﻟﻌﺒﺎرة ﺗﻌﻨﻲ أ اﺛﻨني ﻟﻘﻴﺎ
ﻣﴫﻋﻬﻤﺎ ﰲ ﻋﺎ ،١٩٥١أرﺑﻌﺔ ﰲ ﻋﺎ ،١٩٥٢ﺛﻤﺎﻧﻴﺔ ﰲ ﻋﺎ ،١٩٥٣ﺳﺘﺔ ﻋﴩ
ﰲ ﻋﺎ ،١٩٥٤ﻣﺎ إﱃ ذﻟﻚ .اﺳﺘﻤﺮار املﻀﺎﻋﻔﺔ ﺑﻬﺬ اﻟﻄﺮﻳﻘﺔ ﻳﻌﻨﻲ أﻧﻪ ﺑﺤﻠﻮ اﻟﻮﻗﺖ
اﻟﺮاﻫﻦ ﻳﻘﺘﻞ ﻣﻦ اﻷﻃﻔﺎ رﻣﻴﺎ ﺑﺎﻟﺮﺻﺎص ﺳﻨﻮﻳٍّﺎ ﻋﺪد أﻛﺜﺮ ﻣﻦ ﻋﺪد ﺳﻜﺎ اﻟﻌﺎﻟﻢ.
) ﻫﺬا املﺜﺎ ﻣﺄﺧﻮذ ﻣﻦ اﻟﻜﺘﺎب املﻤﺘﺎز اﻟﺬ أ ﱠﻟﻔﻪ ﺟﻮﻳﻞ ﺑﻴﺴﺖ ،اﻟﻮارد ﰲ ﻗﺴﻢ اﻟﻘﺮاءات
اﻹﺿﺎﻓﻴﺔ(.
ﻗﺮاءات إﺿﺎﻓﻴﺔ
اﻟﻔﺼﻞ اﻷ
A. R. Jadad and M. W. Enkin, Randomised Controlled Trials: Questions,
Answers and Musings, 2nd edn. (Malden, Massachusetts: Blackwell
Publishing, 2007).
Joel Best, Damned Lies and Statistics: Untangling Numbers from the Media,
Politicians, and Activists (Berkeley: University of California Press,
2001).
John Chambers, Greater or lesser statistics: a choice for future research,
Statistics and Computing, 3 (1993): 18–24.
Foundation for the Study of Infant Death. (http://www.fsid.org.uk/cot-
death.html). Accessed 6 April 2007.
Helen Joyce, Beyond reasonable doubt, Plus Magazine (2002). (http://
www.plus.maths.org/issue21/features/clark/index.html). Accessed
14 July 2008.
(http://www.sallyclark.org.uk/). Accessed 14 July 2008.
اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ
D. J. Hand, Information Generation: How Data Rule Our World (Oxford:
Oneworld, 2007).
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ
اﻟﻔﺼﻞ اﻟﺮاﺑﻊ
اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ
اﻟﻔﺼﻞ اﻟﺴﺎدس
116
ﻗﺮاءات إﺿﺎﻓﻴﺔ
117
ﻣﺼﺎدر اﻟﺼﻮر