Professional Documents
Culture Documents
42848630
42848630
ﺗﺄﻟﻴﻒ
دﻳﻔﻴﺪ ﺟﻴﻪ ﻫﺎﻧﺪ
ﺗﺮﺟﻤﺔ
أﺣﻤﺪ ﺷﻜﻞ
ﻣﺮاﺟﻌﺔ
ﻣﺤﻤﺪ ﻓﺘﺤﻲ ﺧﴬ
Statistics ﻋﻠﻢ اﻹﺣﺼﺎء
David J. Hand دﻳﻔﻴﺪ ﺟﻴﻪ ﻫﺎﻧﺪ
7 ﺗﻤﻬﻴﺪ
9 -١ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
27 -٢ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
41 -٣ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
59 -٤اﻻﺣﺘﻤﺎﻻت
77 -٥اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
93 -٦اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
109 -٧اﻟﺤﻮﺳﺒﺔ اﻹﺣﺼﺎﺋﻴﺔ
113 ﺗﻌﻠﻴﻘﺎت ﺧﺘﺎﻣﻴﺔ
115 ﻗﺮاءات إﺿﺎﻓﻴﺔ
119 ﻣﺼﺎدر اﻟﺼﻮر
ﲤﻬﻴﺪ
ﺗﻤﺜﱢﻞ اﻷﻓﻜﺎر واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ أﺳﺎس ﻛﻞ ﺟﻮاﻧﺐ اﻟﺤﻴﺎة اﻟﺤﺪﻳﺜﺔ ﺗﻘﺮﻳﺒًﺎ .ﰲ ﺑﻌﺾ
وﻟﻜﻦ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎن ﺗﻜﻮن اﻷﻓﻜﺎر واﻷدوات ْ اﻷﺣﻴﺎن ﻳﻜﻮن َدوْر اﻹﺣﺼﺎء واﺿﺤً ﺎ،
اﻹﺣﺼﺎﺋﻴﺔ ﻣﺨﺘﻔﻴﺔ ﰲ اﻟﺨﻠﻔﻴﺔ .وﰲ ﻛﻠﺘﺎ اﻟﺤﺎﻟﺘني ،ﺑﺴﺒﺐ اﻟﻮﺟﻮد اﻟﺸﺎﻣﻞ ﻟﻸﻓﻜﺎر
اﻹﺣﺼﺎﺋﻴﺔ ،ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻣﻦ ا ُملﻔِ ﻴﺪ ﻟﻠﻐﺎﻳﺔ أن ﻧﻤﺘﻠﻚ ﺑﻌﺾ اﻟﻔﻬْ ﻢ ﻟﻬﺎ .واﻟﻬﺪف ﻣﻦ
ﻫﺬا اﻟﻜﺘﺎب ﻫﻮ ﺗﻘﺪﻳﻢ ﻣﺜﻞ ﻫﺬا اﻟﻔﻬﻢ.
ﻣﺆﺳﻒ ﻳُﻀ ﱢﻠﻞ اﻟﻨﺎس ﻋﻦ ﻃﺒﻴﻌﺘﻪ اﻷﺳﺎﺳﻴﺔ. ﻳُﻌﺎﻧﻲ اﻹﺣﺼﺎء ﻣﻦ ﺳﻮء ﻓﻬْ ﻢ ﺟﻮﻫﺮي ِ
وﻫﺬا اﻻﻋﺘﻘﺎد اﻟﺨﺎﻃﺊ ﻫﻮ أﻧﻪ ﻳﺘﻄﻠﺐ ﻣﻬﺎرة ﺣﺴﺎﺑﻴﺔ ﻛﺒرية ﻣ ُِﻤ ﱠﻠﺔ ،وأﻧﻪ ،ﻧﺘﻴﺠﺔ ﻟﺬﻟﻚ،
ﺟﺎف وﻣﻤ ﱞﻞ ﻳﺨﻠﻮ ﻣﻦ اﻟﺨﻴﺎل أو اﻹﺑﺪاع أو اﻹﺛﺎرة .ﺑَﻴْ َﺪ أن ﻫﺬه ﺻﻮرة ﺧﺎﻃﺌﺔ ﺗﻤﺎﻣً ﺎ ﱞ ﻣﺠﺎل
ملﺠﺎل ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ؛ إذ إﻧﻬﺎ ﻣﺒﻨﻴﺔ ﻋﲆ ﺗﺼﻮر ﻳﺮﺟﻊ ﺗﺎرﻳﺨﻪ إﱃ أﻛﺜﺮ ﻣﻦ ﻧﺼﻒ
ﻗﺮن .ﺗﺤﺪﻳﺪًا ،ﺗﺘﺠﺎﻫﻞ ﻫﺬه اﻟﺼﻮرة ﺗﻤﺎﻣً ﺎ ﺣﻘﻴﻘﺔ أن أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ ﻗﺪ ﻏريت وﺟﻪ
ﻣﻌﺘﻤﺪ ﻋﲆ اﻟﺤﺴﺎب إﱃ ﻧﻈﺎم ﻗﺎﺋﻢ ﻋﲆ اﺳﺘﺨﺪام أدوات ِ املﺠﺎل ﺗﻤﺎﻣً ﺎ؛ إذ ﺣﻮﱠﻟﺘْﻪ ﻣﻦ ﻣﺠﺎل
ﻟﺴ ْﱪ اﻟﺒﻴﺎﻧﺎت ﺑﺤﺜًﺎ ﻋﻦ اﻟﻔﻬﻢ واﻟﺘﻨﻮﻳﺮ .ﻫﺬا ﻫﻮ ﻣﺎ ﻳﺘﻤﺤﻮر ﺣﻮﻟﻪ ﻣﺠﺎل ﺑﺮﻣﺠﻴﺔ ﻣﺘﻄﻮرة َ
ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ؛ اﺳﺘﺨﺪام اﻷدوات ملﺴﺎﻋﺪة اﻹدراك وﺗﻮﻓري ﻛ ﱟﻞ ﻣﻦ وﺳﺎﺋﻞ ﺗﺴﻠﻴﻂ
ﻈﻢ املﺴﺎﻋﺪة ﰲ ﻋﻤﻠﻴﺔ ﺻﻨﻊ اﻟﻘﺮار .ﻛﻞ وﺳﺒُﻞ اﻟﻔﻬْ ﻢ ،وأدوات اﻟﺮﺻﺪ واﻟﺘﻮﺟﻴﻪ ،وﻧ ُ ُ اﻟﻀﻮءُ ،
ﻫﺬا — وأﻛﺜﺮ — ﻳﻤﺜﱢﻞ ﺟﻮاﻧﺐ ﻣﺠﺎل ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ.
ﻳﻬﺪف ﻫﺬا اﻟﻜﺘﺎب إﱃ ﻣﻨْﺢ اﻟﻘﺎرئ ﻗ ْﺪ ًرا ﻣﻦ اﻟﻔﻬْ ﻢ ملﺠﺎل ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ .ﻣﻦ
اﻟﻮاﺿﺢ أﻧﻪ ﰲ ﻛﺘﺎب ﻗﺼري ﻣﺜﻞ ﻫﺬا اﻟﻜﺘﺎب ﻻ أﺳﺘﻄﻴﻊ اﻟﺨﻮض ﰲ اﻟﺘﻔﺎﺻﻴﻞ؛ ﻟﺬا ً
ﺑﺪﻻ
ﺑﺄﴎه ،ﰲ ﻣﺤﺎوﻟﺔ ﻟﻠﺘﻌﺒري ﻋﻦ ﻃﺒﻴﻌﺔ ﻠﺖ إ ْﻟﻘﺎءَ ﻧﻈﺮة ﻋﺎﻣﺔ ﻋﲆ املﺠﺎل ْ ﻓﻀ ُﻣﻦ اﻟﺘﻔﺼﻴﻞ ،ﱠ
أن ﻳَﻤﻨَﺢ اﻟﻜﺘﺎبُ اﻟﻘﺎرئ َ ﻓﻬﻤً ﺎ
اﻟﻔﻠﺴﻔﺔ واﻷﻓﻜﺎر واﻷدوات واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ .وآ ُﻣ ُﻞ ْ
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻜﻴﻔﻴﺔ ﻋﻤﻞ ﻣﺠﺎل ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ،وﻣﺪى أﻫﻤﻴﺘﻪ ،وأن ﻳُﻌ ﱢﺮﻓﻪ — ﺑﺎﻟﻄﺒﻊ — اﻟﺴﺒﺐ
ﰲ أﻫﻤﻴﺘﻪ.
ﻳﻌﺮض اﻟﻔﺼﻞ اﻷول ﺑﻌﺾ اﻟﺘﻌﺮﻳﻔﺎت اﻷﺳﺎﺳﻴﺔ ،ﻣﻊ ﺗﻮﺿﻴﺤﺎت ﺗﻬﺪف ﻟﻠﺘﻌﺮﻳﻒ
ﺑﻌﻀﺎ ﻣﻦ أﺑﺴﻂ ً ﺑﺒﻌﺾ ﻣﻦ ﻗﻮة اﻹﺣﺼﺎء وأﻫﻤﻴﺘﻪ وإﺛﺎرﺗﻪ .وﻳﻘﺪم اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ ٍ
ﺑﺎملﻠﺨﺼﺎت اﻷﺳﺎﺳﻴﺔ ﱠ اﻷﻓﻜﺎر اﻹﺣﺼﺎﺋﻴﺔ؛ اﻷﻓﻜﺎر اﻟﺘﻲ رﺑﻤﺎ ﻗﺎﺑﻠﻬﺎ اﻟﻘﺎرئ ﺑﺎﻟﻔﻌﻞ ،واملﻌﻨﻴﺔ
ﻟﻠﺒﻴﺎﻧﺎت .وﻳﺤﺬرﻧﺎ اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ ﻣﻦ أن ﺻﺤﺔ أي اﺳﺘﻨﺘﺎﺟﺎت ﻧﺴﺘَﻘِ ﻴﻬﺎ ِ
ﺗﻌﺘﻤﺪ ﻛﺜريًا ﻋﲆ
أﻳﻀﺎ اﺳﱰاﺗﻴﺠﻴﺎت ﻟﺠﻤﻊ اﻟﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ ﻛﻔﺎءة. ﺟﻮدة اﻟﺒﻴﺎﻧﺎت اﻟﺨﺎم ،وﻳﻮﺿﺢ ً
ﺳﺎﻗ ِﻲ اﻹﺣﺼﺎء ،ﻓﺈن ﺳﺎﻗﻬﺎ اﻷﺧﺮى ﻫﻲ اﻻﺣﺘﻤﺎل .وﻳﻘﺪم اﻟﻔﺼﻞ وإذا ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت إﺣﺪى َ
ﺳﺎﻗ ِﻲ اﻟﺒﻴﺎﻧﺎت واﻻﺣﺘﻤﺎﻻت ،ﻳﺒﺪأ اﻹﺣﺼﺎءاﻟﺮاﺑﻊ املﻔﺎﻫﻴﻢ اﻷﺳﺎﺳﻴﺔ ﻟﻼﺣﺘﻤﺎل .واﺳﺘﻨﺎدًا ﻋﲆ َ
ﰲ اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ املﴚ ،ﻣﻊ وﺻﻒ ﻛﻴﻔﻴﺔ اﺳﺘﻘﺎء املﺮء ﻟﻼﺳﺘﻨﺘﺎﺟﺎت واﻟﺘﻮﺻﻞ ﻻﺳﺘﺪﻻﻻت
ﻣﻦ اﻟﺒﻴﺎﻧﺎت .وﻳﻌﺮض اﻟﻔﺼﻞ اﻟﺴﺎدس َﻟﻤْ ﺤﺔ ﺧﺎﻃﻔﺔ ﻟﺒﻌﺾ اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ املﻬﻤﺔ،
ﻣﺒﻴﱢﻨًﺎ ﻛﻴﻒ أﻧﻬﺎ ﺗﺸ ﱢﻜﻞ ﺟﺰءًا ﻣﻦ ﺷﺒﻜﺔ ﻣﱰاﺑﻄﺔ ﻣﻦ اﻷﻓﻜﺎر واﻟﻄﺮق ﻻﺳﺘﺨﺮاج اﻟﻔﻬﻢ
ﻣﻦ اﻟﺒﻴﺎﻧﺎت .وأﺧريًا ،ﻳﺘﻨﺎول اﻟﻔﺼﻞ اﻟﺴﺎﺑﻊ ﺑﻌﺾ اﻟﻄﺮق اﻟﺘﻲ أﺛﱠﺮ ﺑﻬﺎ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻋﲆ
اﻹﺣﺼﺎء.
ً
ﻣﺠﻬﻮﻻ؛ ﻋﲆ أن أﺷﻜﺮ إﻣﻴﲇ ﻛﻴﻨﻮاي ،وﺷﻴﲇ ﺷﺎﻧﻮن ،وﻣﺎرﺗﻦ ﻛﺮودر ،وﻗﺎرﺋًﺎ أو ﱡد ْ
ﺣﺴﻨﺖ ﺗﻌﻠﻴﻘﺎﺗُﻬﻢ ﻫﺬا اﻟﻜﺘﺎبَ ﻛﺜريًا ،وﺳﺎﻋﺪَت ﻋﲆ اﻟﺘﻌﻠﻴﻖ ﻋﲆ ﻣﺴﻮﱠدات ﻫﺬا اﻟﻜﺘﺎب؛ إذ ﱠ
ﺑﺎق ﻫﻮ ﺧﻄﺌﻲ أﻧﺎ وﺣﺪي. ﺗﺴﻮﻳﺔ اﻟﻐﻤﻮض ﰲ اﻟﺘﻔﺴريات .وﺑﺎﻟﻄﺒﻊ ،أي ﻏﻤﻮض ٍ
دﻳﻔﻴﺪ ﺟﻴﻪ ﻫﺎﻧﺪ
إﻣﱪﻳﺎل ﻛﻮﻟﻴﺪج ،ﻟﻨﺪن
8
اﻟﻔﺼﻞ اﻷول
ﻫﺬا إذَن ﻫﻮ أول ﳾء أرﻳﺪ أن أوﺻﻠﻪ ﺧﻼل ﻫﺬا اﻟﻔﺼﻞ :اﻟﻘﻮة واﻹﺛﺎرة اﻟﻬﺎﺋﻠﺘﺎن
اﻟﻠﺘﺎن ﻳﻀﻤﻬﻤﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ،واملﺼﺪر اﻟﺬي ﺟﺎء ﻣﻨﻪ ،واﻷﺷﻴﺎء اﻟﺘﻲ ﻳَﻘﺪِر ﻋﲆ
ﻓﻌﻠﻬﺎ .واﻟﴚء اﻟﺜﺎﻧﻲ اﻟﺬي أﺗﻤﻨﱠﻰ ﺗﻮﺻﻴﻠﻪ ﻫﻮ اﻟﻮﺟﻮد اﻟﻜﲇ ﻟﻺﺣﺼﺎء؛ ﻓﻼ ﻳﻮﺟﺪ ﺟﺎﻧﺐ ﻣﻦ
ﻣﺒﻨﻲ ﻋﲆ ﻋﻠﻢ اﻹﺣﺼﺎء؛ ﱞ ﺟﻮاﻧﺐ اﻟﺤﻴﺎة اﻟﺤﺪﻳﺜﺔ ﻻ ﻳﻤﺴﻪ ﻋﻠﻢ اﻹﺣﺼﺎء .إن اﻟﻄﺐ اﻟﺤﺪﻳﺚ
ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،وُﺻﻔﺖ اﻟﺘﺠﺎرب اﻟﻌﺸﻮاﺋﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﻀﺒﻂ ﺑﺄﻧﻬﺎ »واﺣﺪة ﻣﻦ أدوات
اﻟﺒﺤﺚ اﻷﺑﺴﻂ واﻷﻗﻮى واﻷﻛﺜﺮ ﺛﻮرﻳﺔ «.وﻓﻬْ ﻢ اﻟﻌﻤﻠﻴﺎت اﻟﺘﻲ ﺗﻨﺘﴩ اﻷوﺑﺌﺔ ﻣﻦ ﺧﻼﻟﻬﺎ
ﻳﻤﻨﻌﻬﺎ ﻣﻦ اﻟﻔﺘﻚ ﺑﺎﻟﺒﴩ .ﺗﻌﺘﻤﺪ اﻟﺤﻜﻮﻣﺔ اﻟﻘﺪﻳﺮة ﻋﲆ اﻟﺘﺤﻠﻴﻞ اﻹﺣﺼﺎﺋﻲ اﻟﺪﻗﻴﻖ ﻟﻠﺒﻴﺎﻧﺎت
ﺣﺠﺔ ﻟﻺﴏار ﻋﲆ أن ﺟﻤﻴﻊ ﻣَ ﻦ ﻳﻜﻮﻧﻮن ً ﰲ وﺻﻒ اﻻﻗﺘﺼﺎد واملﺠﺘﻤﻊ؛ ورﺑﻤﺎ ﻳﻤﺜﻞ ﻫﺬا
ﰲ اﻟﺤﻜﻮﻣﺔ ﻳﻨﺒﻐﻲ أن ﻳَﺪرﺳﻮا دورات إﻟﺰاﻣﻴﺔ ﰲ اﻹﺣﺼﺎء .واملﺰارﻋﻮن وﺗﻘﻨﻴﱡﻮ اﻟﻐﺬاء
وﻣﺮاﻛﺰ اﻟﺘﺴﻮق ﻳﺴﺘﺨﺪﻣﻮن ﺟﻤﻴﻌً ﺎ اﻹﺣﺼﺎء ﻋﲆ ﻧﺤﻮ ﺿﻤﻨﻲ ﰲ ﺗﺤﺪﻳ ِﺪ ﻣﺎ ﻳﺰرﻋﻮﻧﻪ،
وﻛﻴﻔﻴﺔ ﻣﻌﺎﻟﺠﺘﻪ ،وﻛﻴﻔﻴﺔ ﺗﻐﻠﻴﻔﻪ وﺗﻮزﻳﻌﻪ .وﻳﺤﺪد اﻟﻬﻴﺪروﻟﻮﺟﻴﻮن ﻣﺪى اﻻرﺗﻔﺎع اﻟﻼزم
ﻟﺒﻨﺎء ﺣﻮاﺟﺰ اﻟﻔﻴﻀﺎﻧﺎت ﻣﻦ ﺧﻼل ﺗﺤﻠﻴﻞ إﺣﺼﺎﺋﻴﺎت اﻷرﺻﺎد اﻟﺠﻮﻳﺔ .وﻳﺒﻨﻲ املﻬﻨﺪﺳﻮن
أﻧﻈﻤﺔ اﻟﻜﻤﺒﻴﻮﺗﺮ ﺑﺎﺳﺘﺨﺪام إﺣﺼﺎﺋﻴﺎت املﻮﺛﻮﻗﻴﺔ ﻟﻀﻤﺎن ﻋﺪم ﺗﻌﻄﻠﻬﺎ ﻛﺜريًا .وﺗُﺒﻨَﻰ ﻧ ُ ُ
ﻈﻢ
ﻣﻌﻘﺪة ،ﺑﺤﻴﺚ ﺗﻌﻤﻞ ﺑﺸﻜﻞ ﻟﺤﻈﻲ )أي ﰲ ُﺮاﻗﺒَﺔ اﻟﺤﺮﻛﺔ اﻟﺠﻮﻳﺔ ﻋﲆ ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ ﱠ ﻣ َ
اﻟﺰﻣﻦ اﻟﺤﻘﻴﻘﻲ( .وﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻚ ﻗﺪ ﻻ ﺗﺪرك ذﻟﻚ ،ﻓﺈن اﻷﻓﻜﺎر واﻷدوات اﻹﺣﺼﺎﺋﻴﺔ
ٌ
ﻛﺎﻣﻨﺔ ﰲ ﻛﻞ ﺟﻮاﻧﺐ اﻟﺤﻴﺎة اﻟﺤﺪﻳﺜﺔ ﺗﻘﺮﻳﺒًﺎ.
10
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
ﺗﺴﻠﺴﻞ اﻟﺠﻴﻨﺎت ﻛﻠﻬﺎ ﺗﻄﺒﻴﻘﺎت ﻟﻺﺣﺼﺎء ،وﻣﻊ ذﻟﻚ رﺑﻤﺎ ﺗﺘﻄﻠﺐ أﺳﺎﻟﻴﺐَ وأدوات ﻣﺨﺘﻠﻔﺔ
ُ
ﺗﻌﻤﺪت اﺧﺘﻴﺎر ﻛﻠﻤﺔ ﻟﻠﻐﺎﻳﺔ .وﺛﻤﺔ ﳾء ﺗﺠﺪر ﻣﻼﺣﻈﺘﻪ ﺣﻮل ﻫﺬه اﻟﺘﻌﺮﻳﻔﺎت؛ ﻫﻮ أﻧﻨﻲ
ﺑﺪﻻ ﻣﻦ ﻋﻠﻢ؛ ﻓﺎﻟﺘﻜﻨﻮﻟﻮﺟﻴﺎ ﻫﻲ ﺗﻄﺒﻴﻖ ﻟﻠﻌﻠﻢ واﻛﺘﺸﺎﻓﺎﺗﻪ ،وﻫﺬا ﻫﻮ ﻣﺎﻫﻴﺔ »ﺗﻜﻨﻮﻟﻮﺟﻴﺎ« ً
اﻹﺣﺼﺎء؛ ﺗﻄﺒﻴﻖ ﻓﻬْ ﻤﻨﺎ ﻟﻜﻴﻔﻴﺔ اﺳﺘﺨﺮاج املﻌﻠﻮﻣﺎت ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،وﻓﻬﻤﻨﺎ ﻟﻌﺪم اﻟﻴﻘني.
وﻣﻊ ذﻟﻚ ،ﻳُﺸﺎر إﱃ اﻹﺣﺼﺎء أﺣﻴﺎﻧًﺎ ﻋﲆ أﻧﻪ ﻋﻠﻢ .ﰲ اﻟﻮاﻗﻊ ،إﺣﺪى املﺠﻼت اﻹﺣﺼﺎﺋﻴﺔ
ً
وﺗﺸﻮﻳﻘﺎ ﺗُﺴﻤﱠ ﻰ ﺑﺬﻟﻚ اﻻﺳﻢ ﻓﺤﺴﺐ» :اﻟﻌﻠﻮم اﻹﺣﺼﺎﺋﻴﺔ«. اﻷﻛﺜﺮ إﺛﺎرة
ُ
ﺗﻨﺎوﻟﺖ وﺣﺘﻰ اﻵن ﰲ ﻫﺬا اﻟﻜﺘﺎب — وﻋﲆ وﺟﻪ اﻟﺨﺼﻮص ﰲ اﻟﻔﻘﺮة اﻟﺴﺎﺑﻘﺔ —
»اﻹﺣﺼﺎء« ،وﻳﻮﺟﺪ ﳾء آﺧﺮ ﺳﻨﺘﻨﺎوﻟﻪ ﰲ ﻫﺬا اﻟﻜﺘﺎب ﻫﻮ »اﻹﺣﺼﺎﺋﻴﺎت« ،واﻹﺣﺼﺎﺋﻴﺔ ﻫﻲ
ﺣﻘﻴﻘﺔ رﻗﻤﻴﺔ أو ﻣﻠﺨﺺ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻣﻠﺨﺺ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗَ ِﺼﻒ ﺑﻌﺾ اﻟﺴﻜﺎن؛
رﺑﻤﺎ ﺣﺠﻢ اﻟﺴﻜﺎن أو ﻣﻌﺪﱠل املﻮاﻟﻴﺪ أو ﻣﻌﺪﱠل اﻟﺠﺮﻳﻤﺔ؛ إذن ،ﻳﺪور ﻫﺬا اﻟﻜﺘﺎب — ﻣﻦ
ﻧﺎﺣﻴﺔ — ﺣﻮل اﻟﺤﻘﺎﺋﻖ اﻟﺮﻗﻤﻴﺔ اﻟﻔﺮدﻳﺔ .وﻟﻜﻦ ﺑﺎملﻌﻨﻰ اﻟﺤﻘﻴﻘﻲ ﻟﻠﻐﺎﻳﺔ ﻓﻬﻮ ﻳﺪور ﺣﻮل
ﻣﺎ ﻫﻮ أﻛﺜﺮ ﻣﻦ ذﻟﻚ ﺑﻜﺜري؛ ﻓﻬﻮ ﻳﺪور ﺣﻮل ﻛﻴﻔﻴﺔ ﺟﻤْ ﻊ وﻣﻌﺎﻟﺠﺔ وﺗﺤﻠﻴﻞ واﺳﺘﻨﺘﺎج أﺷﻴﺎء
ﻣﻦ ﻫﺬه اﻟﺤﻘﺎﺋﻖ اﻟﺮﻗﻤﻴﺔ .وﻫﻮ ﻳﺪور ﺣﻮل اﻟﺘﻜﻨﻮﻟﻮﺟﻴﺎ ﻧﻔﺴﻬﺎ؛ وﻫﺬا ﻳَﻌﻨِﻲ أن اﻟﻘﺎرئ
اﻵﻣﻞ ﰲ أن ﻳ َِﺠ َﺪ ﺟﺪاول أﻋﺪاد ﰲ ﻫﺬا اﻟﻜﺘﺎب )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل »إﺣﺼﺎﺋﻴﺎت رﻳﺎﺿﻴﺔ«( ِ
اﻵﻣﻞ ﰲ اﻟﺘﻮﺻﻞ ﻟﻔﻬﻢ ﻛﻴﻔﻴﺔ اﺗﺨﺎذ اﻟﴩﻛﺎت ﻓﺴﻮف ﻳُﺼﺎب ﺑﺨﻴﺒﺔ أﻣﻞ .وﻟﻜﻦ اﻟﻘﺎرئ ِ
ﻟﻠﻘﺮارات ،وﻛﻴﻔﻴﺔ اﻛﺘﺸﺎف ﻋﻠﻤﺎء اﻟﻔﻠﻚ ﻷﻧﻮاع ﺟﺪﻳﺪة ﻣﻦ اﻟﻨﺠﻮم ،وﻛﻴﻔﻴﺔ ﺗﺤﺪﻳﺪ اﻟﺒﺎﺣﺜني
ﰲ ﻣﺠﺎل اﻟﻄﺐ ﻟﻠﺠﻴﻨﺎت املﺮﺗﺒﻄﺔ ﺑﻤﺮض ﻣﻌني ،وﻛﻴﻔﻴﺔ اﺗﺨﺎذ اﻟﺒﻨﻮك ﻗﺮا ًرا ﺑﻤﻨﺢ أو ﻋﺪم
َ
ﺑﻄﺎﻗﺔ اﺋﺘﻤﺎن ،وﻛﻴﻔﻴﺔ ﺗﺤﺪﻳﺪ ﴍﻛﺎت اﻟﺘﺄﻣني ﺗﻜﻠﻔﺔ اﻟﻘﺴﻂ ،وﻛﻴﻔﻴﺔ ﺑﻨﺎء ﺷﺨﺺ ﻣﺎ
ٍ ﻣﻨﺢ
ﻣﺮﺷﺤﺎت اﻟﱪﻳﺪ املﺰﻋِﺞ اﻟﺘﻲ ﺗﻤﻨﻊ اﻹﻋﻼﻧﺎت املﺰﻋِﺠﺔ ﻣﻦ اﻟﻮﺻﻮل إﱃ ﺻﻨﺪوق ﺑﺮﻳﺪك ﱢ
اﻹﻟﻜﱰوﻧﻲ ،وﻣﺎ إﱃ ذﻟﻚ؛ ﻓﺈﻧﻪ ﺳﻮف ﻳﺠﺪ ﻣﺄرﺑﻪ.
ﻳﺒني اﻟﻔﺎرق ﺑني ا ُملﺴﻤﱠ ﻴ َْني »اﻹﺣﺼﺎء« و»اﻹﺣﺼﺎﺋﻴﺎت«؛ ﻓﺎﻹﺣﺼﺎء ﻫﻮ ﻛﻞ ﻣﺎ ﺳﺒﻖ ﱢ
اﻟﻌﻠﻢ اﻷﺳﺎﳼ اﻟﺸﺎﻣﻞ ،أﻣﺎ اﻹﺣﺼﺎﺋﻴﺎت ﻓﻴ َ
ُﻘﺼﺪ ﺑﻬﺎ اﻟﺤﻘﺎﺋﻖ اﻟﺮﻗﻤﻴﺔ أو املﻠﺨﺼﺎت املﻨﺪرﺟﺔ
ﺗﺤﺖ املﻈ ﱠﻠﺔ اﻟﻜﱪى ﻟﻌﻠﻢ اﻹﺣﺼﺎء.
اﺳﺘﺨﺪﻣﺖ ﰲ ﺗﻌﺮﻳﻔﻲ اﻷول ﻛﻠﻤﺔ »اﻟﺒﻴﺎﻧﺎت« .وﻛﻠﻤﺔ »ﺑﻴﺎﻧﺎت« ﰲ اﻹﻧﺠﻠﻴﺰﻳﺔ Data ُ
ﻄﻰ« املﺸﺘﻘﺔ ﻣﻦ dareﺑﻤﻌﻨﻰ ﻣﺸﺘﻘﺔ ﻣﻦ اﻟﻜﻠﻤﺔ اﻟﻼﺗﻴﻨﻴﺔ datumﺑﻤﻌﻨﻰ »ﳾء ﻣُﻌ ً
ٍ
ﺣﺴﺎﺑﺎت أو ﻏريﻫﺎ ﻣﻦ ٍ
ﻗﻴﺎﺳﺎت أو »ﻳﻌﻄﻲ« .ﻋﺎدة ﻣﺎ ﺗﻜﻮن اﻟﺒﻴﺎﻧﺎت أرﻗﺎﻣً ﺎ؛ ﻧﺘﺎﺋﺞَ
ﺗﻤﺜﻴﻼ ﻣﺒﺴ ً
ﻄﺎ ملﺎ ﻧﺪرﺳﻪ. ً اﻟﻌﻤﻠﻴﺎت .وﻳﻤﻜﻦ اﻟﻨﻈﺮ ملﺜﻞ ﻫﺬه اﻟﺒﻴﺎﻧﺎت ﻋﲆ أﻧﻬﺎ ﺗﻘﺪﱢم
ﻓﺈذا ﻛﻨﱠﺎ ﻣﻬﺘﻤﱢ ني ﺑﺄﻃﻔﺎل املﺪارس ،وﺑﺨﺎﺻﺔ ﻗﺪرﺗﻬﻢ اﻷﻛﺎدﻳﻤﻴﺔ وﻣﺪى ﻣﻼءﻣﺘﻬﻢ ﻷﻧﻮاع
11
ﻋﻠﻢ اﻹﺣﺼﺎء
املِ ﻬَ ﻦ املﺨﺘﻠﻔﺔ ،رﺑﻤﺎ ﻧﺨﺘﺎر دراﺳﺔ اﻷرﻗﺎم اﻟﺘﻲ ﺗﺼﻒ ﻧﺘﺎﺋﺠﻬﻢ ﰲ ﻣﺨﺘﻠﻒ اﻻﺧﺘﺒﺎرات
واﻻﻣﺘﺤﺎﻧﺎت.
ورﺑﻤﺎ ﺗﻤﻨﺤﻨﺎ ﻫﺬه اﻷرﻗﺎم إﺷﺎرة ﺣﻴﺎل ﻗﺪراﺗﻬﻢ وﻣﻴﻮﻟﻬﻢ .ﺑﺎﻋﱰاف اﻟﺠﻤﻴﻊ ،ﻟﻦ
ﺷﺨﺼﺎ ﻣﺎ ﻛﺎن ً ٍ
ﺑﺒﺴﺎﻃﺔ إﱃ أن ﻳﻜﻮن ﻫﺬا اﻟﺘﻤﺜﻴﻞ ﻣﺜﺎﻟﻴٍّﺎ؛ ﻓﺮﺑﻤﺎ ﺗُ ِﺸري اﻟﺪرﺟﺔ املﻨﺨﻔﻀﺔ
ﺨﱪﻧﺎ ﺑﺎﻟﻜﺜري ﻋﻦ ﻗﺪرة اﻟﻄﻔﻞ، ﻳﺸﻌﺮ ﺑﺎملﺮض أﺛﻨﺎء اﻻﻣﺘﺤﺎن .وﻋﺒﺎرة »ﻟﻢ ﻳﺤﴬ« ﻻ ﺗُ ِ
وﻟﻜﻦ ﺗﺨﱪﻧﺎ ﻓﺤﺴﺐ أﻧﻪ ﻟﻢ ﻳ َُﺨ ْﺾ اﻻﻣﺘﺤﺎن .ﺳﺄﺗﺤﺪث ﺑﺸﻜﻞ أﻛﺜﺮ اﺳﺘﻔﺎﺿﺔ ﻋﻦ »ﺟﻮدة
اﻟﺒﻴﺎﻧﺎت« ﰲ وﻗﺖ ﻻﺣﻖ ،وﻫﻲ ﻣﻬﻤﺔ ﺑﺴﺒﺐ املﺒﺪأ اﻟﻌﺎم )اﻟﺬي ﻳﻨﻄﺒﻖ ﻋﲆ ﺟﻤﻴﻊ ﺟﻮاﻧﺐ
اﻟﺤﻴﺎة ،وﻟﻴﺲ ﻓﻘﻂ ﰲ اﻹﺣﺼﺎﺋﻴﺎت( اﻟﻘﺎﴈ ﺑﺄﻧﻪ إذا ﻛﺎﻧﺖ املﺎدة اﻟﺨﺎم اﻟﺘﻲ ﺗﻌﻤﻞ ﻋﻠﻴﻬﺎ
ردﻳﺌﺔ ،ﻓﺈن اﻟﻨﺘﺎﺋﺞ ﺳﺘﻜﻮن ردﻳﺌﺔ .ﻳﺴﺘﻄﻴﻊ اﻹﺣﺼﺎﺋﻴﻮن ﻓﻬْ ﻢ أﺷﻴﺎء ﻛﺜرية ﻣﺬﻫﻠﺔ ﻣﻦ
اﻷرﻗﺎم ،ﻟﻜﻨﻬﻢ ﻻ ﻳﻤﻜﻦ أن ﻳﺼﻨﻌﻮا املﻌﺠﺰات.
ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل ،ﻳﺒﺪو أن ﺣﺎﻻت ﻛﺜرية ﻻ ﺗُﻨﺘِﺞ ﺑﻴﺎﻧﺎت رﻗﻤﻴﺔ ﻣﺒﺎﴍة؛ ﻓﺎﻟﻜﺜري ﻣﻦ
اﻟﺒﻴﺎﻧﺎت اﻟﺨﺎم ﻗﺪ ﺗﻜﻮن ﰲ ﺷﻜﻞ ﺻﻮر أو ﻛﻠﻤﺎت أو ﺣﺘﻰ أﺷﻴﺎء ﻣﺜﻞ إﺷﺎرات إﻟﻜﱰوﻧﻴﺔ
أو ﺻﻮﺗﻴﺔ؛ وﻣﻦ ﺛﻢ ﻓﺈن ﺻﻮر اﻷﻗﻤﺎر اﻟﺼﻨﺎﻋﻴﺔ ﻟﻠﻤﺤﺎﺻﻴﻞ أو ﺗﻐﻄﻴﺔ اﻟﻐﺎﺑﺎت ا َمل ِﻄرية،
واﻷوﺻﺎف اﻟﻠﻔﻈﻴﺔ ﻟﻶﺛﺎر اﻟﺠﺎﻧﺒﻴﺔ اﻟﺘﻲ ﺗَﺤﺪث ﻋﻨﺪ ﺗﻨﺎول اﻟﺪواء ،واﻷﺻﻮات املﻠﻔﻮﻇﺔ
ُﻈﻬﺮ اﻟﻔﺤﺺ اﻟﺪﻗﻴﻖ أﻧﻪ ﻋﻨﺪﻣﺎ ﺗُﻘﺎس ﻋﻨﺪ اﻟﺘﺤﺪث؛ ﻻ ﺗﺄﺧﺬ ﻣَ ﻈﻬَ ﺮ اﻷرﻗﺎم .وﻣﻊ ذﻟﻚ ،ﻳ ِ
ﻫﺬه اﻷﺷﻴﺎء وﺗُﺴﺠﱠ ﻞ ،ﻓﺈﻧﻬﺎ ﺗُﱰﺟَ ﻢ إﱃ ﺗﻤﺜﻴﻼت رﻗﻤﻴﺔ أو إﱃ ﺗﻤﺜﻴﻼت ﻳﻤﻜﻦ أن ﺗﱰﺟَ ﻢ
ُ
ﺑﻌﺪ ذﻟﻚ إﱃ أرﻗﺎم؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺻﻮر اﻷﻗﻤﺎر اﻟﺼﻨﺎﻋﻴﺔ واﻟﺼﻮر اﻷﺧﺮى ﺗُﻤﺜﱠﻞ
ﺑﻤﻼﻳني اﻟﻌﻨﺎﴏ اﻟﺼﻐرية اﻟﺘﻲ ﺗُﺴﻤﱠ ﻰ وﺣﺪات اﻟﺒﻜﺴﻞ ،وﻛ ﱞﻞ ﻣﻨﻬﺎ ﻳﻮﺻﻒ ﻣﻦ ﺣﻴﺚ
اﻟﺸﺪة )اﻟﺮﻗﻤﻴﺔ( ﻟﻸﻟﻮان املﺨﺘﻠﻔﺔ اﻟﺘﻲ ﺗﺸ ﱢﻜﻠﻬﺎ .وﻳﻤﻜﻦ ﻣﻌﺎ َﻟﺠﺔ اﻟﻨﺺ ﰲ ﺻﻮرة ﺗﻌﺪاد
ﻟﻠﻜﻠﻤﺎت أو ﻣﻘﺎﻳﻴﺲ ﻟﻠﺘﺸﺎﺑﻪ ﺑني اﻟﻜﻠﻤﺎت واﻟﻌﺒﺎرات؛ وﻫﺬا ﻫﻮ ﻧﻮع اﻟﺘﻤﺜﻴﻞ املﺴﺘﺨﺪم
ﻣﻦ ﻗِ ﺒَﻞ ﻣﺤ ﱢﺮﻛﺎت اﻟﺒﺤﺚ ﻋﲆ ﺷﺒﻜﺔ اﻹﻧﱰﻧﺖ ﻣﺜﻞ ﺟﻮﺟﻞ .وﺗُﻤﺜﱠﻞ اﻟﻜﻠﻤﺎت املﻨﻄﻮﻗﺔ ﻣﻦ
ﺧﻼل اﻟﻜﺜﺎﻓﺎت اﻟﺮﻗﻤﻴﺔ ﻟﻸﺷﻜﺎل املﻮﺟﻴﺔ اﻟﺘﻲ ﺗﺸ ﱢﻜﻞ اﻷﺟﺰاء املﻔﺮدة ﻣﻦ اﻟﻜﻼم .وﻋﲆ ﻧﺤﻮ
ﻋﺎم ،رﻏﻢ أﻧﻪ ﻟﻴﺴﺖ ﺟﻤﻴﻊ اﻟﺒﻴﺎﻧﺎت أرﻗﺎﻣً ﺎ ،ﻓﺈن ﻣﻌﻈﻢ اﻟﺒﻴﺎﻧﺎت ﺗُﱰﺟَ ﻢ إﱃ ﺷﻜﻞ رﻗﻤﻲ ﰲ
ﻣﺮﺣﻠﺔ ﻣﺎ .وﻣﻌﻈﻢ اﻹﺣﺼﺎﺋﻴﺎت ﺗﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ. ٍ
12
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
ﻟﺴﺎن اﻟﻌﺪﻳﺪ ﻣﻦ اﻷﺷﺨﺎص ﺗﴫﻳﺤﺎت ﻣﻤﺎﺛﻠﺔ؛ ﻣﻨﻬﺎ» :ﻋﲆ ﻏﺮار اﻷﺣﻼم ،اﻹﺣﺼﺎﺋﻴﺎت
ﻫﻲ ﺷﻜﻞ ﻣﻦ أﺷﻜﺎل ﺗﺤﻘﻴﻖ اﻟﺮﻏﺒﺎت« )ﺟﻮن ﺑﻮدرﻳﺎر ،ﰲ ﻛﺘﺎب »ذﻛﺮﻳﺎت ﺟﻤﻴﻠﺔ«،
ﻠﺖﻣﺆﺳﻔﺔ ﺗﻤﺜ ﱠ ْ
ﱠت ﻋﲆ ﻧﺤﻮ ﺧﺎص إﱃ ﻧﺘﻴﺠﺔ ِ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ( ،و»… ﻋﺒﺎدة اﻹﺣﺼﺎﺋﻴﺎت أد ْ
ﰲ ﺟﻌﻞ ﻣﻬﻤﺔ اﻟﻜﺎذب اﻟﴫف أﺳﻬﻞ ﺑﻜﺜري« )ﺗﻮم ﺑﻮرﻧﺎم ،ﰲ ﻛﺘﺎب »ﻗﺎﻣﻮس اﻟﺘﻀﻠﻴﻞ«(،
»ﺧ َﺰﻋْ ِﺒﻼت« ﻣﺪﻋﻮﻣﺔ ﺑﺎﻷرﻗﺎم« )أودري ﻫﺎﺑريا ورﻳﺘﺸﺎرد روﻧﻴﻮن ،ﰲ و»اﻹﺣﺼﺎﺋﻴﺎت ﻫﻲ ُ
َ
ﺗﻼﻋﺒﺖ ﺑﻬﺎ، ﻛﺘﺎب »اﻹﺣﺼﺎﺋﻴﺎت اﻟﻌﺎﻣﺔ«( ،و»اﻹﺟﺮاءات اﻟﻘﺎﻧﻮﻧﻴﺔ ﻣﺜﻞ اﻹﺣﺼﺎﺋﻴﺎت؛ إذا
ﻳﻤﻜﻨﻚ أن ﺗﺜﺒﺖ أيﱠ ﳾء« )آرﺛﺮ ﻫﻴﲇ ،ﰲ رواﻳﺔ »املﻄﺎر«( ،وﻣﺎ إﱃ ذﻟﻚ.
أﻳﻀﺎ ﻣﺎ إذاﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻳﻮﺟﺪ ﻛﺜري ﻣﻦ اﻟﺸﻚ ﺣﻴﺎل اﻹﺣﺼﺎﺋﻴﺎت ،ورﺑﻤﺎ ﻧﺘﺴﺎءل ً
ﻛﺎن ﻫﻨﺎك ﻋﻨﴫ ﺧﻮف ﻣﻦ ﻫﺬا املﺠﺎل .ﻣﻦ املﺆﻛﺪ أن اﻹﺣﺼﺎﺋﻲ ﻏﺎﻟﺒًﺎ ﻣﺎ ﻳﻠﻌﺐ دور ﺷﺨﺺ
ﺗﻮﺧﻲ اﻟﺤَ ﺬَر ،ورﺑﻤﺎ ﺣﺘﻰ ﻳﻜﻮن ﺣﺎﻣ َﻞ اﻷﺧﺒﺎر اﻟﺴﻴﺌﺔ .واﻹﺣﺼﺎﺋﻴﻮن اﻟﻌﺎﻣﻠﻮن ﻳﺠﺐ ﻋﻠﻴﻪ ﱢ
ﰲ اﻟﺒﻴﺌﺎت اﻟﺒﺤﺜﻴﺔ — ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ﰲ ﻛﻠﻴﺎت اﻟﻄﺐ أو اﻟﺴﻴﺎﻗﺎت اﻻﺟﺘﻤﺎﻋﻴﺔ — رﺑﻤﺎ
ﻳﻜﻮن ﻋﻠﻴﻬﻢ ﴍح أن اﻟﺒﻴﺎﻧﺎت ﻏري ﻛﺎﻓﻴﺔ ﻟﻺﺟﺎﺑﺔ ﻋﻦ ﺳﺆال ﻣﻌني ،أو أن اﻟﺠﻮاب ﺑﺒﺴﺎﻃﺔ
ﻣﺆﺳﻔﺎ ﻣﻦ وﺟﻬﺔ ﻧﻈﺮ اﻟﺒﺎﺣﺚ ،وﻟﻜﻦ ً ﻟﻴﺲ ﻣﺎ أراد اﻟﺒﺎﺣﺚ َﺳﻤَ ﺎﻋَ ﻪ ،ورﺑﻤﺎ ﻳﻜﻮن ﻫﺬا أﻣ ًﺮا
ﻟﻴﺲ ﻣﻦ اﻹﻧﺼﺎف إﻟﻘﺎء اﻟﻠﻮم ﻋﲆ ﺣﺎﻣﻞ اﻟﺮﺳﺎﻟﺔ اﻹﺣﺼﺎﺋﻴﺔ.
ﰲ ﻛﺜري ﻣﻦ اﻟﺤﺎﻻت ،ﺗﺘﻮ ﱠﻟﺪ اﻟﺸﻜﻮك ﺑﺴﺒﺐ أوﻟﺌﻚ اﻟﺬﻳﻦ ﻳﺨﺘﺎرون اﻹﺣﺼﺎﺋﻴﺎت اﻧﺘﻘﺎﺋﻴٍّﺎ.
ﻓﺈذا ﻛﺎن ﻫﻨﺎك أﻛﺜﺮ ﻣﻦ ﻃﺮﻳﻘﺔ ﻟﺘﻠﺨﻴﺺ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،وﺗﻨﺒﻊ ﻛ ﱞﻞ ﻣﻨﻬﺎ ﺑﺎﻟﻨﻈﺮ
ﻗﻠﻴﻼ ،ﻓﺈن اﻷﺷﺨﺎص املﺨﺘﻠﻔني ﺣﻴﻨَﻬﺎ ﻳﻤﻜﻦ أن ﻳﺨﺘﺎروا اﻟﱰﻛﻴﺰ ﻋﲆ ﰲ ﺟﻮاﻧﺐ ﻣﺨﺘﻠﻔﺔ ً
ﻣﻠﺨﺼﺎت ﻣﺨﺘﻠﻔﺔ .وﺛﻤﺔ ﻣﺜﺎل ﻣﺤﺪد ﰲ إﺣﺼﺎﺋﻴﺎت اﻟﺠﺮﻳﻤﺔ؛ ﻓﻔﻲ ﺑﺮﻳﻄﺎﻧﻴﺎ ،رﺑﻤﺎ ﻳُﻌَ ﱡﺪ
أﻫﻢ ﻣﺼﺪر ﻹﺣﺼﺎﺋﻴﺎت اﻟﺠﺮﻳﻤﺔ ﻫﻮ »اﺳﺘﻘﺼﺎء اﻟﺠﺮﻳﻤﺔ اﻟﱪﻳﻄﺎﻧﻴﺔ« ،وﻫﺬا اﻻﺳﺘﻘﺼﺎء
ﻳُﻘﺪﱢر ﻣﺴﺘﻮى اﻟﺠﺮﻳﻤﺔ ﻋﻦ ﻃﺮﻳﻖ ﺳﺆال ﻋﻴﱢﻨﺔ ﻣﻦ اﻟﻨﺎس ﻣﺒﺎﴍة ﻋﻦ اﻟﺠﺮاﺋﻢ اﻟﺘﻲ وﻗﻌﻮا
ﺿﺤﺎﻳﺎ ﻟﻬﺎ ﺧﻼل اﻟﻌﺎم املﺎﴈ .ﰲ املﻘﺎﺑﻞ ،ﻓﺈن ﺳﻠﺴﻠﺔ »إﺣﺼﺎﺋﻴﺎت اﻟﺠﺮاﺋﻢ املﺴﺠﱠ ﻠﺔ«
ﺗﺸﻤﻞ ﺟﻤﻴﻊ اﻟﺠﺮاﺋﻢ ا ُملﺒ ﱠﻠﻎ ﻋﻨﻬﺎ إﱃ وزارة اﻟﺪاﺧﻠﻴﺔ واﻟﺘﻲ ﺳﺠﱠ ﻠﺘْﻬﺎ اﻟﴩﻃﺔ .وﺑﻄﺒﻴﻌﺘﻬﺎ،
ﻻ ﺗﺸﻤﻞ ﻫﺬه اﻹﺣﺼﺎﺋﻴﺎت ﺑﻌﺾ اﻟﺠﺮاﺋﻢ اﻟﺒﺴﻴﻄﺔ ،وأﻫﻢ ﻣﻦ ذﻟﻚ ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل أﻧﻬﺎ
ﺗﺴﺘﺜﻨﻲ اﻟﺠﺮاﺋﻢ اﻟﺘﻲ ﻟﻢ ﺗُﺒ ﱠﻠﻎ ﻋﻨﻬﺎ اﻟﴩﻃﺔ ﰲ املﻘﺎم اﻷول .وﺑﻮﺟﻮد ﻣﺜﻞ ﻫﺬه اﻻﺧﺘﻼﻓﺎت،
ﻟﻴﺲ ﻣﻦ املﺴﺘﻐ َﺮب أن اﻷرﻗﺎم ﻳﻤﻜﻦ أن ﺗﺨﺘﻠﻒ ﺑني ﻣﺠﻤﻮﻋﺘَﻲ اﻹﺣﺼﺎﺋﻴﺎت ،ﻟﺪرﺟﺔ أن
وﻓﻘﺎ ﻹﺣﺪى ﻣﺠﻤﻮﻋﺘَﻲ ﻓﺌﺎت ﻣﻌﻴﻨﺔ ﻣﻦ اﻟﺠﺮاﺋﻢ رﺑﻤﺎ ﺗﺒﺪو آﺧِ ﺬة ﰲ اﻟﺘﻨﺎﻗﺺ ﻋﲆ ﻣﺮ اﻟﺰﻣﻦ ً
وﻓﻘﺎ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻷﺧﺮى.اﻷرﻗﺎم ﻓﻴﻤﺎ ﺗﻜﻮن آﺧﺬة ﰲ اﻟﺘﺰاﻳﺪ ً
ﻣﺤﺘﻤﻼ آﺧﺮ ﻟﻠﺘﺸﻜﻚ ﰲ اﻹﺣﺼﺎﺋﻴﺎت؛ ً أﻳﻀﺎ ﺳﺒﺒًﺎأرﻗﺎم إﺣﺼﺎﺋﻴﺎت اﻟﺠﺮﻳﻤﺔ ﺗﻮﺿﺢ ً
ﻓﻌﻨﺪ اﺳﺘﺨﺪام ﻣﻘﻴﺎس ﻣﻌني ﻛﻤﺆﴍ ﻷداء ﻧﻈﺎ ٍم ﻣﺎ ،رﺑﻤﺎ ﻳﺨﺘﺎر اﻷﺷﺨﺎص اﺳﺘﻬﺪاف ﻫﺬا
13
ﻋﻠﻢ اﻹﺣﺼﺎء
وﻟﻜﻦ ﻋﲆ ﺣﺴﺎب ﺟﻮاﻧﺐ أﺧﺮى ﻣﻦ اﻟﻨﻈﺎم؛ وﻣﻦ ﺛﻢ ﻳﺘﺤﺴﻦ ْ املﻘﻴﺎس ،ﻓﻴُﺤﺴﻨﻮن ﻗﻴﻤﺘﻪ
املﻘﻴﺎس املﺨﺘﺎر ﻋﲆ ﻧﺤﻮ ﻏري ﻣﺘﻜﺎﻓﺊ ،وﻳﺼﺒﺢ ﻋﺪﻳﻢ اﻟﻔﺎﺋﺪة ﻛﻤﻘﻴﺎس ﻷداء اﻟﻨﻈﺎم؛ ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻦ ﻟﻠﴩﻃﺔ أن ﺗﻘﻠﻞ ﻣﻦ ﻣﻌﺪل ﴎﻗﺔ املﺘﺎﺟﺮ ﻣﻦ ﺧﻼل ﺗﺮﻛﻴﺰ ﻛﻞ ﻣﻮاردﻫﺎ
ﻋﲆ ﺗﻠﻚ اﻟﺠﺮﻳﻤﺔ ،ﻋﲆ ﺣﺴﺎب اﻟﺴﻤﺎح ﺑﺰﻳﺎدة أﻧﻮاع أﺧﺮى ﻣﻦ اﻟﺠﺮﻳﻤﺔ؛ وﻧﺘﻴﺠﺔ ﻟﺬﻟﻚ،
ﻓﺈن ﻣﻌﺪل ﴎﻗﺔ املﺘﺎﺟﺮ ﻳﺼﺒﺢ ﻋﺪﻳﻢ اﻟﻔﺎﺋﺪة ﻛﻤﺆﴍ ﻋﲆ ﻣﻌﺪل اﻟﺠﺮﻳﻤﺔ .وﻗﺪ ُﺳﻤﱢ ﻴﺖ
ﻫﺬه اﻟﻈﺎﻫﺮة ﺑﺎﺳﻢ »ﻗﺎﻧﻮن ﺟﻮدﻫﺎرت« ،ﺗﻴﻤﱡ ﻨًﺎ ﺑﺘﺸﺎرﻟﺰ ﺟﻮدﻫﺎرت ،وﻫﻮ ﻛﺒري ﻣﺴﺘﺸﺎرﻳﻦ
ً
ﺳﺎﺑﻘﺎ ﰲ »ﻣﴫف إﻧﺠﻠﱰا«.
اﻟﻬﺪف ﻣﻦ ﻛﻞ ذﻟﻚ ﻫﻮ أن املﺸﻜﻠﺔ ﻻ ﺗﻜﻤﻦ ﰲ اﻹﺣﺼﺎﺋﻴﺎت ﰲ ﺣﺪ ذاﺗﻬﺎ ،وﻟﻜﻦ ﰲ
اﺳﺘﺨﺪام ﺗﻠﻚ اﻹﺣﺼﺎﺋﻴﺎت ،وﺳﻮء ﻓﻬﻢ ﻛﻴﻔﻴﺔ إﻧﺘﺎج اﻹﺣﺼﺎﺋﻴﺎت ،وﻣﺎ ﺗﻌﻨﻴﻪ اﻹﺣﺼﺎﺋﻴﺎت
ٍّ
ﺣﻘﺎ .ﻟﻌﻞ ﻣﻦ اﻟﻄﺒﻴﻌﻲ ﺗﻤﺎﻣً ﺎ أن ﻧﻜﻮن ﻣﺘﺸ ﱢﻜﻜني ﺣﻴﺎل اﻷﺷﻴﺎء اﻟﺘﻲ ﻻ ﻧﻔﻬﻤﻬﺎ ،واﻟﺤﻞ ﻫﻮ
إزاﻟﺔ ﺳﻮء اﻟﻔﻬﻢ.
أﺳﺎﺳﺎ ﻧﺘﻴﺠﺔ ﻟﻄﺒﻴﻌﺔ اﻟﺘﻘﺪم اﻟﻌﻠﻤﻲ؛ وﻣﻦ ً ﻣﻊ ذﻟﻚ ،ﺛﻤﺔ ﺳﺒﺐ آﺧﺮ ﻟﻠﺘﺸﻜﻚ ﻳﻨﺸﺄ
ﺗﺒني أن ﻧﻮﻋً ﺎ ﻣﻌﻴﻨًﺎ ﻣﻦ
ﺻﺤﻴﻔﺔ ﻣﺎ ﻋﻦ دراﺳﺔ ﻋﻠﻤﻴﺔ ﱢ ٍ ﺛَﻢﱠ ،رﺑﻤﺎ ﻧﻘﺮأ ﰲ ﻳﻮم ﻣﻦ اﻷﻳﺎم ﰲ
اﻟﻄﻌﺎم ﺿﺎ ﱞر ﻟﻨﺎ ،وﰲ اﻟﻴﻮم اﻟﺘﺎﱄ ﺗُ ِﺸري إﱃ أﻧﻪ ﻣُﻔِ ﻴﺪ .ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل ﻳﻮ ﱢﻟﺪ ذﻟﻚ ا ْﻟﺘ ً
ِﺒﺎﺳﺎ؛
أيْ ﺷﻌﻮ ًرا ﺑﺄن اﻟﻌﻠﻤﺎء ﻻ ﻳﻌﺮﻓﻮن اﻟﺠﻮاب ،ورﺑﻤﺎ أﻧﻪ ﻻ ﻳﻤﻜﻦ اﻟﻮﺛﻮق ﺑﻬﻢ .وﺣﺘﻤً ﺎ ﻣﺜﻞ
ﻫﺬه اﻟﺘﺤﻘﻴﻘﺎت اﻟﻌﻠﻤﻴﺔ ﺗَﺴﺘﺨﺪم اﻟﺘﺤﻠﻴﻼت اﻹﺣﺼﺎﺋﻴﺔ ﻋﲆ ﻧﺤﻮ ﻣﻜﺜﱠﻒ؛ وﻣﻦ ﺛﻢ ﻓﺈن
ﺑﻌﻀﺎ ﻣﻦ ﻫﺬه اﻟﺸﻜﻮك ﻳﻨﺘﻘﻞ إﱃ اﻹﺣﺼﺎﺋﻴﺎت .وﻟﻜﻦ ﺟﻮﻫﺮ اﻟﺘﻘﺪم اﻟﻌﻠﻤﻲ ﻫﻮ ﺗﺤﻘﻴﻖ ً
ﺗﻐري ﻓﻬﻤﻨﺎ؛ ﻓﺮﻏﻢ أﻧﻨﺎ ﻛﻨﱠﺎ ﻧﻈﻦ ﰲ املﺎﴈ أن اﻟﺪﻫﻮن اﻟﻐﺬاﺋﻴﺔ ﺿﺎرة اﻛﺘﺸﺎﻓﺎت ﺟﺪﻳﺪة ﱢ
ﻟﻨﺎ ،ﻓﻘﺪ دﻓﻌَ ﻨﺎ ﻣﺰﻳﺪ ﻣﻦ اﻟﺪراﺳﺎت إﱃ إدراك أﻧﻪ ﻳﻮﺟﺪ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺪﻫﻮن؛ ﺑﻌﻀﻬﺎ
ﻣﻔﻴﺪ وﺑﻌﻀﻬﺎ ﺿﺎر .إن اﻟﺼﻮرة أﻛﺜﺮ ﺗﻌﻘﻴﺪًا ﻣﻤﺎ ﻛﻨﱠﺎ ﻧﻌﺘﻘﺪ ﰲ اﻟﺒﺪاﻳﺔ؛ ﻟﺬﻟﻚ ﻟﻴﺲ ﻣﻦ
املﺴﺘﻐ َﺮب أن ﺗﺆدﱢي اﻟﺪراﺳﺎت اﻷوﻟﻴﺔ إﱃ اﺳﺘﻨﺘﺎﺟﺎت ﺗﺒﺪو ﻣﺘﻀﺎرﺑﺔ وﻣﺘﻨﺎﻗﻀﺔ.
واﻟﺴﺒﺐ اﻟﺮاﺑﻊ ﻟﻠﺘﺸﻜﻚ ﻳﻨﺸﺄ ﻣﻦ ﺳﻮء ﻓﻬﻢ أوﱄ ﱟ ملﺒﺎدئ اﻹﺣﺼﺎء .وﻛﺘﻤﺮﻳﻦ ،رﺑﻤﺎ
ﻳﺤﺎول اﻟﻘﺎرئ أن ﻳﺤﺪد ﻣﺎ ﻫﻮ ﻣﺜري ﻟﻠﺸﻜﻮك ﰲ ﻛ ﱟﻞ ﻣﻦ اﻟﻌﺒﺎرات اﻟﺘﺎﻟﻴﺔ )اﻷﺟﻮﺑﺔ ﻣﻮﺟﻮدة
ﰲ اﻟﺘﻌﻠﻴﻘﺎت اﻟﺨﺘﺎﻣﻴﺔ ﰲ آﺧِ ﺮ اﻟﻜﺘﺎب(:
ﺗﻘﺮﻳﺮ ﻣﺎ أن اﻟﺘﺸﺨﻴﺺ املﺒ ﱢﻜﺮ ﻟﻠﻤﺮض ﻳﺆدي إﱃ اﻟﺘﻤﺘﻊ ﺑﻤﻌﺪﻻت ﻋﻤﺮﻳﺔ ٍ ) (١ﻧﻘﺮأ ﰲ
أﻃﻮل؛ ﻟﺬﻟﻚ ﻓﺈن ﺑﺮاﻣﺞ اﻟﻔﺤﺺ ﻣﻔﻴﺪة.
) (٢ﻗﻴﻞ ﻟﻨﺎ إن اﻟﺴﻌﺮ ا ُملﻌ َﻠﻦ ُﺧ ﱢﻔﺾ ﺑﺎﻟﻔﻌﻞ ﺑﻨﺴﺒﺔ ﺧﺼﻢ ٪٢٥ﻟﻠﻌﻤﻼء ﱠ
املﺆﻫﻠني ،وﻟﻜﻨﻨﺎ
ﻣﺆﻫﻠني؛ ﻟﺬﻟﻚ ﻋﻠﻴﻨﺎ دﻓﻊ ٪٢٥أﻛﺜﺮ ﻣﻦ اﻟﺴﻌﺮ ا ُملﻌ َﻠﻦ.
ﻟﺴﻨﺎ ﱠ
14
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
ﱠ
املﺘﻮﻗﻊ ﺳﻮف ﻳﺼﻞ إﱃ ١٥٠ﻋﺎﻣً ﺎ ﰲ اﻟﻘﺮن ا ُملﻘ ِﺒﻞ، ) (٣ﻧﺴﻤﻊ ﺗﻨﺒ ًﺆا ﺑﺄن ﻣﺘﻮﺳﻂ اﻟﻌﻤﺮ
اﺳﺘﻨﺎدًا إﱃ اﺳﺘﻘﺮاء ﺑﺴﻴﻂ ﻣﻦ اﻟﺰﻳﺎدات ﻋﲆ ﻣﺪى اﻟﺴﻨﻮات املﺎﺋﺔ املﺎﺿﻴﺔ.
) (٤ﻗﻴﻞ ﻟﻨﺎ» :ﻣﻨﺬ ﻋﺎم ،١٩٥٠ﺗَﻀﺎﻋَ ﻒ ﻛ ﱠﻞ ﻋﺎم ﻋﺪ ُد اﻷﻃﻔﺎل اﻷﻣﺮﻳﻜﻴني اﻟﺬﻳﻦ ﺗﻌﺮﺿﻮا
ﻟﺤﺎدث إﻃﻼق ﻧﺎر«.
أﺣﻴﺎﻧًﺎ ﻻ ﻳﻜﻮن ﺳﻮء اﻟﻔﻬﻢ أوﻟﻴٍّﺎ ﻟﻠﻐﺎﻳﺔ ،أو ﻋﲆ اﻷﻗﻞ ،ﻳﻨﺸﺄ ﻋﻦ ﻣﻔﺎﻫﻴﻢ إﺣﺼﺎﺋﻴﺔ
ﻋﻤﻴﻘﺔ ﻧﺴﺒﻴٍّﺎ .ﺳﻴﻜﻮن ﻣﺴﺘﻐﺮﺑًﺎ ﱠأﻻ ﻳﻮﺟﺪ ﺑﻌﺾ اﻷﻓﻜﺎر اﻟﻌﻤﻴﻘﺔ املﻨﺎﻗﻀﺔ ﻟﻠﺒﺪﻳﻬﺔ ﰲ
اﻹﺣﺼﺎء ﺑﻌﺪ أﻛﺜﺮ ﻣﻦ ﻗﺮن ﻣﻦ اﻟﺘﻄﻮر .وﺗﺘﻤﺜﻞ إﺣﺪى ﻫﺬه اﻷﻓﻜﺎر ﻓﻴﻤﺎ ﻳُﻌ َﺮف ﺑﺎﺳﻢ
»ﻣُﻐﺎ َﻟﻄﺔ املﺪﻋﻲ« ،وﺗﺼﻒ اﻟﺨﻠﻂ ﺑني اﺣﺘﻤﺎل أن ﺷﻴﺌًﺎ ﻣﺎ ﺳﻮف ﻳﻜﻮن ﺻﺤﻴﺤً ﺎ )ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎل ،املﺘﻬﻢ ﻣﺬﻧﺐ( إذا ﻛﺎن ﻟﺪﻳﻚ ﺑﻌﺾ اﻷدﻟﺔ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻗﻔﺎزات املﺪﻋَ ﻰ
ﻛﻨﺖ ﺗﻔﱰض أن املﺘﻬﻢ ﻋﻠﻴﻪ ﰲ ﻣﴪح اﻟﺠﺮﻳﻤﺔ( ،ﻣﻊ اﺣﺘﻤﺎل اﻟﻌﺜﻮر ﻋﲆ ﻫﺬا اﻟﺪﻟﻴﻞ إذا َ
ﻣﺬﻧﺐ .وﻫﺬا ﺧﻠﻂ ﺷﺎﺋﻊ — ﻟﻴﺲ ﰲ املﺤﺎﻛﻢ ﻓﺤﺴﺐ — وﺳﻮف ﻧﺘﻨﺎوﻟﻪ ﻋﲆ ﻧﺤﻮ أوﺛﻖ ﰲ
وﻗﺖ ﻻﺣﻖ.
ﻓﻤﻦ اﻟﻮاﺿﺢ أن اﻟﻠﻮم ﻻ ﻳ ََﻘﻊ ﻋﲆ إذا ﻛﺎن ﻫﻨﺎك ﺷﻚ وﻋﺪم ﺛﻘﺔ ﰲ اﻹﺣﺼﺎﺋﻴﺎتِ ،
اﻹﺣﺼﺎﺋﻴﺎت أو ﻛﻴﻔﻴﺔ ﺣﺴﺎﺑﻬﺎ ،وإﻧﻤﺎ ﻳﻘﻊ ﻋﲆ ﻃﺮﻳﻘﺔ اﺳﺘﺨﺪام ﺗﻠﻚ اﻹﺣﺼﺎﺋﻴﺎت .وﻟﻴﺲ
ﻣﻦ اﻟﻌﺪل إ ْﻟﻘﺎء اﻟﻠﻮم ﻋﲆ اﻟﻌﻠﻢ ،أو اﻹﺣﺼﺎﺋﻲ اﻟﺬي ﻳَﺴﺘﺨﺮج املﻌﻨﻰ ﻣﻦ اﻟﺒﻴﺎﻧﺎت؛ ﺑﻞ إن
اﻟﻠﻮم ﻳﻘﻊ ﻋﲆ أوﻟﺌﻚ اﻟﺬﻳﻦ ﻻ ﻳﻔﻬﻤﻮن ﻣﺎ ﺗﻘﻮﻟﻪ اﻷرﻗﺎم ،أو اﻟﺬﻳﻦ ﻳﺘﻌﻤﱠ ﺪون إﺳﺎءة اﺳﺘﺨﺪام
اﻟﻨﺘﺎﺋﺞ؛ ﻓﻨﺤﻦ ﻻ ﻧﻠﻮم اﻟﺒﻨﺪﻗﻴﺔ ﻋﲆ ﻗﺘْﻞ أﺣﺪﻫﻢ ،ﺑﻞ اﻟﺸﺨﺺ اﻟﺬي أﻃﻠﻖ اﻟﺮﺻﺎص ﻣﻦ
اﻟﺒﻨﺪﻗﻴﺔ ﻫﻮ ا َملﻠُﻮم.
) (4اﻟﺒﻴﺎﻧﺎت
رأﻳﻨﺎ أن اﻟﺒﻴﺎﻧﺎت ﻫﻲ املﺎدة اﻟﺨﺎم اﻟﺘﻲ ﺑُﻨِﻲ ﻋﻠﻴﻬﺎ اﻹﺣﺼﺎء ،وﻛﺬﻟﻚ ﻫﻲ املﺎدة اﻟﺨﺎم اﻟﺘﻲ
ﻧﻔﺴﻬﺎ ،وأن ﻫﺬه اﻟﺒﻴﺎﻧﺎت ﻋﺎد ًة ﻣﺎ ﺗﻜﻮن أرﻗﺎﻣً ﺎ .وﻣﻊﺗُﺤﺴﺐ ﻣﻨﻬﺎ اﻹﺣﺼﺎﺋﻴﺎت اﻟﻔﺮدﻳﺔ ُ
ذﻟﻚ ،ﻓﺈن اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﻮاﻗﻊ أﻛﺜﺮ ﻣﻦ ﻣﺠﺮد أرﻗﺎم .وﻟﻜﻲ ﺗﻜﻮن ﻣﻔﻴﺪة — أيْ ﺗﻤ ﱢﻜﻨﻨﺎ ﻣﻦ
اﻟﻘﻴﺎم ﺑﺒﻌﺾ اﻟﺘﺤﻠﻴﻼت اﻹﺣﺼﺎﺋﻴﺔ ذات املﻐﺰى — ﻳﺠﺐ أن ﺗﺮﺗﺒﻂ ﻫﺬه اﻷرﻗﺎم ﺑﻤﻌﻨًﻰ؛
ﻣﻌﺮﻓﺔ ﻣﺎ »ﺗَﻘِ ﻴﺴﻪ« اﻟﻘﻴﺎﺳﺎت ،وﻣﺎ ﺗﻢ ﻋَ ﺪﱡه ﻋﻨﺪﻣﺎ ﻳُﻌﺮض
ِ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ
ﻋﻠﻴﻨﺎ ﺗﻌﺪاد .وﻟﺘﺤﻘﻴﻖ ﻧﺘﺎﺋﺞ ﺻﺤﻴﺤﺔ ودﻗﻴﻘﺔ ﻋﻨﺪﻣﺎ ﻧﻘﻮم ﺑﺘﻨﻔﻴﺬ ﺗﺤﻠﻴﻞ إﺣﺼﺎﺋﻲ ،ﻧﺤﺘﺎج
أﻳﻀﺎ أن ﻧﻌﺮف ﺷﻴﺌًﺎ ﻋﻦ ﻛﻴﻔﻴﺔ اﻟﺤﺼﻮل ﻋﲆ ﻫﺬه اﻟﻘِ ﻴَﻢ .ﻫﻞ أﺟﺎب ﺟﻤﻴﻊ ﻣَ ﻦ ﺳﺄﻟﻨﺎﻫﻢ ً
15
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻋﲆ اﻻﺳﺘﺒﻴﺎن ،أم أﺟﺎب ﺑﻌﺾ اﻷﺷﺨﺎص ﻓﺤﺴﺐ؟ وإذا أﺟﺎب ﺑﻌﺾ اﻷﺷﺨﺎص ﻓﺤﺴﺐ،
ﺪﱄ َ ﺑﺒﻴﺎن ﺣﻮ َﻟﻬﺎ ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ أم إن اﻟﻌﻴﻨﺔ ﻓﻬﻞ ﻫﻢ ﻳﻤﺜﱢﻠﻮن املﺠﻤﻮﻋﺔ اﻟﺘﻲ ﻧﻮ ﱡد أن ﻧ ُ ِ
ﺑﻄﺮﻳﻘﺔ ﻣﺎ؟ ﻫﻞ ،ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺗَﺴﺘﺒﻌِ ﺪ ﻋﻴﱢﻨﺘﻨﺎ اﻟﺸﺒﺎبَ ﻋﲆ ﻧﺤﻮ ﻏري ﻣﺘﻜﺎﻓﺊ؟ ٍ ﻣﺸﻮﱠﻫﺔ
ﻣﻌﺮﻓﺔ ﻣﺎ إذا اﻧﺴﺤﺐ ﻣﺮﴇ ﻣﻦ اﻟﺘﺠﺎرب اﻟﴪﻳﺮﻳﺔ ،وﻣﺎ إذا ِ وﺑﺎملﺜﻞ ،ﻓﺈﻧﻨﺎ ﺑﺤﺎﺟﺔ إﱃ
ً
ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت ﻣُﺤﺪﱠﺛﺔ أم ﻻ .وﻧﺤﺘﺎج إﱃ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎﻧﺖ أداة اﻟﻘﻴﺎس ﻣﻮﺛﻮﻗﺎ ﺑﻬﺎ
أم ﻻ ،أو ﻫﻞ ﻛﺎﻧﺖ ﻟﺪﻳﻬﺎ ﻗﻴﻤﺔ ﻗﺼﻮى ﺗُﺴﺠﱠ ﻞ ﻋﻨﺪﻣﺎ ﺗﻜﻮن اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻣﺮﺗﻔِ ﻌﺔ ﻋﲆ
ﻧﺤﻮ ﻣﻔﺮط .ﻫﻞ ﻟﻨﺎ أن ﻧﻔﱰض أن ﻣﻌﺪل اﻟﻨﺒﺾ اﻟﺬي ﺳﺠﱠ ﻠﺘْﻪ املﻤﺮﺿﺔ دﻗﻴﻖ أم إﻧﻪ ﻗِ ﻴﻤﺔ
ﺗﻘﺮﻳﺒﻴﺔ ﻓﺤﺴﺐ؟ ﺛﻤﺔ ﻋﺪد ﻻ ﺣﴫ ﻟﻪ ﻣﻦ ﻣﺜﻞ ﻫﺬه اﻷﺳﺌﻠﺔ ﻳﻤﻜﻦ ﻃﺮﺣﻪ ،وﻧﺤﺘﺎج إﱃ
أن ﻧﻜﻮن ﻣﺘﻨﺒﱢﻬني ﻟﺘﻠﻚ اﻷﺳﺌﻠﺔ اﻟﺘﻲ ﻳﻤﻜﻦ أن ﺗﺆﺛﱢﺮ ﻋﲆ اﻟﻨﺘﺎﺋﺞ اﻟﺘﻲ ﻧﺴﺘﺨﻠﺼﻬﺎ .وإذا ﻟﻢ
آﻧﻔﺎ ﻣﴩوﻋﺔ ﺗﻤﺎﻣً ﺎ. ﻧﻔﻌﻞ ذﻟﻚ ،ﻓﺴﺘﺼﺒﺢ اﻟﺸﻜﻮك ﻣﻦ اﻟﻨﻮع املﺬﻛﻮر ً
ﺗﺘﻤﺜﱠﻞ إﺣﺪى ﻃﺮق اﻟﻨﻈﺮ إﱃ اﻟﺒﻴﺎﻧﺎت ﰲ اﻋﺘﺒﺎرﻫﺎ »أدﻟﺔ«؛ ﻓﺒﺪون ﺑﻴﺎﻧﺎت ،ﺗﺼﺒﺢ
ً
أﺳﺎﺳﻴﺔ ﺗﺮﺑﻂ ً
ﻣﻌﺮﻓﺔ وﺗﻮﻓﺮ اﻟﺒﻴﺎﻧﺎتﱢ أﻓﻜﺎرﻧﺎ وﻧﻈﺮﻳﺎﺗﻨﺎ ﺣﻴﺎل اﻟﻌﺎﻟﻢ ﻣﺤﺾ ﺗﻜﻬﻨﺎت.
أﻓﻜﺎرﻧﺎ وﻧﻈﺮﻳﺎﺗﻨﺎ ﺑﺎﻟﻮاﻗﻊ ،وﺗﺴﻤﺢ ﻟﻨﺎ ﺑﺎﻟﺘﺤﻘﻖ ﻣﻦ ﺻﺤﺔ ﻓﻬﻤﻨﺎ واﺧﺘﺒﺎره .ﺑﻌﺪ ذﻟﻚ
ﺗُﺴﺘﺨﺪَم اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ ملﻘﺎرﻧﺔ اﻟﺒﻴﺎﻧﺎت ﻣﻊ أﻓﻜﺎرﻧﺎ وﻧﻈﺮﻳﺎﺗﻨﺎ ،ﻟﻨﺮى ﻣﺪى ﺗﻮاﻓﻖ
ﺑﻌﻀﻬﺎ ﻣﻊ ﺑﻌﺾ .وﺳﻮء اﻟﺘﻮاﻓﻖ ﻳﺪﻓﻌﻨﺎ إﱃ اﻟﺘﻔﻜري ﻣﺮة أﺧﺮى وإﻋﺎدة ﺗﻘﻴﻴﻢ أﻓﻜﺎرﻧﺎ
وإﻋﺎدة ﺻﻴﺎﻏﺘﻬﺎ ﻟﻜﻲ ﺗﺘﻄﺎﺑﻖ ﻋﲆ ﻧﺤﻮ أﻓﻀﻞ ﻣﻊ اﻟﻮاﻗﻊ املﺮﺻﻮد .وﻟﻜﻦ رﺑﻤﺎ ﻳﺠﺪر وﺿﻊ
أﻳﻀﺎ أن ﻳﻜﻮن ﻧﺎﺗﺠً ﺎ ﻋﻦ ﺳﻮء ﺟﻮدة ﻣﻼﺣﻈﺔ ﺗﺤﺬﻳﺮﻳﺔ ﻫﻨﺎ؛ وﻫﻲ أن ﺳﻮء اﻟﺘﻮاﻓﻖ ﻳﻤﻜﻦ ً
اﻟﺒﻴﺎﻧﺎت .ﻳﺠﺐ أن ﻧﻜﻮن ﻣﻨﺘﺒﻬني ﻟﻬﺬا اﻻﺣﺘﻤﺎل؛ ﻓﺮﺑﻤﺎ ﺗﻜﻮن ﻧﻈﺮﻳﺎﺗﻨﺎ ﺳﻠﻴﻤﺔ وﻟﻜﻦ ﻗﺪ
ﺑﻄﺮﻳﻘﺔ ﻣﺎ .وﻣﻊ ذﻟﻚ ،ﻓﺎﻟﺘﻄﺎﺑﻖ اﻟﺠﻴﺪ ﺑني اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة ٍ ﺗﻜﻮن أدوات اﻟﻘﻴﺎس ﻣَ ً
ﻌﻴﺒﺔ
وﻣﺎ ﺗﻘﻮﻟﻪ ﻧﻈﺮﻳﺎﺗﻨﺎ ﻋﻤﱠ ﺎ ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن ﻋﻠﻴﻪ اﻟﺒﻴﺎﻧﺎت ﻳﺆﻛﺪ ﻋﻤﻮﻣً ﺎ ﻋﲆ أﻧﻨﺎ ﻋﲆ اﻟﻄﺮﻳﻖ
ﺣﻘﻴﻘﺔ ﻣﺎ ﻳﺠﺮي.َ اﻟﺼﺤﻴﺢ .وذﻟﻚ ﻳﺆﻛﺪ ﻋﲆ أن أﻓﻜﺎرﻧﺎ ﺗﻌﻜﺲ ٍّ
ﺣﻘﺎ
ﻳﺴﺘﺘﺒﻊ ذﻟﻚ ﺿﻤﻨًﺎ أﻧﻪ ﻟﻜﻲ ﺗﻜﻮن أﻓﻜﺎرﻧﺎ وﻧﻈﺮﻳﺎﺗﻨﺎ ذات ﻣﻐ ًﺰى ،ﻳﺠﺐ أن ﺗُﺴﻔِ ﺮ ﻋﻦ
ﺨﱪﻧﺎ اﻟﻨﻈﺮﻳﺎت ﺑﻤﺎ ﻳﻨﺒﻐﻲ ﺗﻮﻗﻌﺎت ﻳﻤﻜﻦ ﻣﻘﺎرﻧﺘﻬﺎ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﻮﺟﻮدة ﻟﺪﻳﻨﺎ .ﻓﺈذا ﻟﻢ ﺗُ ِ
أن ﻧﺘﻮﻗﻊ ﻣﻼﺣﻈﺘﻪ ،أو إذا ﻛﺎﻧﺖ اﻟﺘﻮﻗﻌﺎت ﻋﺎﻣﺔ ﻟﻠﻐﺎﻳﺔ ﺑﺤﻴﺚ إن أي ﺑﻴﺎﻧﺎت ﺳﻮف ﺗﺘﻮاﻓﻖ
ﻣﻊ ﻧﻈﺮﻳﺎﺗﻨﺎ ،ﻓﺈﻧﻬﺎ ﻟﻦ ﺗﻜﻮن ذات ﻓﺎﺋﺪة ﻛﺒرية؛ ﻓﺄي ﺑﻴﺎﻧﺎت ﺳﺘﺘﻮاﻓﻖ ﻣﻌﻬﺎ .وﻗﺪ اﻧﺘُﻘﺪ
اﻟﺘﺤﻠﻴﻞ اﻟﻨﻔﴘ واﻟﺘﻨﺠﻴﻢ ﻋﲆ ﻫﺬه اﻷﺳﺲ.
املﻌﻘﺪ؛ ﺑﺎﺗﺨﺎذ ﻗﺮارات ﺣﻮل ﱠ ﻛﻤﺎ ﺗﺴﻤﺢ اﻟﺒﻴﺎﻧﺎت ﻟﻨﺎ ﺑﺘﺤﺴﺲ ﻃﺮﻳﻘﻨﺎ ﻋﱪ اﻟﻌﺎﻟﻢ
أﻓﻀﻞ اﻹﺟﺮاءات اﻟﺘﻲ ﻳﺠﺐ اﻟﻘﻴﺎم ﺑﻬﺎ؛ ﻓﻨﺤﻦ ﻧﺄﺧﺬ ﻗﻴﺎﺳﺎﺗﻨﺎ ،وﻧﺤﺴﺐ املﺠﺎﻣﻴﻊ اﻟﻜﻠﻴﺔ،
16
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
17
ﻋﻠﻢ اﻹﺣﺼﺎء
رأَوْﻫﺎ ﻓﺮﻋً ﺎ ﻣﻦ اﻟﺮﻳﺎﺿﻴﺎت )إﻧﻬﺎ ﺗﺘﻌﺎﻣﻞ ﻣﻊ اﻷرﻗﺎم ،أﻟﻴﺲ ﻛﺬﻟﻚ؟( وﺑﺎﻟﻔﻌﻞ ،ﻻ ﻳﺰال
اﻹﺣﺼﺎﺋﻴﻮن ﰲ اﻟﺠﺎﻣﻌﺔ ﻏﺎﻟﺒًﺎ ﻣﺎ ﻳﺪرﺳﻮن اﻹﺣﺼﺎء داﺧﻞ أﻗﺴﺎم اﻟﺮﻳﺎﺿﻴﺎتَ .ﺷ ِﻬﺪ اﻟﻨﺼﻒ
اﻟﺜﺎﻧﻲ ﻣﻦ اﻟﻘﺮن اﻟﻌﴩﻳﻦ ﻇﻬﻮر اﻟﻜﻤﺒﻴﻮﺗﺮ ،وﻛﺎن ﻫﺬا اﻟﺘﻐﻴري ﻫﻮ اﻟﺬي ارﺗَ َﻘﻰ ﺑﺎﻹﺣﺼﺎء
ﻋﻤﻼ ﺻﻌﺒًﺎ إﱃ ﻋﻤﻞ ﻣُﻤْ ﺘِﻊ؛ ﻓﻘﺪ أزال اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﺤﺎﺟﺔ ﻻﻣﺘﻼك ﻣﻤﺎرﳼ اﻹﺣﺼﺎء ﻣﻦ ﻛﻮﻧﻬﺎ ً
ملﻬﺎرات ﺣﺴﺎﺑﻴﺔ ﺧﺎﺻﺔ ،ﻓﻠﻢ ﻳﻌﻮدوا ﺑﺤﺎﺟﺔ ﻟﻘﻀﺎء ﺳﺎﻋﺎت ﻃﻮﻳﻠﺔ ﰲ ﻣﻌﺎﻟﺠﺔ اﻷرﻗﺎم.
وﻫﺬا ﻣﻤﺎﺛﻞ ﻟﻠﺘﻐﻴري ﻣﻦ اﻟﺤﺎﺟﺔ إﱃ املﴚ إﱃ ﻛﻞ ﻣﻜﺎن ﻟﻠﻘﺪرة ﻋﲆ ﻗﻴﺎدة اﻟﺴﻴﺎرة؛ ﻓﺎﻟﺮﺣﻼت
أﺻﺒﺤﺖ اﻵن ﺗﺴﺘﻐﺮق دﻗﺎﺋﻖ ،واﻟﺮﺣﻼت اﻟﺘﻲ ﻛﺎﻧﺖ ِ اﻟﺘﻲ ﻛﺎﻧﺖ ﺗﺴﺘﻐﺮق ﰲ اﻟﺴﺎﺑﻖ أﻳﺎﻣً ﺎ
ﻃﻮﻳﻠﺔ ﻟﻠﻐﺎﻳﺔ ﻟﺪرﺟﺔ ﺗﻤﻨَﻊ اﻟﺘﻔﻜري ﻓﻴﻬﺎ أﺻﺒﺤﺖ اﻵن ﻣﻤﻜﻨﺔ.
أﻳﻀﺎ ﻇﻬﻮر ﻣﺪارس أﺧﺮى ﻟﺘﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت، ﺷﻬﺪ اﻟﻨﺼﻒ اﻟﺜﺎﻧﻲ ﻣﻦ اﻟﻘﺮن اﻟﻌﴩﻳﻦ ً
وﻟﻜﻦ ملﺠﺎﻻت أﺧﺮى ،ﺧﺎﺻﺔ ﻋﻠﻮم اﻟﻜﻤﺒﻴﻮﺗﺮ. ْ ﻻ ﺗﻌﻮد أﺻﻮﻟﻬﺎ ﻟﻌﻠﻢ اﻹﺣﺼﺎء اﻟﻜﻼﺳﻴﻜﻲ
وﺗﺸﻤﻞ ﻫﺬه املﺪارس اﻟﺘﻌﻠﻢ اﻵﱄ واﻟﺘﻌﺮف ﻋﲆ اﻷﻧﻤﺎط واﻟﺘﻨﻘﻴﺐ ﻋﻦ اﻟﺒﻴﺎﻧﺎت .وﺑﻴﻨﻤﺎ
ﺗﻄﻮرت ﻫﺬه اﻟﺘﺨﺼﺼﺎت اﻷﺧﺮى ،ﻛﺎﻧﺖ ﺗﺤﺪث ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ﺗﻮﺗﺮات ﺑني ﻫﺬه املﺪارس
املﺨﺘﻠﻔﺔ واﻹﺣﺼﺎء .وﻣﻊ ذﻟﻚ ،ﻓﺎﻟﺤﻘﻴﻘﺔ ﻫﻲ أن وﺟﻬﺎت اﻟﻨﻈﺮ املﺘﻔﺎوﺗﺔ اﻟﺘﻲ ﺗﻘﺪﱢﻣﻬﺎ ﻫﺬه
املﺪارس املﺨﺘﻠﻔﺔ ﺳﺎﻫﻤﺖ ﺟﻤﻴﻌﻬﺎ ﺑﴚء ﰲ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ،إﱃ ﺣ ﱢﺪ أن اﻹﺣﺼﺎﺋﻴني اﻟﺠﺪد
ﺗﻮﻓﺮﻫﺎ ﺟﻤﻴﻊ ﻫﺬه املﺠﺎﻻت .وﺳﺄذﻛﺮ ﰲ اﻟﻮﻗﺖ اﻟﺤﺎﱄ ﻳﺨﺘﺎرون ﺑﺤُ ﺮﻳﺔ ﻣﻦ اﻷدوات اﻟﺘﻲ ﱢ
ﺑﻌﺾ ﻫﺬه اﻷدوات ﰲ وﻗﺖ ﻻﺣﻖ .ﺑﻮﺿﻊ ﻫﺬا ﰲ اﻻﻋﺘﺒﺎر ،ﺳﻮف أﺗﺒﻨﱠﻰ ﰲ ﻫﺬا اﻟﻜﺘﺎب
ﺗﻌﺮﻳﻔﺎ واﺳﻌً ﺎ ﻟﻺﺣﺼﺎء ،ﻣﻬﺘﺪﻳًﺎ ﺑﺘﻌﺮﻳﻒ »ﻋﻠﻢ اﻹﺣﺼﺎء اﻷﻋﻈﻢ« اﻟﺬي ﻗﺪﱠﻣﻪ اﻹﺣﺼﺎﺋﻲ ً
اﻟﺒﺎرز ﺟﻮن ﺗﺸﺎﻣﱪز ،اﻟﺬي ﻗﺎل» :ﻳﻤﻜﻦ ﺗﻌﺮﻳﻒ ﻋﻠﻢ اﻹﺣﺼﺎء اﻷﻋﻈﻢ ﺑﺒﺴﺎﻃﺔ — ْ
وإن
ﻛﺎن ﻋﲆ ﻧﺤﻮ ﻏري ﻣُﺤ َﻜﻢ — ﺑﺄﻧﻪ ﻛﻞ ﻣﺎ ﻳﺘﻌﻠﻖ »ﺑﺎﻟﺘﻌﻠﻢ ﻣﻦ اﻟﺒﻴﺎﻧﺎت« ،ﻣﻦ اﻟﺘﺨﻄﻴﻂ أو
وﺿﻊ ﺣﺪود ﺑني ﺗﺨﺼﺼﺎت اﻟﺠﻤﻊ اﻷول ﺣﺘﻰ اﻟﻌﺮض أو اﻟﺘﻘﺮﻳﺮ اﻷﺧري «.أﻣﺎ ﻣﺤﺎوﻟﺔ ْ
ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت املﺨﺘﻠﻔﺔ ،ﻓﻬﻲ ﻋﻤﻠﻴﺔ ﻏري ﻣُﺠﺪِﻳﺔ وﻻ ﻃﺎﺋﻞ ﻣﻦ وراﺋﻬﺎ.
إذن ،ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ﻻ ﻳَﺪُور ﺣﻮل اﻟﺤﺴﺎب ،وإﻧﻤﺎ ﻳﺪور ﺣﻮل »اﻻﺳﺘﻘﺼﺎء«،
ﻒ ﻋﻠﻢ اﻹﺣﺼﺎء ﺑﺄﻧﻪ »ﺗﻄﺒﻴﻖ اﻷﺳﻠﻮب اﻟﻌﻠﻤﻲ« .وﻣﻊ أﻧﻨﺎ ﻣﺎ زﻟﻨﺎ ﻧﺠﺪ َﺻ َ
ﺑﻞ إن اﻟﺒﻌﺾ و َ
اﻧﻄﻼﻗﺎ ﻣﻦ أﻗﺴﺎم اﻟﺮﻳﺎﺿﻴﺎت ﰲً ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎن أن اﻟﻌﺪﻳﺪ ﻣﻦ اﻹﺣﺼﺎﺋﻴني ﻳﻌﻤﻠﻮن
أﻳﻀﺎ ﰲ ﻛﻠﻴﺎت اﻟﻄﺐ وأﻗﺴﺎم اﻟﻌﻠﻮم اﻻﺟﺘﻤﺎﻋﻴﺔ، أﴍت ً
آﻧﻔﺎ ،ﻓﺈﻧﻨﺎ ﻧ َ ِﺠﺪﻫﻢ ً ُ اﻟﺠﺎﻣﻌﺎت ﻛﻤﺎ
ﺑﻤﺎ ﰲ ذﻟﻚ اﻻﻗﺘﺼﺎد واﻟﻌﺪﻳﺪ ﻣﻦ اﻷﻗﺴﺎم اﻷﺧﺮى اﻟﺘﻲ ﺗﱰاوح ﺑني اﻟﻬﻨﺪﺳﺔ إﱃ ﻋﻠﻢ اﻟﻨﻔﺲ.
وﰲ ﺧﺎرج اﻟﺠﺎﻣﻌﺎت ،ﺗﻌﻤﻞ أﻋﺪاد ﻛﺒرية ﰲ اﻟﺤﻜﻮﻣﺔ واﻟﺼﻨﺎﻋﺔ ،وﰲ اﻟﻘﻄﺎع اﻟﺪواﺋﻲ،
واﻟﺘﺴﻮﻳﻖ ،واﻻﺗﺼﺎﻻت ،واﻟﺨﺪﻣﺎت املﴫﻓﻴﺔ ،وﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ املﺠﺎﻻت اﻷﺧﺮى ،ﻓﺠﻤﻴﻊ
18
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
»اﻟﱪﻳﺪ املﺰﻋﺞ« ﻫﻮ ﻣﺼﻄﻠﺢ ﻳُﺴﺘﺨﺪم ﻟﻮﺻﻒ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰوﻧﻲ ﻏري املﺮﻏﻮب ﻓﻴﻬﺎ
ﺮﺳﻠﺔ ﺗﻠﻘﺎﺋﻴٍّﺎ إﱃ اﻟﻌﺪﻳﺪ ﻣﻦ املﺘﺴ ﱢﻠ ِﻤني؛ ﻋﺎد ًة ﻣﺎ ﻳ َِﺼﻞ ﻋﺪدﻫﻢ إﱃ ﻣﻼﻳني املﺘﺴ ﱢﻠ ِﻤني .ﻫﺬه
ا ُمل َ
اﻟﺮﺳﺎﺋﻞ رﺳﺎﺋﻞ دﻋﺎﺋﻴﺔ ،وﻏﺎﻟﺒًﺎ ﻣﺎ ﺗﻜﻮن ﻣُﺰﻋِﺠﺔ ،ورﺑﻤﺎ ﺗﻜﻮن واﺟﻬﺎت ُملﺤﺘﺎﻟِني .وﻫﻲ
ﺗﺸﻤﻞ أﺷﻴﺎء ﻣﺜﻞ ﻋﺮوض دﻣﺞ اﻟﺪﻳﻮن ،وﺧﻄﻂ اﻟﺜﺮاء اﻟﴪﻳﻊ ،واﻷدوﻳﺔ اﻟﺘﻲ ﻻ ﺗُﴫَف إﻻ
ﺑﻮﺻﻔﺔ ﻃﺒﻴﺔ ،وﻧﺼﺎﺋﺢ ﺣﻮل ﺳﻮق اﻷﺳﻬﻢ ،وأدوات ﺟﻨﺴﻴﺔ ﻏﺮﻳﺒﺔ .واملﺒﺪأ اﻷﺳﺎﳼ ﰲ ﻫﺬه
راﺳﻠﺖ ﻋﺪدًا ﻛﺎﻓﻴًﺎ ﻣﻦ اﻟﻨﺎس ،ﻣﻦ املﺤﺘﻤﻞ أن ﻳُﺼ ِﺒﺢ ﺑﻌﻀﻬﻢ ﻣﻬﺘﻤٍّ ﺎ َ اﻟﺮﺳﺎﺋﻞ ﻫﻮ أﻧﻪ إذا
ُ
— أو ﻳﻨﺨﺪع — ﺑﻌﺮﺿﻚ .وﻣﺎ ﻟﻢ ﺗﻜﻦ اﻟﺮﺳﺎﺋﻞ آﺗﻴﺔ ﻣﻦ ﻣﻨﻈﻤﺎت ﻃﻠﺐ ﻣﻨﻬﺎ ﻋﲆ وﺟﻪ
اﻟﺘﺤﺪﻳﺪ ﻣﻌﻠﻮﻣﺎت ،ﻓﺈن ﻣﻌﻈﻤﻬﺎ ﻟﻦ ﻳﻜﻮن ﻣﺜريًا ﻟﻼﻫﺘﻤﺎم ،وﻟﻦ ﻳﺮﻏﺐ أﺣﺪ ﰲ ﺗﻀﻴﻴﻊ وﻗﺘﻪ
ﰲ ﻗﺮاءﺗﻬﺎ وﺣﺬﻓﻬﺎ .وﻫﻮ ﻣﺎ ﻳﻘﻮدﻧﺎ إﱃ ﻣﺮﺷﺤﺎت اﻟﱪﻳﺪ املﺰﻋﺞ؛ وﻫﻲ ﺑﺮاﻣﺞ ﺣﺎﺳﻮﺑﻴﺔ
ﺗﻔﺤﺺ ﺗﻠﻘﺎﺋﻴٍّﺎ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰوﻧﻲ اﻟﻮاردة وﺗﺤﺪد اﻟﺮﺳﺎﺋﻞ اﻟﺘﻲ ﻣﻦ املﺤﺘﻤﻞ أن
ﺗﻜﻮن ﻏري ﻣﺮﻏﻮب ﻓﻴﻬﺎ .وﻳﻤﻜﻦ ﺑﺮﻣﺠﺔ املﺮﺷﺤﺎت ﺑﺤﻴﺚ ﻳَﺤﺬف اﻟﱪﻧﺎﻣﺞ اﻟﺮﺳﺎﺋﻞ ﻏري
ﻻﺣﻘﺎ ،أو ﻳﺘﺨﺬ ﺑﻌﺾ اﻹﺟﺮاءات املﺮﻏﻮب ﻓﻴﻬﺎ ﺗﻠﻘﺎﺋﻴٍّﺎ ،أو ﻳﺮﺳﻠﻬﺎ إﱃ ﻣﺠﻠﺪ ﺗﺨﺰﻳﻦ ﻟﻠﻔﺤﺺ ً
19
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻷﺧﺮى املﻨﺎﺳﺒﺔ .ﺗﻮﺟﺪ ﺗﻘﺪﻳﺮات ﻣﺨﺘﻠﻔﺔ ﻟﻜﻤﻴﺔ اﻟﱪﻳﺪ املﺰﻋﺞ اﻟﺘﻲ ﺗُﺮﺳﻞ ،وﻟﻜﻦ ﰲ وﻗﺖ
ﻛﺘﺎﺑﺔ ﻫﺬا اﻟﻜﺘﺎب ،ﻳُﺸري أﺣﺪ اﻟﺘﻘﺪﻳﺮات إﱃ أﻧﻪ ﺗﺮﺳﻞ أﻛﺜﺮ ﻣﻦ ٩٠ﻣﻠﻴﺎر رﺳﺎﻟﺔ ﻣﻦ اﻟﱪﻳﺪ
ﻏري املﺮﻏﻮب ﻓﻴﻪ ﻛﻞ ﻳﻮم؛ وﺑﻤﺎ أن ﻫﺬا اﻟﻌﺪد ﻳﺮﺗﻔﻊ ارﺗﻔﺎﻋً ﺎ ﻛﺒريًا ﻛﻞ ﺷﻬﺮ ،ﻓﻤﻦ املﺮﺟﺢ
أن ﻳﻜﻮن أﻛﱪ ﺑﻜﺜري ﰲ وﻗﺖ ﻗﺮاءﺗﻚ ﻟﻬﺬا اﻟﻜﺘﺎب.
ﺛﻤﺔ ﺗﻘﻨﻴﺎت ﻋﺪﻳﺪة ملﻨﻊ اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ .ﺗﺘﺤﻘﻖ ﺑﻌﺾ اﻟﻄﺮق اﻟﺒﺴﻴﻄﺔ ﻟﻠﻐﺎﻳﺔ
ﻓﺤﺴﺐ ﻣﻦ وﺟﻮد ﻛﻠﻤﺎت أﺳﺎﺳﻴﺔ ﰲ اﻟﺮﺳﺎﻟﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﺎﻧﺖ رﺳﺎﻟﺔ ﺗﺘﻀﻤﻦ
ﻛﻠﻤﺔ » viagraﻓﻴﺎﺟﺮا« ،رﺑﻤﺎ ﺗُﺤﻈﺮ .وﻣﻊ ذﻟﻚ ،ﻓﺈن إﺣﺪى ﺧﺼﺎﺋﺺ رﺻﺪ اﻟﱪﻳﺪ املﺰﻋﺞ
ﻫﻲ أﻧﻬﺎ ﺗﺸﺒﻪ ﺳﺒﺎق اﻟﺘﺴﻠﺢ؛ ﻓﺒﻤﺠﺮد أن ﻳﺪرك املﺴﺌﻮﻟﻮن ﻋﻦ اﻟﺮﺳﺎﺋﻞ أن رﺳﺎﺋﻠﻬﻢ ﺣُ ﻈﺮت
ﺑﻄﺮﻳﻘﺔ ﻣﻌﻴﻨﺔ ،ﻳﺴﻌَ ﻮْن إﱃ أﺳﺎﻟﻴﺐ ﻟﻼﻟﺘﻔﺎف ﺣﻮل ﻫﺬه اﻟﻄﺮﻳﻘﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ
ﻳﺘﻌﻤﺪون ﻛﺘﺎﺑﺔ viagraﻋﲆ ﻧﺤﻮ ﺧﺎﻃﺊ ﰲ ﺻﻮرة v1agraأوv-iagra؛ ﺑﺤﻴﺚ ﻳﻤﻜﻨﻚ
اﻟﺘﻌﺮف ﻋﻠﻴﻬﺎ وﻟﻜﻦ دون أن ﻳﺘﻤﻜﻦ اﻟﱪﻧﺎﻣﺞ اﻟﺘﻠﻘﺎﺋﻲ ﻣﻦ اﻟﺘﻌﺮف ﻋﻠﻴﻬﺎ.
ﺗﺴﺘﻨﺪ أدوات رﺻﺪ اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ اﻷﻛﺜﺮ ﺗﻄﻮ ًرا ﻋﲆ ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ
ﻟﻠﻤﺤﺘﻮى اﻟﻜﻼﻣﻲ ﻟﺮﺳﺎﺋﻞ اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﺗَﺴﺘﺨﺪم
ﺗﻘﺪﻳﺮات ﻻﺣﺘﻤﺎﻻت وﺟﻮد ﻛﻠﻤﺎت ﻣﻌﻴﻨﺔ أو ﻣﺠﻤﻮﻋﺎت ﻣﻦ اﻟﻜﻠﻤﺎت اﻟﺘﻲ ﺗَﻈﻬَ ﺮ ﰲ رﺳﺎﺋﻞ
اﻟﱪﻳﺪ ﻏري املﺮﻏﻮب ﻓﻴﻪ .وﺑﻌﺪ ذﻟﻚ ،ﺗُﺼ ِﺒﺢ اﻟﺮﺳﺎﻟﺔ اﻟﺘﻲ ﺗﺤﺘﻮي ﻋﲆ اﻟﻜﺜري ﻣﻦ اﻟﻜﻠﻤﺎت
اﻟﻌﺎﻟﻴﺔ اﻻﺣﺘﻤﺎل ﻣﻮﺿ َﻊ َﺷ ﱟﻚ .وﺗﺒﻨﻲ اﻷدوات اﻷﻛﺜﺮ ﺗﻄﻮ ًرا ﻧﻤﺎذج ﻻﺣﺘﻤﺎﻟﻴﺔ أن ﻛﻠﻤﺔ واﺣﺪة
ﺳﺘﺘﺒﻊ ﻛﻠﻤﺔ أﺧﺮى ﰲ ﺗﺴﻠﺴﻞ؛ وﻣﻦ ﺛ َ ﱠﻢ ﺗﺘﻤﻜﻦ ﻣﻦ رﺻﺪ اﻟﻌﺒﺎرات وﻣﺠﻤﻮﻋﺎت اﻟﻜﻠﻤﺎت
املﺸﺒﻮﻫﺔ .ﻋﻼوة ﻋﲆ ذﻟﻚ ،ﺗﺴﺘﺨﺪم أﺳﺎﻟﻴﺐ أﺧﺮى ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ ﻟﻠﺼﻮر ﻟﺮﺻﺪ أﺷﻴﺎء
ﻣﺜﻞ ﻟﻮن اﻟﺒﴩة ﰲ اﻟﺼﻮرة املﺮﺳﻠﺔ ﻋﱪ اﻟﱪﻳﺪ اﻹﻟﻜﱰوﻧﻲ.
ﰲ ﻋﺎم ،١٩٩٩ﺧﻀﻌﺖ ﺳﺎﱄ ﻛﻼرك — وﻫﻲ ﻣﺤﺎﻣﻴﺔ ﺑﺮﻳﻄﺎﻧﻴﺔ ﺷﺎﺑﺔ — ﻟﻠﻤﺤﺎﻛﻤﺔ وأُدﻳﻨﺖ
وﺣُ ﻜﻢ ﻋﻠﻴﻬﺎ ﺑﺎﻟﺴﺠﻦ ﻣﺪى اﻟﺤﻴﺎة ﻟﻘﺘْﻠﻬﺎ ﻃﻔ َﻠﻴْﻬﺎ .ﺗﻮﰲ ﻃﻔﻠﻬﺎ اﻷول ﰲ ﻋﺎم ،١٩٩٦ﻋﻦ
ﻋﻤﺮ ﻳﺒﻠﻎ ١١أﺳﺒﻮﻋً ﺎ ،وﻣﺎت ﻃﻔﻠﻬﺎ اﻟﺜﺎﻧﻲ ﰲ ﻋﺎم ،١٩٩٨ﻋﻦ ﻋﻤﺮ ﻳﺒﻠﻎ ٨أﺳﺎﺑﻴﻊ.
واﻋﺘﻤﺪ اﻟﺤﻜﻢ ﻋﲆ ﻣﺎ أﺻﺒﺢ ﻧﻤﻮذﺟً ﺎ ﻟﺴﻮء ﻓﻬﻢ واﺳﺘﺨﺪام اﻹﺣﺼﺎﺋﻴﺎت ،ﻋﻨﺪﻣﺎ ادﱠﻋﻰ
ﻃﺒﻴﺐ اﻷﻃﻔﺎل اﻟﺴري روي ِﻣﺪو ،ﰲ دوره ﻛﺸﺎﻫﺪ ﺧﺒري ﻟﺼﺎﻟﺢ اﻻدﱢﻋﺎء ،أن اﺣﺘﻤﺎﻟﻴﺔ املﻮت
املﻔﺎﺟﺊ ﻟﻄﻔﻠني ﻛﺎﻧﺖ ١ﻣﻦ ﺑني ٧٣ﻣﻠﻴﻮن ﺣﺎﻟﺔ .وﻗﺪ ﺣﺼﻞ ﻋﲆ ﻫﺬا اﻟﺮﻗﻢ ﺑﺒﺴﺎﻃﺔ
ﻋﻦ ﻃﺮﻳﻖ ﴐب اﺣﺘﻤﺎﻟﻴﺔ ﺣﺎﻟﺘَﻲ اﻟﻮﻓﺎة ﻣﻌً ﺎ ﻋﲆ ﻧﺤﻮ ﻣﻨﻔﺼﻞ .وﺑﻘﻴﺎﻣﻪ ﺑﺬﻟﻚ ،وﻟﺠﻬﻠﻪ
20
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
ﺗﺠﺎﻫﻞ ﺗﻤﺎﻣً ﺎ ﺣﻘﻴﻘﺔ أن ﺣﺪوث واﺣﺪة ﻣﻦ ﺣﺎﻻت اﻟﻮﻓﺎة ﺗﻠﻚ ﰲ أي َ ﺑﺄﺳﺎﺳﻴﺎت اﻹﺣﺼﺎء،
أﴎة ﻣﻦ املﺮﺟﺢ أن ﻳﻌﻨﻲ ارﺗﻔﺎع اﺣﺘﻤﺎﻟﻴﺔ ﺣﺪوث وﻓﺎة أﺧﺮى.
ﺗُ ﱢﺒني دراﺳﺔ اﻟﺒﻴﺎﻧﺎت اﻟﺴﺎﺑﻘﺔ أن اﺣﺘﻤﺎل ﺗﻌ ﱡﺮض أي ﻃﻔﻞ ﻣﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ ﻟﻠﻤﻮت
املﻔﺎﺟﺊ ﰲ أﴎة ﻣﺜﻞ أﴎة ﻛﻼرك ﻳﺒﻠﻎ ﺣﻮاﱄ .٨٥٠٠ / ١وإذا اﻓﱰﺿﻨﺎ ﺑﺎﻟﺘﺒﻌﻴﺔ أن وﻗﻮع
ﺣﺎﻟﺔ وﻓﺎة ﻣﺜﻞ ﻫﺬه ﻻ ﻳُﻐري اﺣﺘﻤﺎل وﻗﻮع ﺣﺎﻟﺔ أﺧﺮى ،ﻓﺈن ﻓﺮﺻﺔ وﻗﻮع ﺣﺎﻟﺘني ﻣﻦ ﻫﺬه
اﻟﻮﻓﻴﺎت ﰲ اﻷﴎة ﻧﻔﺴﻬﺎ ﺳﺘﻜﻮن ٨٥٠٠ / ١ﻣﴬوﺑًﺎ ﰲ ٨٥٠٠ / ١؛ أي واﺣﺪًا ﻣﻦ ٧٣
ﻣﻠﻴﻮﻧًﺎ .ﺑَﻴْ َﺪ أن ﻫﺬا اﻻﻓﱰاض ﺟﺮيء ،وﻳُﺸري اﻟﺘﺤﻠﻴﻞ اﻹﺣﺼﺎﺋﻲ اﻟﺪﻗﻴﻖ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺴﺎﺑﻘﺔ
ﺛﺎن ﻛﺜريًا ﻋﻨﺪ وﻗﻮع ﺣﺎﻟﺔ ﻣﻤﺎﺛﻠﺔ ﻗﺒﻞ إﱃ أﻧﻪ ﰲ اﻟﻮاﻗﻊ ﺗﺰداد ﻓﺮﺻﺔ ﺣﺪوث ﻣﻮت ﻣﻔﺎﺟﺊ ٍ
ذﻟﻚ ﺑﺎﻟﻔﻌﻞ .وﰲ اﻟﻮاﻗﻊ ،ﺗﺸري اﻟﺤﺴﺎﺑﺎت إﱃ أن اﻟﻌﺪﻳﺪ ﻣﻦ ﺣﺎﻻت اﻟﻮﻓﺎة املﺘﻌﺪﱢدة ﺗﻠﻚ
ُﺘﻮﻗﻊ ﺣﺪوﺛﻬﺎ ﻛﻞ ﻋﺎم ﰲ دوﻟﺔ ﺑﺤﺠﻢ املﻤﻠﻜﺔ املﺘﺤﺪة .وﻳﻘﻮل املﻮﻗﻊ اﻹﻟﻜﱰوﻧﻲ ﻳﻨﺒﻐﻲ أن ﻳ ﱠ
ملﺆﺳﺴﺔ دراﺳﺔ أﺳﺒﺎب ﻣﻮت اﻷﻃﻔﺎل» :ﻣﻦ اﻟﻨﺎدر ﺟﺪٍّا ﺣﺪوث املﻮت املﻔﺎﺟﺊ ﻣﺮﺗني ﰲ
اﻷﴎة ﻧﻔﺴﻬﺎ ،ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أن اﺿﻄﺮاﺑًﺎ وراﺛﻴٍّﺎ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن — ﻣﺜﻞ وﺟﻮد ﺧﻠﻞ
ﻣﻮت أﻛﺜ َﺮ ﻣﻦ رﺿﻴﻊ ﻋﲆ ﻧﺤﻮ ﻏري ﻣﺘﻮﻗﻊ«. أﻳﴤ — ﻗﺪ ﻳﺴﺒﺐ َ
ﰲ ﻗﻀﻴﺔ ﺳﺎﱄ ﻛﻼرك ،ﻛﺎن ﻳﻮﺟﺪ ﻣﺰﻳﺪ ﻣﻦ اﻷدِ ﱠﻟﺔ اﻟﺘﻲ ﺗُ ِﺸري إﱃ ﺑﺮاءﺗﻬﺎ ،وﰲ اﻟﻨﻬﺎﻳﺔ
ً
ﻣﻌﺮوﻓﺎ أﻧﻬﺎ ﺗﺴﺒﱢﺐ ﻣﻮت أﺻﺒﺢ ﻣﻦ اﻟﻮاﺿﺢ أن اﺑﻨَﻬﺎ اﻟﺜﺎﻧﻲ ﻛﺎن ﻳُﻌﺎﻧِﻲ ﻋَ ْﺪوَى ﺑﻜﺘريﻳﺔ
اﻟﺮﺿﻴﻊ املﻔﺎﺟﺊ .وأﻃﻠﻖ ﴎاح اﻟﺴﻴﺪة ﻛﻼرك ﺑﻌﺪ ذﻟﻚ ﰲ اﻻﺳﺘﺌﻨﺎف ﰲ ﻋﺎم .٢٠٠٣وﻣﻦ
املﺄﺳﺎوي أﻧﻬﺎ ﺗﻮﻓﻴﺖ ﰲ ﻣﺎرس ﻣﻦ ﻋﺎم ٢٠٠٧ﻋﻦ ﻋﻤﺮ ﻳﺒﻠﻎ ٤٢ﻋﺎﻣً ﺎ ﻓﺤﺴﺐ .وﻳﻮﺟﺪ
ﻣﺰﻳﺪ ﻣﻦ اﻟﺘﻔﺎﺻﻴﻞ ﻋﻦ ﺳﻮء اﻟﻔﻬﻢ اﻟﺮﻫﻴﺐ وﺳﻮء اﺳﺘﺨﺪام اﻹﺣﺼﺎﺋﻴﺎت ﰲ ﻣﻘﺎل ﻣﻤﺘﺎز
ﻛﺘﺒﺘْﻪ ﻫﻴﻠني ﺟﻮﻳﺲ ﻋﲆ املﻮﻗﻊ املﺬﻛﻮر ﰲ ﻗﺴﻢ اﻟﻘﺮاءات اﻹﺿﺎﻓﻴﺔ ﰲ ﻧﻬﺎﻳﺔ ﻫﺬا اﻟﻜﺘﺎب.
21
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻓﺎرﻏﺔ ﺷﺎﺳﻌﺔ .وﻟﻜﻦ ﻛﻴﻒ اﻛﺘُﺸﻒ ﻛﻞ ﻫﺬا؟ ﻓﺤﺘﻰ ﻟﻮ اﺳﺘﺨﺪﻣﻨﺎ ﺗﻠﺴﻜﻮﺑﺎت ﻗﻮﻳﺔ ﻟﻠﻨﻈﺮ
ﺧﺎرج اﻷرض ،ﻓﺈﻧﻨﺎ ﻧﺮى ﺑﺒﺴﺎﻃﺔ ﺳﻤﺎءً ﻣﻠﻴﺌﺔ ﺑﺎﻟﻨﺠﻮم .واﻟﺠﻮاب ﻫﻮ أن اﺳﺘﻨﺘﺎج وﺟﻮد
ﻫﺬا اﻟﻬﻴﻜﻞ اﻟﻌﻨﻘﻮدي — ﺑﻞ واﻛﺘﺸﺎﻓﻪ ﰲ املﻘﺎم اﻷول — ﺗَﻄ ﱠﻠﺐ ﺗﻘﻨﻴﺎت إﺣﺼﺎﺋﻴﺔ .وﺗﺸﻤﻞ
إﺣﺪى ﻓﺌﺎت ﻫﺬه اﻟﺘﻘﻨﻴﺎت ﺣﺴﺎب املﺴﺎﻓﺎت ﺑني ﻛﻞ ﻧﺠﻢ وﻋﺪد ﻗﻠﻴﻞ ﻣﻦ اﻟﻨﺠﻮم اﻷﻗﺮب
ﱠ
ﻣﺘﻮﻗﻊ ﺗﻜﻮن واﻗﻌﺔ ﰲ إﻟﻴﻪ .واﻟﻨﺠﻮم اﻟﺘﻲ ﻳﻜﻮن ﻋﺪد اﻟﻨﺠﻮم اﻟﻘﺮﻳﺒﺔ ﻣﻨﻬﺎ أﻛﱪ ﻣﻤﺎ ﻫﻮ
ﻣﻨﺎﻃﻖ ﻛﺜﻴﻔﺔ ﻣﺤﻠﻴٍّﺎ؛ أي إﻧﻬﺎ ﺗﺸ ﱢﻜﻞ ﻋﻨﺎﻗﻴﺪ ﻣﺤﻠﻴﺔ.
ﻓﺴﺤُ ﺐ اﻟﻐﺒﺎر ﺑني اﻟﻨﺠﻮم ﺳﺘَﺤﺠﺐ ﺑﺎﻟﻄﺒﻊ ،ﻳﺘﻌﻠﻖ اﻷﻣﺮ ﺑﺄﻛﺜﺮ ﻣﻦ ذﻟﻚ ﺑﻜﺜري؛ ُ
رؤﻳﺔ اﻷﺷﻴﺎء اﻟﺒﻌﻴﺪة ،وﺳﺤﺐ اﻟﻐﺒﺎر ﻫﺬه ﻟﻴﺴﺖ ﻣﻮ ﱠزﻋﺔ ﻋﲆ ﻧﺤﻮ ﻣﻮﺣﱠ ﺪ ﰲ اﻟﻔﻀﺎء.
وﺑﺎملﺜﻞ ،ﻟﻦ ﺗُﺮى اﻷﺟﺮام اﻟﺒﺎﻫﺘﺔ ﱠإﻻ إذا ﻛﺎﻧﺖ ﻗﺮﻳﺒﺔ ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻣﻦ اﻷرض .واﻟﺨﻴﻂ
اﻟﺮﻓﻴﻊ ﻣﻦ املﺠﺮات اﻟﺬي ﺗﺮى ﻧﻬﺎﻳﺘﻪ ﻣﻦ اﻷرض ﻳﻤﻜﻦ أن ﻳﺒﺪو ﻛﻌﻨﻘﻮد ﻛﺜﻴﻒ ،وﻫﻜﺬا.
وﻳﻨﺒﻐﻲ ﺗﻄﺒﻴﻖ ﺗﺼﺤﻴﺤﺎت إﺣﺼﺎﺋﻴﺔ ﻣﺘﻄﻮرة ﺣﺘﻰ ﻧﺘﻤﻜﻦ ﻣﻦ ﺗﻤﻴﻴﺰ اﻟﺤﻘﻴﻘﺔ اﻟﻜﺎﻣﻨﺔ
ﻣﻦ اﻟﺘﻮزﻳﻌﺎت اﻟﻈﺎﻫﺮﻳﺔ ﻟﻸﺟﺮام اﻟﺴﻤﺎوﻳﺔ.
إن َﻓﻬْ ﻢ ﺑﻨﻴﺔ اﻟﻜﻮن ﻳُﻠﻘِ ﻲ اﻟﻀﻮء ﻋﲆ ﻛﻴﻔﻴﺔ ﺗﺸ ﱡﻜﻠﻪ ،وﻋﲆ ﺗﻄﻮﱡره املﺴﺘﻘﺒﲇ.
22
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
ﺗﺒني ﺟﻮدة اﻟﺒﻮﻟﻴﻤﺮ ﻋﻨﺪ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ ﻗِ ﻴَﻢ املﺘﻐريات اﻟﺜﻼﺛﺔ ،وﻳﻤﻜﻨﻨﺎ ﺑﻌﺪ ذﻟﻚ واﻟﺘﻲ ﱢ
اﺧﺘﻴﺎر اﻟﻘِ ﻴَﻢ اﻟﺜﻼث املﺤﺪدة اﻟﺘﻲ ﺗﺰﻳﺪ اﻟﺠﻮدة إﱃ اﻟﺤﺪ اﻷﻗﴡ.
وﻟﻜﻦ ﻣﺎذا ﻟﻮ ﻛﺎﻧﺖ ﻋﻤﻠﻴﺔ اﻟﺘﺼﻨﻴﻊ ﻣﻦ اﻟﻨﻮع اﻟﺬي ﻳﺴﺘﻐﺮق ﻋﺪة أﻳﺎم ﻟﺼﻨﻊ ﻛﻞ
ﻛﻤﻴﺔ؟ إن ﺻﻨﻊ اﻟﻌﺪﻳﺪ ﻣﻦ ﻫﺬه اﻟﻜﻤﻴﺎت ملﺠﺮد اﻟﺘﻮﺻﻞ إﱃ أﻓﻀﻞ ﻃﺮﻳﻘﺔ ﻟﻠﻘﻴﺎم ﺑﺬﻟﻚ
رﺑﻤﺎ ﻳﻜﻮن أﻣ ًﺮا ﺻﻌﺐ اﻟﺘﻨﻔﻴﺬ؛ ﻓﺼﻨﻊ ﻣﺎﺋﺔ ﻛﻤﻴﺔ ،ﻳﺴﺘﻐﺮق ﺻﻨﻊ ﻛ ﱟﻞ ﻣﻨﻬﺎ ﺛﻼﺛﺔ أﻳﺎم،
ﺳﻴﺴﺘﻐﺮق اﻟﺠﺰء اﻷﻛﱪ ﻣﻦ ﻋﺎم ﻛﺎﻣﻞ .ﻟﺤﺴﻦ اﻟﺤﻆ ،اﻟﺘﺠﺎرب املﺼﻤﱠ ﻤﺔ ﺑﺬﻛﺎء ﺗﺴﻤﺢ ﻟﻨﺎ
ﺑﺎﺳﺘﺨﺮاج املﻌﻠﻮﻣﺎت ﻧﻔﺴﻬﺎ ﻣﻦ ﻣﺠﻤﻮﻋﺎت ﻣﺨﺘﺎرة ﺑﻌﻨﺎﻳﺔ ﻣﻦ اﻟﻘِ ﻴَﻢ ﻋﺪدﻫﺎ أﻗ ﱡﻞ ﺑﻜﺜري.
وﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ﻳﻤﻜﻦ ﻟﻨﺴﺒﺔ ﺿﺌﻴﻠﺔ ﻣﻦ اﻟﻜﻤﻴﺎت أن ﺗﻤﻨﺤﻨﺎ ﻣﻌﻠﻮﻣﺎت ﻛﺎﻓﻴﺔ ﻟﺘﺤﺪﻳﺪ
أﻓﻀﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘِ ﻴَﻢ ،ﴍﻳﻄﺔ أن ﺗُﺨﺘﺎر ﺗﻠﻚ اﻟﻜﻤﻴﺎت ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ.
23
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻣﺜﺎل :٧اﻟﺘﻀﺨﻢ
إﻧﻨﺎ ﺟﻤﻴﻌً ﺎ ﻧﺄﻟﻒ ﻓﻜﺮة أن اﻷﺷﻴﺎء ﺗﺰداد ﻏﻼءً ﺑﻤﺮور اﻟﻮﻗﺖ .وﻟﻜﻦ ﻛﻴﻒ ﻳﻤﻜﻨﻨﺎ ﻣﻘﺎرﻧﺔ
ﺗﻜﺎﻟﻴﻒ املﻌﻴﺸﺔ اﻟﻴﻮم ﺑﺘﻜﺎﻟﻴﻒ املﻌﻴﺸﺔ أﻣﺲ؟ ﻟﻠﻘﻴﺎم ﺑﺬﻟﻚ ،ﻧﺤﺘﺎج إﱃ ﻣﻘﺎرﻧﺔ اﻷﺷﻴﺎء
ﻧﻔﺴﻬﺎ اﻟﺘﻲ اﺷﱰﻳﻨﺎﻫﺎ ﰲ اﻟﻴﻮﻣني .ﻟﻜﻦ ﻟﻸﺳﻒ ،ﺗﻮﺟﺪ ﺗﻌﻘﻴﺪات؛ ﻓﺎملﺤﻼت اﻟﺘﺠﺎرﻳﺔ املﺨﺘﻠﻔﺔ
ﺗﺤﺪد أﺳﻌﺎ ًرا ﻣﺨﺘﻠﻔﺔ ﻟﻸﺷﻴﺎء ﻧﻔﺴﻬﺎ ،واﻷﺷﺨﺎص املﺨﺘﻠﻔﻮن ﻳﺸﱰون أﺷﻴﺎء ﻣﺨﺘﻠﻔﺔ،
وﻳﻐري اﻷﺷﺨﺎص أﻧﻔﺴﻬﻢ أﻧﻤﺎط ﴍاﺋﻬﻢ ،وﺗَﻈﻬَ ﺮ ﻣﻨﺘﺠﺎت ﺟﺪﻳﺪة ﰲ اﻟﺴﻮق وﺗﺨﺘﻔﻲ
24
ﻋﻠﻢ اﻹﺣﺼﺎء ﰲ ﻛﻞ ﻣﻜﺎن
ﻣﻨﺘﺠﺎت ﻗﺪﻳﻤﺔ ،وﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ .ﻛﻴﻒ ﻧﻀﻊ ﻣﺜﻞ ﻫﺬه اﻟﺘﻐﻴريات ﰲ اﻻﻋﺘﺒﺎر ﻋﻨﺪ ﺗﺤﺪﻳ ِﺪ ﻣﺎ
إذا ﻛﺎﻧﺖ اﻟﺤﻴﺎة أﻛﺜﺮ ﺗﻜﻠﻔﺔ ﻫﺬه اﻷﻳﺎم أم ﻻ؟
أﻧﺸﺄ اﻹﺣﺼﺎﺋﻴﻮن واﻻﻗﺘﺼﺎدﻳﻮن ﻣﺆﴍات ﻣﺜﻞ »ﻣﺆﴍ أﺳﻌﺎر اﻟﺘﺠﺰﺋﺔ« و»ﻣﺆﴍ
أﺳﻌﺎر املﺴﺘﻬﻠﻚ« ﻟﻘﻴﺎس ﺗﻜﺎﻟﻴﻒ املﻌﻴﺸﺔ .وﺗﺴﺘﻨﺪ ﻫﺬه املﺆﴍات إﱃ »ﺳ ﱠﻠﺔ« اﻓﱰاﺿﻴﺔ
ﻟﻠﺴﻠﻊ )ﻣﺌﺎت ﻣﻨﻬﺎ( اﻟﺘﻲ ﻳﺸﱰﻳﻬﺎ اﻟﻨﺎس ،إﺿﺎﻓﺔ إﱃ دراﺳﺎت اﺳﺘﻘﺼﺎﺋﻴﺔ ﻻﻛﺘﺸﺎف
اﻷﺳﻌﺎر اﻟﺘﻲ ﻳُﺒﺎع ﺑﻬﺎ ﻛﻞ ﻋﻨﴫ ﰲ اﻟﺴﻠﺔ .وﺗُﺴﺘﺨﺪم ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ ﻣﺘﻄﻮرة ﻟﺠﻤﻊ
أﺳﻌﺎر اﻟﻌﻨﺎﴏ املﺨﺘﻠﻔﺔ ﻟﺘﻘﺪم رﻗﻤً ﺎ إﺟﻤﺎﻟﻴٍّﺎ واﺣﺪًا ﻳﻤﻜﻦ ﻣﻘﺎرﻧﺘﻪ ﻋﲆ ﻣﺪار اﻟﺰﻣﻦ.
أﻳﻀﺎ ﻟﻀﺒﻂ ﺣﺪود وﺑﺎﻹﺿﺎﻓﺔ إﱃ ﻛﻮﻧﻬﺎ ﻣﺆﴍًا ﻋﲆ اﻟﺘﻀﺨﻢ ،ﺗﺴﺘﺨﺪم ﻫﺬه املﺆﴍات ً
اﻹﻋﻔﺎء اﻟﴬﻳﺒﻲ واﻟﺮواﺗﺐ املﺮﺗﺒﻄﺔ ﺑﺎملﺆﴍ واملﻌﺎﺷﺎت اﻟﺘﻘﺎﻋﺪﻳﺔ ،وﻣﺎ إﱃ ذﻟﻚ.
ﺧﺎﺗﻤﺔ
رﻏﻢ أن ﻫﺬا ﻗﺪ ﻻ ﻳﺒﺪو واﺿﺤً ﺎ داﺋﻤً ﺎ ﻟﻠﻌني ﻏري اﻟﺨﺒرية ،ﻓﺈن ﻋﻠﻢ اﻹﺣﺼﺎء واﻷﺳﺎﻟﻴﺐ
اﻹﺣﺼﺎﺋﻴﺔ ﻳَ ْﻜﻤُﻨﺎن ﰲ ﻗﻠﺐ اﻻﻛﺘﺸﺎف اﻟﻌﻠﻤﻲ ،واﻟﻌﻤﻠﻴﺎت اﻟﺘﺠﺎرﻳﺔ واﻟﺤﻜﻮﻣﻴﺔ ،واﻟﺴﻴﺎﺳﺔ
اﻻﺟﺘﻤﺎﻋﻴﺔ ،واﻟﺘﺼﻨﻴﻊ ،واﻟﻄﺐ ،وﻣﻌﻈﻢ ﺟﻮاﻧﺐ اﻟﻨﺸﺎط اﻹﻧﺴﺎﻧﻲ اﻷﺧﺮى .ﻋﻼوة ﻋﲆ
ذﻟﻚ ،ﻛﻠﻤﺎ ﺗﻘﺪم اﻟﻌﺎ َﻟﻢ ،زادت أﻫﻤﻴﺔ ﻫﺬا اﻟﺪور أﻛﺜﺮ وأﻛﺜﺮ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻣﻨﺬ وﻗﺖ
َ
ﻣﺸﺎرﻛﺔ اﻹﺣﺼﺎﺋﻴني ،وﳾء ﻣﻦ ﻫﺬا اﻟﻘﺒﻴﻞ ﻃﻮﻳﻞ وﺗﻄﻮﻳ ُﺮ أدوﻳﺔ ﺟﺪﻳﺪة ﻳﺸﱰط ،ﻗﺎﻧﻮﻧًﺎ،
ﻳﺤﺪث اﻵن ﰲ اﻟﺼﻨﺎﻋﺔ املﴫﻓﻴﺔ؛ ﺣﻴﺚ إن اﻻﺗﻔﺎﻗﺎت اﻟﺪوﻟﻴﺔ اﻟﺠﺪﻳﺪة ﺗﺘﻄﻠﺐ وﺿﻊ ﻧﻤﺎذج
إﺣﺼﺎﺋﻴﺔ ﻟﻠﻤﺨﺎﻃﺮ .وﻧﻈ ًﺮا ﻟﻬﺬا اﻟﺪور املﺤﻮري ،ﻣﻦ املﻬﻢ ﺑﻮﺿﻮح أن ﻳﻜﻮن أي ﻣُﻮاﻃﻦ
ﻣﺴﺘﻨري ﻋﲆ ﻋﻠﻢ ﺑﺎملﺒﺎدئ اﻹﺣﺼﺎﺋﻴﺔ اﻷﺳﺎﺳﻴﺔ.
ﻳﻤ ﱢﻜﻨﻨﺎ ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ،اﻟﺬي ﻳﺴﺘﺨﺪم اﻟﱪﻣﺠﻴﺎت املﺘﻄﻮرة ﻟﺪراﺳﺔ اﻟﺒﻴﺎﻧﺎت،
ﻣﻦ اﻟﻘﻴﺎم ﺑﺮﺣﻼت اﺳﺘﻜﺸﺎف ﻣﺸﺎﺑﻬﺔ ﻟﺘﻠﻚ اﻟﺘﻲ ﻗﺎم ﺑﻬﺎ املﺴﺘﻜﺸﻔﻮن ﻗﺒﻞ اﻟﻘﺮن
اﺳﺘﻘﺼﻮْا ودرﺳﻮا ﻋﻮاﻟﻢ ﺟﺪﻳﺪة وﻣﺜرية .وﻫﺬا اﻹدراك — أن ﻋﻠﻢ اﻹﺣﺼﺎء َ اﻟﻌﴩﻳﻦ؛ إذ
اﻟﺤﻘﻴﻘﻲ ﻳﺘﻤﺤﻮر ﺣﻮل اﺳﺘﻜﺸﺎف املﺠﻬﻮل ،وﻻ ﻳﺘﻤﺤﻮر ﺣﻮل ﻋﻤﻠﻴﺎت ﺣﺴﺎﺑﻴﺔ ﻣ ُِﻤ ﱠﻠﺔ —
أﺳﺎﳼ ﰲ ﺗﻘﺪﻳﺮ ﻗﻴﻤﺔ ﻫﺬا اﻟﻌﻠﻢ اﻟﺤﺪﻳﺚ.
ﱞ
25
اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻣﻘﺪﻣﺔ
أﻫﺪف ﰲ ﻫﺬا اﻟﻔﺼﻞ إﱃ ﺗﻘﺪﻳﻢ ﺑﻌﺾ املﻔﺎﻫﻴﻢ واﻷدوات اﻷﺳﺎﺳﻴﺔ اﻟﺘﻲ ﺗﺸﻜﻞ أﺳﺎس ﻋﻠﻢ
اﻹﺣﺼﺎء ،واﻟﺘﻲ ﺗﻤ ﱢﻜﻨﻪ ﻣﻦ ﻟﻌﺐ أدوار ﻛﺜرية.
أن ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ ﻋﺎﻧَﻰ ﻣﻦ ﻛﺜري ﻣﻦ املﻔﺎﻫﻴﻢ أﴍت ﰲ اﻟﻔﺼﻞ اﻷول إﱃ ﱠ ُ
آﺧﺮ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎن )رﺑﻤﺎ ﻋﻦ ﻏري اﻟﺨﺎﻃﺌﺔ وﺳﻮء اﻟﻔﻬﻢ .وﻣﻊ ذﻟﻚ ،ﻳﺮوﱠج ﺳﻮء ﻓﻬﻢ َ
ﻗﺼﺪ( ﻋﻦ ﻃﺮﻳﻖ اﻟﻜﺘﺐ اﻟﺘﻲ ﺗﴩح اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ ﻟﻠﺨﱪاء ﰲ ﺗﺨﺼﺼﺎت أﺧﺮى؛
وﻫﻮ أن اﻹﺣﺼﺎء ﻋﺒﺎرة ﻋﻦ ﺣﻘﻴﺒﺔ ﻣﻦ اﻷدوات ،وﻳﺘﻤﺜﻞ دور اﻹﺣﺼﺎﺋﻲ أو ﻣﺴﺘﺨﺪِم
اﻹﺣﺼﺎء ﰲ اﺧﺘﻴﺎر أداة واﺣﺪة ﺗﺘﻨﺎﺳﺐ ﻣﻊ ﻣﺴﺄﻟﺘﻪ ،ﺛﻢ ﺗﻄﺒﻴﻘﻬﺎ.
ﺗﺘﻤﺜﻞ ﻣﺸﻜﻠﺔ ﻫﺬه اﻟﻨﻈﺮة ﻟﻺﺣﺼﺎء ﰲ أﻧﻬﺎ ﺗﻌﻄﻲ اﻧﻄﺒﺎﻋً ﺎ ﺑﺄن ﻣﺠﺎل اﻹﺣﺼﺎء
ﺑﺒﺴﺎﻃﺔ ﻋﺒﺎرة ﻋﻦ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻄﺮق املﻨﻔﺼﻠﺔ ملﻌﺎﻟﺠﺔ اﻷرﻗﺎم؛ ﻓﻬﻲ ﺗﻔﺸﻞ ﰲ ﻧﻘﻞ ٍ
ﺣﻘﻴﻘﺔ أن اﻹﺣﺼﺎءَ ﻛ ﱞﻞ ﻣﺘﺼ ٌﻞ ،ﻣﺒﻨﻲ ﻋﲆ ﻣﺒﺎدئ ﻓﻠﺴﻔﻴﺔ ﻋﻤﻴﻘﺔ ،ﺑﺤﻴﺚ ﺗﻜﻮن أدوات
ً
ﺷﺎﻣﻼ ﻣﻘﺎرﻧﺔ ﺑﻐريه ،ورﺑﻤﺎ ﻳﺒﺪو ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ﻣﺮﺗﺒﻄﺔ وﻣﺘﺼﻠﺔ؛ ﻓﺒﻌﻀﻬﺎ ﻗﺪ ﻳﺒﺪو
ﻣﺨﺘﻠﻔﺎ ﺑﺒﺴﺎﻃﺔ ﻷﻧﻪ ﻳﺘﻌﺎﻣﻞ ﻣﻊ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﻋﲆ اﻟﺮﻏﻢ ً اﻟﺒﻌﺾ اﻵﺧﺮ
َ
ﻣﻦ أن ﻫﺬه اﻷدوات ﺗﺒﺤﺚ ﻋﻦ اﻟﻨﻮع ﻧﻔﺴﻪ ﻣﻦ اﻟ ِﺒﻨﻰ ،وﻣﺎ إﱃ ذﻟﻚ .وأﻇﻦ أن اﻧﻄﺒﺎع
ﻣﺠﻤﻮﻋﺔ اﻟﻄﺮق املﻌﺰوﻟﺔ ﻫﺬا رﺑﻤﺎ ﻳﻜﻮن ﺳﺒﺒًﺎ آﺧﺮ ﻳﺪﻓﻊ املﺴﺘﺠﺪﱢﻳﻦ ﰲ ﻣﺠﺎل اﻹﺣﺼﺎء
إﱃ اﻻﻋﺘﻘﺎد ﺑﺄن ﻫﺬا املﺠﺎل ﻣﻤ ﱞﻞ ﻧﻮﻋً ﺎ ﻣﺎ وﺻﻌﺐ اﻟﺘﻌﻠﻢ )ﺑﴫف اﻟﻨﻈﺮ ﻋﻦ أي ﺧﻮف ﻣﻦ
اﻷرﻗﺎم ﻗﺪ ﻳﻜﻮن ﻟﺪﻳﻬﻢ(؛ ﻓﺘﻌﻠﻢ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻄﺮق املﻨﻔﺼﻠﺔ اﻟﺘﻲ ﺗﺒﺪو ﺷﺪﻳﺪة اﻟﺘﺒﺎﻳﻦ
أﺻﻌﺐ ﺑﻜﺜري ﻣﻦ ﺗﻌﻠﻢ ﻫﺬه اﻟﻄﺮق ﻣﻦ ﺧﻼل اﺷﺘﻘﺎﻗﻬﺎ ﻣﻦ املﺒﺎدئ اﻷﺳﺎﺳﻴﺔ ﻧﻔﺴﻬﺎ.
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻷﻣﺮ ﻳﺸﺒﻪ ﰲ ﺻﻌﻮﺑﺘﻪ ﺗﻌ ﱡﻠﻢ ﻣﺠﻤﻮﻋﺔ ﻋﺸﻮاﺋﻴﺔ ﻣﻦ اﻟﻜﻠﻤﺎت ﻏري املﺮﺗﺒﻄﺔ ،ﻣﻘﺎرﻧﺔ ﺑﺘﻌﻠﻢ
ﺳﻌﻴﺖ — ﰲ ﻫﺬا اﻟﻔﺼﻞ وﻋﲆ ﻣﺪار اﻟﻜﺘﺎب — ﻟﻠﺘﻌﺒري ﻋﻦُ ﺟﻤﻠﺔ ذات ﻣﻌﻨًﻰ .وﻟﻘﺪ
ٍ ِ
ﻛﻠﻤﺎت
اﻟﻌﻼﻗﺎت ﺑني اﻷﻓﻜﺎر اﻹﺣﺼﺎﺋﻴﺔ ،ﻣﻦ أﺟﻞ إﻳﻀﺎح أن ﻣﺠﺎل اﻹﺣﺼﺎء ﰲ اﻟﺤﻘﻴﻘﺔ وﺣﺪة
ﻣﺘﻜﺎﻣﻠﺔ ﻣﱰاﺑﻄﺔ.
28
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻧﻈﺎﻣﻬﻢ اﻟﻐﺬاﺋﻲ وﻧﻤﻮﱠﻫﻢ اﻟﺒﺪﻧﻲ ،وﰲ ﻫﺬه اﻟﺤﺎﻟﺔ رﺑﻤﺎ ﺗﺘﻤﺜﻞ اﻟﺨﺼﺎﺋﺺ ﰲ ﻃﻮل اﻷﻃﻔﺎل
ووزﻧﻬﻢ ،أو رﺑﻤﺎ ﺗﻜﻮن ﻫﺬه اﻟﻜﺎﺋﻨﺎت ﻣﻮا ﱠد ﻣﺎدﻳﺔ ،أﻣﺎ اﻟﺨﺼﺎﺋﺺ ذات اﻷﻫﻤﻴﺔ ﻓﻬﻲ
ﺳﻤﺎﺗﻬﺎ اﻟﻜﻬﺮﺑﺎﺋﻴﺔ واملﻐﻨﺎﻃﻴﺴﻴﺔ .ﻣﻦ اﻟﺸﺎﺋﻊ ﰲ ﻣﺠﺎل اﻹﺣﺼﺎء ﺗﺴﻤﻴﺔ ﻫﺬه اﻟﺨﺼﺎﺋﺺ
»ﻣﺘﻐريات« ،ﺑﺤﻴﺚ ﻳﻤﺘﻠﻚ ﻛﻞ ﻛﺎﺋﻦ ﻣﻨﻬﺎ »ﻗﻴﻤﺔ« ﻟﻠﻤﺘﻐري )درﺟﺔ اﻟﻄﻔﻞ ﰲ اﺧﺘﺒﺎر اﻹﻣﻼء
ﺗﻤﺜﻞ ﻗﻴﻤﺔ ﻣﺘﻐري اﻻﺧﺘﺒﺎر ،وﻛﻤﻴﺔ اﻟﺘﻮﺻﻴﻞ اﻟﻜﻬﺮﺑﻲ ﻟﻠﻤﺎدة ﺗﻤﺜﻞ ﻗﻴﻤﺔ ﻣﺘﻐري اﻟﻘﺪرة ﻋﲆ
ﺗﻮﺻﻴﻞ اﻟﺘﻴﺎر ،وﻣﺎ إﱃ ذﻟﻚ( .وﰲ ﻣﺠﺎﻻت ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت اﻷﺧﺮى ،ﺗُﺴﺘَﺨﺪَم ﻛﻠﻤﺎت ﺑﺪﻳﻠﺔ
ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن )ﻣﺜﻞ »ﻣﻴﺰة« أو »ﺳﻤﺔ« أو »ﺧﺎﺻﻴﺔ«( ،وﻟﻜﻦ ﻋﻨﺪ ﻣﻨﺎﻗﺸﺔ اﻟﺠﻮاﻧﺐ
اﻟﺘﻘﻨﻴﺔ ،ﺳﺄﻟﺘﺰم ﻋﺎدة ﺑﻜﻠﻤﺔ »ﻣﺘﻐري«.
ﰲ اﻟﻮاﻗﻊ ،ﰲ أي دراﺳﺔ ،رﺑﻤﺎ ﻧﻜﻮن ﻣﻬﺘﻤني ﺑﺄﻧﻮاع ﻣﺘﻌﺪدة ﻣﻦ اﻟﻜﺎﺋﻨﺎت .ﻓﺮﺑﻤﺎ
ﻻ ﻧﺮﻏﺐ ﰲ اﻟﻔﻬﻢ وﺗﻘﺪﻳﻢ اﻟﻨﺘﺎﺋﺞ ﻋﻦ أﻃﻔﺎل املﺪارس ﻓﺤﺴﺐ ،وﻟﻜﻦ ً
أﻳﻀﺎ ﻋﻦ املﺪارس
ﻧﻔﺴﻬﺎ ورﺑﻤﺎ ﻋﻦ املﻌﻠﻤني وأﺳﺎﻟﻴﺐ اﻟﺘﺪرﻳﺲ واﻷﻧﻮاع املﺨﺘﻠﻔﺔ ﻟﻬﻴﺎﻛﻞ اﻹدارة املﺪرﺳﻴﺔ،
ﻛﻞ ذﻟﻚ ﰲ دراﺳﺔ واﺣﺪة .ﻋﻼوة ﻋﲆ ذﻟﻚ ،ﻋﺎدة ﻟﻦ ﻧﻜﻮن ﻣﻬﺘﻤني ﺑﺴﻤﺔ واﺣﺪة ﻟﻠﻜﺎﺋﻨﺎت
اﻟﺘﻲ ﺗﺨﻀﻊ ﻟﻠﺪراﺳﺔ ،وإﻧﻤﺎ ﺑﺎﻟﻌﻼﻗﺎت ﺑني اﻟﺴﻤﺎت ،ورﺑﻤﺎ ﺑﺎﻟﻔﻌﻞ ﺑﺎﻟﻌﻼﻗﺎت ﺑني ﺳﻤﺎت
ﱠ
ﻣﺘﻮﻗﻊ ،ﻧﺠﺪ أن اﻷﻣﻮر اﻟﻜﺎﺋﻨﺎت ﻣﻦ اﻷﻧﻮاع املﺨﺘﻠﻔﺔ وﻋﲆ املﺴﺘﻮﻳﺎت املﺨﺘﻠﻔﺔ .وﻛﻤﺎ ﻫﻮ
ﻏﺎﻟﺒًﺎ ﻣﺎ ﺗﻜﻮن ﱠ
ﻣﻌﻘﺪة ﻟﻠﻐﺎﻳﺔ؛ ﻧﻈ ًﺮا ﻟﺘﻌﻘﻴﺪ املﻮﺿﻮﻋﺎت اﻟﺘﻲ ﻧﺪرﺳﻬﺎ.
ﻳﻘﺎوم ﻛﺜري ﻣﻦ اﻟﻨﺎس ﻓﻜﺮة أﻧﻪ ﻳﻤﻜﻦ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ أن ﺗﻨﻘﻞ ﺟﻤﺎل اﻟﻌﺎﻟﻢ
اﻟﺤﻘﻴﻘﻲ؛ ﻓﻴﺸﻌﺮون ﺑﺄن ﺗﺤﻮﻳﻞ اﻷﺷﻴﺎء إﱃ أرﻗﺎم ﻳ ُِﺰﻳﻞ ﺑﻄﺮﻳﻘﺔ أو ﺑﺄﺧﺮى ﻋﻨﻬﺎ ﺳﺤﺮﻫﺎ.
ﰲ اﻟﻮاﻗﻊ ،ﻫﻢ ﻣﺨﻄﺌﻮن ﺣﺘﻰ اﻟﻨﺨﺎع؛ ﻓﺎﻷرﻗﺎم ﻟﺪﻳﻬﺎ اﻟﻘﺪرة ﻋﲆ اﻟﺴﻤﺎح ﻟﻨﺎ ﺑﺈدراك
ﻋﻤﻘﺎ ،وﺗﻘﺪﻳﺮه ﱠ
ﺣﻖ ﻗﺪْره. ﻫﺬا اﻟﺠﻤﺎل — ﻫﺬا اﻟﺴﺤﺮ — ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ وﺿﻮﺣً ﺎ وأﻛﺜﺮ ً
وﺑﺎﻋﱰاف اﻟﺠﻤﻴﻊ ،رﺑﻤﺎ ﻳُﺰال »اﻟﻐﻤﻮض« ﻋﻦ ﻃﺮﻳﻖ وﺻﻒ اﻷﺷﻴﺎء ﺑﺼﻮرة رﻗﻤﻴﺔ؛ ﻓﺈذا
ﻗﻠﺖ إﻧﻪ ﻳﻮﺟﺪ أرﺑﻌﺔ أﺷﺨﺎص ﰲ اﻟﻐﺮﻓﺔ ،ﻓﺈﻧﻚ ﺗﻌﺮف ﺑﺎﻟﻀﺒﻂ ﻣﺎ أَﻋﻨِﻴﻪ ،ﰲ ﺣني أﻧﻨﻲ إذا ُ
ﺷﺨﺼﺎ ﻣﺎ ﺟﺬﱠاب ،رﺑﻤﺎ ﻻ ﺗﻜﻮن ﻣﺘﺄﻛﺪًا ﺗﻤﺎﻣً ﺎ ﻣﻤﱠ ﺎ أﻋﻨِﻴﻪ .ورﺑﻤﺎ ﺗﺨﺘﻠﻒ ﺣﺘﻰ ﻣﻊ
ً ُ
ﻗﻠﺖ إن
ﺷﺨﺼﺎ ﺟﺬﱠاﺑًﺎ ﰲ اﻟﻐﺮﻓﺔ ،وﻟﻜﻦ ﻣﻦ ﻏري املﺮﺟﱠ ﺢ أن ﺗﺨﺘﻠﻒ ﻣﻊ ً وﺟﻬﺔ ﻧﻈﺮي ﰲ أن ﺛﻤﺔ
وﺟﻬﺔ ﻧﻈﺮي ﺑﺄن ﻫﻨﺎك أرﺑﻌﺔ أﺷﺨﺎص ﰲ اﻟﻐﺮﻓﺔ )ﺑﺎﺳﺘﺜﻨﺎء أﺧﻄﺎء اﻟﻌ ﱢﺪ ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل،
وﻟﻜﻦ ﻫﺬا أﻣﺮ ﻣﺨﺘﻠﻒ( .واﻷرﻗﺎم ﻣﻔﻬﻮﻣﺔ ﻋﲆ ﻧﺤﻮ ﻋﺎملﻲ ،ﺑﻐﺾ اﻟﻨﻈﺮ ﻋﻦ اﻟﺠﻨﺴﻴﺔ أو
اﻟﺪﻳﻦ أو اﻟﺠﻨﺲ أو اﻟﻌﻤﺮ أو أي ِﺳﻤَ ﺔ ﺑﴩﻳﺔ أﺧﺮى .وﻳﻤﻜﻦ أن ﺗﻜﻮن إزاﻟﺔ اﻟﻐﻤﻮض
— وﻣﻌﻬﺎ إزاﻟﺔ ﺧﻄﺮ ﺳﻮء اﻟﻔﻬﻢ — ﻣﻔﻴﺪة ﻋﻨﺪﻣﺎ ﻧﺤﺎول أن ﻧﻔﻬﻢ ﺷﻴﺌًﺎ؛ ﻋﻨﺪﻣﺎ ﻧﺤﺎول
ﻓﻬﻤﻪ ﺗﻤﺎﻣً ﺎ.
29
ﻋﻠﻢ اﻹﺣﺼﺎء
وﺛﻴﻘﺎ ﺑﺤﻘﻴﻘﺔ أن »اﻷرﻗﺎمً وﻳﺮﺗﺒﻂ اﻓﺘﻘﺎد اﻟﻐﻤﻮض ﻫﺬا ﰲ ﺗﻔﺴري اﻷرﻗﺎم ارﺗﺒﺎ ً
ﻃﺎ
ﺗﻤﺘﻠﻚ ﺳﻤﺔ واﺣﺪة ﻓﻘﻂ«؛ وﻧﻌﻨﻲ ﺑﻬﺬا ﻗﻴﻤﺘﻬﺎ أو ﺣﺠﻤﻬﺎ .ﻓﻌﲆ اﻟﻨﻘﻴﺾ ﻣﻤﺎ ﻗﺪ ﻳﺪﻓﻌﻨﺎ
اﻟﻌﺮاﻓﻮن إﱃ اﻹﻳﻤﺎن ﺑﻪ ،ﻓﺈن اﻷرﻗﺎم ﻟﻴﺴﺖ ﺟﺎﻟِﺒﺔ ﻟﻠﺤﻆ اﻟﺠﻴﺪ أو اﻟﺴﻴﺊ؛ ﺗﻤﺎﻣً ﺎ ﻛﻤﺎ أن
اﻷرﻗﺎم ﻻ ﺗﻤﺘﻠﻚ ﻟﻮﻧًﺎ أو ﻧﻜﻬﺔ أو راﺋﺤﺔ ،ﻓﻠﻴﺲ ﻟﺪﻳﻬﺎ ﺳﻤﺎت ﻏري ﻗﻴﻤﺘﻬﺎ اﻟﺮﻗﻤﻴﺔ اﻟﺬاﺗﻴﺔ.
)ﻻ ﻳﻤﻜﻦ إﻧﻜﺎر أن ﺑﻌﺾ اﻷﺷﺨﺎص ﻳﻤﺘﻠﻜﻮن »اﻟﺤﺲ املﺮاﻓﻖ« ،واﻟﺬي ﻓﻴﻪ ﻳﺮﺑﻄﻮن ﻟﻮﻧًﺎ
إﺣﺴﺎﺳﺎ ﺑﺄرﻗﺎم ﻣﻌﻴﻨﺔ .وﻣﻊ ذﻟﻚ ،ﻓﺈن اﻷﺣﺎﺳﻴﺲ املﺮﺗﺒﻄﺔ ﺗﺘﺒﺎﻳﻦ ﺑﺎﺧﺘﻼف ً ﻣﻌﻴﻨًﺎ أو
اﻷﺷﺨﺎص ،وﻻ ﻳﻤﻜﻦ اﻋﺘﺒﺎرﻫﺎ ﺳﻤﺎت ﺧﺎﺻﺔ ﺑﺎﻷرﻗﺎم ﻧﻔﺴﻬﺎ(.
ﺗﻘﺪﱢم اﻟﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ ﻟﻨﺎ ﺻﻠﺔ ﻣﺒﺎﴍة وﻓﻮرﻳﺔ ﺑﺎﻟﻈﻮاﻫﺮ اﻟﺘﻲ ﻧﺪرﺳﻬﺎ أﻛﺜﺮ ﻣﻤﺎ
ً
اﺗﺼﺎﻻ ﺗﻘﺪﱢﻣﻪ اﻟﻜﻠﻤﺎت؛ ﻷن اﻟﺒﻴﺎﻧﺎت اﻟﺮﻗﻤﻴﺔ ﺗَﻨﺘﺞ ﻋﺎدة ﻋﻦ ﻃﺮﻳﻖ أدوات ﻗﻴﺎس ﺗﺘﺼﻞ
ﻣﺒﺎﴍً ا ﺑﺘﻠﻚ اﻟﻈﻮاﻫﺮ ﺑﺪرﺟﺔ أﻛﱪ ﻣﻦ اﺗﺼﺎﻟﻬﺎ ﺑﺎﻟﻜﻠﻤﺎت؛ ﻓﺎﻷرﻗﺎم ﺗﺄﺗﻲ ﻣﺒﺎﴍة ﻣﻦ
اﻷﺷﻴﺎء اﻟﺘﻲ ﺗﺠﺮي دراﺳﺘﻬﺎ ،ﰲ ﺣني أن اﻟﻜﻠﻤﺎت ﺗﺨﻀﻊ ﻟﻠﱰﺷﻴﺢ ﻋﻦ ﻃﺮﻳﻖ اﻟﻌﻘﻞ
اﻟﺒﴩي .ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل ،ﻓﺈن اﻷﺷﻴﺎء ﺗﻜﻮن أﻛﺜﺮ ﺗﻌﻘﻴﺪًا إذا ﺗﻤﱠ ْﺖ إﺟﺮاءات ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت
ﺑﻮاﺳﻄﺔ اﻟﻜﻠﻤﺎت )ﻛﻤﺎ ﻫﻲ اﻟﺤﺎل إذا ﺟُ ِﻤﻌﺖ اﻟﺒﻴﺎﻧﺎت ﻋﻦ ﻃﺮﻳﻖ اﻻﺳﺘﺒﻴﺎﻧﺎت( ،وﻟﻜﻦ
ً
ﺗﻤﺜﻴﻼ ﻻ ﻳﺰال املﺒﺪأ ﺻﺎﻟﺤً ﺎ .وﺑﻴﻨﻤﺎ ﻗﺪ ﻻ ﺗﻜﻮن أدوات اﻟﻘﻴﺎس ﻣﺜﺎﻟﻴﺔ ،ﻓﺈن اﻟﺒﻴﺎﻧﺎت ﺗﻜﻮن
ﺣﻘﻴﻘﻴٍّﺎ ﻟﻨﺘﺎﺋﺞ ﺗﻄﺒﻴﻖ ﺗﻠﻚ اﻷدوات ﻋﲆ اﻟﻈﺎﻫﺮة ﻗﻴﺪ اﻟﺪراﺳﺔ .وأﺣﻴﺎﻧًﺎ أﻟﺨﺺ ذﻟﻚ ﻣﻦ
ﺧﻼل اﻟﺘﻌﻠﻴﻖ املﻮﺟﻮد ﰲ ﺑﺪاﻳﺔ ﻫﺬا اﻟﻔﺼﻞ» :اﻟﺒﻴﺎﻧﺎت ﻫﻲ أدﻟﺔ اﻟﻄﺒﻴﻌﺔ ،اﻟﺘﻲ ﺗُﺮى ﻣﻦ
ﺧﻼل ﻋﺪﺳﺔ أداة اﻟﻘﻴﺎس«.
وﻓﻮق ﻛﻞ ﻫﺬا ،ﻟﻸرﻗﺎم ﻧﺘﺎﺋﺞ ﻋﻤﻠﻴﺔ ﻣﻦ ﺣﻴﺚ اﻟﺘﻘﺪم املﺠﺘﻤﻌﻲ؛ ﻓﻘﺪرة اﻟﻌﺎ َﻟﻢ
املﺘﺤﴬ ﻋﲆ ﻣﻌﺎﻟﺠﺔ ﺗﻤﺜﻴﻼت اﻟﻮاﻗﻊ اﻟﺘﻲ ﺗﻘﺪﱢﻣﻬﺎ اﻷرﻗﺎم ﻫﻲ اﻟﺘﻲ أدﱠت إﱃ ﻣﺜﻞ ﻫﺬا ﱢ
اﻟﺘﻘﺪم املﺎدي املﺬﻫﻞ ﰲ اﻟﻘﺮون اﻟﻘﻠﻴﻠﺔ املﺎﺿﻴﺔ.
ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أن اﻷرﻗﺎم ﻟﻬﺎ ﺳﻤﺔ واﺣﺪة ﻓﻘﻂ — ﻗﻴﻤﺘﻬﺎ اﻟﺮﻗﻤﻴﺔ — ﻓﺮﺑﻤﺎ ﻧﺨﺘﺎر
اﺳﺘﺨﺪام ﺗﻠﻚ اﻟﺴﻤﺔ ﺑﻄﺮق ﻣﺨﺘﻠﻔﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻋﻨﺪ اﺗﺨﺎذ ﻗﺮار ﺑﺸﺄن ﺟﺪارة
وﻓﻘﺎ ﻟﺪرﺟﺎت اﻻﻣﺘﺤﺎن؛ أي إﻧﻨﺎ رﺑﻤﺎ ﻻ ﻧﻬﺘ ﱡﻢ اﻟﻄﻼب ﰲ اﻟﺼﻒ اﻟﺪراﳼ ،رﺑﻤﺎ ﻧﺼﻨﱢﻔﻬﻢ ً
ﻧﺘﻴﺠﺔ ﻣﺎ أﻋﲆ ﻣﻦ أﺧﺮى ،وﻻ ﻧﻬﺘ ﱡﻢ ﺑﺎﻟﻔﺎرق اﻟﻌﺪدي اﻟﺪﻗﻴﻖ .وﻋﻨﺪﻣﺎ ٌ ﱠإﻻ ﺑﻤﺎ إذا ﻛﺎﻧﺖ
ﻧﻬﺘﻢ ﻓﻘﻂ »ﺑﱰﺗﻴﺐ« اﻟﻘِ ﻴَﻢ ﺑﻬﺬه اﻟﻄﺮﻳﻘﺔ ﻧﻘﻮل إﻧﻨﺎ ﻧﻌﺎﻟﺞ اﻟﺒﻴﺎﻧﺎت ﺑﻮﺿﻌﻬﺎ ﻋﲆ ﻣﻘﻴﺎس
»ﺗﺮﺗﻴﺒﻲ« .ﻣﻦ ﻧﺎﺣﻴﺔ أﺧﺮى ،ﻋﻨﺪﻣﺎ ﻳﻘﻴﺲ املﺰارع ﻛﻤﻴﺔ اﻟﺬرة اﻟﺘﻲ أﻧﺘﺠﻬﺎ ،ﻓﻼ ﻳﺮﻳﺪ
ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎن ﻗﺪ أﻧﺘﺞ أﻛﺜﺮ ﻣﻤﺎ أﻧﺘﺞ ﰲ اﻟﻌﺎم املﺎﴈ أم ﻻ ،ﻛﻤﺎ أﻧﻪ ﻳﺮﻳﺪ َ ﺑﺒﺴﺎﻃﺔ
أﻳﻀﺎ أن ﻳﻌﺮف ﻣﻘﺪا َر ﻣﺎ أﻧﺘﺠﻪ؛ أي اﻟﻮزن اﻟﻔﻌﲇ؛ ﻓﻌﲆ أي ﺣﺎل ،ﺳﻮف ﺗُﺒﺎع اﻟﺬرة ﰲ ً
30
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﱠ
املﻠﺨﺼﺎت اﻹﺣﺼﺎﺋﻴﺔ اﻟﺒﺴﻴﻄﺔ )(2
ﰲ ﺣني أن اﻷرﻗﺎم اﻟﺒﺴﻴﻄﺔ ﺗﺸﻜﻞ »ﻋﻨﺎﴏ« اﻟﺒﻴﺎﻧﺎت ،ﻓﺈﻧﻪ ﻣﻦ أﺟﻞ أن ﺗﻜﻮن ﻣﻔﻴﺪة ،ﻓﺈﻧﻨﺎ
ﺑﻄﺮﻳﻘﺔ ﻣﺎ ،وﻫﻨﺎ ﻳﺄﺗﻲ َدوْر ٍ أن ﻧﻨﻈﺮ ﰲ اﻟﻌﻼﻗﺎت ﺑﻴﻨﻬﺎ ،ورﺑﻤﺎ ﻧَﺠﻤَ ﻊ ﺑﻴﻨﻬﺎ ﻧﺤﺘﺎج إﱃ ْ
ﻃﺮﻗﺎ أﻛﺜﺮ ﺗﻌﻘﻴﺪًا ملﻘﺎرﻧﺔ اﻷرﻗﺎم واﻟﺠﻤﻊ ً اﻹﺣﺼﺎء .ﺳﻮف ﺗﺴﺘﻜﺸﻒ اﻟﻔﺼﻮل اﻟﻼﺣﻘﺔ
ُ
ﺑﻴﻨﻬﺎ ،وﻟﻜﻦ ﺳﻴﻜﻮن ﻫﺬا اﻟﻔﺼﻞ ﺑﻤﻨﺰﻟﺔ ﻣﻘﺪﻣﺔ ﻟﻸﻓﻜﺎر .ﺳﻨﻠﻘِ ﻲ ﻫﻨﺎ ﻧﻈﺮة ﻋﲆ ﺑﻌﺾ
أﻛﺜﺮ اﻟﻄﺮق ﻣﺒﺎﴍة؛ ﻓﻠﻦ ﻧﺴﺘﻜﺸﻒ اﻟﻌﻼﻗﺎت ﺑني املﺘﻐريات املﺨﺘﻠﻔﺔ ﰲ ﻫﺬا اﻟﻔﺼﻞ ،وﻟﻜﻦ
ﺑﺒﺴﺎﻃﺔ ﺳﻨﺮى املﻌﻠﻮﻣﺎت واﻟ ﱡﺮ َؤى اﻟﺘﻲ ﻳﻤﻜﻦ اﺳﺘﺨﻼﺻﻬﺎ ﻣﻦ اﻟﻌﻼﻗﺎت ﺑني اﻟﻘِ ﻴَﻢ ا َملﻘﻴﺴﺔ
وﻓﻖ املﺘﻐري ﻧﻔﺴﻪ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻧﻜﻮن ﻗﺪ ﺳﺠﱠ ﻠﻨﺎ أﻋﻤﺎر املﺘﻘﺪﱢﻣني ﻟﻠﺤﺼﻮل ﻋﲆ ْ
ﻣﻨﺼﺐ ﰲ اﻟﺠﺎﻣﻌﺔ ،أو درﺟﺔ ﺳﻄﻮع اﻟﻨﺠﻮم ﰲ ﻋﻨﻘﻮد ﻣَ ﺠَ ﱢﺮيﱟ ﻣﺎ ،أو اﻟﻨﻔﻘﺎت اﻟﺸﻬﺮﻳﺔ
ﻣﺪﻳﻨﺔ ﻣﺎ ،أو أوزان أﺑﻘﺎر ﰲ ﻗﻄﻴﻊ ﰲ وﻗﺖ إرﺳﺎﻟﻬﺎ إﱃ اﻟﺴﻮق ،وﻣﺎ إﱃ ذﻟﻚ. ٍ ﻟﻸ ُ َﴎ ﰲ
وﰲ ﻛﻞ ﺣﺎﻟﺔ ،ﺗُﺴﺠﱠ ﻞ ﻗﻴﻤﺔ رﻗﻤﻴﺔ واﺣﺪة ﻟﻜﻞ »ﻛﺎﺋﻦ« ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﻜﺎﺋﻨﺎت.
ﻋﻨﺪﻣﺎ ﺗﺆﺧﺬ ﻣﻌً ﺎ ،ﻳُﻘﺎل إن اﻟﻘِ ﻴَﻢ اﻟﻔﺮدﻳﺔ ﰲ املﺠﻤﻮﻋﺔ ﺗﺸ ﱢﻜﻞ »ﺗﻮزﻳﻌً ﺎ« ﻟﻠﻘِ ﻴَﻢ .وﺗُﻌَ ﱡﺪ
ﺳﺒﻼ ﻟﺘﻤﻴﻴﺰ ﻫﺬا اﻟﺘﻮزﻳﻊ؛ أي ﻗﻮل ﻣﺎ إذا ﻛﺎﻧﺖ اﻟﻘِ ﻴَﻢ ﻣﺘﺸﺎ ِﺑﻬﺔ ً املﻠﺨﺼﺎت اﻹﺣﺼﺎﺋﻴﺔ
31
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺟﺪٍّا ،وﻣﺎ إذا ﻛﺎﻧﺖ ﺗﻮﺟﺪ ﺑﻌﺾ اﻟﻘِ ﻴَﻢ اﻟﻜﺒرية أو اﻟﺼﻐرية ﻋﲆ ﻧﺤﻮ اﺳﺘﺜﻨﺎﺋﻲ ،وﺗﺤﺪﻳﺪ
اﻟﻘﻴﻤﺔ »اﻟﻨﻤﻮذﺟﻴﺔ« … إﻟﺦ.
32
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻧﺴﺨﺔ ﻟﺘﺼﻞ إﱃ املﺠﻤﻮع ﻧﻔﺴﻪ ﻛﻤﺎ ﰲ اﻟﺠﺪول اﻷول ،ﻳﺴﻤﱠ ﻰ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ )ﻟﻸرﻗﺎم
ﰲ اﻟﺠﺪول اﻷول(.
اﻟﺴﺒُﻞ ﻟﺤﺴﺎب املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ ﻫﻲ ﻣﻦ ﺧﻼل ﻗﺴﻤﺔ ﻣﺠﻤﻮع ﰲ اﻟﻮاﻗﻊ ،أﺳﻬﻞ ﱡ
اﻷرﻗﺎم املﻠﻴﻮن ﰲ اﻟﺠﺪول اﻷول ﻋﲆ ﻣﻠﻴﻮن .وﻋﻤﻮﻣً ﺎ ،ﻳﺘﻢ إﻳﺠﺎد املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ ملﺠﻤﻮﻋﺔ
اﺧﺘﺒﺎر
ٍ ﻣﺜﺎﻻ َ
آﺧﺮ :ﰲ ﻣﻦ اﻷرﻗﺎم ﺑﺠﻤﻊ ﺟﻤﻴﻊ اﻷرﻗﺎم وﻗﺴﻤﺔ املﺠﻤﻮع ﻋﲆ ﻋﺪدﻫﺎ .إﻟﻴﻚ ً
ﻣﺎ ،ﻛﺎﻧﺖ اﻟﻨﺴﺒﺔ املﺌﻮﻳﺔ ﻟﻨﺘﺎﺋﺞ ﺧﻤﺴﺔ ﻃﻼب ﰲ اﻟﺼﻒ ﻫﻲ .٥٥ ،٩١ ،٥٣ ،٦٣ ،٧٨ :ﻳﺒﻠﻎ
ﻣﺠﻤﻮع ﻫﺬه اﻷرﻗﺎم .٣٤٠ = ٥٥ + ٩١ + ٥٣ + ٦٣ + ٧٨ :وﻳﺄﺗﻲ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ
ﺑﺒﺴﺎﻃﺔ ﻋﻦ ﻃﺮﻳﻖ ﻗﺴﻤﺔ ٣٤٠ﻋﲆ ٥؛ وﻫﻮ .٦٨وﻛﻨﺎ ﺳﻨﺤﺼﻞ ﻋﲆ املﺠﻤﻮع ﻧﻔﺴﻪ
) (٣٤٠إذا ﺣﺼﻞ ﺟﻤﻴﻊ اﻟﻄﻼب اﻟﺨﻤﺴﺔ ﻋﲆ اﻟﻘﻴﻤﺔ املﺘﻮﺳﻄﺔ .٦٨
ﻳﻤﺘﻠﻚ املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﺨﺼﺎﺋﺺ اﻟﺠﺬاﺑﺔ؛ ﻓﺪاﺋﻤً ﺎ ﻣﺎ ﻳﺄﺧﺬ ﻗﻴﻤﺔ ﺑني
أﻛﱪ اﻟﻘِ ﻴَﻢ وأﺻﻐﺮﻫﺎ ﰲ ﻣﺠﻤﻮﻋﺔ اﻷرﻗﺎم .ﻋﻼوة ﻋﲆ ذﻟﻚ ،ﻓﺈﻧﻪ ﻳﻮازن ﺑني اﻷرﻗﺎم ﰲ
املﺠﻤﻮﻋﺔ؛ ﺑﻤﻌﻨﻰ أن ﻣﺠﻤﻮع اﻟﻔﺮوق ﺑني املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ واﻟﻘِ ﻴَﻢ اﻷﻛﱪ ﻣﻨﻪ ﻳﺴﺎوي
ﺑﺎﻟﻀﺒﻂ ﻣﺠﻤﻮع اﻟﻔﺮوق ﺑني املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ واﻟﻘِ ﻴَﻢ اﻷﺻﻐﺮ ﻣﻨﻪ .وﺑﻬﺬا املﻌﻨﻰ،
ﻫﻮ ﻗﻴﻤﺔ »ﻣﺮﻛﺰﻳﺔ« .واﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻳﻤﻠﻜﻮن ﺗﻔﻜريًا ﻣﻴﻜﺎﻧﻴﻜﻴٍّﺎ ﻗﺪ ﻳﺮﻏﺒﻮن ﰲ ﺗﺼﻮر
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﺛﻘﺎل ِزﻧَﺔ اﻟﻮاﺣﺪ ﻣﻨﻬﺎ ﻛﻴﻠﻮﺟﺮام واﺣﺪ ﻣﻮﺿﻮﻋﺔ ﰲ ﻣﻮاﻗﻊ ﻣﺨﺘﻠﻔﺔ ﻋﲆ
ﻃﻮل ﻟﻮح ﺧﺸﺒﻲ )ﻋﺪﻳﻢ اﻟﻮزن( .وﻣﺴﺎﻓﺎت اﻷوزان ﻣﻦ أﺣﺪ ﻃﺮﰲ اﻟﻠﻮح ﺗﻤﺜﱢﻞ اﻟﻘِ ﻴَ َﻢ ﰲ
ﻣﺠﻤﻮﻋﺔ اﻷرﻗﺎم .واملﺘﻮﺳﻂ ﻫﻮ املﺴﺎﻓﺔ اﻟﺘﻲ ﺗﻔﺼﻞ اﻟﻄﺮف ﻋﻦ ﻣﺤﻮر ارﺗﻜﺎز ﻳﺘﻮازن
ﻓﻴﻪ ﻟﻮح اﻟﺨﺸﺐ ﺗﻤﺎﻣً ﺎ.
املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ ﻫﻮ »إﺣﺼﺎﺋﻴﺔ« ،وﻫﻮ ﻳﻠﺨﺺ ﻣﺠﻤﻮﻋﺔ ﻛﺎﻣﻠﺔ ﻣﻦ اﻟﻘﻴﻢ ﰲ
أﻳﻀﺎ ﻣﻌﻠﻮﻣﺎت؛ ﻓﻴ َِﺠﺐ ﱠأﻻ ﱠ
ﻧﺘﻮﻗﻊ ﻣﺠﻤﻮﻋﺘﻨﺎ ﰲ ﺻﻮرة ﻗﻴﻤﺔ واﺣﺪة .ﻳﺘﺒﻊ ذﻟﻚ أﻧﻪ ﻳﻬﻤﻞ ً
أن ﻧُﻤﺜﱢﻞ ﻣﻠﻴﻮن رﻗﻢ ﻣﺨﺘﻠﻒ )أو ﺧﻤﺴﺔ ،أو أﻳٍّﺎ ﻛﺎن ﻋﺪدﻫﺎ( ﻋﻦ ﻃﺮﻳﻖ رﻗﻢ واﺣﺪ دون
ْ
وﻟﻜﻦ ﻧﻈ ًﺮا ﻷﻧﻪ اﻟﺘﻀﺤﻴﺔ ﺑﴚءٍ ﻣﺎ ،وﺳﻨﻌﻤﻞ ﻋﲆ اﺳﺘﻜﺸﺎف ﻫﺬه اﻟﺘﻀﺤﻴﺔ ﰲ وﻗﺖ ﻻﺣﻖ.
ﻣﻠﺨﺼﺎ ﻣﻔﻴﺪًا؛ ﻓﻴﻤﻜﻨﻨﺎ ﻣﻘﺎرﻧﺔً ﻗﻴﻤﺔ ﻣﺮﻛﺰﻳﺔ ﺑﺎملﻌﻨﻰ ا ُملﺒ ﱠَني أﻋﻼه ،ﻓﺈﻧﻪ ﻳﻤﻜﻦ أن ﻳﻜﻮن
ﻣﺘﻮﺳﻄﺎت ﺣﺠﻢ اﻟﻔﺼﻞ ﰲ املﺪارس املﺨﺘﻠﻔﺔ ،أو ﻣﺘﻮﺳﻂ درﺟﺔ اﺧﺘﺒﺎر ﻃﻼب ﻣﺨﺘﻠﻔني،
أو ﻣﺘﻮﺳﻂ اﻟﻮﻗﺖ اﻟﺬي ﻳﺴﺘﻐﺮﻗﻪ ﻣﺨﺘﻠﻒ اﻟﻨﺎس ﻟﻠﻮﺻﻮل إﱃ اﻟﻌﻤﻞ ،أو ﻣﺘﻮﺳﻂ درﺟﺔ
اﻟﺤﺮارة اﻟﻴﻮﻣﻴﺔ ﰲ ﺳﻨﻮات ﻣﺨﺘﻠﻔﺔ ،وﻣﺎ إﱃ ذﻟﻚ.
املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ إﺣﺼﺎﺋﻴﺔ ﻣﻬﻤﺔ؛ ﻓﻬﻮ ﻣﻠﺨﺺ ملﺠﻤﻮﻋﺔ ﻣﻦ اﻷرﻗﺎم .وﺛﻤﺔ ﻣﻠﺨﺺ
آﺧﺮ ﻣﻬﻢ ﻫﻮ »اﻟﻮﺳﻴﻂ« .ﻛﺎن املﺘﻮﺳﻂ ﻫﻮ اﻟﻘﻴﻤﺔ املﺤﻮرﻳﺔ؛ ﻧﻮﻋً ﺎ ﻣﻦ اﻟﻨﻘﻄﺔ املﺮﻛﺰﻳﺔ
33
ﻋﻠﻢ اﻹﺣﺼﺎء
املﻮازﻧﺔ ملﺠﻤﻮع اﻟﻔﺮوق ﺑﻴﻨﻪ وﺑني اﻷرﻗﺎم ﰲ املﺠﻤﻮﻋﺔ .أﻣﺎ اﻟﻮﺳﻴﻂ ﻓﻴﻮازن املﺠﻤﻮﻋﺔ
ﺑﻄﺮﻳﻘﺔ أﺧﺮى؛ ﻓﻬﻮ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﻜﻮن ﻧﺼﻒ اﻷرﻗﺎم ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت أﻛﱪ ﻣﻨﻬﺎ
واﻟﻨﺼﻒ اﻵﺧﺮ أﺻﻐﺮ ﻣﻨﻬﺎ .وﺑﺎﻟﻌﻮدة إﱃ اﻟﺼﻒ املﻜﻮﱠن ﻣﻦ ﺧﻤﺴﺔ ﻃﻼب املﺬﻛﻮر أﻋﻼه،
ﻓﺈن ﻧﺘﺎﺋﺠﻬﻢ ﺑﺎﻟﱰﺗﻴﺐ ﻣﻦ اﻷﺻﻐﺮ إﱃ اﻷﻛﱪ ﻫﻲ .٩١ ،٧٨ ،٦٣ ،٥٥ ،٥٣ :واﻟﻨﺘﻴﺠﺔ
اﻟﻮﺳﻄﻰ ﻫﻨﺎ ﻫﻲ ،٦٣ﻟﺬﻟﻚ ﻫﺬا ﻫﻮ اﻟﻮﺳﻴﻂ.
ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﺳﺘﻈﻬﺮ ﺑﻌﺾ اﻟﺘﻌﻘﻴﺪات إذا وﺟﺪت ﻗﻴﻢ ﻣﺘﺴﺎوﻳﺔ ﰲ ﻣﺠﻤﻮﻋﺔ
اﻟﺒﻴﺎﻧﺎت )ﻟﻨﻔﱰض ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل أﻧﻬﺎ ﺗﺘﻜﻮن ﻣﻦ ٩٩ﻧﺴﺨﺔ ﻣﻦ اﻟﻘﻴﻤﺔ ٠وﻧﺴﺨﺔ
واﺣﺪة ﻣﻦ اﻟﻘﻴﻤﺔ ،(١وﻟﻜﻦ ﻳﻤﻜﻦ اﻟﺘﻐﻠﺐ ﻋﲆ ذﻟﻚ .ﻋﲆ أي ﺣﺎل ،ﻣﺮة أﺧﺮى اﻟﻮﺳﻴﻂ
ﻫﻮ ﻗﻴﻤﺔ ﺗﻤﺜﻴﻠﻴﺔ ﺑﻤﻌﻨًﻰ ﻣﺎ ،وإن ﻛﺎن ﻳﺨﺘﻠﻒ ﻋﻦ املﺘﻮﺳﻂ .وﺑﺴﺒﺐ ﻫﺬا اﻻﺧﺘﻼف ،ﻟﻨﺎ أن
ﻧﺘﻮﻗﻊ أﻧﻪ ﺳﻴﺄﺧﺬ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ ﻋﻦ املﺘﻮﺳﻂ .ﻣﻦ اﻟﻮاﺿﺢ أن اﻟﻮﺳﻴﻂ أﺳﻬﻞ ﰲ اﻟﺤﺴﺎب
ﻓﻀﻼ ﻋﻦ اﻟﻘﺴﻤﺔ ﻋﲆ ﻋﺪد اﻟﻘﻴﻢ ً ﻣﻦ املﺘﻮﺳﻂ .ﻓﻠﻴﺲ ﻋﻠﻴﻨﺎ ﺟﻤﻊ أي ﻗﻴﻢ ﻟﻠﻮﺻﻮل إﻟﻴﻪ،
ﰲ املﺠﻤﻮﻋﺔ؛ ﻛﻞ ﻣﺎ ﻋﻠﻴﻚ اﻟﻘﻴﺎم ﺑﻪ ﻫﻮ ﺗﺮﺗﻴﺐ اﻷرﻗﺎم ،وﺗﺤﺪﻳﺪ ﻣﻮﻗﻊ اﻟﺮﻗﻢ املﻮﺟﻮد ﰲ
أﺳﺎﺳﺎ ﻏريُ ذات ﺻﻠﺔ ﺑﻌﴫ اﻟﻜﻤﺒﻴﻮﺗﺮ؛ ً اﻟﻮﺳﻂ .وﻟﻜﻦ ﰲ اﻟﻮاﻗﻊ ﻫﺬه املﻴﺰة اﻟﺤﺴﺎﺑﻴﺔ
ﻓﻔﻲ اﻟﺘﺤﻠﻴﻼت اﻹﺣﺼﺎﺋﻴﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻳﻘﻮم اﻟﻜﻤﺒﻴﻮﺗﺮ ﺑﻌﻤﻠﻴﺎت املﻌﺎﻟﺠﺔ اﻟﺤﺴﺎﺑﻴﺔ املﻤﻠﺔ.
ﺑﻮﺟﻮد ﻫﺬﻳﻦ املﻠﺨﺼني اﻹﺣﺼﺎﺋﻴني ،وﻛﻼﻫﻤﺎ ﻳﻘﺪﱢم ﻗِ ﻴَﻤً ﺎ ﺗﻤﺜﻴﻠﻴﺔ ،ﻛﻴﻒ ﻟﻨﺎ أن ﻧﺤﺪد
أﻳﻬﻤﺎ ﺳﻨﺴﺘﺨﺪم ﰲ أي ﻣﻮﻗﻒ ﻣﻌني؟ ﺑﻤﺎ أﻧﻬﻤﺎ ﻳُﻌ ﱠﺮﻓﺎن ﻋﲆ ﻧﺤﻮ ﻣﺨﺘﻠﻒ — ﻳﺠﻤﻌﺎن
اﻟﻘﻴﻢ اﻟﺮﻗﻤﻴﺔ ﻋﲆ ﻧﺤﻮ ﻣﺨﺘﻠﻒ — ﻓﻤﻦ املﺮﺟﱠ ﺢ أن ﻳﻨﺘﺠﺎ ﻗﻴﻤً ﺎ ﻣﺨﺘﻠﻔﺔ؛ وﻟﺬﻟﻚ رﺑﻤﺎ ﺗﻜﻮن
أي اﺳﺘﻨﺘﺎﺟﺎت ﺗﺴﺘﻨﺪ إﻟﻴﻬﻤﺎ ﻣﺨﺘﻠﻔﺔ ﻟﻠﻐﺎﻳﺔ .واﻟﺠﻮاب اﻟﻜﺎﻣﻞ ملﺴﺄﻟﺔ أﻳﻬﻤﺎ ﺗﺨﺘﺎر ﺳﻮف
ﻳﺪﺧﻠﻨﺎ ﰲ أﻣﻮر ﻓﻨﻴﺔ ﺗﺘﺠﺎوز ﻣﺴﺘﻮى ﻫﺬا اﻟﻜﺘﺎب ،وﻟﻜﻦ اﻟﺠﻮاب اﻟﻘﺼري ﻫﻮ أن اﻻﺧﺘﻴﺎر
ﺳﻴﻌﺘﻤﺪ ﻋﲆ اﻟﺘﻔﺎﺻﻴﻞ اﻟﺪﻗﻴﻘﺔ ﻟﻠﺴﺆال اﻟﺬي ﻳﺮﻏﺐ املﺮء ﰲ اﻹﺟﺎﺑﺔ ﻋﻨﻪ.
ﻣﺜﺎﻻ :ﻟﻨﻔﱰض أن ﴍﻛﺔ ﺻﻐرية ﻟﺪﻳﻬﺎ َﺧﻤﺲ ﻣﺠﻤﻮﻋﺎت ﻣﻦ املﻮﻇﻔني ،ﻟﻜ ﱟﻞ إﻟﻴﻚ ً
ﻣﻨﻬﺎ درﺟﺔ وﻣﺮﺗﺐ ﻣﺨﺘﻠﻔﺎن؛ وﻫﻲ ﻋﲆ اﻟﱰﺗﻴﺐ ١٠٠٠٠ :دوﻻر ١٠٠٠١ ،دوﻻر١٠٠٠٢ ،
دوﻻر ١٠٠٠٣ ،دوﻻرات ٩٩٩٩٩ ،دوﻻ ًرا .ﻣﺘﻮﺳﻂ ﻫﺬه اﻟﻘِ ﻴَﻢ ﻫﻮ ٢٨٠٠١دوﻻر ،ﰲ ﺣني
أن اﻟﻮﺳﻴﻂ ﻫﻮ ١٠٠٠٢دوﻻر .واﻵن ﻟﻨﻔﱰض أن اﻟﴩﻛﺔ ﺗﻌﺘﺰم ﺗﻮﻇﻴﻒ ﺧﻤﺴﺔ ﻣﻮﻇﻔني
ﺟُ ﺪُد؛ واﺣﺪ ﻟﻜﻞ درﺟﺔ .رﺑﻤﺎ ﻳ ُِﺸري ﺻﺎﺣﺐ اﻟﻌﻤﻞ إﱃ أﻧﻪ ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ،ﺳﻴُﻀﻄﺮ »ﰲ
املﺘﻮﺳﻂ« ﻟﺪﻓﻊ راﺗﺐ إﺟﻤﺎﱄ ﻟﻠﻘﺎدﻣني اﻟﺠُ ﺪُد اﻟﺨﻤﺴﺔ ﻛﻠﻬﻢ ﻳﺒﻠﻎ ٢٨٠٠١دوﻻر؛ وﻣﻦ
ﺛﻢ ﻳﻜﻮن ﻫﺬا ﻫﻮ ﻣﺘﻮﺳﻂ اﻟﺮاﺗﺐ اﻟﺬي ﻳﺬﻛﺮه ﰲ اﻹﻋﻼن .ﻟﻜﻦ رﺑﻤﺎ ﻳﺸﻌﺮ املﻮﻇﻔﻮن أن
ُﺪﻓﻊ ﻟﻬﻢ أﻗﻞ ﻣﻦ ١٠٠٠٢دوﻻرات ﺳﻴﺴﺎوي ﻋﺪد ﻫﺬا ﺗﺤﺎﻳﻞ؛ ﻷن ﻋﺪد املﻮﻇﻔني اﻟﺬﻳﻦ ﺳﻴ َ
34
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ُﺪﻓﻊ ﻟﻬﻢ ﻣﺒﻠﻎ أﻛﺜﺮ ﻣﻦ ١٠٠٠٢دوﻻرات .ورﺑﻤﺎ ﻳﺸﻌﺮون أﻧﻪ ﻣﻦ املﻮﻇﻔني اﻟﺬﻳﻦ ﺳﻴ َ
ﺻﺪﻗﺎ وﺿﻊ ﻫﺬا اﻟﺮﻗﻢ ﰲ اﻹﻋﻼن .أﺣﻴﺎﻧًﺎ ﻳﺘﻄﻠﺐ ﺗﺤﺪﻳﺪ أي املﻘﻴﺎﺳني ﻫﻮ املﻨﺎﺳﺐ ً اﻷﻛﺜﺮ
ﻳﺒني ﺷﻜﻞ 1-2ﺗﻮزﻳﻊ ﻛﻨﺖ ﺗﻌﺘﻘﺪ أن ﻫﺬه اﻟﺤﺠﺔ ﻣﺒﺘﺪَﻋﺔ ،ﱢ ﺗﻔﻜريًا ﻣﺘﺄﻧﱢﻴًﺎ) .وﰲ ﺣﺎل َ
رواﺗﺐ ﻻﻋﺒﻲ اﻟﺒﻴﺴﺒﻮل اﻷﻣﺮﻳﻜﻲ ﻗﺒﻞ اﻹﴐاب ﰲ ﻋﺎم .١٩٩٤ﻛﺎن املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ
١٫٢ﻣﻠﻴﻮن دوﻻر ،وﻟﻜﻦ ﻛﺎن اﻟﻮﺳﻴﻂ ٠٫٥ﻣﻠﻴﻮن دوﻻر(.
أﻳﻀﺎ اﻟﺘﺄﺛري اﻟﻨﺴﺒﻲ ﻟﻠﻘِ ﻴَﻢ املﺘﻄ ﱢﺮﻓﺔ ﻋﲆ املﺘﻮﺳﻂ واﻟﻮﺳﻴﻂ.ﻳﻮﺿﺢ ﻫﺬا املﺜﺎل ً
ْ
وﻟﻜﻦ ﰲ ﻣﺜﺎل املﺮﺗﺒﺎت أﻋﻼه ،ﻳﺴﺎوي املﺘﻮﺳﻂ ﻣﺎ ﻳﻘﺮب ﻣﻦ ﺛﻼﺛﺔ أﺿﻌﺎف اﻟﻮﺳﻴﻂ.
ﺑﺪﻻ ﻣﻦ ٩٩٩٩٩دوﻻ ًرا ،ﺣﻴﻨﻬﺎ ﺳﻴﻈﻞ ﻟﻨﻔﱰض أن أﻛﱪ ﻗﻴﻤﺔ ﻛﺎﻧﺖ ١٠٠٠٤دوﻻرات ً
ِﺼﻒ اﻟﻘِ ﻴَﻢ أﻋﻼه وﻧﺼﻔﻬﺎ أدﻧﺎه( ،ﱠإﻻ أن املﺘﻮﺳﻂ ﺳﻴﺘﻘ ﱠﻠﺺاﻟﻮﺳﻴﻂ ١٠٠٠٢دوﻻرات )ﻧ ْ
إﱃ ١٠٠٠٢دوﻻرات .إن ﺣﺠﻢ ﻗﻴﻤﺔ واﺣﺪة ﻓﻘﻂ ﻳﻤﻜﻦ أن ﻳﻜﻮن ﻟﻪ ﺗﺄﺛري ﻛﺒري ﻋﲆ
املﺘﻮﺳﻂ ،وﻟﻜﻨﻪ ﻻ ﻳﺆﺛﺮ ﻋﲆ اﻟﻮﺳﻴﻂ .وﺣﺴﺎﺳﻴﺔ املﺘﻮﺳﻂ ﺗﻠﻚ ﺣﻴﺎل اﻟﻘِ ﻴَﻢ املﺘﻄﺮﻓﺔ ﻫﻲ
ً
ﻣﻔﻀﻼ ﰲ اﻻﺧﺘﻴﺎر ﻋﻦ املﺘﻮﺳﻂ. أﺣﺪ اﻷﺳﺒﺎب اﻟﺘﻲ ﺗﺠﻌﻞ اﻟﻮﺳﻴﻂ أﺣﻴﺎﻧًﺎ
املﻠﺨﺼني اﻟﻮﺣﻴﺪﻳﻦ ﻟﻠﻘﻴﻢ اﻟﺘﻤﺜﻴﻠﻴﺔ؛ ﻓﺜﻤﺔ ﻣﻠﺨﺺ آﺧﺮ ﱠ ﻟﻴﺲ املﺘﻮﺳﻂ واﻟﻮﺳﻴﻂ
ﻣﻬﻢ ﻫﻮ »املﻨﻮال«؛ وﻫﻮ أﻛﺜﺮ اﻟﻘﻴﻢ ﺗﻜﺮا ًرا ﰲ اﻟﻌﻴﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻟﻨﻔﱰض أﻧﻨﻲ
ﺣﴢ ﻋﺪد اﻷﻃﻔﺎل ﰲ اﻷﴎة ﰲ ﻣﺠﻤﻮﻋﺔ ﺳﻜﺎﻧﻴﺔ ﻣﻌﻴﻨﺔ .رﺑﻤﺎ أﺟﺪ أن ﺑﻌﺾ اﻷ ُ َﴎ ﻟﺪﻳﻬﺎ أُ ِ
ﻃﻔﻞ واﺣﺪ ،وﺑﻌﻀﻬﺎ ﻟﺪﻳﻬﺎ ﻃﻔﻼن ،وﺑﻌﻀﻬﺎ ﺛﻼﺛﺔ ،وﻣﺎ إﱃ ذﻟﻚ ،ورﺑﻤﺎ أﺟﺪ ﻋﲆ وﺟﻪ
اﻟﺨﺼﻮص أن ﻋﺪد اﻷ ُ َﴎ اﻟﺘﻲ ﻟﺪﻳﻬﺎ ﻃﻔﻼن أﻛﱪ ﻣﻦ أي ﻗﻴﻤﺔ أﺧﺮى .ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ،
ﺳﻴﻜﻮن ﻣﻨﻮال ﻋﺪد اﻷﻃﻔﺎل ﻟﻜﻞ أﴎة ﻫﻮ اﺛﻨني.
) (2-2اﻟﺘﺸﺘﺖ
ً
رﻗﻤﻴﺔ واﺣﺪ ًة ٍ
ﻣﻠﺨﺼﺎت املﺘﻮﺳﻄﺎت — ﻋﲆ ﻏﺮار املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ واﻟﻮﺳﻴﻂ —ُ ﺗﻘﺪﱢم
ملﺠﻤﻮﻋﺎت ﻣﻦ اﻟﻘﻴﻢ اﻟﺮﻗﻤﻴﺔ ،وﻫﻲ ﻣﻔﻴﺪة ﻷﻧﻬﺎ ﻳﻤﻜﻦ أن ﺗﻌﻄﻲ ﻣﺆﴍًا ﻋﻦ اﻟﺤﺠﻢ اﻟﻌﺎم
ْ
وﻟﻜﻦ ،ﻛﻤﺎ رأﻳﻨﺎ ﰲ املﺜﺎل اﻟﺴﺎﺑﻖ ،ﻳﻤﻜﻦ ﻟﻠﻘِ ﻴَﻢ اﻟﺘﻠﺨﻴﺼﻴﺔ ﻟﻠﻘﻴﻢ املﻮﺟﻮدة ﰲ اﻟﺒﻴﺎﻧﺎت.
اﻟﻮاﺣﺪة أن ﺗﻜﻮن ﻣﻀ ﱢﻠﻠﺔ .وﻋﲆ وﺟﻪ اﻟﺘﺤﺪﻳﺪ ،ﻗﺪ ﺗﻨﺤﺮف اﻟﻘِ ﻴَﻢ اﻟﺘﻠﺨﻴﺼﻴﺔ اﻟﻮاﺣﺪة ﻛﺜريًا
ﻋﻦ اﻟﻘِ ﻴَﻢ اﻟﻔﺮدﻳﺔ ﰲ ﻣﺠﻤﻮﻋﺔ اﻷرﻗﺎم .وﻟﺘﻮﺿﻴﺢ ذﻟﻚ ،ﻟﻨﻔﱰض أن ﻟﺪﻳﻨﺎ ﻣﺠﻤﻮﻋﺔ ﻣﻦ
ﻣﻠﻴﻮن رﻗﻢ وواﺣﺪ ،ﻟﻬﺎ اﻟﻘﻴﻢ .١٠٠٠٠٠٠ ،… ،٤ ،٣ ،٢ ،١ ،٠ :إن املﺘﻮﺳﻂ واﻟﻮﺳﻴﻂ
ﻛﻠﻴﻬﻤﺎ ﻟﻬﺬه املﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘِ ﻴَﻢ ﻳُﺴﺎوي .٥٠٠٠٠٠وﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ ﺗﻤﺎﻣً ﺎ أن ﻫﺬه
35
ﻋﻠﻢ اﻹﺣﺼﺎء
٤٠٠
٣٠٠
ﻣﻌﺪل اﻟﺘﻜﺮار
٢٠٠
١٠٠
٠
٠ ١ ٢ ٣ ٤ ٥ ٦
اﻟﺮواﺗﺐ ﺑﺎملﻠﻴﻮن دوﻻر
ﺷﻜﻞ :1-2ﺗﻮزﻳﻊ رواﺗﺐ ﻻﻋﺒﻲ اﻟﺒﻴﺴﺒﻮل اﻷﻣﺮﻳﻜﻴني ﰲ ﻋﺎم .١٩٩٤ﻳﺒني املﺤﻮر اﻷﻓﻘﻲ
اﻟﺮواﺗﺐ ﺑﺎملﻠﻴﻮن دوﻻر ،وﻳﺒني املﺤﻮر اﻟﺮأﳼ أﻋﺪاد اﻟﻼﻋﺒني ﰲ ﻛﻞ ﻧﻄﺎق ﻣﻦ اﻟﺮواﺗﺐ.
اﻟﻘﻴﻤﺔ ﻟﻴﺴﺖ ﻗﻴﻤﺔ »ﺗﻤﺜﻴﻠﻴﺔ« ﺟﻴﺪة ﻟﻠﻤﺠﻤﻮﻋﺔ .ﻓﻌﲆ ﻃﺮﰲ املﺠﻤﻮﻋﺔ ،ﺛﻤﺔ ﻗﻴﻤﺔ واﺣﺪة
أﻛﱪ ﺑﻨﺼﻒ ﻣﻠﻴﻮن وﻗﻴﻤﺔ واﺣﺪة أﺻﻐﺮ ﺑﻨﺼﻒ ﻣﻠﻴﻮن ﻣﻦ املﺘﻮﺳﻂ )واﻟﻮﺳﻴﻂ(.
إن ﻣﺎ ﻧﻔﺘﻘﺪه ﻋﻨﺪﻣﺎ ﻧﻌﺘﻤﺪ ﻓﻘﻂ ﻋﲆ املﺘﻮﺳﻂ ﻟﺘﻠﺨﻴﺺ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻫﻮ
ﺑﻌﺾ املﺆﴍات ﺣﻮل ﻣﺪى اﻧﺘﺸﺎر اﻟﺒﻴﺎﻧﺎت ﺣﻮل ﻫﺬا املﺘﻮﺳﻂ؛ ﻫﻞ ﺑﻌﺾ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت
أﻛﱪ ﺑﻜﺜري ﻣﻦ املﺘﻮﺳﻂ؟ ﻫﻞ ﺑﻌﻀﻬﺎ أﺻﻐﺮ ﻣﻨﻪ ﺑﻜﺜري؟ أم إﻧﻬﺎ ﻣﺘﺠﻤﻌﺔ ﰲ ﺗﻘﺎرب ﺣﻮل
املﺘﻮﺳﻂ؟ وﻋﻤﻮﻣً ﺎ ،ﻣﺎ ﻣﺪى اﺧﺘﻼف اﻟﻘِ ﻴَﻢ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ﺑﻌﻀﻬﺎ ﻋﻦ ﺑﻌﺾ؟ ﺗﻘﺪﱢم
املﻘﺎﻳﻴﺲ اﻹﺣﺼﺎﺋﻴﺔ ﻟﻠﺘﺸﺘﺖ ﻫﺬه املﻌﻠﻮﻣﺎت ﺑﺪﻗﺔ ،وﻛﻤﺎ ﻫﻲ اﻟﺤﺎل ﻣﻊ املﺘﻮﺳﻂ ،ﻳﻮﺟﺪ
أﻛﺜﺮ ﻣﻦ ﻣﺠﺮد ﻣﻘﻴﺎس واﺣﺪ.
36
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
أﺑﺴﻂ ﻣﻘﺎﻳﻴﺲ اﻟﺘﺸﺘﺖ ﻫﻮ »املﺪى«؛ واﻟﺬي ﻳُﻌ ﱠﺮف ﺑﺄﻧﻪ اﻟﻔﺮق ﺑني أﻛﱪ وأﺻﻐﺮ
اﻟﻘﻴﻢ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت .ﰲ ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎﺗﻨﺎ املﻜﻮﻧﺔ ﻣﻦ ﻣﻠﻴﻮن رﻗﻢ وواﺣﺪ ،املﺪى
ﻫﻮ .١٠٠٠٠٠٠ = ٠ − ١٠٠٠٠٠٠ :وﰲ ﻣﺜﺎل اﻟﺮواﺗﺐ اﻟﺨﻤﺴﺔ ،املﺪى ﻫﻮ٩٩٩٩٩ :
ﱢ
وﻳﺒني ﻫﺬان املﺜﺎﻻن — اﻟﻠﺬان ﻳﻤﺘﻠﻜﺎن ﻣﺪًى ﻛﺒريًا — أﻧﻪ ﻳﻮﺟﺪ .٨٩٩٩٩ = ١٠٠٠٠ −
َ
اﺧﺘﻼف ﻛﺒري ﻋﻦ املﺘﻮﺳﻂ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﺎن املﻮﻇﻔﻮن ﻳﺘﻘﺎﺿﻮْن رواﺗﺐ ﺗﺒﻠﻎ
٢٧٩٩٩دوﻻ ًرا ٢٨٠٠٠ ،دوﻻر ٢٨٠٠١ ،دوﻻر ٢٨٠٠٢ ،دوﻻر ٢٨٠٠٣ ،دوﻻرات ،ﻓﺈن
أﻳﻀﺎ ٢٨٠٠١دوﻻر ،وﻟﻜﻦ ﺳﻴﻜﻮن املﺪى ٤دوﻻرات ﻓﻘﻂ .ﻫﺬا ﻳﺮﺳﻢ املﺘﻮﺳﻂ ﺳﻴﻜﻮن ً
َ
ﺳﻴﺘﻘﺎﺿﻮْن اﻷﺟﺮ ﺻﻮرة ﻣﺨﺘﻠﻔﺔ ﺟﺪٍّا ﺗﺨﱪﻧﺎ أن املﻮﻇﻔني ﻣﻊ ﻫﺬه اﻟﺮواﺗﺐ اﻟﺠﺪﻳﺪة
ﻧﻔﺴﻪ ﺗﻘﺮﻳﺒًﺎ .أﻣﺎ املﺪى اﻟﻜﺒري ﻣﻦ املﺜﺎل اﻟﺴﺎﺑﻖ — اﻟﺒﺎﻟﻎ ٨٩٩٩٩دوﻻ ًرا — ﻓﻴُﺨﱪﻧﺎ ﻋﲆ
اﻟﻔﻮر أﻧﻪ ﺗﻮﺟﺪ اﺧﺘﻼﻓﺎت ﺿﺨﻤﺔ.
املﺪى ﻣﻘﻴﺎس ﻣﻼﺋﻢ ﻟﻠﻐﺎﻳﺔ وﻟﻪ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﺨﺼﺎﺋﺺ اﻟﺠﺬاﺑﺔ ﻛﻤﻘﻴﺎس ﻟﻠﺘﺸﺘﺖ ،ﻣﻦ
أﻫﻤﻬﺎ ﺑﺴﺎﻃﺘﻪ وإﻣﻜﺎﻧﻴﺔ ﺗﻔﺴريه اﻟﺴﻬﻠﺔ .وﻣﻊ ذﻟﻚ ،ﻣﻦ املﻤﻜﻦ أن ﻧﺸﻌﺮ أﻧﻪ ﻟﻴﺲ ﻣﺜﺎﻟﻴٍّﺎ؛
ﻓﻬﻮ رﻏﻢ ﻛﻞ ﳾء ﻳﺘﺠﺎﻫﻞ ﻣﻌﻈﻢ اﻟﺒﻴﺎﻧﺎت؛ ﺣﻴﺚ ﻳﻌﺘﻤﺪ ﻓﻘﻂ ﻋﲆ أﻛﱪ اﻟﻘﻴﻢ وأﺻﻐﺮﻫﺎ.
وﻟﻠﺘﻮﺿﻴﺢ ،ﺗَﺨﻴﱠ ْﻞ ﻣﺠﻤﻮﻋﺘَني ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﺗﺘﺄﻟﻒ ﻛ ﱞﻞ ﻣﻨﻬﻤﺎ ﻣﻦ أﻟﻒ ﻗﻴﻤﺔ .ﺗﺘﻀﻤﻦ إﺣﺪى
املﺠﻤﻮﻋﺘَني ﻗﻴﻤﺔ واﺣﺪة ﺗﺒﻠﻎ ،٠و ٩٩٨ﻗﻴﻤﺔ ﺗﺒﻠﻎ ،٥٠٠وﻗﻴﻤﺔ واﺣﺪة ﺗﺒﻠﻎ .١٠٠٠
وﺗﺘﻀﻤﻦ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت اﻷﺧﺮى ٥٠٠ﻗﻴﻤﺔ ﺗﺒﻠﻎ ،٠و ٥٠٠ﻗﻴﻤﺔ ﺗﺒﻠﻎ .١٠٠٠ﻣﺪى
أﻳﻀﺎ ﻣﺘﻮﺳﻂ ﻳﺒﻠﻎ ،(٥٠٠ ﻛﻠﺘﺎ ﻣﺠﻤﻮﻋﺘَﻲ اﻟﺒﻴﺎﻧﺎت ﻫﻮ ) ١٠٠٠وﺑﺎملﺼﺎدﻓﺔ ،ﻟﻜﻞ ﻣﻨﻬﻤﺎ ً
وﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ أﻧﻬﻤﺎ ﻣﺨﺘﻠﻔﺘﺎن ﻟﻠﻐﺎﻳﺔ ﰲ ﻃﺒﻴﻌﺘﻬﻤﺎ؛ ﻓﺒﺎﻟﱰﻛﻴﺰ ﻓﻘﻂ ﻋﲆ أﻛﱪ اﻟﻘﻴﻢ
وأﺻﻐﺮﻫﺎ ،ﻓﺸﻞ املﺪى ﰲ ﻛﺸﻒ ﺣﻘﻴﻘﺔ أن ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت اﻷوﱃ ﺗﱰﻛﺰ ﻏﺎﻟﺒًﺎ ﺑﻜﺜﺎﻓﺔ
ﺣﻮل املﺘﻮﺳﻂ.
ﻳﻤﻜﻦ اﻟﺘﻐﻠﺐ ﻋﲆ ﻫﺬا اﻟﻘﺼﻮر ﺑﺎﺳﺘﺨﺪام ﻣﻘﻴﺎس ﻟﻠﺘﺸﺘﺖ ﻳﻀﻊ اﻟﻘﻴﻢ »ﻛﻠﻬﺎ« ﰲ
اﻻﻋﺘﺒﺎر.
إﺣﺪى اﻟﻄﺮق اﻟﺸﺎﺋﻌﺔ ﻟﻠﻘﻴﺎم ﺑﺬﻟﻚ ﻫﻲ أن ﺗﺤﺴﺐ اﻟﻔﺮوق ﺑني املﺘﻮﺳﻂ )اﻟﺤﺴﺎﺑﻲ(
وﻛﻞ رﻗﻢ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ،وﺗﻘﻮم ﺑﱰﺑﻴﻊ ﻫﺬه اﻟﻔﺮوق؛ وﻣﻦ ﺛﻢ ﺗﺤﺴﺐ ﻣﺘﻮﺳﻂ
ﻫﺬه اﻻﺧﺘﻼﻓﺎت املﺮﺑﻌﺔ) .ﺗﺮﺑﻴﻊ اﻟﻔﺮوق ﻳﺠﻌﻞ اﻟﻘِ ﻴَﻢ ﺟﻤﻴﻌﻬﺎ ﻣﻮﺟﺒﺔ .ﻓﺒﺨﻼف ذﻟﻚ،
ﺑﻌﻀﺎ ﻋﻨﺪﻣﺎ ﻧﻘﻮم ﺑﺤﺴﺎب املﺘﻮﺳﻂ(. ً ﺳﻮف ﺗﻠﻐﻲ اﻟﻔﺮوق املﻮﺟﺒﺔ واﻟﺴﺎﻟﺒﺔ ﺑﻌﻀﻬﺎ
وإذا ﻛﺎن املﺘﻮﺳﻂ اﻟﻨﺎﺗﺞ ﻋﻦ اﻟﻔﺮوق املﺮﺑﻌﺔ ﺻﻐريًا ،ﻓﺈﻧﻪ ﻳﺨﱪﻧﺎ ﰲ اﻟﻌﺎدة أن اﻷرﻗﺎم
ﻟﻴﺴﺖ ﻣﺨﺘﻠﻔﺔ ﻛﺜريًا ﻋﻦ ﻣﺘﻮﺳﻄﻬﺎ؛ وﻫﺬا ﻳﻌﻨﻲ أﻧﻬﺎ ﻟﻴﺴﺖ ﻣﺸﺘﺘﺔ ﻋﲆ ﻧﻄﺎق واﺳﻊ.
37
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻳُﺴﻤﱠ ﻰ ﻣﻘﻴﺎس ﻣﺘﻮﺳﻂ اﻟﻔﺮوق املﺮﺑﻌﺔ »ﺗﺒﺎﻳﻦ« اﻟﺒﻴﺎﻧﺎت؛ أو ﻳﺴﻤﱠ ﻰ ﰲ ﺑﻌﺾ اﻟﺘﺨﺼﺼﺎت
»ﻣﺘﻮﺳﻂ ﻣﺮﺑﻌﺎت اﻧﺤﺮاﻓﺎت اﻟﻘِ ﻴَﻢ« .وﺳﻨﻮﺿﺢ اﻷﻣﺮ ﺑﺎﺳﺘﺨﺪام درﺟﺎت اﻟﻄﻼب اﻟﺨﻤﺴﺔ
ﰲ اﻻﺧﺘﺒﺎر اﻟﺘﻲ ﻛﺎﻧﺖ ،٥٥ ،٩١ ،٥٣ ،٦٣ ،٧٨وﻛﺎن ﻣﺘﻮﺳﻄﻬﺎ .٦٨اﻟﻔﺎرق املﺮﺑﻊ ﺑني
اﻟﻨﺘﻴﺠﺔ اﻷوﱃ واملﺘﻮﺳﻂ ﻫﻮ ) ،١٠٠ = ٢ (٦٨ − ٧٨وﻫﻜﺬا .وﻣﺠﻤﻮع اﻟﻔﺮوق املﺮﺑﻌﺔ ﻫﻮ
١٠٤٨ = ١٦٩ + ٥٢٩ + ٢٢٥ + ٢٥ + ١٠٠؛ وﻣﻦ ﺛﻢ ﻓﺈن ﻣﺘﻮﺳﻂ ﻣﺮﺑﻌﺎت اﻧﺤﺮاﻓﺎت
اﻟﻘﻴﻢ ﻫﻮ .٢٠٩٫٦ = ٥ ÷ ١٠٤٨وﻫﺬا ﻫﻮ اﻟﺘﺒﺎﻳﻦ.
ﻳﻨﺸﺄ ﺗﻌﻘﻴﺪ ﻃﻔﻴﻒ ﻣﻦ ﺣﻘﻴﻘﺔ أن اﻟﺘﺒﺎﻳﻦ ﻳﻨﻄﻮي ﻋﲆ ﻗﻴﻢ ﻣﺮﺑﻌﺔ؛ وﻫﺬا ﻳﻌﻨﻲ أن
اﻟﺘﺒﺎﻳﻦ ﻧﻔﺴﻪ ﻳﻘﺎس ﺑ »وﺣﺪات ﻣﺮﺑﻌﺔ« .ﻓﺈذا ﻛﻨﺎ ﻧﻘﻴﺲ إﻧﺘﺎﺟﻴﺔ املﺰارع ﻣﻦ ﺣﻴﺚ أﻃﻨﺎن
اﻟﺬرة ،ﻓﺈن ﺗﺒﺎﻳﻦ اﻟﻘﻴﻢ ﻳُﻘﺎس ﺑ »اﻟﻄﻦ املﺮﺑﻊ« .ﻟﻴﺲ ﺗﺄﺛري ﻫﺬا اﻷﻣﺮ واﺿﺤً ﺎ ،وﺑﺴﺒﺐ ﻫﺬه
اﻟﺼﻌﻮﺑﺔ ،ﻣﻦ اﻟﺸﺎﺋﻊ أن ﻧﺤﺴﺐ اﻟﺠﺬر اﻟﱰﺑﻴﻌﻲ ﻟﻠﺘﺒﺎﻳﻦ .وﻫﺬا ﻳُﻌِ ﻴﺪ وﺣﺪات اﻟﻘﻴﺎس إﱃ
ﻣﻘﻴﺎﺳﺎ ﻟﻠﺘﺸﺘﺖ ﻳُﺴﻤﱠ ﻰ »اﻻﻧﺤﺮاف املﻌﻴﺎري« .وﰲ املﺜﺎل اﻟﺴﺎﺑﻖ،
ً ﺻﻮرﺗﻬﺎ اﻷﺻﻠﻴﺔ ،وﻳُﻨﺘﺞ
ﻳﺘﻤﺜﻞ اﻻﻧﺤﺮاف املﻌﻴﺎري ﻟﺪرﺟﺎت اﻟﻄﻼب ﰲ اﻻﺧﺘﺒﺎر ﰲ اﻟﺠﺬر اﻟﱰﺑﻴﻌﻲ ﻟﻠﻌﺪد ،٢٠٩٫٦
وﻫﻮ .١٤٫٥
ﻳﺘﻐﻠﺐ اﻻﻧﺤﺮاف املﻌﻴﺎري ﻋﲆ املﺸﻜﻠﺔ اﻟﺘﻲ وﺟﺪﻧﺎﻫﺎ ﻣﻊ املﺪى؛ ﻓﻬﻮ ﻳﺴﺘﺨﺪم
اﻟﺒﻴﺎﻧﺎت ﻛﺎﻓﺔ .ﻓﺈذا ﺗﺠﻤﻌﺖ ﻣﻌﻈﻢ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ وﺛﻴﻖ ﺟﺪٍّا ﻣﻌً ﺎ ،ﻣﻊ وﺟﻮد
ﻋﺪد ﻗﻠﻴﻞ ﻣﻦ اﻟﻨﻘﺎط اﻟﻨﺎﺋﻴﺔ ،ﻓﺴﻴﻌﻨﻲ ذﻟﻚ أن اﻻﻧﺤﺮاف املﻌﻴﺎري ﺻﻐري .وﰲ املﻘﺎﺑﻞ،
إذا ﻛﺎﻧﺖ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت ﺗﺘﺨﺬ ﻗِ ﻴَﻤً ﺎ ﻣﺨﺘﻠﻔﺔ ﻟﻠﻐﺎﻳﺔ ،ﺣﺘﻰ إذا ﻛﺎﻧﺖ ﺗﺘﺨﺬ اﻟﻘِ ﻴَﻢ اﻷﻛﱪ
واﻷﺻﻐﺮ ﻧﻔﺴﻬﺎ ،ﻓﺈن اﻻﻧﺤﺮاف املﻌﻴﺎري ﺳﻴﻜﻮن أﻛﱪ ﺑﻜﺜري.
) (3-2اﻻﻟﺘﻮاء
ﺗﺨﱪﻧﺎ ﻣﻘﺎﻳﻴﺲ اﻟﺘﺸﺘﺖ ﺑﻤﺪى اﻧﺤﺮاف اﻟﻘﻴﻢ املﻔﺮدة ﺑﻌﻀﻬﺎ ﻋﻦ ﺑﻌﺾ ،وﻟﻜﻨﻬﺎ ﻻ ﺗﺨﱪﻧﺎ
ﺑﻄﺮﻳﻘﺔ اﻧﺤﺮاﻓﻬﺎ .وﺑﺎﻟﺘﺤﺪﻳﺪ ﻻ ﺗﺨﱪﻧﺎ ﻣﺎ إذا ﻛﺎﻧﺖ اﻻﻧﺤﺮاﻓﺎت اﻷﻛﱪ ﺗﻤﻴﻞ إﱃ أن ﺗﻜﻮن
ﻟﺪى اﻟﻘﻴﻢ اﻟﻜﱪى أم اﻟﻘﻴﻢ اﻟﺼﻐﺮى ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت .ﺗَﺬ ﱠﻛ ْﺮ ﻣﺜﺎﻟﻨﺎ ﻋﻦ ﻣﻮﻇﻔﻲ اﻟﴩﻛﺔ
اﻟﺨﻤﺴﺔ ،واﻟﺬي ﻳﺤﺼﻞ ﻓﻴﻪ أرﺑﻌﺔ ﻣﻮﻇﻔني ﻋﲆ ﺣﻮاﱄ ١٠٠٠٠دوﻻر ﺳﻨﻮﻳٍّﺎ ،ﺑﻴﻨﻤﺎ ﻳﺤﺼﻞ
ﻣﻮﻇﻒ واﺣﺪ ﻋﲆ ﺣﻮاﱄ ﻋﴩة أﺿﻌﺎف ذﻟﻚ .ﻣﻦ ﺷﺄن أي ﻣﻘﻴﺎس ﻟﻠﺘﺸﺘﺖ )اﻻﻧﺤﺮاف
املﻌﻴﺎري ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل( أن ﻳﺨﱪﻧﺎ أن اﻟﻘﻴﻢ ﻣﺸﺘﺘﺔ ﻋﲆ ﻧﻄﺎق واﺳﻊ ﺟﺪٍّا ،وﻟﻜﻨﻪ ﻟﻦ
ُﺨﱪﻧﺎ أن إﺣﺪى اﻟﻘﻴﻢ أﻛﱪ ﺑﻜﺜري ﻣﻦ اﻟﻘﻴﻢ اﻷﺧﺮى .وﺑﺎﻟﻔﻌﻞ ،ﻓﺈن اﻻﻧﺤﺮاف املﻌﻴﺎري ﻳ ِ
38
ﺗﻌﺮﻳﻔﺎت ﺑﺴﻴﻄﺔ
ﻟﻠﻘﻴﻢ اﻟﺨﻤﺴﺔ ٩٠٠٠٠دوﻻر ٨٩٩٩٩ ،دوﻻ ًرا ٨٩٩٩٨ ،دوﻻ ًرا ٨٩٩٩٧ ،دوﻻ ًرا ١ ،دوﻻر؛
ﻫﻮ ﺑﺎﻟﻀﺒﻂ ﻧﻔﺴﻪ ﻟﻠﻘﻴﻢ اﻟﺨﻤﺴﺔ اﻷﺻﻠﻴﺔ .املﺨﺘﻠِﻒ ﻫﻨﺎ ﻫﻮ أن اﻟﻘﻴﻤﺔ اﻟﺸﺎذة )ﻗﻴﻤﺔ
ﺑﺪﻻ ﻣﻦ ﻛﻮﻧﻬﺎ ﻛﺒرية ﺟﺪٍّا .وﻟﺮﺻﺪ ﻫﺬا اﻻﺧﺘﻼف ،ﻧﺤﺘﺎج إﱃ ١دوﻻر( اﻵن ﺻﻐرية ﺟﺪٍّا ً
إﺣﺼﺎﺋﻴﺔ أﺧﺮى ﻟﺘﻠﺨﻴﺺ اﻟﺒﻴﺎﻧﺎت ،إﺣﺼﺎﺋﻴﺔ ﺗﻀﻊ ﰲ اﻻﻋﺘﺒﺎر وﺗﻘﻴﺲ »ﻋﺪم اﻟﺘﻨﺎﻇﺮ« ﰲ
ﺗﻮزﻳﻊ اﻟﻘِ ﻴَﻢ .ﻳﺴﻤﱠ ﻰ أﺣﺪ أﻧﻮاع ﻋﺪم اﻟﺘﻨﺎﻇﺮ ﰲ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ »اﻻﻟﺘﻮاء« .وﻳﻌﺪ ﻣﺜﺎﻟﻨﺎ اﻷﺻﲇ
ﻟﺮواﺗﺐ املﻮﻇﻔني ،اﻟﺬي ﻳﻤﺘﻠﻚ ﻗﻴﻤﺔ واﺣﺪة ﻛﺒرية ﻋﲆ ﻧﺤﻮ ﺷﺎذ ﺗﺒﻠﻎ ٩٩٩٩٩دوﻻ ًرا،
ﻃﻮﻳﻼ ﻳﻤﺘﺪ إﱃ ﻗﻴﻤﺔ ً ً
»ذﻳﻼ« »أﻳﻤﻦ اﻻﻟﺘﻮاء« )أو ﻣﻮﺟﺐ اﻻﻟﺘﻮاء(؛ ﻷن ﺗﻮزﻳﻊ اﻟﻘﻴﻢ ﻳﻤﺘﻠﻚ
واﺣﺪة ﻛﺒرية ﻟﻠﻐﺎﻳﺔ ﻫﻲ ٩٩٩٩٩دوﻻ ًرا .ﻟﻬﺬا اﻟﺘﻮزﻳﻊ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻘﻴﻢ اﻟﺼﻐﺮى وﻋﺪد
ﺳﺎﺑﻘﺎ ،اﻟﺬي ﻳﺘﻀﻤﻦ ً ﻗﻠﻴﻞ ﻟﻠﻐﺎﻳﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﻜﱪى .وﰲ املﻘﺎﺑﻞ ،ﻓﺈن ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﺬﻛﻮر
ﺷﺬوذًا ﻋﻨﺪ ﻗﻴﻤﺔ ١دوﻻر ،ﻳﻜﻮن »أﻳﴪ اﻻﻟﺘﻮاء« )أو ﺳﺎﻟﺐ اﻻﻟﺘﻮاء(؛ ﻷن اﻟﺠﺰء اﻷﻛﱪ ﻣﻦ
اﻟﻘﻴﻢ ﻳﱰاﻛﻢ ﻣﻌً ﺎ ،وﻳﻮﺟﺪ ذﻳﻞ ﻃﻮﻳﻞ ﻳﻤﺘﺪ ﻟﻸﺳﻔﻞ ﻧﺤﻮ اﻟﻘﻴﻤﺔ املﻔﺮدة اﻟﺼﻐرية ﺟﺪٍّا.
اﻟﺘﻮزﻳﻌﺎت املﻮﺟﺒﺔ اﻻﻟﺘﻮاء ﺷﺎﺋﻌﺔ ﻛﺜريًا ،واملﺜﺎل اﻟﻜﻼﺳﻴﻜﻲ ﻋﻠﻴﻬﺎ ﻫﻮ ﺗﻮزﻳﻊ اﻟﺜﺮوة،
واﻟﺬي ﻳﻤﺘﻠﻚ ﻓﻴﻪ اﻟﻌﺪﻳﺪ ﻣﻦ اﻷﻓﺮاد ﻣﺒﺎﻟﻎ ﺻﻐرية ﻓﻴﻤﺎ ﻳﻤﺘﻠﻚ ﻋﺪد ﻗﻠﻴﻞ ﻓﺤﺴﺐ ﻣﻦ
اﻷﻓﺮاد ﻣﻠﻴﺎرات ﻋﺪة ﻣﻦ اﻟﺪوﻻرات .وﻳُﻌَ ﱡﺪ ﺗﻮزﻳﻊ رواﺗﺐ ﻻﻋﺒﻲ اﻟﺒﻴﺴﺒﻮل ﰲ اﻟﺸﻜﻞ 1-2
ﺗﻮزﻳﻌً ﺎ ﻣﻮﺟﺐ اﻻﻟﺘﻮاء ﺑﺸﺪة.
39
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﺒﻴﺎﻧﺎت إﱃ ﴍاﺋﺢ ﻣﺌﻮﻳﺔ( .وﻫﻜﺬا ﻳﻤﻜﻦ وﺻﻒ ﺷﺨﺺ ﺑﺄﻧﻪ ﺣﻘﻖ ﻧﺘﻴﺠﺔ ﻓﻮق ا ُمل َﺆيﱢ
اﻟﺨﺎﻣﺲ واﻟﺘﺴﻌني؛ وﻫﺬا ﻳﻌﻨﻲ أﻧﻪ ﰲ أﻋﲆ ٪٥ﻣﻦ ﻣﺠﻤﻮﻋﺔ اﻟﻨﺘﺎﺋﺞ .واملﺼﻄﻠﺢ اﻟﻌﺎم —
اﻟﺬي ﻳﺘﻀﻤﻦ اﻟ ﱡﺮﺑَﻴْ َﻊ واﻟﻌُ َﺸ ْ َ
ري وا ُمل َﺆيﱠ وﻏريﻫﺎ ﻛﺤﺎﻻت ﺧﺎﺻﺔ — ﻫﻮ »املﻘﺎﻳﻴﺲ اﻟﺘﺠﺰﻳﺌﻴﺔ«.
40
اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ
ً
ﺗﻨﻈﻴﻔﺎ ﻗﺒﻞ اﻻﺳﺘﺨﺪام. اﻟﺒﻴﺎﻧﺎت اﻟﺨﺎم ﻣﺜﻞ اﻟﺒﻄﺎﻃﺲ اﻟﺨﺎم؛ ﻋﺎد ًة ﻣﺎ ﺗﺘﻄﻠﺐ
روﻧﺎﻟﺪ إﻳﻪ ﺛﻴﺴﺘﺪ
ﺗﻮﻓﺮ اﻟﺒﻴﺎﻧﺎت ﻧﺎﻓﺬة ﻋﲆ اﻟﻌﺎﻟﻢ ،وﻟﻜﻦ ﻣﻦ املﻬﻢ أن ﺗﻤﻨﺤﻨﺎ رؤﻳﺔ واﺿﺤﺔ .إن اﻟﻨﺎﻓﺬةﱢ
اﻟﺘﻲ ﺗُﻌﺎﻧِﻲ ﻣﻦ اﻟﺨﺪوش أو اﻟﺘﺸﻮﻫﺎت أو وﺟﻮد ﻋﻼﻣﺎت ﻋﲆ زﺟﺎﺟﻬﺎ ﻣﻦ املﺮﺟﱠ ﺢ أن
ﺗﻀ ﱢﻠﻠﻨﺎ ﺣﻴﺎل ﻣﺎ ﻳﻜﻤﻦ وراءَﻫﺎ ،وﻳﻨﻄﺒﻖ اﻷﻣﺮ ﻧﻔﺴﻪ ﻋﲆ اﻟﺒﻴﺎﻧﺎت .ﻓﺈذا ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت
ٍ
ﺑﻄﺮﻳﻘﺔ ﻣﺎ ،ﻳﻤﻜﻦ ﺑﺴﻬﻮﻟﺔ أن ﺗﻨﺸﺄ ﻋﻨﻬﺎ اﺳﺘﻨﺘﺎﺟﺎت ﺧﺎﻃﺌﺔ .وﻋﻤﻮﻣً ﺎ، ﻣﺸﻮﱠﻫﺔ أو ﺗﺎﻟِﻔﺔ
ﻟﻴﺴﺖ ﻛﻞ اﻟﺒﻴﺎﻧﺎت ذات ﺟﻮدة ﻋﺎﻟﻴﺔ .ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻨﻨﻲ أن أﺗﻌﻤﻖ أﻛﺜﺮ وأﺷري إﱃ أﻧﻪ
ﻧﻮع ،رﺑﻤﺎ
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻟﻴﺲ ﺑﻬﺎ ﻣﺸﺎﻛﻞ ﰲ اﻟﺠﻮدة ﻣﻦ أي ًٍ ﻣﻦ اﻟﻨﺎدر أن ﺗﻘﺎﺑﻞ
ﻗﺎﺑﻠﺖ ﻣﺠﻤﻮﻋﺔ ﻣﻦ ﻣﺜﻞ ﻫﺬه اﻟﺒﻴﺎﻧﺎت »املﺜﺎﻟﻴﺔ« ﻓﻼ ﺑﺪ أن ﺗﺸﻚ ﻓﻴﻬﺎ. َ إﱃ ﺣﺪ أﻧﻚ إذا
رﺑﻤﺎ ﻳﺠﺐ ﻋﻠﻴﻚ وﻗﺘﻬﺎ أن ﺗﺴﺄل ﻋﻦ ﻋﻤﻠﻴﺎت اﻹﻋﺪاد اﻟﺘﻲ ﺧﻀﻌﺖ ﻟﻬﺎ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت،
واﻟﺘﻲ ﺗﺠﻌﻠﻬﺎ ﺗﺒﺪو ﻣﺜﺎﻟﻴﺔ .وﺳﻮف ﻧﻌﻮد إﱃ ﻣﺴﺄﻟﺔ اﻹﻋﺪاد ً
ﻻﺣﻘﺎ.
ﺗﻤﻴﻞ اﻟﺘﻮﺻﻴﻔﺎت اﻟﻘﻴﺎﺳﻴﺔ ﻟﻸﻓﻜﺎر واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ املﻮﺟﻮدة ﰲ اﻟﻜﺘﺐ إﱃ
اﻓﱰاض أن اﻟﺒﻴﺎﻧﺎت ﻟﻴﺲ ﺑﻬﺎ ﻣﺸﺎﻛﻞ )وﻫﻨﺎ ﻳﺼﻒ ﺧﱪاء اﻹﺣﺼﺎء اﻟﺒﻴﺎﻧﺎت ﺑﺄﻧﻬﺎ
»ﻧﻈﻴﻔﺔ« ،ﰲ ﻣﻘﺎﺑﻞ اﻟﺒﻴﺎﻧﺎت »املﻠﻮﺛﺔ« أو »اﻟﻔﻮﺿﻮﻳﺔ«( .وﻫﺬا أﻣﺮ ﻣﻔﻬﻮم؛ ﻷن اﻟﻬﺪف ﻣﻦ
ﻫﺬه اﻟﻜﺘﺐ ﻫﻮ وﺻﻒ اﻟﻄﺮق ،وﻳﻨﺘﻘﺺ ﻣﻦ وﺿﻮح اﻟﻮﺻﻒ ﻗﻮل ﻣﺎ ﻳﺠﺐ اﻟﻘﻴﺎم ﺑﻪ إذا
ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت ﻟﻴﺴﺖ ﻛﻤﺎ ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن .وﻣﻊ ذﻟﻚ ،ﻓﺈن ﻫﺬا اﻟﻜﺘﺎب ﻣﺨﺘﻠﻒ إﱃ ﺣ ﱟﺪ
وﻧﻘﻞ ﻧﻜﻬﺔ املﺠﺎلﻣﺎ؛ ﻓﺎﻟﻬﺪف ﻫﻨﺎ ﻟﻴﺲ ﺗﻌﻠﻴﻢ آﻟﻴﺎت اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ ،وإﻧﻤﺎ ﺗﻘﺪﻳﻢ ْ
اﻟﺤﻘﻴﻘﻲ .وﻣﺠﺎل اﻹﺣﺼﺎء اﻟﺤﻘﻴﻘﻲ ﻳﻨﺒﻐﻲ أن ﻳﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﻠﻮﺛﺔ.
ﻋﻠﻢ اﻹﺣﺼﺎء
42
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﻋﺎم ١٩٣٦ﰲ اﻟﻮﻻﻳﺎت املﺘﺤﺪة ﺑﺄﻏﻠﺒﻴﺔ ﺳﺎﺣﻘﺔ .ﻟﺴﻮء اﻟﺤﻆ ،ﻛﺎﻧﺖ اﻻﺳﺘﺒﻴﺎﻧﺎت ﻗﺪ أُرﺳ َﻠﺖ
ﻓﻘﻂ ﻟﻸﺷﺨﺎص اﻟﺬﻳﻦ ﻟﺪﻳﻬﻢ ﻫﺎﺗﻒ وﺳﻴﺎرة ،وﰲ ﻋﺎم ١٩٣٦ﻛﺎن ﻫﺆﻻء اﻷﺷﺨﺎص أﻛﺜﺮ
ﺛﺮاء ﰲ املﺘﻮﺳﻂ ﻣﻦ إﺟﻤﺎﱄ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .ﻓﻜﺎن اﻷﺷﺨﺎص اﻟﺬﻳﻦ أُرﺳﻠﺖ
إﻟﻴﻬﻢ اﻻﺳﺘﺒﻴﺎﻧﺎت ﻻ ﻳﻤﺜﻠﻮن ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ ﻛﻞ املﺠﻤﻮﻋﺔ املﻄﻠﻮﺑﺔ .وﻛﻤﺎ اﺗﻀﺢ ،اﻟﺠﺰء
اﻷﻛﱪ ﻣﻦ ﻏريﻫﻢ أﻳﱠﺪوا روزﻓﻠﺖ.
ﺛﻤﺔ ﻧﻮع آﺧﺮ ﻣﺨﺘﻠﻒ ﻣﻦ ﺣﺎﻟﺔ اﻻﺳﺘﻨﺘﺎﺟﺎت ﻏري اﻟﺼﺤﻴﺤﺔ اﻟﻨﺎﺷﺌﺔ ﻋﻦ ﻋﺪم ﻣﺮاﻋﺎة
اﻟﺒﻴﺎﻧﺎت املﻔﻘﻮدة ،واﻟﺬي أﺻﺒﺢ ﺣﺎﻟﺔ إﺣﺼﺎﺋﻴﺔ ﻛﻼﺳﻴﻜﻴﺔ ﺛﺎﻧﻮﻳﺔ .ﻫﺬه اﻟﺤﺎﻟﺔ ﻫﻲ ﺣﺎﻟﺔ
ﻣﻜﻮك اﻟﻔﻀﺎء »ﺗﺸﺎﻟﻨﺠﺮ« ،اﻟﺬي اﻧﻔﺠﺮ ﻋﻨﺪ إﻃﻼﻗﻪ ﰲ ﻋﺎم ١٩٨٦؛ ﻣﻤﺎ أﺳﻔﺮ ﻋﻦ ﻣﻘﺘﻞ
ِ
ملﻨﺎﻗﺸﺔ ﻣﺎ إذا ﻛﺎن ﺟﻤﻴﻊ ﻣَ ﻦ ﻛﺎﻧﻮا ﻋﲆ ﻣﺘْﻨﻪ .ﰲ اﻟﻠﻴﻠﺔ اﻟﺘﻲ ﺳﺒﻘﺖ اﻹﻃﻼق ،ﻋُ ﻘﺪ اﺟﺘﻤﺎع
ﻳﻨﺒﻐﻲ املﴤ ﻗﺪﻣً ﺎ ﰲ اﻹﻃﻼق أم ﻻ؛ ﺣﻴﺚ إن ﺗﻮﻗﻌﺎت درﺟﺔ اﻟﺤﺮارة ﰲ ﻣﻮﻋﺪ اﻹﻃﻼق
ﺗﺒني أﻧﻪ ﻋﲆ ﻣﺎ ﻳﺒﺪو ﻻ ﺗﻮﺟﺪ أﺷﺎرت إﱃ أﻧﻬﺎ ﻣﻨﺨﻔﻀﺔ ﻋﲆ ﻧﺤﻮ ﻛﺒري .أُﻧﺘﺠﺖ ﺑﻴﺎﻧﺎت ﱢ ْ
ﻋﻼﻗﺔ ﺑني درﺟﺔ ﺣﺮارة اﻟﻬﻮاء واﻷﴐار اﻟﺘﻲ ﻟﺤﻘﺖ ﺑﺒﻌﺾ أرﺑﻄﺔ اﻟﺼﻮارﻳﺦ املﺴﺎﻋﺪة.
وﻣﻊ ذﻟﻚ ،ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت ﻏري ﻣﻜﺘﻤﻠﺔ ،وﻟﻢ ﺗﺸﻤﻞ ﺟﻤﻴﻊ ﻋﻤﻠﻴﺎت اﻹﻃﻼق اﻟﺘﻲ ﻟﻢ ﺗﻘﻊ
ﺑﻬﺎ »أي« أﴐار .ﻛﺎن ﻫﺬا ﻏري ﻣﻼﺋﻢ ﻷن ﻋﻤﻠﻴﺎت اﻹﻃﻼق اﻟﺘﻲ ﻟﻢ ﺗَ َﻘﻊ ﻓﻴﻬﺎ أي أﴐار
أُﺟﺮﻳﺖ ﰲ اﻟﻐﺎﻟﺐ ﰲ درﺟﺎت ﺣﺮارة أﻋﲆ .ﻛﺎن اﻟﺠﺪول املﺤﺘﻮي ﻋﲆ اﻟﺒﻴﺎﻧﺎت »ﻛﺎﻓﺔ«
ُﻈﻬﺮ ﻋﻼﻗﺔ واﺿﺤﺔ؛ زﻳﺎدة اﺣﺘﻤﺎﻟﻴﺔ وﻗﻮع اﻟﴬر ﰲ درﺟﺎت اﻟﺤﺮارة اﻷﻗﻞ. ﺳﻴ ِ
وﻛﻤﺜﺎل أﺧري ،اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻳﺘﻘﺪﻣﻮن ﺑﻄﻠﺒﺎت ﻟﻠﺤﺼﻮل ﻋﲆ ﻗﺮوض ﻣﴫﻓﻴﺔ
وﺑﻄﺎﻗﺎت اﻻﺋﺘﻤﺎن ،وﻣﺎ ﺷﺎﺑَ َﻪ ذﻟﻚ ،ﻳﺠﺮي ﺣﺴﺎب »ﻣﺠﻤﻮع اﻟﻨﻘﺎط اﻻﺋﺘﻤﺎﻧﻴﺔ« ﻟﻬﻢ؛ وﻫﻲ
ﺗﻠﻌﺐ دو ًرا أﺳﺎﺳﻴٍّﺎ ﰲ ﺗﻘﺪﻳﺮ اﺣﺘﻤﺎﻟﻴﺔ ﻋﺠْ ِﺰﻫﻢ ﻋﻦ اﻟﺴﺪاد .وﺗُﺴﺘﻤﺪ ﻫﺬه اﻟﺘﻘﺪﻳﺮات ﻣﻦ
اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ املﺒﻨﻴﺔ )ﻛﻤﺎ ﻫﻮ ﻣﻮﺿﺢ ﰲ اﻟﻔﺼﻞ اﻟﺴﺎدس( ﺑﺎﺳﺘﺨﺪام ﺑﻴﺎﻧﺎت ﻣﻦ
اﻟﻌﻤﻼء اﻟﺴﺎﺑﻘني اﻟﺬﻳﻦ ﺳﺪدوا دﻳﻮﻧﻬﻢ ﺑﺎﻟﻔﻌﻞ أو ﻋﺠﺰوا ﻋﻦ اﻟﺴﺪاد .وﻟﻜﻦ ﺗﻮﺟﺪ ﻣﺸﻜﻠﺔ؛
ﻓﺎﻟﻌﻤﻼء اﻟﺴﺎﺑﻘﻮن ﻟﻴﺴﻮا ﻣﻤﺜﻠني ﻟﺠﻤﻴﻊ اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﺗﻘﺪﻣﻮا ﺑﻄﻠﺒﺎت ﻟﻠﺤﺼﻮل ﻋﲆ
ﻗﺮض .ﻓﺮﻏﻢ ﻛﻞ ﳾء ،اﺧﺘري اﻟﻌﻤﻼء اﻟﺴﺎﺑﻘﻮن ﻷﻧﻪ ﻛﺎن ﻳُﻌﺘﻘﺪ أﻧﻬﻢ ﻣﺨﺎﻃﺮة ﻣﺄﻣﻮﻧﺔ.
ﻓﻠﻮ ﻛﺎن ﻫﺆﻻء املﺘﻘﺪﻣﻮن ﻋُ ﺪﱡوا ﻣﺨﺎﻃﺮة ﻏري ﻣﺄﻣﻮﻧﺔ ﰲ ﺣﺪ ذاﺗﻬﻢ وﻛﺎن ﻣﻦ املﺮﺟﺢ
أن ﻳﻌﺠﺰوا ﻋﻦ اﻟﺴﺪاد ،ﻣﺎ ﻛﺎﻧﻮا ﻟﻴُﻘﺒَﻠﻮا ﰲ املﻘﺎم اﻷول؛ وﻣﻦ ﺛ َ ﱠﻢ ﻟﻢ ﻳﻜﻮﻧﻮا ﻟﻴﺪﺧﻠﻮا ﰲ
اﻟﺒﻴﺎﻧﺎت .إن أي ﻧﻤﻮذج إﺣﺼﺎﺋﻲ ﻻ ﻳﺄﺧﺬ ﺑﻌني اﻻﻋﺘﺒﺎر ﻫﺬا اﻟﺘﺸﻮﻳﻪ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت
ﻣﻦ املﺮﺟﱠ ﺢ أن ﻳﺆدﱢي إﱃ اﺳﺘﻨﺘﺎﺟﺎت ﺧﺎﻃﺌﺔ .وﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ،ﻳﻤﻜﻦ أن ﻳﻌﻨﻲ ﻫﺬا اﻧﻬﻴﺎر
اﻟﺒﻨﻚ.
43
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻛﺎﻧﺖ ﺑﻌﺾ اﻟﻘِ ﻴَﻢ ﻓﺤﺴﺐ ﻧﺎﻗﺼﺔ ﻟﻜﻞ ﺳﺠﻞ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ﺑﻌﺾ اﻹﺟﺎﺑﺎت ْ إذا
ﻋﲆ اﻻﺳﺘﺒﻴﺎن( ،ﻳﻮﺟﺪ ﻧﻬﺠﺎن أﺳﺎﺳﻴﺎن ﺷﺎﺋﻌﺎن ﻟﻠﺘﺤﻠﻴﻞ .ﻳﺘﻤﺜﻞ أﺣﺪ اﻟﻨﻬﺠني ﺑﺒﺴﺎﻃﺔ ﰲ
ﻧﺒﺬ أي ﺳﺠﻼت ﻏري ﻣﻜﺘﻤﻠﺔ؛ وﻫﺬا ﻳﺘﻀﻤﻦ ﻧﻘﻄﺘَﻲ ﺿﻌﻒ ﻣﺤﺘﻤﻠﺘني ﺧﻄريﺗني؛ أوﻻﻫﻤﺎ:
أﻧﻪ ﻳﻤﻜﻦ أن ﻳﺆدي ﻟﺘﺸﻮﻫﺎت ﻳﺴﺒﺒﻬﺎ اﻟﺘﺤﻴﺰ ﰲ اﻻﺧﺘﻴﺎر ﻣﻦ اﻟﻨﻮع اﻟﺬي ﻧﻮﻗﺶ ً
آﻧﻔﺎ؛ ﻓﺈذا
ﻛﺎﻧﺖ ﺳﺠﻼت ﻣﻦ ﻧﻮع ﻣﻌني أﻛﺜﺮ ﻋﺮﺿﺔ ﻷن ﻳﻜﻮن ﺑﻌﺾ ﻗِ ﻴَﻤﻬﺎ ﻧﺎﻗﺼﺔ ،ﻓﺈن ﺣﺬف
ﻫﺬه اﻟﺴﺠﻼت ﺳﻮف ﻳﱰك ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎت ﻣﺸﻮﻫﺔ .وﻧﻘﻄﺔ اﻟﻀﻌﻒ اﻟﺨﻄرية اﻟﺜﺎﻧﻴﺔ ﻫﻲ
أﻧﻪ ﻳﻤﻜﻦ أن ﻳﺆدي إﱃ اﻧﺨﻔﺎض ﻫﺎﺋﻞ ﰲ ﺣﺠﻢ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت املﺘﺎﺣﺔ ﻟﻠﺘﺤﻠﻴﻞ؛ ﻋﲆ
ﺳﺒﻴﻞ املﺜﺎل ،ﻟﻨﻔﱰض أن اﺳﺘﺒﻴﺎﻧًﺎ ﻳﺤﺘﻮي ﻋﲆ ﻣﺎﺋﺔ ﺳﺆال ،ﻣﻦ املﻤﻜﻦ ﺗﻤﺎﻣً ﺎ ﱠأﻻ ﻳ ُِﺠﻴﺐ
أي ﻣﺸﺎرك ﰲ اﻟﺪراﺳﺔ ﻋﲆ »ﻛﻞ« ﺳﺆال؛ وﻣﻦ ﺛﻢ ﻓﺈن »ﺟﻤﻴﻊ« اﻟﺴﺠﻼت ﺳﺘﺘﻀﻤﻦ ﺷﻴﺌًﺎ
ﻧﺎﻗﺼﺎ؛ وﻫﺬا ﻳﻌﻨﻲ أن ﻧﺒﺬ اﻟﺮدود ﻏري املﻜﺘﻤﻠﺔ ﻣﻦ ﺷﺄﻧﻪ أن ﻳﺆدي إﱃ ﻧﺒﺬ ﻛﺎﻓﺔ اﻟﺒﻴﺎﻧﺎت.ً
اﻟﻨﻬﺞ اﻟﺸﺎﺋﻊ اﻟﺜﺎﻧﻲ ملﻌﺎﻟﺠﺔ اﻟﻘﻴﻢ اﻟﻨﺎﻗﺼﺔ ﻫﻮ إدﺧﺎل ﻗﻴﻢ ﺑﺪﻳﻠﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل،
ﻟﻨﻔﱰض أن ﺑﻨﺪ اﻟﻌﻤﺮ ﻧﺎﻗﺺ ﻣﻦ ﺑﻌﺾ اﻟﺴﺠﻼت ،ﻳﻤﻜﻨﻨﺎ ﺣﻴﻨﻬﺎ اﺳﺘﺒﺪال ﻣﺘﻮﺳﻂ
اﻷﻋﻤﺎر املﺴﺠﻠﺔ ﺑﺎﻟﻘﻴﻢ املﻔﻘﻮدة .وﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أن ﻫﺬا ﻳﻨﺘﺞ ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎت ﻛﺎﻣﻠﺔ
أﻳﻀﺎ؛ ﻓﻔﻲ ﻫﺬه )ﺳﻮاء أﻛﻤﻠﻬﺎ املﺸﺎرﻛﻮن ﰲ اﻟﺪراﺳﺔ أو أﻛﻤﻠﻨﺎﻫﺎ ﻧﺤﻦ( ،ﻓﺈﻧﻪ ﻟﻪ ﻋﻴﻮب ً
اﻟﺤﺎﻟﺔ ﻧﻜﻮن ﻗﺪ اﺧﺘﻠﻘﻨﺎ اﻟﺒﻴﺎﻧﺎت ﰲ اﻷﺳﺎس.
إذا ﻛﺎن ﻫﻨﺎك ﺳﺒﺐ ﻟﻠﺸﻚ ﰲ أن ﻏﻴﺎب ﻋﺪد ﻣﻌني إﻧﻤﺎ ﻳﺮﺗﺒﻂ ﺑﺎﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻛﺎن
ﺳﻴﻤﺘﻠﻜﻬﺎ ﻟﻮ ﻛﺎن ﺣﺎﴐً ا )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﺎن ﻛﺒﺎر اﻟﺴﻦ أﻗﻞ ﰲ اﺣﺘﻤﺎﻟﻴﺔ اﻟﺘﻌﺮﻳﻒ
ﺗﻔﺼﻴﻼ .ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ ﺑﻨﺎء ً ﺑﺴﻨﱢﻬﻢ( ،ﻓﺜﻤﺔ ﺣﺎﺟﺔ إﱃ وﺟﻮد أﺳﺎﻟﻴﺐ إﺣﺼﺎﺋﻴﺔ أﻛﺜﺮ ِ
ﻧﻤﻮذج إﺣﺼﺎﺋﻲ ﻻﺣﺘﻤﺎﻟﻴﺔ ﻧﻘﺼﺎن اﻟﺒﻴﺎﻧﺎت — رﺑﻤﺎ ﻣﻦ اﻟﻨﻮع اﻟﺬي ﻳﺘﻨﺎوﻟﻪ اﻟﻔﺼﻞ
اﻟﺴﺎدس — وﻛﺬﻟﻚ ﻟﻠﻌﻼﻗﺎت اﻷﺧﺮى املﻮﺟﻮدة داﺧﻞ اﻟﺒﻴﺎﻧﺎت.
وﻣﻦ اﻟﺠﺪﻳﺮ ﺑﺎﻟﺬﻛﺮ أﻧﻪ ﻣﻦ اﻟﴬوري ﻗﺒﻮل ﺣﻘﻴﻘﺔ أﻧﻪ ﻟﻴﺴﺖ ﻛﻞ اﻟﻘﻴﻢ ﻗﺪ ُﺳﺠﱢ َﻠﺖ.
وﻣﻦ املﻤﺎرﺳﺎت اﻟﺸﺎﺋﻌﺔ اﺳﺘﺨﺪام رﻣﺰ ﺧﺎص ﻟﻺﺷﺎرة إﱃ أن اﻟﻘﻴﻤﺔ ﻧﺎﻗﺼﺔ؛ ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎل ،ﻣﻦ اﻟﺸﺎﺋﻊ اﺳﺘﺨﺪام رﻣﺰ N/Aاﺧﺘﺼﺎ ًرا ﻟﻌﺒﺎرة Not Availableﺑﻤﻌﻨﻰ »ﻏري
ُﻣﺘَﺎح« ،وﻟﻜﻦ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ﻳﺘﻢ اﺳﺘﺨﺪام رﻣﻮز رﻗﻤﻴﺔ ﻣﺜﻞ ٩٩٩٩ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻌﻤﺮ.
وﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ،اﻹﺧﻔﺎق ﰲ ﺟﻌﻞ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ ﻳﺪرك أن ٩٩٩٩ﻳﻤﺜﻞ اﻟﻘﻴﻢ اﻟﻨﺎﻗﺼﺔ
ﻳﻤﻜﻦ أن ﻳﺆدي إﱃ ﻧﺘﻴﺠﺔ ﻏري دﻗﻴﻘﺔ إﱃ ﺣ ﱟﺪ ﻛﺒري .ﺗَﺨﻴﱠ ْﻞ ﻣﺎ ﺳﻴﻜﻮن ﻋﻠﻴﻪ ﻣﺘﻮﺳﻂ اﻟﻌﻤﺮ
املﻘﺪﱠر ﻋﻨﺪﻣﺎ ﻳﺪﺧﻞ ﻋﺪد ﻛﺒري ﻣﻦ اﻟﻘﻴﻢ ٩٩٩٩ﰲ ﻋﻤﻠﻴﺔ اﻟﺤﺴﺎب.
44
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﱠ
ﻣﺘﻮﻗﻌً ﺎ ،ﻻ ﻳﻮﺟﺪ ﺣ ﱞﻞ ﻣﺜﺎﱄ ﻟﻠﺒﻴﺎﻧﺎت اﻟﻨﺎﻗﺼﺔ؛ ﻋﻤﻮﻣً ﺎ ،وﻟﻌﻞ ﻫﺬا ﻳﻨﺒﻐﻲ أن ﻳﻜﻮن
ﻓﺠﻤﻴﻊ ﻃﺮق اﻟﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ ﺗﺘﻄﻠﺐ إﻗﺤﺎم ﻧﻮع ﻣﻦ اﻻﻓﱰاﺿﺎت اﻹﺿﺎﻓﻴﺔ ،واﻟﺤﻞ اﻷﻓﻀﻞ
ﻫﻮ ﺗﻘﻠﻴﻞ املﺸﻜﻠﺔ أﺛﻨﺎء ﻣﺮﺣﻠﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت.
45
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺑﺪﻻ ﻣﻦ ،(٨٢أو ﻳﻤﻜﻦ اﻟﺨﻠﻂ ﺗﺼﻠﻪ أﺧﻄﺎء اﻟﺘﺴﺠﻴﻞ ،ﻳﻤﻜﻦ أن ﺗُﻌﻜﺲ اﻷرﻗﺎم )ً ،٢٨
اﺣﺘﻤﺎﻻ ﰲ أوروﺑﺎ؛ ﺣﻴﺚ إن ٧ ً ﺑني اﻟﺮﻗﻢ ٧املﻜﺘﻮب ﺑﺨﻂ اﻟﻴﺪ ﻣﻊ اﻟﺮﻗﻢ ) ١وﻫﺬا أﻗﻞ
ﻳﻜﺘﺐ ،(٧أو ﻗﺪ ﺗﻮﺿﻊ اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﻌﻤﻮد اﻟﺨﻄﺄ ﰲ اﻟﻨﻤﻮذج ،وﺑﻬﺬا ﺗﺘﻀﺎﻋﻒ اﻟﻘﻴﻢ
ﻣﺼﺎدﻓﺔ ﺑﻤﻘﺪار ﻋﴩة أﺿﻌﺎف ،أو رﺑﻤﺎ ﻳﺤﺪث ﺧﻠﻂ ﺑني اﻟﻨﻤﻂ اﻷﻣﺮﻳﻜﻲ ﻟﻜﺘﺎﺑﺔ اﻟﺘﺎرﻳﺦ
)ﺷﻬﺮ/ﻳﻮم/ﺳﻨﺔ( وﻧﻤﻂ املﻤﻠﻜﺔ املﺘﺤﺪة )ﻳﻮم/ﺷﻬﺮ/ﺳﻨﺔ( ،أو اﻟﻌﻜﺲ ،وﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ.
ﻃ َﺮ َد اﻟﻔﻠﻜﻲ املﻠﻜﻲ ﻧﻴﻔﻴﻞ ﻣﺎﺳﻜﻴﻠني ﻣﺴﺎﻋﺪه دﻳﻔﻴﺪ ﻛﻴﻨﱪوك ﻋﲆ أﺳﺎس ﰲ ﻋﺎم َ ،١٧٩٦
َﻌﱪ ﻓﻴﻬﺎ ﻧﺠﻢ ﻣﺨﺘﺎر ﻟﺨﻂ اﻟﺰوال ﻋﻦ ﻃﺮﻳﻖ أﺣﺪ أن ﻣﺸﺎﻫﺪات اﻷﺧري ﻟﻸوﻗﺎت اﻟﺘﻲ ﻳ ُ
اﻟﺘﻠﺴﻜﻮﺑﺎت ﰲ ﺟﺮﻳﻨﺘﺶ ﻟﻢ ﺗﻜﻦ دﻗﻴﻘﺔ ﺟﺪٍّا .ﻛﺎن ﻫﺬا اﻷﻣﺮ ﻣﻬﻤٍّ ﺎ ﻷن دﻗﺔ اﻟﺴﺎﻋﺔ ﰲ
ﺟﺮﻳﻨﺘﺶ ﺗﺘﻮﻗﻒ ﻋﲆ اﻟﻘﻴﺎﺳﺎت اﻟﺪﻗﻴﻘﺔ ﻷوﻗﺎت اﻟﻌﺒﻮر ،وﺗﻘﺪﻳﺮات ﺧﻄﻮط اﻟﻄﻮل ﻟﺪى
ﺳﻔﻦ اﻟﺪوﻟﺔ ﺗﻌﺘﻤﺪ ﻋﲆ اﻟﺴﺎﻋﺔ ،واﻹﻣﱪاﻃﻮرﻳﺔ اﻟﱪﻳﻄﺎﻧﻴﺔ ﺗﻌﺘﻤﺪ ﻋﲆ ﺳﻔﻨﻬﺎ .وﻣﻊ ذﻟﻚ،
ﺗﺄﺧﺮ رد اﻟﻔﻌﻞ اﻟﻨﻔﴘ وﻇﺎﻫﺮة ﻓﴪ اﻟﺒﺎﺣﺜﻮن ﺑﻌﺪ ذﻟﻚ أﺳﺒﺎب ﻋﺪم اﻟﺪﻗﺔ ﻫﺬه ﰲ ﺿﻮء ﱡ ﱠ
اﻟﺘﻘﺮﻳﺐ اﻟﻼواﻋﻲ املﺬﻛﻮرة أﻋﻼه .وﻛﻤﺜﺎل أﺧري ﻣﻦ ﺑني ﻛﺜري ﻣﻦ اﻷﻣﺜﻠﺔ اﻟﺘﻲ ﻛﺎن ﻳﻤﻜﻦ
ﻃ ﱢﻠﻘﺖأن أﺧﺘﺎرﻫﺎ ،أﺷﺎر ﺗﻌﺪاد اﻟﻮﻻﻳﺎت املﺘﺤﺪة ﻟﻌﺎم ١٩٧٠إﱃ وﺟﻮد ٢٨٩ﻓﺘﺎة ُرﻣﱢ ﻠﺖ و ُ
أﻳﻀﺎ ﻧﻘﻄﺔ ﻋﺎﻣﺔ ،وﻫﻲ أﻧﻪ ﻛﻠﻤﺎ زاد ﰲ اﻟﻮﻗﺖ ﻧﻔﺴﻪ ﰲ ﺳﻦ .١٤وﻳﺠﺐ أن ﻧﻼﺣﻆ ً
املﺸﺎرﻛﺔ
ِ ﺣﺠﻢ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ،زاد ﻋﺪد املﺸﺎرﻛني ﰲ ﺗﺠﻤﻴﻌﻬﺎ ،وﻛﻠﻤﺎ زادت املﺮاﺣﻞ
ﰲ ﻣﻌﺎﻟﺠﺘﻬﺎ ،زاد اﺣﺘﻤﺎل اﺣﺘﻮاﺋﻬﺎ ﻋﲆ أﺧﻄﺎء.
ﻛﺜريًا ﻣﺎ ﺗﻨﺸﺄ أﻣﺜﻠﺔ أﺧﺮى ﻷﺧﻄﺎء اﻟﺒﻴﺎﻧﺎت ﻣﻦ املﺴﺘﻮى اﻷدﻧﻰ ﻣﻦ وﺣﺪات اﻟﻘﻴﺎس،
ﺑﺪﻻ ﻣﻦ اﻟﻜﻴﻠﻮﺟﺮام .ﰲ ﻋﺎم ﺑﺪﻻ ﻣﻦ َ
اﻟﻘﺪَم ،أو اﻟﻮزن ﺑﺎﻟﺮﻃﻞ ً ﻣﺜﻞ ﺗﺴﺠﻴﻞ اﻟﻄﻮل ﺑﺎملﱰ ً
ُ ،١٩٩٩ﻓﻘﺪ »ﻣﺴﺒﺎر ﻣﻨﺎخ املﺮﻳﺦ« ﻋﻨﺪﻣﺎ ﻓﺸﻞ ﰲ دﺧﻮل اﻟﻐﻼف اﻟﺠﻮي ﻟﻠﻤﺮﻳﺦ ﺑﺎﻟﺰاوﻳﺔ
آﺧﺮاﻟﺼﺤﻴﺤﺔ ﺑﺴﺒﺐ اﻟﺨﻠﻂ ﺑني ﻗﻴﺎﺳﺎت اﻟﻀﻐﻂ ﺑﻮﺣ َﺪﺗَﻲ اﻟﺮﻃﻞ واﻟﻨﻴﻮﺗﻦ .وﰲ ﻣﺜﺎل َ
ِ
ﻟﻠﺨﻠﻂ ﺑني وﺣﺪات اﻟﻘﻴﺎس — وﻫﺬه املﺮة ﰲ ﺳﻴﺎق ﻃﺒﻲ — ﻛﺎﻧﺖ ﻣﺴﺘﻮﻳﺎت اﻟﻜﺎﻟﺴﻴﻮم
ﻋﺎدﻳﺔ ،ﰲ ﻧﻄﺎق ٨٫٦ﺣﺘﻰ ،٩٫١ﻟﻜﻦ ﺑَﺪ ْ
َت ً ٍ
ﻣﺴﺘﻮﻳﺎت ﻣﺴﻨﱠﺔ ﻋﺎد ًة
ﰲ اﻟﺪم ﻋﻨﺪ ﺳﻴﺪة ِ
ﻓﺠﺄة أﻧﻬﺎ اﻧﺨﻔﻀﺖ إﱃ ﻗﻴﻤﺔ أﻗ ﱠﻞ ﻣﻦ ذﻟﻚ ﺑﻜﺜري ﺗﺒﻠﻎ .٤٫٨ﻛﺎﻧﺖ املﻤﺮﺿﺔ املﺴﺌﻮﻟﺔ
ﻋﲆ وﺷﻚ أن ﺗﺒﺪأ ﰲ ﺣﻘﻨﻬﺎ ﺑﺎﻟﻜﺎﻟﺴﻴﻮم ﻋﻨﺪﻣﺎ اﻛﺘﺸﻒ اﻟﺪﻛﺘﻮر ﺳﻠﻔﺎﺗﻮري ﺑﻴﻨﻔﻴﻨﺠﺎ
أن اﻻﻧﺨﻔﺎض اﻟﻈﺎﻫﺮي ﻛﺎن ﺑﺒﺴﺎﻃﺔ ﺑﺴﺒﺐ أن املﺨﺘﱪ ﻏري وﺣﺪات اﻟﻘﻴﺎس اﻟﺘﻲ ﻛﺎن
ﻣﲇﻳﺴﺘﺨﺪﻣﻬﺎ ﰲ ﺗﻘﺪﻳﻢ ﺗﻘﺎرﻳﺮ اﻟﻨﺘﺎﺋﺞ )ﻣﻦ ﻣ ﱢﻠﻴﺠﺮام ﻟﻜﻞ دﻳﺴﻴﻠﱰ )ﻋُ ْﴩ اﻟﻠﱰ( إﱃ ﱢ
ﻣﻜﺎﻓﺊ ﻟﻜﻞ ﻟﱰ(.
46
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
) (4اﻹﻋﺪاد
ﻛﻤﺎ ﻳﺠﺐ أن ﻳﻜﻮن واﺿﺤً ﺎ ﻣﻦ اﻷﻣﺜﻠﺔ اﻟﺴﺎﺑﻘﺔ ،ﻓﺈن ﻋﻨﴫًا أﺳﺎﺳﻴٍّﺎ أوﻟﻴٍّﺎ ﰲ أي ﺗﺤﻠﻴﻞ
إﺣﺼﺎﺋﻲ ﻳﺘﻤﺜﻞ ﰲ اﻟﻔﺤﺺ اﻟﺪﻗﻴﻖ ﻟﻠﺒﻴﺎﻧﺎت واﻟﺘﺤﻘﻖ ﻣﻦ وﺟﻮد اﻷﺧﻄﺎء وﺗﺼﺤﻴﺤﻬﺎ ْ
إن
أﻣﻜﻦ .وﰲ ﺑﻌﺾ اﻟﺴﻴﺎﻗﺎت ،ﻳﻤﻜﻦ أن ﺗﺴﺘﻐﺮق ﻫﺬه املﺮﺣﻠﺔ اﻷوﻟﻴﺔ وﻗﺘًﺎ أﻃﻮل ﻣﻦ ﻣﺮاﺣﻞ
اﻟﺘﺤﻠﻴﻞ اﻟﻼﺣﻘﺔ.
ﺛﻤﺔ ﻣﻔﻬﻮم رﺋﻴﴘ ﰲ ﺗﻨﻈﻴﻒ اﻟﺒﻴﺎﻧﺎت ﻫﻮ »اﻟﻘﻴﻤﺔ اﻟﺸﺎذة« .واﻟﻘﻴﻤﺔ اﻟﺸﺎذة ﻫﻲ
ﻗﻴﻤﺔ ﺗﺨﺘﻠﻒ ﻛﺜريًا ﻋﻦ اﻟﻘﻴﻢ اﻷﺧﺮى ،أو ﻋﻤﺎ ﻫﻮ ﻣﺘﻮﻗﻊ ،وﺗﻜﻮن ﺧﺎرﺟﺔ ﻋﻦ ذﻳﻞ اﻟﺘﻮزﻳﻊ.
وأﺣﻴﺎﻧًﺎ ﺗﺤﺪُث ﻫﺬه اﻟﻘﻴﻢ املﺘﻄﺮﻓﺔ ﺑﻔﻌﻞ املﺼﺎدﻓﺔ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أن
ﻣﻌﻈﻢ ﺣﺎﻻت اﻟﻄﻘﺲ ﺗﻜﻮن ﻣﻌﺘﺪﻟﺔ إﱃ ﺣ ﱟﺪ ﻣﺎ ،ﻓﺈن اﻟﻌﻮاﺻﻒ اﻟﺸﺪﻳﺪة ﺗﺤﺪث ﺑﺎﻟﻔﻌﻞ ﰲ
ً
ﺳﺎﺑﻘﺎ، ﺑﻌﺾ اﻷﺣﻴﺎن .وﻟﻜﻦ ﰲ ﺣﺎﻻت أﺧﺮى ﻳﻨﺸﺄ اﻟﺸﺬوذ ﺑﺴﺒﺐ أﻧﻮاع اﻷﺧﻄﺎء املﻮﺿﺤﺔ
ﻣﺜﻞ ﻣﻘﻴﺎس ﺷﺪة اﻟﺮﻳﺢ اﻟﺬي ﻳﺸري ﻇﺎﻫﺮﻳٍّﺎ إﱃ ﻋﺎﺻﻔﺔ ﺿﺨﻤﺔ ﻣﻔﺎﺟﺌﺔ ﻣﻦ اﻟﺮﻳﺎح ﰲ
ﻛﻞ ﻣﻨﺘﺼﻒ ﻟﻴﻞ ،ﺗﺰاﻣﻨًﺎ ﻣﻊ اﻟﻮﻗﺖ ﻧﻔﺴﻪ اﻟﺬي ﻳﻌﻴﺪ ﻓﻴﻪ ﺗﻠﻘﺎﺋﻴٍّﺎ ﻣﻌﺎﻳﺮة ﻧﻔﺴﻪ؛ ﻟﺬﻟﻚ
ﻳﻌﺪ اﻟﺒﺤﺚ ﻋﻦ اﻟﻘﻴﻢ اﻟﺸﺎذة اﺳﱰاﺗﻴﺠﻴﺔ ﻋﺎﻣﺔ ﺟﻴﺪة ﻟﻠﻜﺸﻒ ﻋﻦ اﻷﺧﻄﺎء ﰲ اﻟﺒﻴﺎﻧﺎت،
ﺷﺨﺺ ﻣﺎ .ورﺑﻤﺎ ﺗﻜﻮن ﻫﺬه اﻟﻘﻴﻢ ﻗﻴﻤً ﺎ
ٍ واﻟﺘﻲ ﻳﻤﻜﻦ ﺑﻌﺪ ذﻟﻚ اﻟﺘﺤﻘﻖ ﻣﻨﻬﺎ ﻋﻦ ﻃﺮﻳﻖ
47
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺷﺎذة ﺧﺎﺻﺔ ﺑﻤﺘﻐريات ﻣﻔﺮدة )ﻣﺜﻞ اﻟﺮﺟﻞ اﻟﺒﺎﻟﻎ ﻣﻦ اﻟﻌﻤﺮ ٢١٠ﺳﻨﻮات( ،أو ﻣﺘﻐريات
ﻣﺘﻌﺪدة ،ﻟﻴﺲ أيﱞ ﻣﻨﻬﺎ ﻗﻴﻤﺔ ﺷﺎذة ﰲ ﺣﺪ ذاﺗﻪ )ﻣﺜﻞ اﻟﻔﺘﺎة اﻟﺒﺎﻟﻐﺔ ﻣﻦ اﻟﻌﻤﺮ ٥ﺳﻨﻮات
وﻟﺪﻳﻬﺎ ٣أﻃﻔﺎل(.
ﺷﺎﻣﻼ ﻟﻠﻜﺸﻒ ﻋﻦ اﻷﺧﻄﺎء ﰲ ً ﻛﺸﻒ اﻟﻘﻴﻤﺔ اﻟﺸﺎذة ﻟﻴﺲ ٍّ
ﺣﻼ وﺑﻄﺒﻴﻌﺔ اﻟﺤﺎلْ ،
اﻟﺒﻴﺎﻧﺎت؛ ﻓﺮﻏﻢ ﻛﻞ ﳾء ،ﻳﻤﻜﻦ اﻟﻮﻗﻮع ﰲ أﺧﻄﺎء ﺗﺆدي إﱃ ﻗﻴﻢ ﺗﻈﻬﺮ ﻃﺒﻴﻌﻴﺔ ﺗﻤﺎﻣً ﺎ.
ﺷﺨﺺ ﻣﺎ ﻋﻦ ﻃﺮﻳﻖ اﻟﺨﻄﺄ ﻋﲆ أﻧﻪ أﻧﺜﻰ ً
ﺑﺪﻻ ﻣﻦ ﻛﻮﻧﻪ ذﻛ ًﺮا .وأﻓﻀﻞ ٍ ﻓﺮﺑﻤﺎ ﻳُﺪ َرج ﺟﻨﺲ
ﺣﻞ ﻫﻮ ﺗﺒﻨﱢﻲ ﻣﻤﺎرﺳﺎت إدﺧﺎل ﺑﻴﺎﻧﺎت ﺗﻘﻠﻞ ﻣﻦ ﻋﺪد ﻣﻦ اﻷﺧﻄﺎء .وﺳﻨﺘﻨﺎول ﻫﺬا اﻷﻣﺮ
ﺗﺎل.
ﺑﺎﻟﺘﻔﺼﻴﻞ ﰲ ﺟﺰء ٍ
ُ
ﻣﺸﻜﻠﺔ ﻣﺎ ﻳﺠﺐ اﻟﻘﻴﺎم ﺑﻪ ﺣﻴﺎﻟﻪ .ﻳﻤﻜﻦ أن ﻧﺤﺬف إذا اﻛﺘُﺸﻒ ﺧﻄﺄ واﺿﺢ ،ﺗﻮاﺟﻬﻨﺎ
اﻟﻘﻴﻤﺔ ،ﻣﻌﺘﱪﻳﻦ أﻧﻬﺎ ﻗﻴﻤﺔ ﻧﺎﻗﺼﺔ ،ﺛﻢ ﻧﺤﺎول اﺳﺘﺨﺪام أﺣﺪ إﺟﺮاءات اﻟﻘﻴﻢ اﻟﻨﺎﻗﺼﺔ
ﺳﺎﺑﻘﺎ .وأﺣﻴﺎﻧًﺎ ﻳﻤﻜﻨﻨﺎ وﺿﻊ ﺗﺨﻤني ذﻛﻲ ملﺎ ﻛﺎن ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن ﻋﻠﻴﻪ ﻫﺬه ً املﺬﻛﻮرة
اﻟﻘﻴﻤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻟﻨﻔﱰض أﻧﻪ ﺧﻼل ﺗﺴﺠﻴﻞ أﻋﻤﺎر ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻄﻼب ،ﺣﺼﻞ
اﻟﺸﺨﺺ ﻋﲆ ﺳﻠﺴﻠﺔ اﻟﻘﻴﻢ .٢٣ ،١٨ ،١٨ ،٢١٠ ،١٩ ،٢٣ ،٢١ ،١٧ ،١٩ ،١٨وﺑﺪراﺳﺔ
ﻫﺬه اﻟﻘﻴﻢ ،رﺑﻤﺎ ﻧﻌﺘﻘﺪ أﻧﻪ ﻣﻦ املﺮﺟﺢ أن اﻟﻘﻴﻤﺔ ٢١٠ﻗﺪ دﺧﻠﺖ ﰲ اﻟﻌﻤﻮد اﻟﺨﻄﺄ ،وأﻧﻪ
ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن .٢١وﺑﺎملﻨﺎﺳﺒﺔ ،ﻻﺣﻆ ﻋﺒﺎرة »ﺗﺨﻤني ذﻛﻲ« املﺴﺘﺨﺪﻣﺔ أﻋﻼه .ﻓﻜﻤﺎ
ﻫﻲ اﻟﺤﺎل ﻣﻊ ﻛﻞ ﺗﺤﻠﻴﻼت اﻟﺒﻴﺎﻧﺎت اﻹﺣﺼﺎﺋﻴﺔ ،ﻓﺈن اﻟﺘﻔﻜري املﺘﺄﻧﻲ أﻣﺮ ﺑﺎﻟﻎ اﻷﻫﻤﻴﺔ.
ﻓﻠﻴﺲ اﻷﻣﺮ ﻣﺠﺮد ﻣﺴﺄﻟﺔ اﺧﺘﻴﺎر ﻃﺮﻳﻘﺔ إﺣﺼﺎﺋﻴﺔ ﻣﻌﻴﻨﺔ وﺗﺮك اﻟﻜﻤﺒﻴﻮﺗﺮ ﻟﻴﻘﻮم ﺑﺎﻟﻌﻤﻞ؛
ﻓﺎﻟﻜﻤﺒﻴﻮﺗﺮ ﻻ ﻳﻘﻮم إﻻ ﺑﺎﻟﻌﻤﻠﻴﺎت اﻟﺤﺴﺎﺑﻴﺔ وﺣﺴﺐ.
ﻛﺎن ﻣﺜﺎل أﻋﻤﺎر اﻟﻄﻼب ﰲ اﻟﻔﻘﺮة اﻟﺴﺎﺑﻘﺔ ﺻﻐريًا ﻟﻠﻐﺎﻳﺔ؛ إذ ﻛﺎن ﻳﺤﺘﻮي ﻓﺤﺴﺐ
ﻋﲆ ﻋﴩة أرﻗﺎم؛ ﻟﺬﻟﻚ ﻛﺎن ﻣﻦ اﻟﺴﻬﻞ اﻟﻨﻈﺮ ﻓﻴﻬﺎ وﺗﺤﺪﻳﺪ اﻟﻘﻴﻤﺔ اﻟﺸﺎذة ،ووﺿﻊ
ﺗﺨﻤني ذﻛﻲ ﺣﻮل ﻣﺎ ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن ﻋﻠﻴﻪ ﻫﺬه اﻟﻘﻴﻤﺔ .وﻟﻜﻨﻨﺎ ﻧﻮاﺟﻪ ﻋﲆ ﻧﺤﻮ ﻣﺘﺰاﻳﺪ
ﻣﺠﻤﻮﻋﺎت ﺑﻴﺎﻧﺎت أﻛﱪ وأﻛﱪ .إن ﻣﺠﻤﻮﻋﺎت اﻟﺒﻴﺎﻧﺎت املﻜﻮﻧﺔ ﻣﻦ ﻋﺪة ﻣﻠﻴﺎرات ﻣﻦ اﻟﻘﻴﻢ
ﺷﺎﺋﻌﺔ ﰲ اﻟﻮﻗﺖ اﻟﺤﺎﴐ ﰲ اﻟﺘﻄﺒﻴﻘﺎت اﻟﻌﻠﻤﻴﺔ )ﻣﺜﻞ ﺗﺠﺎرب اﻟﺠﺴﻴﻤﺎت( ،واﻟﺘﻄﺒﻴﻘﺎت
ً
ﻣﺴﺘﺤﻴﻼ ﺗﻤﺎﻣً ﺎ اﻟﺘﺠﺎرﻳﺔ )ﻣﺜﻞ اﻻﺗﺼﺎﻻت( ،وﻏريﻫﺎ ﻣﻦ املﺠﺎﻻت اﻷﺧﺮى .وﻏﺎﻟﺒًﺎ ﻣﺎ ﺳﻴﻜﻮن
اﺳﺘﻜﺸﺎف ﻛﻞ اﻟﻘﻴﻢ ﻳﺪوﻳٍّﺎ ،وﻳﻜﻮن ﻋﻠﻴﻨﺎ أن ﻧﻌﺘﻤﺪ ﻋﲆ اﻟﻜﻤﺒﻴﻮﺗﺮ .ﻃﻮﱠر اﻹﺣﺼﺎﺋﻴﻮن
إﺟﺮاءات آﻟﻴﺔ ﻟﻠﻜﺸﻒ ﻋﻦ اﻟﻘﻴﻢ اﻟﺸﺎذة ،وﻟﻜﻨﻬﺎ ﻻ ﺗﺤﻞ املﺸﻜﻠﺔ ﺗﻤﺎﻣً ﺎ .رﺑﻤﺎ ﺗﻠﻔﺖ
اﻹﺟﺮاءات اﻵﻟﻴﺔ اﻻﻧﺘﺒﺎه ﻧﺤﻮ أﻧﻮاع ﻣﻌﻴﻨﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﻐﺮﻳﺒﺔ ،وﻟﻜﻨﻬﺎ ﺳﺘﺘﺠﺎﻫﻞ ﺳﻤﺎت
ﻣﺴﺄﻟﺔ ﻣﺎ ﻳﺠﺐ اﻟﻘﻴﺎم ﺑﻪ ﺣﻴﺎل اﻟﺸﺬوذ اﻟﻈﺎﻫﺮي ُ اﻟﻐﺮاﺑﺔ اﻟﺘﻲ ﻟﻢ ﺗُﺨﱪ ﻋﻨﻬﺎ .ﺛﻢ ﻫﻨﺎك
48
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
املﻠﻴﺎر رﻗ ٍﻢ ﻫﻮ
ِ اﻟﺬي ﻛﺸﻔﻪ اﻟﻜﻤﺒﻴﻮﺗﺮ .ﻻ ﺑﺄس ﰲ ﻫﺬا إذا ﻛﺎن رﻗﻤً ﺎ واﺣﺪًا ﻣﻦ ﻫﺬه
اﻟﺬي ﻛﺎن ﻣﻮﺿﻊ ﺷﻚ ،وﻟﻜﻦ ﻣﺎذا ﻟﻮ ﻛﺎن ﻣﺎﺋﺔ أﻟﻒ رﻗﻢ ﰲ ﻣﻮﺿﻊ ﺷﻚ؟ ﻣﺮة أﺧﺮى،
اﻟﻔﺤﺺ واﻟﺘﺼﺤﻴﺢ ﻋﻦ ﻃﺮﻳﻖ اﻷﺷﺨﺎص ﻏري ﻋﻤﲇ .وﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ ﻣﺜﻞ ﻫﺬه اﻟﺤﺎﻻت،
ﺑﻌﺾ ﻣﻦ أﻗﺪم أﺳﺎﻟﻴﺐ اﻟﺘﺤﺮﻳﺮ ٌ ﻃﻮﱠر اﻹﺣﺼﺎﺋﻴﻮن ﻣﺮة أﺧﺮى إﺟﺮاءات آﻟﻴﺔ ،وﻃﻮرت
اﻵﻟﻴﺔ ﺗﻠﻚ ﰲ ﺳﻴﺎق اﻟﺘﻌﺪادات واﻟﺪراﺳﺎت املﺴﺤﻴﺔ اﻟﻜﺒرية ،وﻟﻜﻨﻬﺎ دراﺳﺎت َ واﻟﺘﺼﺤﻴﺢ
ﻟﻴﺴﺖ ﻣﻌﺼﻮﻣﺔ ﻣﻦ اﻟﺨﻄﺄ .ﺧﻼﺻﺔ اﻟﻘﻮل أن اﻹﺣﺼﺎﺋﻴني ﻻ ﻳﺴﺘﻄﻴﻌﻮن — ﻟﻸﺳﻒ —
ﺻﻨﻊ املﻌﺠﺰات .إن وﺟﻮد ﺑﻴﺎﻧﺎت ردﻳﺌﺔ اﻟﺠﻮدة ﻳﺠﻌﻠﻨﺎ ﰲ ﺧﻄﺮ اﻟﺤﺼﻮل ﻋﲆ ﻧﺘﺎﺋﺞ
ردﻳﺌﺔ اﻟﺠﻮدة )ﺑﻤﻌﻨﻰ ﻏري دﻗﻴﻘﺔ وﺧﺎﻃﺌﺔ وﻋﺮﺿﺔ ﻟﻠﺨﻄﺄ( .وأﻓﻀﻞ اﺳﱰاﺗﻴﺠﻴﺔ ﻟﺘﺠﻨﺐ
ذﻟﻚ ﻫﻲ اﻟﺤﺮص ﻋﲆ اﻟﺤﺼﻮل ﻋﲆ ﺑﻴﺎﻧﺎت ذات ﺟﻮدة ﻋﺎﻟﻴﺔ ﻣﻦ اﻟﺒﺪاﻳﺔ.
ﻃﻮرت اﻟﻌﺪﻳﺪ ﻣﻦ اﻻﺳﱰاﺗﻴﺠﻴﺎت ﻟﺘﺠﻨﺐ اﻷﺧﻄﺎء ﰲ اﻟﺒﻴﺎﻧﺎت ﰲ املﻘﺎم اﻷول ،وﻫﻲ
وﻓﻘﺎ ملﺠﺎل اﻟﺘﻄﺒﻴﻖ وﻃﺮﻳﻘﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻋﻨﺪﻣﺎ ﺗُﻨﺴﺦ ﺑﻴﺎﻧﺎت ﺗﺘﻨﻮع ً
اﻟﺘﺠﺎرب اﻟﴪﻳﺮﻳﺔ ﻣﻦ اﺳﺘﻤﺎرات ﺳﺠﻞ اﻟﺤﺎﻟﺔ املﻜﺘﻮﺑﺔ ﺑﺎﻟﻴﺪ ،ﻳﻮﺟﺪ اﺣﺘﻤﺎل ﺣﺪوث
أﺧﻄﺎء ﰲ ﻣﺮﺣﻠﺔ اﻟﻨﺴﺦ .وﺗﻘﻠﻞ ﻫﺬه اﻷﺧﻄﺎء ﻋﻦ ﻃﺮﻳﻖ ﺗﺮﺗﻴﺐ ﺗﻜﺮار إدﺧﺎل اﻟﺒﻴﺎﻧﺎت
ﻣﺮﺗني ﻋﻦ ﻃﺮﻳﻖ ﺷﺨﺼني ﻣﺨﺘﻠﻔني ﻳﻌﻤﻼن ﻋﲆ ﻧﺤﻮ ﻣﺴﺘﻘﻞ ،ﺛﻢ اﻟﺘﺤﻘﻖ ﻣﻦ وﺟﻮد
أي اﺧﺘﻼﻓﺎت .ﻋﻨﺪ اﻟﺘﻘﺪم ﻟﻠﺤﺼﻮل ﻋﲆ ﻗﺮض ،ﻓﺈن ﺑﻴﺎﻧﺎت اﻟﻄﻠﺐ )ﻣﺜﻞ اﻟﻌﻤﺮ واﻟﺪﺧﻞ
واﻟﺪﻳﻮن اﻷﺧﺮى ،وﻣﺎ إﱃ ذﻟﻚ( ﻳﻤﻜﻦ إدﺧﺎﻟﻬﺎ ﻣﺒﺎﴍة إﱃ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ ،وﻳﻤﻜﻦ
ﻟﱪاﻣﺞ اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﺘﻔﺎﻋﻠﻴﺔ اﻟﺘﺤﻘﻖ ﻣﻦ اﻷﺟﻮﺑﺔ ﺑﻴﻨﻤﺎ ﻳﺘﻢ إدﺧﺎﻟﻬﺎ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا
ﻛﺎن اﻟﺸﺨﺺ ﻣﺎﻟ ًﻜﺎ ملﻨﺰل ،ﻓﻬﻞ ﺗﺸﻤﻞ دﻳﻮﻧﻪ اﻟﺮﻫﻦ اﻟﻌﻘﺎري؟( وﻋﻤﻮﻣً ﺎ ،ﻳﺠﺐ ﺗﺼﻤﻴﻢ
اﻻﺳﺘﻤﺎرات ﻋﲆ ﻧﺤﻮ ﻳﻘﻠﻞ اﻷﺧﻄﺎء؛ ﻓﻼ ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن ﻣﻌﻘﺪة ﻋﲆ ﻧﺤﻮ ﻣﻔﺮط ،وﻳﺠﺐ
أن ﺗﻜﻮن ﺟﻤﻴﻊ اﻷﺳﺌﻠﺔ واﺿﺤﺔ .وﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻣﻦ اﻷﻓﻜﺎر اﻟﺠﻴﺪة إﺟﺮاء دراﺳﺔ
ﻣﺴﺤﻴﺔ ﺗﺠﺮﻳﺒﻴﺔ ﺻﻐرية ﻟﻠﺘﻌﺮف ﻋﲆ أﻳﺔ ﻣﺸﻜﻼت ﰲ ﻋﻤﻠﻴﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ﻗﺒﻞ اﻻﻧﺘﻘﺎل
ﻟﻠﺘﻨﻔﻴﺬ اﻟﻔﻌﲇ.
وﺑﺎملﻨﺎﺳﺒﺔ ،ﺗﻌﺪ ﻋﺒﺎرة »ﺧﻄﺄ ﺣﺎﺳﻮﺑﻲ« ﻋﺒﺎرة ﻣﺄﻟﻮﻓﺔ ،وﻳﻌﺪ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻛﺒﺶ ﻓﺪاء
ﺷﺎﺋﻊ ﻋﻨﺪﻣﺎ ﺗﺤﺪث أﺧﻄﺎء ﰲ اﻟﺒﻴﺎﻧﺎت .وﻟﻜﻦ اﻟﻜﻤﺒﻴﻮﺗﺮ ﻳﻔﻌﻞ ﻓﺤﺴﺐ ﻣﺎ ﻳﻘﺎل ﻟﻪ،
ﻣﺴﺘﺨﺪﻣً ﺎ اﻟﺒﻴﺎﻧﺎت ا ُملﻘﺪﱠﻣَ ﺔ ﻟﻪ .وﻋﻨﺪﻣﺎ ﺗﺤﺪث اﻷﺧﻄﺎء ،ﻓﻠﻴﺲ ﻫﺬا ﺻﻨﻴﻌﺔ ﻳﺪ اﻟﻜﻤﺒﻴﻮﺗﺮ.
49
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﺘﻲ ﻻ ﻳﺴﺘﻄﻴﻊ املﺮء ﻓﻴﻬﺎ أن ﻳﺘﺪﺧﻞ ﰲ ﻋﻤﻠﻴﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ
اﺳﺘﻄﻼع ﺣﻮل اﻟﺘﻮﺟﻬﺎت اﻟﺬﻫﻨﻴﺔ ﻟﻸﺷﺨﺎص ﺣﻴﺎل اﻟﺴﻴﺎﺳﻴني )اﻧﻈﺮ أدﻧﺎه( ،ﺗُﺴﺄل ﻋﻴﻨﺔ
ﻣﻨﺎﺳﺒﺔ ﻣﻦ اﻷﺷﺨﺎص ﻋﻦ ﺷﻌﻮرﻫﻢ ،أو ﰲ دراﺳﺔ ﻟﺨﺼﺎﺋﺺ املﺠﺮات اﻟﺒﻌﻴﺪة ،ﺳﻮف
ٍ
ﺑﺒﺴﺎﻃﺔ ﺗﺨﻀﻊ ﻫﺬه اﻟﺨﺼﺎﺋﺺ ﻟﻠﺮﺻﺪ واﻟﺘﺴﺠﻴﻞ .ﰲ ﻫﺬﻳﻦ املﺜﺎﻟني ،اﺧﺘﺎر اﻟﺒﺎﺣﺜﻮن
اﻷﺷﺨﺎص أو اﻷﺷﻴﺎءَ اﻟﺘﻲ ﺳﻴﺪرﺳﻮﻧﻬﺎ ﺛﻢ ﺳﺠﻠﻮا ﺧﺼﺎﺋﺺ ﻫﺆﻻء اﻷﺷﺨﺎص أو اﻷﺷﻴﺎء. َ
ﻻ وﺟﻮد ﻫﻨﺎ ﻟﻔﻜﺮة اﻟﻘﻴﺎم ﺑﴚءٍ ﻣﺎ ﻟﻸﺷﺨﺎص أو املﺠﺮات ﻗﺒﻞ ﻗﻴﺎﺳﻬﺎ .ﰲ املﻘﺎﺑﻞ،
ﰲ اﻟﺪراﺳﺔ اﻟﺘﺠﺮﻳﺒﻴﺔ ﻳﺘﻼﻋﺐ اﻟﺒﺎﺣﺜﻮن ﻓﻌﻠﻴٍّﺎ ﺑﻌﻨﺎﴏ اﻟﺪراﺳﺔ ﺑﻄﺮﻳﻘﺔ ﻣﺎ؛ ﻋﲆ ﺳﺒﻴﻞ
أﺧﺬ اﻟﻘﻴﺎﺳﺎت .وﰲ املﺜﺎل ،ﰲ ﺗﺠﺮﺑﺔ ﴎﻳﺮﻳﺔ رﺑﻤﺎ ﻳﻌ ﱢﺮﺿﻮن املﺘﻄﻮﱢﻋني ﻟﺪواء ﻣﻌني ﻗﺒﻞ ْ
ً
ﻇﺮوﻓﺎ ﺗﺠﺮﺑﺔ ﺗﺼﻨﻴﻌﻴﺔ ﻹﻳﺠﺎد اﻟﻈﺮوف اﻟﺘﻲ ﺗُﺴﻔِ ﺮ ﻋﻦ أﻗﻮى ﻣﻨﺘﺞ ﻧﻬﺎﺋﻲ ،ﺳﻴﺠ ﱢﺮﺑﻮن
ﻣﺨﺘﻠﻔﺔ.
ﻳﺘﻤﺜﱠﻞ أﺣﺪ اﻟﻔﺮوق اﻟﺠﻮﻫﺮﻳﺔ ﺑني اﻟﺪراﺳﺎت اﻟﺮﺻﺪﻳﺔ واﻟﺘﺠﺮﻳﺒﻴﺔ ﰲ أن اﻟﺪراﺳﺎت
اﻟﺘﺠﺮﻳﺒﻴﺔ أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ ﺑﻜﺜري ﰲ ﺗﺤﺪﻳﺪ اﻟﺴﺒﺐ واملﺴﺒﺐ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻧﺨﻤﻦ
ﻣﺜﻼ( أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ ﻣﻦ ﻃﺮﻳﻘﺔ أن ﻃﺮﻳﻘﺔ ﻣﻌﻴﻨﺔ ﻟﺘﻌﻠﻴﻢ اﻷﻃﻔﺎل اﻟﻘﺮاءة )اﻟﻄﺮﻳﻘﺔ »أ« ً
أﺧﺮى )اﻟﻄﺮﻳﻘﺔ »ب«( .وﰲ دراﺳﺔ وﺻﻔﻴﺔ ،ﺳﻮف ﻧﻨﻈﺮ ﻟﻸﻃﻔﺎل اﻟﺬﻳﻦ ﺧﻀﻌﻮا ﻟﻠﺘﻌﻠﻴﻢ
ﺑﺎﺳﺘﺨﺪام إﺣﺪى اﻟﻄﺮﻳﻘﺘني وﻧﻘﺎرن ﻗﺪرﺗﻬﻢ ﻋﲆ اﻟﻘﺮاءة .ﻟﻜﻨﻨﺎ ﻟﻦ ﻧﻜﻮن ﻗﺎدرﻳﻦ ﻋﲆ
اﻟﺘﺪﺧﻞ ﰲ ﺗﻮزﻳﻊ اﻷﻃﻔﺎل اﻟﺬﻳﻦ ﻳﺨﻀﻌﻮن ﻟﻠﻄﺮﻳﻘﺔ »أ« واﻟﺬﻳﻦ ﻳﺨﻀﻌﻮن ﻟﻠﻄﺮﻳﻘﺔ »ب«؛
آﺧﺮ .ﻳﺴﺒﺐ ذﻟﻚ ﻣﺸﻜﻠﺔ ﻣﺤﺘﻤﻠﺔ؛ إذ ﻳﻌﻨﻲ أﻧﻪ ﻣﻦ املﻤﻜﻦ ﻓﻬﺬا ﻳﺘﺤﺪد ﻣﻦ ﻗِ ﺒَﻞ ﺷﺨﺺ َ
ﻓﻀﻼ ﻋﻦ ﻃﺮﻳﻘﺔ اﻟﺘﺪرﻳﺲ؛ ﻋﲆ ً أن ﺗﻮﺟﺪ اﺧﺘﻼﻓﺎت أﺧﺮى ﺑني ﻣﺠﻤﻮﻋﺘَﻲ ﺗﻌ ﱡﻠﻢ اﻟﻘﺮاءة،
ﺳﺒﻴﻞ املﺜﺎل ،وﻟﺘﻘﺪﻳﻢ ﺗﻮﺿﻴﺢ ﺻﺎرخ ،رﺑﻤﺎ ﻳُﻠﺤِ ﻖ املﺪ ﱢرس ﺟﻤﻴﻊ اﻷﻃﻔﺎل اﻟﺬﻳﻦ ﻳﺘﻌ ﱠﻠﻤﻮن
ﻋﲆ ﻧﺤﻮ أﴎع ﺑﺎﻟﻄﺮﻳﻘﺔ »أ«؛ أو رﺑﻤﺎ ﻛﺎن اﻷﻃﻔﺎل أﻧﻔﺴﻬﻢ ﻣﺴﻤﻮﺣً ﺎ ﻟﻬﻢ ﺑﺎﻻﺧﺘﻴﺎر،
ً
ﺗﻤﺮﺳﺎ ﰲ وﻣﺎل أوﻟﺌﻚ اﻷﻛﺜﺮ ﺗﻘﺪﻣً ﺎ ﺑﺎﻟﻔﻌﻞ ﰲ اﻟﻘﺮاءة إﱃ اﺧﺘﻴﺎر اﻟﻄﺮﻳﻘﺔ »أ« .إذا ﻛﻨﱠﺎ أﻛﺜﺮ
ﻣﺠﺎل اﻹﺣﺼﺎء ،ﻓﺮﺑﻤﺎ ﻧﺴﺘﺨﺪم أﺳﺎﻟﻴﺐ إﺣﺼﺎﺋﻴﺔ ﰲ ﻣﺤﺎوﻟﺔ ﻟﻠﺴﻴﻄﺮة ﻋﲆ أي اﺧﺘﻼﻓﺎت
ﻣﺴﺒﻘﺎ ﺑني اﻷﻃﻔﺎل ،وﻛﺬﻟﻚ اﻟﻌﻮاﻣﻞ اﻷﺧﺮى اﻟﺘﻲ ﻧﻌﺘﻘﺪ أﻧﻬﺎ ﻣﻦ املﺮﺟﱠ ﺢ أن ﺗﺆﺛﱢﺮ ً ﻣﻮﺟﻮدة
ﻋﲆ ﻣﺪى ﴎﻋﺔ ﺗﻌﻠﻤﻬﻢ اﻟﻘﺮاءة .وﻟﻜﻦ ﺗﻈﻞ ﻫﻨﺎك داﺋﻤً ﺎ اﺣﺘﻤﺎﻟﻴﺔ وﺟﻮد ﺗﺄﺛريات أﺧﺮى
ﻟﻢ ﻧﻔ ﱢﻜﺮ ﻓﻴﻬﺎ ،واﻟﺘﻲ ﺗﺴﺒﺐ اﻟﻔﺮق.
ﺗﺘﻐﻠﺐ اﻟﺪراﺳﺎت اﻟﺘﺠﺮﻳﺒﻴﺔ ﻋﲆ ﻫﺬا اﻻﺣﺘﻤﺎل ﻋﻦ ﻃﺮﻳﻖ اﻻﺧﺘﻴﺎر املﺘﻌﻤﱠ ﺪ ﻟﻜﻞ ﻃﻔﻞ
ﻧﻌﺮف ﺑﺎﻟﻔﻌﻞ ﻛﻞ اﻟﻌﻮاﻣﻞ ا ُملﻤﻜِﻨﺔ ،ﺑﺎﻹﺿﺎﻓﺔ إﱃ وﻟﻠﻄﺮﻳﻘﺔ اﻟﺘﻲ ﻳﺪرس ﺑﻬﺎ؛ ﻓﺈذا ﻛﻨﱠﺎ ِ
ﻃﺮﻳﻘﺔ اﻟﺘﺪرﻳﺲ — اﻟﺘﻲ ﻳﻤﻜﻦ أن ﺗﺆﺛﱢﺮ ﻋﲆ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة — ﻳﻤﻜﻨﻨﺎ اﻟﺘﺄﻛﺪ ﻣﻦ
50
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﱡ
ﻧﻈﻦ أن أن اﻟﺘﻮزﻳﻊ ﻋﲆ ﻃﺮﻳﻘﺘَﻲ اﻟﺘﺪرﻳﺲ ﻛﺎن »ﻣﺘﻮازﻧًﺎ«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﻨﱠﺎ
اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة ﺗﺘﺄﺛﺮ ﺑﺎﻟﻌﻤﺮ ،ﻳﻤﻜﻨﻨﺎ ﺗﻮزﻳﻊ اﻟﻌﺪد ﻧﻔﺴﻪ ﻣﻦ اﻷﻃﻔﺎل اﻟﺼﻐﺎر ﻋﲆ ﻛﻞ
ﻃﺮﻳﻘﺔ .وﻫﻜﺬا ،ﻓﺈن أي اﺧﺘﻼﻓﺎت ﰲ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة ﻧﺎﺷﺌﺔ ﻋﻦ اﻟﻌﻤﺮ ﻟﻦ ﻳﻜﻮن ﻟﻬﺎ
أي ﺗﺄﺛري ﻋﲆ اﻟﻔﺮق ﺑني ﻣﺠﻤﻮﻋﺘَﻴﻨﺎ؛ أي إﻧﻪ إذا ﻛﺎن ﻟﻠﻌﻤﺮ ﺗﺄﺛري ﻋﲆ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة،
ﻓﺈن اﻟﺘﺄﺛري ﺳﻴﻜﻮن ﻧﻔﺴﻪ ﰲ ﻛﻠﺘﺎ املﺠﻤﻮﻋﺘَني .وﻣﻊ ذﻟﻚ ،ﺗﻤﺘﻠﻚ اﻟﺪراﺳﺎت اﻟﺘﺠﺮﻳﺒﻴﺔ
وﺳﻴﻠﺔ أﻛﺜﺮ ﻗﻮة ﰲ اﺧﺘﻴﺎر أي ﻃﻔﻞ ﻳﺨﻀﻊ ﻷي ﻃﺮﻳﻘﺔ ،واﻟﺘﻲ ﻳُﻄ َﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ »اﻟﺘﻮزﻳﻊ
اﻟﻌﺸﻮاﺋﻲ« ،وﺳﻮف أﺗﻨﺎول ذﻟﻚ ﻓﻴﻤﺎ ﻳﲇ:
ﻧﺘﻴﺠﺔ ﻫﺬا أﻧﻪ ﰲ اﻟﺪراﺳﺔ اﻟﺘﺠﺮﻳﺒﻴﺔ ﻳﻤﻜﻦ أن ﻧﻜﻮن أﻛﺜﺮ ﺛﻘﺔ ﺣﻴﺎل ﺳﺒﺐ أي
ﺗﺄﺛري ﻣﺮﺻﻮد .وﰲ ﺗﺠﺮﺑﺔ ﻣﻘﺎرﻧﺔ ﺗﻌﻠﻴﻢ اﻟﻘﺮاءة ،ﻳﻤﻜﻨﻨﺎ أن ﻧﻜﻮن أﻛﺜﺮ ﺛﻘﺔ أن أي ﻓ ْﺮق
ﰲ اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة ﺑني املﺠﻤﻮﻋﺘَني ﻫﻮ ﻧﺘﻴﺠﺔ ﻟﻄﺮﻳﻘﺔ اﻟﺘﻌﻠﻴﻢ ،وﻟﻴﺲ ﻧﺘﻴﺠﺔ ﻋﺎﻣﻞ
َ
آﺧﺮ.
ﺑﺪﻻ ﻣﻦ اﻟﺪراﺳﺎت اﻟﺮﺻﺪﻳﺔ .ﻓﻼ ﻟﻸﺳﻒ ،ﻟﻴﺲ ﻣﻦ املﻤﻜﻦ داﺋﻤً ﺎ إﺟﺮاء اﻟﺘﺠﺎرب ً
ﻣﺜﻼ ﺗﻌﺮﻳﺾ املﺠﺮات املﺨﺘﻠﻔﺔ ﻟﻈﺮوف ﻣﺨﺘﻠﻔﺔ! وﻋﲆ أي ﺣﺎل ،رﺑﻤﺎ ﻳﻜﻮن ﻣﻦ ﻳﻤﻜﻨﻨﺎ ً
املﻀ ﱢﻠﻞ ﰲ ﺑﻌﺾ اﻷوﻗﺎت اﺳﺘﺨﺪام املﻨﻬﺞ اﻟﺘﺠﺮﻳﺒﻲ؛ ﻓﻔﻲ ﻛﺜري ﻣﻦ اﻟﺪراﺳﺎت املﺴﺤﻴﺔ
اﻻﺟﺘﻤﺎﻋﻴﺔ ،ﻳﺘﻤﺜﻞ اﻟﻬﺪف ﰲ ﻣﻌﺮﻓﺔ ﺣﺎل اﻟﺴﻜﺎن اﻟﺤﻘﻴﻘﻲ ،ﻻ ﰲ »ﻣﺎذا ﺳﻴﻜﻮن اﻟﺘﺄﺛري
اﻟﻨﺎﺗﺞ إذا ﻓﻌﻠﻨﺎ ﻛﺬا وﻛﺬا؟« وﻣﻊ ذﻟﻚ ،إذا ﻛﻨﱠﺎ ﻧﺮﻳﺪ ﺑﺎﻟﻔﻌﻞ أن ﻧﻌﺮف ﻣﺎذا ﺳﻴﻜﻮن ﺗﺄﺛري أي
ﺗﺪﺧﻞ ﻣﺤﺘﻤﻞ ،ﻓﺈن اﻟﺪراﺳﺎت اﻟﺘﺠﺮﻳﺒﻴﺔ ﺗُﻌَ ﱡﺪ اﺳﱰاﺗﻴﺠﻴﺔ أﻓﻀﻞ .ﻫﺬا اﻟﻨﻮع ﻣﻦ اﻟﺪراﺳﺎت ﱡ
واﺳﻊ اﻻﻧﺘﺸﺎر ﰲ ﻗﻄﺎع اﻟﺼﻨﺎﻋﺎت اﻟﺪواﺋﻴﺔ واﻟﻄﺐ وﻋﻠﻢ اﻟﻨﻔﺲ ،وﻣﺠﺎل اﻟﺘﺼﻨﻴﻊ
واﻟﺼﻨﺎﻋﺎت اﻟﺘﺤﻮﻳﻠﻴﺔ ،ﻛﻤﺎ ﻳُﺴﺘﺨﺪم ﻋﲆ ﻧﺤﻮ ﻣﺘﺰاﻳﺪ ﰲ ﺗﻘﻴﻴﻢ اﻟﺴﻴﺎﺳﺔ اﻻﺟﺘﻤﺎﻋﻴﺔ وﰲ
ﻣﺠﺎﻻت ﻣﺜﻞ إدارة ﻗﻴﻤﺔ اﻟﻌﻤﻼء.
وﻋﻤﻮﻣً ﺎ ،ﻋﻨﺪ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ﺑﻬﺪف إﺟﺎﺑﺔ أو اﺳﺘﻜﺸﺎف ﺑﻌﺾ اﻷﺳﺌﻠﺔ ،ﻛﻠﻤﺎ زادت
اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗُﺠﻤَ ﻊ ،زادت دﻗﺔ اﻹﺟﺎﺑﺔ اﻟﺘﻲ ﻳﻤﻜﻦ اﻟﺤﺼﻮل ﻋﻠﻴﻬﺎ؛ وﻫﺬا ﻧﺘﻴﺠﺔ ﻟ »ﻗﺎﻧﻮن
ﺳﻴﻨﺎﻗﺶ ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ .وﻟﻜﻦ ﺟﻤﻊ املﺰﻳﺪ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻳﻔﺮض َ اﻷﻋﺪاد اﻟﻜﺒرية« ،اﻟﺬي
ﺗﻜﻠﻔﺔ أﻛﱪ .وﻟﺬﻟﻚ ﻓﻤﻦ اﻟﴬوري اﻟﺘﻮﺻﻞ إﱃ ﺣ ﱟﻞ وﺳﻂ ﻣﻨﺎﺳﺐ ﺑني ﻛﻤﻴﺔ اﻟﺒﻴﺎﻧﺎت
اﻟﺘﻲ ﺗُﺠﻤَ ﻊ وﺗﻜﻠﻔﺔ ﺟﻤﻌﻬﺎ .ﺗﻘﺒﻊ ﺗﺨﺼﺼﺎت ﻓﺮﻋﻴﺔ ﻣﺘﻌﺪدة ﻣﻦ اﻹﺣﺼﺎء ﰲ ﻗﻠﺐ ﻫﺬه
اﻟﻌﻤﻠﻴﺔ ،وﻋﲆ وﺟﻪ اﻟﺨﺼﻮص ،ﻳُﻌَ ﱡﺪ »اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ« و»ﻣﺴﺢ اﻟﻌﻴﻨﺎت« ﻧﻮﻋني ﻣﻦ
اﻟﺘﺨﺼﺼﺎت اﻟﺮﺋﻴﺴﻴﺔ.
51
ﻋﻠﻢ اﻹﺣﺼﺎء
52
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
وﺗﺮﻣﻴﺰﻫﺎ ﺑﺒﺴﺎﻃﺔ ﺑﺎﻟﺤﺮﻓني »س« و»ص« دون اﻹﺷﺎرة إﱃ ﻣﺎﻫﻴﺔ اﻟﻌﻼج .وﰲ وﻗﺖ ﻻﺣﻖ
ﻓﺤﺴﺐ — ﺑﻌﺪ أن ﻳﻜﺸﻒ اﻟﺘﺤﻠﻴﻞ أن »س« أﻓﻀﻞ ﻣﻦ »ص« — ﺗُ َﻔﻚ ﺷﻔﺮة اﻟﱰﻣﻴﺰ،
ﻟﺘﻮﺿﻴﺢ أن »س« ﻫﻮ ﰲ ﺣﻘﻴﻘﺘﻪ اﻟﻌﻼج »أ« أو »ب«.
ٌ
ﺑﺴﻴﻄﺔ ﺟﺪٍّا، ً
ﻋﺸﻮاﺋﻴﺔ ٍ
ﻋﻴﻨﺎت إن اﻟﺘﺠﺮﺑﺔ اﻟﴪﻳﺮﻳﺔ اﻟﺜﻨﺎﺋﻴﺔ املﺠﻤﻮﻋﺔ اﻟﺘﻲ ﺗَﺴﺘﺨﺪم
وﻟﻬﺎ ﺻﻮر ﻣﻮﺳﻌﺔ واﺿﺤﺔ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ اﻟﺘﻮﺳﻊ ﻓﻴﻬﺎ ﻋﲆ اﻟﻔﻮر إﱃ أﻛﺜﺮ
أﻏري اﻷﻣﺜﻠﺔ .ﻳﺮﻏﺐ ﻣُﺰارع ﰲ ﻣﻦ ﻣﺠﻤﻮﻋﺘَﻲ ﻋﻼج .وﻣﻊ ذﻟﻚ ،ﻣﻦ أﺟﻞ اﻟﺘﻨﻮﻳﻊ ،ﺳﻮف ﱢ
ﻣﻌﺮﻓﺔ أيﱟ ﻣﻦ ﻣﺴﺘﻮﻳﺎت املﺎء املﻨﺨﻔﻀﺔ أو اﻟﻌﺎﻟﻴﺔ أﻓﻀﻞ ﻓﻴﻤﺎ ﻳﺨﺺ إﻧﺘﺎج ﻏﻠﺔ أﻛﱪ ﻣﻦ
ً
ﺳﺎﺑﻘﺎ ﻟﺘﺤﺪﻳﺪ املﺤﺎﺻﻴﻞ .ﻳﻤﻜﻨﻪ إﺟﺮاء ﺗﺠﺮﺑﺔ ﺑﺴﻴﻄﺔ ﺛﻨﺎﺋﻴﺔ املﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻨﻮع املﺬﻛﻮر
ﻣﺘﻮﻗﻌﺔ ﺗﻤﺎﻣً ﺎ ،ﻓﺴﻮف ﻳﺮﻳﺪ ﺗﻌﺮﻳﺾ أﻛﺜﺮ ﻣﻦ ﱠ ﻫﺬا .وﺑﻤﺎ أﻧﻨﺎ ﻧﻌﻠﻢ أن اﻟﻨﺘﺎﺋﺞ ﻟﻴﺴﺖ
ﻋﺎل ،ﺛﻢ ﻳﺤﺴﺐ ﺻﻮﺑﺔ واﺣﺪة ملﺴﺘﻮى ﻣﻴﺎ ٍه ﻣﻨﺨﻔِ ﺾ ،وأﻛﺜﺮ ﻣﻦ ﺻﻮﺑﺔ واﺣﺪة ملﺴﺘﻮًى ٍ
اﻟﻐ ﱠﻠﺔ ﰲ ﻛﻞ ﻣﺴﺘﻮًى؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻳﻘﺮر اﺳﺘﺨﺪام أرﺑﻊ ﺻﻮﺑﺎت ﻟﻜﻞ ﻣﺘﻮﺳﻂ َ
ﻣﺴﺘﻮًى .وﻫﺬا ﻫﻮ ﺑﺎﻟﻀﺒﻂ ﻧﻮع اﻟﺘﺼﻤﻴﻢ ﻧﻔﺴﻪ ﻛﻤﺎ ﰲ دراﺳﺔ ﻃﺮق اﻟﺘﺪرﻳﺲ اﻟﺴﺎﺑﻘﺔ.
أﻳﻀﺎ أن ﻳﻌﺮف أيﱞ ﻣﻦ ﻣﺴﺘﻮﻳﺎت اﻷﺳﻤﺪة وﻟﻜﻦ ﻟﻨﻔﱰض اﻵن أن املﺰارع ﻳﺮﻳﺪ ً
املﻨﺨﻔﻀﺔ واﻟﻌﺎﻟﻴﺔ أﻛﺜﺮ ﻓﻌﺎﻟﻴﺔ .اﻟﴚء اﻟﺒﺪﻳﻬﻲ اﻟﻘﻴﺎم ﺑﻪ ﻫﻮ إﺟﺮاء ﺗﺠﺮﺑﺔ أﺧﺮى ﺛﻨﺎﺋﻴﺔ
ً
ﻣﻨﺨﻔﻀﺎ ﻣﻦ اﻷﺳﻤﺪة وأرﺑﻌﺔ املﺠﻤﻮﻋﺔ؛ ﻫﺬه املﺮة ﺑﺎﺳﺘﺨﺪام أرﺑﻊ ﺻﻮﺑﺎت ﱠ
ﺗﺘﻠﻘﻰ ﻣﺴﺘﻮًى
ﺗﺘﻠﻘﻰ ﻣﺴﺘﻮًى ﻋﺎﻟﻴًﺎ .ﻫﺬا ﺟﻴﺪ ﺟﺪٍّا ،وﻟﻜﻦ اﻹﺟﺎﺑﺔ ﻋﲆ ﻛﻼ اﻟﺴﺆاﻟني — اﻟﺴﺆال ﻋﻦ ﻣﺴﺘﻮى ﱠ
املﺎء واﻟﺴﺆال ﻋﻦ ﻣﺴﺘﻮى اﻷﺳﻤﺪة — ﺗﺘﻄﻠﺐ ﻣﺎ ﻣﺠﻤﻮﻋﻪ ﺳﺖ ﻋﴩة ﺻﻮﺑﺔ .وإذا ﻛﺎن
أﻳﻀﺎ ﺑﻔﻌﺎﻟﻴﺔ ﻣﺴﺘﻮﻳﺎت اﻟﺮﻃﻮﺑﺔ املﻨﺨﻔﻀﺔ واﻟﻌﺎﻟﻴﺔ ،ودرﺟﺔ اﻟﺤﺮارة، املﺰارع ﻣﻬﺘﻤٍّ ﺎ ً
وﺳﺎﻋﺎت اﻟﺘﻌﺮض ﻟﻀﻮء اﻟﺸﻤﺲ ،وﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ؛ ﻓﺴﻨﺮى أﻧﻪ ﺳﻴﻜﻮن ﺑﺤﺎﺟﺔ ﻟﻌﺪد ﻛﺒري
ﻟﻠﻐﺎﻳﺔ ﻣﻦ اﻟﺼﻮﺑﺎت.
ﺗﻮﺟﺪ ﻃﺮﻳﻘﺔ ذﻛﻴﺔ ﻟﻠﻐﺎﻳﺔ ﻟﻼﻟﺘﻔﺎف ﺣﻮل ذﻟﻚ؛ وﻫﻲ ﺑﺎﺳﺘﺨﺪام ﻣﻔﻬﻮم ﺗﺼﻤﻴﻢ
ﻓﺒﺪﻻ ﻣﻦ ﺗﻨﻔﻴﺬ ﺗﺠﺮﺑﺘني ﻣﻨﻔﺼﻠﺘني ،واﺣﺪة ﻟﻠﻤﻴﺎه وواﺣﺪة ﻟﻸﺳﻤﺪة، اﻟﺘﺠﺎرب »اﻟﻌﺎﻣﻠﻴﺔ«؛ ً
ﻳﺴﺘﻄﻴﻊ املﺰارع ﻣﻌﺎﻟﺠﺔ ﺻﻮﺑﺘني ﺑﺎﺳﺘﺨﺪام »أﺳﻤﺪة ﻣﻨﺨﻔﻀﺔ ،وﻣﺎء ﻣﻨﺨﻔﺾ« ،واﺛﻨﺘني
ﻋﺎل« .ﻫﺬا ﻳﺘﻄﻠﺐ ﻓﻘﻂ ﻋﺎل« ،واﺛﻨﺘني »ﻋﺎﻟﻴﺔ وﻣﻨﺨﻔﺾ« ،واﺛﻨﺘني »ﻋﺎﻟﻴﺔٍ ،
»ﻣﻨﺨﻔﻀﺔٍ ،
ﺛﻤﺎﻧﻲ ﺻﻮﺑﺎت زراﻋﻴﺔ ،وﻣﻊ ذﻟﻚ ﻧﻈﻞ ﻧﻌﺎﻟﺞ أرﺑﻌً ﺎ ﻣﻨﻬﺎ ﺑﻤﺴﺘﻮى ﻣﻴﺎه ﻣﻨﺨﻔﺾ وأرﺑﻌً ﺎ
ﻋﺎل ،وﻛﺬﻟﻚ أرﺑﻊ ﺻﻮﺑﺎت ﺑﻤﺴﺘﻮى أﺳﻤﺪة ﻣﻨﺨﻔﺾ وأرﺑﻌً ﺎ ﺑﻤﺴﺘﻮى ﺑﻤﺴﺘﻮى ﻣﻴﺎه ٍ
ﻋﺎل؛ وﻣﻦ ﺛﻢ ﻓﺈن ﻧﺘﺎﺋﺞ اﻟﺘﺤﻠﻴﻞ ﺳﻮف ﺗﻜﻮن دﻗﻴﻘﺔ ﺗﻤﺎﻣً ﺎ ﻛﻤﺎ ﻟﻮ ﻛﻨﱠﺎ أﺟ َﺮﻳْﻨﺎ أﺳﻤﺪة ٍ
ﺗﺠﺮﺑﺘني ﻣﻨﻔﺼﻠﺘني.
53
ﻋﻠﻢ اﻹﺣﺼﺎء
ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﺘﻠﻚ ﻫﺬا اﻟﺘﺼﻤﻴﻢ اﻟﻌﺎﻣﲇ )املﻴﺎه واﻷﺳﻤﺪة ﻛﻼﻫﻤﺎ »ﻋﺎﻣﻞ«( ﻣﻴﺰة إﺿﺎﻓﻴﺔ
ً
ﻣﺨﺘﻠﻔﺎ ﻋﻨﺪ ﻣﺴﺘﻮﻳ َِﻲ املﻴﺎه؛ َ
ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎن ﺗﺄﺛري ﻣﺴﺘﻮى اﻟﺴﻤﺎد ﺟﺬاﺑﺔ؛ ﻓﻬﻮ ﻳُﺘﻴﺢ ﻟﻨﺎ
ﻓﺮﺑﻤﺎ ﻳﺨﺘﻠﻒ اﻟﻔﺮق ﺑني املﺤﺼﻮل ﻣﻊ ﻣﺴﺘﻮﻳ َِﻲ اﻷﺳﻤﺪة املﻨﺨﻔِ ﺾ واﻟﻌﺎﱄ ﰲ ﺣﺎﻟﺔ
ﺼﻪ ﰲ ﻧﻬْ ﺞ إﺟﺮاء اﺧﺘﻼف ﻣﺴﺘﻮى املﻴﺎه .وﻫﺬا ﻳُﺴﻤﱠ ﻰ »ﺗﺄﺛري اﻟﺘﻔﺎﻋﻞ« ،وﻻ ﻳﻤﻜﻦ ﻓﺤْ ُ
ﺗﺠﺮﺑﺘني ﻣﻨﻔﺼﻠﺘني.
ُ
ﺟﺮى اﻟﺘﻮﺳﻊ ﰲ ﻫﺬه اﻟﻔﻜﺮة اﻷﺳﺎﺳﻴﺔ ﺑﻄ ُﺮق ﻋﺪﻳﺪة ﻹﻧﺘﺎج أدوات ﻗﻮﻳﺔ ﻟﻠﻐﺎﻳﺔ
ﻟﻠﺤﺼﻮل ﻋﲆ ﻣﻌﻠﻮﻣﺎت دﻗﻴﻘﺔ ﻣﻦ أﺟْ ﻞ اﻟﻮﺻﻮل ﻟﻠﺤ ﱢﺪ اﻷدﻧﻰ ﻣﻦ اﻟﺘﻜﻠﻔﺔ .وﻋﻨﺪ ﺿﻤﱢ ﻬﺎ
إﱃ ﻏريﻫﺎ ﻣﻦ أدوات اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ ،ﻣﺜﻞ اﻟﺘﻮازن واﻟﺘﻮزﻳﻊ اﻟﻌﺸﻮاﺋﻲ واﻟﺴﻴﻄﺮة ﻋﲆ
اﻟﺘﺄﺛريات املﻌﺮوﻓﺔ ،ﻧﺘﺠﺖ ﺑﻌﺾ اﻟﺘﺼﺎﻣﻴﻢ اﻟﺘﺠﺮﻳﺒﻴﺔ املﺘﻄﻮرة ﻟﻠﻐﺎﻳﺔ.
أﺣﻴﺎﻧًﺎ ﰲ اﻟﺘﺠﺎرب ﺗﻜﻮن اﻷﻣﻮر ﻏري اﻹﺣﺼﺎﺋﻴﺔ ﻣﻬﻤﱠ ﺔ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ اﻟﺘﺠﺎرب
اﻟﴪﻳﺮﻳﺔ واﻟﺪراﺳﺎت اﻟﻄﺒﻴﺔ ودراﺳﺎت اﻟﺴﻴﺎﺳﺔ اﻻﺟﺘﻤﺎﻋﻴﺔ اﻷﺧﺮى ،رﺑﻤﺎ ﺗﻜﻮن اﻷﻣﻮر
ﺗﻘﺎرن ﻋﻼﺟً ﺎ ﺟﺪﻳﺪًا ﻣﻘﱰَﺣً ﺎ ﻣﻊ ﻋﻼج وﻫﻤﻲ اﻷﺧﻼﻗﻴﺔ ذات ﺻﻠﺔ؛ ﻓﻔﻲ ﺗﺠﺮﺑﺔ ﴎﻳﺮﻳﺔ ِ
ﱠ
ﺳﻴﺘﻠﻘﻮْن ﺷﻴﺌًﺎ ﻟﻴﺲ ﻟﻪ ِﺼﻒ املﺮﴇ املﺘﻄﻮﱢﻋني ﻧﺸﻂ( ،ﺳﻨﻜﻮن ﻋﲆ ﻣﻌﺮﻓﺔ ﱠ
ﺑﺄن ﻧ ْ )ﻏري ِ
أي ﺗﺄﺛري ﺑﻴﻮﻟﻮﺟﻲ .ﻫﻞ ﻫﺬا ﻣﻨﺎﺳﺐ؟ ﻫﻞ ﻳﻮﺟﺪ ﺧﻄﺮ أن ﻳُﻌﺎﻧِﻲ أوﻟﺌﻚ اﻟﺬﻳﻦ ﻳﺘﻨﺎوﻟﻮن
اﻟﻌﻼج اﻟﺠﺪﻳﺪ املﻘﱰح ﻣﻦ آﺛﺎر ﺟﺎﻧﺒﻴﺔ؟ ﻣﺜﻞ ﻫﺬه اﻷﺷﻴﺎء ﻳﺠﺐ أن ﺗﻜﻮن ﻣﺘﻮازﻧﺔ ﻣﻊ
ﺤﴡ ﻣﻦ املﺮﴇ ﰲ املﺴﺘﻘﺒَﻞ ﺳﻮف ﻳﺴﺘﻔﻴﺪون ﻣﻤﱠ ﺎ ﻳﺘﻢ ﻣﻌﺮﻓﺘﻪ ﺣﻘﻴﻘﺔ أن أﻋﺪادًا ﻻ ﺗُ َ
ﺧﻼل اﻟﺘﺠﺮﺑﺔ.
ﺗﺨﻴﻞ أﻧﻪ ﻣﻦ أﺟﻞ إدارة اﻟﺒﻼد ﻋﲆ ﻧﺤﻮ ﻓﻌﺎل ،ﻧﻮ ﱡد أن ﻧﻌﺮف ﻣﺘﻮﺳﻂ اﻟﺪﺧﻞ ملﻠﻴﻮن
ﺷﺨﺺ ﻋﺎﻣﻞ ﻣﻦ اﻟﺮﺟﺎل واﻟﻨﺴﺎء ﰲ ﺑﻠﺪة ﻣﻌﻴﻨﺔ .ﻇﺎﻫﺮﻳٍّﺎ ،ﻳﻤﻜﻨﻨﺎ ﺗﺤﺪﻳﺪ ﻫﺬا ﻋﻦ ﻃﺮﻳﻖ
ﺳﺆال ﻛ ﱟﻞ ﻣﻨﻬﻢ ﻋﻦ دﺧﻠﻪ ،وﺣﺴﺎب ﻣﺘﻮﺳﻂ اﻟﻨﺘﺎﺋﺞ .أﻣﺎ ﻋﻤﻠﻴٍّﺎ ،ﻓﺈن ﻫﺬا ﺳﻴﻜﻮن ﺻﻌﺒًﺎ
ِ
وﻓﻀﻼ ﻋﻦ أي ﳾء آﺧﺮ ،ﻣﻦ املﺮﺟﱠ ﺢ أن ﻳﺘﻐري اﻟﺪﺧﻞ ً ً
ﻣﺴﺘﺤﻴﻼ. ﻟﻠﻐﺎﻳﺔ ،وﻳﻜﺎد ﻳﻜﻮن
ﻋﲆ ﻣﺪى اﻟﻮﻗﺖ اﻟﺬي ﺳﻴﺴﺘﻐﺮﻗﻪ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت؛ ﻓﺮﺑﻤﺎ ﻳﱰك ﺑﻌﺾ اﻟﻨﺎس وﻇﺎﺋﻔﻬﻢ أو
ﺗﻌﻘﺐﻳﺘﻠﻘﻰ اﻟﺒﻌﺾ اﻵﺧﺮ ﻋﻼوات ،وﻣﺎ إﱃ ذﻟﻚ .وﻋﻼوة ﻋﲆ ذﻟﻚ ،ﻓﺈن ﱡ ﻳﻐريوﻧﻬﺎ ،ورﺑﻤﺎ ﱠ
ﻛﻞ ﺷﺨﺺ ﺳﻴﻜﻮن ﻣﻜ ﱢﻠ ًﻔﺎ ﻟﻠﻐﺎﻳﺔ .رﺑﻤﺎ ﻧﺤﺎول ﺧﻔﺾ اﻟﺘﻜﺎﻟﻴﻒ ﻣﻦ ﺧﻼل اﻻﻋﺘﻤﺎد ﻋﲆ
ً
ﺳﺎﺑﻘﺎ ﰲ اﻟﺤﺎﻟﺔ املﺘﻄ ﱢﺮﻓﺔ ﻟﻼﻧﺘﺨﺎﺑﺎت وﻟﻜﻦ ﻛﻤﺎ رأَﻳْﻨﺎ
ْ اﻟﻬﺎﺗﻒ ،ﻻ املﻘﺎﺑﻼت اﻟﺸﺨﺼﻴﺔ،
54
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
اﻟﺮﺋﺎﺳﻴﺔ ﰲ اﻟﻮﻻﻳﺎت املﺘﺤﺪة ﻟﻌﺎم ،١٩٣٦ﻳﻮﺟﺪ ﺧﻄﺮ ﻛﺒري ﺑﺄﻧﻨﺎ ﺳﻮف ﻧَﻐﻔﻞ ﻋﻦ ﴍاﺋﺢ
ﻣﻬﻤﺔ ﻣﻦ اﻟﺴﻜﺎن.
ﻃﺮﻳﻘﺔ ﻣﺎ ﻟﺘﻘﻠﻴﻞ ﺗﻜﻠﻔﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ﻟﻜﻨﻬﺎ ﰲ ﻧﻔﺲ اﻟﻮﻗﺖ ﺗﺠﻌﻞ ٌ ﻣﺎ ﻧﺤﺘﺎﺟﻪ ﻫﻮ
أﻳﻀﺎ .ﺑﺼﻴﺎﻏﺔ اﻷﻣﺮ ﺑﻬﺬه اﻟﻄﺮﻳﻘﺔ، اﻟﻌﻤﻠﻴﺔ أﴎع ،وﺗﺠﻌﻠﻬﺎ — إذا أﻣﻜﻦ — أﻛﺜﺮ دﻗﺔ ً
ﺷﺎﻗﺔ ،وﻟﻜﻦ اﻷﻓﻜﺎر واﻷدوات اﻹﺣﺼﺎﺋﻴﺔ اﻟﺘﻲ ﺗﺘﻤﺘﻊ ﺑﻬﺬه رﺑﻤﺎ ﻳﺒﺪو اﻷﻣﺮ ﻛﺄﻧﻪ ﻣﻬﻤﺔ ﱠ
اﻟﺨﺼﺎﺋﺺ ﻣﻮﺟﻮدة .واﻟﻔﻜﺮة اﻟﺮﺋﻴﺴﻴﺔ ﻫﻲ ﻓﻜﺮة ﻗﺎﺑﻠﻨﺎﻫﺎ ﻋﺪة ﻣﺮات ﻣﻦ ﻗﺒ ُﻞ؛ وﻫﻲ
ﻓﻜﺮة اﻟﻌﻴﱢﻨﺔ.
ﻣﻌﺮﻓﺔ ﻣﺎ ﻳﺤﺼﻞ ﻋﻠﻴﻪ ﻛﻞ واﺣﺪ ﻣﻦ املﻠﻴﻮن ﻣﻮﻇﻒ ،ﺳﺄﻟﻨﺎ ِ ﻟﻨﻔﱰض أﻧﻪ ً
ﺑﺪﻻ ﻣﻦ
أﻟﻒ ﻣﻮﻇﻒ ﻣﻨﻬﻢ .ﻟﻜﻦ ﻋﻠﻴﻨﺎ ﺑﻮﺿﻮح اﻵن أن ﻧﻜﻮن ﺣَ ﺬِرﻳﻦ ﺑﺸﺄن اﻷﻟﻒ ﺑﺒﺴﺎﻃﺔ َ
ٍ
ﻣﻮﻇﻒ اﻟﺬﻳﻦ ﻧﺴﺄﻟﻬﻢ ﺑﺎﻟﻀﺒﻂ .وأﺳﺒﺎب ذﻟﻚ ﻫﻲ ﰲ اﻷﺳﺎس اﻷﺳﺒﺎب ﻧﻔﺴﻬﺎ اﻟﺘﻲ دﻋﺘْﻨﺎ
ﻋﻨﺪﻣﺎ ﻛﻨﱠﺎ ﻧﺼﻤﱢ ﻢ اﻟﺘﺠﺮﺑﺔ اﻟﺜﻨﺎﺋﻴﺔ املﺠﻤﻮﻋﺔ اﻟﺒﺴﻴﻄﺔ إﱃ اﺗﺨﺎذ ﺧﻄﻮات ﻟﻀﻤﺎن أن اﻟﻔﺮق
ﺗﺘﻠﻘﻰ اﻟﻌﻼج »ب«؛ ﻟﺬاﺗﺘﻠﻘﻰ اﻟﻌﻼج »أ« واﻷﺧﺮى ﱠ اﻟﻮﺣﻴﺪ ﺑني املﺠﻤﻮﻋﺘَني ﻛﺎن أن واﺣﺪة ﱠ
ﻋﻠﻴﻨﺎ اﻵن أن ﻧﺘﺄﻛﺪ أن اﻷﺷﺨﺎص اﻷﻟﻒ املﺤﺪدﻳﻦ اﻟﺬﻳﻦ ﻧﺘﻮاﺻﻞ ﻣﻌﻬﻢ ﻳﻤﺜﻠﻮن املﻮﻇﻔني
املﻠﻴﻮن ﻋﲆ ﻧﺤﻮ ﺗﺎم.
ﱢ
ﻣﺎ اﻟﺬي ﻧﻌﻨﻴﻪ ﺑﻜﻠﻤﺔ »ﻣﻤﺜﻞ«؟ ﻋﲆ ﻧﺤﻮ ﻣﺜﺎﱄ ،ﻳﻨﺒﻐﻲ أن ﺗﻜﻮن ﻋﻴﱢﻨﺘﻨﺎ املﻜﻮﱠﻧﺔ ﻣﻦ
أﻟﻒ ﻣﻮﻇﻒ ﺗﺤﺘﻮي ﻋﲆ ﻧﺴﺒﺔ اﻟﺮﺟﺎل ﻧﻔﺴﻬﺎ املﻮﺟﻮدة ﰲ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ
ﻟﻠﺪراﺳﺔ ،واﻟﻨﺴﺒﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﺸﺒﺎب ،واﻟﻨﺴﺒﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﻌﺎﻣﻠني ﺑﺪوام ﺟﺰﺋﻲ ،وﻣﺎ إﱃ
ذﻟﻚ .ﻧﺴﺘﻄﻴﻊ ﺿﻤﺎن ذﻟﻚ إﱃ ﺣ ﱟﺪ ﻣﺎ ﻣﻦ ﺧﻼل اﺧﺘﻴﺎر أﻟﻒ ﻣﻮﻇﻒ ﺑﺤﻴﺚ ﺗﻜﻮن ﻧﺴﺒﺔ
اﻟﺮﺟﺎل — ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل — ﺻﺤﻴﺤﺔ .وﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻳﻮﺟﺪ ﻗﻴﺪ ﻋﻤﲇ ملﺎ ﻳﻤﻜﻨﻨﺎ
ﻣﻮازﻧﺘﻪ ﻋﻤﺪًا ﺑﻬﺬه اﻟﻄﺮﻳﻘﺔ.
ﺷﺎﻫﺪﻧﺎ ﻛﻴﻔﻴﺔ اﻟﺘﻌﺎﻣﻞ ﻣﻊ ﻫﺬه اﻟﺼﻌﻮﺑﺔ ﻋﻨﺪﻣﺎ ﺗﻨﺎوﻟﻨﺎ اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ؛ وذﻟﻚ
ﻣﻦ ﺧﻼل »اﻟﺘﻮزﻳﻊ اﻟﻌﺸﻮاﺋﻲ« ﻟﻠﻤﺮﴇ ﻋﲆ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ املﺠﻤﻮﻋﺘَني .ﰲ ﺣﺎﻟﺘﻨﺎ ﻫﺬه
ﺳﻨﺘﻌﺎﻣﻞ ﻣﻌﻬﺎ ﻋﻦ ﻃﺮﻳﻖ »أﺧﺬ ﻋﻴﻨﺔ ﻋﺸﻮاﺋﻴﺔ« ﻣﻦ أﻟﻒ ﺷﺨﺺ ﻣﻦ ﻣﺠﻤﻮﻋﺔ املﻮﻇﻔني
اﻟﻜﻠﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .وﻣﺮة أﺧﺮى ،رﻏﻢ أن ﻫﺬا ﻻ ﻳﻀﻤﻦ أن اﻟﻌﻴﻨﺔ ﺳﺘﻜﻮن ﻣﺸﺎ ِﺑﻬﺔ
ﺨﱪﻧﺎ أن ﻓﺮﺻﺔ ﰲ ﺗﻜﻮﻳﻨﻬﺎ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ،ﻓﺈن اﻻﺣﺘﻤﺎﻟﻴﺔ اﻷﺳﺎﺳﻴﺔ ﺗُ ِ
اﻟﺤﺼﻮل ﻋﲆ ﻋﻴﱢﻨﺔ ﻣﺨﺘﻠِﻔﺔ ﻛﺜريًا ﺿﺌﻴﻠﺔ ﺟﺪٍّا .وﺗﺤﺪﻳﺪًا ،ﻳﱰﺗﺐ ﻋﲆ ذﻟﻚ أن اﺣﺘﻤﺎﻟﻴﺔ
ً
ﻣﺨﺘﻠﻔﺔ ﻛﺜريًا ﻋﻦ ﻣﺘﻮﺳﻂ أن ﺗﻜﻮن ﺗﻘﺪﻳﺮاﺗﻨﺎ ملﺘﻮﺳﻂ اﻟﺪﺧﻞ ،واملﺴﺘﻤَ ﺪﱠة ﻣﻦ اﻟﻌﻴﻨﺔ،
ٌ
ﺿﻌﻴﻔﺔ ﻟﻠﻐﺎﻳﺔ .وﰲ اﻟﻮاﻗﻊ ،ﺛﻤﺔ ﺧﺎﺻﻴﺘﺎن اﻟﺪﺧﻞ ﰲ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ؛
55
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻼﺣﺘﻤﺎﻻت — ﺳﻮف ﻧﺘﻨﺎوﻟﻬﻤﺎ ﰲ وﻗﺖ ﻻﺣﻖ؛ ﻫﻤﺎ »ﻗﺎﻧﻮن اﻷﻋﺪاد اﻟﻜﺒرية« و»ﻣﱪﻫﻨﺔ
أﻳﻀﺎ أﻧﻨﺎ ﻳﻤﻜﻨﻨﺎ ﺟﻌﻞ ﻫﺬه اﻻﺣﺘﻤﺎﻟﻴﺔ ﺿﺌﻴﻠﺔ ﻛﻤﺎ ﻧﺸﺎء اﻟﻨﻬﺎﻳﺔ املﺮﻛﺰﻳﺔ« — ﺗُ ِ
ﺨﱪا ِﻧﻨَﺎ ً
ﺣﻘﺎ ﻟﻴﺲ ﻣﺪى ﻛ َِﱪ ﻧﺴﺒﺔ اﻟﻌﻴﻨﺔ إﱃﻣﻦ ﺧﻼل زﻳﺎدة ﺣﺠﻢ اﻟﻌﻴﻨﺔ .وﻳﺘﻀﺢ ﻟﻨﺎ أن ﻣﺎ ﻳﻬﻢ ٍّ
املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ ،وإﻧﻤﺎ ﺑﺒﺴﺎﻃﺔ ﻣﺪى ﻛﱪ ﺣﺠﻢ اﻟﻌﻴﻨﺔ .ﻓﺴﻴﻜﻮن ﺗﻘﺪﻳﺮﻧﺎ — املﺴﺘﻨِﺪ إﱃ
ﺣﺠﻢ ﻋﻴﻨﺔ ﻣﻜﻮﻧﺔ ﻣﻦ أﻟﻒ ﺷﺨﺺ — ﺑﺎﻟﺪﻗﺔ ﻧﻔﺴﻬﺎ إذا ﻛﺎﻧﺖ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ اﻟﺨﺎﺿﻌﺔ
ﻟﻠﺪراﺳﺔ ﺗﺘﺄﻟﻒ ﻣﻦ ﻋﴩة ﻣﻼﻳني أو ﻋﴩة ﻣﻠﻴﺎرات ﺷﺨﺺ .وﺑﻤﺎ أن ﺣﺠﻢ اﻟﻌﻴﻨﺔ ﻳﺮﺗﺒﻂ
ﻃﺎ ﻣﺒﺎﴍًا ﺑﺘﻜﻠﻔﺔ ﺟﻤﻊ اﻟﺒﻴﺎﻧﺎت ،ﻓﺈن ﻟﺪﻳﻨﺎ اﻵن ﻋﻼﻗﺔ ﻣﺒﺎﴍة ﺑني اﻟﺪﻗﺔ واﻟﺘﻜﻠﻔﺔ؛ ارﺗﺒﺎ ً
ﻓﻜﻠﻤﺎ ﻛﺎن ﺣﺠﻢ اﻟﻌﻴﻨﺔ أﻛﱪ ،زادت اﻟﺘﻜﻠﻔﺔ ،وﻟﻜﻦ ﻗ ﱠﻞ اﺣﺘﻤﺎل اﻻﻧﺤﺮاف اﻟﻜﺒري ﺑني ﺗﻘﺪﻳﺮ
اﻟﻌﻴﻨﺔ وﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ.
ﰲ ﺣني أن »أﺧﺬ ﻋﻴﻨﺔ ﻋﺸﻮاﺋﻴﺔ ﻣﻜﻮﻧﺔ ﻣﻦ أﻟﻒ ﺷﺨﺺ ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ« ﻟﻠﻌﺎﻣﻠني
ﰲ املﺪﻳﻨﺔ ﻗﺪ ﻳﺒﺪو ﻛﺄﻧﻪ ﻋﻤﻠﻴﺔ ﺑﺴﻴﻄﺔ ،ﻓﺈﻧﻬﺎ ﰲ واﻗﻊ اﻷﻣﺮ ﻋﻤﻠﻴﺔ ﺗﺘﻄﻠﺐ ﻋﻨﺎﻳﺔ ﺷﺪﻳﺪة؛
ﺑﺒﺴﺎﻃﺔ اﺧﺘﻴﺎ ُر أﻟﻒ ﺷﺨﺺ ﻣﻦ أﻛﱪ ﴍﻛﺔ ﰲ املﺪﻳﻨﺔ؛ ﻷن ٍ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻻ ﻳﻤﻜﻨﻨﺎ
ﻫﺬه اﻟﻌﻴﻨﺔ ﻗﺪ ﻻ ﺗﻜﻮن ﻣﻤﺜﻠﺔ ﻟﻠﻌﺎﻣﻠني املﻠﻴﻮن ﺟﻤﻴﻌﻬﻢ .وﺑﺎملﺜﻞ ،ﻻ ﻳﻤﻜﻨﻨﺎ اﻻﺗﺼﺎل ﺑﻌﻴﻨﺔ
ﻋﺸﻮاﺋﻴﺔ ﻣﻦ ﺑﻴﻮت اﻷﺷﺨﺎص ﰲ اﻟﺴﺎﻋﺔ اﻟﺜﺎﻣﻨﺔ ﻣﺴﺎءً؛ ﻷﻧﻨﺎ ﺳﻨﻐﻔﻞ ﻋﻦ أوﻟﺌﻚ اﻟﺬﻳﻦ
ﻳﻌﻤﻠﻮن ﰲ وﻗﺖ ﻣﺘﺄﺧﺮ ،ورﺑﻤﺎ ﻳﺨﺘﻠﻒ ﻫﺆﻻء اﻟﻌﻤﺎل ﰲ ﻣﺘﻮﺳﻂ اﻟﺪﺧﻞ ﻋﻦ اﻵﺧﺮﻳﻦ.
وﻋﻤﻮﻣً ﺎ ،ﻟﻠﺘﺄﻛﺪ ﻣﻦ أن اﻟﻌﻴﻨﺔ املﻜﻮﻧﺔ ﻣﻦ أﻟﻒ ﺷﺨﺺ ﻣُﻤﺜﱢﻠﺔ ﻋﲆ ﻧﺤﻮ ﻣﻨﺎﺳﺐ ﻟﻠﻤﺠﻤﻮﻋﺔ
اﻟﻜﻠﻴﺔ ،ﻓﺈﻧﻨﺎ ﺑﺤﺎﺟﺔ إﱃ »إﻃﺎر املﻌﺎﻳﻨﺔ«؛ وﻫﻮ ﻗﺎﺋﻤﺔ ﺗﻀﻢ املﻠﻴﻮن اﻟﻌﺎﻣﻠني ﺟﻤﻴﻌﻬﻢ ﰲ
املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ،واﻟﺘﻲ ﻳﻤﻜﻦ أن ﻧﺨﺘﺎر ﻣﻨﻬﺎ أﻟﻒ ﺷﺨﺺ ﻋﺸﻮاﺋﻴٍّﺎ .إن وﺟﻮد
ﻣﺜﻞ ﻫﺬه اﻟﻘﺎﺋﻤﺔ ﻳﻀﻤﻦ أن اﺣﺘﻤﺎﻟﻴﺔ ﺗﻀﻤني ﻛﻞ اﻷﺷﺨﺎص ﰲ اﻟﻌﻴﻨﺔ ﻣﺘﺴﺎوﻳﺔ.
أﺳﺎﺳﺎ ﻟﻌﻤﻠﻴﺔ ﻣﺴﺢ اﻟﻌﻴﻨﺎت؛ ً ﺗُﻌَ ﱡﺪ ﻓﻜﺮة »أﺧﺬ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ اﻟﺒﺴﻴﻄﺔ« ﻫﺬه
ﻓﻘﺪ ﺷ ﱠﻜ ْﻠﻨﺎ إﻃﺎر ﻣﻌﺎﻳﻨﺔ ،وﻣﻨﻪ ﻧﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﺳﻨُﻀﻤﱢ ﻨﻬﻢ ﰲ ﻋﻴﱢﻨﺘﻨﺎ ،ﺛﻢ
ﻧﺘﻌﻘﺒﻬﻢ )ﻣﻦ ﺧﻼل ﻣﻘﺎﺑﻠﺔ ﺷﺨﺼﻴﺔ أو اﺗﺼﺎل ﻫﺎﺗﻔﻲ أو رﺳﺎﻟﺔ أو ﺑﺮﻳﺪ إﻟﻜﱰوﻧﻲ ،أو ﱠ
ﻃﻮرت ﻫﺬه اﻟﻔﻜﺮة اﻷﺳﺎﺳﻴﺔ ﺑﺎﻟﻌﺪﻳﺪ ﺑﺄي ﻃﺮﻳﻘﺔ( وﻧﺴﺠﻞ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﻧﺮﻳﺪﻫﺎ .وﻗﺪ ُ
ﻣﻦ اﻟﻄﺮق اﻟﺪﻗﻴﻘﺔ واملﺘﻄﻮرة ﺟﺪٍّا؛ ﻣﻤﺎ أﺳﻔﺮ ﻋﻦ ﻧﻬﺞ أﻛﺜﺮ دﻗﺔ وأﻗﻞ ﺗﻜﻠﻔﺔ؛ ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎل ،إذا ﻛﻨﱠﺎ ﻧﻨﻮي ﻣﻘﺎﺑﻠﺔ ﻛﻞ ﺷﺨﺺ ﻣﻦ اﻷﻟﻒ املﺸﺎرﻛني ﰲ اﻟﺪراﺳﺔ ،ﻓﺈن ذﻟﻚ ﻳﻤﻜﻦ
أن ﻳﻜﻮن ﻣﻜ ﱢﻠ ًﻔﺎ ﺟﺪٍّا ﻣﻦ ﺣﻴﺚ اﻟﻮﻗﺖ وﻧﻔﻘﺎت اﻟﺘﻨﻘﻞ .ﺳﻴﻜﻮن ﻣﻦ اﻷﻓﻀﻞ — ﻣﻦ ﻫﺬا
املﻨﻈﻮر — اﺧﺘﻴﺎر املﺸﺎرﻛني ﰲ اﻟﺪراﺳﺔ ﻣﻦ ﻋﻨﺎﻗﻴﺪ ﺟﻐﺮاﻓﻴﺔ ﻣﺤﻠﻴﺔ ﺻﻐرية .وﻳﻮﺳﻊ
»أﺧﺬ اﻟﻌﻴﻨﺎت اﻟﻌﻨﻘﻮدﻳﺔ« ﻋﻤﻠﻴﺔ أﺧﺬ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ اﻟﺒﺴﻴﻄﺔ ﻣﻦ ﺧﻼل اﻟﺴﻤﺎح
56
ﺟﻤﻊ ﺑﻴﺎﻧﺎت ﺻﺎﻟﺤﺔ
ﻓﺒﺪﻻ ﻣﻦ اﺧﺘﻴﺎر أﻟﻒ ﺷﺨﺺ ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﻋﺸﻮاﺋﻴٍّﺎ ،ﻓﺈن ﻫﺬا ً ﺑﺬﻟﻚ؛
ﱞ
اﻟﻨﻬﺞ ﻳﺨﺘﺎر )ﻣﺜﻼ( ﻋﴩ ﻣﺠﻤﻮﻋﺎت ﺗﺘﻜﻮن ﻛﻞ ﻣﻨﻬﺎ ﻣﻦ ﻣﺎﺋﺔ ﺷﺨﺺ ،ﺑﺤﻴﺚ ﻳﻌﻴﺶ ﻛﻞ ً
اﻷﺷﺨﺎص ﰲ ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﺑﻌﻀﻬﻢ ﺑﺎﻟﻘﺮب ﻣﻦ ﺑﻌﺾ .وﺑﺎملﺜﻞ ،ﻳﻤﻜﻨﻨﺎ اﻟﺘﺄﻛﺪ ﻣﻦ ﺗﺤﻘﻴﻖ
ﺑﺪﻻ ﻣﻦ ﻣﺠﺮد اﻻﻋﺘﻤﺎد ﻋﲆ إﺟﺮاء أﺧﺬ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ ،إذا اﻟﺘﻮازن ﰲ ﺑﻌﺾ اﻟﻌﻮاﻣﻞً ،
ﻓﺮﺿﻨﺎ اﻟﺘﻮازن ﻋﲆ ﻃﺮﻳﻘﺔ اﺧﺘﻴﺎر اﻟﻌﻴﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ أن ﻧﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ
ﻋﺪدًا ﻣﻦ اﻟﻨﺴﺎء ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ،وﻧﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ ﻋﲆ ﻧﺤﻮ ﻣﻨﻔﺼﻞ
ﻋﺪدًا ﻣﻦ اﻟﺮﺟﺎل ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ؛ ﺣﻴﺚ ﻳﺘﻢ اﺧﺘﻴﺎر اﻷﻋﺪاد ﺑﺤﻴﺚ ﺗﻜﻮن
ﻧﺴﺐ اﻟﺬﻛﻮر واﻹﻧﺎث ﻫﻲ ﻧﻔﺴﻬﺎ ﻛﻤﺎ ﻫﻲ اﻟﺤﺎل ﰲ املﺠﻤﻮﻋﺔ اﻹﺟﻤﺎﻟﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ.
ﻳﻘﺴﻢ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ ﻳُﻌﺮف ﻫﺬا اﻹﺟﺮاء ﺑﺄﻧﻪ »اﻟﻄﺮﻳﻘﺔ اﻟﴩاﺋﺤﻴﺔ ﻷﺧﺬ اﻟﻌﻴﻨﺎت«؛ ﻷﻧﻪ ﱢ
اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ املﺪرﺟﺔ ﰲ إﻃﺎر اﻟﻌﻴﻨﺔ إﱃ ﴍاﺋﺢ )اﻟﺮﺟﺎل واﻟﻨﺴﺎء ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ(.
وإذا ﻛﺎن املﺘﻐري املﺴﺘﺨﺪم ﰲ اﻟﴩاﺋﺢ )اﻟﺠﻨﺲ ﰲ ﻫﺬا املﺜﺎل( ﻳﺮﺗﺒﻂ ارﺗﺒﺎ ً
ﻃﺎ ﻗﻮﻳٍّﺎ ﺑﺎملﺘﻐري
اﻟﺬي ﻧﻬﺘﻢ ﺑﻪ )اﻟﺪﺧﻞ ﻫﻨﺎ( ،ﻳﻤﻜﻦ أن ﻳﺴﻔﺮ ﻫﺬا ﻋﻦ ﺗﺤﺴﻦ ﰲ اﻟﺪﻗﺔ ﻟﺤﺠﻢ اﻟﻌﻴﻨﺔ ﻧﻔﺴﻪ.
وﻋﻤﻮﻣً ﺎ ،ﰲ ﻋﻤﻠﻴﺔ املﻌﺎﻳﻨﺔ ،ﻧﻜﻮن ﻣﺤﻈﻮﻇني ﻟﻠﻐﺎﻳﺔ إذا ﺣﺼﻠﻨﺎ ﻋﲆ ردود ﻣﻦ ﺟﻤﻴﻊ
اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻧﺘﻮاﺻﻞ ﻣﻌﻬﻢ .ﻳﻮﺟﺪ داﺋﻤً ﺎ ﻣﻘﺪار ﻣﻦ ﻋﺪم اﻻﺳﺘﺠﺎﺑﺔ ،وﻫﺬا ﻳﻌﻮد ﺑﻨﺎ
ﺳﺎﺑﻘﺎ ،وﻛﻤﺎ رأﻳﻨﺎ ،ﻳﻤﻜﻦ ﻟﻠﺒﻴﺎﻧﺎت اﻟﻨﺎﻗﺼﺔ ً إﱃ ﻣﺸﻜﻠﺔ اﻟﺒﻴﺎﻧﺎت اﻟﻨﺎﻗﺼﺔ اﻟﺘﻲ ﻧﺎﻗﺸﻨﺎﻫﺎ
أن ﺗﺆدي إﱃ ﻋﻴﻨﺔ ﻣﺘﺤﻴﺰة واﺳﺘﻨﺘﺎﺟﺎت ﻏري ﺻﺤﻴﺤﺔ .ﻓﺈذا رﻓﺾ اﻟﺬﻳﻦ ﻳﺤﺼﻠﻮن ﻋﲆ
رواﺗﺐ ﻛﺒرية املﺸﺎرﻛﺔ ﰲ اﻟﺪراﺳﺔ ،ﻓﺴﻮف ﻧﺒﺨﺲ ﺗﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ اﻟﺪﺧﻞ ﰲ املﺠﻤﻮﻋﺔ
اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .وﺑﺴﺒﺐ ﻫﺬا ،ﻃﻮر ﺧﱪاء اﻟﺪراﺳﺎت املﺴﺤﻴﺔ ﻣﺠﻤﻮﻋﺔ ﻣﺘﻨﻮﻋﺔ ﻣﻦ
وﺳﺎﺋﻞ ﺗﻘﻠﻴﻞ وﺿﺒﻂ ﻋﺪم اﻻﺳﺘﺠﺎﺑﺔ ،ﺑﻤﺎ ﰲ ذﻟﻚ ﺗﻜﺮار اﻟﺘﻮاﺻﻞ ﻣﻊ ﻏري املﺴﺘﺠﻴﺒني
وإﺟﺮاءات إﻋﺎدة اﻟﺘﻘﻴﻴﻢ اﻹﺣﺼﺎﺋﻲ.
ﺧﺎﺗﻤﺔ
ﺗﻨﺎول ﻫﺬا اﻟﻔﺼﻞ املﻮاد اﻟﺨﺎم ﻟﻺﺣﺼﺎﺋﻴﺎت؛ وﻫﻲ اﻟﺒﻴﺎﻧﺎت .وﻗﺪ ﺻﻴﻐﺖ ﺗﻘﻨﻴﺎت ﺟﻤﻊ
ﺑﻴﺎﻧﺎت ﻣﺘﻄﻮرة ﻋﲆ ﻳﺪ اﻹﺣﺼﺎﺋﻴني ﻟﻠﺤﺼﻮل ﻋﲆ أﻗﴡ ﻗﺪر ﻣﻦ املﻌﻠﻮﻣﺎت ﺑﺎﻟﺤﺪ اﻷدﻧﻰ
ﻣﻦ اﻟﺘﻜﻠﻔﺔ ،وﻟﻜﻦ ﺳﻴﻜﻮن ﻣﻦ اﻟﺴﺬاﺟﺔ اﻻﻋﺘﻘﺎد ﺑﺄﻧﻪ ﻳﻤﻜﻦ ﻋﺎدة اﻟﺤﺼﻮل ﻋﲆ ﺑﻴﺎﻧﺎت
ﻣﺜﺎﻟﻴﺔ .إن اﻟﺒﻴﺎﻧﺎت اﻧﻌﻜﺎس ﻟﻠﻌﺎ َﻟﻢ اﻟﺤﻘﻴﻘﻲ ،واﻟﻌﺎ َﻟﻢ اﻟﺤﻘﻴﻘﻲ ﱠ
ﻣﻌﻘﺪ .وإدرا ًﻛﺎ ﻟﻬﺬا،
ْ
وﻟﻜﻦ ﻣﻦ املﻬﻢ ﻃﻮر اﻹﺣﺼﺎﺋﻴﻮن ً
أﻳﻀﺎ أدوات ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت ذات اﻟﺠﻮدة اﻟﺮدﻳﺌﺔ.
ُﺪﺧﻼت ﻋﺪﻳﻤﺔ ﺪرك أن اﻹﺣﺼﺎﺋﻴني ﻟﻴﺴﻮا َﺳﺤَ ﺮة .وﻳﻨﻄﺒﻖ اﻟﻘﻮل املﺄﺛﻮر اﻟﻘﺪﻳﻢ» :ﻣ َ
أن ﻧ ُ ِ
اﻟﻨﻔﻊ ﺗﺴﺎوي ﻧﺘﺎﺋﺞ ﻋﺪﻳﻤﺔ اﻟﻨﻔﻊ« ﺗﻤﺎﻣً ﺎ ﻋﲆ اﻹﺣﺼﺎﺋﻴﺎت ﻛﻤﺎ ﻳﻨﻄﺒﻖ ﻋﲆ ﻛﻞ ﳾء آﺧﺮ.
57
اﻟﻔﺼﻞ اﻟﺮاﺑﻊ
اﻻﺣﺘﲈﻻت
أﻗﻮل ﻣﺎ إذا ﻛﺎﻧﺖ اﻟﻌﻤﻠﺔ ﺳﺘﻈﻬﺮ وﺟﻪ اﻟﺼﻮرة أم اﻟﻜﺘﺎﺑﺔ ﺑﻌﺪ أي ﻋﻤﻠﻴﺔ إﻟﻘﺎء ﻣﻨﻔﺮدة،
ﻳﻤﻜﻨﻨﻲ أن أﻗﻮل ﺑﺜﻘﺔ ﻛﺒرية إﻧﻪ إذا أُﻟﻘﻴﺖ اﻟﻌﻤﻠﺔ ﻋﺪة ﻣﺮات ﻓﺈﻧﻬﺎ ﺳﺘﻈﻬﺮ وﺟﻪ اﻟﺼﻮرة
ﰲ ﺣﻮاﱄ ﻧﺼﻒ ﻋﺪد املﺮات ووﺟﻪ اﻟﻜﺘﺎﺑﺔ ﰲ ﺣﻮاﱄ ﻧﺼﻒ ﻋﺪد املﺮات) .أﻓﱰض ﻫﻨﺎ أن
اﻟﻌﻤﻠﺔ »ﻋﻤﻠﺔ ﻣﺘﺰﻧﺔ« ،وأﻧﻪ ﻻ ﺗُﺴﺘﺨﺪم أي ﺧﺪﻋﺔ ﺑﺎﻷﻳﺪي أﺛﻨﺎء إﻟﻘﺎﺋﻬﺎ (.وﺛﻤﺔ ﻣﺜﺎل آﺧﺮ
ﰲ ﻫﺬا اﻟﻨﻄﺎق ﻫﻮ ﺗﺤﺪﻳﺪ ﻣﺎ إذا ﻛﺎن املﻮﻟﻮد ذﻛ ًﺮا أم أﻧﺜﻰ؛ ﻓﺘﺤﺪﻳﺪ اﻟﺠﻨﺲ ﺧﻼل ﻋﻤﻠﻴﺔ
اﻟﺤﻤﻞ أﻣﺮ ﺧﺎﺿﻊ ﻟﻠﻤﺼﺎدﻓﺔ اﻟﺒﺤﺘﺔ وﻻ ﻳﻤﻜﻦ اﻟﺘﻨﺒﺆ ﺑﻪ .وﻟﻜﻨﻨﺎ ﻧﻌﺮف أﻧﻪ ﻋﲆ ﻣﺪار
اﻟﻌﺪﻳﺪ ﻣﻦ ﺣﺎﻻت اﻟﻮﻻدة ﻓﺈن أﻛﺜﺮ ﻣﻦ ﻧﺼﻒ ﻋﺪد املﻮاﻟﻴﺪ ﺑﻘﻠﻴﻞ ﺳﻴﻜﻮﻧﻮن ذﻛﻮ ًرا.
ﺗُﻌَ ﱡﺪ ﻫﺬه اﻟﺴﻤﺔ اﻟﻄﺒﻴﻌﻴﺔ اﻟﻘﺎﺑﻠﺔ ﻟﻠﻤﻼﺣﻈﺔ ً
ﻣﺜﺎﻻ ﻟﻠﻘﻮاﻧني اﻟﺘﻲ ﺗﺤﻜﻢ ﻋﺪم اﻟﻴﻘني،
وﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ »ﻗﺎﻧﻮن اﻷﻋﺪاد اﻟﻜﺒرية« ﺑﺴﺒﺐ ﺣﻘﻴﻘﺔ أن اﻟﻨﺴﺒﺔ ﺗﻘﱰب أﻛﺜﺮ وأﻛﺜﺮ
ﻣﻦ ﻗﻴﻤﺔ ﻣﻌﻴﻨﺔ )اﻟﻨﺼﻒ ﰲ ﺣﺎﻻت اﻟﻌﻤﻠﺔ املﺘﺰﻧﺔ وﻧﻮع ﺟﻨﺲ املﻮاﻟﻴﺪ( ﻛﻠﻤﺎ زاد ﻋﺪد
اﻟﺤﺎﻻت اﻟﺘﻲ ﻧﻨﻈﺮ ﻓﻴﻬﺎ .ﻟﻬﺬا اﻟﻘﺎﻧﻮن ﺗﺒﻌﺎت ﻣﺘﻌﺪدة ،وﻫﻮ واﺣﺪ ﻣﻦ أﻗﻮى اﻷدوات
اﻹﺣﺼﺎﺋﻴﺔ ﰲ ﺗﺮوﻳﺾ ﻋﺪم اﻟﻴﻘني واﻟﺴﻴﻄﺮة ﻋﻠﻴﻪ واﻟﺴﻤﺎح ﻟﻨﺎ ﺑﺎﻻﺳﺘﻔﺎدة ﻣﻨﻪ .وﺳﻨﻌﻮد
ﻻﺣﻘﺎ ﰲ ﻫﺬا اﻟﻔﺼﻞ ،وﻋﲆ ﻧﺤﻮ ﻣﺘﻜﺮر ﺧﻼل اﻟﻜﺘﺎب.إﻟﻴﻪ ً
ﻟﻜﻲ ﻧﺘﻤﻜﻦ ﻣﻦ ﻣﻨﺎﻗﺸﺔ ﻣﺴﺎﺋﻞ ﻋﺪم اﻟﻴﻘني وﻋﺪم اﻟﻘﺪرة ﻋﲆ اﻟﺘﻨﺒﺆ دون ﻏﻤﻮض ،ﻓﺈن
آﺧﺮ — ﻟﻐﺔ دﻗﻴﻘﺔ؛ وﻫﻲ ﻟﻐﺔ »اﻻﺣﺘﻤﺎﻻت« .وإذاﻋﻠﻢ اﻹﺣﺼﺎء ﻳﺴﺘﺨﺪم — ﻣﺜﻞ أي ﻋﻠﻢ َ
ﻛﺎن ﻫﺬا ﻫﻮ أول ﺗﻌ ﱡﺮض ﻟﻚ ﻟﻠﻐﺔ اﻻﺣﺘﻤﺎﻻت ،إذن ﻳﺠﺐ أن أﺣﺬرك ﻣﻦ أﻧﻚ ﺳﻮف ﺗﻜﻮن
ﺑﺤﺎﺟﺔ ﻟﺒﺬل ﺑﻌﺾ اﻟﺠﻬﺪ ﻣﻦ أﺟﻞ ﻓﻬﻤﻬﺎ ،ﻛﻤﺎ ﻫﻲ اﻟﺤﺎل ﻣﻊ أول ﺗﻌﺮض ﻟﻠﻤﺮء ﻷي
ﻟﻐﺔ ﺟﺪﻳﺪة .وﺑﻮﺿﻊ ذﻟﻚ ﰲ اﻻﻋﺘﺒﺎر ،رﺑﻤﺎ ﺗﺠﺪ ﰲ اﻟﻮاﻗﻊ أن ﻫﺬا اﻟﻔﺼﻞ ﻳﺘﻄﻠﺐ اﻟﻘﺮاءة
أﻛﺜﺮ ﻣﻦ ﻣﺮة واﺣﺪة؛ ﻓﺮﺑﻤﺎ ﺗﺮﻏﺐ ﰲ إﻋﺎدة ﻗﺮاءة ﻫﺬا اﻟﻔﺼﻞ ﻣﺮة أﺧﺮى ﻋﻨﺪﻣﺎ ﺗﺼﻞ إﱃ
ﻧﻬﺎﻳﺔ اﻟﻜﺘﺎب.
ازدﻫﺮ ﺗﻄﻮر ﻟﻐﺔ اﻻﺣﺘﻤﺎﻻت ﰲ اﻟﻘﺮن اﻟﺴﺎﺑﻊ ﻋﴩ .وﻗﺪ أرﳻ ﻗﻮاﻋﺪﻫﺎ ﻋﻠﻤﺎء
اﻟﺮﻳﺎﺿﻴﺎت أﻣﺜﺎل ﺑﻠﻴﺰ ﺑﺎﺳﻜﺎل وﺑﻴري دي ﻓريﻣﺎ وﻛﺮﻳﺴﺘﻴﺎن ﻫﻴﺠﻨﺰ وﺟﺎﻛﻮب ﺑﺮﻧﻮﱄ،
وﻣﻦ ﺑﻌﺪﻫﻢ ﺑﻴري ﺳﻴﻤﻮن ﻻﺑﻼس وأﺑﺮاﻫﺎم دي ﻣﻮاﻓﺮ وﺳﻴﻤﻴﻮن-دﻧﻴﺲ ﺑﻮاﺳﻮن وأﻧﻄﻮان
ﻛﻮرﻧﻮ وﺟﻮن ﻓني ،وﻏريﻫﻢ .وﺑﺤﻠﻮل أواﺋﻞ اﻟﻘﺮن اﻟﻌﴩﻳﻦ ،ﻛﺎﻧﺖ ﻛﻞ اﻷﻓﻜﺎر اﻟﻼزﻣﺔ
ﻟﻌﻠﻢ اﺣﺘﻤﺎﻻت ﻗﻮي ﻣﺘﻮاﻓﺮة .وﰲ ﻋﺎم ،١٩٣٣ﻗﺪﱠم ﻋﺎﻟِﻢ اﻟﺮﻳﺎﺿﻴﺎت اﻟﺮوﳼ أﻧﺪرﻳﻪ
60
اﻻﺣﺘﻤﺎﻻت
ٍّ
ﻛﺎﻣﻼ ﻛﻮملﻮﺟﻮروف ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﺪﻳﻬﻴﺎت اﻟﺘﻲ ﻗﺪﻣﺖ »ﺣﺴﺎﺑًﺎ« رﻳﺎﺿﻴٍّﺎ رﺳﻤﻴٍّﺎ
ﻟﻼﺣﺘﻤﺎﻻت .وﻣﻨﺬ ذﻟﻚ اﻟﺤني ،اﻋﺘُﻤﺪ ﻧﻈﺎم اﻟﺒﺪﻳﻬﻴﺎت ﻫﺬا ﻋﺎملﻴٍّﺎ ﺗﻘﺮﻳﺒًﺎ.
آﻟﻴﺔ ﻳﻤﻜﻦ ﻣﻦ ﺧﻼﻟﻬﺎ اﻟﺘﻌﺎﻣﻞ ﻣﻊ اﻻﺣﺘﻤﺎﻻت ،ﻟﻜﻨﻬﺎ ﺗﻮﻓﺮ ﺑﺪﻳﻬﻴﺎت ﻛﻮملﻮﺟﻮروف ً ﱢ
ﺑﻨﻴﺔ رﻳﺎﺿﻴﺔ .وﻻﺳﺘﺨﺪام ﻫﺬه اﻟﺒﻨﻴﺔ ﻟﺘﻘﺪﻳﻢ ﺑﻴﺎﻧﺎت ﺣﻮل اﻟﻌﺎﻟﻢ اﻟﺤﻘﻴﻘﻲ ،ﻣﻦ اﻟﴬوري
اﻹﺷﺎرة إﱃ ﻣﺎ ﺗﻤﺜﱢﻠﻪ اﻟﺮﻣﻮز املﻮﺟﻮدة ﰲ اﻵﻟﻴﺔ اﻟﺮﻳﺎﺿﻴﺔ املﻮﺟﻮدة ﰲ ﻫﺬا اﻟﻌﺎﻟﻢ؛ أي إﻧﻨﺎ
ﺑﺤﺎﺟﺔ إﱃ ﻗﻮل ﻣﺎ »ﺗﻌﻨﻴﻪ« اﻟﺮﻳﺎﺿﻴﺎت.
ﻳﻌني ﺣﺴﺎب اﻻﺣﺘﻤﺎﻻت أرﻗﺎﻣً ﺎ ﺑني ٠و ١ﻟﻸﺣﺪاث ﻏري املﺆﻛﺪة ﻟﺘﻤﺜﻴﻞ اﺣﺘﻤﺎﻟﻴﺔ
ﺣﺪوﺛﻬﺎ .ﻳﻌﻨﻲ اﻻﺣﺘﻤﺎل ١أن ﻫﺬا اﻟﺤﺪث ﻣﺆﻛﺪ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،اﺣﺘﻤﺎل أﻧﻪ ﻟﻮ أن
ً
ﺟﺎﻟﺴﺎ إﱃ ﻛﻨﺖ أﻛﺘﺐ ﻫﺬا اﻟﻜﺘﺎب ،ﻟﺮآﻧﻲ ُ أﺣﺪﻫﻢ ﻧﻈﺮ ﻣﻦ ﻧﺎﻓﺬة ﺣﺠﺮة ﻣﻜﺘﺒﻲ ﺑﻴﻨﻤﺎ
ﺷﺨﺼﺎً ﻣﻜﺘﺒﻲ( .واﻻﺣﺘﻤﺎل ٠ﻳﻌﻨﻲ أن اﻟﺤﺪث ﻣﺴﺘﺤﻴﻞ )ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،اﺣﺘﻤﺎل أن
ﻟﺤﺪث ﻣﺎ »ﻳﻤﻜﻦ« أن ﻳﺤﺪث ٍ ﻣﺎ ﺳﻮف ﻳﻨﻬﻲ ﺳﺒﺎق ﻣﺎراﺛﻮن ﰲ ﻋﴩ دﻗﺎﺋﻖ( .وﺑﺎﻟﻨﺴﺒﺔ
ﻣﺴﺘﺤﻴﻼ ،ﻓﺈن رﻗﻤً ﺎ ﺑني ٠و ١ﻳﻤﺜﻞ »اﺣﺘﻤﺎل« ﺣﺪوﺛﻪ.ً وﻟﻜﻨﻪ ﻟﻴﺲ ﻣﺆﻛﺪًا وﻻ
إﺣﺪى ﻃﺮق اﻟﻨﻈﺮ إﱃ ﻫﺬا اﻟﺮﻗﻢ ﻫﻲ أﻧﻪ ﻳﻤﺜﻞ »درﺟﺔ اﻋﺘﻘﺎد« املﺮء أن اﻟﺤﺪث
ﺳﻮف ﻳﺤﺪث .ﺳﻮف ﻳﻤﺘﻠﻚ اﻷﺷﺨﺎص املﺨﺘﻠﻔﻮن ﻣﻌﻠﻮﻣﺎت أﻛﺜﺮ أو أﻗﻞ ﻣﺘﻌﻠﻘﺔ ﺑﻜﻮن
اﻟﺤﺪث ﺳﻴﻘﻊ أم ﻻ؛ ﻟﺬﻟﻚ رﺑﻤﺎ ﻳُﺘﻮﻗﻊ أن ﻳﻤﺘﻠﻚ اﻷﺷﺨﺎص املﺨﺘﻠﻔﻮن درﺟﺎت ﻣﺨﺘﻠﻔﺔ ﻣﻦ
اﻻﻋﺘﻘﺎد؛ وﻫﺬا ﻳﻌﻨﻲ اﺣﺘﻤﺎﻻت ﻣﺨﺘﻠﻔﺔ ﻟﻬﺬا اﻟﺤﺪث .وﻟﻬﺬا اﻟﺴﺒﺐ ،ﺗُﺴﻤﱠ ﻰ وﺟﻬﺔ اﻟﻨﻈﺮ
ﺗﻠﻚ ﺣﻴﺎل اﻻﺣﺘﻤﺎل اﻻﺣﺘﻤﺎ َل »اﻟﺬاﺗﻲ« أو »اﻟﺸﺨﴢ«؛ ﻓﻬﻲ ﺗﻌﺘﻤﺪ ﻋﲆ ﻣَ ﻦ ﻳﻘﻴﱢﻢ اﻻﺣﺘﻤﺎل.
أﻳﻀﺎ أن اﻻﺣﺘﻤﺎل ﻟﺪى اﻟﺸﺨﺺ رﺑﻤﺎ ﻳﺘﻐري ﻣﻊ ﺗﻮاﻓﺮ املﺰﻳﺪ ﻣﻦ املﻌﻠﻮﻣﺎت. وﻣﻦ اﻟﻮاﺿﺢ ً
ﻓﺮﺑﻤﺎ ﺗﺒﺪأ ﺑﺎﺣﺘﻤﺎل — درﺟﺔ اﻋﺘﻘﺎد — ﺗﺒﻠﻎ ٢ / ١أن ﻋﻤﻠﺔ ﻣﻌﻴﻨﺔ ﺳﻮف ﺗﺴﺘﻘﺮ ووﺟﻪ
اﻟﺼﻮرة ﻷﻋﲆ )ﻋﲆ أﺳﺎس ﺗﺠﺮﺑﺘﻚ اﻟﺴﺎﺑﻘﺔ ﻣﻊ ﻗﺬف ﻋﻤﻼت ﻣﻌﺪﻧﻴﺔ أﺧﺮى( ،وﻟﻜﻦ ﺑﻌﺪ
ﻣﺮاﻗﺒﺔ اﺳﺘﻘﺮار اﻟﻌﻤﻠﺔ ووﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ ١٠٠ﻣﺮة ﻣﺘﺘﺎﻟﻴﺔ دون اﺳﺘﻘﺮارﻫﺎ ﻋﲆ وﺟﻪ
اﻟﻜﺘﺎﺑﺔ ﻗﻂ ،رﺑﻤﺎ ﺗﺼﺒﺢ ﻣﺘﺸﻜ ًﻜﺎ وﺗﻐري اﺣﺘﻤﺎﻻﺗﻚ اﻟﺸﺨﺼﻴﺔ ﺑﺄن ﺗﺴﺘﻘﺮ ﻫﺬه اﻟﻌﻤﻠﺔ
ﻋﲆ وﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ.
ﻃﻮرت أدوات ﻟﺘﻘﺪﻳﺮ اﻻﺣﺘﻤﺎﻻت اﻟﺬاﺗﻴﺔ ﻟﻸﻓﺮاد ﻋﲆ أﺳﺎس اﺳﱰاﺗﻴﺠﻴﺎت وﻗﺪ ُ
املﺮاﻫﻨﺔ ،وﻟﻜﻦ ﻛﻤﺎ ﻫﻲ اﻟﺤﺎل ﻣﻊ أي إﺟﺮاء ﻟﻠﻘﻴﺎس ،ﺛﻤﺔ ﻗﻴﻮد ﻋﻤﻠﻴﺔ ﻋﲆ ﻣﺪى دﻗﺔ
ﺗﻘﺪﻳﺮ اﻻﺣﺘﻤﺎﻻت.
ﺣﺪث ﻣﺎ ﰲ أﻧﻬﺎ ﻋﺪد ﻣﺮات وﻗﻮع ﻫﺬا ٍ ﺗﺘﻤﺜﻞ وﺟﻬﺔ ﻧﻈﺮ ﻣﺨﺘﻠﻔﺔ ﻻﺣﺘﻤﺎﻻت وﻗﻮع
اﻟﺤﺪث إذا ﺗﻜﺮرت اﻟﻈﺮوف ﻋﲆ ﻧﺤﻮ ﻣﺘﻄﺎﺑﻖ ﻟﻌﺪد ﻻ ﻧﻬﺎﺋﻲ ﻣﻦ املﺮات .وﻳُﻌَ ﱡﺪ ﻣﺜﺎل
61
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻗﺬف اﻟﻌﻤﻠﺔ املﺘﺰﻧﺔ اﻟﺴﺎﺑﻖ ﺗﻮﺿﻴﺤً ﺎ ﻟﻬﺬا؛ ﻓﻘﺪ رأﻳﻨﺎ أﻧﻪ ﺑﻴﻨﻤﺎ ﺗﻘﺬف اﻟﻌﻤﻠﺔ ،ﻓﺈن ﻧﺴﺒﺔ
ﻇﻬﻮر اﻟﺼﻮرة ﺗﻘﱰب أﻛﺜﺮ وأﻛﺜﺮ ﻣﻦ ﻗﻴﻤﺔ ﻣﺤﺪدة .وﺗﻌ ﱠﺮف ﻫﺬه اﻟﻘﻴﻤﺔ ﻋﲆ أﻧﻬﺎ اﺣﺘﻤﺎل
اﺳﺘﻘﺮار اﻟﻌﻤﻠﺔ ﻋﲆ وﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ ﰲ أي ﻋﻤﻠﻴﺔ ﻗﺬف واﺣﺪة .وﻧﻈ ًﺮا ﻟﺪور اﻟﺘﻜﺮارات،
أو ﻋﺪد املﺮات ،ﰲ ﺗﺤﺪﻳﺪ ﻫﺬا اﻟﺘﻔﺴري ﻟﻼﺣﺘﻤﺎﻻت ،ﻓﺈﻧﻪ ﻳﺴﻤﻰ اﻟﺘﻔﺴري »اﻟﺘﻜﺮاري«.
وﺗﻤﺎﻣً ﺎ ﻛﻤﺎ ﻫﻲ اﻟﺤﺎل ﻣﻊ اﻟﻨﻬﺞ اﻟﺬاﺗﻲ ،ﺗﻮﺟﺪ ﻗﻴﻮد ﻋﻤﻠﻴﺔ ﺗﻤﻨﻌﻨﺎ ﻣﻦ إﻳﺠﺎد
ً
ﻇﺮوﻓﺎ ﻟﻌﻤﻠﺔ ﻣﺎ ﻻ ﻳﻤﻜﻦ أن ﺗﻤﺘﻠﻜﺎ ٍّ
ﺣﻘﺎ ٍ ٍ
ﻗﺬف اﻻﺣﺘﻤﺎﻻت اﻟﺘﻜﺮارﻳﺔ ﺑﺎﻟﻀﺒﻂ؛ ﻓﻌﻤﻠﻴﺘﺎ
ﻣﺘﻄﺎﺑﻘﺔ ﺗﻤﺎﻣً ﺎ؛ ﻓﺴﻮف ﺗﺒﲆ ﺑﻌﺾ اﻟﺠﺰﻳﺌﺎت ﻣﻦ اﻟﻌﻤﻠﺔ ﰲ اﻟﺮﻣﻴﺔ اﻷوﱃ ،وﺳﺘﺨﺘﻠﻒ
ﻤﺎس ﻣﻊ اﻷﺻﺎﺑﻊ ﰲ املﺮة ﻗﻠﻴﻼ ﺟﺮاء اﻟﺘﱠ ﱢ
ﺗﻴﺎرات اﻟﻬﻮاء ،وﺳﱰﺗﻔﻊ درﺟﺔ ﺣﺮارة اﻟﻌﻤﻠﺔ ً
وﻗﺖ ﻣﺎ؛ ﻟﺬﻟﻚ ﻻ ﻳﻤﻜﻨﻨﺎ ﻗﺬﻓﻬﺎاﻷوﱃ .وﻋﲆ أي ﺣﺎل ﺳﻴﻜﻮن ﻋﻠﻴﻨﺎ وﻗﻒ ﻗﺬف اﻟﻌﻤﻠﺔ ﰲ ٍ
ﻓﻌﻠﻴٍّﺎ ﻟﻌﺪد ﻻ ﻧﻬﺎﺋﻲ ﻣﻦ املﺮات.
ﻫﺬان اﻟﺘﻔﺴريان املﺨﺘﻠﻔﺎن ملﺎ ﺗﻌﻨﻴﻪ اﻻﺣﺘﻤﺎﻻت ﻟﻬﻤﺎ ﺧﺼﺎﺋﺺ ﻣﺨﺘﻠﻔﺔ .ﻓﻴﻤﻜﻦ
ٍ
ﺣﺪث ﻳﻜﻮن اﻟﺘﻔﻜري ﻟﺤﺪث ﻓﺮﻳﺪ ﻣﻦ ﻧﻮﻋﻪ؛ٍ اﺳﺘﺨﺪام اﻟﻨﻬﺞ اﻟﺬاﺗﻲ ﻟﺘﻌﻴني اﺣﺘﻤﺎل ﻣﻌني
ﰲ ﺗﻜﺮاره ﰲ ﻇﻞ ﻇﺮوف ﻣﻤﺎﺛﻠﺔ ﻟﻌﺪد ﻻ ﻧﻬﺎﺋﻲ — أو ﺣﺘﻰ ﻋﺪد ﻛﺒري — ﻣﻦ املﺮات
ﻻ ﻣﻌﻨﻰ ﻟﻪ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻟﻴﺲ ﻫﻨﺎك ﻣﻌﻨًﻰ ﻻﻗﱰاح ﻋﻤﻞ ﺳﻠﺴﻠﺔ ﻻ ﻧﻬﺎﺋﻴﺔ ﻣﻦ
ٍ
ﻟﻨﺘﻴﺠﺔ املﺤﺎوﻻت املﺘﻄﺎﺑﻘﺔ ﻻﻏﺘﻴﺎل اﻟﺮﺋﻴﺲ املﻘﺒﻞ ﻟﻠﻮﻻﻳﺎت املﺘﺤﺪة ،ﺑﺤﻴﺚ ﻳﺆدي ﺑﻌﻀﻬﺎ
ﻣﺎ واﻟﺒﻌﺾ اﻵﺧﺮ ﻟﻨﺘﻴﺠﺔ أﺧﺮى؛ ﻟﺬﻟﻚ ﻳﺒﺪو ﻣﻦ اﻟﺼﻌﺐ ﺗﻄﺒﻴﻖ اﻟﺘﻔﺴري اﻟﺘﻜﺮاري ﻋﲆ
ﻣﺜﻞ ﻫﺬا اﻟﺤﺪث .ﻣﻦ ﻧﺎﺣﻴﺔ أﺧﺮى ،ﻓﺈن اﻟﻨﻬﺞ اﻟﺬاﺗﻲ ﻳﻨﻘﻞ اﻻﺣﺘﻤﺎﻻت ﻣﻦ ﻛﻮﻧﻬﺎ ﺧﺎﺻﻴﺔ
ﻣﻮﺿﻮﻋﻴﺔ ﻟﻠﻌﺎﻟﻢ اﻟﺨﺎرﺟﻲ )ﻣﺜﻞ اﻟﻜﺘﻠﺔ أو اﻟﻄﻮل( إﱃ ﻛﻮﻧﻬﺎ ﺧﺎﺻﻴﺔ ﻟﻠﺘﻔﺎﻋﻞ ﺑني اﻟﺮاﺻﺪ
واﻟﻌﺎﻟﻢ؛ ﻓﺎﻻﺣﺘﻤﺎﻻت اﻟﺬاﺗﻴﺔ ﺗﺠﻌﻞ اﻟﺮاﺻﺪ ﻫﻮ اﻷﺳﺎس .ﻗﺪ ﻳﺸﻌﺮ اﻟﺒﻌﺾ أن ﻫﺬا ﻧﻘﻄﺔ
ﺿﻌﻒ؛ ﻓﻬﺬا ﻳﻌﻨﻲ أن اﻷﺷﺨﺎص املﺨﺘﻠﻔني ﻳﻤﻜﻨﻬﻢ اﺳﺘﺨﻼص اﺳﺘﻨﺘﺎﺟﺎت ﻣﺨﺘﻠﻔﺔ ﻣﻦ
اﻟﺘﺤﻠﻴﻞ ﻧﻔﺴﻪ ﻟﻠﺒﻴﺎﻧﺎت ﻧﻔﺴﻬﺎ .وﻗﺪ ﻳﻌﺘﱪه اﻟﺒﻌﺾ اﻵﺧﺮ ﻧﻘﻄﺔ ﻗﻮة؛ إذ إن اﻻﺳﺘﻨﺘﺎﺟﺎت
ﺗﺘﺄﺛﺮ ﺑﻤﻌﺮﻓﺘﻚ اﻟﺴﺎﺑﻘﺔ.
ﻣﻊ ذﻟﻚ ،ﺗﻮﺟﺪ ﺗﻔﺴريات أﺧﺮى ﻟﻼﺣﺘﻤﺎل؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻔﱰض اﻟﻨﻬﺞ
»اﻟﻜﻼﺳﻴﻜﻲ« أن ﺟﻤﻴﻊ اﻷﺣﺪاث ﺗﺘﻜﻮن ﻣﻦ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﺣﺪاث اﻻﺑﺘﺪاﺋﻴﺔ املﺘﺴﺎوﻳﺔ
اﻻﺣﺘﻤﺎل؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﻣﻲ اﻟﻨﺮد ﻗﺪ ﻳﻨﺘﺞ اﻟﺮﻗﻢ ١أو ٢أو ٣أو ٤أو ٥أو
،٦وﺗﻤﺎﺛﻞ اﻟﻨﺮد ﻳﺸري إﱃ ﺗَﺴﺎوي اﺣﺘﻤﺎﻟﻴﺔ ﻇﻬﻮر ﻫﺬه اﻟﻨﺘﺎﺋﺞ اﻟﺴﺖ ،وﻫﻜﺬا ﻛﻞ رﻗﻢ
ﻟﺪﻳﻪ اﺣﺘﻤﺎل ﻳﺒﻠﻎ ) ٦ / ١ﻳﺠﺐ أن ﻳﻜﻮن ﻣﺠﻤﻮﻋﻬﺎ ،١ﻧﻈ ًﺮا ﻷﻧﻪ ﻣﻦ »املﺆﻛﺪ« أن واﺣﺪًا
ﻣﻦ اﻷرﻗﺎم ١أو ٢أو ٣أو ٤أو ٥أو ٦ﺳﻮف ﻳﻈﻬﺮ( .واﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﻋﺪد
62
اﻻﺣﺘﻤﺎﻻت
63
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻓﻴﻤﺎ ﻳﻘﺮب ﻣﻦ ﻧﺼﻒ ﻣﺮات ﻗﺬﻓﻬﺎ ،وأﻧﻪ ﻣﻦ ﺑني ﻫﺬه اﻟﺤﺎﻻت ،ﺳﻮف ﺗﺴﺘﻘﺮ اﻟﻘﻄﻌﺔ
اﻟﻨﻘﺪﻳﺔ ﰲ اﻟﻴﺪ اﻟﻴﻤﻨﻰ ووﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ ﻓﻴﻤﺎ ﻳﻘﺮب ﻣﻦ ﻧﺼﻒ ﻣﺮات ﻗﺬﻓﻬﺎ ﻷن ﻧﺘﺎﺋﺞ
ﻋﻤﻠﻴﺔ اﻟﻘﺬف اﻷوﱃ ﻻ ﺗﺆﺛﺮ ﻋﲆ اﻟﺜﺎﻧﻴﺔ .وﺑﻮﺟﻪ ﻋﺎم ،ﻓﺈن ﺣﻮاﱄ ٤ / ١ﻋﺪد ﻣﺮات اﻟﻘﺬف
املﺰدوج ﻣﻦ ﺷﺄﻧﻪ أن ﻳﻨﺘﺞ ﻋﻨﻪ ﺻﻮرة .وﺑﺎملﺜﻞ ،ﻓﺈن ﺣﻮاﱄ ٤ / ١ﻋﺪد املﺮات ﺳﻴﻨﺘﺞ
ﻋﻨﻪ ﻛﺘﺎﺑﺔ ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﴪى ،وﺻﻮرة ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﻤﻨﻰ ،وﺣﻮاﱄ ٤ / ١ﻋﺪد املﺮات
ﺳﻴﻨﺘﺞ ﻋﻨﻪ ﺻﻮرة ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﴪى ،وﻛﺘﺎﺑﺔ ﰲ ﻋﻤﻠﺔ اﻟﻴﺪ اﻟﻴﻤﻨﻰ ،وﺣﻮاﱄ ٤ / ١ﻋﺪد
املﺮات ﺳﻴﻨﺘﺞ ﻋﻨﻪ ﻛﺘﺎﺑﺔ ﰲ ﻛﻠﺘﺎ اﻟﻌﻤﻠﺘني.
ٍّ
ﻣﺴﺘﻘﻼ ﻋﻤﱠ ﺎ إذا ﰲ املﻘﺎﺑﻞ ،ﻓﺈن اﺣﺘﻤﺎل اﻟﺘﻌﺜﺮ واﻟﺴﻘﻮط ﰲ اﻟﺸﺎرع ﺑﺎﻟﺘﺄﻛﻴﺪ ﻟﻴﺲ
آﺧﺮ ﻣﺜﺎﻻ َ
ً ﻄﻰ ﺑﺎﻟﺜﻠﻮج أم ﻻ؛ ﻓﻬﺬان اﻟﺤﺪﺛﺎن »ﻏري ﻣﺴﺘﻘﻠني« .رأﻳﻨﺎ ﻛﺎن اﻟﺸﺎرع ﻣﻐ ٍّ
ﻟﻸﺣﺪاث ﻏري املﺴﺘﻘﻠﺔ ﰲ اﻟﻔﺼﻞ اﻷول؛ ﰲ ﺣﺎﻟﺔ ﻟﺴﺎﱄ ﻛﻼرك املﺄﺳﺎوﻳﺔ اﻟﺘﻲ ﺗﻮﰲ ﻓﻴﻬﺎ
ﻃﻔﻼن ﰲ اﻷﴎة ﻧﻔﺴﻬﺎ .ﻋﻨﺪﻣﺎ ﻳﻜﻮن اﻟﺤﺪﺛﺎن ﻏري ﻣﺴﺘﻘﻠني ،ﻓﺈﻧﻨﺎ ﻻ ﻧﺴﺘﻄﻴﻊ ﺣﺴﺎب
اﺣﺘﻤﺎﱄ وﻗﻮﻋﻬﻤﺎ املﻨﻔﺼﻠني ﻣﻌً ﺎ .وﰲ َ اﺣﺘﻤﺎل وﻗﻮع ﻛ ﱟﻞ ﻣﻨﻬﻤﺎ ﺑﺒﺴﺎﻃﺔ ﻋﻦ ﻃﺮﻳﻖ ﴐب
اﻟﻮاﻗﻊ ،ﻛﺎن ﻫﺬا ﻫﻮ اﻟﺨﻄﺄ اﻟﺬي ﻛﺎن ﻳﻜﻤﻦ ﰲ ﺟﻮﻫﺮ ﻗﻀﻴﺔ ﺳﺎﱄ ﻛﻼرك .ﻹدراك ذﻟﻚ،
ﺗﻄﺮﻓﺎ ﻟﺤﺪﺛني ﻏري ﻣﺴﺘﻘﻠني ﺗﻤﺎﻣً ﺎ؛ وﻫﻮ ﻋﻨﺪﻣﺎ »ﺗﺤﺪﱢد« ﻧﺘﺎﺋﺞُ ً دﻋﻨﺎ ﻧﺄﺧﺬ املﻮﻗﻒ اﻷﻛﺜﺮ
أﺣﺪ اﻟﺤﺪﺛني »ﻋﲆ ﻧﺤﻮ ﺗﺎم« ﻧﺘﺎﺋﺞَ اﻟﺤﺪث اﻵﺧﺮ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺗﺄﻣﱠ ْﻞ ﻋﻤﻠﻴﺔ ﻗﺬف
ﻋﻤﻠﺔ واﺣﺪة ،واﻟﺤﺪﺛﺎن »وﺟﻪ اﻟﺼﻮرة ﻟﻠﻌﻤﻠﺔ ﻷﻋﲆ« و»وﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻟﻠﻌﻤﻠﺔ ﻷﺳﻔﻞ« .ﻛ ﱞﻞ
ﻣﻦ ﻫﺬﻳﻦ اﻟﺤﺪﺛني ﻟﺪﻳﻪ اﺣﺘﻤﺎل ﻳﺒﻠﻎ اﻟﻨﺼﻒ؛ ﻓﺎﺣﺘﻤﺎل أن اﻟﻌﻤﻠﺔ ﺳﻮف ﺗﺴﺘﻘﺮ ووﺟﻪ
اﻟﺼﻮرة ﻷﻋﲆ ﻫﻮ ،٢ / ١واﺣﺘﻤﺎل أن اﻟﻌﻤﻠﺔ ﺳﻮف ﺗﺴﺘﻘﺮ ووﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻷﺳﻔﻞ ﻫﻮ
ﻃﺎ .٢ / ١وﻟﻜﻦ ﻣﻦ اﻟﻮاﺿﺢ أﻧﻬﻤﺎ ﻟﻴﺴﺎ ﺣﺪﺛني ﻣﺴﺘﻘﻠني .ﰲ اﻟﻮاﻗﻊ ،ﻫﻤﺎ ﻣﺮﺗﺒﻄﺎن ارﺗﺒﺎ ً
ﺗﺎﻣٍّ ﺎ .ﻓﻌﲆ أي ﺣﺎل ،إذا ﻛﺎن اﻟﺤﺪث اﻷول ﺻﺤﻴﺤً ﺎ )اﻟﺼﻮرة ﻷﻋﲆ( »ﻳﺠﺐ« أن ﻳﻜﻮن
ﻃﺎ ﺗﺎﻣٍّ ﺎ ،ﻓﺈن اﺣﺘﻤﺎل أن ﻳﺤﺪث اﻟﺜﺎﻧﻲ ﺻﺤﻴﺤً ﺎ )اﻟﻜﺘﺎﺑﺔ ﻷﺳﻔﻞ( .وﻷﻧﻬﻤﺎ ﻣﺮﺗﺒﻄﺎن ارﺗﺒﺎ ً
ﻛﻼﻫﻤﺎ ﻳﺴﺎوي ﺑﺒﺴﺎﻃﺔ اﺣﺘﻤﺎل ﺣﺪوث اﻷول؛ وﻫﻮ اﺣﺘﻤﺎل ﻳﺒﻠﻎ اﻟﻨﺼﻒ .وﻟﻴﺲ ﻫﺬا ﻣﺎ
ً
ﻧﺼﻔﺎ ﻣﻌً ﺎ. ﻧﺤﺼﻞ ﻋﻠﻴﻪ إذا ﴐﺑﻨﺎ اﻻﺣﺘﻤﺎﻟني املﻨﻔﺼﻠني اﻟﺒﺎﻟﻎ ﻛ ﱞﻞ ﻣﻨﻬﻤﺎ
ﺑﺼﻔﺔ ﻋﺎﻣﺔ ،ﻳﻌﻨﻲ ﻋﺪم اﻻﺳﺘﻘﻼل ﺑني ﺣﺪﺛني أن اﺣﺘﻤﺎل أن أﺣﺪﻫﻤﺎ ﺳﻴﺤﺪث
ﻳﻌﺘﻤﺪ ﻋﲆ ﻛﻮن اﻵﺧﺮ ﻗﺪ ﺣﺪث أم ﻻ.
ﻳﻄﻠﻖ اﻹﺣﺼﺎﺋﻴﻮن ﻋﲆ اﺣﺘﻤﺎل وﻗﻮع ﺣﺪﺛني ﻣﻌً ﺎ اﺳﻢ »اﻻﺣﺘﻤﺎل املﺸﱰك« ﻟﻬﺬﻳﻦ
اﻟﺤﺪﺛني؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ أن ﻧﺘﺤﺪث ﻋﻦ اﻻﺣﺘﻤﺎل املﺸﱰك ﺑﺄﻧﻨﻲ ﺳﻮف أﻧﺰﻟﻖ
وﺛﻴﻘﺎ ﺑﺎﺣﺘﻤﺎل ﻃﺎ ً ﻄﻰ ﺑﺎﻟﺜﻠﻮج .واﻻﺣﺘﻤﺎل املﺸﱰك ﺑني ﺣﺪﺛني ﻳﺮﺗﺒﻂ ارﺗﺒﺎ ً وأن اﻟﻄﺮﻳﻖ ﻣﻐ ٍّ
64
اﻻﺣﺘﻤﺎﻻت
ﺣﺪث آﺧﺮ .ﻫﺬا ﻳﺴﻤﻰ »اﻻﺣﺘﻤﺎل اﻟﴩﻃﻲ«؛ أي اﺣﺘﻤﺎل ٌ ﺣﺪث ﻣﺎ »إذا« وﻗﻊ ٌ أن ﻳﻘﻊ
أن ﺣﺪﺛﺎ ﻣﺎ ﺳﻮف ﻳﻘﻊ ﻧﻈ ًﺮا ﻟﻮﻗﻮع ﺣﺪث آﺧﺮ .وﻫﻜﺬا ﻳﻤﻜﻨﻨﺎ أن ﻧﺘﺤﺪث ﻋﻦ اﻻﺣﺘﻤﺎل ً
اﻟﴩﻃﻲ ﺑﺄﻧﻨﻲ ﺳﻮف أﻧﺰﻟﻖ ﻷن اﻟﻄﺮﻳﻖ ﻣﻐ ٍّ
ﻄﻰ ﺑﺎﻟﺜﻠﻮج.
إن اﻻﺣﺘﻤﺎل )املﺸﱰك( ﻟﻮﻗﻮع ﻛﻼ اﻟﺤﺪﺛني »أ« و»ب« ﻫﻮ ﺑﺒﺴﺎﻃﺔ اﺣﺘﻤﺎل وﻗﻮع
اﻟﺤﺪث »أ« ﻣﴬوﺑًﺎ ﰲ اﺣﺘﻤﺎل وﻗﻮع اﻟﺤﺪث »ب« )املﴩوط( ﻧﻈ ًﺮا ﻟﻮﻗﻮع »أ«؛ ﻓﺎﻻﺣﺘﻤﺎل
)املﺸﱰك( أن اﻟﺜﻠﻮج ﺗﺘﺴﺎﻗﻂ وأﻧﻨﻲ ﺳﺄﻧﺰﻟﻖ ﻫﻮ اﺣﺘﻤﺎل أن اﻟﺜﻠﻮج ﺗﺘﺴﺎﻗﻂ ﻣﴬوﺑًﺎ ﰲ
اﻻﺣﺘﻤﺎل )املﴩوط( أﻧﻨﻲ ﺳﺄﻧﺰﻟﻖ إذا ﻛﺎﻧﺖ اﻟﺜﻠﻮج ﻗﺪ ﺗﺴﺎﻗﻄﺖ.
وﻟﻠﺘﻮﺿﻴﺢ ،ﺗﺄﻣﱠ ْﻞ رﻣﻴﺔ واﺣﺪة ﻟﺤﺠﺮ ﻧﺮد وﺣﺪﺛني .اﻟﺤﺪث »أ« ﻫﻮ أن اﻟﺮﻗﻢ اﻟﻈﺎﻫﺮ
ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ،٢واﻟﺤﺪث »ب« ﻫﻮ أن اﻟﺮﻗﻢ اﻟﻈﺎﻫﺮ ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ .٣اﻻﺣﺘﻤﺎل
املﺸﱰك ﻟﻬﺬﻳﻦ اﻟﺤﺪﺛني »أ« و»ب« ﻫﻮ اﺣﺘﻤﺎل أن ﻧﺤﺼﻞ ﻋﲆ ﻋﺪد ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ٢
و ،٣وﻫﺬا اﻻﺣﺘﻤﺎل ﻳﺒﻠﻎ ٦ / ١ﻓﻘﻂ؛ إذ إن واﺣﺪًا ﻓﻘﻂ ﻣﻦ اﻷرﻗﺎم ٦ ،٥ ،٤ ،٣ ،٢ ،١ﻳﻘﺒﻞ
اﻟﻘﺴﻤﺔ ﻋﲆ ﻛﻞ ﻣﻦ ٢و .٣واﻻﺣﺘﻤﺎل املﴩوط ﻟﻠﺤﺪث »ب« ﻧﻈ ًﺮا ﻟﻮﻗﻮع »أ« ﻫﻮ اﺣﺘﻤﺎل
اﻟﺤﺼﻮل ﻋﲆ رﻗﻢ ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ٣ﻣﻦ ﺑني اﻷرﻗﺎم اﻟﺘﻲ ﺗﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ .٢ﺣﺴﻨًﺎ،
ﻣﻦ ﺑني ﺟﻤﻴﻊ اﻷرﻗﺎم اﻟﺘﻲ ﺗﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ) ٢وﻫﺬا ﻳﻌﻨﻲ ،ﻣﻦ ﺑني (٦ ،٤ ،٢رﻗﻢ واﺣﺪ
ﻓﻘﻂ ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ ،٣ﻟﺬﻟﻚ ﻳﺒﻠﻎ ﻫﺬا اﻻﺣﺘﻤﺎل اﻟﴩﻃﻲ .٣ / ١وأﺧريًا ،ﻓﺈن اﺣﺘﻤﺎل
اﻟﺤﺪث »أ« ﻫﻮ ) ٢ / ١ﻧﺼﻒ اﻷرﻗﺎم ٦ ،٥ ،٤ ،٣ ،٢ ،١ﻳﻘﺒﻞ اﻟﻘﺴﻤﺔ ﻋﲆ .(٢وﻣﻦ ﺛ َ ﱠﻢ
ﻧﺠﺪ أن اﺣﺘﻤﺎل »أ« ) (٢ / ١ﻣﴬوﺑًﺎ ﰲ اﻻﺣﺘﻤﺎل )اﻟﴩﻃﻲ( ﻟﻠﺤﺪث »ب« ﻧﻈ ًﺮا ﻟﻮﻗﻮع
»أ« ) (٣ / ١ﻫﻮ .٦ / ١وﻫﻮ ﻳﺒﻠﻎ ﻧﻔﺲ ﻗﻴﻤﺔ اﻻﺣﺘﻤﺎل املﺸﱰك ﺑﺎﻟﺤﺼﻮل ﻋﲆ ﻋﺪد ﻳﻘﺒﻞ
اﻟﻘﺴﻤﺔ ﻋﲆ ﻛﻞ ﻣﻦ ٢و٣؛ أي اﻻﺣﺘﻤﺎل املﺸﱰك ﻟﻮﻗﻮع اﻟﺤﺪﺛني »أ« و»ب«.
ﺳﺎﺑﻘﺎ ﻣﻔﻬﻮم اﻻﺣﺘﻤﺎل اﻟﴩﻃﻲ ﰲ اﻟﻔﺼﻞ اﻷول ،ﰲ ﺻﻮرة ً ﰲ اﻟﻮاﻗﻊ ،ا ْﻟﺘَ َﻘﻴْﻨﺎ
ﻣﻐﺎﻟﻄﺔ املﺪﻋﻲ .وأﺷﺎر ﻫﺬا إﱃ أن اﺣﺘﻤﺎل وﻗﻮع اﻟﺤﺪث »أ« ﻧﻈ ًﺮا إﱃ ﺣﺪوث »ب« ﻟﻴﺲ
ﻫﻮ اﻻﺣﺘﻤﺎل ﻧﻔﺴﻪ ﺑﻮﻗﻮع اﻟﺤﺪث »ب« ﻧﻈ ًﺮا ﻟﻮﻗﻮع »أ«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،اﺣﺘﻤﺎل أن
ﺷﺨﺼﺎ ﻣﺎ ﻳُﺪِﻳﺮ ﴍﻛﺔ ﻛﱪى ﻳﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ﻟﻴﺲ ﻫﻮ اﻻﺣﺘﻤﺎل ﻧﻔﺴﻪ ﺑﺄن اﻟﺸﺨﺺ ً
اﻟﺬي ﻳﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ﻳﺪﻳﺮ ﴍﻛﺔ ﻛﱪى .وﻫﺬا ﻳﻘﻮدﻧﺎ إﱃ ﻗﺎﻧﻮن َ
آﺧﺮ ﻣﻬ ﱟﻢ ﻟﻠﻐﺎﻳﺔ ﻣﻦ
ﻗﻮاﻧني اﻻﺣﺘﻤﺎﻻت؛ وﻫﻮ »ﻣﱪﻫﻨﺔ ﺑﺎﻳﺰ« )أو »ﻗﺎﻋﺪة ﺑﺎﻳﺰ«( .ﺗﺴﺎﻋﺪﻧﺎ ﻣﱪﻫﻨﺔ ﺑﺎﻳﺰ ﰲ رﺑﻂ
ﻫﺬﻳﻦ اﻻﺣﺘﻤﺎﻟني اﻟﴩﻃﻴني؛ اﻻﺣﺘﻤﺎل اﻟﴩﻃﻲ ﻟﻠﺤﺪث »أ« ﻧﻈ ًﺮا ﻟﻮﻗﻮع »ب« ،واﻻﺣﺘﻤﺎل
اﻟﴩﻃﻲ ﻟﻠﺤﺪث »ب« ﻧﻈ ًﺮا ﻟﻮﻗﻮع »أ«.
رأﻳﻨﺎ ﻟﻠﺘ ﱢﻮ أن اﺣﺘﻤﺎل وﻗﻮع ﻛﻼ اﻟﺤﺪﺛني »أ« و»ب« ﻳﺴﺎوي اﺣﺘﻤﺎل أن »أ« ﺳﻴ ََﻘﻊ
أﻳﻀﺎ ﻣﴬوﺑًﺎ ﰲ اﻻﺣﺘﻤﺎل )املﴩوط( ﺑﺄن »ب« ﺳﻴﻘﻊ ﻧﻈ ًﺮا ﻟﻮﻗﻮع »أ« .وﻟﻜﻦ ﻳﻤﻜﻦ ً
65
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻛﺘﺎﺑﺔ ﻫﺬا ﻋﲆ ﻧﺤﻮ ﻣﻌﻜﻮس؛ اﺣﺘﻤﺎل أن ﻛﻼ اﻟﺤﺪﺛني »أ« و»ب« ﺳﻮف ﻳﻘﻌﺎن ﻳﺴﺎوي
أﻳﻀﺎ اﺣﺘﻤﺎل أن »ب« ﺳﻴﻘﻊ ﻣﴬوﺑًﺎ ﰲ اﺣﺘﻤﺎل أن »أ« ﺳﻴﻘﻊ ﻧﻈ ًﺮا ﻟﻮﻗﻮع »ب« .وﺗﻨﺺ ً
ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ )ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻪ ﻋﺎدة ﻣﺎ ﻳُﻌﱪ ﻋﻦ ذﻟﻚ ﻋﲆ ﻧﺤﻮ ﻣﺨﺘﻠﻒ( ﻋﲆ أن ﻫﺎﺗني
اﻟﻄﺮﻳﻘﺘني ﺑﺒﺴﺎﻃﺔ ﻃﺮﻳﻘﺘﺎن ﺑﺪﻳﻠﺘﺎن ﻟﻜﺘﺎﺑﺔ اﻻﺣﺘﻤﺎل املﺸﱰك ﻟﻠﺤﺪﺛني »أ« و»ب«؛ أي
إن اﺣﺘﻤﺎل »أ« ﻣﴬوﺑًﺎ ﰲ اﺣﺘﻤﺎل »ب« ﻧﻈ ًﺮا ﻟﻮﻗﻮع اﻟﺤﺪث »أ« ﻳﺴﺎوي اﺣﺘﻤﺎل »ب«
ﻣﴬوﺑًﺎ ﰲ اﺣﺘﻤﺎل »أ« ﻧﻈ ًﺮا ﻟﻮﻗﻮع اﻟﺤﺪث »ب« .وﻛﻼﻫﻤﺎ ﻳﺴﺎوي اﻻﺣﺘﻤﺎل املﺸﱰك
ﺑني »أ« و»ب« .ﰲ ﻣﺜﺎل »رﺋﻴﺲ اﻟﴩﻛﺔ اﻟﺬي ﻳﻘﻮد ﺳﻴﺎرة« ،ﺗﻜﺎﻓﺊ ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ ﻗﻮل إن
اﺣﺘﻤﺎل إدارﺗﻚ ﻟﴩﻛﺔ ﻛﱪى ﻧﻈ ًﺮا إﱃ أﻧﻚ ﺗﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ،ﻣﴬوﺑًﺎ ﰲ اﺣﺘﻤﺎل أن
ﺗﺘﻤﻜﻦ ﻣﻦ ﻗﻴﺎدة ﺳﻴﺎرة ،ﻳﺴﺎوي اﺣﺘﻤﺎل أﻧﻚ ﺗﺴﺘﻄﻴﻊ ﻗﻴﺎدة ﺳﻴﺎرة ﻧﻈ ًﺮا إﱃ أﻧﻚ رﺋﻴﺲ
ﴍﻛﺔ ،ﻣﴬوﺑًﺎ ﰲ اﺣﺘﻤﺎل ﻛﻮﻧﻚ رﺋﻴﺲ ﴍﻛﺔ .وﻛﻼﻫﻤﺎ ﻳﺴﺎوي اﻻﺣﺘﻤﺎل املﺸﱰك ﻟﻜﻮﻧﻚ
رﺋﻴﺲ ﴍﻛﺔ وﻗﺎد ًرا ﻋﲆ ﻗﻴﺎدة ﺳﻴﺎرة.
ﻳﻨﺺ ﻗﺎﻧﻮن آﺧﺮ ﻟﻼﺣﺘﻤﺎﻻت ﻋﲆ أﻧﻪ إذا ﻛﺎن ﻳﻤﻜﻦ وﻗﻮع أﺣﺪ اﻟﺤﺪﺛني ،وﻟﻜﻦ
ﻻ ﻳﻤﻜﻦ أن ﻳﻘﻊ ﻛﻼﻫﻤﺎ ﻣﻌً ﺎ ،ﻓﺈن اﺣﺘﻤﺎل أن أﺣﺪﻫﻤﺎ ﺳﻴﻘﻊ ﻫﻮ ﻣﺠﻤﻮع اﻻﺣﺘﻤﺎﻟني
ﻗﺬﻓﺖ ﻋﻤﻠﺔ — وﻣﻦ املﺆﻛﺪ أﻧﻬﺎ ﻻ ﻳﻤﻜﻦ أن ﺗﻈﻬﺮ وﺟﻪَ املﻨﻔﺼﻠني ﻟﻮﻗﻮع ﻛ ﱟﻞ ﻣﻨﻬﻤﺎ .إذا
اﻟﻜﺘﺎﺑﺔ واﻟﺼﻮرة ﰲ اﻟﻮﻗﺖ ذاﺗﻪ — ﻓﺈن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة »أو« وﺟﻪ اﻟﻜﺘﺎﺑﺔ
ﻫﻮ ﻣﺠﻤﻮع اﺣﺘﻤﺎل أن وﺟﻪ اﻟﺼﻮرة ﺳﻮف ﻳﻈﻬﺮ واﺣﺘﻤﺎل أن وﺟﻪ اﻟﻜﺘﺎﺑﺔ ﺳﻮف ﻳﻈﻬﺮ.
إذا ﻛﺎﻧﺖ اﻟﻌﻤﻠﺔ ﻣﺘﺰﻧﺔ ،ﻓﺈن ﻛﻼ ﻫﺬﻳﻦ اﻻﺣﺘﻤﺎﻟني املﻨﻔﺼﻠني ﻫﻮ اﻟﻨﺼﻒ ،وﻫﻜﺬا ﻓﺈن
ً
ﻣﻌﻘﻮﻻ ﺗﻤﺎﻣً ﺎ؛ اﻻﺣﺘﻤﺎل اﻟﻜﲇ ﻟﻈﻬﻮر وﺟﻪ اﻟﺼﻮرة ووﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻫﻮ .١ﻫﺬا اﻷﻣﺮ ﻳﺒﺪو
إذ ﻳﺘﻮاﻓﻖ اﻟﺮﻗﻢ ١ﻣﻊ اﻟﻴﻘني ،وﻣﻦ املﺆﻛﺪ أﻧﻪ ﻳﺠﺐ أن ﻳَﻈﻬَ ﺮ وﺟﻪ اﻟﺼﻮرة أو وﺟﻪ
اﻟﻜﺘﺎﺑﺔ )أﻓﱰض أﻧﻪ ﻻ ﻳﻤﻜﻦ أن ﻳﻨﺘﻬﻲ اﻷﻣﺮ ﺑﻮﻗﻮف اﻟﻌﻤﻠﺔ ﻋﲆ ﺣﺎﻓﺘﻬﺎ!( وﺑﺎﻟﻌﻮدة إﱃ
ﻣﺜﺎل رﻣﻲ اﻟﻨﺮد :ﻛﺎن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﻋﺪد زوﺟﻲ ﻫﻮ ﻣﺠﻤﻮع اﺣﺘﻤﺎﻻت اﻟﺤﺼﻮل
ﻋﲆ أيﱟ ﻣﻦ اﻷرﻗﺎم ٢أو ٤أو ٦؛ ﻷﻧﻪ ﻻ ﻳﻤﻜﻦ أن ﻳﻘﻊ أي ﻣﻦ ﻫﺬه اﻷﺣﺪاث ﻣﻌً ﺎ )وﻻ
ﺗﻮﺟﺪ أي ﻃﺮق أﺧﺮى ﻟﻠﺤﺼﻮل ﻋﲆ ﻋﺪد زوﺟﻲ ﺑﺮﻣﻴﺔ واﺣﺪة ﻟﻠﻨﺮد(.
66
اﻻﺣﺘﻤﺎﻻت
أن ﺗﺤﺘﻮي إﻻ ﻋﲆ ﻋﺪد ﻣﺤﺪود ﻣﻦ اﻟﻘِ ﻴَﻢ .ﻫﺬه املﺠﻤﻮﻋﺔ املﺤﺪودة ﻗﺪ ﺗﻤﺜﻞ ﻗﻴﻢ ﻛﺎﻓﺔ
اﻷﺷﻴﺎء ﻣﻦ اﻟﻨﻮع اﻟﺬي ﻧُﺨﻀﻌﻪ ﻟﻠﺪراﺳﺔ )ﻣﺜﻞ درﺟﺎت ﺟﻤﻴﻊ ﻻﻋﺒﻲ دوري ﻛﺮة اﻟﻘﺪم ﰲ
ﺳﻨﺔ ﻣﻌﻴﻨﺔ( أو ﻗﺪ ﺗﻤﺜﻞ ﻗﻴﻢ ﺑﻌﺾ اﻷﺷﻴﺎء ﻓﺤﺴﺐ؛ أيْ إﻧﻬﺎ »ﻋﻴﻨﺔ« .ورأﻳﻨﺎ أﻣﺜﻠﺔ ﻋﲆ
ﻫﺬا ﻋﻨﺪﻣﺎ ﺗﻨﺎوﻟﻨﺎ ﻣﺴﺢ اﻟﻌﻴﻨﺎت.
اﻟﻌﻴﻨﺔ ﻫﻲ ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋﻴﺔ ﻣﻦ »ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﻢ« اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ .ﰲ
ﺑﻌﺾ اﻟﺤﺎﻻت ،ﺗﻜﻮن املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻏريَ واﺿﺤﺔ اﻟﺘﻌﺮﻳﻒ ،ورﺑﻤﺎ ﺗﻜﻮن ﺿﺨﻤﺔ أو
ﺣﺘﻰ ﻻ ﻧﻬﺎﺋﻴﺔ؛ ﻟﺬﻟﻚ ﻻ ﻳﻜﻮن ﻟﺪﻳﻨﺎ ﺧﻴﺎر اﻟﻠﺠﻮء إﱃ ﻋﻴﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ ﺗﺠﺎرب
ﻗﻴﺎس ﴎﻋﺔ اﻟﻀﻮء ،ﰲ ﻛﻞ ﻣﺮة آﺧﺬ ﻓﻴﻬﺎ اﻟﻘﻴﺎس أﺗﻮﻗﻊ اﻟﺤﺼﻮل ﻋﲆ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ
ﻗﻠﻴﻼ؛ وذﻟﻚ ﺑﺒﺴﺎﻃﺔ ﺑﺴﺒﺐ ﻋﺪم اﻟﺪﻗﺔ ﰲ ﻋﻤﻠﻴﺔ اﻟﻘﻴﺎس .وﻳﻤﻜﻨﻨﻲ — ﻋﲆ اﻷﻗﻞ ﻣﻦ ً
ﺣﻴﺚ املﺒﺪأ — املﴤ ﻗﺪﻣً ﺎ ﰲ أﺧﺬ اﻟﻘﻴﺎﺳﺎت إﱃ اﻷﺑﺪ؛ وﻫﺬا ﻳﻌﻨﻲ أن ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﺎﺳﺎت
املﺤﺘﻤﻠﺔ اﻟﻜﺎﻣﻠﺔ ﻻ ﻧﻬﺎﺋﻴﺔ .وﺑﻤﺎ أن ﻫﺬا أﻣﺮ ﻣﺴﺘﺤﻴﻞ ،ﻳﺠﺐ أن أرﴇ ﺑﻌﻴﻨﺔ ﻣﺤﺪودة ﻣﻦ
اﻟﻘﻴﺎﺳﺎت .وﺳﻮف ﺗُﺴﺘﺨ َﺮج ﻫﺬه اﻟﻘﻴﺎﺳﺎت ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﻠﻘﻴﻢ اﻟﺘﻲ ﻳﺤﺘﻤﻞ أن
أﺣﺼﻞ ﻋﻠﻴﻬﺎ .وﰲ ﺣﺎﻻت أﺧﺮى ،ﺗﻜﻮن املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﺤﺪودة؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ
ﻟﻠﺴﻤْ ﻨﺔ ﺑني اﻟﺬﻛﻮر ﰲ ﺑﻠﺪة ﻣﻌﻴﻨﺔ ،ﺗﻜﻮن ﻣﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌني ﻟﻠﺪراﺳﺔ ﻣﺤﺪودة، دراﺳﺔ ﱢ
ورﻏﻢ أﻧﻨﻲ ﻣﻦ ﺣﻴﺚ املﺒﺪأ أﺳﺘﻄﻴﻊ وزن ﻛﻞ واﺣﺪ ﻣﻨﻬﻢ ﰲ املﺪﻳﻨﺔ ،ﻓﻔﻲ املﻤﺎرﺳﺔ اﻟﻌﻤﻠﻴﺔ
رﺑﻤﺎ ﻟﻦ أرﻳﺪ ذﻟﻚ ،وﺳﻮف أﺳﺘﺨﺪم ﻋﻴﻨﺔ .وﻣﺮة أﺧﺮى ،ﻛﻞ ﻗﻴﻤﺔ ﰲ ﻋﻴﻨﺘﻲ ﻣﺄﺧﻮذة ﻣﻦ
املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﻠﻘﻴﻢ املﻤﻜﻨﺔ.
ﰲ ﻛ ﱟﻞ ﻣﻦ ﻫﺬه اﻷﻣﺜﻠﺔ ،ﻛﻞ ﻣﺎ أﻋﺮﻓﻪ ﻗﺒﻞ أن آﺧﺬ ﻛﻞ ﻗﻴﺎس ﻫﻮ أﻧﻪ ﺳﻴﻜﻮن ﻟﻪ
ﻗﻴﻤﺔ ﻣﺎ ﻣﻦ ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﻢ اﻟﻜﺎﻣﻠﺔ املﻤﻜﻨﺔ .ﺳﺘﺤﺪث ﻛﻞ ﻗﻴﻤﺔ ﺑﺎﺣﺘﻤﺎل ﻣﻌني ،وﻟﻜﻨﻲ ٌ
ﻻ أﺳﺘﻄﻴﻊ أن أﺣﺪده أﻛﺜﺮ ﻣﻦ ذﻟﻚ ،ورﺑﻤﺎ ﻻ أﻋﺮف ﻣﺎ ﻫﻮ ﻫﺬا اﻻﺣﺘﻤﺎل .وﺑﺎﻟﺘﺄﻛﻴﺪ
ﻻ أﺳﺘﻄﻴﻊ أن أﺣﺪد ﺑﺎﻟﻀﺒﻂ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﺳﻮف أﺣﺼﻞ ﻋﻠﻴﻬﺎ ﰲ اﻟﻘﻴﺎس اﻟﺘﺎﱄ ﻟﴪﻋﺔ
اﻟﻀﻮء أو ﻣﺎذا ﺳﻴﻜﻮن وزن اﻟﺮﺟﻞ اﻟﺘﺎﱄ اﻟﺬي ﺳﺄﻗﻴﺴﻪ .وﺑﺎملﺜﻞ ،ﰲ رﻣﻲ اﻟﻨﺮد ،أﻋﻠﻢ أن
اﻟﻨﺘﻴﺠﺔ ﻳﻤﻜﻦ أن ﺗﻜﻮن ١أو ٢أو ٣أو ٤أو ٥أو ،٦وﻫﻨﺎ أﻋﺮف أن ﻫﺬه اﻻﺣﺘﻤﺎﻻت
ﻣﺘﺴﺎوﻳﺔ )ﻓﻨﺮدي ﻣﻜﻌﺐ ﻣﺜﺎﱄ( ،وﻟﻜﻦ ﺑﺨﻼف ذﻟﻚ ﻻ أﺳﺘﻄﻴﻊ أن أﺣﺪد اﻟﻌﺪد اﻟﺬي
ﺳﻴَﻈﻬَ ﺮ .وﻋﲆ ﻏﺮار ﻗﻴﺎﺳﺎت اﻟﴪﻋﺔ واﻟﻮزن ،ﻓﺈن اﻟﻨﺘﻴﺠﺔ ﻋﺸﻮاﺋﻴﺔ؛ وﻟﻬﺬا اﻟﺴﺒﺐ ﺗُﺴﻤﱠ ﻰ
ﻫﺬه املﺘﻐريات »ﻣﺘﻐريات ﻋﺸﻮاﺋﻴﺔ«.
ا ْﻟﺘَ َﻘﻴْﻨﺎ ﻣﻦ ﻗﺒ ُﻞ ﺑﺎﻟﻔﻌﻞ ﻣﻔﻬﻮ َم املﻘﺎﻳﻴﺲ اﻟﺘﺠﺰﻳﺌﻴﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ ﺣﺎﻟﺔ
ا ُمل َﺆﻳﱠﺎت ،ا ُمل َﺆيﱡ ٢٠ﻣﻦ اﻟﺘﻮزﻳﻊ ﻫﻮ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﻜﻮن ٪٢٠ﻣﻦ ﻗﻴﻢ اﻟﺒﻴﺎﻧﺎت أﺻﻐﺮ
67
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻣﻨﻬﺎ ،وا ُمل َﺆي ٨ﻫﻮ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﻜﻮن ٪٨ﻣﻦ ﻗﻴﻢ اﻟﺒﻴﺎﻧﺎت أﺻﻐﺮ ﻣﻨﻬﺎ ،وﻫﻜﺬا .وﻋﻤﻮﻣً ﺎ،
ا ُمل َﺆيﱡ Kﻳﻜﻮن k%ﻣﻦ اﻟﻌﻴﻨﺔ أﺻﻐﺮ ﻣﻨﻪ .وﻳﻤﻜﻨﻨﺎ ﺗﺼﻮر ﺗﺤﺪﻳﺪ ُﻣ َﺆﻳﱠﺎت ﻣﻤﺎﺛﻠﺔ ،ﻟﻴﺲ
ﻟﻠﻌﻴﻨﺔ اﻟﺘﻲ ﻧﺮﺻﺪﻫﺎ ﻓﺤﺴﺐ ،وﻟﻜﻦ ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﺘﻲ ﻳﻤﻜﻨﻨﺎ
رﺻﺪﻫﺎ .إذا ﻋﺮﻓﻨﺎ ا ُمل َﺆيﱠ ٢٠ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﻦ اﻟﻘﻴﻢ ،ﺣﻴﻨﻬﺎ ﻓﺴﻨﻌﺮف أن اﻟﻘﻴﻤﺔ
املﺄﺧﻮذة ﻋﺸﻮاﺋﻴٍّﺎ ﻣﻦ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﺪﻳﻬﺎ اﺣﺘﻤﺎل ٠٫٢٠أن ﺗﻜﻮن أﺻﻐﺮ ﻣﻦ ﻫﺬا
ا ُمل َﺆيﱢ .وﻋﻤﻮﻣً ﺎ ،إذا ﻋﺮﻓﻨﺎ ﻛﻞ ُﻣ َﺆﻳﱠﺎت املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ،ﻓﺴﻨﻌﺮف اﺣﺘﻤﺎل اﺳﺘﺨﺮاج ﻗﻴﻤﺔ
آﺧﺮ ٪١٠أو ٪٢٥أو ٪١٦أو ٪٩٨أو أي ﻧﺴﺒﺔ ﻣﺌﻮﻳﺔ أﺧﺮى ﻧﻬﺘ ﱡﻢ ﺑﺎﺧﺘﻴﺎرﻫﺎ؛ وﻫﺬا ﰲ َ
ﻳﻌﻨﻲ أﻧﻨﺎ ﺣﻴﻨﻬﺎ ﻧﻌﺮف ﻛﻞ ﳾء ﻋﻦ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﻤﻜﻨﺔ اﻟﺘﻲ ﻧﺴﺘﻄﻴﻊ اﻟﺤﺼﻮل ﻋﻠﻴﻬﺎ.
ﻟﻦ ﻧﻌﺮف ﻣﺎ اﻟﻘﻴﻤﺔ اﻟﺘﺎﻟﻴﺔ اﻟﺘﻲ ﺳﻨﺤﺼﻞ ﻋﻠﻴﻬﺎ ،وﻟﻜﻦ ﺳﻨﻌﺮف اﺣﺘﻤﺎل أﻧﻬﺎ ﺳﺘﻜﻮن ﰲ
أﺻﻐﺮ ٪١ﻣﻦ اﻟﻘﻴﻢ ﰲ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ،أو ﰲ أﺻﻐﺮ ،٪٢وﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ.
ﻳﻮﺟﺪ اﺳﻢ ملﺠﻤﻮﻋﺔ ُﻣ َﺆﻳﱠﺎت اﻟﺘﻮزﻳﻊ اﻟﻜﺎﻣﻠﺔ؛ إذ ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ »ﺗﻮزﻳﻊ اﻻﺣﺘﻤﺎل
اﻟﱰاﻛﻤﻲ« ،وﻫﻮ »ﺗﻮزﻳﻊ اﺣﺘﻤﺎل« ﻷﻧﻪ ﻳﺨﱪﻧﺎ »ﺑﺎﺣﺘﻤﺎل« اﻟﺤﺼﻮل ﻋﲆ ﻗﻴﻤﺔ أﻗﻞ ﻣﻦ أي
ﻗﻴﻤﺔ ﻧﺨﺘﺎرﻫﺎ ،وﻫﻮ »ﺗﺮاﻛﻤﻲ« ﻷﻧﻪ ﻣﻦ اﻟﻮاﺿﺢ أن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﻗﻴﻤﺔ أﻗﻞ ﻣﻦ
ﻛﻨﺖ أﻋﺮف أن اﺣﺘﻤﺎل اﻟﻘﻴﻤﺔ »س« ﻳﺰداد ﻛﻠﻤﺎ زادت »س« .ﰲ ﻣﺜﺎل أوزان اﻟﺬﻛﻮر ،ﻟﻮ ُ
اﺧﺘﻴﺎر رﺟﻞ وزﻧﻪ أﻗﻞ ﻣﻦ ٧٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ ﻫﻮ ،٢ / ١ﻓﺈﻧﻨﻲ ﺣﻴﻨﻬﺎ ﺳﺄﻋﻠﻢ أن اﺣﺘﻤﺎل
اﺧﺘﻴﺎر رﺟﻞ وزﻧﻪ أﻗﻞ ﻣﻦ ٨٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ ﻫﻮ أﻛﺜﺮ ﻣﻦ ٢ / ١ﻷﻧﻪ ﻳﻤﻜﻨﻨﻲ أن أﺧﺘﺎر ﻣﻦ
ﺑني ﻛﻞ أوﻟﺌﻚ اﻟﺬﻳﻦ ﻳﻘ ﱡﻞ وزﻧﻬﻢ ﻋﻦ ٧٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ ،وﻛﺬﻟﻚ أوﻟﺌﻚ اﻟﺬﻳﻦ ﻳﻜﻮن وزﻧﻬﻢ
ﺑني ٧٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ و ٨٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ .وﻋﻨﺪ اﻟﺤﺪ اﻷﻗﴡ ،ﻓﺈن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﻗﻴﻤﺔ
أﻗﻞ ﻣﻦ أو ﺗﺴﺎوي أﻛﱪ ﻗﻴﻤﺔ ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﻘﻴﻢ اﻟﻜﺎﻣﻠﺔ ﻫﻮ ١؛ أي إﻧﻪ ﺣﺪث ﻣﺆﻛﺪ.
ﺗﺘﻀﺢ ﻫﺬه اﻟﻔﻜﺮة ﰲ اﻟﺸﻜﻞ 1-4؛ ﻓﻔﻲ ﻫﺬا اﻟﺸﻜﻞ ،ﺗُﻤﺜﱠﻞ ﻗﻴﻢ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ
)ﻓﻜﺮ ﰲ اﻟﻮزن( ﻋﲆ املﺤﻮر اﻷﻓﻘﻲ ،وﻳُﻤﺜﱠﻞ اﺣﺘﻤﺎل اﻟﻘﻴﻢ اﻷﺻﻐﺮ ﻋﲆ املﺤﻮر اﻟﺮأﳼ.
وﻳﺒني املﻨﺤﻨﻰ اﺣﺘﻤﺎل أن ﺗﻜﻮن اﻟﻘﻴﻤﺔ املﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ — ﺑﺎﻟﻨﺴﺒﺔ ﻷي ﻗﻴﻤﺔ ﻣﻌﻴﻨﺔ
ﻟﻠﻤﺘﻐري اﻟﻌﺸﻮاﺋﻲ — أﺻﻐﺮ ﻣﻦ ﻫﺬه اﻟﻘﻴﻤﺔ املﻌﻴﻨﺔ.
ﻳﺨﱪﻧﺎ ﺗﻮزﻳﻊ اﻻﺣﺘﻤﺎل اﻟﱰاﻛﻤﻲ ملﺘﻐري ﻋﺸﻮاﺋﻲ ﺑﺎﺣﺘﻤﺎل أن ﺗﻜﻮن ﻗﻴﻤﺔ ﻣﺨﺘﺎرة
ﻋﺸﻮاﺋﻴٍّﺎ »أﻗﻞ« ﻣﻦ أي ﻗﻴﻤﺔ أﺧﺮى .واﻟﻄﺮﻳﻘﺔ اﻟﺒﺪﻳﻠﺔ ﻟﻠﻨﻈﺮ إﱃ اﻷﻣﻮر ﻫﻲ أن ﻧﻨﻈﺮ إﱃ
»ﺑني« أي ﻗﻴﻤﺘني ﻣﻌﻴﻨﺘني .وﺗﺘﻤﺜﻞ ﻫﺬه اﺣﺘﻤﺎل أن ﻗﻴﻤﺔ ﻣﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﺳﻮف ﺗَ َﻘﻊ ْ َ
اﻻﺣﺘﻤﺎﻻت ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ ﰲ ﺳﻴﺎق اﻟﻨﻄﺎق اﻟﻮاﻗﻊ ﺑني ﻗﻴﻤﺘني ﺗﺤﺖ ﻣﻨﺤﻨﻰ »اﻟﻜﺜﺎﻓﺔ«
ً
ﻣﻨﻄﻘﺔ اﻻﺣﺘﻤﺎﻟﻴﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﺒني ﺷﻜﻞ 2-4ﻣﻨﺤﻨﻰ »اﻟﻜﺜﺎﻓﺔ اﻻﺣﺘﻤﺎﻟﻴﺔ« ،وﻳﺒني
68
اﻻﺣﺘﻤﺎﻻت
اﻻﺣﺘﻤﺎل س
ص
ﻗﻴﻤﺔ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ
)ﻣﻈﻠﻠﺔ( ﺗﺤﺖ املﻨﺤﻨﻰ ﺑني ﻧﻘﻄﺘﻲ »أ« و»ب« ﻣﻤﺜﻠﺔ اﺣﺘﻤﺎل أن ﻗﻴﻤﺔ ﻣﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ
ﺳﻮف ﺗﻘﻊ ﺑني »أ« و»ب«؛ وﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻋﻨﺪ اﺳﺘﺨﺪام ﻣﺜﻞ ﻫﺬا املﻨﺤﻨﻰ ﻟﺘﻮزﻳﻊ
أوزان اﻟﺮﺟﺎل ﰲ ﺑﻠﺪﺗﻨﺎ ،ﻳﻤﻜﻦ أن ﻧﺠﺪ اﺣﺘﻤﺎل أن ﻳﻘﻊ رﺟﻞ ﻣﺨﺘﺎر ﻋﺸﻮاﺋﻴٍّﺎ ﺑني
٧٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ و ٨٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ ،أو أي زوج آﺧﺮ ﻣﻦ اﻟﻘﻴﻢ ،أو ﻓﻮق أي ﻗﻴﻤﺔ ﻧﺮﻳﺪﻫﺎ
أو ﺗﺤﺘﻬﺎ .وﻋﲆ ﻧﺤﻮ ﻋﺎم ،ﻣﻦ املﺮﺟﺢ أن ﺗﺤﺪث اﻟﻘﻴﻢ املﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﰲ املﻨﺎﻃﻖ
اﻟﺘﻲ ﺗﻜﻮن ﻓﻴﻬﺎ اﻻﺣﺘﻤﺎﻟﻴﺔ أﻛﺜﺮ ﻛﺜﺎﻓﺔ؛ أي ﺣﻴﺚ ﻳﻜﻮن ﻣﻨﺤﻨﻰ اﻟﻜﺜﺎﻓﺔ اﻻﺣﺘﻤﺎﻟﻴﺔ ﰲ
أﻋﻼه.
ﻻﺣﻆ أن املﺴﺎﺣﺔ اﻟﻜﻠﻴﺔ ﺗﺤﺖ املﻨﺤﻨﻰ ﰲ ﺷﻜﻞ 2-4ﻳﺠﺐ أن ﺗﻜﻮن — ١املﺘﻮاﻓﻖ
ﻣﻊ اﻟﻴﻘني — وﻳﺠﺐ أن ﺗﻜﻮن ﻟﻠﻘﻴﻤﺔ املﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﻗﻴﻤﺔ »ﺟﺰﺋﻴﺔ« ﻣﻨﻬﺎ.
ً
أﺷﻜﺎﻻ ﻣﺨﺘﻠﻔﺔ؛ ﻓﺎﺣﺘﻤﺎل أن اﻣﺮأة ﺗﻤﺘﻠﻚ ﻣﻨﺤﻨﻴﺎت اﻟﺘﻮزﻳﻊ ﻟﻠﻤﺘﻐريات اﻟﻌﺸﻮاﺋﻴﺔ
ﻣﺨﺘﺎرة ﻋﺸﻮاﺋﻴٍّﺎ ﺳﻮف ﻳﻜﻮن وزﻧﻬﺎ ﺑني ٧٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ و ٨٠ﻛﻴﻠﻮﺟﺮاﻣً ﺎ ﻋﺎدة ﻻ ﻳﻜﻮن
رﺟﻼ ﻣﺨﺘﺎ ًرا ﻋﺸﻮاﺋﻴٍّﺎ ﺳﻴﻜﻮن وزﻧﻪ ﺑني ﻫﺎﺗني اﻟﻘﻴﻤﺘني .ورﺑﻤﺎ ً ﻫﻮ ﻧﻔﺴﻪ اﺣﺘﻤﺎل أن
ﻧﺘﻮﻗﻊ أن ﻣﻨﺤﻨﻰ ﺗﻮزﻳﻊ أوزان اﻟﻨﺴﺎء ﺳﻴﺄﺧﺬ ﻗِ ﻴَﻤً ﺎ ﻛﺒرية ﰲ اﻷوزان اﻷﺻﻐﺮ ﻣﻤﺎ ﻫﻲ ﱠ
اﻟﺤﺎل ﺑﺎﻟﻨﺴﺒﺔ ملﻨﺤﻨﻰ اﻟﺮﺟﺎل.
69
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻛﺜﺎﻓﺔ اﻻﺣﺘﻤﺎل
أ ب
ﻗﻴﻤﺔ املﺘﻐري اﻟﻌﺸﻮاﺋﻲ
ﺗﻤﺘﻠﻚ ﺑﻌﺾ اﻷﺷﻜﺎل أﻫﻤﻴﺔ ﺧﺎﺻﺔ ،وﺗﻮﺟﺪ أﺳﺒﺎب ﻋﺪﻳﺪة ﻟﺬﻟﻚ؛ ﻓﻔﻲ ﺑﻌﺾ اﻟﺤﺎﻻت،
ﺗﻈﻬﺮ أﺷﻜﺎل ﻣﻌﻴﻨﺔ ،أو أﺷﻜﺎل ﻣﻘﺎرﺑﺔ ﻟﻠﻐﺎﻳﺔ ﻟﻬﺬه اﻷﺷﻜﺎل ،ﻋﲆ ﻧﺤﻮ ﻃﺒﻴﻌﻲ .ﺑﻴﻨﻤﺎ ﰲ
ﺣﺎﻻت أﺧﺮى ،ﺗﻨﺸﺄ اﻟﺘﻮزﻳﻌﺎت ﻛﻨﺘﺎﺋﺞ ﻟﻘﻮاﻧني اﻻﺣﺘﻤﺎﻻت.
ﻟﻌﻞ أﺑﺴﻂ اﻟﺘﻮزﻳﻌﺎت ﻫﻮ »ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ« .وﻫﺬا اﻟﺘﻮزﻳﻊ ﻳﻤﻜﻦ أن ﻳﺘﺨﺬ ﻗﻴﻤﺘني
ﻣﺜﻼ ،واﻷﺧﺮى ﻟﻬﺎ اﺣﺘﻤﺎل .1−pوﺑﻤﺎ أﻧﻪ ﻻ ﻳﻤﻜﻦ أن ﻳﺘﺨﺬ ﻓﺤﺴﺐ ،ﻗﻴﻤﺔ ﻟﻬﺎ اﺣﺘﻤﺎل ً ،p
ﱠإﻻ ﻗﻴﻤﺘني ﻓﻘﻂ ،ﻓﻤﻦ »املﺆﻛﺪ« أن إﺣﺪى اﻟﻘﻴﻤﺘني ﺳﻮف ﺗﻈﻬﺮ؛ وﻣﻦ ﺛ َ ﱠﻢ ﻓﺈن ﻣﺠﻤﻮع
اﺣﺘﻤﺎﻻت ﻫﺎﺗني اﻟﻨﺘﻴﺠﺘني ﻳﺴﺎوي .١ﻟﺪﻳﻨﺎ ﺑﺎﻟﻔﻌﻞ أﻣﺜﻠﺔ أوﺿﺤﺖ ملﺎذا ﻳُﻌَ ﱡﺪ ﻫﺬا اﻟﺘﻮزﻳﻊ
ﻣﻔﻴﺪًا؛ ﻓﺎﻟﺤﺎﻻت اﻟﺘﻲ ﻻ ﻳﻨﺘﺞ ﻋﻨﻬﺎ إﻻ ﻧﺘﻴﺠﺘﺎن ﺷﺎﺋﻌﺔ ﺟﺪٍّا؛ ﻣﺜﻞ ﻗﺬف اﻟﻌﻤﻠﺔ اﻟﺘﻲ ﻳﻨﺘﺞ
ﻋﻨﻬﺎ إﻣﱠ ﺎ وﺟﻪ اﻟﺼﻮرة وإﻣﱠ ﺎ وﺟْ ﻪ اﻟﻜﺘﺎﺑﺔ ،وﻋﻤﻠﻴﺔ اﻟﻮﻻدة اﻟﺘﻲ ﺗﻜﻮن ﻧﺘﻴﺠﺘﻬﺎ إﻣﺎ ذﻛ ًﺮا وإﻣﺎ
أﻧﺜﻰ .ﰲ ﻫﺎﺗني اﻟﺤﺎﻟﺘني ،ﺗﻤﺘﻠﻚ pﻗﻴﻤﺔ ٢ / ١أو ﻣﺎ ﻳﻘﺮب ﻣﻦ .٢ / ١وﻟﻜﻦ ﻳﻮﺟﺪ ﻋﺪد
ﻛﺒري ﻣﻦ اﻟﺤﺎﻻت اﻷﺧﺮى اﻟﺘﻲ ﻻ ﻳﻮﺟﺪ ﻟﻬﺎ ﺳﻮى ﻧﺘﻴﺠﺘني ﻣﺤﺘﻤﻠﺘني :ﻧﻌﻢ/ﻻ ،ﺟﻴﺪ/ﺳﻴﺊ،
اﻓﱰاﴈ أو ﻏري اﻓﱰاﴈ ،اﻧﻜﺴﺎر أو ﻋﺪم اﻧﻜﺴﺎر ،ﺗﻮﻗﻒ/ﺣﺮﻛﺔ ،وﻣﺎ ﺷﺎﺑﻪ ذﻟﻚ.
ﻳﻮﺳﻊ »اﻟﺘﻮزﻳﻊ ذو اﻟﺤﺪﻳﻦ« ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ؛ ﻓﺈذا ﻗﺬﻓﻨﺎ ﻋﻤﻠﺔ ﺛﻼث ﻣﺮات ،رﺑﻤﺎ ﻳﻈﻬﺮ
وﺟﻪ اﻟﺼﻮرة ﻣﺮة أو ﻣﺮﺗني أو ﺛﻼث ﻣﺮات أو ﻻ ﻳﻈﻬﺮ أﺑﺪًا .وإذا ﻛﺎن ﻟﺪﻳﻨﺎ ﺛﻼﺛﺔ ﻣﻮﻇﻔني
70
اﻻﺣﺘﻤﺎﻻت
ﰲ ﻣﺮﻛﺰ اﺗﺼﺎﻻت ﻳﺠﻴﺒﻮن ﻋﲆ ﻧﺤﻮ ﻣﺴﺘﻘ ﱟﻞ ﻋﲆ املﻜﺎملﺎت ﻋﻨﺪﻣﺎ ﺗَ ِﺮدُ ،ﻓﺈﻧﻪ ﻣﻦ املﻤﻜﻦ أن
ً
ﻣﺸﻐﻮﻻ ﰲ أي ﻟﺤﻈﺔ ﻣﻌﻴﻨﺔ. ﻳﻜﻮن واﺣﺪ أو اﺛﻨﺎن أو اﻟﺜﻼﺛﺔ ﻣﺸﻐﻮﻟني أو ﻻ ﻳﻜﻮن أﺣﺪﻫﻢ
ﻳﺨﱪﻧﺎ اﻟﺘﻮزﻳﻊ ذو اﻟﺤﺪﻳﻦ ﺑﺎﺣﺘﻤﺎل ﺣﺼﻮﻟﻨﺎ ﻋﲆ ﻛﻞ رﻗﻢ ﻣﻦ ﻫﺬه اﻷرﻗﺎم ،٠أو ،١أو ،٢
أو .٣وﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل ،ﻓﺈﻧﻪ ﻳﻄﺒﻖ ﻋﲆ ﻧﺤﻮ ﻋﺎم ،وﻟﻴﺲ ﻓﻘﻂ ﻋﲆ املﺠﻤﻮع اﻟﻜﲇ ﻟﺜﻼﺛﺔ
أﺣﺪاث .ﻓﺈذا ﻗﺬﻓﻨﺎ ﻋﻤﻠﺔ ﻣﺎﺋﺔ ﻣﺮة ،ﻓﺈن اﻟﺘﻮزﻳﻊ ذا اﻟﺤ ﱠﺪﻳْﻦ ﻳﺨﱪﻧﺎ ً
أﻳﻀﺎ ﺑﺎﺣﺘﻤﺎﻻت أﻧﻨﺎ
ﺳﻨﺤﺼﻞ ﻋﲆ ﻛ ﱟﻞ ﻣﻦ ١٠٠ ،… ،٢ ،١ ،٠وﺟﻪ ﺻﻮرة.
ﺗﺼﻞ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰوﻧﻲ إﱃ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﺨﺎص ﺑﻲ ﻋﺸﻮاﺋﻴٍّﺎ .وﺗﺼﻞ
)ﻣﺜﻼ( ﺑﻤﻌﺪل ﺧﻤﺲ رﺳﺎﺋﻞ ﰲ اﻟﺴﺎﻋﺔ ،وﻟﻜﻦ ً ﺧﻼل اﻟﻌﻤﻞ اﻟﺼﺒﺎﺣﻲ — ﰲ املﺘﻮﺳﻂ —
ﻋﺪد اﻟﺮﺳﺎﺋﻞ اﻟﺘﻲ ﺗﺼﻞ ﰲ ﻛﻞ ﺳﺎﻋﺔ ﻳﻤﻜﻦ أن ﻳﻨﺤﺮف ﻋﻦ ﻫﺬا املﻌﺪل ﻋﲆ ﻧﺤﻮ ﻛﺒري
ﺟﺪٍّا؛ إذ ﻳﺼﻞ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ﻋﴩ رﺳﺎﺋﻞ ،وﰲ أﺣﻴﺎن أﺧﺮى ﻻ ﺗﺼﻞ أي رﺳﺎﻟﺔ .ﻳﻤﻜﻦ
اﺳﺘﺨﺪام »ﺗﻮزﻳﻊ ﺑﻮاﺳﻮن« ﻟﻮﺻﻒ اﻟﺘﻮزﻳﻊ اﻻﺣﺘﻤﺎﱄ ﻟﻌﺪد رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰوﻧﻲ اﻟﺘﻲ
ﺗﺼﻞ ﰲ ﻛﻞ ﺳﺎﻋﺔ .وﻳﻤﻜﻦ أن ﻳﺨﱪﻧﺎ ﺑﺎﺣﺘﻤﺎل )إذا ﻛﺎﻧﺖ رﺳﺎﺋﻞ اﻟﱪﻳﺪ اﻹﻟﻜﱰوﻧﻲ ﺗﺼﻞ
ﻋﲆ ﻧﺤﻮ ﻣﺴﺘﻘﻞ وﻛﺎن املﻌﺪل اﻟﻌﺎم ﻟﻮﺻﻮﻟﻬﺎ ﺛﺎﺑﺘًﺎ( ﻋﺪم وﺻﻮل أي رﺳﺎﻟﺔ ،أو وﺻﻮل
رﺳﺎﻟﺔ واﺣﺪة ،أو رﺳﺎﻟﺘني ،وﻣﺎ إﱃ ذﻟﻚ .وﻫﺬا اﻟﺘﻮزﻳﻊ ﻳﺨﺘﻠﻒ ﻋﻦ اﻟﺘﻮزﻳﻊ ذي اﻟﺤﺪﻳﻦ؛
ﻷﻧﻪ ﻋﲆ اﻷﻗﻞ ﻣﻦ ﺣﻴﺚ املﺒﺪأ ﻻ ﻳﻮﺟﺪ ﺣﺪ أﻋﲆ ﻟﻠﻌﺪد اﻟﺬي ﻳﻤﻜﻦ أن ﻳﺼﻞ ﰲ أي ﺳﺎﻋﺔ.
ﻓﻔﻲ ﺣﺎﻟﺔ ﻗﺬف اﻟﻌﻤﻠﺔ ﻣﺎﺋﺔ ﻣﺮة ،ﻻ ﻳﻤﻜﻨﻨﺎ رؤﻳﺔ أﻛﺜﺮ ﻣﻦ ١٠٠وﺟﻪ ﺻﻮرة ،وﻟﻜﻦ ﻳﻤﻜﻦ
أن ﻳﺼﻠﻨﻲ )ﰲ ﻳﻮم ﺳﻴﺊ ﻟﻠﻐﺎﻳﺔ!( أﻛﺜﺮ ﻣﻦ ١٠٠رﺳﺎﻟﺔ ﺑﺮﻳﺪ إﻟﻜﱰوﻧﻲ ﰲ ﺳﺎﻋﺔ واﺣﺪة.
ﺣﺘﻰ اﻵن ،ﻛﻞ اﻟﺘﻮزﻳﻌﺎت اﻻﺣﺘﻤﺎﻟﻴﺔ اﻟﺘﻲ ذﻛﺮﺗُﻬﺎ ﻫﻲ ملﺘﻐريات ﻋﺸﻮاﺋﻴﺔ »ﻣﻨﻔﺼﻠﺔ«
)أو ﻣﺘﻘﻄﻌﺔ(؛ أي إن املﺘﻐريات اﻟﻌﺸﻮاﺋﻴﺔ ﻻ ﺗﺄﺧﺬ ﺳﻮى ﻗﻴ ٍﻢ ﻣﻌﻴﻨﺔ )ﻗﻴﻤﺘني ﰲ ﺣﺎﻟﺔ
ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ،ﻋﺪد ﻣﻦ اﻟﻘﻴﻢ ﻳﻌﺘﻤﺪ ﻋﲆ ﻋﺪد ﻣﺮات ﻗﺬف اﻟﻌﻤﻠﺔ/ﻋﺪد املﺸﻐﻠني ﰲ ﺣﺎﻟﺔ
اﻟﺘﻮزﻳﻊ ذي اﻟﺤﺪﻳﻦ ،واﻷﻋﺪاد اﻟﺼﺤﻴﺤﺔ … ،٣ ،٢ ،١ ،٠ﰲ ﺣﺎﻟﺔ ﺗﻮزﻳﻊ ﺑﻮاﺳﻮن( .ﺛﻤﺔ
ﻣﺘﻐريات ﻋﺸﻮاﺋﻴﺔ أﺧﺮى »ﻣﺘﺼﻠﺔ« )أو ﻣﺴﺘﻤﺮة( ،وﻳﻤﻜﻦ أن ﺗﺄﺧﺬ أي ﻗﻴﻤﺔ ﻣﻦ اﻟﻨﻄﺎق؛
ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،اﻟﻄﻮل ﻳﻤﻜﻦ أن ﻳﺄﺧﺬ أي ﻗﻴﻤﺔ داﺧﻞ ﻧﻄﺎق ﻣﻌني )رﻫﻨًﺎ ﺑﺪﻗﺔ أداة
اﻟﻘﻴﺎس( ،وﻻ ﻳﻘﺘﴫً ،
ﻣﺜﻼ ،ﻋﲆ ٤أو ٥أو ٦أﻗﺪام.
إذا ﻛﺎن املﺘﻐري اﻟﻌﺸﻮاﺋﻲ ﻳﻤﻜﻦ أن ﻳﺄﺧﺬ ﻗﻴﻤً ﺎ ﺿﻤﻦ ﻓﱰة ﻣﺤﺪودة ﻓﻘﻂ )ﻋﲆ ﺳﺒﻴﻞ
ﻣﺘﺴﺎو« أن ﻳﺄﺧﺬ أي ﻗﻴﻤﺔ ﻣﻦ اﻟﻘﻴﻢ ٍ املﺜﺎل ﺑني ٠و (١وإذا ﻛﺎن »ﻣﻦ املﺤﺘﻤﻞ ﻋﲆ ﻧﺤﻮ
ﰲ ﺗﻠﻚ اﻟﻔﱰة ،ﻳﻘﺎل إﻧﻪ ﻳﺘﺒﻊ »ﺗﻮزﻳﻌً ﺎ ﻣﻨﺘﻈﻤً ﺎ«؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﺎن ﺳﺎﻋﻲ اﻟﱪﻳﺪ
ﻳﺼﻞ داﺋﻤً ﺎ ﰲ اﻟﻔﱰة ﻣﻦ ١٠ﺻﺒﺎﺣً ﺎ ﺣﺘﻰ ١١ﺻﺒﺎﺣً ﺎ ،وﻟﻜﻦ ﺑﻄﺮﻳﻘﺔ ﻻ ﻳﻤﻜﻦ اﻟﺘﻨﺒﺆ ﺑﻬﺎ
71
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺗﻤﺎﻣً ﺎ )ﻓﻤﻦ املﺤﺘﻤﻞ أن ﻳﺼﻞ ﰲ اﻟﻔﱰة ﺑني ١٠ : ٠٥ﺣﺘﻰ ١٠ : ١٠ﺑﺎﻟﻘﺪر ﻧﻔﺴﻪ ﻻﺣﺘﻤﺎل
وﺻﻮﻟﻪ ﰲ أي ﻓﱰة ﺧﻤﺲ دﻗﺎﺋﻖ أﺧﺮى ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل( ،ﻓﺈن ﺗﻮزﻳﻊ وﻗﺖ وﺻﻮﻟﻪ ﺧﻼل
ﻫﺬه اﻟﻔﱰة ﻳﻜﻮن ﻣﻨﺘﻈﻤً ﺎ.
ﻳﻤﻜﻦ ﻟﺒﻌﺾ املﺘﻐريات اﻟﻌﺸﻮاﺋﻴﺔ أن ﺗﺄﺧﺬ أي ﻗﻴﻤﺔ ﻣﻮﺟﺒﺔ؛ ﺷﺄن املﺪة اﻟﺰﻣﻨﻴﺔ
ﻟﻈﺎﻫﺮ ٍة ﻣﺎ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل .ﻟﺘﻮﺿﻴﺢ ذﻟﻚ ،ﺗﺄﻣﱠ ِﻞ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ اﻟﺘﻲ ﺗَ َ
ﻈ ﱡﻞ ﻓﻴﻬﺎ املﺰﻫﺮﻳﺎت
اﻟﺰﺟﺎﺟﻴﺔ ﺳﻠﻴﻤﺔ ﻗﺒﻞ أن ﺗﻨﻜﴪ .املﺰﻫﺮﻳﺎت اﻟﺰﺟﺎﺟﻴﺔ ﻻ ﺗﺘﻘﺪم ﰲ اﻟﻌﻤﺮ ،ﻟﺬﻟﻚ ﻟﻴﺲ ﻣﻦ
املﻔﻀﻠﺔ ﻟﺪﻳﻚ ﰲ اﻟﻌﺎم املﻘﺒﻞ إذا ﻛﺎن ﻋﻤﺮﻫﺎ ٨٠ ﱠ املﺮﺟﺢ ﺑﺪرﺟﺔ أﻛﱪ أن ﺗﻨﻜﴪ املﺰﻫﺮﻳﺔ
َ ِ
ﺣﺎﻟﺔ ﺗﺴﺎوي ﺳﻨﺔ ،ﻣﻦ أن ﺗﻨﻜﴪ ﰲ اﻟﻌﺎم املﻘﺒﻞ إذا ﻛﺎن ﻋﻤﺮﻫﺎ ١٠ﺳﻨﻮات ﻓﻘﻂ )ﰲ
ﻗﺎر ْن ذﻟﻚ ﻣﻊ اﺣﺘﻤﺎل وﻓﺎة ﺷﺨﺺ ﻳﺒﻠﻎ ﻣﻦ اﻟﻌﻤﺮ ٨٠ﺳﻨﺔ ﰲ ﻛﻞ اﻟﻌﻮاﻣﻞ اﻷﺧﺮى(ِ .
اﻟﻌﺎم املﻘﺒﻞ ﰲ ﻣﻘﺎﺑﻞ اﺣﺘﻤﺎل وﻓﺎة ﺷﺨﺺ ﻳﺒﻠﻎ ﻣﻦ اﻟﻌﻤﺮ ١٠ﺳﻨﻮات ﰲ اﻟﻌﺎم املﻘﺒﻞ.
ﻄﻢ ﰲ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ ،tﻓﺈن اﺣﺘﻤﺎل أن ﺗﺘﺤﻄﻢ ﰲ ﺑﺎﻟﻨﺴﺒﺔ ملﺰﻫﺮﻳﺔ زﺟﺎﺟﻴﺔ ،إذا ﻟﻢ ﺗﺘﺤ ﱠ
اﻟﻠﺤﻈﺔ اﻟﺘﺎﻟﻴﺔ ﻫﻮ اﻻﺣﺘﻤﺎل ﻧﻔﺴﻪ ،ﻣﻬﻤﺎ ﻛﺎﻧﺖ ﻗﻴﻤﺔ ) tﻣﺮة أﺧﺮى ،ﻛﻞ اﻟﻌﻮاﻣﻞ اﻷﺧﺮى
ﻣﺘﺴﺎوﻳﺔ( .ﻳﻘﺎل ﻫﻨﺎ إن ﻋﻤﺮ املﺰﻫﺮﻳﺎت اﻟﺰﺟﺎﺟﻴﺔ ﻳﺘﺒﻊ »ﺗﻮزﻳﻌً ﺎ أ ُ ﱢﺳﻴٍّﺎ« .ﰲ اﻟﻮاﻗﻊ ،ﺗﻮﺟﺪ
أﻋﺪاد ﻫﺎﺋﻠﺔ ﻣﻦ ﺗﻄﺒﻴﻘﺎت اﻟﺘﻮزﻳﻌﺎت اﻷ ُ ﱢﺳﻴﱠﺔ ،وﻟﻴﺲ أﻋﻤﺎر املﺰﻫﺮﻳﺎت اﻟﺰﺟﺎﺟﻴﺔ ﻓﺤﺴﺐ!
وﻟﻌﻞ اﻷﻛﺜﺮ ﺷﻬﺮة ﺑني اﻟﺘﻮزﻳﻌﺎت املﺴﺘﻤﺮة ﻫﻮ »اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ« أو »ﺗﻮزﻳﻊ
ﺟﺎوس« .وﻏﺎﻟﺒًﺎ ﻣﺎ ﻳﻮﺻﻒ ﻋﲆ ﻧﺤﻮ ﻋﺎم ﰲ ﺳﻴﺎق ﺷﻜﻠﻪ اﻟﻌﺎم» :ﺷﻜﻞ اﻟﺠﺮس« ،ﻛﻤﺎ ﻫﻮ
ﻣﺒني ﰲ اﻟﺸﻜﻞ .3-4وﻫﺬا ﻳﻌﻨﻲ أن اﺣﺘﻤﺎل ﺣﺪوث اﻟﻘﻴﻢ املﻮﺟﻮدة ﰲ اﻟﻮﺳﻂ أﻛﱪ ﻣﻦ
اﺣﺘﻤﺎل ﺣﺪوث اﻟﻘﻴﻢ ﰲ اﻟﻄﺮﻓني اﻟﺒﻌﻴﺪﻳﻦ ﻋﻦ اﻟﻮﺳﻂ .ﻳﻮﻓﺮ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ ﺗﻘﺮﻳﺒًﺎ
ﺟﻴﺪًا ﻟﻜﺜري ﻣﻦ اﻟﺘﻮزﻳﻌﺎت اﻟﺘﻲ ﺗﺤﺪث ﻃﺒﻴﻌﻴٍّﺎ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺗﻮزﻳﻊ أﻃﻮال ﻋﻴﻨﺔ
ﻋﺸﻮاﺋﻴﺔ ﻣﻦ اﻟﺮﺟﺎل اﻟﺒﺎﻟﻐني ﻳﺘﺒﻊ ﺗﻮزﻳﻌً ﺎ ﻃﺒﻴﻌﻴٍّﺎ ﺗﻘﺮﻳﺒًﺎ.
أﻳﻀﺎ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎن ﺑﻤَ ﻈﻬَ ﺮ اﻟﻨﻤﻮذج اﻟﺠﻴﺪ ﻟﺸﻜﻞ ﻳﻈﻬﺮ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ ً
ﺗﻮزﻳﻊ إﺣﺼﺎﺋﻴﺎت اﻟﻌﻴﻨﺔ )ﻣﺜﻞ املﻠﺨﺼﺎت اﻹﺣﺼﺎﺋﻴﺔ املﺬﻛﻮرة ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ( ﻋﻨﺪﻣﺎ
ﺗﻨﻄﻮي ﻋﲆ ﻋﻴﻨﺎت ﻛﺒرية .ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻟﻨﻔﱰض أﻧﻨﺎ أﺧﺬﻧﺎ ﻋﲆ ﻧﺤﻮ ﻣﺘﻜﺮر ﻋﻴﻨﺎت
ﺗﻮزﻳﻊ ﻣﺎ ،وﺣﺴﺒﻨﺎ ﻣﺘﻮﺳﻂ ﻛﻞ ﻋﻴﻨﺔ ﻣﻦ ﻫﺬه اﻟﻌﻴﻨﺎت .ﺑﻤﺎ أن ﻛﻞ ﻋﻴﻨﺔ ٍ ﻋﺸﻮاﺋﻴﺔ ﻣﻦ
ﻣﺨﺘﻠﻔﺎ؛ أي ﺳﻴﻜﻮن ﻟﺪﻳﻨﺎ ﺗﻮزﻳﻊ ﻟﻠﻤﺘﻮﺳﻄﺎت. ً ﻣﺨﺘﻠﻔﺔ ،ﻓﺈﻧﻨﺎ ﻧﺘﻮﻗﻊ أن ﻳﻜﻮن ﻛﻞ ﻣﺘﻮﺳﻂ
وإذا ﻛﺎﻧﺖ ﻛﻞ ﻋﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ،ﻓﺴﻴﺘﻀﺢ أن ﻫﺬا اﻟﺘﻮزﻳﻊ ﻟﻠﻤﺘﻮﺳﻄﺎت ﻫﻮ
ﺗﻮزﻳﻊ ﻃﺒﻴﻌﻲ ﺗﻘﺮﻳﺒًﺎ.
أﴍت ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ إﱃ أن اﻹﺣﺼﺎء ﻟﻴﺲ ﻣﺠﺮد ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷدوات املﻌﺰوﻟﺔ، ُ
وﻟﻜﻨﻪ ﻟﻐﺔ ﻣﺘﺼﻠﺔ .وﺗﻨﻄﺒﻖ ﻧﻘﻄﺔ ﻣﻤﺎﺛﻠﺔ ﻋﲆ اﻟﺘﻮزﻳﻌﺎت اﻻﺣﺘﻤﺎﻟﻴﺔ .ﻓﻌﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻨﻲ
72
اﻻﺣﺘﻤﺎﻻت
٠٫٤
٠٫٣
٠٫٢
٠٫١
٠
٣− ٢− ١− ٠ ١ ٢ ٣
ﻛﻼ ﻋﲆ ﺣِ ﺪَة آﻧ ًِﻔﺎ ،ﻓﺈن اﻟﺤﻘﻴﻘﺔ ﻫﻲ أن ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻳﻤﻜﻦ اﻋﺘﺒﺎره ﺣﺎﻟﺔ ﺧﺎﺻﺔ
ذﻛﺮﺗُﻬﺎ ٍّ
ﻣﻦ اﻟﺘﻮزﻳﻊ ذي اﻟﺤ ﱠﺪﻳْﻦ )ﻓﻬﻮ ﺗﻮزﻳﻊ ذو ﺣ ﱠﺪﻳْﻦ ﻋﻨﺪﻣﺎ ﻻ ﻳﻮﺟﺪ ﺳﻮى ﻧﺘﻴﺠﺘني ﻣﺤﺘﻤﻠﺘني
ﻄﻰ ﺣﺠﻢ ﻈﻬﺮ ﻫﺬا ﺗﺘﺨ ﱠ ﻓﺤﺴﺐ( .وﺑﺎملﺜﻞ ،ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أن اﻟﻌﻤﻠﻴﺎت اﻟﺮﻳﺎﺿﻴﺔ اﻟﺘﻲ ﺗُ ِ
ﻫﺬا اﻟﻜﺘﺎب ،ﻓﺈن ﺗﻮزﻳﻊ ﺑﻮاﺳﻮن ﻳﻤﺜﱢﻞ ﺣﺎﻟﺔ ﻣﺘﻄ ﱢﺮﻓﺔ ﻣﻦ اﻟﺘﻮزﻳﻊ ذي اﻟﺤ ﱠﺪﻳْﻦ ،وﻳﺸ ﱢﻜﻞ
ﺗﻮزﻳﻊ ﺑﻮاﺳﻮن واﻟﺘﻮزﻳﻊ اﻷ ُ ﱢﳼ زوﺟً ﺎ ﻃﺒﻴﻌﻴٍّﺎ ،وﻳﺼﺒﺢ اﻟﺘﻮزﻳﻊ ذو اﻟﺤﺪﻳﻦ أﻛﺜﺮ وأﻛﺜﺮ
ﺷﺒﻬً ﺎ ﺑﺎﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ ﻛﻠﻤﺎ زاد اﻟﺤﺪ اﻷﻗﴡ ﻟﻌﺪد اﻷﺣﺪاث ،وﻫﻜﺬا .وﻫﺬه اﻟﺘﻮزﻳﻌﺎت
ﰲ ﺣﻘﻴﻘﺘﻬﺎ ﺟﺰء ﻣﻦ وﺣﺪة رﻳﺎﺿﻴﺔ ﻛﺎﻣﻠﺔ ﻣﺘﻜﺎﻣﻠﺔ.
ً
وﺻﻔﺖ اﻟﺘﻮزﻳﻌﺎت اﻟﺴﺎﺑﻘﺔ ﺑﺎﻟﻘﻮل إن ﻟﻬﺎ أﺷﻜﺎﻻ ﻣﺨﺘﻠﻔﺔ .وﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻦ ُ ﻟﻘﺪ
َ
وﺻﻒ ﻫﺬه اﻷﺷﻜﺎل ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ .ﻓﺮأﻳْﻨﺎ أن ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻳﺘﻤﻴﺰ ﺑﻮﺟﻮد اﻟﻘﻴﻤﺔ .p
ُﺨﱪﻧﺎ ﺑﺎﺣﺘﻤﺎل أﻧﻨﺎ ﺳﻮف ﻧﺤﺼﻞ ﻋﲆ ﻧﺘﻴﺠﺔ ﻣﻌﻴﻨﺔ .وﺗﺘﻮاﻓﻖ ﻗﻴﻢ pاملﺨﺘﻠﻔﺔ ﻣﻊ وﻫﺬا ﻳ ِ
ﺗﻮزﻳﻌﺎت ﺑﺮﻧﻮﱄ ﻣﺨﺘﻠﻔﺔ؛ ﻓﻴﻤﻜﻨﻨﺎ ﺻﻴﺎﻏﺔ ﻧﺘﺎﺋﺞ ﻗﺬف ﻋﻤﻠﺔ ﻋﻦ ﻃﺮﻳﻖ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻣﻊ
اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة — — pﻣﺴﺎوﻳًﺎ اﻟﻨﺼﻒ ،وﺻﻴﺎﻏﺔ اﺣﺘﻤﺎل وﻗﻮع ﺣﺎدث
73
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﺴﻴﺎرة ﰲ رﺣﻠﺔ واﺣﺪة ﺑﻮاﺳﻄﺔ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻣﻊ pﺗﺴﺎوي ﻗﻴﻤﺔ ﺻﻐرية ﺟﺪٍّا )ﻛﻤﺎ
آﻣﻞ!( .وﰲ ﻣﺜﻞ ﻫﺬه اﻟﺤﺎﻟﺔ ،ﺗﺴﻤﻰ » pﻣَ ﻌْ َﻠﻤﺔ« )أو ﺑﺎراﻣﱰًا(.
أﻳﻀﺎ ﺑﻮﺟﻮد ﻣﻌﻠﻤﺎت ﺗﺆدي اﻟﺪور ﻧﻔﺴﻪ؛ إذ ﺗﻌﺮﻓﻨﺎ وﺗﺘﻤﻴﺰ اﻟﺘﻮزﻳﻌﺎت اﻷﺧﺮى ً
ﺑﺎﻟﻀﺒﻂ ﺑﻌﻀﻮ ﻋﺎﺋﻠﺔ اﻟﺘﻮزﻳﻌﺎت اﻟﺬي ﻧﺘﺤﺪث ﻋﻨﻪ .ﻟﻨﺮى ﻛﻴﻔﻴﺔ ذﻟﻚ ،دَﻋْ ﻨﺎ ﻧَﻌُ ْﺪ ﺧﻄﻮة
إﱃ اﻟﻮراء وﻧﺘﺬﻛﺮ ﻗﺎﻧﻮن اﻷﻋﺪاد اﻟﻜﺒرية .ﻳﻨﺺ ﻫﺬا اﻟﻘﺎﻧﻮن ﻋﲆ أﻧﻨﺎ إذا ﻗﻤﻨﺎ ﺑﻤﻼﺣﻈﺎت
ﻣﺴﺘﻘ ﱠﻠﺔ ﻣﺘﻜﺮرة ﻟﺤﺪث ﻟﻪ ﻧﺘﻴﺠﺔ Aﺑﺎﺣﺘﻤﺎل pوﻧﺘﻴﺠﺔ Bﺑﺎﺣﺘﻤﺎل ،1 − pﻓﺈﻧﻨﺎ ﻳﺠﺐ
أن ﻧﺘﻮﻗﻊ أن ﻧﺴﺒﺔ ﻣﺮات ﻣﻼﺣﻈﺔ اﻟﻨﺘﻴﺠﺔ Aﺗﻘﱰب أﻛﺜﺮ وأﻛﺜﺮ ﻣﻦ pﻛﻠﻤﺎ زاد ﻋﺪد
املﻼﺣﻈﺎت اﻟﺘﻲ ﻧﻘﻮم ﺑﻬﺎ .ﺗُﻌﻤﱠ ﻢ ﻫﺬه اﻟﺴﻤﺔ ﺑﻄﺮق ﻣﻬﻤﺔ .ﻓﻌﲆ وﺟﻪ اﻟﺨﺼﻮص ،ﻟﻨﻔﱰض
ﺑﺪﻻ ﻣﻦ ﻣﻼﺣﻈﺔ ﺣﺪث ﻟﻪ ﻧﺘﻴﺠﺘﺎن ﻣﺤﺘﻤﻠﺘﺎن ﻓﺤﺴﺐ ،ﻻﺣﻈﻨﺎ ﺣﺪﺛًﺎ ﻳﻤﻜﻦ أن ﻳﺄﺧﺬ أﻧﻪ ً
أي ﻗﻴﻤﺔ ﻣﻦ ﺗﻮزﻳﻊ ﻋﲆ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻳﺄﺧﺬ أي ﻗﻴﻤﺔ ﰲ اﻟﻔﱰة
] .[١ ،٠وﻟﻨﻔﱰض أﻧﻨﺎ أﺧﺬﻧﺎ ﻣﺠﻤﻮﻋﺎت ﻣﻦ اﻟﻘﻴﺎﺳﺎت nﻣﻦ ﻣﺜﻞ ﻫﺬا اﻟﺘﻮزﻳﻊ ﻋﲆ ﻧﺤﻮ
أﻳﻀﺎ أﻧﻪ ﻳﻨﺒﻐﻲ ﻟﻨﺎ أن ﻧﺘﻮﻗﻊ أن ﻳﻘﱰب ﻣﺘﻮﺳﻂ ﻣﺘﻜﺮر .ﻳﺨﱪﻧﺎ ﻗﺎﻧﻮن اﻷﻋﺪاد اﻟﻜﺒرية ً
اﻟﻘﻴﺎﺳﺎت nﻣﻦ ﻗﻴﻤﺔ ﺛﺎﺑﺘﺔ ﻛﻠﻤﺎ ﻛﺎﻧﺖ nأﻛﱪ .وﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻨﻨﺎ ﺗﺼﻮر زﻳﺎدة nدون
ﺣﺪ ،وﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ﻣﻦ املﻨﻄﻘﻲ أن ﻧﺘﺤﺪث ﻋﻦ ﻣﺘﻮﺳﻂ ﻋﻴﻨﺔ ﻏري ﻣﺤﺪودة ﻣﺴﺘﻤﺪة
ﻣﻦ اﻟﺘﻮزﻳﻊ؛ ﺑﻞ وﺣﺘﻰ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ ﻧﻔﺴﻪ .ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺑﺎﺳﺘﺨﺪام ﻫﺬه اﻟﻔﻜﺮة
ﻳﻤﻜﻦ أن ﻧﺘﺤﺪث ﻋﻦ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ اﻷ ُ ﱢﳼ ﻧﻔﺴﻪ وﻟﻴﺲ ﻋﻦ ﻣﺘﻮﺳﻂ »ﻋﻴﻨﺔ ﻣﺄﺧﻮذة
ﻣﻦ اﻟﺘﻮزﻳﻊ اﻷﳼ« ﻓﺤﺴﺐ .وﺗﻤﺎﻣً ﺎ ﻛﻤﺎ ﺳﺘﻤﺘﻠﻚ ﺗﻮزﻳﻌﺎت ﺑﺮﻧﻮﱄ املﺨﺘﻠﻔﺔ ﻣﻌﻠﻤﺎت p
ﻣﺨﺘﻠﻔﺔ ،ﻓﺈن اﻟﺘﻮزﻳﻌﺎت اﻷﺳﻴﺔ املﺨﺘﻠﻔﺔ ﺳﻮف ﺗﻤﺘﻠﻚ ﻣﺘﻮﺳﻄﺎت ﻣﺨﺘﻠﻔﺔ .وﺣﻴﻨﻬﺎ ﻳﻜﻮن
املﺘﻮﺳﻂ ﻣﻌﻠﻤﺔ ﻟﻠﺘﻮزﻳﻊ اﻷﳼ.
ﻣﻌﻘﻮﻻ »ﻟﻌﻤﺮ« املﺰﻫﺮﻳﺎت ً رأﻳﻨﺎ ﰲ ﻣﺜﺎل ﺳﺎﺑﻖ أن اﻟﺘﻮزﻳﻊ اﻷﳼ ﻛﺎن ﻧﻤﻮذﺟً ﺎ
اﻟﺰﺟﺎﺟﻴﺔ )ﺗﺤﺖ ﻇﺮوف ﻣﻌﻴﻨﺔ( ،واﻵن ﻳﻤﻜﻨﻨﺎ أن ﻧﺘﺼﻮر أن ﻟﺪﻳﻨﺎ ﻣﺠﻤﻮﻋﺘَني ﻣﻦ ﻫﺬه
املﺰﻫﺮﻳﺎت؛ ﻣﺠﻤﻮﻋﺔ ﺗﺘﻜﻮن ﻣﻦ ﻣﺰﻫﺮﻳﺎت ﺻﻠﺒﺔ ﻣﺼﻨﻮﻋﺔ ﻣﻦ زﺟﺎج ﺳﻤﻴﻚ ﻟﻠﻐﺎﻳﺔ،
وﻣﺠﻤﻮﻋﺔ ﺛﺎﻧﻴﺔ ﺗﺘﻜﻮن ﻣﻦ ﻣﺰﻫﺮﻳﺎت َﻫ ﱠﺸﺔ ﻣﺼﻨﻮﻋﺔ ﻣﻦ زﺟﺎج رﻗﻴﻖ ﻟﻠﻐﺎﻳﺔ .ﻣﻦ اﻟﻮاﺿﺢ
أﻧﻪ ﰲ املﺘﻮﺳﻂ ،ﻣﺰﻫﺮﻳﺎت املﺠﻤﻮﻋﺔ اﻷوﱃ ﻣﻦ املﺮﺟﺢ أن ﺗﻌﻴﺶ ﻟﻔﱰة أﻃﻮل ﻣﻦ ﻣﺰﻫﺮﻳﺎت
املﺠﻤﻮﻋﺔ اﻟﺜﺎﻧﻴﺔ .ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ املﺠﻤﻮﻋﺘَني ﻟﻬﺎ ﻣﻌﻠﻤﺔ ﻣﺨﺘﻠﻔﺔ.
ﻳﻤﻜﻨﻨﺎ ﺗﺤﺪﻳﺪ املﻌﻠﻤﺎت اﻟﺨﺎﺻﺔ ﺑﺎﻟﺘﻮزﻳﻌﺎت اﻷﺧﺮى ﻋﲆ ﻧﺤﻮ ﻣﺸﺎ ِﺑ ٍﻪ؛ ﻓﻨﺘﺼﻮر
ﺣﺴﺎب ﻣﻠﺨﺼﺎت إﺣﺼﺎﺋﻴﺔ ﻟﻌﻴﻨﺎت ﺑﺤﺠﻢ ﻻ ﻧﻬﺎﺋﻲ ﻣﺴﺘﻤﺪة ﻣﻦ اﻟﺘﻮزﻳﻌﺎت؛ ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ أن ﻧﺘﺼﻮر ﺣﺴﺎب ﻣﺘﻮﺳﻄﺎت ﻋﻴﻨﺎت ﻛﺒرية ﻻ ﻧﻬﺎﺋﻴﺔ ﻣﺴﺘﻤﺪة ﻣﻦ أﻋﻀﺎء
74
اﻻﺣﺘﻤﺎﻻت
ﻗﻠﻴﻼ ﻫﻨﺎ؛ ﻷن أﻋﻀﺎء ﻫﺬه اﻷﴎة اﻷﴎة اﻟﻌﺎدﻳﺔ ﻟﻠﺘﻮزﻳﻌﺎت .إﻻ أن اﻷﻣﻮر أﻛﺜﺮ ﺗﻌﻘﻴﺪًا ً
ﻣﻦ اﻟﺘﻮزﻳﻌﺎت ﻻ ﺗﺘﺤﺪﱠد ﻋﲆ ﻧﺤﻮ ﻓﺮﻳﺪ ﺑﻮاﺳﻄﺔ ﻣﻌﻠﻤﺔ واﺣﺪة؛ ﻓﻬﻲ ﺗﺘﻄﻠﺐ ﻣﻌﻠﻤﺘني .ﰲ
اﻟﻮاﻗﻊ ،املﺘﻮﺳﻂ واﻻﻧﺤﺮاف املﻌﻴﺎري ﻟﻠﺘﻮزﻳﻌﺎت ﺳﻴﻜﻮﻧﺎن ﻛﺎﻓﻴ ْ ِ
َني؛ إذ ﺳﻴﻌﻤﻼن ﻣﻌً ﺎ ﻋﲆ
ﺗﺤﺪﻳﺪ أي أﻋﻀﺎء اﻟﻌﺎﺋﻠﺔ ﻧﺘﺤﺪث ﻋﻨﻪ ﻋﲆ ﻧﺤﻮ ﻓﺮﻳﺪ.
ﻧ ُ ﱢﻘﺢ ﻗﺎﻧﻮن اﻷﻋﺪاد اﻟﻜﺒرية أﻛﺜﺮ ﻣﻦ ذﻟﻚ .ﺗﺨﻴ ِﱠﻞ اﺳﺘﺨﺮاج اﻟﻌﺪﻳﺪ ﻣﻦ ﻣﺠﻤﻮﻋﺎت اﻟﻘﻴﻢ
ﺗﻮزﻳﻊ ﻣﺎ ،ﺑﺤﻴﺚ ﺗﻜﻮن ﻛﻞ ﻣﺠﻤﻮﻋﺔ ﺑﺎﻟﺤﺠﻢ ،nواﺣﺴﺐ املﺘﻮﺳﻂ ﻟﻜﻞ ﻣﺠﻤﻮﻋﺔ. ٍ ﻣﻦ
ﺣﻴﻨﻬﺎ ﺳﺘﻜﻮن املﺘﻮﺳﻄﺎت ﻧﻔﺴﻬﺎ ﻋﻴﻨﺔ ﻣﻦ اﻟﺘﻮزﻳﻊ؛ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﺤﺘﻤﻠﺔ ملﺘﻮﺳﻂ ﻋﻴﻨﺔ
ﺑﺎﻟﺤﺠﻢ .nﺗﺨﱪﻧﺎ »ﻣﱪﻫﻨﺔ اﻟﻨﻬﺎﻳﺔ املﺮﻛﺰﻳﺔ« أن ﺗﻮزﻳﻊ ﻫﺬه املﺘﻮﺳﻄﺎت ﻧﻔﺴﻬﺎ ﻳﺘﺒﻊ
ﺗﻘﺮﻳﺒًﺎ ﺗﻮزﻳﻌً ﺎ ﻃﺒﻴﻌﻴٍّﺎ ،وﻫﺬا اﻟﺘﻘﺮﻳﺐ ﻳﺰداد أﻛﺜﺮ وأﻛﺜﺮ ﻛﻠﻤﺎ زادت ﻗﻴﻤﺔ .nﰲ اﻟﻮاﻗﻊ،
أﻳﻀﺎ أن ﻣﺘﻮﺳﻂ ﺗﻮزﻳﻊ املﺘﻮﺳﻄﺎت ﻫﺬا ﻳﺘﻄﺎﺑﻖ ﺨﱪﻧﺎ أﻛﺜﺮ ﻣﻦ ﻫﺬا؛ إذ ﺗﺨﱪﻧﺎ ً إﻧﻬﺎ ﺗُ ِ
ﻣﻊ ﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻟﻠﻘﻴﻢ ،وأن اﻟﺘﺒﺎﻳﻦ ﰲ ﺗﻮزﻳﻊ املﺘﻮﺳﻄﺎت ﻳﺴﺎوي ﻓﻘﻂ 1/n
ﺿﻌﻒ ﺣﺠﻢ ﺗﺒﺎﻳﻦ ﺗﻮزﻳﻊ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ .وﻳﺘﻀﺢ أن ﻫﺬا ﻣﻔﻴﺪ ﻟﻠﻐﺎﻳﺔ ﰲ اﻹﺣﺼﺎء؛
ﻷﻧﻪ ﻳﻌﻨﻲ أﻧﻨﺎ ﻳﻤﻜﻨﻨﺎ ﺗﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﺑﺄﻛﱪ ﻗﺪر ﻣﻦ اﻟﺪﻗﺔ ﻧﺮﻏﺐ ﻓﻴﻪ
ﻓﻘﻂ ﻋﻦ ﻃﺮﻳﻖ أﺧﺬ ﻋﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻳﻜﻔﻲ )أﺧﺬ nﻛﺒرية ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ(؛ ﺣﻴﺚ ﺗﺨﱪﻧﺎ
ﻣﱪﻫﻨﺔ اﻟﻨﻬﺎﻳﺔ املﺮﻛﺰﻳﺔ ﻣﺪى ﺣﺠﻢ اﻟﻌﻴﻨﺔ اﻟﺬي ﻳﺠﺐ أن ﻧﺼﻞ إﻟﻴﻪ ﻟﺘﺤﻘﻴﻖ اﺣﺘﻤﺎل
ﻛﺒري ﻟﻠﻮﺻﻮل ﻟﻬﺬه اﻟﺪﻗﺔ .وﺑﺸﻜﻞ أﻋﻢ ،ﻳُﻌَ ﱡﺪ املﺒﺪأ اﻟﻘﺎﺋﻞ ﺑﺄﻧﻨﺎ ﻧﺴﺘﻄﻴﻊ اﻟﺤﺼﻮل ﻋﲆ
ﺗﻘﺪﻳﺮات أﻓﻀﻞ وأﻓﻀﻞ ﻣﻦ ﺧﻼل أﺧﺬ ﻋﻴﻨﺎت أﻛﱪ ﻣﺒﺪأ ً ﻗﻮﻳٍّﺎ ﻟﻠﻐﺎﻳﺔ .وﻗﺪ رأﻳﻨﺎ ﺑﺎﻟﻔﻌﻞ
إﺣﺪى اﻟﻄﺮق اﻟﺘﻲ ﺗُﺴﺘﺨﺪم ﻓﻴﻬﺎ ﻫﺬه اﻟﻔﻜﺮة ﻋﲆ ﻧﺤﻮ ﻋﻤﲇ ﺣني ﺗﻨﺎوﻟﻨﺎ ﻣﻮﺿﻮع ﻣﺴﺢ
اﻟﻌﻴﻨﺎت ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ.
آﺧﺮ .ﰲ ﻋﻠﻢ اﻟﻔﻠﻚ ،ﺗﻜﻮن اﻷﺟﺮام اﻟﺴﻤﺎوﻳﺔ اﻟﺒﻌﻴﺪة ﺧﺎﻓﺘﺔ ﺟﺪٍّا ،وﺗﻜﻮن ﻣﺜﺎﻻ َ
إﻟﻴﻚ ً
ﻣﻌﻘﺪة ﺑﺴﺒﺐ اﻟﺘﻘﻠﺒﺎت اﻟﻌﺸﻮاﺋﻴﺔ ﰲ اﻹﺷﺎرات .وﻣﻊ ذﻟﻚ ،إذا أﺧﺬﻧﺎ اﻟﻌﺪﻳﺪ املﺸﺎﻫﺪات ﱠ
ﻣﻦ اﻟﺼﻮر ﻟﻠﺠﺮم ﻧﻔﺴﻪ ورا َﻛﺒْﻨﺎﻫﺎ ﺑﻌﻀﻬﺎ ﻓﻮق ﺑﻌﺾ ،ﻓﺈن اﻷﻣﺮ ﻳُﺸ ِﺒﻪ ﺣﺴﺎب ﻣﺘﻮﺳﻂ
اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻘﻴﺎﺳﺎت ﻟﻠﴚء ﻧﻔﺴﻪ ،وﻛﻞ ﻗﻴﺎس ﻣﺴﺘﻤﺪ ﻣﻦ اﻟﺘﻮزﻳﻊ ﻧﻔﺴﻪ وﻟﻜﻦ ﺑﻮﺟﻮد
ً
ﺳﺎﺑﻘﺎ ﻳﺘﻢ اﻟﺘﺨﻠﺺ ﻣﻦ ﻣﻜﻮﱢن ﻋﺸﻮاﺋﻲ إﺿﺎﰲ .وﺑﺎﺳﺘﺨﺪام ﻗﻮاﻧني اﻻﺣﺘﻤﺎﻻت املﺬﻛﻮرة
اﻟﻌﺸﻮاﺋﻴﺔ ،وﺗﺒﻘﻰ رؤﻳﺔ واﺿﺤﺔ ﻟﻺﺷﺎرة اﻷﺳﺎﺳﻴﺔ؛ أي اﻟﺠﺮم اﻟﺴﻤﺎوي.
75
اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
رأﻳﻨﺎ ﰲ اﻟﻔﺼﻞ اﻷول أن اﻹﺣﺼﺎﺋﻴﺎت ﺗﻠﻌﺐ دو ًرا ﻣﺰدوﺟً ﺎ ﻳﺘﻤﺜﻞ ﰲ ﺗﻠﺨﻴﺺ اﻟﺒﻴﺎﻧﺎت
واﺳﺘﺨﺮاج اﻻﺳﺘﻨﺘﺎﺟﺎت ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،واﺳﺘﻜﺸﻔﻨﺎ ﺑﻌﺾ اﻷدوات اﻟﺒﺴﻴﻄﺔ ﻟﺘﻠﺨﻴﺺ
اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ .وﰲ ﻫﺬا اﻟﻔﺼﻞ ،وﺑﺎﺳﺘﺨﺪام ﻣﻔﺎﻫﻴﻢ اﻻﺣﺘﻤﺎﻻت املﺬﻛﻮرة
ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ ،ﺳﻮف ﻧﺘﻨﺎول اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل؛ أي ،ﺳﻨﺪرس ﻃﺮق ﺗﺤﺪﻳﺪ ﻗﻴﻤﺔ
اﻟﻜﻤﻴﺎت اﻟﺘﻲ ﻻ ﻳﻤﻜﻨﻨﺎ ﻣﻼﺣﻈﺘﻬﺎ ﺑﺎﻟﻔﻌﻞ ،وﺗﻘﺪﻳﻢ إﻓﺎدات ﻋﻨﻬﺎ .إﻟﻴﻚ ﺑﻌﺾ اﻷﻣﺜﻠﺔ:
ﻣﺜﺎل :١ﻟﺘﺤﺪﻳﺪ ﴎﻋﺔ اﻟﻀﻮء ،ﺳﻨﻘﻮم ﺑﺘﻨﻔﻴﺬ ﺑﻌﺾ ﻃﺮق اﻟﻘﻴﺎس .ﻻ ﺗﻮﺟﺪ ﻃﺮﻳﻘﺔ
ﻗﻴﺎس ﻣﺜﺎﻟﻴﺔ ،وإذا ﻛﺮرﻧﺎ ﻫﺬه اﻟﻌﻤﻠﻴﺔ ﻓﺮﺑﻤﺎ ﺳﻨﺤﺼﻞ ﻋﲆ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ ً
ﻗﻠﻴﻼ .وﺗﻜﺮار
ُ
وﻫﺪﻓﻨﺎ إذن ﻫﻮ اﻟﻘﻴﺎس ﻣﺎﺋﺔ ﻣﺮة ﻣﻦ املﺮﺟﺢ أن ﻳﻌﻄﻴﻨﺎ ﻣﺎﺋﺔ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ ً
ﻗﻠﻴﻼ.
اﺳﺘﺨﺪام ﻫﺬه اﻟﻌﻴﻨﺔ ﻣﻦ اﻟﻘﻴﻢ ﻟﺘﻘﺪﻳﺮ ﴎﻋﺔ اﻟﻀﻮء اﻟﺤﻘﻴﻘﻴﺔ ،دون أن ﻳﺸﻮﺑﻬﺎ ﺷﺎﺋﺒﺔ
ﻣﻦ ﺧﻄﺄ اﻟﻘﻴﺎس.
ﻌﻄﻲ دواءً ﺟﺪﻳﺪًا ﻟﻌﻴﱢﻨﺔ ﻣﻦ املﺮﴇ ﻣﺜﺎل :٢ﰲ ﺗﺠﺮﺑﺔ ﴎﻳﺮﻳﺔ ﻋﺸﻮاﺋﻴﺔ ﺑﺴﻴﻄﺔ ،رﺑﻤﺎ ﻧ ُ ِ
ودواءً ﻣﻌﻴﺎرﻳٍّﺎ ﻟﻌﻴﻨﺔ أﺧﺮى .وﺑﻨﺎءً ﻋﲆ ﻣﻼﺣﻈﺎت اﻵﺛﺎر ﻟﺪى ﻫﺎﺗني املﺠﻤﻮﻋﺘَني ﻣﻦ
املﺮﴇ ﺳﻮف ﻧﺮﻏﺐ ﰲ ﺗﻘﺪﻳﻢ إﻓﺎدة ،أو اﺳﺘﺪﻻل ،ﺣﻮل اﻟﻔﻌﺎﻟﻴﺔ اﻟﻨﺴﺒﻴﺔ ﻟﻠﺪواء اﻟﺠﺪﻳﺪ.
ﺑﻌﺒﺎرة أﺧﺮى ،ﻧﺮﻏﺐ ﰲ ﺗﻘﺪﻳﺮ ﻣﺪى ﻛﱪ اﻟﻔﺎرق ﰲ ﻓﻌﺎﻟﻴﺔ اﻟﺪواءﻳﻦ اﻟﺬي ﻗﺪ ﱠ
ﻧﺘﻮﻗﻌﻪ
وﺻﻔﻨﺎ ﻛﻞ دواء ﻣﻦ اﻟﺪواءﻳﻦ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ ﻣﻦ املﺮﴇ اﻟﺨﺎﺿﻌني ْ إذا ﻛﻨﱠﺎ ﻗﺪ
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻠﺪراﺳﺔ .وﺳﻨﺮﻏﺐ ً
أﻳﻀﺎ ﻋﲆ ﻧﺤﻮ ﻣﺜﺎﱄ ﰲ اﻟﺤﺼﻮل ﻋﲆ ﺑﻌﺾ املﺆﴍات ﺣﻮل ﻣﺪى
ﺛﻘﺘﻨﺎ ﰲ ﺣﺠﻢ اﻟﺘﻘﺪﻳﺮ.
ﻣﺜﺎل :٣ﰲ دراﺳﺔ ﻟﻠﺒﻄﺎﻟﺔ ﰲ ﻟﻨﺪن ،ﺳﺘﻜﻮن ﻣﻘﺎﺑﻠﺔ اﻟﺠﻤﻴﻊ ﻏري ﻗﺎﺑﻠﺔ ﻟﻠﺘﻄﺒﻴﻖ؛ ﻟﺬﻟﻚ
ﺳﺘُﺠﺮى ﻣﻘﺎﺑﻼت ﻣﻊ ﻋﻴﻨﺔ ﻣﻦ اﻷﺷﺨﺎص ،ﺑﻬﺪف اﺳﺘﺨﺪام ردود ﻫﺬه اﻟﻌﻴﻨﺔ ﻟﺘﻘﺪﻳﻢ
إﻓﺎدة ﻋﺎﻣﺔ ﻋﻦ ﻟﻨﺪن ﺑﺄﻛﻤﻠﻬﺎ؛ أي إﻧﻨﺎ ﻧﻮد ﺗﻘﺪﻳﺮ اﻟﺒﻄﺎﻟﺔ ﰲ ﻟﻨﺪن ﺑﺄﻛﻤﻠﻬﺎ ﺑﺎﺳﺘﺨﺪام
ﺑﻴﺎﻧﺎت اﻟﻌﻴﻨﺔ.
ﻗﺪﻣﺖ ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ ﻓﻜﺮة »ﻣَ ﻌْ َﻠﻤﺔ« اﻟﺘﻮزﻳﻊ.
ُ ﻣﺜﺎل :٤ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ ﺗﺠﺮﻳﺪﻳﺔ،
وﺷﺎﻫﺪﻧﺎ ﻣﺜﺎل ﻋﺎﺋﻠﺔ ﺑﺮﻧﻮﱄ ﻣﻦ اﻟﺘﻮزﻳﻌﺎت؛ ﺣﻴﺚ ﻳﺴﺘﻄﻴﻊ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ أن ﻳﺄﺧﺬ
اﻟﻘﻴﻤﺔ ٠أو ،١وﺣﻴﺚ ﻛﺎﻧﺖ pﻣﻌﻠﻤﺔ ﺗﻌﻄﻲ اﺣﺘﻤﺎل ﻣﻼﺣﻈﺔ اﻟﻘﻴﻤﺔ .١ﻛﻤﺎ
ﻣﺜﺎﻻ ﻋﲆ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ ،واﻟﺬي ﻛﺎن ﻳﻤﺘﻠﻚ ﻣﻌﻠﻤﺘني؛ ﻫﻤﺎ اﻻﻧﺤﺮاف ً رأﻳﻨﺎ ً
أﻳﻀﺎ
املﻌﻴﺎري واملﺘﻮﺳﻂ .ورﺑﻤﺎ ﻳﻜﻮن ﻫﺪﻓﻨﺎ ﻫﻮ ﺗﻘﺪﻳﺮ ﻗﻴﻤﺔ ﻫﺬه املﻌﻠﻤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل،
رﺑﻤﺎ ﺗﺪرس ﻋﺎﻟِﻤﺔ أﻧﺜﺮوﺑﻮﻟﻮﺟﻴﺎ أﻃﻮال ﻣﺠﻤﻮﻋﺔ ﻣﻌﻴﻨﺔ ﻣﻦ اﻷﺷﺨﺎص ،ورﺑﻤﺎ ﺗﻜﻮن
ً
ﺗﻮﺻﻴﻔﺎ ﺗﺎﻣٍّ ﺎ ﻣﺴﺘﻌِ ﺪﱠة ﻻﻓﱰاض أن اﻷﻃﻮال ﻣُﻮ ﱠزﻋﺔ ﻃﺒﻴﻌﻴٍّﺎ ،وﻟﻜﻦ ﻟﺘﻮﺻﻴﻒ اﻟﺘﻮزﻳﻊ
ﺳﻮف ﺗﺤﺘﺎج إﱃ ﻣﻌﺮﻓﺔ املﺘﻮﺳﻂ واﻻﻧﺤﺮاف املﻌﻴﺎري ﻟﻬﺬا اﻟﺘﻮزﻳﻊ .ورﺑﻤﺎ ﺗﺮﻏﺐ ﰲ
اﺳﺘﺨﺪام أﻃﻮال ﻋﻴﻨﺔ أﺷﺨﺎص ﻣﻦ املﺠﻤﻮﻋﺔ ﻟﺘﻘﺪﻳﺮ املﺘﻮﺳﻂ واﻻﻧﺤﺮاف املﻌﻴﺎري
ﻟﻠﻤﺠﻤﻮﻋﺔ ﺑﺄﻛﻤﻠﻬﺎ.
78
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
ً
ﺿﺌﻴﻼ أﻗ ﱠﻞ ﻣﻦ اﻟﻨﺼﻒ .ﻓﻌﲆ أي ﺣﺎل ،إذا ﻛﺎن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﰲ اﻟﺤﻘﻴﻘﺔ
ﻟﻠﻐﺎﻳﺔ ،ﺑﺤﻴﺚ إﻧﻪ ﻧﺎد ًرا ﻣﺎ ﻳَﻈﻬَ ﺮ ،ﻳﻤﻜﻦ أن ﺗﻜﻮن اﻟﺼﻔﻘﺔ ﺳﻴﺌﺔ ﺑﺎﻟﻨﺴﺒﺔ ﱄ .ملﻌﺮﻓﺔ ﻫﺬا،
ﺳﺄرﻏﺐ ﰲ ﺗﻘﺪﻳﺮ ﻫﺬا اﻻﺣﺘﻤﺎل .ﻋﺮض ﺻﺪﻳﻘﻲ — اﻟﻜﺮﻳﻢ ﻟﻠﻐﺎﻳﺔ وﻟﻜﻨﻪ ﻻ ﻳﻌﺮف ﺷﻴﺌًﺎ
ﺳﺖ ﻣﺮات ،ﺣﺘﻰ أﺳﺘﻄﻴﻊ أن أرى اﻟﻮﺟﻪ اﻟﺬي ﺳﻴَﻈﻬَ ﺮ ﰲ ﻋﻦ اﻹﺣﺼﺎء — ﻗﺬْف اﻟﻌﻤﻠﺔ ﱠ
ﻛﻞ ﻣﺮة .وﻫﺪﰲ إذن ﻫﻮ اﺳﺘﺨﺪام ﻫﺬه اﻟﺒﻴﺎﻧﺎت ﻟﺘﻘﺪﻳﺮ اﺣﺘﻤﺎل أن اﻟﻌﻤﻠﺔ ﺳﺘﺴﺘﻘﺮ ووﺟﻪ
اﻟﺼﻮرة ﻷﻋﲆ ﰲ ﻋﻤﻠﻴﺎت اﻟﻘﺬف املﺴﺘﻘﺒﻠﻴﺔ.
ﻟﻨﻔﱰض أن اﻟﻌﻤﻠﺔ ﺧﻀﻌﺖ ﻟﻠﺘﻼﻋﺐ ،وأن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﻌﻤﻠﺔ ﰲ أي ﻗﺬﻓﺔ
واﺣﺪة ﻛﺎن ٣ / ١ﻓﻘﻂ .وﺑﻤﺎ أن ﻗﺬﻓﺎت اﻟﻌﻤﻠﺔ ﻣﺴﺘﻘﻠﺔ ﺑﻌﻀﻬﺎ ﻋﻦ ﺑﻌﺾ )ﻧﺘﻴﺠﺔ اﻟﻘﺬﻓﺔ
اﻟﻮاﺣﺪة ﻻ ﺗﺆﺛﺮ ﻋﲆ ﻧﺘﻴﺠﺔ أي ﻗﺬﻓﺔ أﺧﺮى( ،ﻓﺈﻧﻨﺎ ﻧﻌﻠﻢ أن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة
ﰲ ﻗﺬﻓﺘني ﻫﻮ ﺑﺒﺴﺎﻃﺔ ﻧﺎﺗﺞ ﴐب اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﰲ ﻛﻠﺘﺎ املﺮﺗني× ٣ / ١ :
.٩ / ١ = ٣ / ١وﺑﺎملﺜﻞ ،ﺑﻤﺎ أن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻫﻮ ،٣ / ٢ = ٣ / ١ − ١ﻓﺈن
اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﻣﺘﺒﻮﻋً ﺎ ﺑﻈﻬﻮر وﺟﻪ اﻟﻜﺘﺎﺑﺔ ﺳﻴﻜﻮن ﺣﺎﺻﻞ ﴐب ٣ / ١
و٣ / ٢؛ وﻫﻮ .٩ / ٢وﻋﻤﻮﻣً ﺎ ،ﺑﺎﻓﱰاض أن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﰲ ﻛﻞ ﻗﺬﻓﺔ ﻫﻮ
،٣ / ١ﻳﻤﻜﻨﻨﺎ ﺣﺴﺎب اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ أي ﺗﺴﻠﺴﻞ ﻟﻮﺟﻬَ ﻲ اﻟﺼﻮرة واﻟﻜﺘﺎﺑﺔ؛ وﻋﲆ
ُ
ﺗﺴﻠﺴﻞ ﻣﻤﺎﺛﻞ ﻟﺬﻟﻚ اﻟﺬي ﻳﻈﻬﺮ ﰲ اﻟﻘﺬﻓﺎت اﻟﺴﺖ اﻟﺘﻲ رأﻳﻨﺎﻫﺎ ﺑﺎﻟﻔﻌﻞ؛ وﺟﻪ اﻟﺨﺼﻮص،
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا أﻇﻬﺮت اﻟﻘﺬﻓﺎت اﻟﺴﺖ اﻟﺘﺴﻠﺴ َﻞ ص – ك – ص – ك – ك – ك،
ﻓﺈن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﺗﺴﻠﺴﻞ ﻣﺘﻄﺎﺑﻖ ﺑﺎملﺼﺎدﻓﺔ ﺳﻴﻜﻮن × ٣ / ١ × ٣ / ٢ × ٣ / ١
٧٢٩ / ١٦ = ٣ / ٢ × ٣ / ٢ × ٣ / ٢؛ أي ﺗﻘﺮﻳﺒًﺎ .٠٫٠٢٢
ﻳﻤﻜﻨﻨﺎ ﺑﺎﻟﻄﺮﻳﻘﺔ ﻧﻔﺴﻬﺎ ﺣﺴﺎب اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﺗﺴﻠﺴﻞ ص – ك – ص – ك
– ك – ك إذا ﻛﺎن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﰲ ﻛﻞ ﻗﺬﻓﺔ ﻳﺴﺎوي ﻓﻌﻠﻴٍّﺎ أي ﻗﻴﻤﺔ أﺧﺮى؛
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﺎن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ) ٢ / ١وﻣﻦ ﺛﻢ ﻓﺈن اﺣﺘﻤﺎل ﻇﻬﻮر
وﺟﻪ اﻟﻜﺘﺎﺑﺔ ﻳﺴﺎوي ،(٢ / ١ = ٢ / ١ − ١ﻓﺈن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﻣﺜﻞ ﻫﺬا اﻟﺘﺴﻠﺴﻞ
ﻫﻮ ٦٤ / ١ = ٢ / ١ × ٢ / ١ × ٢ / ١ × ٢ / ١ × ٢ / ١ × ٢ / ١؛ أي ﺗﻘﺮﻳﺒًﺎ ،٠٫٠١٦
وإذا ﻛﺎن اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﻫﻮ ،١٠ / ١ﻓﺈن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ ﻣﺜﻞ ﻫﺬا
اﻟﺘﺴﻠﺴﻞ ﻳﻘﺮب ﻣﻦ ٠٫٠٠٧وﻫﻜﺬا.
ﻫﺪﻓﻨﺎ اﻵن ﻫﻮ ﺗﻘﺪﻳﺮ اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﰲ أي ﻗﺬﻓﺔ ﻣﺴﺘﻘﺒﻠﻴﺔ؛ أي إﻧﻨﺎ
ﻧﺮﻏﺐ ﰲ اﺧﺘﻴﺎر ﻗﻴﻤﺔ واﺣﺪة — ٣ / ١أو ٢ / ١أو ١٠ / ١أو أﻳٍّﺎ ﻣﺎ ﺗﻜﻮن — ﻛﺘﻘﺪﻳﺮ
ﻟﻬﺬا اﻻﺣﺘﻤﺎل .وﻋﻨﺪ اﻟﻨﻈﺮ إﱃ اﻟﺤﺴﺎﺑﺎت اﻟﺴﺎﺑﻘﺔ ،ﻧﺮى أن اﺣﺘﻤﺎل اﻟﺤﺼﻮل ﻋﲆ اﻟﻨﺘﺎﺋﺞ
79
ﻋﻠﻢ اﻹﺣﺼﺎء
املﺮﺻﻮدة ﻟﺴﺖ ﻗﺬﻓﺎت ﻫﻮ ٠٫٠٢٢إذا ﻛﺎن اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ ﻟﻈﻬﻮر وﺟﻪ اﻟﺼﻮرة ﻫﻮ
،٣ / ١ﰲ ﺣني أﻧﻪ ﻻ ﻳﺘﺠﺎوز ٠٫٠١٦إذا ﻛﺎن اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ ﻟﻈﻬﻮر وﺟﻪ اﻟﺼﻮرة
ﻫﻮ ،٢ / ١وﻫﻮ أﻗﻞ ﻣﻦ ذﻟﻚ — ٠٫٠٠٧ﻓﻘﻂ — إذا ﻛﺎن اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ ﻟﻈﻬﻮر
وﺟﻪ اﻟﺼﻮرة ﻫﻮ .١٠ / ١ﻣﺎ ﻳﻌﻨﻴﻪ ﻫﺬا ﻫﻮ أﻧﻪ ﻣﻦ اﻷﻛﺜﺮ ﺗﺮﺟﻴﺤً ﺎ أن ﻧﺤﺼﻞ ﻋﲆ ﻧﺘﺎﺋﺞ
اﻟﻘﺬﻓﺎت اﻟﺴﺖ املﺮﺻﻮدة إذا ﻛﺎن اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ ﻫﻮ ٣ / ١أﻛﺜﺮ ﻣﻤﱠ ﺎ إذا ﻛﺎن ٢ / ١أو
١٠ / ١؛ وﻣﻦ ﺛ َ ﱠﻢ ﻳﺒﺪو ﻣﻦ املﻌﻘﻮل أن ﻧﺨﺘﺎر اﻟﻘﻴﻤﺔ ٣ / ١ﻛﺘﻘﺪﻳﺮ وﺣﻴﺪ ﻻﺣﺘﻤﺎل ﻇﻬﻮر
وﺟﻪ اﻟﺼﻮرة؛ ﻓﻬﺬه ﻫﻲ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻳﺮﺟﺢ أن ﺗﺴﻔﺮ ﻋﻦ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺣﺼﻠﻨﺎ ﻋﻠﻴﻬﺎ
ً
ﻓﻌﻼ.
ﻳﻮﺿﺢ ﻫﺬا املﺜﺎل ﻃﺮﻳﻘﺔ »اﻹﻣﻜﺎﻧﻴﺔ اﻟﻘﺼﻮى« ﻟﻠﺘﻘﺪﻳﺮ؛ إذ ﻧﺨﺘﺎر ﻗﻴﻤﺔ املﻌﻠﻤﺔ
اﻟﺘﻲ ﻟﺪﻳﻬﺎ أﻋﲆ اﺣﺘﻤﺎل ﻹﻧﺘﺎج اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة .ﰲ املﺜﺎل اﻟﺴﺎﺑﻖ ،ﺣﺴﺒﺖ ﻓﻘﻂ ﻫﺬا
اﻻﺣﺘﻤﺎل ﻟﻠﻘِ ﻴَﻢ اﻟﺜﻼث املﺮﺗﺒﻄﺔ ﺑﺎﺣﺘﻤﺎﻟﻴﺔ ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة )،(١٠ / ١ ،٢ / ١ ،٣ / ١
ﺗﺒني اﺣﺘﻤﺎل ﺣﺪوث وﻟﻜﻦ ﻳﻤﻜﻨﻨﺎ ﺟﻮﻫﺮﻳٍّﺎ ﺣﺴﺎﺑﻬﺎ ﻟﺠﻤﻴﻊ اﻟﻘِ ﻴَﻢ املﻤﻜﻨﺔ .واﻟﺪاﻟﺔ اﻟﺘﻲ ﱢ
اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة ﻟﻜﻞ ﺧﻴﺎر ﻣﻤﻜﻦ ﻻﺣﺘﻤﺎﻟﻴﺔ ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ اﺳﻢ
»داﻟﺔ اﻹﻣﻜﺎن« .وﺗﻠﻌﺐ ﻫﺬه اﻟﺪاﻟﺔ دو ًرا ﻣﺤﻮرﻳٍّﺎ ﰲ اﻻﺳﺘﺪﻻل اﻹﺣﺼﺎﺋﻲ.
وﻳﻤﻜﻦ ﺗﻄﺒﻴﻖ املﺒﺪأ ﻧﻔﺴﻪ ﻣﻦ أﺟْ ﻞ اﻟﺤﺼﻮل ﻋﲆ ﺗﻘﺪﻳﺮات ملﻌﻠﻤﺎت اﻟﺘﻮزﻳﻊ
اﻟﻄﺒﻴﻌﻲ ،أو أي ﺗﻮزﻳﻊ آﺧﺮ .ﻓﻨﺤﺴﺐ ﺑﺒﺴﺎﻃﺔ ﻣﺎ ﻳﻤﻜﻦ أن ﻳﻜﻮن اﺣﺘﻤﺎل اﻟﺤﺼﻮل
ﻋﲆ ﻣﺠﻤﻮﻋﺔ ﺑﻴﺎﻧﺎت ﻣﺜﻞ اﻟﺘﻲ ﺣﺪﺛﺖ ﰲ اﻟﻮاﻗﻊ ﺑﺎﻟﻨﺴﺒﺔ ﻟﺨﻴﺎرات اﻟﻘﻴﻢ املﺨﺘﻠﻔﺔ املﺤﺘﻤﻠﺔ
ﻟﻠﻤﻌﻠﻤﺔ .وﻣُﻘﺪر اﻹﻣﻜﺎﻧﻴﺔ اﻟﻘﺼﻮى ﻫﻮ ﻗﻴﻤﺔ املﻌﻠﻤﺔ اﻟﺘﻲ ﺗُﻨﺘﺞ أﻛﱪ اﻻﺣﺘﻤﺎﻻت .ﻻﺣِ ﻆ
أن ﻫﺬه اﻟﻌﻤﻠﻴﺔ ﺗُﻨﺘﺞ ﻗﻴﻤﺔ واﺣﺪة؛ وﻫﻲ ﺗﻘﺪﻳﺮ ﻳﻜﻮن ﻫﻮ اﻷﻓﻀﻞ ﻣﻦ ﻣﻨﻈﻮر اﻹﻣﻜﺎﻧﻴﺔ
اﻟﻘﺼﻮى .وﻷﻧﻬﺎ ﻗﻴﻤﺔ واﺣﺪة ﻓﺤﺴﺐ ،ﻓﺈﻧﻬﺎ ﺗﺴﻤﻰ »ﺗﻘﺪﻳﺮ اﻟﻨﻘﻄﺔ«.
ﺛﻤﺔ ﻃﺮﻳﻘﺔ ﺑﺪﻳﻠﺔ ﻟﻠﺘﻔﻜري ﰲ ﻫﺬا اﻟﻨﻬﺞ ﻟﻠﺘﻘﺪﻳﺮ؛ وﻫﻲ اﻟﻨﻈﺮ ﻟﺪاﻟﺔ اﻹﻣﻜﺎن ﻋﲆ
أﻧﻬﺎ ﻣﻘﻴﺎس ﻟﻠﺘﻮاﻓﻖ ﺑني اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة )اﻟﺘﺴﻠﺴﻞ اﻟﻨﺎﺗﺞ ﻋﻦ ﺳﺖ ﻗﺬﻓﺎت ﻟﻠﻌﻤﻠﺔ(
واﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﻨﺒﱠﺄَت ﺑﻬﺎ ﻧﻈﺮﻳﺘﻨﺎ )ﺣﻴﺚ ﺗﻌﻨﻲ ﻛﻠﻤﺔ »ﻧﻈﺮﻳﺔ« ﻫﻨﺎ اﻟﻘﻴﻤﺔ املﻘﱰﺣﺔ
ﻻﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ٣ / ١ ،أو .(٢ / ١واﺧﺘﻴﺎر اﻟﻨﻈﺮﻳﺔ
)اﺣﺘﻤﺎل ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة( ﻟﺘﺤﻘﻴﻖ أﻗﴡ ﻗﺪر ﻣﻦ اﻟﺘﻮاﻓﻖ — أو ﻋﲆ ﻧﺤﻮ ﻣﻜﺎﻓﺊ،
ﻟﺘﻘﻠﻴﻞ اﻟﺘﻨﺎﻗﺾ — أﻣﺮ ﻣﻌﻘﻮل ﻋﲆ ﻧﺤﻮ واﺿﺢ .واﻟﺘﻔﻜري ﰲ اﻷﻣﺮ ﺑﻬﺬه اﻟﻄﺮﻳﻘﺔ ﻳﺴﻤﺢ
ﻟﻨﺎ ﺑﺎﻟﺘﻌﻤﻴﻢ؛ إذ ﻳﻤﻜﻨﻨﺎ اﻟﺘﻔﻜري ﰲ ﻣﻘﺎﻳﻴﺲ أﺧﺮى ﻟﻠﺘﻨﺎﻗﺾ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ ﻛﺜري
ﻣﻦ اﻟﺤﺎﻻت ،ﻳﺘﻤﺜﻞ ﻣﻘﻴﺎس ﺟﻴﺪ ﻟﻠﺘﻨﺎﻗﺾ ﰲ ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت اﻟﻔﺮوق ﺑني ﻗﻴﻤﺔ املﻌﻠﻤﺔ
80
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
املﻘﱰﺣﺔ وﻗﻴﻢ اﻟﻌﻴﻨﺔ اﻟﻔﺮدﻳﺔ .واﺧﺘﻴﺎر املﻌﻠﻤﺔ ﻟﻠﺤﺪ ﻣﻦ ﻫﺬا املﻘﻴﺎس ﻳﻌﻨﻲ اﻟﺤﺼﻮل ﻋﲆ
»أﻓﻀﻞ« ﺗﻘﺪﻳﺮ ،ﰲ ﺳﻴﺎق أﺻﻐﺮ ﻣﺠﻤﻮع ﻟﻠﻔﺮوق املﺮﺑﻌﺔ .ﰲ اﻟﻮاﻗﻊ ،ﻫﺬه ﻃﺮﻳﻘﺔ ﺷﺎﺋﻌﺔ
ﻟﻠﻐﺎﻳﺔ ﻟﻠﺘﻘﺪﻳﺮ ،وﻳﻄﻠﻖ ﻋﻠﻴﻬﺎ — ﻷﺳﺒﺎب واﺿﺤﺔ — »ﺗﻘﺪﻳﺮ املﺮﺑﻌﺎت اﻟﺼﻐﺮى«.
أﺣﻴﺎﻧًﺎ ﻳﻜﻮن ﻟﺪﻳﻨﺎ أﻓﻜﺎر ﻗﺒﻞ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ﻋﻦ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﻧﺘﻮﻗﻊ أن ﺗﻜﻮن ﻋﻠﻴﻬﺎ
املﻌﻠﻤﺔ .وﻣﺜﻞ ﻫﺬه اﻷﻓﻜﺎر ﻗﺪ ﺗﺄﺗﻲ ﻣﻦ اﻟﺨﱪات أو اﻟﺘﺠﺎرب اﻟﺴﺎﺑﻘﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل،
ﻄﻊ اﻟﻨﻘﺪﻳﺔ ،رﺑﻤﺎ ﻧﻌﺘﻘﺪ أن املﻌﻠﻤﺔ ،pاﻟﺘﻲ ﺗﻌﻄﻲ ﺑﻨﺎءً ﻋﲆ ﺧﱪﺗﻨﺎ اﻟﺴﺎﺑﻘﺔ ﰲ ﻗﺬف اﻟﻘِ َ
اﺣﺘﻤﺎل أن اﻟﻌﻤﻠﺔ املﻘﺬوﻓﺔ ﺳﻮف ﺗﻈﻬﺮ وﺟﻪ اﻟﺼﻮرة ،ﺗﻘﱰب ﻣﻦ ،٢ / ١وأﻧﻪ ﻣﻦ ﻏري
املﺤﺘﻤﻞ ﺟﺪٍّا أن ﺗﻜﻮن ﺑﻌﻴﺪة ﻋﻦ .٢ / ١وﻧﻘﻮل إن ﻟﺪﻳﻨﺎ »ﺗﻮزﻳﻌً ﺎ َﻗﺒﻠﻴٍّﺎ« ﻹﻳﻤﺎﻧﻨﺎ ﺑﺄن
املﻌﻠﻤﺔ املﺠﻬﻮﻟﺔ ﺗﺄﺧﺬ ﻗﻴﻤً ﺎ ﻣﺨﺘﻠﻔﺔ .وﻳﻤﺜﻞ ﻫﺬا اﻟﺘﻮزﻳﻊ إﻳﻤﺎﻧًﺎ ذاﺗﻴٍّﺎ ﺣﻴﺎل ﻗﻴﻤﺔ املﻌﻠﻤﺔ؛
ﻛﻤﺎ ﻫﻲ اﻟﺤﺎل ﻣﻊ اﻟﺘﻔﺴري اﻟﺬاﺗﻲ ﻟﻼﺣﺘﻤﺎل املﺬﻛﻮر ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ .وﰲ ﻣﺜﻞ ﻫﺬه
ﺑﺪﻻ ﻣﻦ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت ﺑﻤﻌﺰل ﻻﺳﺘﺨﺮاج ﺗﻘﺪﻳﺮ ﻟﻘﻴﻤﺔ املﻌﻠﻤﺔ ،ﻣﻦ املﻨﻄﻘﻲ اﻟﺤﺎﻻتً ،
اﻟﺠﻤﻊ ﺑني اﻟﺒﻴﺎﻧﺎت وإﻳﻤﺎﻧﻨﺎ اﻟﺴﺎﺑﻖ ﻻﺳﺘﺨﺮاج »ﺗﻮزﻳﻊ ﺑﻌﺪي« ملﻌﺘﻘﺪاﺗﻨﺎ ﺣﻮل اﻟﻘﻴﻢ
املﺤﺘﻤﻠﺔ ﻟﻠﻤﻌﻠﻤﺔ .وﻫﺬا ﻳﻌﻨﻲ أﻧﻨﺎ ﻧﺒﺪأ ﺑﺘﻮزﻳﻊ ﻳﺼﻒ ﻣﻌﺘﻘﺪاﺗﻨﺎ ﺣﻮل اﻟﻘﻴﻢ املﺤﺘﻤﻠﺔ
وﻓﻘﺎ ملﺎ ﻧﻼﺣﻈﻪ ﰲ اﻟﺒﻴﺎﻧﺎت؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺗﻮزﻳﻌﻨﺎ اﻟﻘﺒﲇ ﻻﺣﺘﻤﺎل ﻟﻠﻤﻌﻠﻤﺔ ،وﻧﻌﺪﱢﻟﻪ ً
أن اﻟﻌﻤﻠﺔ ﺳﺘﻈﻬﺮ وﺟﻪ اﻟﺼﻮرة رﺑﻤﺎ ﻳﻜﻮن ﻣﺮ ﱠﻛ ًﺰا ﻟﻠﻐﺎﻳﺔ ﺣﻮل ﻗﻴﻤﺔ ٢ / ١؛ ﻓﻨﻌﺘﻘﺪ
أﻧﻪ ﻣﻦ املﺤﺘﻤﻞ ﺟﺪٍّا أن ﺗﻘﱰب ﻣﻦ .٢ / ١وﻣﻊ ذﻟﻚ ،إذا ُﻗﺬﻓﺖ اﻟﻌﻤﻠﺔ ﻣﺎﺋﺔ ﻣﺮة ،وﻇﻬﺮ
ﰲ ﺛﻼث ﻣﺮات ﻓﺤﺴﺐ ﻣﻦ أﺻﻞ ﻣﺎﺋﺔ ﻣﺮة وﺟﻪ اﻟﺼﻮرة ،ﻓﺮﺑﻤﺎ ﻧﺮﻏﺐ ﰲ ﺿﺒﻂ ﻫﺬا
اﻟﺘﻮزﻳﻊ؛ ﺑﺤﻴﺚ ﺗﻌﺘﱪ اﻟﻘﻴﻢ اﻷﺻﻐﺮ ﻟﻼﺣﺘﻤﺎل أﻛﺜﺮ ﺗﺮﺟﻴﺤً ﺎ واﻟﻘﻴﻢ اﻷﻗﺮب ﻟﻠﻘﻴﻤﺔ ٢ / ١
أﻗﻞ ﺗﺮﺟﻴﺤً ﺎ.
ﰲ اﻟﻮاﻗﻊ ،ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ — املﺬﻛﻮرة ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ — ﻫﻲ اﻟﺘﻲ ﺗﻤﻜﻨﻨﺎ ﻣﻦ اﻟﺠﻤﻊ
اﻟﻘﺒﻠﻴﺔ واﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة ﻹﻧﺘﺎج املﻌﺘﻘﺪات اﻟﺒﻌﺪﻳﺔ .ﻟﻬﺬا اﻟﺴﺒﺐ ،ﻳﻄﻠﻖ ﺑني املﻌﺘﻘﺪات َ
ﻋﲆ ﻫﺬه اﻟﻄﺮﻳﻘﺔ ﻟﻠﺘﻘﺪﻳﺮ ﻃﺮﻳﻘﺔ »اﻟﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰي« .ﺗﺬﻛﺮ أن ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ ﺗﺮﺑﻂ اﺛﻨني
ﻣﻦ اﻻﺣﺘﻤﺎﻻت اﻟﴩﻃﻴﺔ :اﺣﺘﻤﺎل ﺣﺪوث »أ« ﻧﻈ ًﺮا ﻟﻮﻗﻮع »ب« ،واﺣﺘﻤﺎل ﺣﺪوث »ب«
ٌ
ﻗﻴﻤﺔ ﻧﻈ ًﺮا ﻟﻮﻗﻮع »أ« .ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ،ﻧَﺴﺘﺨﺪم اﻟﻨﻈﺮﻳﺔ ﻟﺮﺑﻂ اﺣﺘﻤﺎل أن املﻌﻠﻤﺔ ﻟﻬﺎ
ﻣﺎ ﻧﻈ ًﺮا ﻟﻠﺒﻴﺎﻧﺎت اﻟﺘﻲ ﻧﻼﺣﻈﻬﺎ ،ﻣﻊ اﺣﺘﻤﺎل ﻣﻼﺣﻈﺔ ﻫﺬه اﻟﺒﻴﺎﻧﺎت ﻧﻈ ًﺮا ﻟﻘﻴﻤﺔ ﻣﻌﻴﻨﺔ
ﻟﻠﻤﻌﻠﻤﺔ .واﻵن ،اﻻﺣﺘﻤﺎل اﻟﺜﺎﻧﻲ ﻣﻦ ﻫﺬﻳﻦ اﻻﺣﺘﻤﺎﻟني — اﺣﺘﻤﺎل ﻣﻼﺣﻈﺔ ﻫﺬه اﻟﺒﻴﺎﻧﺎت
ﻧﻈ ًﺮا ﻟﻘﻴﻤﺔ ﻣﻌﻴﻨﺔ ﻟﻠﻤﻌﻠﻤﺔ — ﻫﻮ ﺑﺒﺴﺎﻃﺔ داﻟﺔ اﻹﻣﻜﺎن؛ وﻣﻦ ﺛ َ ﱠﻢ ﺗَﺴﺘﺨﺪم ﻧﻈﺮﻳﺔ ﺑﺎﻳﺰ
إﻣﻜﺎﻧﻴﺔ اﻟﺒﻴﺎﻧﺎت ﻟﺘﻌﺪﻳﻞ ﻣﻌﺘﻘﺪاﺗﻨﺎ اﻟﻘﺒﻠﻴﺔ ،ﻣﻦ أﺟﻞ إﻧﺘﺎج ﻣﻌﺘﻘﺪاﺗﻨﺎ اﻟﺒﻌﺪﻳﺔ.
81
ﻋﻠﻢ اﻹﺣﺼﺎء
دﻗﻴﻘﺎ — وﻟﻜﻨﻪ ﻣﻬﻢ — ﺑني ﻫﺬه اﻟﻄﺮﻳﻘﺔ واﻟﻄﺮق اﻷﺧﺮى ً ﻻﺣﻆ أن ﻫﻨﺎك ً
ﻓﺮﻗﺎ
ﺳﺎﺑﻘﺎ )اﻟﺘﻲ ﻏﺎﻟﺒًﺎ ﻣﺎ ﻳُﻄ َﻠﻖ ﻋﻠﻴﻬﺎ اﻟﻄﺮق »اﻟﺘﻜﺮارﻳﺔ« أو »اﻟﻜﻼﺳﻴﻜﻴﺔ«(؛ ﺣﻴﺚ ً املﺬﻛﻮرة
إﻧﻨﺎ ﻧﻔﱰض ﻓﻴﻬﺎ أن املﻌﻠﻤﺔ املﺠﻬﻮﻟﺔ ﻟﻬﺎ ﻗﻴﻤﺔ ﺛﺎﺑﺘﺔ وﻟﻜﻨﻬﺎ ﻣﺠﻬﻮﻟﺔ .وﻣﻊ ذﻟﻚ ،ﺑﺎﻟﻨﺴﺒﺔ
ﻟﻠﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰي ،اﻓﱰﺿﻨﺎ أن املﻌﻠﻤﺔ املﺠﻬﻮﻟﺔ ﻟﻬﺎ ﺗﻮزﻳﻊ ﻋﱪ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ املﻤﻜﻨﺔ،
اﻟﻘﺒْﲇ ،ﺛﻢ ﺑﻌﺪ ذﻟﻚ — ﻋﻨﺪ ﺗﺤﺪﻳﺜﻪ ﺑﻮاﺳﻄﺔ املﻌﻠﻮﻣﺎت ﻣﻘﺪم ﰲ اﻟﺒﺪاﻳﺔ ﻣﻦ ﺧﻼل اﻟﺘﻮزﻳﻊ َ
ﰲ اﻟﺒﻴﺎﻧﺎت — ﻣﻦ ﺧﻼل اﻟﺘﻮزﻳﻊ اﻟﺒَﻌْ ﺪي .وﻳﻘﺮ اﻟﺒﺎﺣﺚ ﺑﺄن املﻌﻠﻤﺔ ﻳﻤﻜﻦ أن ﻳﻜﻮن ﻟﻬﺎ
ﻗﻴﻢ ﻣﺨﺘﻠﻔﺔ ،وﻳﺴﺘﺨﺪم اﻟﺘﻮزﻳﻊ اﻻﺣﺘﻤﺎﱄ ﻟﻠﺘﻌﺒري ﻋﻦ ﻣﻌﺘﻘﺪه ﺣﻴﺎل ﻛﻞ ﻗﻴﻤﺔ.
ﻻ ﻳﺨﻠﻮ ﻣﻔﻬﻮم اﻟﺘﻮزﻳﻊ اﻟﻘﺒﲇ ﻣﻦ اﻟﺠﻮاﻧﺐ ا ُملﺜِرية ﻟﻠﺠَ ﺪَل .ﻓﻌَ َﲆ أﻗﻞ ﺗﻘﺪﻳﺮ ،اﻷﺷﺨﺎص
ﱠ
املﺘﻮﻗﻊ أن ﻳﻤﺘﻠﻜﻮا ﺗﻮزﻳﻌﺎت املﺨﺘﻠﻔﻮن ذوو اﻟﺨﱪة اﻟﺴﺎﺑﻘﺔ املﺨﺘﻠﻔﺔ ،رﺑﻤﺎ ﻳﻜﻮن ﻣﻦ
ﻗﺒﻠﻴﺔ ﻣﺨﺘﻠﻔﺔ ،وﻫﺬه اﻟﺘﻮزﻳﻌﺎت ﺳﺘُﺠﻤﻊ ﻣﻊ اﻟﺒﻴﺎﻧﺎت ﻹﻧﺘﺎج ﺗﻮزﻳﻌﺎت ﺑﻌﺪﻳﺔ ﻣﺨﺘﻠﻔﺔ،
ورﺑﻤﺎ اﺳﺘﻨﺘﺎﺟﺎت ﻣﺨﺘﻠﻔﺔ .وﻫﻜﺬا ﺗﻢ اﻟﺘﻀﺤﻴﺔ ﺑﺄي ﺗﻈﺎﻫﺮ ﺑﺎملﻮﺿﻮﻋﻴﺔ .ﻛﻤﺎ ﺗﻮﺟﺪ ً
أﻳﻀﺎ
ﺻﻌﻮﺑﺔ ﻋﻤﻠﻴﺔ؛ ﻓﻔﻲ ﺣني أن ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ اﻟﻄﺒﻴﻌﻲ واملﻌﻠﻤﺔ pﰲ ﺗﻮزﻳﻊ ﺑﺮﻧﻮﱄ ﻟﻬﻤﺎ
ﺗﻔﺴريات واﺿﺤﺔ وﻣﺒﺎﴍة ،ﻓﻠﻴﺴﺖ اﻟﺤﺎل داﺋﻤً ﺎ أن ﺗﻤﺘﻠﻚ ﻣﻌﻠﻤﺎت اﻟﺘﻮزﻳﻌﺎت ﺗﻔﺴريات
واﺿﺤﺔ .وﻳﻤﻜﻦ أن ﻳﻜﻮن أﺣﻴﺎﻧًﺎ ﻣﻦ اﻟﺼﻌﺐ ﻟﻠﻐﺎﻳﺔ اﻟﻮﺻﻮل ﻟﺘﻮزﻳﻌﺎت ﻗﺒﻠﻴﺔ ﻣﻌﻘﻮﻟﺔ
ﺗﻌﻜﺲ ﻣﻌﺮﻓﺘﻨﺎ املﺴﺒﻘﺔ.
ﻋﻨﺪ ﻫﺬه اﻟﻨﻘﻄﺔ ﰲ ﴍﺣﻨﺎ ﻟﻄﺮﻳﻘﺔ اﻟﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰي وﺻﻠﻨﺎ إﱃ اﻟﺘﻮزﻳﻊ اﻟﺒﻌﺪي؛
وﻫﻮ ﺗﻮزﻳﻊ ﻳﻠﺨﺺ اﻋﺘﻘﺎد اﻟﺒﺎﺣﺚ ﺑﺸﺄن ﻛﻞ ﻗﻴﻤﺔ ﺗﺄﺧﺬﻫﺎ املﻌﻠﻤﺔ ﺑﻌﺪ رؤﻳﺔ اﻟﺒﻴﺎﻧﺎت.
وﻳﻤﻜﻨﻨﺎ ،إذا أردﻧﺎ ،ﺗﻘﻠﻴﺺ ﻫﺬا اﻟﺘﻮزﻳﻊ ﺑﺄﻛﻤﻠﻪ ﻟﺘﻘﺪﻳﺮ ﻧﻘﻄﺔ واﺣﺪة ﻋﻦ ﻃﺮﻳﻖ اﺳﺘﺨﺪام
ﻣﻠﺨﺺ إﺣﺼﺎﺋﻲ ﻟﻠﺘﻮزﻳﻊ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ أن ﻧﺴﺘﺨﺪم املﺘﻮﺳﻂ أو املﻨﻮال
اﻟﺨﺎص ﺑﻪ.
ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎﻧﺖ ﻃﺮﻳﻘﺔ ﺗﻘﺪﻳﺮ اﻟﻨﻘﻄﺔ ﻓﻌﺎﻟﺔ أم ﻻ ،وأي ﻣ َُﻘﺪﱢر ﻫﻮ ُ ﻛﻴﻒ ﻳﻤﻜﻨﻨﺎ
اﻷﻓﻀﻞ؟ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺑﻴﻨﻤﺎ ﻗﺪ أﺧﺘﺎر ﺗﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ اﻟﺘﻮزﻳﻊ ﺑﺎﺳﺘﺨﺪام ﻣﺘﻮﺳﻂ
ﻋﻴﻨﺔ ﻣﺄﺧﻮذة ﻣﻦ ﻫﺬا اﻟﺘﻮزﻳﻊ ،ﺛﻤﺔ ﺑﺪﻳﻞ ﻳﺘﻤﺜﻞ ﰲ إﺳﻘﺎط أﻛﱪ اﻟﻘﻴﻢ وأﺻﻐﺮﻫﺎ ﻣﻦ اﻟﻌﻴﻨﺔ
ﺑﺎﻟﻘﺪْر اﻷﻛﱪ ﻣﻦ اﻟﺘﻔﺎوت ﻗﺒﻞ اﺣﺘﺴﺎب املﺘﻮﺳﻂ .وﻋﻤﻮﻣً ﺎ ،ﺗﺘﺴﻢ أﻛﱪ اﻟﻘﻴﻢ وأﺻﻐﺮﻫﺎ َ
ﻣﻦ ﻋﻴﻨﺔ ﻷﺧﺮى؛ ﻟﺬﻟﻚ رﺑﻤﺎ ﻳُﻨﺘﺞ اﻟﺘﻐﺎﴈ ﻋﻨﻬﺎ ﺗﻘﺪﻳ ًﺮا أﻛﺜﺮ ﻣﻮﺛﻮﻗﻴﺔ وأﻗ ﱠﻞ ﺗﻔﺎوﺗًﺎ.
82
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻄﺮﻳﻘﺔ اﻟﺘﻜﺮارﻳﺔ ﻟﻠﺘﻘﺪﻳﺮ ،واﻟﺘﻲ ﺗَﻔﱰض وﺟﻮد ﻗﻴﻤﺔ ﺣﻘﻴﻘﻴﺔ ﺛﺎﺑﺘﺔ —
وﻟﻜﻨﻬﺎ ﻣﺠﻬﻮﻟﺔ — ﻟﻠﻤﻌﻠﻤﺔ اﻟﺠﺎري ﺗﻘﺪﻳﺮﻫﺎ ،ﻧ َ َﻮ ﱡد ﰲ اﻟﺤﺎﻟﺔ املﺜﺎﻟﻴﺔ أن ﻧﻌﺮف أيﱞ ﻣﻦ
ﻫﺎﺗني اﻟﻄﺮﻳﻘﺘني ﺗﻌﻄﻲ ﺗﻘﺪﻳ ًﺮا أﻗﺮب إﱃ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ .وﻟﻸﺳﻒ ،ﺑﻤﺎ أن اﻟﻘﻴﻤﺔ
اﻟﺤﻘﻴﻘﻴﺔ ﻣﺠﻬﻮﻟﺔ )ﺑﻴﺖ اﻟﻘﺼﻴﺪ ﻫﻨﺎ ﻫﻮ ﺗﻘﺪﻳﺮﻫﺎ!( ﻓﻼ ﻳﻤﻜﻦ أﺑﺪًا أن ﻧﻌﺮف اﻹﺟﺎﺑﺔ .ﻣﻦ
ﻧﺘﻮﻗﻊ ﻓﻴﻬﺎ أن ﻧﺎﺣﻴﺔ أﺧﺮى ،ﻣﺎ »ﻳﻤﻜﻨﻨﺎ« أن ﻧﺄﻣﻞ ﰲ أن ﻧﻌﺮﻓﻪ ﻫﻮ ﻋﺪد املﺮات اﻟﺘﻲ ﻗﺪ ﱠ
ﺗﻜﻮن اﻟﻘﻴﻤﺔ املﻘ ﱠﺪ َرة ﻗﺮﻳﺒﺔ ﻣﻦ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ إذا ﺣﺪث أن ﻛﺮرﻧﺎ ﻋﻤﻠﻴﺔ أ َ ْﺧﺬ ﻋﻴﻨﺔ ﻣﻦ
ﻓﻤﻦ اﻟﻘﻴﺎﺳﺎت واﺣﺘﺴﺎب اﻟﺘﻘﺪﻳﺮ .ﻓﺮﻏﻢ ﻛﻞ ﳾء ،ﺑﻤﺎ أن اﻟﻘﻴﻤﺔ املﻘﺪرة ﺗﺴﺘﻨﺪ ﻋﲆ ﻋﻴﻨﺔِ ،
املﺮﺟﱠ ﺢ أن اﻟﻘﻴﻤﺔ املﻘﺪرة ﺳﺘﻜﻮن ﻣﺨﺘﻠﻔﺔ إذا أﺧﺬت ﻋﻴﻨﺔ ﻣﺨﺘﻠﻔﺔ؛ وﻫﺬا ﻳﻌﻨﻲ أن اﻟﺘﻘﺪﻳﺮ
ﰲ ﺣ ﱢﺪ ذاﺗﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ ،ﻳﺨﺘﻠﻒ ﻣﻦ ﻋﻴﻨﺔ ﻟﻌﻴﻨﺔ أﺧﺮى .وﺑﻤﺎ أﻧﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ،
ﻓﺈن ﻟﻪ ﺗﻮزﻳﻌً ﺎ .وإذا ﻋﻠﻤﻨﺎ أن ﻫﺬا اﻟﺘﻮزﻳﻊ ﻣﺘﺠﻤﻊ ﺑﺈﺣﻜﺎم ﺣﻮل اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ،ﻓﺮﺑﻤﺎ
ﻃﺮﻳﻘﺔ ﻣﺎ »ﻋﺎدة«ً ً
ﻃﺮﻳﻘﺔ ﺟﻴﺪ ًة .ﺑﻌﺒﺎرة أﺧﺮى ،إذا ﻛﻨﱠﺎ ﻧﻌﺮف أن َ
ﻃﺮﻳﻘﺔ اﻟﺘﻘﺪﻳ َﺮ ﻧﻌﺘﱪ
ﻣﺎ ﺗُﺴﻔِ ﺮ ﻋﻦ ﺗﻘﺪﻳﺮ ﻳﻜﻮن ﻗﺮﻳﺒًﺎ ﻟﻠﻐﺎﻳﺔ ﻣﻦ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻟﻠﻤﻌﻠﻤﺔ ،ﻓﺮﺑﻤﺎ ﻧﻌﺘﱪﻫﺎ
ُﺨﱪﻧﺎ ﺷﻴﺌًﺎ ﻋﻦ ﺣﺎﻟﺘﻨﺎ املﺤﺪدة ،ﻓﺈﻧﻪ ﺳﻴﻜﻮن ﻟﺪﻳﻨﺎ ﻃﺮﻳﻘﺔ ﺟﻴﺪة ﻟﻠﺘﻘﺪﻳﺮ .وﻣﻊ أن ﻫﺬا ﻻ ﻳ ِ
ً
ﺷﺨﺼﺎ ﻣﺎ ﻳﺘﻨﺒﱠﺄ ﻛﻨﺖ ﻋﲆ ﻋﻠﻢ ﺑﺄنﺛﻘﺔ ﰲ اﻟﻄﺮﻳﻘﺔ ﻋﲆ ﻧﺤﻮ ﻣﱪر .ﻓﻌﲆ أي ﺣﺎل ،إذا َ
ﺗﻨﺒ ًﺆا ﺻﺤﻴﺤً ﺎ ﰲ ٩٩٩ﻣﻦ ﻛﻞ ١٠٠٠ﻣﺮة ،ﻓﺈﻧﻚ ﺑﺎﻟﺘﺄﻛﻴﺪ ﺳﺘَ ِﻤﻴﻞ إﱃ اﻟﻮﺛﻮق ﺑﻪ ﰲ أي
ﺣﺎﻟﺔ ﻣﻌﻴﻨﺔ .أﻧﺖ ﺗﻔﻌﻞ ذﻟﻚ ﻣﻊ ﺳﺎﺋﻘﻲ اﻟﻘﻄﺎرات واﻟﻄﻴﺎرﻳﻦ واملﻄﺎﻋﻢ ،وﻣﺎ إﱃ ذﻟﻚ؛
ﻓﺄﻧﺖ ﺗﻌﺮف أن اﻟﺴﺎﺋﻖ واﻟﻄﻴﺎر ﻧﺎد ًرا ﻣﺎ ﻳﻘﻊ ﰲ ﺣﺎدث ،واملﻄﻌﻢ ﻧﺎد ًرا ﻣﺎ ﻳﻘﺪم ﻃﻌﺎﻣً ﺎ
ﻣﺴﻤﱠ ﻤً ﺎ ،ﻟﺬﻟﻚ ﺗﻜﻮن ﺳﻌﻴﺪًا ﺑﺎملﺨﺎﻃﺮة ﺑﺄﻧﻪ »ﰲ ﻫﺬه املﺮة« ﺳﺘﻜﻮن اﻷﻣﻮر ﻋﲆ ﻣﺎ ﻳﺮام.
ﻃﻮﱢرت ﻋﺪة ﻣﻘﺎﻳﻴﺲ ﻣﺨﺘﻠﻔﺔ ﻟﺘﻘﻴﻴﻢ ﻃﺮق اﻟﺘﻘﺪﻳﺮ اﻟﺘﻜﺮارﻳﺔ ﺑﺎﺳﺘﺨﺪام ﻫﺬا املﺒﺪأُ ،
ُﺨﱪﻧﺎ ﺑﻤﺪى ﺣﺠﻢ اﻟﻔﺎرق ﺑني اﻟﺒﺪﻳﻠﺔ .ﻳﺘﻤﺜﻞ أﺣﺪ ﻫﺬه املﻘﺎﻳﻴﺲ ﰲ »اﻟﺘﺤﻴﺰ« ،وﻫﺬا ﻳ ِ
اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻟﻠﻤﻌﻠﻤﺔ واﻟﻘﻴﻤﺔ املﺘﻮﺳﻄﺔ ﻟﺘﻮزﻳﻊ اﻟﻘﻴﻢ املﻘﺪرة .وﻋﲆ وﺟﻪ اﻟﺘﺤﺪﻳﺪ ،إذا
ﻛﺎن ﻫﺬا اﻟﻔﺎرق ﻳﺴﺎوي ﺻﻔ ًﺮا )أي إذا ﻛﺎن ﻣﺘﻮﺳﻂ ﺗﻮزﻳﻊ اﻟﻘﻴﻢ املﻘﺪرة ﻳﺴﺎوي اﻟﻘﻴﻤﺔ
اﻟﺤﻘﻴﻘﻴﺔ( ،ﻳﻘﺎل إن ا ُملﻘﺪﱢر »ﻏري ﻣﺘﺤﻴﺰ«.
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻧﺴﺒﺔ ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة ﻧﺘﻴﺠﺔ ﻗﺬف اﻟﻌﻤﻠﺔ ﻋﺪة ﻣﺮات ﺗﻜﻮن
ﻣُﻘ ﱢﺪ ًرا ﻏري ﻣﺘﺤﻴﺰ ﻻﺣﺘﻤﺎل أن اﻟﻌﻤﻠﺔ ﺳﺘﺴﺘﻘﺮ ووﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ؛ إذ إن اﻟﻘﻴﻤﺔ
املﺘﻮﺳﻄﺔ ﻟﺘﻮزﻳﻊ ﻫﺬه اﻟﻨﺴﺒﺔ ﰲ اﻟﺘﺠﺎرب املﺘﻜﺮرة ﺗﺴﺎوي اﻻﺣﺘﻤﺎل اﻟﺼﺤﻴﺢ ﻟﻈﻬﻮر
وﺟﻪ اﻟﺼﻮرة .وﻟﻠﺘﻮﺿﻴﺢ ،اﻓﱰض أن اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ ﻻﺳﺘﻘﺮار اﻟﻌﻤﻠﺔ ووﺟﻪ اﻟﺼﻮرة
ﻷﻋﲆ ﻫﻮ ٠٫٥٥؛ وﻫﻮ أﻣﺮ ﻣﺠﻬﻮل ﺑﺎﻟﻨﺴﺒﺔ ﻟﻨﺎ ،وأﻧﻨﺎ ﻗﺬﻓﻨﺎ اﻟﻌﻤﻠﺔ ﻋﴩ ﻣﺮات ،وﻗﺪرﻧﺎ
83
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻫﺬا اﻻﺣﺘﻤﺎل ﻋﻦ ﻃﺮﻳﻖ ﻧﺴﺒﺔ ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة .رﺑﻤﺎ ﺗُﺴﻔِ ﺮ اﻟﻘﺬﻓﺎت اﻟﻌﴩ ﻋﻦ ﺳﺖ
ﻣﺮات ﻟﻈﻬﻮر وﺟﻪ اﻟﺼﻮرة؛ وﻫﻲ ﻧﺴﺒﺔ ﺗﺒﻠﻎ ،٠٫٦أو ﺛﻼث ﻣﺮات؛ وﻫﻲ ﻧﺴﺒﺔ ﺗﺒﻠﻎ ،٠٫٣
أو ﺧﻤﺲ ﻣﺮات؛ وﻫﻲ ﻧﺴﺒﺔ ﺗﺒﻠﻎ ،٠٫٥وﻫﻜﺬا .وﰲ املﺘﻮﺳﻂ )ﻣﺘﻮﺳﻂ ﻳُﺤﺴﺐ ﻣﻦ ﺧﻼل
ﺗﻜﺮارات ﺧﻴﺎﻟﻴﺔ ﻟﻠﻘﺬﻓﺎت اﻟﻌﴩ( ﺳﺘﻜﻮن اﻟﻨﺴﺒﺔ ٠٫٥٥ﻷن ﻧﺴﺒﺔ ﻇﻬﻮر وﺟﻪ اﻟﺼﻮرة
ﻫﻲ ﻣُﻘﺪﱢر ﻏري ﻣﺘﺤﻴﺰ ﻻﺣﺘﻤﺎل أن اﻟﻌﻤﻠﺔ ﺳﻮف ﺗﺴﺘﻘﺮ ووﺟﻪ اﻟﺼﻮرة ﻷﻋﲆ.
وﻋﻤﻮﻣً ﺎ ،املﻘﺪر ذو اﻟﺘﺤﻴﺰ اﻟﻜﺒري ﻟﻦ ﻳُﻨﻈﺮ إﻟﻴﻪ ﻋﲆ ﻧﺤﻮ ﻣﻔﻀﻞ ﻣﺜﻞ املﻘﺪر ﻏري
املﺘﺤﻴﺰ .وﰲ املﺘﻮﺳﻂ ،ﻣﻦ ﺧﻼل ﺗﻜﺮار اﻟﺘﺠﺮﺑﺔ ،ﻓﺈن املﻘﺪر ذا اﻟﺘﺤﻴﺰ اﻟﻜﺒري ﺳﻮف ﻳُﺴﻔِ ﺮ
ﻋﻦ ﻗﻴﻤﺔ ﻣﺨﺘﻠﻔﺔ ﻛﺜريًا ﻋﻦ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ.
آﺧﺮ ﻟﺘﺤﺪﻳﺪ ﺟﻮدة املﻘﺪر ﻫﻮ »ﻣﺘﻮﺳﻂ ﻣﺮﺑﻊ اﻟﺨﻄﺄ«؛ ﻓﺒﺎﻟﻨﺴﺒﺔ ﻷي ﺛﻤﺔ ﻣﻘﻴﺎس َ
ﻗﻴﻤﺔ ﻣﻘﺪﱠرة ﻣﻌﻴﻨﺔ ﻳﻤﻜﻨﻨﺎ — إذا ﻋﺮﻓﻨﺎ ﻗﻴﻤﺔ املﻌﻠﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ — ﺣﺴﺎب ﻣﺮﺑﻊ اﻟﻔﺎرق
)أي »ﻣﺮﺑﻊ اﻟﺨﻄﺄ«( ﺑني اﻟﺘﻘﺪﻳﺮ واﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ .اﻟﱰﺑﻴﻊ ﻣُﻔﻴﺪ ﻟﺴﺒﺐ واﺣﺪ؛ وﻫﻮ أﻧﻪ
ﻳﺠﻌﻞ ﻛﻞ اﻷرﻗﺎم ﻣﻮﺟﺒﺔ .وﺑﻤﺎ أن اﻟﺘﻘﺪﻳﺮ ﻧﻔﺴﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ ﻳﺨﺘﻠﻒ ﻣﻦ ﻋﻴﻨﺔ ﻟﻌﻴﻨﺔ
أﻳﻀﺎ ﻛﺬﻟﻚ .وﺑﻤﺎ أﻧﻪ ﻣﺘﻐري ﻋﺸﻮاﺋﻲ ،ﻓﺈن ﻟﺪﻳﻪ ﺗﻮزﻳﻌً ﺎ، أﺧﺮى ،ﻓﺈن ﻣﺮﺑﻊ اﻟﺨﻄﺄ ﻫﻮ ً
و»ﻣﺘﻮﺳﻂ« ﻣﺮﺑﻊ اﻟﺨﻄﺄ ﺑﺒﺴﺎﻃﺔ ﻫﻮ ﻣﺘﻮﺳﻂ ﻫﺬا اﻟﺘﻮزﻳﻊ .وﻣﺘﻮﺳﻂ ﻣﺮﺑﻊ اﻟﺨﻄﺄ اﻟﺼﻐري
أن — ﰲ املﺘﻮﺳﻂ — ﻣﺮﺑ َﻊ اﻟﻔﺎرق ﺑني اﻟﻘﻴﻤﺔ املﻘﺪﱠرة واﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﺻﻐريٌ .وﻻ ﻳﻌﻨﻲ ﱠ
ﻣﻔﻀﻠﺔ ﻣﺜﻞ ذﻟﻚ ﱠ ﻣﺮﺑﻊ ﺧﻄﺄٍ ﻛﺒريًا ﺑﻨﻈﺮة
ِ ﻳُﻨﻈﺮ إﱃ ا ُملﻘﺪﱢر اﻟﺬي ﻳُﻌ َﺮف أن ﻟﺪﻳﻪ ﻣﺘﻮﺳ َ
ﻂ
ﻣﺮﺑﻊ ﺧﻄﺄٍ ﺻﻐريٌ؛ إذ ﻟﻦ ﻳﺜﻖ املﺮء ﻛﺜريًا ﰲ أن ﻗﻴﻤﺘﻪ ﻗﺮﻳﺒﺔ ﻣﻦ اﻟﻘﻴﻤﺔ
ِ اﻟﺬي ﻟﺪﻳﻪ ﻣﺘﻮﺳ ُ
ﻂ
اﻟﺤﻘﻴﻘﻴﺔ.
84
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
ﻣﻦ اﻟﻘﻴﻢ — أي »ﻓﱰة« — ﻧﺜﻖ ﰲ أﻧﻬﺎ ﺗﺤﺘﻮي ﻋﲆ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ .دﻋﻨﺎ ﻧَﻌُ ْﺪ إﱃ ﺻﻔﻘﺔ
ﺳﺎﺑﻘﺎ ﻟﻠﻮﺻﻮل إﱃ أﻓﻀﻞ ﺗﻘﺪﻳﺮ ً اﻟﻌﴩة/اﻟﺨﻤﺴﺔ ﺟﻨﻴﻬﺎت اﻟﺘﻲ ﻋﺮﺿﻬﺎ ﺻﺪﻳﻘﻲ .ﺳﻌَ ﻴْﻨﺎ
ً
ﻈﻬﺮ وﺟﻪ اﻟﺼﻮرة .ﺑﺪﻻ ﻣﻦ ذﻟﻚ ،ﻳﻤﻜﻦ أن ﻧﺴﻌﻰ وﺣﻴﺪ ﻻﺣﺘﻤﺎل أن ﻗﺬﻓﺔ اﻟﻌﻤﻠﺔ ﺳﺘُ ِ
ﻟﻠﻮﺻﻮل إﱃ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻘﻴﻢ اﻟﺘﻲ ﻧَﺜِﻖ ﰲ أﻧﻬﺎ ﺗﺸﻤﻞ اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ .رﺑﻤﺎ ﻳﻤﻜﻨﻨﺎ
ﻣﺜﻼ .وﻫﺬا أن ﻧﻜﻮن واﺛﻘني ﻟﻠﻐﺎﻳﺔ ﰲ أن اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ ﻳﻜﻤﻦ ﺑني ٤ / ١وً ،٥ / ٢
ﻣﺜﺎل ﻋﲆ »ﺗﻘﺪﻳﺮ اﻟﻔﱰة«.
وﺑﻤﺎ أن اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﻣﺠﻬﻮﻟﺔ ،ﻓﻼ ﻧﺴﺘﻄﻴﻊ أن ﻧﻘﻮل ﻋﲆ وﺟﻪ اﻟﻴﻘني إذا ﻛﺎﻧﺖ
أي ﻓﱰة ﻣﻌﻴﻨﺔ ﺳﻮف ﺗﺸﺘﻤﻞ ﰲ اﻟﻮاﻗﻊ ﻋﲆ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ أم ﻻ .وﻟﻜﻦ ﺗﺨﻴﱠ ْﻞ ﺗﻜﺮار
اﻟﺘﻤﺮﻳﻦ ﻣﺮا ًرا وﺗﻜﺮا ًرا ﺑﺎﺳﺘﺨﺪام ﻋﻴﻨﺎت ﻋﺸﻮاﺋﻴﺔ ﻣﺨﺘﻠﻔﺔ )ﺗﻤﺎﻣً ﺎ ﻛﻤﺎ ﺗﺨﻴﻠﻨﺎ ﻋﻨﺪﻣﺎ ﺣﺪدﻧﺎ
ﻧﺸﺌﺖﺳﺎﺑﻘﺎ( .ﻳﻤﻜﻨﻨﺎ ﺣﺴﺎب ﺗﻘﺪﻳﺮ اﻟﻔﱰة ﻟﻜﻞ ﻋﻴﻨﺔ ﻣﻦ ﻫﺬه اﻟﻌﻴﻨﺎت ،وإذا أ ُ ِ ً اﻟﺘﺤﻴﺰ
اﻟﻔﱰات ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ ،ﻓﻤﻦ املﻤﻜﻦ أن ﻧﻘﻮل إن ﻧﺴﺒﺔ ﻣﻌﻴﻨﺔ ﻣﻦ اﻟﻔﱰات )ﻋﲆ ﺳﺒﻴﻞ
املﺜﺎل ٪٩٥أو ٪٩٩أو ﻣﺎ ﻧﺨﺘﺎر( ﺗﺸﻤﻞ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ املﺠﻬﻮﻟﺔ.
ٍ
ﻣﻌﻴﻨﺔ، ﺑﺎﻟﻌﻮدة إﱃ ﻋﻤﻠﺔ ﺻﺪﻳﻘﻲ ،ﻻ ﻧﺴﺘﻄﻴﻊ أن ﻧﻘﻮل ﻋﲆ وﺟﻪ اﻟﻴﻘني إن أي ﻓﱰ ٍة
ﻣﺤﺴﻮﺑ ٍﺔ ﻷي ﻋﻴﻨﺔ ﺑﻴﺎﻧﺎت ﻣﻌﻴﻨﺔ ،ﺳﺘﺤﺘﻮي ﻋﲆ اﻻﺣﺘﻤﺎل اﻟﺼﺤﻴﺢ ﺑﺄن اﻟﻌﻤﻠﺔ ﺳﻮف
ﺗﻈﻬﺮ وﺟﻪ اﻟﺼﻮرة .وﻟﻜﻦ ﻳﻤﻜﻨﻨﺎ اﻟﻘﻮل إن ) ٪٩٥أو ﻣﺎ ﻧﺨﺘﺎر( ﻣﻦ اﻟﻔﱰات ﺳﺘﺤﺘﻮي
ﻋﲆ اﻻﺣﺘﻤﺎل اﻟﺤﻘﻴﻘﻲ .وﺑﻤﺎ أن ٪٩٥ﻣﻦ اﻟﻔﱰات ﺳﻮف ﺗﺤﺘﻮي ﻋﲆ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ،
ﻓﺈﻧﻨﺎ ﻳﻤﻜﻦ أن ﻧﺜﻖ ﻋﲆ ﻧﺤﻮ ﻛﺒري أن اﻟﻔﱰة اﻟﻮاﺣﺪة اﻟﺘﻲ ﺣﺴﺒﻨﺎﻫﺎ ،اﺳﺘﻨﺎدًا إﱃ اﻟﻌﻴﻨﺔ
ﻓﻌﻼ )ص – ك – ص – ك – ك – ك ﰲ املﺜﺎل( ﺳﺘﺸﻤﻞ اﻟﻘﻴﻤﺔ اﻟﺘﻲ ﺣﺼﻠﻨﺎ ﻋﻠﻴﻬﺎ ً
اﻟﺤﻘﻴﻘﻴﺔ؛ وﻟﻬﺬا اﻟﺴﺒﺐ ،ﺗﺴﻤﻰ ﻫﺬه اﻟﻔﱰات »ﻓﱰات اﻟﺜﻘﺔ«.
ﺑﺎﻟﺘﺤﻮل إﱃ ﻃﺮق اﻟﺘﻘﺪﻳﺮ اﻟﺒﺎﻳﺰي ،رأﻳﻨﺎ أن ﻧﺘﻴﺠﺔ اﻟﺘﺤﻠﻴﻞ اﻟﺒﺎﻳﺰي ﻫﻲ ﺗﻮزﻳﻊ
ﺑَﻌﺪيﱞ ﻛﺎﻣﻞ ﻟﻠﻘﻴﻢ ،وﻫﺬا اﻟﺘﻮزﻳﻊ ﻳﺨﱪﻧﺎ ﺑﻘﻮة اﻋﺘﻘﺎدﻧﺎ ﰲ أن املﻌﻠﻤﺔ ﻟﺪﻳﻬﺎ أي ﻗﻴﻤﺔ ﻣﻌﻴﻨﺔ.
ﻳﻤﻜﻦ أن ﻧﱰك اﻷﻣﻮر ﻋﻨﺪ ﻫﺬا اﻟﺤﺪ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا ﻛﺎن ﻟﻠﺘﻮزﻳﻊ اﻧﺤﺮاف ﻣﻌﻴﺎري
ﺻﻐري ﻓﺈن ﻫﺬا ﻳﻌﻨﻲ أﻧﻨﺎ ﻛﻨﱠﺎ ﻋﲆ ﺛﻘﺔ ﻛﺒرية ﺑﺄن ﻗﻴﻤﺔ املﻌﻠﻤﺔ ﺗﻜﻤﻦ ﰲ ﻧﻄﺎق ﺿﻴﻖ.
ﻟﻜﻦ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ،ﻣﻦ املﺮﻳﺢ ﺗﻠﺨﻴﺺ اﻷﻣﻮر ﺑﻄﺮﻳﻘﺔ ﻣﻤﺎﺛﻠﺔ ﻟﻔﱰات اﻟﺜﻘﺔ أﻋﻼه،
وﺗﻘﺪﻳﻢ ﻓﱰة ﻣﺤﺪدة ﺑﺄﻛﱪ وأﺻﻐﺮ ﻗﻴﻤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ إﻳﺠﺎد ﻓﱰة ﺗﺤﺘﻮي ﻋﲆ
٪٩٥ﻣﻦ املﺴﺎﺣﺔ املﻮﺟﻮدة ﺗﺤﺖ اﻟﺘﻮزﻳﻊ اﻻﺣﺘﻤﺎﱄ اﻟﺒﻌﺪي داﺧﻠﻬﺎ .وﺑﻤﺎ أن اﻟﺘﻮزﻳﻌﺎت
ﻌﻄﻲ اﺣﺘﻤﺎل ﺗﻤﺘﻠﻚ درﺟﺔ ﻣﻦ ﺗﻔﺴري املﻌﺘﻘﺪ ،ﻓﺈن ﻫﺬه اﻟﻔﱰات ﻳﻤﻜﻦ ﺗﻔﺴريﻫﺎ ﻋﲆ أﻧﻬﺎ ﺗُ ِ
أن اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ ﺗﻜﻤﻦ ﰲ داﺧﻠﻬﺎ .وﻟﺘﻤﻴﻴﺰﻫﺎ ﻋﻦ ﻓﱰات اﻟﺜﻘﺔ اﻟﺘﻜﺮارﻳﺔ ،ﺗُﺴﻤﱠ ﻰ ﻫﺬه
اﻟﻔﱰات »ﻓﱰات املﺼﺪاﻗﻴﺔ«.
85
ﻋﻠﻢ اﻹﺣﺼﺎء
) (4اﻻﺧﺘﺒﺎر
ﻳَﺴﺘﺨﺪم اﻹﺣﺼﺎﺋﻴﻮن ﻋﺒﺎرﺗَﻲ» :اﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺔ« و»اﺧﺘﺒﺎر اﻟﺪﻻﻟﺔ« ﻟﻮﺻﻒ ﻋﻤﻠﻴﺘَ ِﻲ
ِ
اﺳﺘﻜﺸﺎف ﻣﺎ إذا ﻛﺎﻧﺖ املﻌﻠﻤﺎت ﰲ اﻟﻨﻤﻮذج ﺗﺄﺧﺬ ﻗﻴﻤً ﺎ ﻣﺤﺪدة أو ﺗﻘﻊ ﰲ ﻧﻄﺎﻗﺎت ﻣﻌﻴﻨﺔ.
ورﺑﻤﺎ ﻳﻌﻨﻲ ذﻟﻚ ﰲ أﺑﺴﻂ ﻣﺴﺘﻮﻳﺎﺗﻪ اﺧﺘﺒﺎر ﻣﻌﻠﻤﺔ واﺣﺪة ﻓﺤﺴﺐ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل،
َ
ﻳﺘﻌﺎﻓﻮْن ﺑﺘﻨﺎول ﻳﻤﻜﻦ أن ﻧﻌﺮف أن ٪٥٠ﻣﻦ املﺮﴇ اﻟﺬﻳﻦ ﻳﻌﺎﻧﻮن ﻣﻦ ﻣﺮض ﻣﻌني
اﻟﻌﻼج املﻌﻴﺎري ،وﻗﺪ ﻧﺨﻤﻦ أن ﺗﻨﺎول ﻋﻼج ﺟﺪﻳﺪ ﻣﻘﱰح ﻳﺸﻔﻲ ٪٨٠ﻣﻦ ﻫﺆﻻء املﺮﴇ.
املﻌﻠﻤﺔ اﻟﻮﺣﻴﺪة اﻟﺘﻲ ﻧﻬﺘﻢ ﺑﺎﺧﺘﺒﺎرﻫﺎ ﻫﻲ ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﻌﻼج اﻟﺠﺪﻳﺪ ،وﺳﻨﻮ ﱡد
ﺑﺪﻻ ﻣﻦ .٪٥٠ أن ﻧﻌﺮف ﻣﺎ إذا ﻛﺎﻧﺖ ً ٪٨٠
ﻣﻦ اﻟﺤﻘﻴﻘﻲ أن اﻟﻨﺎس ﻣﺨﺘﻠﻔﻮن؛ ﻓﻬﻢ ﻳﺨﺘﻠﻔﻮن ﻣﻦ ﺣﻴﺚ اﻟﻌﻤﺮ واﻟﺠﻨﺲ واﻟﻠﻴﺎﻗﺔ
اﻟﺒﺪﻧﻴﺔ وﺷﺪة املﺮض واﻟﻮزن وﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﺷﻴﺎء اﻷﺧﺮى؛ وﻫﺬا ﻳﻌﻨﻲ أﻧﻪ ﺣﺘﻰ ﻋﻨﺪﻣﺎ
اﻟﺠﺮﻋﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﺪواء ﻧﻔﺴﻪ ،ﻓﺈن اﻻﺳﺘﺠﺎﺑﺔ ﺗﺨﺘﻠﻒ؛ َ ﻳﺘﻨﺎول أﺷﺨﺎص ﻣﺘﻤﺎﺛﻠﻮن
ُﺸﻔﻰ اﻟﺒﻌﺾ اﻵﺧﺮ .وﰲ اﻟﻮاﻗﻊ ،ﻣﻦ املﻤﻜﻦ ﻟﻠﻐﺎﻳﺔ أن ﺗﺨﺘﻠﻒ ُﺸﻔﻰ اﻟﺒﻌﺾ وﻻ ﻳ َ ﻓﺮﺑﻤﺎ ﻳ َ
اﺳﺘﺠﺎﺑﺔ املﺮﻳﺾ ﻧﻔﺴﻪ ﰲ اﻷوﻗﺎت املﺨﺘﻠﻔﺔ وﺗﺤﺖ اﻟﻈﺮوف املﺨﺘﻠﻔﺔ .اﻟﻨﻤﻮذج املﻌﻘﻮل
ﻟﻬﺬه اﻟﺤﺎﻟﺔ رﺑﻤﺎ ﻳﺘﻤﺜﻞ ﰲ أن أي ﻣﺮﻳﺾ ﻳﺘﻨﺎول دواءً ﻟﺪﻳﻪ اﺣﺘﻤﺎل p = 0.5ﻟﻠﺸﻔﺎء.
وﰲ ﻣﺜﺎﻟﻨﺎ ،ﻧﻌﻠﻢ أن p = 0.8ﰲ ﻇﻞ اﻟﻌﻼج املﻌﻴﺎري ،وﻧﻈﻦ أن p = 0.8ﰲ ﻇﻞ اﻟﻌﻼج
اﻟﺠﺪﻳﺪ.
ﺸﻔﻰ ﻋﻦ ﻃﺮﻳﻖ اﻟﺪواء اﻟﺠﺪﻳﺪ ،ﻓﺈن ﻣﺎ ﻧﻮ ﱡد ﰲ ﻫﺬه املﺮﺣﻠﺔ ،ملﻌﺮﻓﺔ اﻟﻨﺴﺒﺔ اﻟﺘﻲ ﺗُ َ
اﻟﻘﻴﺎم ﺑﻪ ﻫﻮ إﻋﻄﺎء اﻟﺪواء اﻟﺠﺪﻳﺪ ملﺠﻤﻮﻋﺔ املﺮﴇ ﺑﺄﻛﻤﻠﻬﺎ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ،ﺗﺤﺖ ﻛﻞ
ﺸﻔﻰ .ﻫﺬا ﻣﺴﺘﺤﻴﻞ ﻋﲆ ﻧﺤﻮ واﺿﺢ ،وﻣﺎ ﻳﺘﻌني اﻟﻈﺮوف املﻤﻜﻨﺔ ،وﻧﺮى اﻟﻨﺴﺒﺔ اﻟﺘﻲ ﺗُ َ
ﻋﻠﻴﻨﺎ اﻟﻘﻴﺎم ﺑﻪ ﻫﻮ إﻋﻄﺎء اﻟﺪواء ﻟﻌﻴﻨﺔ ﻣﻦ املﺮﴇ وﺣﺴﺐ ،وﻳﻤﻜﻨﻨﺎ ﺑﻌﺪ ذﻟﻚ ﺣﺴﺎب
ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﰲ اﻟﻌﻴﻨﺔ .ﻟﻸﺳﻒ ،ﺑﻤﺎ أﻧﻨﺎ ﻧﺘﻌﺎﻣﻞ ﻣﻊ ﻋﻴﻨﺔ ﻓﺤﺴﺐ ،وﻟﻴﺲ ﺟﻤﻴﻊ املﺮﴇ،
ﻓﺈن ﻣﺠﺮد ﺣﻘﻴﻘﺔ ﺷﻔﺎء — ٪٨٠ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل — ﻣﻦ اﻟﻌﻴﻨﺔ أو ٪٦٠أو ٪٩٠أو
ﺸﻔﻰ ﰲ ﻣﺠﻤﻮﻋﺔ املﺮﴇ ﺑﺄﻛﻤﻠﻬﺎ .ﻓﺈذا أي ﻧﺴﺒﺔ ،ﻻ ﺗﻌﻨﻲ ﺑﺎﻟﴬورة أن ﻫﺬه اﻟﻨﺴﺒﺔ ﺳﺘُ َ
أﺧﺬﻧﺎ ﻋﻴﻨﺔ ﻣﺨﺘﻠﻔﺔ ،ﻓﺴﻨﺤﺼﻞ ﻋﲆ اﻷرﺟﺢ ﻋﲆ ﻧﺘﻴﺠﺔ ﻣﺨﺘﻠﻔﺔ.
ُﺸﻔﻰ ﻓﻴﻬﺎ ﻋﻤﻮﻣً ﺎ ٪٥٠ﻓﻘﻂ ﻣﻦ املﺮﴇ وﻣﻊ ذﻟﻚ ﻓﺈن اﻟﻌﻴﻨﺔ املﺄﺧﻮذة ﻣﻦ ﻣﺠﻤﻮﻋﺔ ﻳ َ
ﻋﺎد ًة ﻣﺎ ﺗﻜﻮن ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﻓﻴﻬﺎ أﻗﻞ ﻣﻦ اﻟﻌﻴﻨﺔ املﺄﺧﻮذة ﻣﻦ ﻣﺠﻤﻮﻋﺔ ﺗﺒﻠﻎ ﻧﺴﺒﺔ اﻟﺸﻔﺎء
ﻓﻴﻬﺎ ٪٨٠ﻣﻦ املﺮﴇ.
86
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
ﻣﺜﻼ — ﺑﺤﻴﺚ ﻟﻮ ﻻﺣﻈﻨﺎ أن ﻧﺴﺒﺔ اﻟﺸﻔﺎء وﻫﺬا ﻳﻌﻨﻲ أﻧﻨﺎ ﻳﻤﻜﻦ اﺳﺘﺨﺪام ﺣﺪ — ً t
ﰲ اﻟﻌﻴﻨﺔ أﻗﻞ ﻣﻦ tﺳﻮف ﻧﺮﺟﺢ ﻓﺮﺿﻴﺔ ،٪٥٠وإذا ﻻﺣﻈﻨﺎ ﻧﺴﺒﺔ ﺷﻔﺎء ﰲ اﻟﻌﻴﻨﺔ أﻛﱪ
ﻣﻦ ،tﻓﺴﻮف ﻧﺮﺟﺢ ﻓﺮﺿﻴﺔ .٪٨٠وﰲ اﻟﺤﺎﻟﺔ اﻟﺜﺎﻧﻴﺔ ،ﻧﻘﻮل إن إﺣﺼﺎﺋﻴﺎت اﻟﻌﻴﻨﺔ ﺗﻘﻊ
ﰲ »ﻣﻨﻄﻘﺔ اﻟﺮﻓﺾ« أو »املﻨﻄﻘﺔ اﻟﺤﺮﺟﺔ«؛ ﺣﻴﺚ إن ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﻟﻠﻌﻼج املﻌﻴﺎري —
— ٪٥٠ﻗﺪ »رﻓﻀﺖ«.
ﺑﺎﻟﻘﻴﺎم ﺑﺬﻟﻚ ،ﻓﺈﻧﻨﺎ ﻧﺨﺎﻃﺮ ﺑﺎﻟﻮﻗﻮع ﰲ أﺣﺪ ﻧﻮﻋني ﻣﻦ اﻷﺧﻄﺎء؛ ﻓﻘﺪ ﻧﻘﺮر أن اﻟﺪواء
اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٨٠ﻣﻦ املﺮﴇ ﰲ ﻣﺠﻤﻮﻋﺔ املﺮﴇ اﻟﺨﺎﺿﻌني ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﻢ ﰲ ﺣني
أﻧﻪ ﰲ اﻟﺤﻘﻴﻘﺔ ﻳﺸﻔﻲ ٪٥٠ﻓﻘﻂ ،أو ﻗﺪ ﻧﻘﺮر أن اﻟﺪواء اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٥٠ﻣﻦ املﺮﴇ ﰲ
ﻣﺠﻤﻮﻋﺔ املﺮﴇ اﻟﺨﺎﺿﻌني ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﻢ ﰲ ﺣني أﻧﻪ ﰲ واﻗﻊ اﻷﻣﺮ ﻳﺸﻔﻲ .٪٨٠ﺗﺮﺗﱢﺐ
ﻃﺮﻳﻘﺔ ﺗﺴﻤﻰ ﻃﺮﻳﻘﺔ »ﻧﻴﻤﺎن-ﺑريﺳﻮن« ﻻﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺔ اﻷﻣﻮ َر ﺑﺤﻴﺚ ﻳﻜﻮن اﺣﺘﻤﺎل ٌ
ً
ﻣﻌﺮوﻓﺎ ،وﺻﻐريًا ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻟﻴﻌﻄﻴﻨﺎ ﺛﻘﺔ اﻟﻮﻗﻮع ﰲ ﻛﻼ ﻫﺬﻳﻦ اﻟﻨﻮﻋني ﻣﻦ اﻷﺧﻄﺎء
ﰲ اﻟﻨﺘﺎﺋﺞ.
إﻟﻴﻚ ﻛﻴﻔﻴﺔ ﻋﻤﻞ ذﻟﻚ :ﻧﺒﺪأ ﺑﻮﺿﻊ اﻓﱰاض؛ إذ ﻧﻔﱰض أن اﻟﺪواء اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٥٠
ﻓﻘﻂ ﻣﻦ املﺮﴇ ،وﻳﺴﻤﻰ ﻫﺬا اﻻﻓﱰاض »ﻓﺮﺿﻴﺔ اﻟﻌﺪم« .ﺗﻨﺺ ﻓﺮﺿﻴﺔ أﺧﺮى ﺗُﺴﻤﱠ ﻰ
»اﻟﻔﺮﺿﻴﺔ اﻟﺒﺪﻳﻠﺔ« ﻋﲆ أن اﻟﺪواء اﻟﺠﺪﻳﺪ ﻳﺸﻔﻲ ٪٨٠ﻣﻦ املﺮﴇ .ﺑﺎﺳﺘﺨﺪام ﺣﺴﺎﺑﺎت
اﻻﺣﺘﻤﺎل اﻷﺳﺎﺳﻴﺔ ﻧﺘﻤﻜﻦ ﻣﻦ ﻣﻌﺮﻓﺔ ﻧﺴﺒﺔ اﻟﻌﻴﻨﺎت اﻟﺘﻲ ﺳﻮف ﺗُﻈﻬﺮ ﻧﺴﺒﺔ ﺷﻔﺎء —
ﻋﻦ ﻃﺮﻳﻖ املﺼﺎدﻓﺔ — أﻛﱪ ﻣﻦ أي tﻣﺨﺘﺎرة ،إذا ﻛﺎن اﻓﱰاض ) ٪٥٠ﻓﺮﺿﻴﺔ اﻟﻌﺪم(
ﺣﻘﻴﻘﻴٍّﺎ .وﻋﺎدة ﻣﺎ ﺗُﺨﺘﺎر tﺑﺤﻴﺚ إﻧﻪ إذا ﻛﺎﻧﺖ ﻓﺮﺿﻴﺔ اﻟﻌﺪم ﺣﻘﻴﻘﻴﺔ ،ﻓﺈن ٪٥أو ٪١
ﻓﻘﻂ ﻣﻦ املﺮات ﺗﺘﺠﺎوز ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﰲ اﻟﻌﻴﻨﺔ .t
ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ،ﻋﻨﺪﻣﺎ ﺗﻜﻮن ﻓﺮﺿﻴﺔ اﻟﻌﺪم ﺣﻘﻴﻘﻴﺔ )أي إذا ﻛﺎن ٪٥٠ﻓﻘﻂ ﻣﻦ
املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ ﺳﻴُﺸﻔﻰ( وﺣﺼﻠﻨﺎ ﰲ اﻟﻮاﻗﻊ ﻋﲆ ﻧﺴﺒﺔ ﺷﻔﺎء ﰲ
اﻟﻌﻴﻨﺔ أﻛﱪ ﻣﻦ — tﻣﻤﺎ ﻳﺆدي ﺑﻨﺎ إﱃ اﺗﺨﺎذ ﻗﺮار ﻟﺼﺎﻟﺢ ﻧﺴﺒﺔ اﻟﺸﻔﺎء اﻟﻜﲇ اﻟﺒﺎﻟﻐﺔ ٪٨٠
— ﻓﺮﺑﻤﺎ ﻧﻜﻮن واﻗﻌني ﰲ اﻟﻨﻮع اﻷول ﻣﻦ اﻷﺧﻄﺎء املﺬﻛﻮرة ً
آﻧﻔﺎ )وﻫﻮ ﻣﺎ ﻳﺴﻤﻰ ﺗﻘﻠﻴﺪﻳٍّﺎ
»ﺧﻄﺄ ﻣﻦ اﻟﻨﻮع اﻷول«( .وﻋﺎدة ﻣﺎ ﻳﺴﺘﺨﺪم اﻟﺮﻣﺰ ∝ ﻟﺘﻤﺜﻴﻞ اﺣﺘﻤﺎل ﺣﺪوث ﺧﻄﺄ ﻣﻦ
اﻟﻨﻮع اﻷول .وﻳﻌﻨﻲ اﺧﺘﻴﺎرﻧﺎ ﻟﻘﻴﻤﺔ tﰲ املﺜﺎل أن ∝ ﺛﺎﺑﺘﺔ ﻟﺪﻳﻨﺎ ﻋﻨﺪ ٠٫٠٥أو ٠٫٠١أو
أي ﻗﻴﻤﺔ ﻧﺨﺘﺎرﻫﺎ.
إذا ﻻﺣﻈﻨﺎ ﻧﺴﺒﺔ ﺷﻔﺎء ﰲ اﻟﻌﻴﻨﺔ أﻛﱪ ﻣﻦ ،tﺣﻴﻨﻬﺎ إﻣﺎ أن ﺗﻜﻮن ﻓﺮﺿﻴﺔ اﻟﻌﺪم
ﺣﺪث ذو اﺣﺘﻤﺎل ﺿﻌﻴﻒ )ﻣﻌﺪل ٌ ﺣﻘﻴﻘﻴﺔ )اﻟﻨﺴﺒﺔ اﻟﺤﻘﻴﻘﻴﺔ اﻟﺒﺎﻟﻐﺔ ،(٪٥٠وﻳﻜﻮن
87
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﻌﻴﻨﺔ أﻋﲆ ﻣﻦ ،tﻳﺤﺪث ﺑﺎﺣﺘﻤﺎل ∝( ﻗﺪ وﻗﻊ ،أو ﺗﻜﻮن ﻓﺮﺿﻴﺔ اﻟﻌﺪم ﻏري ﺣﻘﻴﻘﻴﺔ.
ﻫﺬان ﻫﻤﺎ اﻻﺣﺘﻤﺎﻻن اﻟﻮﺣﻴﺪان املﻤﻜﻨﺎن ،وﻫﺬا ﻫﻮ ﺟﻮﻫﺮ ﻃﺮﻳﻘﺔ ﻧﻴﻤﺎن-ﺑريﺳﻮن ﻻﺧﺘﺒﺎر
اﻟﻔﺮﺿﻴﺔ؛ ﻓﻌﻦ ﻃﺮﻳﻖ اﺧﺘﻴﺎر tﺑﺤﻴﺚ ﻳﻜﻮن ∝ ﺻﻐريًا ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ )وﻳﻌﺘﻘﺪ ﻋﻤﻮﻣً ﺎ
أن ٠٫٠٥و ٠٫٠١ﺻﻐريان ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ( ،ﻧﺸﻌﺮ ﻋﲆ ﻧﺤﻮ ﻣﻌﻘﻮل ﺑﺎﻟﺜﻘﺔ ﻋﻨﺪ اﻹﺷﺎرة
إﱃ أن ﻓﺮﺿﻴﺔ اﻟﻌﺪم ﻟﻴﺴﺖ ﺣﻘﻴﻘﻴﺔ؛ ﻷﻧﻪ ﻟﻮ ﻛﺎﻧﺖ ﺣﻘﻴﻘﺔ ﻟﻮﻗﻊ ﺣﺪث ﻏري ﻣﺮﺟﺢ.
أﻣﺎ اﻟﻨﻮع اﻟﺜﺎﻧﻲ ﻣﻦ اﻷﺧﻄﺎء )ﻳﺴﻤﻰ ﺑﻄﺒﻴﻌﺔ اﻟﺤﺎل »ﺧﻄﺄ ﻣﻦ اﻟﻨﻮع اﻟﺜﺎﻧﻲ«(
ﻓﻴﻨﺸﺄ ﻋﻨﺪﻣﺎ ﺗﻜﻮن اﻟﻔﺮﺿﻴﺔ اﻟﺒﺪﻳﻠﺔ ﺣﻘﻴﻘﻴﺔ )ﻧﺴﺒﺔ ٪٨٠ﰲ املﺜﺎل( ،وﻟﻜﻦ ﻧﺴﺒﺔ اﻟﺸﻔﺎء
املﺮﺻﻮدة ﰲ اﻟﻌﻴﻨﺔ أﻗﻞ ﻣﻦ .tﺑﻤﺎ أﻧﻨﺎ اﺧﱰﻧﺎ tﻟﻠﺴﻴﻄﺮة ﻋﲆ اﺣﺘﻤﺎل اﻟﻮﻗﻮع ﰲ اﻟﺨﻄﺄ
أﻳﻀﺎ ﻟﻠﺴﻴﻄﺮة ﻋﲆ اﺣﺘﻤﺎل اﻟﻮﻗﻮع ﰲ اﻟﺨﻄﺄ ﻣﻦ ﻣﻦ اﻟﻨﻮع اﻷول ،ﻻ ﻳﻤﻜﻨﻨﺎ أن ﻧﺨﺘﺎر ً t
اﻟﻨﻮع اﻟﺜﺎﻧﻲ .وﻣﻊ ذﻟﻚ ،ﻳﻤﻜﻨﻨﺎ أن ﻧﺠﻌﻞ اﺣﺘﻤﺎل اﻟﻮﻗﻮع ﰲ اﻟﺨﻄﺄ ﻣﻦ اﻟﻨﻮع اﻟﺜﺎﻧﻲ
ﺻﻐريًا ﻛﻤﺎ ﻧﺸﺎء ﻋﻦ ﻃﺮﻳﻖ أﺧﺬ ﻋﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻳﻜﻔﻲ .وﻫﺬا ﻣﺮة أﺧﺮى ﻫﻮ ﺗﺄﺛري
ﻗﺎﻧﻮن اﻷﻋﺪاد اﻟﻜﺒرية؛ ﻓﺰﻳﺎدة ﺣﺠﻢ اﻟﻌﻴﻨﺔ ﻳﻘﻠﻞ ﻣﻦ ﻧﻄﺎق اﻟﺘﻔﺎوت ﰲ ﺗﻘﺪﻳﺮ اﻟﻌﻴﻨﺔ؛
وﻣﻦ ﺛ َ ﱠﻢ ﻳﻘﻠﻞ ﻣﻦ اﺣﺘﻤﺎل أن ﻳﻜﻮن ﺗﻘﺪﻳﺮ اﻟﻌﻴﻨﺔ أﻗﻞ ﻣﻦ tﻋﻨﺪﻣﺎ ﺗﻜﻮن اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ
ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ أﻋﲆ؛ أي ﻋﻨﺪ ﻗﻴﻤﺔ .٪٨٠وﺑﺎﻟﺘﺤﺪﻳﺪ ،ﻣﻦ ﺧﻼل
ﺟﻌﻞ اﻟﻌﻴﻨﺔ ﻛﺒرية ﺑﻤﺎ ﻳﻜﻔﻲ ﻳﻤﻜﻨﻨﺎ أن ﻧﻘ ﱢﻠﻞ ِﻣﻦ اﺣﺘﻤﺎل ﺣﺪوث اﻟﺨﻄﺄ ﻣﻦ اﻟﻨﻮع اﻟﺜﺎﻧﻲ
ﻣﻨﺎﺳﺒﺔ .ﻋﺎدة ﻣﺎ ﻳُﺴﺘﺨﺪَم اﻟﺮﻣﺰ βﻟﺘﻤﺜﻴﻞ اﺣﺘﻤﺎل ﺣﺪوث اﻟﺨﻄﺄ ﻣﻦ ِ إﱃ أي ﻗﻴﻤﺔ ﻧﺮاﻫﺎ
اﻟﻨﻮع اﻟﺜﺎﻧﻲ ،وﻳﺴﺘﺨﺪم ﻣﺼﻄﻠﺢ »اﻟﻘﻮة« ﻟﺘﻤﺜﻴﻞ 1 − β؛ وﻫﻮ اﺣﺘﻤﺎل اﺧﺘﻴﺎر اﻟﻔﺮﺿﻴﺔ
اﻟﺒﺪﻳﻠﺔ ﻋﻨﺪﻣﺎ ﺗﻜﻮن ﺣﻘﻴﻘﻴﺔ.
إن ﻣﻮﻗﻒ اﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺎت املﺬﻛﻮر ﻫﻨﺎ ﻳﺸﺒﻪ املﻮﻗﻒ ﰲ املﺤﻜﻤﺔ ،ﺣﻴﺚ ﻳُﻔﱰض
ﰲ اﻟﺒﺪاﻳﺔ أن املﺘﻬﻢ ﺑﺮيء )ﻓﺮﺿﻴﺔ اﻟﻌﺪم( ،وﻫﻨﺎ ﻳﻜﻮن ﻣﻦ املﻤﻜﻦ ﺣﺪوث ﻧﻮﻋني ﻣﻦ
اﻷﺧﻄﺎء :اﻟﺤﻜﻢ ﻋﲆ ﺷﺨﺺ ﺑﺮيء ﺑﺄﻧﻪ ﻣﺬﻧﺐ )اﻟﻨﻮع اﻷول( أو اﻟﺤﻜﻢ ﻋﲆ ﺷﺨﺺ ﻣﺬﻧﺐ
ﺑﺄﻧﻪ ﺑﺮيء )اﻟﻨﻮع اﻟﺜﺎﻧﻲ(.
ﻻﺣﻆ أن اﻟﻔﺮﺿﻴﺘني ﺗﺪﺧﻼن ﰲ ﻃﺮﻳﻘﺔ ﻧﻴﻤﺎن-ﺑريﺳﻮن ﻻﺧﺘﺒﺎر اﻟﻔﺮﺿﻴﺔ :ﻓﺮﺿﻴﺔ
اﻟﻌﺪم واﻟﻔﺮﺿﻴﺔ اﻟﺒﺪﻳﻠﺔ .ﰲ »اﺧﺘﺒﺎر اﻟﺪﻻﻟﺔ« ،ﺗﺨﻀﻊ ﻓﺮﺿﻴﺔ اﻟﻌﺪم ﻓﻘﻂ ﻟﻼﺧﺘﺒﺎر؛
ﻓﺎﻟﻬﺪف ﻫﻮ »رﻓﺾ« ﻓﺮﺿﻴﺔ اﻟﻌﺪم إذا ﻛﺎﻧﺖ اﻟﻘﻴﻤﺔ اﻹﺣﺼﺎﺋﻴﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻼﺧﺘﺒﺎر
ﺗﻮﻗﻌﻪ ﰲﻣﺨﺘﻠﻔﺔ ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻋﻤﱠ ﺎ ﻳﻤﻜﻦ ﱡ
ً )ﻧﺴﺒﺔ اﻟﺸﻔﺎء ﰲ اﻟﻌﻴﻨﺔ ﰲ املﺜﺎل اﻟﺴﺎﺑﻖ(
ﻇﻞ ﻓﺮﺿﻴﺔ اﻟﻌﺪم ،أو »اﻟﻔﺸﻞ ﰲ رﻓﻀﻬﺎ« إذا ﻟﻢ ﺗﻜﻦ اﻟﻘﻴﻤﺔ ﻣﺘﻄﺮﻓﺔ ﻟﻠﻐﺎﻳﺔ .ﻓﻼ ﺗﻮﺟﺪ
أي ﻓﺮﺿﻴﺔ ﺑﺪﻳﻠﺔ ﻣﺬﻛﻮرة ﺑﻮﺿﻮح .وﻳﺴﺘﺨﺪم املﺼﻄﻠﺢ »ﻗﻴﻤﺔ «pﻟﻮﺻﻒ اﺣﺘﻤﺎل أن
88
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
ﻧﺮﺻﺪ ﻗﻴﻤﺔ إﺣﺼﺎﺋﻴﺔ ﺧﺎﺿﻌﺔ ﻟﻼﺧﺘﺒﺎر ﻣﺘﻄﺮﻓﺔ ﻣﺜﻞ ﺗﻠﻚ املﺮﺻﻮدة ﰲ اﻟﻮاﻗﻊ ،أو أﻛﺜﺮ
ﺗﻄﺮﻓﺎ إذا ﻛﺎﻧﺖ ﻓﺮﺿﻴﺔ اﻟﻌﺪم ﺣﻘﻴﻘﻴﺔ. ً
وُﺿﻌﺖ ﻓﻜﺮﺗﺎ ﻓﺮﺿﻴﺔ اﻟﻌﺪم واﺧﺘﺒﺎر اﻟﺪﻻﻟﺔ ﻣﻦ أﺟﻞ ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ املﺸﺎﻛﻞ،
وﺳﻤﱢ ﻴﺖ ﰲ ﻛﺜري ﻣﻦ اﻷﺣﻴﺎن ﺑﺎﺳﻢ أﺣﺪ ﻣﻄﻮﱢرﻳﻬﺎ اﻷﺻﻠﻴني ﻃﻮﱢرت ُﻓﺜﻤﺔ اﺧﺘﺒﺎرات ﻣﻌﻴﻨﺔ ُ
)ﻣﺜﻞ اﺧﺘﺒﺎر واﻟﺪ ،واﺧﺘﺒﺎر ﻣﺎن وﻳﺘﻨﻲ( ،أو ُﺳﻤﱢ ﻴﺖ ﺗﻴﻤﱡ ﻨًﺎ ﺑﺘﻮزﻳﻊ اﻹﺣﺼﺎﺋﻴﺔ املﻌﻨﻴﺔ
اﻟﺨﺎﺿﻌﺔ ﻟﻼﺧﺘﺒﺎر )ﻣﺜﻞ اﺧﺘﺒﺎر ،tواﺧﺘﺒﺎر ﻣﺮﺑﻊ ﻛﺎي(.
وﺗُﻌَ ﱡﺪ اﺧﺘﺒﺎرات اﻟﻔﺮﺿﻴﺎت اﻟﺒﺎﻳﺰﻳﺔ — ﻇﺎﻫﺮﻳٍّﺎ ﻋﲆ اﻷﻗﻞ — أﻛﺜﺮ وﺿﻮﺣً ﺎ؛ ﻓﻮ َْﻓ َﻖ
ﻣﱪﻫﻨﺔ ﺑﺎﻳﺰ ،ﻟﺪﻳﻨﺎ اﺣﺘﻤﺎﻻت ﺑَﻌﺪﻳﺔ ﺑﺄن ﻛﻞ ﻓﺮﺿﻴﺔ ﺣﻘﻴﻘﻴﺔ؛ وﻣﻦ ﺛﻢ ﻧﺴﺘﻄﻴﻊ اﺳﺘﺨﺪاﻣﻬﺎ
ﻻﺧﺘﻴﺎر إﺣﺪى اﻟﻔﺮﺿﻴﺎت .وﰲ املﻤﺎرﺳﺔ اﻟﻌﻤﻠﻴﺔ ،ﻓﺈن اﻷﻣﻮر ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ﺗﻜﻮن أﻛﺜﺮ
ﺗﻌﻘﻴﺪًا.
89
ﻋﻠﻢ اﻹﺣﺼﺎء
90
اﻟﺘﻘﺪﻳﺮ واﻻﺳﺘﺪﻻل
أﺧﺬ ﻋﻴﻨﺎت ﻣﺘﻜﺮرة« )ﻳﻨﺒﻐﻲ ﺗﻘﻴﻴﻢ اﻹﺟﺮاءات اﻹﺣﺼﺎﺋﻴﺔ ﻋﲆ أﺳﺎس ﻛﻴﻒ ﺳﺘﺘﴫف »ﰲ
ﻃﺒﻘﺖ ﻋﲆ اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻌﻴﻨﺎت املﺘﻜﺮرة( ،و»ﻣﺒﺪأ اﻟﻜﻔﺎﻳﺔ« )املﻌﻨﻲ ﺑﺘﻠﺨﻴﺺ املﺘﻮﺳﻂ« إذا ُ
اﻟﺒﻴﺎﻧﺎت ﺑﺤﻴﺚ ﻳﺘﻢ إﺑﻘﺎء ﻣﻌﻠﻮﻣﺎت ﻛﺎﻓﻴﺔ ﻟﺘﻘﺪﻳﺮ أي ﻣﻌﻠﻤﺔ( .ﻳﺒﺪو ﻛﻞ ﻣﺒﺪأ ﻣﻦ ﻫﺬه
ﻣﻌﻘﻮﻻ ﺗﻤﺎﻣً ﺎ ،وﻟﻜﻨﻬﺎ رﺑﻤﺎ ﺗﺘﻌﺎرض أﺣﻴﺎﻧًﺎ.
ً املﺒﺎدئ
ﻛﺎﻧﺖ اﻷﺳﺎﻟﻴﺐ اﻟﺘﻜﺮارﻳﺔ اﻟﻜﻼﺳﻴﻜﻴﺔ ﻟﺴﻨﻮات ﻋﺪﻳﺪة ﻫﻲ اﻟﻄﺮق اﻷﻛﺜﺮ اﺳﺘﺨﺪاﻣً ﺎ
وﻟﻜﻦ اﻛﺘﺴﺒﺖ اﻷﺳﺎﻟﻴﺐ اﻟﺒﺎﻳﺰﻳﺔ ﺷﻌﺒﻴﺔ ﻛﺒرية ﰲ اﻟﺴﻨﻮات اﻷﺧرية .ﻛﺎن ِ ﰲ اﻻﺳﺘﺪﻻل،
ﻓﻀﻼً ﻫﺬا ﻧﺘﻴﺠﺔ ﻣﺒﺎﴍة ﻟﺘﻄﻮﻳﺮ أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ اﻟﻘﻮﻳﺔ وأﺳﺎﻟﻴﺐ اﻟﺤﻮﺳﺒﺔ اﻟﺬﻛﻴﺔ،
ﻋﻦ اﻟﱰوﻳﺞ ﺑﺤﻤﺎس ملﺜﻞ ﻫﺬه اﻷﺳﺎﻟﻴﺐ ﻣﻦ ﻗِ ﺒَﻞ ﻣﺆﻳﺪﻳﻬﺎ؛ ﻓﺎﻟﻌﻠﻮم ﺗُﻤﺎ َرس ﰲ ﺳﻴﺎق
اﺟﺘﻤﺎﻋﻲ ،واﻟﺠﻮاﻧﺐ اﻹﻧﺴﺎﻧﻴﺔ املﺘﻌﻠﻘﺔ ﺑﻜﻴﻔﻴﺔ اﻧﺘﺸﺎر وﺗﺮاﺟﻊ ﻫﻴﻤﻨﺔ اﻷﻓﻜﺎر املﺨﺘﻠﻔﺔ
ﻟﻼﺳﺘﺪﻻل ﻋﲆ ﻣﺪى اﻟﻌﻘﻮد اﻟﻘﻠﻴﻠﺔ املﺎﺿﻴﺔ ﺗُﻌﺪ ﻗﺼﺔ راﺋﻌﺔ.
أوﺿﺤﺖ ﰲ ﻫﺬا اﻟﻔﺼﻞ أن ﻫﻨﺎك ﺟﻮاﻧﺐ ﻣﺨﺘﻠﻔﺔ ُ ﺛﻤﺔ ﻧﻘﻄﺔ أﺧرية؛ آﻣﻞ أن أﻛﻮن ﻗﺪ
ﻟﻼﺳﺘﺪﻻل .وﺗﺤﺪﻳﺪًا ،رﺑﻤﺎ ﻧﻜﻮن ﻣﻬﺘﻤﱢ ني ﺑﻤﺤﺎوﻟﺔ اﻟﻌﺜﻮر ﻋﲆ إﺟﺎﺑﺎت ﻷﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ
اﻷﺳﺌﻠﺔ .وﺗﺸﺘﻤﻞ ﻫﺬه اﻷﺳﺌﻠﺔ ﻋﲆ أﺳﺌﻠﺔ ﻣﺜﻞِ :ﺑ َﻢ ﺗﺨﱪﻧﻲ اﻟﺒﻴﺎﻧﺎت؟ وﻣﺎذا ﻳﻨﺒﻐﻲ ﻋﲇ ﱠ
أن أُوﻣ َِﻦ ﺑﻪ؟ وﻣﺎذا ﻳﻨﺒﻐﻲ أن أﻓﻌﻞ؟ وﻣﺎ إﱃ ذﻟﻚ .وﺗﺘﻼءم ﻃﺮق اﻻﺳﺘﺪﻻل املﺨﺘﻠﻔﺔ ﻣﻊ
اﻷﻧﻮاع املﺨﺘﻠﻔﺔ ﻣﻦ اﻷﺳﺌﻠﺔ.
91
اﻟﻔﺼﻞ اﻟﺴﺎدس
اﺳﺘﺨﺪﻣﺖ اﻟﺘﻌﺒري »ﻧﻤﻮذج إﺣﺼﺎﺋﻲ« ﰲ أﻣﺎﻛﻦ ﻣﺨﺘﻠﻔﺔ ﰲ ﻫﺬا اﻟﻜﺘﺎب ﺣﺘﻰ اﻵن دونُ
ﺗﺤﺪﻳﺪ ﻣﺎ أﻋﻨﻴﻪ .اﻟﻨﻤﻮذج اﻹﺣﺼﺎﺋﻲ ﻫﻮ ﺗﻤﺜﻴﻞ أو وﺻﻒ ﺑﺴﻴﻂ ﻟﴚء أو ﻧﻈﺎم ﻳﺨﻀﻊ
ﻟﻠﺪراﺳﺔ .ورﺑﻤﺎ ﻳﻨﻄﻮي اﻟﻨﻤﻮذج اﻟﺒﺴﻴﻂ ﻟﻠﻐﺎﻳﺔ ﻋﲆ ﺟﺎﻧﺐ واﺣﺪ ﻓﺤﺴﺐ ﻣﻦ اﻟﻄﺒﻴﻌﺔ.
وﰲ اﻟﻮاﻗﻊ ،رأﻳﻨﺎ أﻣﺜﻠﺔ ﻋﲆ ذﻟﻚ ﰲ اﻟﻔﺼﻞ اﻟﺮاﺑﻊ ﻋﻨﺪﻣﺎ ﺗﻨﺎوﻟﻨﺎ ﺗﻮزﻳﻌﺎت املﺘﻐريات
ﱠ
ﻣﻔﺼﻠﺔ ﻟﻠﻐﺎﻳﺔ؛ إذ رﺑﻤﺎ املﻔﺮدة .وﻋﻤﻮﻣً ﺎ ،ﻳﻤﻜﻦ ﺑﺎﻟﻔﻌﻞ أن ﺗﻜﻮن اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ
ﺗﺤﺘﻮي ﻋﲆ آﻻف املﺘﻐريات املﺮﺗﺒﻄﺔ ﺑﻄﺮق ﻣﻌﻘﺪة ﻟﻠﻐﺎﻳﺔ .وﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﺳﻮف
ﻳﺴﺘﺨﺪم اﻻﻗﺘﺼﺎدﻳﻮن اﻟﺬﻳﻦ ﻳﺤﺎوﻟﻮن ﺗﻮﺟﻴﻪ ﻗﺮارات أي ﺑﻨﻚ ﻣﺮﻛﺰي ﻣﺜﻞ ﻫﺬه اﻟﻨﻤﺎذج
اﻟﻜﺒرية.
ﺛﻤﺔ ﻣﻨﻈﻮر ﻣﻬ ﱞﻢ ﻓﻴﻤﺎ ﻳﺨﺺ اﻟﻨﻤﺎذج ﻳﺘﻤﺜﻞ ﰲ اﻟﺘﺴﺎؤل ﻣﺎ إذا ﻛﺎﻧﺖ ﻫﺬه اﻟﻨﻤﺎذج
ﺗﻤﺜﻞ اﻟﻮاﻗﻊ اﻷﺳﺎﳼ ﻋﲆ ﻧﺤﻮ ﺻﺤﻴﺢ؛ أي ﻣﺎ إذا ﻛﺎﻧﺖ »ﺣﻘﻴﻘﻴﺔ« أم ﻻ .ﰲ اﻟﻮاﻗﻊ ،ﻫﺬا
ً
ﺳﺎﺑﻘﺎ ﰲ ﻫﺬا اﻟﻜﺘﺎب ﻋﻨﺪﻣﺎ ﺳﺄﻟﻨﺎ ﻣﺎ إذا ﻛﺎﻧﺖ ﻗﻴﻤﺔ املﻌﻠﻤﺔ ﻫﻮ املﻨﻈﻮر اﻟﺬي اﺗﺨﺬﻧﺎه
املﻘﱰﺣﺔ ﻫﻲ اﻟﻘﻴﻤﺔ اﻟﺤﻘﻴﻘﻴﺔ أم ﻻ .وﻣﻊ ذﻟﻚ ،ﻳﻘﺮ املﻨﻈﻮر اﻷﻛﺜﺮ ﺗﻄﻮ ًرا أﻧﻪ ﻻ ﻳﻮﺟﺪ
ﻧﻤﻮذج — إﺣﺼﺎﺋﻲ أو ﻏري ذﻟﻚ — ﻳﻤﻜﻦ أن ﻳﺄﺧﺬ ﰲ اﻻﻋﺘﺒﺎر ﻛﻞ اﻟﺘﺄﺛريات واﻟﻌﻼﻗﺎت
ﻋﻠﻢ اﻹﺣﺼﺎء
املﻤﻜﻨﺔ ﰲ اﻟﻌﺎﻟﻢ اﻟﺤﻘﻴﻘﻲ .وﻫﺬا املﻨﻈﻮر ﻫﻮ اﻟﺬي دﻓﻊ اﻹﺣﺼﺎﺋﻲ اﻟﺒﺎرز ﺟﻮرج ﺑﻮﻛﺲ
ﻟﻠﺘﺄﻛﻴﺪ ﻋﲆ أن »ﺟﻤﻴﻊ اﻟﻨﻤﺎذج ﺧﺎﻃﺌﺔ ،وإن ﻛﺎن ﺑﻌﻀﻬﺎ ﻣﻔﻴﺪًا «.إﻧﻨﺎ ﻧﺒﻨﻲ ﻧﻤﺎذج ﻟﺴﺒﺐ؛
وﻫﻮ ﻣﺴﺎﻋﺪﺗﻨﺎ ﰲ اﻟﻔﻬﻢ واﻟﺘﻨﺒﺆ واﺗﺨﺎذ اﻟﻘﺮار ،وﻣﺎ إﱃ ذﻟﻚ .ورﻏﻢ أﻧﻨﺎ ﻧﺪرك أن ﻧﻤﺎذﺟﻨﺎ
ﻄﺎ ﴐورﻳٍّﺎ ﻟﻠﺘﻌﻘﻴﺪ اﻟﺮﻫﻴﺐ ﻟﻠﻌﺎﻟﻢ ،ﻓﺈﻧﻨﺎ إذا ﻣﺎ اﺧﱰﻧﺎﻫﺎ ﺟﻴﺪًا ﻓﺴﻮف ﺗﻤﻜﻨﻨﺎ ﺗﻤﺜﻞ ﺗﺒﺴﻴ ً
ﻣﻦ اﻟﻘﻴﺎم ﺑﻬﺬه اﻷﻣﻮر .أﻣﺎ إذا اﺧﱰﻧﺎﻫﺎ ﻋﲆ ﻧﺤﻮ ﺳﻴﺊ ،ﻓﻠﻦ ﻧﻔﻬﻢ ،وﺳﻮف ﺗُﺨﻔِ ﻖ
ﺗﻮﻗﻌﺎﺗﻨﺎ ،وﺳﻮف ﺗﺆدي ﻗﺮاراﺗﻨﺎ إﱃ أﺧﻄﺎء؛ إذن ،ﻫﺪﻓﻨﺎ ﻫﻮ ﺑﻨﺎء ﻧﻤﺎذج ﺟﻴﺪة ﺑﻤﺎ ﻓﻴﻪ ﱡ
اﻟﻜﻔﺎﻳﺔ ﻟﺘﺤﻘﻴﻖ ﻏﺮﺿﻨﺎ.
وﻳﻤﻜﻦ ﺗﻘﺴﻴﻢ اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ ﻋﲆ ﻧﺤﻮ ﻣﻼﺋﻢ إﱃ ﻧﻮﻋَ ْني ،ﻳُﺴﻤﱠ ﻴَﺎن ﻏﺎﻟﺒًﺎ »اﻟﻨﻤﺎذج
اﻵﻟﻴﺔ« و»اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ« .ﻳَﺴﺘَﻨِﺪ اﻟﻨﻤﻮذج اﻵﱄ ﻋﲆ ﺑﻌﺾ اﻟﻨﻈﺮﻳﺎت اﻷﺳﺎﺳﻴﺔ اﻟﺼﻠﺒﺔ
ﻧﻈﺮﻳﺔ ﻣﺎ ﰲ اﻟﻔﻴﺰﻳﺎء ﻛﻴﻒ أن ٌ ﺨﱪﻧﺎ ﻟﻜﻴﻔﻴﺔ ارﺗﺒﺎط اﻷﺷﻴﺎء؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﺗُ ِ
ﴎﻋﺔ ﺳﻘﻮط اﻷﺟﺴﺎم ﺗﺰﻳﺪ ﻣﻊ زﻳﺎدة اﻟﺰﻣﻦ اﻟﺬي ﺗﻘﻊ ﻓﻴﻪ .أو رﺑﻤﺎ ﺗﺨﱪﻧﺎ ﻧﻈﺮﻳﺔ أﺧﺮى
ﺣﻮل ﻛﻴﻔﻴﺔ اﻧﺘﺸﺎر اﻟﻌﻘﺎﻗري ﰲ أﻧﺤﺎء اﻟﺠﺴﻢ .ﰲ ﻛﻠﺘﺎ ﻫﺎﺗني اﻟﺤﺎﻟﺘني ،ﺳﻮف ﺗﺴﺘﻨﺪ
اﻟﻨﻤﺎذج إﱃ ﻧﻈﺮﻳﺎت ﺣﻮل ﻛﻴﻔﻴﺔ ﻋﻤﻞ اﻷﺷﻴﺎء ﻓﻌﻠﻴٍّﺎ؛ ﰲ اﻟﻮاﻗﻊ ،ﺳﻮف ﺗﺴﺘﻨﺪ اﻟﻨﻤﺎذج ﻋﲆ
ﻒ ﻫﺬه اﻟﻨﻈﺮﻳﺎت ،واﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﻧﺠﻤﻌﻬﺎ ﻟﺘﻘﻴﻴﻢ ﻧﻤﺎذﺟﻨﺎ املﻌﺎدﻻت اﻟﺮﻳﺎﺿﻴﺔ اﻟﺘﻲ ﺗَ ِﺼ ُ
ﺳﻮف ﺗﻜﻮن ﻗِ ﻴَﻢ املﺘﻐريات املﺴﺘﺨﺪﻣﺔ ﰲ ﻫﺬه اﻟﻨﻈﺮﻳﺎت ،ﻣﺜﻞ اﻟﴪﻋﺔ واﻟﺰﻣﻦ )ﰲ ﺣﺎﻟﺔ
ﺳﻘﻮط اﻟﴚء( واﻟﱰﻛﻴﺰ واﻟﺰﻣﻦ )ﰲ ﺣﺎﻟﺔ اﻧﺘﺸﺎر اﻟﻌﻘﺎﻗري(؛ وﻣﻦ ﺛ َ ﱠﻢ اﻟﻨﻤﺎذج اﻵﻟﻴﺔ ﻫﻲ
ﻣﺒﺎﴍة ﻟﻮﺻﻒ اﻟﻨﻈﺮﻳﺎت. ِ ﻃﺮق رﻳﺎﺿﻴﺔ
ﰲ املﻘﺎﺑﻞ ،اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ ﻫﻲ ﻣﺠﺮد ﻣﺤﺎوﻻت ﻟﺘﻮﻓري ﻣﻠﺨﺼﺎت ﻣﻼﺋﻤﺔ ﻟﻠﺠﻮاﻧﺐ
املﻬﻤﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة .ﻗﺪ ﻻ ﻳﻜﻮن ﻟﺪﻳﻨﺎ أي ﻧﻈﺮﻳﺔ ﺗﻘﻮل إن اﻷﺟﺴﺎم اﻟﺴﺎﻗﻄﺔ
ﺗﺰﻳﺪ ﴎﻋﺘﻬﺎ ﻣﻊ ﻣﺮور اﻟﺰﻣﻦ ،وﻟﻜﻨﻨﺎ ﻗﺪ ﻧﻼﺣﻆ وﺟﻮد ﻋﻼﻗﺔ ﺑني اﻟﺰﻣﻦ واﻟﴪﻋﺔ ،وﻋﲆ
أﺳﺎس ﻫﺬا ،ﻧُﺨﻤﱢ ﻦ وﺟﻮد ﻋﻼﻗﺔ ﻃﺮدﻳﺔ .وإذا ﻟﻢ ﻳﻮﺟﺪ أي ﻗﺎﻋﺪة ﻧﻈﺮﻳﺔ أﺳﺎﺳﻴﺔ ﻟﻬﺬه
اﻟﻌﻼﻗﺔ املﻘﱰﺣﺔ ،ﻓﺈن اﻟﻨﻤﻮذج ﻳﻜﻮن ﻧﻤﻮذﺟً ﺎ ﺗﺠﺮﻳﺒﻴٍّﺎ.
اﻟﻨﻤﺎذج اﻵﻟﻴﺔ واﺳﻌﺔ اﻻﻧﺘﺸﺎر ﰲ اﻟﻌﻠﻮم اﻟﻔﻴﺰﻳﺎﺋﻴﺔ وﰲ ﻣﺠﺎﻻت ﻣﺜﻞ اﻟﻬﻨﺪﺳﺔ ،ﻓﻴﻤﺎ
ﺗﻤﻴﻞ اﻟﻌﻠﻮم اﻻﺟﺘﻤﺎﻋﻴﺔ واﻟﺴﻠﻮﻛﻴﺔ إﱃ اﻻﺳﺘﻔﺎدة ﻋﲆ ﻧﺤﻮ أﻛﱪ ﻣﻦ اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ.
وﻣﻊ ذﻟﻚ ﻓﻤﻦ اﻟﻮاﺿﺢ وﺟﻮد ﺗﺪاﺧﻞ ﻛﺒري؛ إذ إن ﻃﺒﻴﻌﺔ اﻟﻨﻤﻮذج ﺗﻌﺘﻤﺪ ﻋﲆ ﻣﺎ ﻳﺠﺮي
ﻧَﻤْ ﺬﺟﺘﻪ وﻣﺪى ﺳﻬﻮﻟﺔ ﻓﻬﻤﻪ؛ ﻓﺎﻻﻗﺘﺼﺎد — اﻟﺬي ﻳُﻌَ ﱡﺪ ﻋﻠﻤً ﺎ اﺟﺘﻤﺎﻋﻴٍّﺎ — ﻣﲇء ﺑﺎﻟﻨﻤﺎذج
املﻌﺘﻤﺪة ﻋﲆ ﻧﻈﺮﻳﺎت ﺣﻮل ﻛﻴﻔﻴﺔ ارﺗﺒﺎط اﻟﻌﻮاﻣﻞ اﻻﻗﺘﺼﺎدﻳﺔ .وﻋﻤﻮﻣً ﺎ ،رﺑﻤﺎ ﻣﻦ ِ اﻵﻟﻴﺔ
اﻹﻧﺼﺎف اﻟﻘﻮل إﻧﻪ ﰲ املﺮاﺣﻞ اﻷوﻟﻴﺔ ﻻﺳﺘﻜﺸﺎف ﻇﺎﻫﺮ ٍة ﻣﺎ ،ﻓﺈن اﻟﻨﻤﺎذج اﻟﺘﺠﺮﻳﺒﻴﺔ
94
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﺗﻜﻮن أﻛﺜﺮ ﺷﻴﻮﻋً ﺎ؛ إذ إن املﺮء ﻳﺒﺤﺚ ﻋﻦ اﻻﺗﺴﺎق واﻷﻧﻤﺎط ﰲ ﻣﺠﻤﻮﻋﺔ املﻼﺣﻈﺎت .وﰲ
ﻣﺮاﺣﻞ ﻻﺣﻘﺔ ،ﻋﻨﺪﻣﺎ ﻳﻜﻮن اﻟﻔﻬﻢ ﻗﺪ ازداد ،ﺗُﺼ ِﺒﺢ اﻟﻨﻤﺎذج اﻵﻟﻴﺔ أﻛﺜﺮ أﻫﻤﻴﺔ .وﻋﲆ أي
ﺣﺎل ،ﻛﻤﺎ ﺗﻮﺿﺢ ﻧﻤﺎذﺟﻨﺎ ﻟﻸﺟﺴﺎم اﻟﺴﺎﻗﻄﺔ ،ﻳﻤﻜﻦ ﺑﻨﺎء ﻧﻤﻮذج ﻣﻌني ﻋﲆ أﻧﻪ ﻧﻤﻮذج
ﺗﺠﺮﻳﺒﻲ ﺛﻢ ﻳﺼﺒﺢ آﻟﻴٍّﺎ ﻋﻨﺪﻣﺎ ﻳﺰداد ﻓﻬﻤﻨﺎ ﻟﻠﻈﺎﻫﺮة.
أﺣﻴﺎﻧًﺎ ﻣﺎ ﻳﻜﻮن ﻣﻦ املﻔﻴﺪ اﻟﺘﻤﻴﻴﺰ ﺑني ﻣﺨﺘﻠﻒ اﻻﺳﺘﺨﺪاﻣﺎت املﻤﻜﻨﺔ ﻟﻠﻨﻤﺎذج
اﻹﺣﺼﺎﺋﻴﺔ .أﺣﺪ أﻣﺜﻠﺔ ﻫﺬا اﻟﺘﻤﻴﻴﺰ ﻳﻜﻮن ﺑني »اﻻﺳﺘﻜﺸﺎف« و»اﻟﺘﺄﻛﻴﺪ«؛ ﻓﻔﻲ اﻻﺳﺘﻜﺸﺎف،
ﻧﺒﺤﺚ ﻋﻦ اﻟﻌﻼﻗﺎت أو اﻷﻧﻤﺎط؛ ﺑﻴﻨﻤﺎ ﰲ اﻟﺘﺄﻛﻴﺪ ،ﻧﻬﺪف إﱃ ﻣﻌﺮﻓﺔ ﻣﺎ إذا ﻛﺎﻧﺖ اﻟﺒﻴﺎﻧﺎت
ﺗﺪﻋﻢ ﺗﻔﺴريًا ﻣﻘﱰﺣً ﺎ أم ﻻ؛ ﻟﺬﻟﻚ ،ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ دراﺳﺔ اﺳﺘﻜﺸﺎﻓﻴﺔ رﺑﻤﺎ ﻧﺒﺤﺚ
ً
وﺛﻴﻘﺎ .ﻓﺮﺑﻤﺎ ﻳﺄﺧﺬ ﻣﺘﻐري واﺣﺪ ﻗﻴﻤﺔ ﻋﺎﻟﻴﺔ ﻛﻠﻤﺎ ﻋﻦ املﺘﻐريات اﻟﺘﻲ ﺗﺮﺗﺒﻂ ﻣﻌً ﺎ ارﺗﺒﺎ ً
ﻃﺎ
ﻓﻌﻞ ذﻟﻚ ﻣﺘﻐري آﺧﺮ ،أو رﺑﻤﺎ ﺗﺄﺧﺬ ﻣﺠﻤﻮﻋﺎت ﻣﻦ املﺘﻐريات ﻗﻴﻤً ﺎ ﻣﺘﺸﺎﺑﻬﺔ ﺟﺪٍّا ﻣﻊ
أﺷﻴﺎء ﻣﺨﺘﻠﻔﺔ ،وﻣﺎ إﱃ ذﻟﻚ .ﻣﻦ ﻧﺎﺣﻴﺔ أﺧﺮى ،رﺑﻤﺎ ﻧﺴﺘﺨﺪم اﻟﺒﻴﺎﻧﺎت ﰲ اﻟﺪراﺳﺎت
اﻟﺘﺄﻛﻴﺪﻳﺔ ﻟﺘﻘﺪﻳﺮ ﻣﻌﻠﻤﺎت ﻧﻤﻮذج إﺣﺼﺎﺋﻲ ﻣﻘﱰح وإﺟﺮاء اﺧﺘﺒﺎر إﺣﺼﺎﺋﻲ ملﻌﺮﻓﺔ ﻣﺎ إذا
أﺻﺒﺤﺖ اﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔِ ﻛﺎن اﻟﺘﻘﺪﻳﺮ ﻗﺮﻳﺒًﺎ ﺑﻤﺎ ﻓﻴﻪ اﻟﻜﻔﺎﻳﺔ ﻣﻤﱠ ﺎ ﺗﻮﻗﻌﺘْﻪ ﻧﻈﺮﻳﺘﻨﺎ.
ﻻﺳﺘﻜﺸﺎف اﻟﺒﻴﺎﻧﺎت ذات أﻫﻤﻴﺔ ﻣﺘﺰاﻳﺪة ﰲ اﻟﺴﻨﻮات اﻷﺧرية ،ﻣﻊ ﺗﺮاﻛﻢ ﻣﺠﻤﻮﻋﺎت ﻣﻦ
اﻟﺒﻴﺎﻧﺎت أﻛﱪ وأﻛﱪ .وﻳﻨﻄﺒﻖ ﻫﺬا ﻋﲆ اﻟﺘﻄﺒﻴﻘﺎت اﻟﻌﻠﻤﻴﺔ )ﻣﺜﻞ ﻓﻴﺰﻳﺎء اﻟﺠﺴﻴﻤﺎت وﻋﻠﻢ
اﻟﻔﻠﻚ( ،وﻛﺬﻟﻚ اﻟﺘﻄﺒﻴﻘﺎت اﻟﺘﺠﺎرﻳﺔ )ﻣﺜﻞ ﻗﻮاﻋﺪ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﺤﺘﻮي ﻋﲆ ﺗﻔﺎﺻﻴﻞ
املﺸﱰﻳﺎت ﻣﻦ املﺘﺎﺟﺮ ،أو املﻜﺎملﺎت اﻟﻬﺎﺗﻔﻴﺔ ،أو ﺑﻴﺎﻧﺎت ﺗﺪﻓﻖ اﻟﻨﻘﺮ ﻋﲆ اﻹﻧﱰﻧﺖ(.
ﺛﻤﺔ ﺗﻤﻴﻴﺰ آﺧﺮ ﻣﻬﻢ ﰲ اﻟﻨﻤﺬﺟﺔ اﻹﺣﺼﺎﺋﻴﺔ ﺑني »اﻟﻮﺻﻒ« و»اﻟﺘﻨﺒﺆ«؛ ﻓﻌﻨﺪ وﺻﻒ
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﻳﺘﻤﺜﻞ اﻟﻬﺪف ﰲ ﺗﻠﺨﻴﺼﻬﺎ ﺑﻄﺮﻳﻘﺔ ﻣﺮﻳﺤﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،إذا
ﻛﺎﻧﺖ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ﺗﺘﻜﻮن ﻣﻦ ﻣﻼﺣﻈﺎت ﻟﻌﴩة ﻣﺘﻐريات )اﻟﻄﻮل واﻟﻮزن واﻟﺰﻣﻦ
املﺴﺘﻐﺮق ﰲ اﻟﺘﻮﺟﻪ ﻟﻠﻌﻤﻞ ،وﻣﺎ إﱃ ذﻟﻚ( ﻟﻜﻞ ﺷﺨﺺ ﻣﻦ ﻣﻠﻴﻮن ﺷﺨﺺ ،ﻓﺴﻨﺤﺘﺎج ﻟﻜﻲ
ﻧﺒﺪأ ﰲ ﻓﻬﻤﻬﺎ إﱃ ﺗﻘﻠﻴﻞ ﺣﺠﻤﻬﺎ إﱃ ﺣﺠﻢ ﻣﻌﻘﻮل؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﻜﻨﻨﺎ ﺗﻠﺨﻴﺼﻬﺎ ﻣﻦ
ﺧﻼل املﺘﻮﺳﻂ اﻟﺤﺴﺎﺑﻲ واﻻﻧﺤﺮاﻓﺎت املﻌﻴﺎرﻳﺔ ﻟﻜﻞ ﻣﺘﻐري ،وﻛﺬﻟﻚ ﻋﻦ ﻃﺮﻳﻖ ﻗﻴﺎﺳﺎت
ﻣﺪى ﺗﺮاﺑﻄﻬﺎ .ﺣﻴﻨﻬﺎ ﺳﻴﻜﻮن ﻟﺪﻳﻨﺎ ﺑﻌﺾ اﻷﻣﻞ ﰲ ﻓﻬْ ِﻢ ﻣﺎ ﻳﺠﺮي ﺣﻴﺚ إﻧﻨﺎ وﺻﻔﻨﺎ
اﻟﺨﺼﺎﺋﺺ اﻟﻌﺎﻣﺔ ﻟﻠﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ ﻣﺮﻳﺢ .وﺑﺎﻹﺷﺎرة إﱃ ﻫﺬا ،ﻛﻤﺎ رأﻳﻨﺎ ﰲ اﻟﻔﺼﻞ
اﻟﺜﺎﻧﻲ ،ﻓﺈن ﻫﺬه املﻠﺨﺼﺎت اﻟﻮﺻﻔﻴﺔ ﻻ ﺗﺨﻠﻮ ﻣﻦ املﺨﺎﻃﺮ .ﻓﺈﻧﻬﺎ ،ﺑﺤﻜﻢ ﻃﺒﻴﻌﺘﻬﺎ ،ﺗﺒﺴﻂ
أن وﺻﻔﻨﺎ املﻮﺟﺰ اﻟﺘﻌﻘﻴﺪ اﻟﻬﺎﺋﻞ ملﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت ﺑﺄﻛﻤﻠﻬﺎ؛ ﻟﺬﻟﻚ ﻳﺠﺐ أن ﻧﻨﺘﺒﻪ ﻻﺣﺘﻤﺎل ﱠ
َ
ﺣﻘﻴﻘﺔ أﻏﻔﻞ ﺷﻴﺌًﺎ ﻣﻬﻤٍّ ﺎ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻓﺸﻞ ﻧﻤﻮذﺟﻨﺎ ﰲ اﻟﻮﺿﻊ ﰲ اﻻﻋﺘﺒﺎر
95
ﻋﻠﻢ اﻹﺣﺼﺎء
وﺟﻮد ﻣﺠﻤﻮﻋﺘَني وراﺛﻴﺘني ﻣﺘﻤﻴﺰﺗني ﰲ املﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ؛ ﻟﺬﻟﻚ ﻳﻠﺰم
ً
ﺗﻔﺼﻴﻼ ﻟﺘﻤﺜﻴﻞ ذﻟﻚ. وﺟﻮد ﻧﻤﻮذج أﻛﺜﺮ
أﻣﺎ ﻫﺪﻓﻨﺎ ﰲ اﻟﺘﻨﺒﺆ ﻓﻬﻮ اﺳﺘﺨﺪام ﺑﻌﺾ املﺘﻐريات ﻟﻠﺘﻨﺒﺆ ﺑﻘﻴﻢ ﻣﺘﻐريات أﺧﺮى؛ ﻋﲆ
ﺗﺒني ﺗﻔﺎﺻﻴﻞ اﻟﻨﻈﺎم اﻟﻐﺬاﺋﻲ ﺳﺒﻴﻞ املﺜﺎل ،ﻗﺪ ﻳﻜﻮن ﻟﺪﻳﻨﺎ ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﱢ
ﰲ اﻟﻄﻔﻮﻟﺔ ﻟﻌﻴﻨﺔ ﻣﻦ اﻷﺷﺨﺎص وﻃﻮﻟﻬﻢ ﺑﻌﺪ اﻟﺒﻠﻮغ .ﻳﻤﻜﻨﻨﺎ ﺑﺎﺳﺘﺨﺪام ﻫﺬه اﻟﺒﻴﺎﻧﺎت
ﺑﻨﺎء ﻧﻤﻮذج ﻳﺮﺑﻂ اﻟﻄﻮل ﺑﻌﺪ اﻟﺒﻠﻮغ ﺑﺎﻟﻨﻈﺎم اﻟﻐﺬاﺋﻲ ﰲ اﻟﻄﻔﻮﻟﺔ ،ﺛﻢ ﻧﺴﺘﺨﺪم اﻟﻨﻤﻮذج
ﻟﻠﺘﻨﺒﺆ ﺑﺎﻟﻄﻮل املﺴﺘﻘﺒﲇ املﺤﺘﻤﻞ ﻟﻄﻔﻞ ﻳﺘﺒﻊ ﻧﻈﺎﻣً ﺎ ﻏﺬاﺋﻴٍّﺎ ﻣﻌﻴﻨًﺎ .ﻻﺣﻆ أن ﺟﺎﻧﺒًﺎ أﺳﺎﺳﻴٍّﺎ
ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﻻز ٌم ﻟﻬﺬه اﻟﻨﻤﺎذج؛ إذ إﻧﻨﺎ ﻧﺤﺘﺎج ﻟﻘِ ﻴَ ٍﻢ ﻟﻜ ﱟﻞ ﻣﻦ املﺘﻐريات املﺘﻨﺒﱢﺌﺔ واملﺘﻐري
املﺘﻨﺒﱠﺄ ﺑﻪ ﻣﻦ ﻋﻴﻨﺘﻨﺎ .وﺳﻮف ﻳﺘﻀﺢ أن ﻫﺬا ﺗﻤﻴﻴﺰ ﻣﻬﻢ ﺟﺪٍّا ﺑني اﻟﻨﻤﺎذج اﻟﺘﻨﺒﱡﺌﻴﺔ واﻟﻨﻤﺎذج
اﻟﻮﺻﻔﻴﺔ ،ﻛﻤﺎ ﺳﻨﺮى ﻓﻴﻤﺎ ﻳﲇ:
وﻣﺮة أﺧﺮى ،ﻟﻴﺲ اﻟﺘﻤﻴﻴﺰ واﺿﺤً ﺎ داﺋﻤً ﺎ وﺿﻮح اﻟﺸﻤﺲ ،ﻓﺮﺑﻤﺎ ﻧﻜﻮن ﺑﺒﺴﺎﻃﺔ
ﻣﻬﺘﻤﱢ ني ﺑﻮﺻﻒ اﻟﻌﻼﻗﺔ ﺑني اﻟﻨﻈﺎم اﻟﻐﺬاﺋﻲ ﰲ اﻟﻄﻔﻮﻟﺔ واﻟﻄﻮل ﺑﻌﺪ اﻟﺒﻠﻮغ ،ﻣﻊ ﻋﺪم
وﺟﻮد ﻧﻴﺔ ﻻﺳﺘﺨﺪام اﻟﻨﻤﻮذج ﻟﻠﺘﻨﺒﺆ ﺑﺄﺣﺪﻫﻤﺎ ﻋﻦ ﻃﺮﻳﻖ اﻵﺧﺮ.
ﻳﻮﺟﺪ ﻧﻮع آﺧﺮ ﻣﻬﻢ ﻣﻦ اﻟﺘﻨﺒﺆ ﻫﻮ »اﻟﺘﻮﻗﻊ« ،وﻓﻴﻪ ﻧﺴﺘﺨﺪم ﺑﻴﺎﻧﺎت ﻣﻦ املﺎﴈ
ﻟﺒﻨﺎء ﻧﻤﻮذج ﻳﻤﻜﻦ اﺳﺘﺨﺪاﻣﻪ ﻛﺄﺳﺎس ﻟﻠﺘﻨﺒﺆ ﺑﺎﻟﻘﻴﻢ املﺤﺘﻤﻠﺔ ملﻼﺣﻈﺎت ﻟﻢ ﺗُﺮﺻﺪ ﺑﻌﺪُ؛
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻧﻔﺤﺺ اﻟﻨﻤﻂ اﻟﺸﻬﺮي ملﺒﻴﻌﺎت أﺟﻬﺰة اﻟﺘﻠﻔﺎز ﻋﲆ ﻣﺪى اﻟﺴﻨﻮات
ﺗﻮﻗﻊﻧﺰﻋﺔ املﺒﻴﻌﺎت واﻟﺘﻔﺎوت املﻮﺳﻤﻲ ﻣﻦ أﺟْ ﻞ ﱡ َ اﻟﺨﻤﺲ املﺎﺿﻴﺔ ،وﻧﻘﺪﱢر اﺳﺘﻘﺮاﺋﻴٍّﺎ
ا َمل ِﺒﻴﻌﺎت املﺤﺘﻤﻠﺔ ﺧﻼل اﻻﺛﻨﻲ ﻋﴩ ﺷﻬ ًﺮا اﻟﺘﺎﻟﻴﺔ.
أﻳﻀﺎ .ﺗﻌﺮﻓﻨﺎ ﴎﻳﻌً ﺎ ﻋﲆ دورﻫﺎ ﰲ اﺗﺨﺎذ ﻟﻠﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ اﺳﺘﺨﺪاﻣﺎت أﺧﺮى ً
أﻳﻀﺎ ﰲ اﻟﻔﺼﻞ ﻋﻴﻨﻪ ﻛﻴﻒ ُﻗﺪﱢرت ﻣﻌﻠﻤﺎت اﻟﺘﻮزﻳﻌﺎت. اﻟﻘﺮار ﰲ اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ ،ﻛﻤﺎ رأﻳﻨﺎ ً
ﻳﺘﻢ ذﻟﻚ ﻋﻦ ﻃﺮﻳﻖ ﺗﺤﺪﻳﺪ ﻣﻘﻴﺎس ﻟﻠﺘﻨﺎﻗﺾ ﺑني اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة واﻟﺘﻮزﻳﻊ اﻟﻨﻈﺮي،
ﺛﻢ اﺧﺘﻴﺎر ﻗﻴﻤﺔ املﻌﻠﻤﺔ املﻘﺪﱠرة اﻟﺘﻲ ﺗﻘﻠﻞ ﻗﻴﺎس اﻟﺘﻨﺎﻗﺾ ﻷدﻧﻰ ﺣﺪ .وﻳﺴﺘﻤﺪ ﻣﻘﻴﺎس
ﺷﺎﺋﻊ ﻟﻠﺘﻨﺎﻗﺾ ﻣﻦ اﻹﻣﻜﺎن ،واﻟﺬي ﻳﻘﻴﺲ ﻣﺪى اﺣﺘﻤﺎل أن ﺑﻴﺎﻧﺎت ﻣﺜﻞ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة
أﺧﺬت املﻌﻠﻤﺎت ﻗﻴﻤً ﺎ ﻣﺨﺘﻠﻔﺔ ﻣﺘﻌﺪدة .واﻵن ،ﺑﻤﺎ أن اﻟﺘﻮزﻳﻌﺎت ﻫﻲ أﺷﻜﺎل ِ ﺳﺘﻨﺸﺄ إذا
ﺑﺴﻴﻄﺔ ﻓﺤﺴﺐ ﻣﻦ اﻟﻨﻤﻮذج ،ﻓﺈن املﺒﺎدئ ﻧﻔﺴﻬﺎ ﺑﺎﻟﻀﺒﻂ ﺗﻨﻄﺒﻖ ﻋﻨﺪ ﺗﺠﺮﺑﺔ ﻧﻤﺎذج أﻛﺜﺮ
ﺗﻔﺼﻴﻼ )ﻣﺜﻞ ﺗﻠﻚ املﺬﻛﻮرة ﻓﻴﻤﺎ ﻳﲇ( .وﻣﻊ ذﻟﻚ ،ﺗﻨﺸﺄ ﻇﺎﻫﺮة ﻏﺮﻳﺒﺔ ﺑﻴﻨﻤﺎ ﺗﺼﺒﺢ اﻟﻨﻤﺎذج ً
ً
ﺗﻔﺼﻴﻼ. أﻛﺜﺮ
ﻄﺎ ﻟﻠﺘﻮﺿﻴﺢ؛ ﻟﻨﻔﱰض أﻧﻨﺎ ﻧﺮﻳﺪ ﺑﻨﺎء ﻧﻤﻮذج ﻟﻠﺘﻨﺒﺆ ﺑﺎﻟﺮواﺗﺐ اﻷوﱃ ﻣﺜﺎﻻ ﺑﺴﻴ ً
ﺳﺄذﻛﺮ ً
ﻟﻠﺨﺮﻳﺠني ،اﺳﺘﻨﺎدًا إﱃ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗَ ِﺼﻒ دراﺳﺘﻬﻢ ،واملﻮاد اﻟﺘﻲ درﺳﻮﻫﺎ ﰲ اﻟﺠﺎﻣﻌﺔ،
96
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
وأﻳﻀﺎ ﻋﻮاﻣﻞ ﻣﺜﻞ اﻟﻌﻤﺮ واﻟﺠﻨﺲ وﻣﻜﺎن اﻹﻗﺎﻣﺔ ،وﻣﺎ إﱃ ذﻟﻚ. ً وﻧﺘﺎﺋﺞ اﻣﺘﺤﺎﻧﺎﺗﻬﻢ،
اﻓﱰض أﻧﻨﺎ ﺟﻤﻌﻨﺎ ﻋﻴﻨﺔ ﻣﻜﻮﻧﺔ ﻣﻦ ﻣﺎﺋﺔ ﻣﻦ اﻟﺨﺮﻳﺠني اﻟﺠﺪد وﺟﻤﻌﻨﺎ اﻟﺒﻴﺎﻧﺎت ﻣﻨﻬﺎ.
ﻋﻤﻮﻣً ﺎ ،إذا ﺣﺎوﻟﻨﺎ أن ﻧﺒﻨﻲ ﺗﻮﻗﻌﺎﺗﻨﺎ ﻋﲆ ﻋﺪد ﻗﻠﻴﻞ ﺟﺪٍّا ﻣﻦ املﺘﻐريات )ﻣﺜﻞ اﻟﻌﻤﺮ ﻓﻘﻂ(
ﻓﺈﻧﻨﺎ ﻟﻦ ﻧﺤﺼﻞ ﻋﲆ ﺗﻨﺒﺆات دﻗﻴﻘﺔ ﻟﻠﻐﺎﻳﺔ؛ ﻓﺎﻟﻌﻤﺮ ،ﰲ ﺣﺪ ذاﺗﻪ ،وﺣﺪه ﻻ ﻳﺤﺘﻮي ﻋﲆ
ﻣﻌﻠﻮﻣﺎت ﻛﺎﻓﻴﺔ ﻟﻠﺴﻤﺎح ﻟﻨﺎ ﺑﺄن ﻧﻌﺮف ﻛﻢ ﺳﻴﻜﻮن راﺗﺐ اﻟﺸﺨﺺ املﺘﺨ ﱢﺮج ﰲ اﻟﺠﺎﻣﻌﺔ
ﺑﺪﻗﺔ ﻣﺘﻨﺎﻫﻴﺔ .ﻟﺘﺤﺴني دﻗﺔ اﻟﺘﻨﺒﺆ ﻓﺈﻧﻨﺎ ﺑﺤﺎﺟﺔ إﱃ إﺿﺎﻓﺔ املﺰﻳﺪ ﻣﻦ اﻟﻌﻮاﻣﻞ املﺘﻨﺒﱢﺌﺔ )ﻣﺜﻞ
اﺳﺘﺨﺪام اﻟﻌﻤﺮ وﻣﺠﺎل اﻟﺪراﺳﺔ ودرﺟﺎت اﻻﻣﺘﺤﺎن ﻟﻠﺘﻨﺒﺆ ﺑﺮاﺗﺐ اﻟﺸﺨﺺ املﺘﺨﺮج( .وﻣﻊ
ذﻟﻚ — وﻫﻨﺎ ﺗﱪز املﻌﻀﻠﺔ — إذا أﺿﻔﻨﺎ ﻋﺪدًا أﻛﱪ ﻣﻤﺎ ﻳﻠﺰم ﻣﻦ املﺘﻐريات املﺘﻨﺒﱢﺌﺔ ﻓﺈن
دﻗﺔ اﻟﺘﻨﺒﺆ ﻟﻠﻤﺠﻤﻮﻋﺔ اﻟﻜﺎﻣﻠﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺳﺘﻘﻞ؛ ﻓﻌﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻨﺎ ﻧﺴﺘﺨﺪم
ﻣﺰﻳﺪًا ﻣﻦ املﻌﻠﻮﻣﺎت ﺣﻮل اﻟﺨﺮﻳﺠني ،ﻓﺈن ﻧﻤﻮذﺟﻨﺎ ﻟﻴﺲ ﺟﻴﺪًا.
ﻣﻨﺎﻗﻀﺎ ﻟﻠﻤﻨﻄﻖ؛ ﻓﻜﻴﻒ ﻳﻤﻜﻦ ﻹﺿﺎﻓﺔ »ﻣﺰﻳﺪ« ﻣﻦ املﻌﻠﻮﻣﺎت أن ﺗﺆدي إﱃ ً ﻳﺒﺪو ﻫﺬا
ﺗﻨﺒﺆات »أﺳﻮأ«؟
ﻌﱪ »اﻹﻓﺮاط ﰲ املﻄﺎﺑَﻘﺔ«. اﻟﺠﻮاب ﻣﺮاوغ ،وﻳُﻄ َﻠﻖ ﻋﻠﻴﻪ أﺳﻤﺎء ﻣﺨﺘﻠﻔﺔ ،ﻣﻨﻬﺎ اﻻﺳﻢ ا ُمل ﱢ
ﻟﻔﻬﻢ ذﻟﻚ ،دﻋﻨﺎ ﻧﱰاﺟﻊ ﺧﻄﻮة إﱃ اﻟﻮراء وﻧﺘﺪﺑﺮ ﻫﺪﻓﻨﺎ اﻟﺤﻘﻴﻘﻲ .إن ﻫﺪﻓﻨﺎ »ﻟﻴﺲ«
اﻟﺤﺼﻮل ﻋﲆ أﻓﻀﻞ اﻟﺘﻨﺒﺆات املﻤﻜﻨﺔ ﻟﻠﺨﺮﻳﺠني املﺎﺋﺔ ﰲ ﻋﻴﱢﻨﺘﻨﺎ؛ ﻓﻨﺤﻦ ﻧﻌﻠﻢ ﺑﺎﻟﻔﻌﻞ
وﻟﻜﻦ ﻫﺪﻓﻨﺎ ﻫﻮ اﻟﺤﺼﻮل ﻋﲆ أﻓﻀﻞ اﻟﺘﻨﺒﺆات املﻤﻜﻨﺔ ﺑﺎﻟﻨﺴﺒﺔ ﻟﻠﺨﺮﻳﺠني ﱠ رواﺗﺒﻬﻢ اﻷوﱃ،
اﻵﺧﺮﻳﻦ؛ أي إن ﻫﺪﻓﻨﺎ ﻫﻮ »اﻟﺘﻌﻤﻴﻢ« ﻣﻦ اﻟﻌﻴﻨﺔ املﻮﺟﻮدة ﻟﺪﻳﻨﺎ .واﻵن ،ﺑﺈﺿﺎﻓﺔ املﺰﻳﺪ
واملﺰﻳﺪ ﻣﻦ املﺘﻐريات املﺘﻨﺒﱢﺌﺔ ،ﻓﺈﻧﻨﺎ ﺑﺎﻟﺘﺄﻛﻴﺪ ﻧﻀﻴﻒ ﻣﻌﻠﻮﻣﺎت ﺳﻮف ﺗﻤ ﱢﻜﻨﻨﺎ ﻣﻦ اﻟﺘﻨﺒﺆ
ﺑﺮواﺗﺐ اﻷﺷﺨﺎص املﻮﺟﻮدﻳﻦ ﰲ ﻋﻴﻨﺘﻨﺎ ﺑﺎﻟﻔﻌﻞ ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ دﻗﺔ .وﻟﻜﻦ اﻟﻌﻴﻨﺔ ﻟﻴﺴﺖ
ﺳﻮى ﻋﻴﻨﺔ؛ أي إﻧﻬﺎ ﻻ ﺗﻤﺜﻞ رواﺗﺐ املﺠﻤﻮﻋﺔ ﺑﺄﻛﻤﻠﻬﺎ ﻋﲆ ﻧﺤﻮ ﻛﺎﻣﻞ .وﺑﻌﺪ ﻓﱰة
ﻣﻦ اﻟﻮﻗﺖ ،وﺑﻴﻨﻤﺎ ﻧﻮاﺻﻞ إﺿﺎﻓﺔ املﺰﻳﺪ ﻣﻦ املﺘﻐريات املﺘﻨﺒﺌﺔ ،ﻧﺒﺪأ ﰲ اﻟﺘﻨﺒﺆ ﺑﺠﻮاﻧﺐ
ﻣﻦ اﻟﺒﻴﺎﻧﺎت ﺧﺎﺻﺔ ﺑﺎﻟﻌﻴﻨﺔ وﺣﺪﻫﺎ؛ ﻓﻬﻲ ﻟﻴﺴﺖ ﺳﻤﺎت ﺗﻨﻄﺒﻖ ﻋﲆ املﺠﻤﻮﻋﺔ اﻟﻜﻠﻴﺔ
ﺑﺄﻛﻤﻠﻬﺎ.
ﺗﻨﻄﺒﻖ ﻫﺬه اﻟﻈﺎﻫﺮة ﻋﲆ ﺟﻤﻴﻊ اﻟﻨﻤﺎذج اﻹﺣﺼﺎﺋﻴﺔ؛ ﻓﺎﻟﻨﻤﺎذج ﻳﻤﻜﻦ أن ﺗﻜﻮن
ﻣﻔﺮﻃﺔ ﰲ اﻟﺘﻌﻘﻴﺪ ،ﺑﺤﻴﺚ ﺗﺘﻄﺎﺑﻖ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة ﺟﻴﺪًا ﺟﺪٍّا ﺑﺎﻟﻔﻌﻞ ،وﻟﻜﻨﻬﺎ
ﺗﻔﺸﻞ ﰲ اﻟﺘﻌﻤﻴﻢ ﻋﲆ أﺷﻴﺎء أﺧﺮى ﻣﺴﺘﻤَ ﺪﱠة ﻣﻦ اﻟﺘﻮزﻳﻊ ﻧﻔﺴﻪ؛ وﻫﺬا ﻳﻌﻨﻲ أﻧﻪ ﻻ ﺑﺪ
ﻣﻦ وﺿﻊ اﺳﱰاﺗﻴﺠﻴﺎت ﻻﺧﺘﻴﺎر ﻧﻤﺎذج ﺑﺪرﺟﺔ ﺗﻌﻘﻴﺪ ﻣﻨﺎﺳﺒﺔ؛ ﻓﺈذا ﻛﺎﻧﺖ اﻟﻨﻤﺎذج ﻣﻔﺮﻃﺔ
اﻟﺘﺒﺴﻴﻂ ،ﻓﺈﻧﻨﺎ ﻧﺨﺎﻃﺮ ﺑﻔﻘﺪان ﻗﺪرﺗﻬﺎ ﻋﲆ اﻟﺘﻨﺒﺆ ،وإذا ﻛﺎﻧﺖ ﻣﻔﺮﻃﺔ اﻟﺘﻌﻘﻴﺪ ،ﻓﺈﻧﻨﺎ
97
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻧﺨﺎﻃﺮ ﺑﺎﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ .ﻳﺸﻜﻞ ﻫﺬا املﻔﻬﻮم أﺳﺎس ﻣﺒﺪأ »ﺷﻔﺮة أوﻛﺎم« ،اﻟﺬي ﻳﻨﺺ
ﻋﲆ أن »اﻟﻨﻤﺎذج ﻳﻨﺒﻐﻲ ﱠأﻻ ﺗﻜﻮن أﻛﺜﺮ ﺗﻌﻘﻴﺪًا ﻣﻤﺎ ﻫﻮ ﴐوري« )ﻳﻨﺴﺐ إﱃ اﻟﺮاﻫﺐ
اﻟﻔﺮﻧﺴﻴﺴﻜﺎﻧﻲ وﻳﻠﻴﺎم اﻷوﻛﺎﻣﻲ ﻣﻦ اﻟﻘﺮن اﻟﺮاﺑﻊ ﻋﴩ(.
وملﺸﻜﻠﺔ اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ أﻫﻤﻴﺔ ﺧﺎﺻﺔ ﰲ ﻣﺠﺎل ﻋﻠﻢ اﻹﺣﺼﺎء اﻟﺤﺪﻳﺚ؛ ﻓﻘﺒﻞ
ُ
ﻣﻄﺎﺑﻘﺔ اﻟﻨﻤﺎذج املﻌﻘﺪة ﻣﻊ أﻋﺪاد ﻛﺒرية ً
ﻣﺄﻟﻮﻓﺎ ﻇﻬﻮر أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ ،وﻗﺒﻞ أن ﻳﺼﺒﺢ
ﻣﻦ املﻌﻠﻤﺎت ،ﻛﺎن ﺧﻄﺮ اﻟﻮﻗﻮع ﰲ اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ أﻗﻞ.
98
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﺛﻤﺔ رﻗﻢ واﺣﺪ ﻳﻤﻜﻦ اﺳﺘﺨﺪاﻣﻪ ﻟﺘﻤﺜﻴﻞ ﻗﻮة اﻻرﺗﺒﺎط ،وﻫﻮ »ﻣﻌﺎﻣﻞ اﻻرﺗﺒﺎط« .وﻳﻮﺟﺪ
اﻟﻌﺪﻳﺪ ﻣﻦ اﻟﻄﺮق اﻟﺘﻲ ﻳﻤﻜﻦ ﻗﻴﺎس ﻫﺬه اﻟﻘﻮة ﺑﻬﺎ ،ﺗﻤﺎﻣً ﺎ ﻣﺜﻠﻤﺎ رأﻳﻨﺎ أﻧﻪ ﺗﻮﺟﺪ ﻃﺮق
ﻣﺨﺘﻠﻔﺔ ﻟﺘﻌﺮﻳﻒ »املﺘﻮﺳﻂ« و»اﻟﺘﺸﺘﺖ« .وﻣﻊ ذﻟﻚ ،ﻳﻮﺟﺪ ﻣﻌﻴﺎر ﻋﺎم ملﻌﺎﻣﻼت اﻻرﺗﺒﺎط
ﺑﺄﻧﻬﺎ ﺗَ َﻘﻊ ﺑني ١−و١+؛ ﺑﺤﻴﺚ ﻳﻌﻨﻰ ٠أﻧﻪ ﻻ ﻳﻮﺟﺪ ارﺗﺒﺎط ،وﻳﻌﻨﻰ ١+وﺟﻮد ارﺗﺒﺎط
إﻳﺠﺎﺑﻲ ﺗﺎم ،وﻳﻌﻨﻲ ١−وﺟﻮد ارﺗﺒﺎط ﺳﻠﺒﻲ ﺗﺎم .وﻳﻌﻨﻲ اﻻرﺗﺒﺎط »اﻟﺘﺎم« ﺑني ﻣﺘﻐريﻳﻦ
ﻛﻨﺖ ﺗﻌﺮف ﻗﻴﻤﺔ »س« ﻓﺈﻧﻚ ﺗﻌﺮف ﻗﻴﻤﺔ »ص« ﺑﺎﻟﻀﺒﻂ. »س« و»ص« أﻧﻚ إذا َ
اﻻرﺗﺒﺎط ﻋﻼﻗﺔ ﻣﺘﻨﺎﻇﺮة؛ ﻓﺈذا ﻛﺎن اﻟﻄﻮل ﻳﺮﺗﺒﻂ ﺑﺎﻟﻮزن ،ﻓﺈن اﻟﻮزن ﻳﺮﺗﺒﻂ ﺑﺎﻟﻄﻮل،
وﻗﻮة ﻫﺬا اﻻرﺗﺒﺎط ﺗﻈﻞ ﻧﻔﺴﻬﺎ ﻣَ ﻬْ ﻤَ ﺎ ﻛﺎﻧﺖ اﻟﻨﺎﺣﻴﺔ اﻟﺘﻲ ﻧﻨﻈﺮ إﻟﻴﻬﺎ ﻣﻨﻬﺎ .وﰲ املﻘﺎﺑﻞ،
ﻧﻬﺘﻢ ﰲ ﺑﻌﺾ اﻷﺣﻴﺎن ﺑﺎﻟﻌﻼﻗﺎت ﻏري املﺘﻨﺎﻇﺮة ﺑني املﺘﻐريات؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ
ﻧﺮﻏﺐ ﰲ ﻣﻌﺮﻓﺔ ﻣﻘﺪار اﻟﻔﺮق ﰲ اﻟﻮزن — ﰲ املﺘﻮﺳﻂ — اﻟﺬي ﻳﺮﺗﺒﻂ ﺑﻮﺟﻮد ﻓﺎرق ﰲ
اﻟﻄﻮل ﻳﺒﻠﻎ ﻋﴩة ﺳﻨﺘﻴﻤﱰات .واﻹﺟﺎﺑﺔ ﻋﲆ ﻫﺬا اﻟﻨﻮع ﻣﻦ اﻷﺳﺌﻠﺔ ﺗﺄﺗﻲ ﻣﻦ ﺧﻼل ﻃﺮﻳﻘﺔ
إﺣﺼﺎﺋﻴﺔ ﺗﺴﻤﻰ »ﺗﺤﻠﻴﻞ اﻻﻧﺤﺪار« .وﻳﺨﱪﻧﺎ ﻧﻤﻮذج اﻻﻧﺤﺪار ﺑﻤﺘﻮﺳﻂ ﻗﻴﻤﺔ املﺘﻐري »ص«
ﻟﻜﻞ ﻗﻴﻤﺔ ﻟﻠﻤﺘﻐري »س« .ﰲ املﺜﺎل اﻟﺴﺎﺑﻖ» ،اﻧﺤﺪار اﻟﻮزن ﻋﲆ اﻟﻄﻮل« ﺳﻴﺨﱪﻧﺎ ﺑﻤﺘﻮﺳﻂ
اﻟﻮزن اﻟﺬي ﺳﻴﺼﻞ إﻟﻴﻪ اﻷﺷﺨﺎص ﻋﻨﺪ ﻛﻞ ﻃﻮل .وﻳﺘﻀﺢ ﻫﺬا ﰲ اﻟﺸﻜﻞ 1-6؛ ﺣﻴﺚ
ﻳﻤﺜﱠﻞ اﻟﻮزن ﻋﲆ املﺤﻮر اﻟﺮأﳼ ،واﻟﻄﻮل ﻋﲆ املﺤﻮر اﻷﻓﻘﻲ .وﺗﻮﺿﺢ ﻛﻞ ﻧﻘﻄﺔ ﺳﻮداء
زوج اﻟﻮزن/اﻟﻄﻮل ﻟﺸﺨﺺ ﻣﻦ اﻟﻌﻴﻨﺔ .ﻳﺒﺪو واﺿﺤً ﺎ اﻵن ﻣﻦ ﻫﺬا اﻟﺸﻜﻞ أﻧﻨﺎ ﻟﻢ ﻧﺮﺻﺪ
ﻗﻴﻤً ﺎ ﻟﺠﻤﻴﻊ اﻷﻃﻮال املﻤﻜﻨﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻻ ﻳﻮﺟﺪ أي ﻧﻘﻄﺔ ﺑﻴﺎﻧﺎت ﻋﻨﺪ اﻟﻄﻮل اﻟﺬي
ﻳﺒﻠﻎ ﺑﺎﻟﻀﺒﻂ ٦أﻗﺪام .إﺣﺪى ﻃﺮق اﻟﺘﻐﻠﺐ ﻋﲆ ﻫﺬه اﻟﺼﻌﻮﺑﺔ — ﺑﻨﺎء ﻧﻤﻮذج ﻳﻌﻄﻴﻨﺎ
ﻣﺘﻮﺳﻂ وزن ﻟﻜﻞ ﻗﻴﻤﺔ ﻣﻦ اﻟﻄﻮل — ﻫﻲ أن ﻧﻔﱰض وﺟﻮد ﻋﻼﻗﺔ ﺑﺴﻴﻄﺔ ﺑني اﻟﻄﻮل
وﻣﺘﻮﺳﻂ اﻟﻮزن .وﻫﺬه اﻟﻌﻼﻗﺔ اﻟﺒﺴﻴﻄﺔ ﺟﺪٍّا ﻫﻲ ﻋﻼﻗﺔ ﺧﻂ ﻣﺴﺘﻘﻴﻢ؛ وﻳ َِﺮ ُد ﻣﺜﺎل ﻟﻬﺬا
اﻟﺨﻂ ﰲ اﻟﺸﻜﻞ .وﺑﺎﻟﻨﺴﺒﺔ ﻷي ﻃﻮل ﻣﻌني ،ﻳﺴﻤﺢ ﻟﻨﺎ ﻫﺬا اﻟﺨﻂ ﺑﺎﻟﺒﺤﺚ ﻋﻦ اﻟﻘﻴﻤﺔ
املﻘﺎﺑﻠﺔ ﻣﻦ ﻣﺘﻮﺳﻂ اﻟﻮزن؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،وﻋﲆ وﺟﻪ اﻟﺘﺤﺪﻳﺪ ،ﻓﺈﻧﻪ ﻳﻌﻄﻴﻨﺎ ﻗﻴﻤﺔ
ملﺘﻮﺳﻂ وزن اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﻳﺒﻠﻎ ﻃﻮﻟﻬﻢ ٦أﻗﺪام.
وﺛﻤﺔ ﻋﺪة ﻧﻘﺎط ﻳﻨﺒﻐﻲ ﺗﻮﺿﻴﺤﻬﺎ ﻓﻴﻤﺎ ﻳﺨﺺ ﻫﺬه اﻟﻄﺮﻳﻘﺔ.
أوﻻ :إﻧﻬﺎ ﺗﻌﻄﻲ »ﻣﺘﻮﺳﻂ« اﻷوزان ﻋﻨﺪ ﻛﻞ ﻃﻮل .وﻫﺬا أﻣﺮ ﻣﻌﻘﻮل؛ إذ إﻧﻪ ﰲ اﻟﺤﻴﺎة ً
اﻟﻮاﻗﻌﻴﺔ ،ﺣﺘﻰ اﻷﺷﺨﺎص ذوو اﻟﻄﻮل ﻧﻔﺴﻪ ﻳﻤﻜﻦ أن ﺗﺘﺒﺎﻳﻦ أوزاﻧﻬﻢ.
ﻃﺮﻳﻘﺔ ﻣﺎ ﻟﺘﺤﺪﻳﺪ اﻟﺨﻂ اﻟﺬي ﻧﺘﺤﺪث ﻋﻨﻪ ﺑﺎﻟﻀﺒﻂ. ٍ ﺛﺎﻧﻴًﺎ :ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ إﻳﺠﺎد
ﻄﺎ واﺣﺪًا ،وﻟﻜﻦ ﻛﻴﻒ اﺧﱰﻧﺎ ﻫﺬا اﻟﺨﻂ وﻟﻴﺲ ﻏريه؟ ﺗﺘﺤﺪد اﻟﺨﻄﻮط ﻳﺘﻀﻤﻦ اﻟﺸﻜﻞ ﺧ ٍّ
99
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﻮزن ١٠أﺣﺠﺎر
٨أﺣﺠﺎر
ﻋﲆ ﻧﺤﻮ ﻓﺮﻳﺪ ﻋﻦ ﻃﺮﻳﻖ ﻣَ ﻌﻠﻤﺘني — ﺗﻘﺎﻃﻌﻬﻤﺎ )ﰲ ﻫﺬا اﻟﺸﻜﻞ ﻗﻴﻤﺔ اﻟﻮزن اﻟﺘﻲ ﻳﺘﻘﺎﻃﻊ
ﻋﻨﺪﻫﺎ اﻟﺨﻂ ﻣﻊ ﻣﺤﻮر اﻟﻮزن( وﻣﻴﻠﻬﻤﺎ — ﻟﺬﻟﻚ ﻧﺤﻦ ﺑﺤﺎﺟﺔ إﱃ إﻳﺠﺎد وﺳﻴﻠﺔ ﻻﺧﺘﻴﺎر
ﻫﺎﺗني املﻌﻠﻤﺘني أو ﺗﻘﺪﻳﺮﻫﻤﺎ .ﻧﻌﺮف ﺑﺎﻟﻔﻌﻞ ﻃﺮﻳﻘﺔ ﺗﻘﺪﻳﺮ املﻌﻠﻤﺔ؛ ﻓﻘﺪ ﺗﻨﺎوﻟﻨﺎﻫﺎ ﰲ
اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ .وﻟﺘﻘﺪﻳﺮ املﻌﻠﻤﺎت ﻧﺨﺘﺎر ﺗﻠﻚ اﻟﻘﻴﻢ اﻟﺘﻲ ﺗﻘﻠﻞ ﻣﻦ ﻗﺪر اﻟﺘﻨﺎﻗﺾ ﺑني
اﻟﻨﻤﻮذج واﻟﺒﻴﺎﻧﺎت املﺮﺻﻮدة .وﺑﺎﻟﻨﺴﺒﺔ ﻷي زوج ﻣﻌني )اﻟﻮزن واﻟﻄﻮل( ﻣﻦ اﻟﺒﻴﺎﻧﺎت،
ﻓﺈن أﺣﺪ ﻣﻘﺎﻳﻴﺲ اﻟﺘﻨﺎﻗﺾ ﻫﻮ ﻣﺮﺑﻊ اﻟﻔﺮق )ﻣﺮة أﺧﺮى ،اﻟﺴﺒﺐ ﰲ ﻛﻮﻧﻪ ﻣﺮﺑﻌً ﺎ ﻫﻮ
ﺟﻌﻞ اﻷرﻗﺎم ﻣﻮﺟﺒﺔ( ﺑني اﻟﻮزن املﺮﺻﻮد واﻟﻮزن املﺘﻮﻗﻊ ﻋﻨﺪ ﻫﺬا اﻟﻄﻮل .وﻳﺘﻤﺜﻞ
ﻣﻘﻴﺎس اﻟﺘﻨﺎﻗﺾ اﻟﻜﲇ املﻌﺘﻤﺪ ﻋﲆ ﻫﺬا ﰲ ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت اﻟﻔﺮوق ﺑني اﻷوزان املﺮﺻﻮدة
ﱠ
املﺘﻮﻗﻌﺔ ﻋﻨﺪ اﻷﻃﻮال اﻟﻮاردة ﰲ اﻟﺒﻴﺎﻧﺎت .وﺑﻌﺪ ذﻟﻚ ﻧﻘﺪر اﻟﺘﻘﺎﻃﻊ واﻻﻧﺤﺪار واﻷوزان
ﺑﺎﺧﺘﻴﺎر ﺗﻠﻚ اﻟﻘﻴﻢ اﻟﺘﻲ ﺗﻘﻠﻞ ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت اﻟﻔﺮوق ﻷدﻧﻰ درﺟﺔ .وﺑﻤﺎ أﻧﻬﺎ ﺗﻘﻠﻞ
)ﻣﺠﻤﻮع ﻣﺮﺑﻌﺎت( اﻟﻔﺮوق ﺑني اﻟﻘﻴﻢ املﺮﺻﻮدة واملﺘﻮﻗﻌﺔ ﻟﻸوزان ﰲ اﻟﺒﻴﺎﻧﺎت ،ﻓﺈن »ﺧﻂ
اﻧﺤﺪار املﺮﺑﻌﺎت اﻟﺼﻐﺮى« ﻫﺬا ﻳﻨﺘِﺞ أﻓﻀﻞ ﺗﻨﺒﺆ ملﺘﻮﺳﻂ اﻟﻮزن ﻋﻨﺪ أي ﻗﻴﻤﺔ ﻟﻠﻄﻮل
ﻧﺨﺘﺎرﻫﺎ.
100
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
اﻟﻨﻘﻄﺔ اﻟﺜﺎﻟﺜﺔ :ﻫﻲ أﻧﻪ ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أن ﻫﺬا اﻻﻓﱰاض ﺑﻮﺟﻮد ﻋﻼﻗﺔ ﺧﻂ ﻣﺴﺘﻘﻴﻢ
ﻄﺎ ﻣﺴﺘﻘﻴﻤً ﺎ ،وﻟﻴﺲ ﺧ ٍّ
ﻄﺎ ﻗﻠﻴﻼ .ملﺎذا ﻧﺨﺘﺎر ﺧ ٍّ
ﻗﺪ ﻳﺒﺪو اﻋﺘﺒﺎﻃﻴٍّﺎ إﱃ ﺣ ﱟﺪ ﻣﺎ ،ﻓﺈﻧﻪ ُﻣﱪﱠر ً
ﻣﻨﺤﻨﻴًﺎ؟ دون اﻟﺨﻮض ﰲ اﻟﺘﻔﺎﺻﻴﻞ ﻫﻨﺎ ،ﻣﻦ املﻤﻜﻦ ﺗﻘﺪﻳﻢ ﻣﻨﺤﻨﻴﺎت ﺑﺪرﺟﺎت ﻣﺘﻔﺎوﺗﺔ
ﺑﺤﻴﺚ ﻳﻤﻜﻦ أن ﻳﻜﻮن ﻟﻠﺨﻂ اﻟﺬي ﻳﺒني اﻟﻌﻼﻗﺔ ﺑني اﻟﻄﻮل وﻣﺘﻮﺳﻂ اﻟﻮزن أﺷﻜﺎل أﻛﺜﺮ
ﺗﻌﻘﻴﺪًا؛ ﻓﺮﺑﻤﺎ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ﻳﺰداد ﺑﴪﻋﺔ أﻛﱪ ﻋﻨﺪ اﻷﻃﻮال اﻷدﻧﻰ ﻣﻦ ازدﻳﺎده ﻋﻨﺪ
اﻷﻃﻮال اﻷﻋﲆ .وﻧﻔﻌﻞ ذﻟﻚ ﻣﻦ ﺧﻼل ﺟﻌﻞ اﻟﻨﻤﻮذج أﻛﺜﺮ ﺗﻌﻘﻴﺪًا ،ﻋﻦ ﻃﺮﻳﻖ إدﺧﺎل
ﻣﻌﻠﻤﺎت إﺿﺎﻓﻴﺔ ﺑﺎﻹﺿﺎﻓﺔ إﱃ اﻟﺘﻘﺎﻃﻊ واملﻴﻞ.
ﺳﻌﻰ ﻣﺜﺎل اﻧﺤﺪار اﻟﻄﻮل/اﻟﻮزن ﻟﻠﺘﻨﺒﺆ ﺑﻤﺘﻮﺳﻂ اﻟﻮزن ﻣﻦ ﺧﻼل ﻣﺘﻐري ﻣﺘﻨﺒﺊ
أﻳﻀﺎ إدﺧﺎل ﻋﻮاﻣﻞ ﻣﺘﻨﺒﺌﺔ ﻣﺤﺘﻤﻠﺔ أﺧﺮى ﻣﻦ أﺟﻞ واﺣﺪ ﻓﻘﻂ ﻫﻮ اﻟﻄﻮل ،ﻟﻜﻦ ﻳﻤﻜﻨﻨﺎ ً
ﺗﺤﻘﻴﻖ ﺗﻮﻗﻌﺎت أﻛﺜﺮ دﻗﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﻳﻤﺘﻠﻚ اﻟﺮﺟﺎل واﻟﻨﺴﺎء أﺷﻜﺎل ﺟﺴﻢ ﻣﺨﺘﻠﻔﺔ،
ﺑﺤﻴﺚ إﻧﻪ ﻋﻨﺪ ﻃﻮل ﻣﻌني ،رﺑﻤﺎ ﻳﻜﻮن اﻻﺧﺘﻼف ﰲ اﻷوزان ﺑﺴﺒﺐ ﻧﻮع اﻟﺠﻨﺲ ﻋﲆ
ﻋﺎﻣﻼ ﻣﺘﻨﺒﺌًﺎ .وﻳﻤﻜﻨﻨﺎ ﻣﻮاﺻﻠﺔً ﻧﺤﻮ ﻛﺒري؛ ﻟﺬا ﻳﻤﻜﻨﻨﺎ ﺗﻀﻤني ﻧﻮع اﻟﺠﻨﺲ ً
أﻳﻀﺎ ﺑﺎﻋﺘﺒﺎره
ﺗﻀﻤني ﻣﺘﻐريات أﺧﺮى ﻧﻈﻦ أﻧﻪ ﻣﻦ املﺮﺟﺢ أن ﺗﺮﺗﺒﻂ ﺑﺎﻟﻮزن .ﻟﻜﻦ ﻻ ﻳﻨﺒﻐﻲ أن ﻧﺘﻤﺎدى
وإﻻ ﻓﺴﻮف ﻳﺘﻤﻴﺰ ﻛﺎﻧﺖ املﻼﺣﻈﺎت ﺗﺘﻌﻠﻖ ﺑﻌﺪد ﻣﺤﺪد ﻣﻦ اﻷﺷﺨﺎص ﻓﺤﺴﺐ ،ﱠ ِ ﻛﺜريًا إذا
ﻧﻤﻮذﺟﻨﺎ ﻣﺮة أﺧﺮى ﺑﺎﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ ﻣﻊ اﻟﺒﻴﺎﻧﺎت؛ وﻟﺬا ﻓﺈﻧﻨﺎ ﻗﺪ ﻻ ﻧﺮﻏﺐ ﰲ ﺗﻀﻤني
ﻛﺎﻓﺔ املﺘﻐريات اﻟﺘﻲ ﻳﻤﻜﻦ أن ﻧﻔﻜﺮ ﻓﻴﻬﺎ ،وإﻧﻤﺎ ﻧﺪرج وﺣﺴﺐ ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋﻴﺔ ﻣﻨﻬﺎ.
أﻳﻀﺎ ﻗﺪ ﺗﺪﻓﻌﻨﺎ إﱃ اﻟﺮﻏﺒﺔ ﰲ ﺗﻀﻤني ﻣﺠﻤﻮﻋﺔ ﻓﺮﻋﻴﺔ ﺑﺼﻔﺔ ﻋﺎﻣﺔ ،ﺛﻤﺔ أﺳﺒﺎب أﺧﺮى ً
ﻓﻘﻂ ﻣﻦ املﺘﻐريات املﺘﻨﺒﺌﺔ املﺤﺘﻤﻠﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻳﻜﻮن ﻗﻴﺎس املﺘﻐريات املﺘﻨﺒﺌﺔ
ﻃﻮﻳﻼ؛ وﻟﺬا ﻓﺈﻧﻨﺎ ﺳﻮف ﻧﺮﻳﺪ أن ﻧُﺒﻘِﻲ اﻟﻌﺪد ﻋﻨﺪ أدﻧﻰ ً ً
ﻣﻜﻠﻔﺎ ،أو ﻳﺴﺘﻐﺮق وﻗﺘًﺎ اﻹﺿﺎﻓﻴﺔ
ﻃﺮﻗﺎ ﻟﻠﻌﺜﻮر ﻋﲆ ﻣﺠﻤﻮﻋﺎت ﻓﺮﻋﻴﺔ ﺣﺪ ﻣﻤﻜﻦ .ﻟﻬﺬه اﻷﺳﺒﺎب وﻏريﻫﺎ ،ﻃﻮر اﻹﺣﺼﺎﺋﻴﻮن ً
ﺟﻴﺪة ﻣﻦ املﺘﻐريات؛ ﺣﻴﺚ ﺗﻌﻨﻲ ﻛﻠﻤﺔ »ﺟﻴﺪة« أﻧﻬﺎ ﺗﻨﺘﺞ أﻓﻀﻞ اﻟﺘﻨﺒﺆات.
ﺗﺮﺑﻂ ﻧﻤﺎذج اﻻﻧﺤﺪار ﻣﺘﻐري ﻧﺎﺗﺞ أو ﻣﺘﻐري إﺟﺎﺑﺔ ﺑﻮاﺣﺪ أو أﻛﺜﺮ ﻣﻦ املﺘﻐريات
ﻃﻮرت ﻧﻤﺎذج إﺣﺼﺎﺋﻴﺔ أﺧﺮى ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ املﺘﻨﺒﱢﺌﺔ .ﻫﺬا ﻧﻮع ﺷﺎﺋﻊ ﺟﺪٍّا ﻣﻦ املﺸﻜﻼت ،و ُ
ﺣﺎﻻت ﻣﻤﺎﺛﻠﺔ ﺗﺨﺘﻠﻒ ﰲ ﺑﻌﺾ اﻟﻨﻮاﺣﻲ ﻋﻦ ﺣﺎﻟﺔ اﻻﻧﺤﺪار املﺴﺘﻘﻴﻢ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل،
ﰲ »ﺗﺤﻠﻴﻞ اﻟﺒﻘﺎء« ﺗُﻌ َﺮف ﻗﻴﻤﺔ ﻣﺘﻐري اﻹﺟﺎﺑﺔ ﻟﺒﻌﺾ اﻟﺤﺎﻻت ﻓﻘﻂ ،وﻳُﻌﺮف ﻓﻘﻂ أن
ﻗﻴﻤﺔ ﻣﺎ .ﻳﻨﺸﺄ ﻫﺬا ﻋﲆ ﻧﺤﻮ أﻛﺜﺮ ﺷﻴﻮﻋً ﺎ )ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻪ ﻗﻴﻤﺘﻬﺎ ﻟﺤﺎﻻت أﺧﺮى ﺗﺘﺠﺎوز ً
ﻟﻴﺲ ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ وﺣﺴﺐ( ﻋﻨﺪﻣﺎ ﻳﻜﻮن ﻣﺘﻐري اﻹﺟﺎﺑﺔ ﻓﱰة زﻣﻨﻴﺔ؛ وﻣﻦ ﺛَﻢﱠ ،ﻓﺈﻧﻨﺎ ﻗﺪ
ﻧﺮﻏﺐ ﰲ ﻣﻌﺮﻓﺔ اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ اﻟﺘﻲ ﺳﻴﻈﻞ ﻓﻴﻬﺎ املﺮﻳﺾ ﻋﲆ ﻗﻴﺪ اﻟﺤﻴﺎة )وﻣﻦ ﻫﻨﺎ ﺟﺎء
101
ﻋﻠﻢ اﻹﺣﺼﺎء
اﺳﻢ ﻫﺬه اﻟﺘﻘﻨﻴﺔ( أو ﻃﻮل اﻟﻔﱰة اﻟﺰﻣﻨﻴﺔ اﻟﺘﻲ ﺳﻴﺒﻘﻰ ﻓﻴﻬﺎ ﻣﻜﻮن ﻣﻦ اﻟﻨﻈﺎم ﻗﺒﻞ أن
ﻳﺤﺘﺎج إﱃ اﻻﺳﺘﺒﺪال .وﺑﺄﺧﺬ اﻟﺤﺎﻟﺔ اﻷوﱃ ﻛﻤﺜﺎل ﻟﻠﺘﻮﺿﻴﺢ ،رﺑﻤﺎ ﺗُ ﱢﺒني ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت
املﺘﻮﻓﺮة ﻟﺪﻳﻨﺎ أن أﺣﺪ املﺮﴇ ﻋﺎش ﺧﻤﺴﺔ أﺷﻬﺮ ،وﻋﺎش آﺧﺮ ﺷﻬﺮﻳﻦ ﻓﻘﻂ ،وﻋﺎش ﺛﻼﺛﺔ ﱢ
آﺧﺮون أﺣﺪ ﻋﴩ ﺷﻬ ًﺮا ،وﻫﻜﺬا .وﻣﻊ ذﻟﻚ ،رﺑﻤﺎ ﻟﻢ ﻧﺘﻤﻜﻦ ﻷﺳﺒﺎب ﻋﻤﻠﻴﺔ ﻣﻦ اﻻﻧﺘﻈﺎر
ﺣﺘﻰ ﻳﻤﻮت آﺧِ ﺮ ﻣﺮﻳﺾ ﰲ اﻟﺪراﺳﺔ )اﻟﻔﱰة اﻟﺘﻲ ﻗﺪ ﺗﺼﻞ إﱃ أﻋﻮام(؛ ﻟﺬﻟﻚ ﺗﻮﻗﻔﻨﺎ
ﻋﻦ ﺗﺴﺠﻴﻞ املﻼﺣﻈﺎت .ﻛﻞ ﻣﺎ ﻧﻌﺮﻓﻪ ﻋﻦ ﺑﻌﺾ املﺮﴇ ﻫﻮ أﻧﻬﻢ ﻋﺎﺷﻮا ﻓﱰة »أﻃﻮل«
ﻣﻦ اﻟﻮﻗﺖ ﺑني ﺑﺪء رﺻﺪ املﻼﺣﻈﺎت واﻟﺘﻮﻗﻒ ﻋﻦ رﺻﺪﻫﺎ .ﺗﻮﺻﻒ ﻫﺬه اﻟﺒﻴﺎﻧﺎت ﺑﺄﻧﻬﺎ
»ﻣﺒﺘﻮرة« ،وﻟﺘﻮﺿﻴﺢ اﻟﺘﻌﻘﻴﺪات اﻟﺘﻲ ﺗﺴﺒﺒﻬﺎ ،ﺗﺄﻣﱠ ْﻞ ﻃﺮﻳﻘﺔ ﺣﺴﺎب ﻣﺘﻮﺳﻂ ﻓﱰة اﻟﺒﻘﺎء
ﻋﲆ ﻗﻴﺪ اﻟﺤﻴﺎة؛ َﻓﻠِﺤِ ﺴﺎب املﺘﻮﺳﻂ ،ﻧﺤﺘﺎج إﱃ ﺟﻤﻊ اﻟﻔﱰات اﻟﺰﻣﻨﻴﺔ املﺮﺻﻮدة واﻟﻘﺴﻤﺔ
ﻋﲆ اﻟﻌﺪد املﻮﺟﻮد .إﻧﻨﺎ ﻟﻢ ﻧﺮﺻﺪ ﰲ اﻟﻮاﻗﻊ ﻓﱰات اﻟﺒﻘﺎء ﻋﲆ ﻗﻴﺪ اﻟﺤﻴﺎة ﻟﻠﻤﺮﴇ املﺒﺘﻮرة
ﺑﻴﺎﻧﺎﺗﻬﻢ ،وﻻ ﻳﻤﻜﻨﻨﺎ ﺗﻀﻤﻴﻨﻬﻢ ﰲ اﻟﺤﺴﺎب .وﻟﻜﻦ إذا أﻏﻔﻠﻨﺎﻫﻢ ،ﻓﺈﻧﻨﺎ ﺳﻮف ﻧُﻐﻔِ ﻞ ﻋﲆ
وﺟﻪ اﻟﺘﺤﺪﻳﺪ اﻟﻘِ ﻴَﻢ اﻷﻛﱪ؛ ﻟﺬﻟﻚ ﺳﻮف ﻳﻜﻮن ﺗﻘﺪﻳﺮﻧﺎ ﻣﺘﺤﻴ ًﺰا إﱃ اﻷﺳﻔﻞ .وﻋﲆ اﻟﻨﻘﻴﺾ،
إذا ﺿﻤﱠ ﻨﱠﺎﻫﻢ ،ﺑﺎﺳﺘﺨﺪام ﻓﱰات املﻼﺣﻈﺔ ،ﻓﺈن اﻟﻨﺘﻴﺠﺔ ﺗﻌﺘﻤﺪ ﻋﲆ وﻗﺖ اﺧﺘﻴﺎرﻧﺎ ﻟﻠﺘﻮﻗﻒ
أﻳﻀﺎ ،ﻓﻘﺪ وُﺿﻌﺖ أﺳﺎﻟﻴﺐ أﻛﺜﺮ ﺗﻄﻮ ًرا ﻋﻦ رﺻﺪ املﻼﺣﻈﺎت .وﺑﻤﺎ أن ﻫﺬا ﻏري ﻣﻼﺋﻢ ً
ﻟﻠﺘﻌﺎﻣﻞ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﺒﺘﻮرة.
ﺛﻤﺔ ﻧﺴﺨﺔ أﺧﺮى ﻣﻦ ﻣﺸﻜﻠﺔ وﺟﻮد ﻣﺘﻐري ﻧﺎﺗﺞ واﺣﺪ ﻣﺮﺗﺒﻂ ﺑﻮاﺣﺪ أو أﻛﺜﺮ ﻣﻦ
املﺘﻐريات املﺘﻨﺒﺌﺔ ﺗﺤﺪث ﰲ »ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ« .ﻳﺴﺘﺨﺪم ﻫﺬا اﻟﺘﺤﻠﻴﻞ ﻋﲆ ﻧﻄﺎق واﺳﻊ ﰲ
ﻣﺠﺎل اﻟﺰراﻋﺔ ،وﻋﻠﻢ اﻟﻨﻔﺲ ،وﻣﺮاﻗﺒﺔ اﻟﺠﻮدة اﻟﺼﻨﺎﻋﻴﺔ واﻟﺘﺼﻨﻴﻊ ،وﻏريﻫﺎ ﻣﻦ املﺠﺎﻻت.
ﻛﻼ ﻣﻨﻬﺎ ﻳﺘﺨﺬ ﺑﻀﻊ ﰲ ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ ،ﺗﻜﻮن املﺘﻐريات املﺘﻨﺒﺌﺔ ﴏﻳﺤﺔ؛ وﻫﺬا ﻳﻌﻨﻲ أن ٍّ
ﻗِ ﻴَﻢ ﻓﺤﺴﺐ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،ﰲ ﺗﺼﻨﻴﻊ ﺑﻌﺾ املﻮاد اﻟﻜﻴﻤﻴﺎﺋﻴﺔ رﺑﻤﺎ ﻧﻜﻮن ﻗﺎدرﻳﻦ ﻋﲆ
اﻟﺴﻴﻄﺮة ﻋﲆ درﺟﺔ اﻟﺤﺮارة واﻟﻀﻐﻂ واملﺪة ،وﻳﻜﻮن ﻟﺪﻳﻨﺎ ﺛﻼﺛﺔ إﻋﺪادات ﻟﻜ ﱟﻞ ﻣﻨﻬﺎ:
ﻣﻨﺨﻔﻀﺔ وﻣﺘﻮﺳﻄﺔ وﻋﺎﻟﻴﺔ .ﻗﺎﺑﻠﻨﺎ ﻣﺜﻞ ﻫﺬا املﻮﻗﻒ ﻋﻨﺪﻣﺎ ﻧﺎﻗﺸﻨﺎ اﻟﺘﺼﻤﻴﻢ اﻟﺘﺠﺮﻳﺒﻲ ﰲ
اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ ،وﻏﺎﻟﺒًﺎ ﻣﺎ ﻳﺴﺘﺨﺪم ﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ ﻟﺘﺤﻠﻴﻞ اﻟﺘﺠﺎرب .ورﻏﻢ ﺗﻘﺪﻳﻤﻪ ﻋﺎدة
ﻋﲆ أﻧﻪ ﻣﺨﺘﻠﻒ ﻋﻦ ﺗﺤﻠﻴﻞ اﻻﻧﺤﺪار ،ﻓﺈﻧﻪ ﻣﻦ املﻤﻜﻦ إﻋﺎدة ﺻﻴﺎﻏﺘﻪ ﰲ ﺻﻮرة ﻧﻤﻮذج
اﻧﺤﺪار .وﻛﻼﻫﻤﺎ ﺣﺎﻟﺘﺎن ﺧﺎﺻﺘﺎن ﻣﻦ ﻓﺌﺔ أﻛﱪ ﻣﻦ اﻟﻨﻤﺎذج ﺗُﺴﻤﱠ ﻰ »اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ«.
و ﱢُﺳﻌﺖ اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ ﻧﻔﺴﻬﺎ ﺑﻄﺮق ﻣﺨﺘﻠﻔﺔ .أﺣﺪ اﻟﺘﻌﻤﻴﻤﺎت املﻬﻤﺔ ﻟﻠﻐﺎﻳﺔ ﻳﺘﻤﺜﻞ
ﻓﻴﻤﺎ ﻳﺴﻤﻰ »اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ املﻌﻤﱠ ﻤﺔ« .ﰲ اﻻﻧﺤﺪار وﺗﺤﻠﻴﻞ اﻟﺘﺒﺎﻳﻦ ،ﻳﻜﻮن اﻟﻬﺪف ﻫﻮ
ُ
اﻟﺨﻄﻴﺔ وﺗﻮﺳﻊ اﻟﻨﻤﺎذجُ
ﱢ اﻟﺘﻨﺒﺆ ﺑﺎﻟﻘﻴﻤﺔ املﺘﻮﺳﻄﺔ ﻟﻺﺟﺎﺑﺔ ﻋﻨﺪ ﻛﻞ ﻗﻴﻤﺔ ﻋﺎﻣﻞ ﻣﺘﻨﺒﺊ.
102
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
املﻌﻤﻤﺔ ﻫﺬا ﻣﻦ ﺧﻼل اﻟﺴﻤﺎح ﺑﻜﻮن ﻏريﻫﺎ ﻣﻦ ﻣﻌﻠﻤﺎت ﺗﻮزﻳﻊ اﻹﺟﺎﺑﺔ ،وﻟﻴﺲ املﺘﻮﺳﻂ ُ
ﻓﻘﻂ ،ﺧﺎﺿﻌﺔ ﻟﻠﺘﻨﺒﺆ.
ﻣﻊ ذﻟﻚ ،ﺗﻈﻬﺮ ﻧﺴﺨﺔ أﺧﺮى ﻣﻦ ﺑﻨﻴﺔ اﻟﻨﺎﺗﺞ/املﺘﻨﺒﺊ ﻋﻨﺪﻣﺎ ﺗﻜﻮن اﻹﺟﺎﺑﺔ ﻧﻔﺴﻬﺎ
ﻗﺎﻃﻌﺔ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﺗﻜﻮن اﻹﺟﺎﺑﺔ ﻋﺒﺎرة ﻋﻦ ﻗﺎﺋﻤﺔ ﻣﻦ اﻟﺘﺸﺨﻴﺼﺎت اﻟﻄﺒﻴﺔ
املﻤﻜﻨﺔ ،ورﺑﻤﺎ ﺗﻜﻮن اﻟﻌﻮاﻣﻞ املﺘﻨﺒﺌﺔ ﻣﺰﻳﺠً ﺎ ﻣﻦ اﻷﻋﺮاض )ﻗﺪ ﺗﻜﻮن ﻣﺪرﺟﺔ ﻋﲆ أﻧﻬﺎ
ﺣﺎﴐة أو ﻏﺎﺋﺒﺔ( وﻧﺘﺎﺋﺞ اﻟﺘﺤﺎﻟﻴﻞ اﻟﻄﺒﻴﺔ .وﺗﻨﺪرج ﻫﺬه اﻷﺳﺎﻟﻴﺐ ﺗﺤﺖ اﺳﻢ ﻋﺎم
املﺮاﻗﺐ« .وﺗﺤﺪث اﻟﺤﺎﻟﺔ اﻟﺨﺎﺻﺔ اﻷﻫﻢ ﻣﻦ ﻫﺬه اﻟﻨﻤﺎذج ﻋﻨﺪﻣﺎ ﻳﻜﻮن َ ﻫﻮ »اﻟﺘﺼﻨﻴﻒ
ﻣﺘﻐري اﻹﺟﺎﺑﺔ ﺛﻨﺎﺋﻴٍّﺎ؛ أي ﻳﺄﺧﺬ ﻗﻴﻤﺘني ﻣﻤﻜﻨﺘني ﻓﺤﺴﺐ؛ ﻣﺜﻞ ﻣﺮﻳﺾ/ﺻﺤﻴﺢ ،ﻣﺨﺎﻃﺮة
ﺟﻴﺪة/ﻣﺨﺎﻃﺮة ﺳﻴﺌﺔ ،ﻣﺮﺑﺢ/ﻋﺪﻳﻢ اﻟﺠﺪوى ،اﻟﻜﻠﻤﺔ املﻨﻄﻮﻗﺔ »ﻧﻌﻢ«/اﻟﻜﻠﻤﺔ املﻨﻄﻮﻗﺔ
»ﻻ« )ﰲ ﺑﺮاﻣﺞ اﻟﺘﻌﺮف ﻋﲆ اﻟﻜﻼم( ،ﺑﺼﻤﺔ ﻣﴫح ﺑﻬﺎ/ﺑﺼﻤﺔ ﻏري ﻣﴫح ﺑﻬﺎ )ﰲ
أﻧﻈﻤﺔ املﻘﺎﻳﻴﺲ اﻟﺤﻴﻮﻳﺔ ﻟﻠﺘﻌﺮف ﻋﲆ اﻷﺷﺨﺎص( ،ﺻﻔﻘﺔ اﺣﺘﻴﺎﻟﻴﺔ/ﺻﻔﻘﺔ ﴍﻋﻴﺔ ،وﻣﺎ
ﺷﺎﺑﻪ ذﻟﻚ .وﰲ ﻛﻞ ﺣﺎل ،ﻓﺈن اﻟﻬﺪف ﺳﻴﻜﻮن ﺑﻨﺎء ﻧﻤﻮذج ﻳُﻤ ﱢﻜﻨﻨﺎ ﻣﻦ ﺗﺤﺪﻳﺪ اﻟﻔﺌﺔ اﻷﻛﺜﺮ
ً
اﺣﺘﻤﺎﻻ ﻟﻠﺤﺎﻻت اﻟﺠﺪﻳﺪة ،ﻣﺴﺘﺨﺪﻣً ﺎ ﻓﺤﺴﺐ املﻌﻠﻮﻣﺎت ﰲ املﺘﻐريات املﺘﻨﺒﺌﺔ.
ﻃﻮر ﻋﺪد ﻛﺒري ﻣﻦ اﻷدوات اﻹﺣﺼﺎﺋﻴﺔ ملﺜﻞ ﻫﺬه اﻟﺤﺎﻻت .وﻛﺎن ﻣﻦ ﺑني أول
اﻷدوات »ﺗﺤﻠﻴﻞ اﻟﺘﻤﺎﻳﺰ اﻟﺨﻄﻲ« ،اﻟﺬي ﻃﻮر ﰲ ﺛﻼﺛﻴﻨﻴﺎت اﻟﻘﺮن اﻟﻌﴩﻳﻦ ،وﻟﻜﻨﻪ ﻻ ﻳﺰال
ﻣﺴﺘﺨﺪﻣً ﺎ ﻋﲆ ﻧﻄﺎق واﺳﻊ ﻟﻠﻐﺎﻳﺔ ﺣﺘﻰ اﻟﻴﻮم ،ﺳﻮاء ﺑﺸﻜﻠﻪ اﻷﺳﺎﳼ أو ﺑﺘﻮﺳﻴﻌﺎﺗﻪ
ﻈﻰ ﺑﺸﻌﺒﻴﺔ ﻛﺒرية ﰲ ﺑﻌﺾ املﺠﺎﻻت — ﻣﺜﻞ ﺗﻔﺼﻴﻼ .وﺗﻮﺟﺪ ﻃﺮﻳﻘﺔ أﺧﺮى ﺗَﺤ َ
ً اﻷﻛﺜﺮ
اﻟﻄﺐ وإدارة ﻗِ ﻴﻤﺔ اﻟﻌُ ﻤَ ﻼء — ﻫﻲ »ﺗﺤﻠﻴﻞ اﻟﺘﻤﺎﻳﺰ اﻟﻠﻮﺟﺴﺘﻲ« .وﻫﺬا ﻧﺴﺨﺔ ﻣﻦ اﻻﻧﺤﺪار
اﻟﻠﻮﺟﺴﺘﻲ ،وﻫﻮ ﻧﻮع ﻣﻦ اﻟﻨﻤﺎذج اﻟﺨﻄﻴﺔ املﻌﻤﻤﺔ؛ ﻟﺬﻟﻚ ﻳﻈﻬﺮ اﻟﺼﻠﺔ اﻟﻮﺛﻴﻘﺔ ﺑني ﻃﺒﻘﺎت
اﻷدوات .ﰲ اﻟﻮاﻗﻊ ،ﻳﻤﻜﻦ اﻋﺘﺒﺎر اﻻﻧﺤﺪار اﻟﻠﻮﺟﺴﺘﻲ أﺑﺴﻂ أﻧﻮاع »اﻟﺸﺒﻜﺎت اﻟﻌﺼﺒﻴﺔ«.
ﺗُﺴﻤﱠ ﻰ اﻟﺸﺒﻜﺎت اﻟﻌﺼﺒﻴﺔ ﺑﻬﺬا اﻻﺳﻢ ﻷﻧﻬﺎ ُﻗﺪﱢﻣﺖ ﰲ اﻷﺻﻞ ﻛﻨﻤﺎذج ﻟﻄﺮﻳﻘﺔ ﻋﻤﻞ املﺦ؛ ﱠإﻻ
أﻧﻪ ﰲ اﻟﻮﻗﺖ اﻟﺤﺎﴐ ﺗَﺮ ﱠﻛﺰ اﻟﻌﻤﻞ ﰲ ﻫﺬا املﺠﺎل ﻛﺜريًا ﻋﲆ ﺧﺼﺎﺋﺼﻬﺎ اﻹﺣﺼﺎﺋﻴﺔ ﻛﻨﻈﻢ
ﻟﻠﺘﻨﺒﺆ ،ﺑﻐﺾ اﻟﻨﻈﺮ ﻋﻤﺎ إذا ﻛﺎﻧﺖ ﺗﺸ ﱢﻜﻞ ﻧﻤﺎذج ﺟﻴﺪة ﻟﻠﻨﻈﻢ اﻟﻄﺒﻴﻌﻴﺔ أم ﻻ.
وﺗﻮﺟﺪ ﻧﻤﺎذج أﺧﺮى ﻟﻠﺘﺼﻨﻴﻒ املﺮاﻗﺐ ﺗﺸﻤﻞ أﺳﻠﻮب »اﻟﺘﺼﻨﻴﻒ اﻟﺸﺠﺮي« وﻃﺮﻳﻘﺔ
ﻃﺎ ﺟﺪﻳﺪة ﻳﻘﺴﻢ اﻟﻨﻤﻮذج اﻟﺸﺠﺮي املﺘﻐريات إﱃ ﻧﻄﺎﻗﺎت ،وﻳﺼﻨﻒ ﻧﻘﺎ ً »اﻟﺠﺎر اﻷﻗﺮب« .ﱢ
ُﻈﻬﺮ ﺗﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت وﻓﻘﺎ ملﺠﻤﻮﻋﺔ اﻟﻨﻄﺎﻗﺎت اﻟﺘﻲ ﺗﻘﻊ ﻓﻴﻬﺎ .ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻳ ِ ً
أن اﻷﺷﺨﺎص اﻟﺬﻳﻦ ﺗﺰﻳﺪ أﻋﻤﺎرﻫﻢ ﻋﻦ ٥٠ﻋﺎﻣً ﺎ وﻳﻌﻴﺸﻮن ﻧﻤﻂ ﺣﻴﺎة ﻗﻠﻴﻞ اﻟﺤﺮﻛﺔ
ﻣﺆﴍ ﻛﺘﻠﺔ ﺟﺴﻢ أﻛﱪ ﻣﻦ ٢٥؛ ﻣﻌ ﱠﺮﺿﻮن ﻟﺨﻄﺮ اﻹﺻﺎﺑﺔ ﺑﺄﻣﺮاض اﻟﻘﻠﺐ .ﻣﺜﻞ وﻟﺪﻳﻬﻢ ﱢ
103
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻫﺬه اﻟﻨﻤﺎذج ﻳﻤﻜﻦ أن ﺗُﻤﺜﱠﻞ ﰲ ﺻﻮرة ﺑﻨﻴﺔ ﺷﺠﺮﻳﺔ؛ وﻣﻦ ﻫﻨﺎ ﺟﺎءت اﻟﺘﺴﻤﻴﺔ .ﰲ أﺳﻠﻮب
اﻟﺠﺎر اﻷﻗﺮب ،ﻧﺠﺪ اﻟﻜﺎﺋﻨﺎت اﻟﻘﻠﻴﻠﺔ املﻮﺟﻮدة ﰲ ﻣﺠﻤﻮﻋﺔ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﻜﻮن أﻛﺜﺮ ﺷﺒﻬً ﺎ
)أو »أﻛﺜﺮ ﻗﺮﺑًﺎ«( إﱃ اﻟﻜﺎﺋﻦ اﻟﺠﺪﻳﺪ اﻟﺨﺎﺿﻊ ﻟﻠﺘﺼﻨﻴﻒ؛ ﺣﻴﺚ ﻳﺘﺤﺪﱠد اﻟﺘﺸﺎﺑﻪ ﻣﻦ ﻧﺎﺣﻴﺔ
املﺘﻐريات املﺘﻨﺒﱢﺌﺔ .ﺑﻌﺪﻫﺎ ﻳﻮﺿﻊ اﻟﻜﺎﺋﻦ اﻟﺠﺪﻳﺪ ﺑﺒﺴﺎﻃﺔ ﰲ اﻟﻔﺌﺔ ﻧﻔﺴﻬﺎ ﻛﻤﺎ ﻫﻲ ﺣﺎل
ﻏﺎﻟﺒﻴﺔ ﻫﺬه اﻟﻜﺎﺋﻨﺎت املﺘﺸﺎﺑﻬﺔ ﻛﺜريًا.
ً
ﺷﺨﺼﺎ )أي »ﻣﺮاﻗﺒًﺎ«( ﻟﺘﺤﺪﻳﺪ ﺮاﻗﺐ ﺑﻬﺬا اﻻﺳﻢ ﻷﻧﻪ ﻳﺤﺘﺎج وﻳﺴﻤﻰ اﻟﺘﺼﻨﻴﻒ ا ُمل َ
ﺗﺴﻤﻴﺎت ﻓﺌﺎت ﻋﻴﻨﺔ اﻟﺒﻴﺎﻧﺎت ،واﻟﺘﻲ ﻳﻤﻜﻨﻨﺎ ﻣﻦ ﺧﻼﻟﻬﺎ ﺑﻨﺎء ﻗﺎﻋﺪة اﻟﺘﺼﻨﻴﻒ ﻟﺘﻄﺒﻴﻘﻬﺎ
ﻋﲆ اﻟﻜﺎﺋﻨﺎت اﻟﺠﺪﻳﺪة .وﻣﻊ ذﻟﻚ ،ﻻ ﻳﻮﺟﺪ ﰲ ﻣﺴﺎﺋﻞ اﻟﺘﺼﻨﻴﻒ اﻷﺧﺮى أي ﺗﺴﻤﻴﺔ ﻟﻠﻔﺌﺎت،
واﻟﻬﺪف ﻫﻮ ﺑﺒﺴﺎﻃﺔ ﺗﻘﺴﻴﻢ اﻟﻜﺎﺋﻨﺎت إﱃ ﻓﺌﺎت ﻃﺒﻴﻌﻴﺔ ،أو رﺑﻤﺎ ﻓﺌﺎت ﻣﻼﺋﻤﺔ .وﻳﻤﻜﻨﻨﺎ
اﻟﻘﻮل إن اﻟﻬﺪف ﻣﻦ ذﻟﻚ ﻫﻮ ﺗﺤﺪﻳﺪ اﻟﻔﺌﺎت؛ ﻓﻔﻲ اﻟﻄﺐ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﺗﻜﻮن
ﻟﺪﻳﻨﺎ ﻋﻴﻨﺔ ﻣﻦ املﺮﴇ ﻟﻜ ﱟﻞ ﻣﻨﻬﻢ ﺗﻔﺎﺻﻴﻞ ﻋﻦ أﻧﻤﺎط اﻷﻋﺮاض وﻧﺘﺎﺋﺞ اﻟﺘﺤﺎﻟﻴﻞ ،ورﺑﻤﺎ
َ
ﻣﻌﺮﻓﺔ ﻧﻈﻦ أن ﻋﺪة أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻷﻣﺮاض ﻣﻤﺜﻠﺔ ﰲ اﻟﻌﻴﻨﺔ .ﺳﻴﻜﻮن ُ
ﻫﺪﻓﻨﺎ ﺣﻴﻨﻬﺎ
ﻣﺎ إذا ﻛﺎن املﺮﴇ ﻳﺸ ﱢﻜﻠﻮن ﻣﺠﻤﻮﻋﺎت ﻣﺨﺘﻠﻔﺔ ﻣﻦ ﻣﻨﻈﻮر اﻷﻋﺮاض وﻧﺘﺎﺋﺞ اﻟﺘﺤﺎﻟﻴﻞ.
وﻳﻄﻠﻖ ﻋﲆ اﻷدوات اﻹﺣﺼﺎﺋﻴﺔ ﻻﺳﺘﻜﺸﺎف ﻫﺬه اﻟﺘﺠﻤﻌﺎت اﺳﻢ »اﻟﺘﺤﻠﻴﻞ اﻟﻌﻨﻘﻮدي«.
ﻛﺎن ﻟﻬﺬه اﻷﺳﺎﻟﻴﺐ ﻓﺎﺋﺪة ﻛﺒرية ﰲ ﺗﺤﺪﻳﺪ اﻟﻔﺮق ﺑني اﻻﻛﺘﺌﺎب اﻷﺣﺎدي اﻟﻘﻄﺐ واﻟﺜﻨﺎﺋﻲ
اﻟﻘﻄﺐ ،وﺗﺴﺘﺨﺪم ﰲ ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ املﺠﺎﻻت اﻷﺧﺮى ،ﻣﻨﻬﺎ — ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل —
إدارة ﻗﻴﻤﺔ اﻟﻌﻤﻼء واﻟﺘﺴﻮﻳﻖ؛ ﺣﻴﺚ ﺗﻜﻤﻦ ﻓﺎﺋﺪﺗﻬﺎ ﰲ ﺗﺤﺪﻳ ِﺪ ﻣﺎ إذا ﻛﺎن ﻳﻮﺟﺪ أﻧﻮاع
ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﻌﻤﻼء أم ﻻ.
ﺑﺪﻻ ﻣﻦ ذﻟﻚ ،ﻓﺈن اﻟﻬﺪفﰲ اﻟﺘﺤﻠﻴﻞ اﻟﻌﻨﻘﻮدي ،ﻻ ﻳﻮﺟﺪ ﻣﺘﻐري »ﻧﺎﺗﺞ« وﻻ »إﺟﺎﺑﺔ«ً .
ﻫﻮ ﻣﺠﺮد وﺻﻒ اﻟﺒﻴﺎﻧﺎت ﻋﲆ ﻧﺤﻮ ﺳﻬﻞ .وﺛﻤﺔ أدوات إﺣﺼﺎﺋﻴﺔ أﺧﺮى ﻟﻬﺎ اﻟﻬﺪف ﻧﻔﺴﻪ،
ﻋﲆ اﻟﺮﻏﻢ ﻣﻦ أﻧﻬﺎ ﺗﺴﻌﻰ إﱃ وﺻﻒ ﻣﻦ ﻧﻮع ﻣﺨﺘﻠﻒ ﺗﻤﺎﻣً ﺎ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل» ،اﻟﻨﻤﻮذج
اﻟﺒﻴﺎﻧﻲ« ﻫﻮ وﺻﻒ ﻣﺒﺴﻂ ﻟﻠﻌﻼﻗﺎت ﺑني ﻋﺪة ﻣﺘﻐريات — ورﺑﻤﺎ ﻋﺪد ﻛﺒري ﻣﻨﻬﺎ —
اﺳﺘﻨﺎدًا إﱃ اﻓﱰاض أن اﻟﻌﻼﻗﺎت ﺑني اﻟﻌﺪﻳﺪ ﻣﻦ املﺘﻐريات ﺗﺴﺒﺒﻬﺎ ﻋﻼﻗﺎت وﺳﻴﻄﺔ ﻣﻊ
ً
ﺳﺎﺑﻘﺎ؛ ﻓﺮﺑﻤﺎ ﻛﺎن اﻻرﺗﺒﺎط اﻹﻳﺠﺎﺑﻲ ﻣﺜﺎﻻ ﺑﺴﻴ ً
ﻄﺎ ﺟﺪٍّا ﻋﲆ ﻫﺬا ﻣﺘﻐريات أﺧﺮى .وﻗﺪ رأﻳﻨﺎ ً
ﺑني اﻟﻘﺪرة ﻋﲆ اﻟﻘﺮاءة واﻟﻘﺪرة اﻟﺤﺴﺎﺑﻴﺔ ﻟﺪى اﻷﻃﻔﺎل ﻧﺘﻴﺠﺔ ﻟﻠﻌﻼﻗﺔ ﺑني ﻛﻼ ﻫﺬﻳﻦ
املﺘﻐريﻳﻦ واﻟﻌﻤﺮ.
ﻳﻤﻜﻦ اﻟﺘﻮﺳﻊ ﰲ ﻫﺬه اﻟﻨﻤﺎذج ﻣﻦ ﺧﻼل اﻓﱰاض أن ﺑﻌﺾ اﻟﻌﻼﻗﺎت ﺳﺒﺒﻬﺎ
املﺘﻐريات »اﻟﻜﺎﻣﻨﺔ« ﻏري املﻘﻴﺴﺔ اﻟﺘﻲ ﺗﺘﻌﻠﻖ ﺑﺒﻌﺾ املﺘﻐريات املﺮﺻﻮدة؛ وﻣﻦ ﺛ َ ﱠﻢ ﺗﺤﻔﺰ
104
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
ﻋﻼﻗﺔ واﺿﺤﺔ ﺑﻴﻨﻬﻤﺎ؛ ﻓﻌﲆ ﺳﺒﻴﻞ املﺜﺎل ،رﺑﻤﺎ ﻧﻼﺣﻆ أن أﺳﻌﺎر أﺳﻬﻢ ﺑﻌﺾ اﻟﴩﻛﺎت
ﺗﺮﺗﻔﻊ أو ﺗﻨﺨﻔﺾ ﻣﻌً ﺎ .إﺣﺪى ﻃﺮق ﺗﻔﺴري ﻫﺬا ﻗﺪ ﺗﺘﻤﺜﻞ ﰲ ﺗﺨﻤني وﺟﻮد ﺑﻌﺾ املﺘﻐريات
اﻟﺨﻔﻴﺔ )ﺑﻌﺾ ﺟﻮاﻧﺐ اﻻﻗﺘﺼﺎد ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل( اﻟﺘﻲ ﺗﺮﺗﺒﻂ ﺑﻜﻞ ﺳﻌﺮ؛ وﻣﻦ ﺛ َ ﱠﻢ ﺗﺤﻔﺰ
اﻟﻌﻼﻗﺔ ﺑني ﻫﺬه اﻷﺳﻌﺎر؛ ﻓﻌﻨﺪﻣﺎ ﻳﺰﻳﺪ املﺘﻐري اﻟﺨﻔﻲ ،ﺗﺮﺗﻔﻊ ﻛﻞ اﻷﺳﻌﺎر .ﺗﺸﻜﻞ ﻫﺬه
اﻷﻓﻜﺎر أﺳﺎس ﻧﻤﺎذج »اﻟﺘﺤﻠﻴﻞ اﻟﻌﺎﻣﲇ« ،وﻏﺎﻟﺒًﺎ ﻣﺎ ﻳُﺴﻤﱠ ﻰ املﺘﻐري اﻟﻜﺎﻣﻦ ﺑﺎﺳﻢ »اﻟﻌﺎﻣﻞ
ﻔﴪ ﺳﻠﺴﻠﺔ اﻟﻜﺎﻣﻦ« .ﻛﻤﺎ أﻧﻬﺎ ﺗﺸﻜﻞ أﺳﺎس »ﻧﻤﺎذج ﻣﺎرﻛﻮف املﺨﻔﻴﺔ« ،واﻟﺘﻲ ﻓﻴﻬﺎ ﺗُ ﱠ
ﻗﻴﻢ ﻣﺮﺻﻮدة ﰲ ﺳﻴﺎق ﺣﺎﻻت ﺧﻔﻴﺔ ﻟﻠﻨﻈﺎم؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،املﺮﴇ اﻟﺬﻳﻦ ﻳﻌﺎﻧﻮن ﻣﻦ
ُﺸﻔﻮْن ﻋﲆ ﺑﻌﺾ اﻷﻣﺮاض ﻳﺘﻔﺎوﺗﻮن ﻣﻦ ﺣﻴﺚ ﺟﻮدة اﻟﺤﻴﺎة ،ﻓﺄﺣﻴﺎﻧًﺎ ﻳﻨﺘﻜﺴﻮن وأﺣﻴﺎﻧًﺎ ﻳ َ
ﻧﺤﻮ ﻣﺆﻗﺖ .وﻳﻤﻜﻦ ﻧﻤﺬﺟﺔ ﻫﺬا اﻟﺘﻌﺎﻗﺐ ﰲ ﺳﻴﺎق اﻟﺤﺎﻻت اﻷﺳﺎﺳﻴﺔ املﺘﻐرية.
إذا ﻛﺎﻧﺖ أﺳﺎﻟﻴﺐ اﻟﺘﺼﻨﻴﻒ ُﺳﻤﱢ ﻴﺖ ﺗﻴﻤﱡ ﻨًﺎ ﺑﺄﻧﻮاع املﺴﺎﺋﻞ املﺼﻤﱠ ﻤﺔ ﻟﺤﻠﻬﺎ ،ﻓﻘﺪ ﺳﻤﻴﺖ
أﺳﺎﻟﻴﺐ أﺧﺮى ﺗﻴﻤﻨًﺎ ﺑﻄﺒﻴﻌﺔ اﻟﺒﻴﺎﻧﺎت اﻟﺘﻲ ﺗﻌﻤﻞ ﻋﻠﻴﻬﺎ؛ ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،أﺳﺎﻟﻴﺐ
»ﺗﺤﻠﻴﻞ اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨﻴﺔ« ﺗﻌﻤﻞ ﻋﲆ اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨﻴﺔ؛ أي املﻼﺣﻈﺎت املﺘﻜﺮرة ﻟﻠﻤﺘﻐري
أو املﺘﻐريات ﻧﻔﺴﻬﺎ ﻋﲆ ﻣﺪار ﺗﺴﻠﺴﻞ زﻣﻨﻲ .وﻫﻴﺎﻛﻞ اﻟﺒﻴﺎﻧﺎت ﺗﻠﻚ ﻣﻮﺟﻮدة ﰲ ﻛﻞ
ﻣﻜﺎن؛ ﻓﻬﻲ ﺗﻮﺟﺪ ﰲ اﻻﻗﺘﺼﺎد )ﻣﺜﻞ ﻗﻴﺎﺳﺎت اﻟﺘﻀﺨﻢ واﻟﻨﺎﺗﺞ املﺤﲇ اﻹﺟﻤﺎﱄ واﻟﺒﻄﺎﻟﺔ(،
واﻟﻬﻨﺪﺳﺔ ،واﻟﻄﺐ )ﻣﺜﻞ وﺣﺪات اﻟﻌﻨﺎﻳﺔ املﺮﻛﺰة( ،وﰲ ﻛﺜري ﻣﻦ املﺠﺎﻻت اﻷﺧﺮى .وﰲ
ﺗﺤﻠﻴﻞ اﻟﺴﻼﺳﻞ اﻟﺰﻣﻨﻴﺔ ،رﺑﻤﺎ ﻳﻜﻮن ﻫﺪﻓﻨﺎ ﻫﻮ ﻓﻬﻤﻬﺎ ،أو ﺗﺤﻠﻴﻠﻬﺎ إﱃ ﻣﻜﻮﻧﺎﺗﻬﺎ اﻟﺮﺋﻴﺴﻴﺔ
)ﻣﺜﻞ اﻟﻨﺰﻋﺔ واملﻮﺳﻤﻴﺔ( ،أو رﺻﺪ ﻣﺘﻰ ﻳﺘﻐري ﺳﻠﻮك اﻟﻨﻈﺎم ،أو رﺻﺪ اﻟﺤﺎﻻت اﻟﺸﺎذة
)ﻣﺜﻞ اﻟﺘﻨﺒﺆ ﺑﺎﻟﺰﻻزل( ،أو ﺗﻮﻗﻊ اﻟﻘﻴﻢ املﺴﺘﻘﺒﻠﻴﺔ املﺤﺘﻤﻠﺔ ،أو ﻣﻦ أﺟﻞ ﻣﺠﻤﻮﻋﺔ ﻣﻦ
اﻷﺳﺒﺎب اﻷﺧﺮى .وﻗﺪ ﻃﻮرت ﻣﺠﻤﻮﻋﺔ ﻛﺒرية ﻣﻦ اﻷﺳﺎﻟﻴﺐ ﻟﺘﺤﻠﻴﻞ ﻫﺬه اﻟﺒﻴﺎﻧﺎت.
105
ﻋﻠﻢ اﻹﺣﺼﺎء
١١٫٥
١٠٠ﻣﱰ
١١
٥٢
٥١
٥٠
٤٠٠ﻣﱰ
٤٩
٤٨
١٦
١٥
١٤
دﻓﻊ اﻟﺠُ ﻠﺔ ١٣
١٢
١١
١٠
٥٠
٤٥
٤٠
ﻗﺬف اﻟﻘﺮص
٣٥
٣٠
ﺷﻜﻞ » :2-6ﻣﺼﻔﻮﻓﺔ اﻟﺸﻜﻞ اﻻﻧﺘﺸﺎري« اﻟﺘﻲ ﺗُ ﱢﺒني أوﻗﺎت ﺳﺒﺎق اﻟﻌَ ﺪْو ١٠٠ﻣﱰ و ٤٠٠ﻣﱰ
)ﺑﺎﻟﺜﻮاﻧﻲ( ،واملﺴﺎﻓﺎت )ﺑﺎﻷﻣﺘﺎر( ﻟﺪﻓﻊ اﻟﺠُ ﻠﺔ وﻗﺬف اﻟﻘﺮص ﻟﻠﻤﻨﺎﻓﺴني ﰲ ﻋﺸﺎري اﻟﺮﺟﺎل ﰲ
َ
اﻟﻌﻼﻗﺔ ﺑني اﺛﻨني ﻣﻦ املﺘﻐريات اﻷرﺑﻌﺔ. ﱢ
وﻳﺒني ﻛﻞ ﻣﺮﺑﻊ دورة اﻷﻟﻌﺎب اﻷوملﺒﻴﺔ ﻋﺎم .١٩٨٨
ﻋﲆ ﻧﺤﻮ ﻣﺒﺎﴍ. واﺿﺢٌ واﻟﱰاﺑﻂ اﻟﻘﻮي ﺑني ﻧﺘﺎﺋﺞ ﺣﺪﺛ َ ِﻲ اﻟﺮﻣﻲ
106
اﻟﻨﻤﺎذج واﻷﺳﺎﻟﻴﺐ اﻹﺣﺼﺎﺋﻴﺔ
١٥٠٠٠
)ﺑﺎﻟﺠﻨﻴﻪ اﻹﺳﱰﻟﻴﻨﻲ(
اﻟﺴﺤﺐ اﻟﻨﻘﺪي
١٠٠٠٠
٥٠٠٠
٠
٠ ٥٠ ١٠٠ ١٥٠
ﻋﺪد اﻷﻳﺎم
ﺷﻜﻞ :3-6ﻣﺨﻄﻂ اﻟﺴﻠﺴﻠﺔ اﻟﺰﻣﻨﻴﺔ اﻟﺬي ﻳﺒني املﺒﻠﻎ املﺴﺤﻮب ﻣﻦ ﺟﻬﺎز ﴏاف آﱄ ﻛﻞ
ً
وأﻳﻀﺎ وﺟﻮد ﻧﺰﻋﺔ ﻣﺘﺰاﻳﺪة ﻳﻮم .ﻳﺒني اﻟﺸﻜﻞ ﺑﻮﺿﻮح وﺟﻮد دورات أﺳﺒﻮﻋﻴﺔ وﺷﻬﺮﻳﺔ،
ﺗﺪرﻳﺠﻴٍّﺎ ﻣﻊ ﻣﺮور اﻟﻮﻗﺖ .وﻳﺘﻀﺢ ً
أﻳﻀﺎ وﺟﻮد ﻗﻴﻤﺔ ﻣﻨﺨﻔﻀﺔ ﻋﲆ ﻧﺤﻮ ﻣﻔﺎﺟﺊ ﺑﺎﻟﻘﺮب ﻣﻦ
ﻧﻬﺎﻳﺔ اﻟﻔﱰة.
٦٠
٤٠
١
٢٠
٠,٨
ﺗﺸ
ﺘﻴﺖ
٠,٦
ﺿﻮء
٠٫٦
٠٫٨
ﺑﺰاو
٠,٤
ﻣ ﺎﻣ ﻲ
ﻳﺔ ٠
ﺿﻮء أ ١
٩د
ﺸﺘﻴﺖ ١,٢
ﺗ ٠,٢
رﺟﺔ
ﺷﻜﻞ :4-6ﺗﻮزﻳﻊ ﻗِ ﻴَﻢ ﺗﺸﺘﻴﺖ اﻟﻀﻮء ﻣﻦ ﺧﻼﻳﺎ ﻋﻮاﻟﻖ ﻧﺒﺎﺗﻴﺔ ﻣﻦ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ .ﰲ اﻟﻮاﻗﻊ،
ﻳُﻌﺮض ﺛﻼﺛﺔ أﻧﻮاع ﻫﻨﺎ ،وﻟﻜﻦ ﻳﻤﺘﻠﻚ اﺛﻨﺎن ﻣﻨﻬﺎ ﺗﻮزﻳﻌني ﻟﻠﻘﻴﻢ ﻣﺘﺸﺎﺑﻬني ﺟﺪٍّا؛ ﻟﺬﻟﻚ ﻳﺘﺠﻤﻊ
ﻫﺬان اﻟﺘﻮزﻳﻌﺎن ﻟﺘﻜﻮﻳﻦ ﻗﻤﺔ ﻋﺎﻟﻴﺔ واﺣﺪة.
107
ﻋﻠﻢ اﻹﺣﺼﺎء
ﺧﺎﺗﻤﺔ
َﻗﺪﱠم ﻫﺬا اﻟﻔﺼﻞ ﻣﺮاﺟﻌﺔ ﴎﻳﻌﺔ ﻟﻌﺪد ﻗﻠﻴﻞ ﻣﻦ اﻷدوات اﻹﺣﺼﺎﺋﻴﺔ املﻬﻤﺔ ،وﻟﻜﻦ ﻳﻮﺟﺪ
اﻟﻌﺪﻳﺪ ﻣﻦ اﻷدوات اﻷﺧﺮى اﻟﺮاﺋﻌﺔ اﻟﺘﻲ ﻟﻢ أذﻛﺮﻫﺎ .وﺗﺘﻨﺎﺳﺐ اﻟﻨﻤﺎذج املﺨﺘﻠﻔﺔ ﻣﻊ
أﻧﻮاع املﺴﺎﺋﻞ املﺨﺘﻠﻔﺔ وأﻧﻮاع اﻟﺒﻴﺎﻧﺎت املﺨﺘﻠﻔﺔ ،وﻳﻮﺟﺪ ﻋﺪد ﻻ ﻧﻬﺎﺋﻲ ﻣﻦ املﺴﺎﺋﻞ وﺑﻨﻰ
أﻳﻀﺎ أن ﻧﺪرك أن اﻟﻨﻤﺎذج ﻟﻴﺴﺖ ﻛﻴﺎﻧﺎت ﻣﻌﺰوﻟﺔ؛ ﻓﺎﻟﺤﻘﻴﻘﺔ ﻫﻲ أن اﻟﺒﻴﺎﻧﺎت .وﻣﻦ املﻬﻢ ً
اﻟﻨﻤﺎذج املﺨﺘﻠﻔﺔ ﺗﺮﺗﺒﻂ ﺑﻄﺮق ﻣﺘﻌﺪدة؛ ﻓﺮﺑﻤﺎ ﺗﻜﻮن اﻟﻨﻤﺎذج ﺗﻌﻤﻴﻤً ﺎ ﻷﻧﻮاع أﺧﺮى ﻣﻦ
اﻟﻨﻤﺎذج أو ﺗﻜﻮن ﺣﺎﻻت ﺧﺎﺻﺔ ﻣﻨﻬﺎ أو ﺗﺘﻜﻴﻒ ﻣﻊ أﻧﻮاع ﻣﺨﺘﻠﻔﺔ ﻣﻦ اﻟﺒﻴﺎﻧﺎت ،ﺑَﻴْ َﺪ أﻧﻬﺎ
ﻣُﺪﻣَ ﺠَ ﺔ ﺟﻤﻴﻌً ﺎ ﰲ ﺷﺒﻜﺔ ﻏﻨﻴﺔ ﻣﻦ اﻟﻌﻼﻗﺎت.
108
اﻟﻔﺼﻞ اﻟﺴﺎﺑﻊ
اﳊﻮﺳﺒﺔ اﻹﺣﺼﺎﺋﻴﺔ
رأﻳﻨﺎ ﰲ املﻨﺎﻗﺸﺎت اﻟﺴﺎﺑﻘﺔ ﻛﻴﻒ أن اﻹﻓﺮاط ﰲ املﻄﺎﺑﻘﺔ ﻳﻤﻜﻦ أن ﻳﻤﺜﻞ ﻣﺸﻜﻠﺔ ،ﻟﻜﻨﻨﺎ ﻟﻢ
أﻳﻀﺎ إﱃ اﻟﺤﻞ؛ إذ إﻧﻨﺎ ﺑﺒﺴﺎﻃﺔ أﴍﻧﺎ إﱃ أﻧﻪ ﻛﺎن ﻣﻦ اﻟﴬوري اﺧﺘﻴﺎر ﻧﻤﺎذج ﻧﺘﻄﺮق ً
ﻟﻴﺴﺖ ﻣﻌﻘﺪة ﻟﻠﻐﺎﻳﺔ وﻻ ﺑﺴﻴﻄﺔ ﻟﻠﻐﺎﻳﺔ .وﺑﺪون اﻣﺘﻼك ﺧﱪة ﻛﺒرية ﰲ ﻣﺠﺎل اﻟﻨﻤﺬﺟﺔ
اﻹﺣﺼﺎﺋﻴﺔ ،ﻟﻴﺴﺖ ﻫﺬه ﻧﺼﻴﺤﺔ ﻣﻔﻴﺪة ﺟﺪٍّا ،وﺗﻮﺟﺪ ﺣﺎﺟﺔ إﱃ ﻣﺰﻳﺪ ﻣﻦ اﻟﻄﺮق املﻮﺿﻮﻋﻴﺔ.
ﱡ
»اﻟﺘﺤﻘﻖ املﺘﺒﺎدل«. وﺗﺴﺘﻨﺪ إﺣﺪى ﻫﺬه اﻟﻄﺮق إﱃ ﻣﺒﺪأ
ﺗﻮاﺻﻞ ﺟﻮد ُة ﻣﻄﺎﺑﻘﺘﻪ
ﻛﻤﺎ رأﻳﻨﺎ أﻧﻪ — ﺑﺼﻔﺔ ﻋﺎﻣﺔ — ﺑﻴﻨﻤﺎ ﻳﺰداد ﺗﻌﻘﻴﺪ اﻟﻨﻤﻮذجِ ،
اﻟﺘﺤﺴﻦ ،ﱠإﻻ أن ﺟﻮدة ﻣﻄﺎﺑﻘﺘﻪ ﻣﻊ ﻋﻴﻨﺎت أﺧﺮى ﻣﺴﺘﻤَ ﺪﱠة ﻣﻦ اﻟﺘﻮزﻳﻊ
َ ﻣﻊ اﻟﺒﻴﺎﻧﺎت املﺘﺎﺣﺔ
ْ
وﻟﻜﻦ ﺑﻌﺪ ذﻟﻚ ﺗﺒﺪأ ﰲ اﻟﺘﺪﻫﻮر. ﻧﻔﺴﻪ )أو »أداﺋﻪ ﺧﺎرج اﻟﻌﻴﻨﺔ«( ﺗﺘﺤﺴﻦ ﻋﺎدة ﰲ اﻟﺒﺪاﻳﺔ،
ﺗﻤﺜﻴﻼ ﻟﻠﺒﻴﺎﻧﺎت اﻟﺠﺪﻳﺪة ،وﻫﻲ ﻣﺎ ﻧﺤﻦ ﻣﻬﺘﻤﻮن ﺑﻪ ٍّ
ﺣﻘﺎ. ً ﻫﻨﺎ ﺗﻜﻮن »اﻟﻌﻴﻨﺎت اﻷﺧﺮى«
ﻣﻄﺎﺑﻘﺎ ﻋﲆ ﻧﺤﻮ أﻓﻀﻞ ﻣﻊ ﺑﻴﺎﻧﺎت »ﻋﻴﻨﺔ أﺧﺮى« ﻳﺒﺪو ً واﻟﻨﻘﻄﺔ اﻟﺘﻲ ﻳﻜﻮن ﻓﻴﻬﺎ اﻟﻨﻤﻮذج
أن ﻣﻦ ﺷﺄﻧﻬﺎ أن ﺗﻤﻨﺤﻨﺎ ﻧﻤﻮذﺟً ﺎ ذا ﻣﺴﺘﻮًى ﻣﻨﺎﺳﺐ ﻣﻦ اﻟﺘﻌﻘﻴﺪ .وﻫﺬا ﻫﻮ ﻣﻔﺘﺎح اﻟﺤﻞ؛
ﻓﻴﺠﺐ ﻋﻠﻴﻨﺎ ﺗﻘﺪﻳﺮ ﻣﻌﻠﻤﺎت اﻟﻨﻤﻮذج ﺑﺎﺳﺘﺨﺪام ﻋﻴﻨﺔ واﺣﺪة ،وﺗﻘﻴﻴﻢ أداﺋﻪ ﺑﺎﺳﺘﺨﺪام
ﻋﻴﻨﺔ أﺧﺮى.
ﻋﻠﻢ اﻹﺣﺼﺎء
ﻟﻸﺳﻒ ،ﻋﺎد ًة ﻣﺎ ﻧﻤﺘﻠﻚ ﻋﻴﻨﺔ واﺣﺪة ﻓﻘﻂ .وإﺣﺪى ﻃﺮق ﻣﻮاﺟﻬﺔ ذﻟﻚ ﺗﺘﻤﺜﻞ ﰲ
ﺗﻘﺴﻴﻢ ﻫﺬه اﻟﻌﻴﻨﺔ )ﻋﺸﻮاﺋﻴٍّﺎ( إﱃ ﻋﻴﻨﺘني ﻓﺮﻋﻴﺘني .وﺗﺴﺘﺨﺪم ﻋﻴﻨﺔ ﻓﺮﻋﻴﺔ واﺣﺪة )ﺗُﺴﻤﱠ ﻰ
»ﻋﻴﻨﺔ اﻟﺘﺪرﻳﺐ« أو »ﻋﻴﻨﺔ اﻟﺘﺼﻤﻴﻢ«( ﻟﺘﻘﺪﻳﺮ املﻌﻠﻤﺔ ،وﺗﺴﺘﺨﺪم اﻷﺧﺮى )ﺗُﺴﻤﱠ ﻰ »ﻋﻴﻨﺔ
اﻟﺘﺤﻘﻖ«( ﻟﺘﻘﻴﻴﻢ اﻷداء واﺧﺘﻴﺎر اﻟﻨﻤﻮذج .وﻫﺬا ﻫﻮ أﺳﻠﻮب اﻟﺘﺤﻘﻖ املﺘﺒﺎدل .وﰲ اﻟﻌﺎدة،
ﻟﺘﺨﻔﻴﻒ أي ﻣﺸﺎﻛﻞ ﻧﺎﺟﻤﺔ ﻋﻦ ﻛﻮن اﻟﻌﻴﻨﺔ اﻟﻔﺮﻋﻴﺔ املﺴﺘﺨﺪﻣﺔ ﻟﺘﻘﺪﻳﺮ املﻌﻠﻤﺎت ﻟﻴﺴﺖ
ﻫﻲ ﻣﺠﻤﻞ اﻟﻌﻴﻨﺔ اﻷﺻﻠﻴﺔ ،ﻳُﻜﺮر ﻫﺬا اﻹﺟﺮاء ﻋﺪة ﻣﺮات؛ ﻳﻌﻨﻲ ﻫﺬا أن اﻟﻌﻴﻨﺔ اﻷﺻﻠﻴﺔ
ﻘﺴﻢ ﻋﺸﻮاﺋﻴٍّﺎ إﱃ ﻋﻴﻨﺘني ،وﺗُﻘﺪﱠر املﻌﻠﻤﺎت ﺑﺎﺳﺘﺨﺪام ﻋﻴﻨﺔ ﻓﺮﻋﻴﺔ واﺣﺪة ،وﻳُﻘﻴﱠﻢ اﻟﻨﻤﻮذج ﺗُ ﱠ
ﺑﺎﺳﺘﺨﺪام اﻷﺧﺮى .وﻳُﻜ ﱠﺮر ﻫﺬا ﺑﺘﻘﺴﻴﻤﺎت ﻋﺸﻮاﺋﻴﺔ ﻣﺨﺘﻠﻔﺔ ﻟﻠﻌﻴﻨﺔ .وأﺧريًا ،ﻳُﺤﺴﺐ
ﻗﻴﺎس ﻋﺎ ﱞم ﻟﻸداء املﺴﺘﻘﺒﲇ املﺮﺟﺢ.
ٌ ﻣﺘﻮﺳﻂ ﻧﺘﺎﺋﺞ ﺗﻘﻴﻴﻢ ﻛﻞ اﻟﺘﻘﺴﻴﻤﺎت ،ﻟﻜﻲ ﻳَﻨﺘُﺞ
وﺳﻤﱢ ﻲ ﻫﻜﺬا ﻟﻠﺴﺒﺐ اﻟﻮاﺿﺢ ﻣﺜﺎﻻ ﻋﲆ ﻧﻬﺞ »ﻣﻜﺜﱠﻒ ﺣﺎﺳﻮﺑﻴٍّﺎ«؛ ُ ﻳُﻌَ ﱡﺪ اﻟﺘﺤﻘﻖ املﺘﺒﺎدَل ً
املﺘﻤﺜﻞ ﰲ ﴐورة ﺑﻨﺎء ﻧﻤﺎذج ﻣﺘﻌﺪدة .وﺗﻮﺟﺪ ﻓﺌﺔ أﺧﺮى ﻣﻬﻤﺔ ﻣﻦ ﻫﺬه اﻷﺳﺎﻟﻴﺐ ﻫﻲ
ﱠ
وﻟﻜﻦ أﺣﺪ »ﺗﻘﻨﻴﺔ إﻋﺎدة املﻌﺎﻳﻨﺔ« ،وﻟﻬﺬه اﻟﻄﺮﻳﻘﺔ ﻣﺠﻤﻮﻋﺔ ﻣﺘﻨﻮﻋﺔ ﻣﻦ اﻻﺳﺘﺨﺪاﻣﺎت،
اﺳﺘﺨﺪاﻣﺎﺗﻬﺎ املﻬﻤﺔ ﻳﺘﻤﺜﻞ ﰲ ﺗﻘﺪﻳﺮ ﻋﺪم اﻟﻴﻘني املﺮﺗﺒﻂ ﺑﺎﻟﻨﻤﺎذج املﻌﻘﺪة؛ أي ﺗﺤﺪﻳﺪ ﻣﺪى
اﻻﺧﺘﻼف اﻟﺬي ﻳﻤﻜﻨﻨﺎ أن ﻧﺘﻮﻗﻊ أن ﻳﺼﺒﺢ ﻋﻠﻴﻪ اﻟﻨﻤﻮذج إذا ﻛﻨﱠﺎ ﻗﺪ أﺧﺬﻧﺎ ﻋﻴﻨﺔ ﺑﻴﺎﻧﺎت
ﻣﺨﺘﻠﻔﺔ .وﺗﻌﻤﻞ ﻃﺮق إﻋﺎدة املﻌﺎﻳﻨﺔ ﻣﻦ ﺧﻼل أﺧﺬ ﻋﻴﻨﺎت ﻓﺮﻋﻴﺔ ﻋﺸﻮاﺋﻴﺔ ﺑﺤﺠﻢ اﻟﻌﻴﻨﺔ
اﻷﺻﻠﻴﺔ ﻧﻔﺴﻬﺎ ﻣﻦ اﻟﻌﻴﻨﺔ اﻷﺻﻠﻴﺔ )وﻫﻮ ﻣﺎ ﻳﻌﻨﻲ أن ﺑﻌﺾ ﻧﻘﺎط اﻟﺒﻴﺎﻧﺎت ﺳﺘﺴﺘﺨﺪم
أﻛﺜﺮ ﻣﻦ ﻣﺮة( .وﻳﺒﻨﻰ ﻧﻤﻮذج ﺟﺪﻳﺪ ،ﺑﺎﻟﺸﻜﻞ ﻧﻔﺴﻪ ﻟﻠﻨﻤﻮذج اﻟﺬي ﻳﺠﺮي ﺗﻘﻴﻴﻤﻪ ،ﻟﻜﻞ
ﻋﻴﻨﺔ ﻣﻦ ﻫﺬه اﻟﻌﻴﻨﺎت اﻟﻔﺮﻋﻴﺔ .ﻳﺒﺪو اﻷﻣﺮ ﻛﻤﺎ ﻟﻮ ﻛﺎن ﻟﺪﻳﻨﺎ ﻋﻴﻨﺎت ﻣﺘﻌﺪدة ،وﻛﻠﻬﺎ
ﺑﺎﻟﺤﺠﻢ ﻧﻔﺴﻪ ،ﻣﻦ اﻟﺘﻮزﻳﻊ اﻷﺻﲇ ،وﺗُﻨﺘﺞ ﻛ ﱞﻞ ﻣﻨﻬﺎ ﻧﻤﻮذﺟً ﺎ ﻣُﻘ ﱠﺪ ًرا .وﻳﻤﻜﻦ ﺑﻌﺪ ذﻟﻚ
اﺳﺘﺨﺪام ﻣﺠﻤﻮﻋﺔ اﻟﻨﻤﺎذج ﺗﻠﻚ ملﻌﺮﻓﺔ ﻛﻴﻒ ﻛﺎن ﻳﻤﻜﻦ أن ﻳﺨﺘﻠﻒ ﻫﺬا اﻟﻨﻤﻮذج إذا ﻛﻨﱠﺎ
ﻗﺪ أﺧﺬﻧﺎ ﻋﻴﻨﺔ ﻣﺨﺘﻠﻔﺔ.
ﻏريت ﺑﻬﺎ ﻗﻮة اﻟﻜﻤﺒﻴﻮﺗﺮ ﻋﻠﻢ اﻹﺣﺼﺎء أﺣﺪ أﻗﻮى اﻷﻣﺜﻠﺔ اﻟﺘﻮﺿﻴﺤﻴﺔ ﻟﻠﻜﻴﻔﻴﺔ اﻟﺘﻲ ﱠ
اﻟﺤﺪﻳﺚ ،ﻳَﻈﻬﺮ ﰲ ﺗﺄﺛري اﻷﺳﺎﻟﻴﺐ اﻟﻜﺜﻴﻔﺔ ﺣﺎﺳﻮﺑﻴٍّﺎ ﻋﲆ ﻃﺮق اﻻﺳﺘﺪﻻل اﻟﺒﺎﻳﺰﻳﺔ املﺬﻛﻮرة
ﰲ اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ .ﻓﻤﻦ أﺟْ ﻞ اﺳﺘﺨﺪام اﻟﻄﺮق اﻟﺒﺎﻳﺰﻳﺔ ﻋﻤﻠﻴٍّﺎ ،ﻣﻦ اﻟﴬوري ﺣﺴﺎب
دوا ﱢل اﻟﺘﻮزﻳﻊ املﻌﻘﺪة )ﺑﻤﺼﻄﻠﺤﺎت رﻳﺎﺿﻴﺔ ،ﺗﻮﺟﺪ ﺣﺎﺟﺔ إﱃ ﺗﻜﺎﻣﻞ ﻋﺎﱄ اﻷﺑﻌﺎد( .وﻗﺪ
ﻓﺒﺪﻻ ﻣﻦ ﺗﻘﻴﻴﻢ اﻟﺘﻮزﻳﻌﺎت رﻳﺎﺿﻴٍّﺎ،ً ﺳﺎﻋﺪت أﺟﻬﺰة اﻟﻜﻤﺒﻴﻮﺗﺮ ﻋﲆ ﺗﺠﻨﺐ ﻫﺬه املﺸﻜﻠﺔ؛
ﻳﺄﺧﺬ ﺟﻬﺎز اﻟﻜﻤﺒﻴﻮﺗﺮ أﻋﺪادًا ﻛﺒرية ﻣﻦ اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ ﻣﻨﻬﺎ .وﻳﻤﻜﻦ ﺗﻘﺪﻳﺮ ﺧﺼﺎﺋﺺ
اﻟﺘﻮزﻳﻌﺎت ﻣﻦ ﻫﺬه اﻟﻌﻴﻨﺎت اﻟﻌﺸﻮاﺋﻴﺔ ،ﺑﺎﻟﻄﺮﻳﻘﺔ ﻧﻔﺴﻬﺎ ﻻﺳﺘﺨﺪاﻣﻨﺎ ملﺘﻮﺳﻂ اﻟﻌﻴﻨﺔ
110
اﻟﺤﻮﺳﺒﺔ اﻹﺣﺼﺎﺋﻴﺔ
ﻟﺘﻘﺪﻳﺮ ﻣﺘﻮﺳﻂ املﺠﻤﻮﻋﺔ اﻟﺨﺎﺿﻌﺔ ﻟﻠﺪراﺳﺔ ﺑﺄﻛﻤﻠﻬﺎ .وأﺣﺪﺛﺖ ﻃﺮﻳﻘﺔ »ﻣﻮﻧﺖ ﻛﺎرﻟﻮ
املﺴﺘﻨﺪة إﱃ ﺳﻠﺴﻠﺔ ﻣﺎرﻛﻮف« ﺛﻮرة ﰲ ﻣﻤﺎرﺳﺔ اﻹﺣﺼﺎء اﻟﺒﺎﻳﺰﻳﺔ؛ إذ ﺣﻮﱠﻟﺘْﻬﺎ ﺟﻮﻫﺮﻳٍّﺎ ﻣﻦ
ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻷﻓﻜﺎر اﻟﺠﺬﱠاﺑﺔ ﻣﻦ اﻟﻨﺎﺣﻴﺔ اﻟﻨﻈﺮﻳﺔ ،وﻟﻜﻨﻬﺎ ﻗﺎﴏة ﻋﲆ اﻟﻨﺤﻮ اﻟﻌﻤﲇ إﱃ
ﺗﻘﻨﻴﺔ ﻗﻮﻳﺔ ﻟﺘﺤﻠﻴﻞ اﻟﺒﻴﺎﻧﺎت.
َﻟ َﻔ َﺖ اﻟﻔﺼﻞ اﻟﺴﺎﺑﻖ اﻻﻧﺘﺒﺎ َه إﱃ ﻗﻮة اﻷﺳﺎﻟﻴﺐ اﻟﺮﺳﻮﻣﻴﺔ اﻟﺒﻴﺎﻧﻴﺔ ،ﻣﻦ أﺟﻞ اﻟﺘﻮﺿﻴﺢ
وﻟﻜﻦ ﻧ َ َﻘ َﻞ اﻟﻜﻤﺒﻴﻮﺗﺮ اﻷﺳﺎﻟﻴﺐَ اﻟﺮﺳﻮﻣﻴﺔ اﻟﺒﻴﺎﻧﻴﺔ إﱃ ﻣﺴﺘﻮًى ﺟﺪﻳﺪ ْ وﺗﻮﺻﻴﻞ اﻟﻔﻜﺮة،
ﺗﻤﺎﻣً ﺎ؛ ﻓﺒﻴﻨﻤﺎ ﻟﻢ ﻳﻜﻦ ﻟﺪﻳﻨﺎ ﰲ املﺎﴈ ﺳﻮى ﺻﻮر ﺛﺎﺑﺘﺔ ﺑﺎﻷﺑﻴﺾ واﻷﺳﻮد ،أﺻﺒﺢ ﻟﺪﻳﻨﺎ
اﻵن ﺻﻮ ًرا ﻣﻠﻮﱠﻧﺔ ﻣﺘﺤﺮﻛﺔ ،ﺑﻞ وأﻫﻢ ﻣﻦ ذﻟﻚ أﻧﻨﺎ ﻳﻤﻜﻨﻨﺎ اﻵن اﻟﺘﻔﺎﻋﻞ ﻣﺒﺎﴍة ﻣﻊ اﻟﺼﻮرة.
وﻛﻤﺜﺎل ﺑﺴﻴﻂ ﻓﺤﺴﺐ ،ﻣﻦ املﻤﻜﻦ ﻋﺮض أﺷﻜﺎل ﻣﺘﻌﺪدة ﰲ اﻟﻮﻗﺖ ذاﺗﻪ ،ﻳﺒني ﻛﻞ واﺣﺪ
ﻣﻨﻬﺎ اﻟﻌﻼﻗﺎت ﺑني أزواج ﻣﺨﺘﻠﻔﺔ ﻣﻦ املﺘﻐريات املﺮﺗﺒﻄﺔ ﺑﺎﻟﻜﺎﺋﻨﺎت ،ﻣﺜﻞ ﻣﺼﻔﻮﻓﺔ اﻟﺸﻜﻞ
اﻻﻧﺘﺸﺎري ﰲ اﻟﺸﻜﻞ ،2-6وﻟﻜﻦ ﰲ ﻫﺬه اﻟﺤﺎﻟﺔ ﺗﺮﺗﺒﻂ اﻷﺷﻜﺎل ﻣﻦ ﺧﻼل اﻟﻜﻤﺒﻴﻮﺗﺮ .ﰲ
ﻫﺬه اﻟﺤﺎﻟﺔ ،إن إﺑﺮاز أو ﺗﻐﻴري أي ﻣﺠﻤﻮﻋﺔ ﻣﻦ اﻟﻨﻘﺎط ﻳَﻈﻬﺮ ﰲ اﻟﻮﻗﺖ ﻧﻔﺴﻪ ﰲ ﺟﻤﻴﻊ
اﻷﺷﻜﺎل .وﺗﺴﻤﺢ أدوات أﺧﺮى ﻟﻠﻤﺮء »ﺑﺎﻟﻄريان« ﻋﲆ ﻧﺤﻮ ﺗﻔﺎﻋﲇ ﺧﻼل ﻓﻀﺎء ﺑﻴﺎﻧﺎت
ً
ﻋﺎرﺿﺎ اﻟﺒﻴﺎﻧﺎت ﺑﻄﺮق ﻣﺘﻌﺪدة. ﻋﺎﱄ اﻷﺑﻌﺎد،
وﺑﻤﺎ أن اﻹﺣﺼﺎء ﻳُﺴﺘﺨﺪَم ﻋﲆ ﻣﺴﺘﻮًى ﻋﺎملﻲ ،وﻷن اﻟﻜﻤﺒﻴﻮﺗﺮ ﻳﻠﻌﺐ ﻣﺜﻞ ﻫﺬا اﻟﺪور
املﺤﻮري ،ﻓﺈﻧﻪ ﻟﻴﺲ ﻣﻦ املﺴﺘﻐ َﺮب أن ﺗُﻄﻮﱠر ﺣﺰم ﺑﺮاﻣﺞ إﺣﺼﺎﺋﻴﺔ ﺳﻬﻠﺔ اﻻﺳﺘﻌﻤﺎل.
أﺻﺒﺤﺖ ﻣﻌﺎﻳري ﰲ ﻣﺠﺎﻻت ﺗﻄﺒﻴﻖ ﻣﻌﻴﻨﺔ .وﻟﻜﻦ ﻫﺬا ْ وﻳُﻌَ ﱡﺪ ﺑﻌﺾ ﻣﻨﻬﺎ ﻣﻬﻤٍّ ﺎ ﻟﺪرﺟﺔ أﻧﻬﺎ
ُﻨﺴﻴﻨﺎ أن اﻟﺘﻄﺒﻴﻖ اﻟﻔﻌﱠ ﺎل ﻟﻸدوات اﻹﺣﺼﺎﺋﻴﺔ ﻳﺘﻄﻠﺐ ﺗﻔﻜريًا ﻣﺘﺄﻧﱢﻴًﺎ؛ ﻓﻔﻲ ﻻ ﻳﻨﺒﻐﻲ أن ﻳ ِ
أن ُ
ﺗﻮاﻓﺮ ﻣﺜﻞ ﻫﺬه ﴚ اﻟﺒﻌﺾ ﻣﻦ ﱠ اﻟﻮاﻗﻊ ،ﰲ اﻷﻳﺎم اﻷوﱃ ﻟﺘﻄﻮﻳﺮ اﻟﱪﻣﺠﻴﺎت اﻹﺣﺼﺎﺋﻴﺔَ ،ﺧ ِ َ
اﻷدوات ﻣﻦ ﺷﺄﻧﻪ أن ﻳﺰﻳﻞ اﻟﺤﺎﺟﺔ ﻟﻺﺣﺼﺎﺋﻴني؛ ﺣﻴﺚ إﻧﻪ »ﻳﻤﻜﻦ ﻷي ﺷﺨﺺ أن ﻳﻘﻮم
ﺑﺎﻟﺘﺤﻠﻴﻞ اﻹﺣﺼﺎﺋﻲ؛ ﻓﻜﻞ ﻣﺎ ﻋﻠﻴﻪ اﻟﻘﻴﺎم ﺑﻪ ﻫﻮ إﻋﻄﺎء اﻟﺘﻌﻠﻴﻤﺎت املﻨﺎﺳﺒﺔ ﻟﻠﻜﻤﺒﻴﻮﺗﺮ«.
ﻣﻊ ذﻟﻚ ،ﺛﺒﺖ أن اﻟﻌﻜﺲ ﺗﻤﺎﻣً ﺎ ﻫﻮ اﻟﺼﺤﻴﺢ؛ وﻫﻨﺎك ﻣﺰﻳﺪ ﻣﻦ اﻟﻄﻠﺐ ﻋﲆ اﻹﺣﺼﺎﺋﻴني
ﺑﻤﺮور اﻟﻮﻗﺖ .وﺗﻮﺟﺪ ﻋﺪة أﺳﺒﺎب ﻟﺬﻟﻚ.
أﺣﺪ اﻷﺳﺒﺎب ﻫﻮ أن اﻟﺒﻴﺎﻧﺎت ﺗُﺴﺠﱠ ﻞ ﺗﻠﻘﺎﺋﻴٍّﺎ ﻋﲆ ﻧﺤﻮ ﻣﺘﺰاﻳﺪ؛ ﻓﻔﻲ اﻟﺤﻴﺎة اﻟﻴﻮﻣﻴﺔ،
ﰲ ﻛﻞ ﻣﺮة ﺗﻘﻮم ﻓﻴﻬﺎ ﺑﺈﺟﺮاء ﻋﻤﻠﻴﺔ ﴍاء ﺑﺒﻄﺎﻗﺔ اﻻﺋﺘﻤﺎن أو ﺗﺘﺴﻮق ﰲ ﻣﺘﺠﺮ ،ﺗُﺨ ﱠﺰن
ﺗﻔﺎﺻﻴﻞ اﻟﻌﻤﻠﻴﺔ ﺗﻠﻘﺎﺋﻴٍّﺎ؛ وﰲ اﻟﻌﻠﻮم اﻟﻄﺒﻴﻌﻴﺔ ،ﺗﺴﺠﱢ ﻞ اﻷدوات اﻟﺮﻗﻤﻴﺔ اﻟﺨﻮاص اﻟﻔﻴﺰﻳﺎﺋﻴﺔ
واﻟﻜﻴﻤﻴﺎﺋﻴﺔ دون اﻟﺤﺎﺟﺔ إﱃ ﺗﺪﺧﻞ ﺑﴩي؛ وﰲ املﺴﺘﺸﻔﻴﺎت ،ﺗﺮاﻗﺐ اﻷﺟﻬﺰة اﻹﻟﻜﱰوﻧﻴﺔ
ﺳﻴﻼ ﻣﻦ اﻟﺒﻴﺎﻧﺎت .وﻫﺬا ﻳﻤﺜﻞ ﻓﺮﺻﺔ ﻫﺎﺋﻠﺔ، ً املﺮﴇ ﺗﻠﻘﺎﺋﻴٍّﺎ؛ وﻣﺎ إﱃ ذﻟﻚ .إﻧﻨﺎ ﻧﻮاﺟﻪ
وﻟﻜﻦ ﻳﻠﺰم وﺟﻮد ﻣﻬﺎرات إﺣﺼﺎﺋﻴﺔ ﻟﻼﺳﺘﻔﺎدة ﻣﻨﻬﺎ. ْ
111
ﻋﻠﻢ اﻹﺣﺼﺎء
112
ﺗﻌﻠﻴﻘﺎت ﺧﺘﺎﻣﻴﺔ
ﻃﺎﻟﺖ املﺪة اﻟﺘﻲِ ) (١ﻣﻦ اﻟﻮاﺿﺢ أﻧﻪ ﻛﻠﻤﺎ ﻛﺎن اﻛﺘﺸﺎف املﺮض ﰲ وﻗﺖ ﻣﺒﻜﺮ،
ﺑﻐﺾ اﻟﻨﻈﺮ ﻋﻦ أي ﺗﺪﺧﻞ ﻃﺒﻲ؛ ﻓﺒﻄﺮﻳﻘﺔ أو ﺑﺄﺧﺮى ﻳﺤﺘﺎج ﻫﺬا إﱃ ﺳﻴﻌﻴﺸﻬﺎ املﺮﻳﺾ ،ﱢ
أن َ
ﻳﺆﺧﺬ ﺑﻌني اﻻﻋﺘﺒﺎر.
) (٢ﻳﻌﻨﻲ اﻟﺘﺨﻔﻴﺾ ﺑﻨﺴﺒﺔ ٪٢٥أن اﻟﺴﻌﺮ ُﺧ ﱢﻔ َﺾ ﺑﻤﻘﺪار اﻟﺮﺑﻊ ،وﻟﻜﻦ ﻫﺬا ﻳﻌﻨﻲ أﻧﻪ
ﻟﻠﻌﻮدة إﱃ اﻟﺴﻌﺮ اﻷﺻﲇ ﻋﻠﻴﻚ زﻳﺎدة اﻟﺴﻌﺮ ﺑﻤﻘﺪار اﻟﺜﻠﺚ ) ،(٪٣٣وﻟﻴﺲ اﻟﺮﺑﻊ )(٪٢٥؛
ﻋﲆ ﺳﺒﻴﻞ املﺜﺎل ،اﻟﺨﺼﻢ اﻟﺒﺎﻟﻎ ٪٢٥ﻋﲆ اﻟﺴﻌﺮ اﻷﺻﲇ ١٠٠ﺟﻨﻴﻪ اﺳﱰﻟﻴﻨﻲ ﻳﺆدي إﱃ
اﻟﺴﻌﺮ ا ُملﻌ َﻠﻦ ٧٥ﺟﻨﻴﻬً ﺎ اﺳﱰﻟﻴﻨﻴٍّﺎ .وﻟﻠﻌﻮدة إﱃ اﻟﺴﻌﺮ اﻷﺻﲇ ﻋﻠﻴﻨﺎ زﻳﺎدة ﻫﺬا اﻟﺴﻌﺮ
ﺑﻤﺒﻠﻎ ٢٥ﺟﻨﻴﻬً ﺎ اﺳﱰﻟﻴﻨﻴٍّﺎ؛ أي ٪٣٣ﻣﻦ ٧٥ﺟﻨﻴﻬً ﺎ اﺳﱰﻟﻴﻨﻴٍّﺎ.
املﺘﻮﻗﻊ ﺳﻮف ﻳﺴﺘﻤﺮ ﰲ اﻟﺰﻳﺎدة ﺑﺎملﻌﺪل ﻧﻔﺴﻪ ﱠ ) (٣ﻫﺬا ﻳﻔﱰض أن ﻣﺘﻮﺳﻂ اﻟﻌﻤﺮ
ﻟﺰﻳﺎدﺗﻪ ﰲ املﺎﴈ.
ُ
) (٤إذا ﻛﺎن ﻃﻔﻞ واﺣﺪ ﻗﺪ ﻗﺘِﻞ ﰲ ﻋﺎم ،١٩٥٠ﻓﺈن اﻟﻌﺒﺎرة ﺗﻌﻨﻲ أن اﺛﻨني َﻟﻘِ ﻴَﺎ
ﻣﴫﻋﻬﻤﺎ ﰲ ﻋﺎم ،١٩٥١وأرﺑﻌﺔ ﰲ ﻋﺎم ،١٩٥٢وﺛﻤﺎﻧﻴﺔ ﰲ ﻋﺎم ،١٩٥٣وﺳﺘﺔ ﻋﴩ
ﰲ ﻋﺎم ،١٩٥٤وﻣﺎ إﱃ ذﻟﻚ .واﺳﺘﻤﺮار املﻀﺎﻋﻔﺔ ﺑﻬﺬه اﻟﻄﺮﻳﻘﺔ ﻳﻌﻨﻲ أﻧﻪ ﺑﺤﻠﻮل اﻟﻮﻗﺖ
اﻟﺮاﻫﻦ ﻳُﻘﺘَﻞ ﻣﻦ اﻷﻃﻔﺎل رﻣﻴًﺎ ﺑﺎﻟﺮﺻﺎص ﺳﻨﻮﻳٍّﺎ ﻋﺪد أﻛﺜﺮ ﻣﻦ ﻋﺪد ﺳﻜﺎن اﻟﻌﺎﻟﻢ.
)وﻫﺬا املﺜﺎل ﻣﺄﺧﻮذ ﻣﻦ اﻟﻜﺘﺎب املﻤﺘﺎز اﻟﺬي أ ﱠﻟﻔﻪ ﺟﻮﻳﻞ ﺑﻴﺴﺖ ،واﻟﻮارد ﰲ ﻗﺴﻢ اﻟﻘﺮاءات
اﻹﺿﺎﻓﻴﺔ(.
ﻗﺮاءات إﺿﺎﻓﻴﺔ
اﻟﻔﺼﻞ اﻷول
A. R. Jadad and M. W. Enkin, Randomised Controlled Trials: Questions,
Answers and Musings, 2nd edn. (Malden, Massachusetts: Blackwell
Publishing, 2007).
Joel Best, Damned Lies and Statistics: Untangling Numbers from the Media,
Politicians, and Activists (Berkeley: University of California Press,
2001).
John Chambers, Greater or lesser statistics: a choice for future research,
Statistics and Computing, 3 (1993): 18–24.
Foundation for the Study of Infant Death. (http://www.fsid.org.uk/cot-
death.html). Accessed 6 April 2007.
Helen Joyce, Beyond reasonable doubt, Plus Magazine (2002). (http://
www.plus.maths.org/issue21/features/clark/index.html). Accessed
14 July 2008.
(http://www.sallyclark.org.uk/). Accessed 14 July 2008.
اﻟﻔﺼﻞ اﻟﺜﺎﻧﻲ
D. J. Hand, Information Generation: How Data Rule Our World (Oxford:
Oneworld, 2007).
ﻋﻠﻢ اﻹﺣﺼﺎء
اﻟﻔﺼﻞ اﻟﺜﺎﻟﺚ
اﻟﻔﺼﻞ اﻟﺮاﺑﻊ
اﻟﻔﺼﻞ اﻟﺨﺎﻣﺲ
اﻟﻔﺼﻞ اﻟﺴﺎدس
116
ﻗﺮاءات إﺿﺎﻓﻴﺔ
117
ﻣﺼﺎدر اﻟﺼﻮر