Professional Documents
Culture Documents
Pr. A. SOULAYMANI
Fluctuations de lchantillonnage
Gnralits
Supposons une population infiniment grande sur laquelle on veut valuer la frquence ou la proportion dun caractre.
Recensement
Echantillonnage
Population
Cours Statistique 2005
Fluctuations de lchantillonnage
Recensement = vrit linformation que lon dsire est disponible pour tous les individus de la population tudie.
chantillon = estimation de la vrit linformation nest disponible que pour un sous-ensemble des individus de la population tudie.
Pr. A. SOULAYMANI
Fluctuations de lchantillonnage
I- Lchantillon
Pr. A. SOULAYMANI
En gnral, on procde ce quon appelle chantillonnage. Lchantillon est donc un groupe restreint de la population dont il est issu.
Pop
Fluctuations de lchantillonnage
Fluctuations de lchantillonnage
Cet chantillon est dit non reprsentatif si au cours du tirage, on procde un choix pralable ou une slection.
Pop
Il sagit l, dun tirage non alatoire ou biais. Les conclusions sur la population ne peuvent pas tre tirer de lobservation de tels chantillons.
Pr. A. SOULAYMANI Cours Statistique 2005 6
Fluctuations de lchantillonnage
Pour que lchantillon soit reprsentatif, il faut que tous les individus de la population aient la mme chance dtre tirs.
Ceci peut tre obtenu par un brassage adquat et convenable des individus et permet de tirer vritablement au hasard un chantillon reprsentatif.
Tirage Alatoire
Pr. A. SOULAYMANI
Fluctuations de lchantillonnage
En dfinitif, un chantillon reprsentatif est un chantillon issu de faon parfaitement alatoire, non conditionn par un choix pralable ou slection.
Tirage parfaitement au hasard
Pr. A. SOULAYMANI
Fluctuations de lchantillonnage
Fluctuations de lchantillonnage
tapes suivre
Dterminer lobjectif de lchantillonnage Dterminer la condition recherche Dfinir la population vrifier Dterminer la taille de lchantillonnage Slectionner les chantillons Effectuer les tests et valuer les rsultats Analyser les erreurs projetes Plans dchantillonnage statistique
Cours Statistique 2005 10
Pr. A. SOULAYMANI
Fluctuations de lchantillonnage
II- Le Pari
Pr. A. SOULAYMANI
11
Fluctuations de lchantillonnage
Considrons une population o la proportion thorique dun caractre donn est pth (p thorique).
Population chantillon
Pobserve. Pthorique
Pr. A. SOULAYMANI Cours Statistique 2005 12
Fluctuations de lchantillonnage
La proportion observe du caractre (sa frquence) au niveau de lchantillon Pobs nest pas obligatoirement identique la proportion thorique au niveau de la population dont il est issu, mme si lchantillon est reprsentatif.
Population chantillon
Tirage parfaitement
au hasard
Elle peut prendre toutes les valeurs possibles comprise entre 0 et 1. Pobserve.
Pthorique
Exemple de Pari
Fluctuations de lchantillonnage
Considrons une population o la proportion thorique dun caractre donn est pth = 0,50 (p thorique).
Tirage parfaitement au hasard Population
p thorique = 050
chantillon
p observe
En gnrale pobs fluctue autour de pth et on peut calculer la probabilit pour que pobs sorte dune certaine marge entourant pth.
Pr. A. SOULAYMANI Cours Statistique 2005 14
Fluctuations de lchantillonnage
on peut parier que la frquence au niveau dun chantillon tir au hasard de cette population sera comprise entre 40% et 60% (0.40 pobs . 0.60). Une question simpose ce niveau et peut poser de deux faons diffrentes mais complmentaires:
- Quelle est la probabilit pour que notre pari soit juste ? (p ?) - Quel est le risque quon a pris en choisissant cet intervalle [0.40-0.60] ? (a ?)
a et p prsente la relation a = 1 p et p = 1 - a.
Pr. A. SOULAYMANI Cours Statistique 2005 15
Intervalle de pari Lintervalle de pari est dfini par un cart e autour de pth. ; ainsi, lintervalle 40 60% autour de 50% est dfini par e = 10%.
Pth.
Fluctuations de lchantillonnage
0,40
0,50
0,60
La table de lcart rduit ( loi normale) ne peut tre utilise directement pour valuer le risque du pari ; de ce fait, lcart e est transform en cart rduit e appel cart rduit observ ou calcul tel que :
Pr. A. SOULAYMANI Cours Statistique 2005 16
Fluctuations de lchantillonnage
e
Obs .
e pth(1 pth) N
p p pth(1 pth) N
Obs . Th .
Dans lexemple prcdant, en supposant que leffectif de lchantillon est de 100, on aura :
Pr. A. SOULAYMANI
Fluctuations de lchantillonnage
La table de lcart rduit donne pour tout cart observ le risque a qui lui est associ. Pour la valeur de 2 de notre exemple, il ny a pas de correspondance directe mais on peut remarquer que notre valeur est comprise entre deux risque : eth = 1,96 < eos. = 2 < eth = 2,058
Pr. A. SOULAYMANI
18
Fluctuations de lchantillonnage
Sans chercher eth=1,96 < eobs.=2 < eth=2,058 interpoler,on prendra toujours la valeur la plus proche de 2 qui correspond dans ce cas a = 5% et p = 95%. Donc, lorsquon a pari sur lintervalle 40%-60% sur un chantillon de 100 tir dune population pour laquelle la frquence thorique est de 50%, on a 5% de chance de se tromper contre une probabilit de 95% de tomber sur cet intervalle par Pr. A. SOULAYMANI Cours Statistique 2005 19 tirage au hasard.
Fluctuations de lchantillonnage
En conclusion, lorsquon a pari sur lintervalle 40%60% sur un chantillon de 100 tir dune population pour laquelle la frquence thorique est de 50%, on a 5% de chance de se tromper contre une probabilit de 95% de tomber sur cet intervalle par tirage au hasard.
Remarque : La table de lcart rduit ne peut tre utilise que si lchantillon est grand . Pour le calcul; on considre que lchantillon est grand si et seulement si Np 5 et N(1-p) 5.
Pr. A. SOULAYMANI Cours Statistique 2005 20
Fluctuations de lchantillonnage
Pr. A. SOULAYMANI
21
Fluctuations de lchantillonnage
Avec une urne prsentant une frquence pth.= 50% ; on se propose destimer le risque derreur pour un mme intervalle de pari [0.40-0.60] mais pour des effectifs diffrents (N1=16 ; N2=100 et N3=400).
N
16
pth.(1 pth.) N
e
0,10
e
obs
p p p (1 p ) N
obs th th th
a
0,47
0,125
0,80
100
400
Pr. A. SOULAYMANI
0,05
0,025
0,10
0,10
Cours Statistique 2005
2
4
0,05
<0,001
22
Fluctuations de lchantillonnage
Ainsi, pour le mme cart absolu (10%), on prend beaucoup plus de risques avec des petits chantillons. Donc, lcart entre la composition de lchantillon et celle de la population a dautant moins de chance dtre dpass lorsque la taille de lchantillon est grande.
cest la loi des grands nombre
Pr. A. SOULAYMANI
23