You are on page 1of 23

Fluctuations de lchantillonnage

Lchantillonnage & Ses Fluctuations

Pr. A. SOULAYMANI

Cours Statistique 2005

Fluctuations de lchantillonnage

Gnralits
Supposons une population infiniment grande sur laquelle on veut valuer la frquence ou la proportion dun caractre.

Recensement

Echantillonnage

Tous les sujets de la population sont examins


Pr. A. SOULAYMANI

Population
Cours Statistique 2005

Une partie des sujets de la population sont examins


2

Fluctuations de lchantillonnage

Recensement = vrit linformation que lon dsire est disponible pour tous les individus de la population tudie.

chantillon = estimation de la vrit linformation nest disponible que pour un sous-ensemble des individus de la population tudie.

Pr. A. SOULAYMANI

Cours Statistique 2005

Fluctuations de lchantillonnage

I- Lchantillon

Pr. A. SOULAYMANI

Cours Statistique 2005

En gnral, on procde ce quon appelle chantillonnage. Lchantillon est donc un groupe restreint de la population dont il est issu.
Pop

Fluctuations de lchantillonnage

Plusieurs chantillons peuvent tre constitus

Lchantillon en lui-mme nest pas intressant,


ce sont les conclusions sur la population que lon peut tirer de son observation qui en font lintrt : Infrence.
Pr. A. SOULAYMANI Cours Statistique 2005 5

Fluctuations de lchantillonnage

Cet chantillon est dit non reprsentatif si au cours du tirage, on procde un choix pralable ou une slection.
Pop

Echantillon non reprsentatif

Il sagit l, dun tirage non alatoire ou biais. Les conclusions sur la population ne peuvent pas tre tirer de lobservation de tels chantillons.
Pr. A. SOULAYMANI Cours Statistique 2005 6

Fluctuations de lchantillonnage

Pour que lchantillon soit reprsentatif, il faut que tous les individus de la population aient la mme chance dtre tirs.
Ceci peut tre obtenu par un brassage adquat et convenable des individus et permet de tirer vritablement au hasard un chantillon reprsentatif.
Tirage Alatoire

Pr. A. SOULAYMANI

Cours Statistique 2005

Fluctuations de lchantillonnage

En dfinitif, un chantillon reprsentatif est un chantillon issu de faon parfaitement alatoire, non conditionn par un choix pralable ou slection.
Tirage parfaitement au hasard

Pr. A. SOULAYMANI

Cours Statistique 2005

Fluctuations de lchantillonnage

Un chantillon a pour but de reprsenter la population, donc tre reprsentatif.


En quelque sorte, lchantillon est un modle pour la population. Il nest pas possible de dterminer si un chantillon est reprsentatif ou non. Un bon plan dchantillonnage peut cependant contribuer liminer des chantillons non reprsentatifs.
Pr. A. SOULAYMANI Cours Statistique 2005 9

Fluctuations de lchantillonnage

tapes suivre
Dterminer lobjectif de lchantillonnage Dterminer la condition recherche Dfinir la population vrifier Dterminer la taille de lchantillonnage Slectionner les chantillons Effectuer les tests et valuer les rsultats Analyser les erreurs projetes Plans dchantillonnage statistique
Cours Statistique 2005 10

Pr. A. SOULAYMANI

Fluctuations de lchantillonnage

II- Le Pari

Pr. A. SOULAYMANI

Cours Statistique 2005

11

Fluctuations de lchantillonnage

Considrons une population o la proportion thorique dun caractre donn est pth (p thorique).
Population chantillon

Tirage parfaitement au hasard

Pobserve. Pthorique
Pr. A. SOULAYMANI Cours Statistique 2005 12

Fluctuations de lchantillonnage

La proportion observe du caractre (sa frquence) au niveau de lchantillon Pobs nest pas obligatoirement identique la proportion thorique au niveau de la population dont il est issu, mme si lchantillon est reprsentatif.
Population chantillon
Tirage parfaitement

au hasard

Elle peut prendre toutes les valeurs possibles comprise entre 0 et 1. Pobserve.

Pthorique

Cest les fluctuations de lchantillonnage


Pr. A. SOULAYMANI Cours Statistique 2005 13

Exemple de Pari

Fluctuations de lchantillonnage

Considrons une population o la proportion thorique dun caractre donn est pth = 0,50 (p thorique).
Tirage parfaitement au hasard Population

p thorique = 050

chantillon

p observe

En gnrale pobs fluctue autour de pth et on peut calculer la probabilit pour que pobs sorte dune certaine marge entourant pth.
Pr. A. SOULAYMANI Cours Statistique 2005 14

Fluctuations de lchantillonnage

on peut parier que la frquence au niveau dun chantillon tir au hasard de cette population sera comprise entre 40% et 60% (0.40 pobs . 0.60). Une question simpose ce niveau et peut poser de deux faons diffrentes mais complmentaires:
- Quelle est la probabilit pour que notre pari soit juste ? (p ?) - Quel est le risque quon a pris en choisissant cet intervalle [0.40-0.60] ? (a ?)

a et p prsente la relation a = 1 p et p = 1 - a.
Pr. A. SOULAYMANI Cours Statistique 2005 15

Intervalle de pari Lintervalle de pari est dfini par un cart e autour de pth. ; ainsi, lintervalle 40 60% autour de 50% est dfini par e = 10%.
Pth.

Fluctuations de lchantillonnage

0,40

0,50

0,60

La table de lcart rduit ( loi normale) ne peut tre utilise directement pour valuer le risque du pari ; de ce fait, lcart e est transform en cart rduit e appel cart rduit observ ou calcul tel que :
Pr. A. SOULAYMANI Cours Statistique 2005 16

Fluctuations de lchantillonnage

e
Obs .

e pth(1 pth) N

p p pth(1 pth) N
Obs . Th .

Dans lexemple prcdant, en supposant que leffectif de lchantillon est de 100, on aura :

0.10 0.10 2 0.50 x0.50 0.05 100


Cours Statistique 2005 17

Pr. A. SOULAYMANI

Fluctuations de lchantillonnage

La table de lcart rduit donne pour tout cart observ le risque a qui lui est associ. Pour la valeur de 2 de notre exemple, il ny a pas de correspondance directe mais on peut remarquer que notre valeur est comprise entre deux risque : eth = 1,96 < eos. = 2 < eth = 2,058

Pr. A. SOULAYMANI

Cours Statistique 2005

18

Fluctuations de lchantillonnage

Sans chercher eth=1,96 < eobs.=2 < eth=2,058 interpoler,on prendra toujours la valeur la plus proche de 2 qui correspond dans ce cas a = 5% et p = 95%. Donc, lorsquon a pari sur lintervalle 40%-60% sur un chantillon de 100 tir dune population pour laquelle la frquence thorique est de 50%, on a 5% de chance de se tromper contre une probabilit de 95% de tomber sur cet intervalle par Pr. A. SOULAYMANI Cours Statistique 2005 19 tirage au hasard.

Fluctuations de lchantillonnage

En conclusion, lorsquon a pari sur lintervalle 40%60% sur un chantillon de 100 tir dune population pour laquelle la frquence thorique est de 50%, on a 5% de chance de se tromper contre une probabilit de 95% de tomber sur cet intervalle par tirage au hasard.

Remarque : La table de lcart rduit ne peut tre utilise que si lchantillon est grand . Pour le calcul; on considre que lchantillon est grand si et seulement si Np 5 et N(1-p) 5.
Pr. A. SOULAYMANI Cours Statistique 2005 20

Fluctuations de lchantillonnage

III- Loi des Grands Nombres

Pr. A. SOULAYMANI

Cours Statistique 2005

21

Fluctuations de lchantillonnage

Avec une urne prsentant une frquence pth.= 50% ; on se propose destimer le risque derreur pour un mme intervalle de pari [0.40-0.60] mais pour des effectifs diffrents (N1=16 ; N2=100 et N3=400).

N
16

pth.(1 pth.) N

e
0,10

e
obs

p p p (1 p ) N
obs th th th

a
0,47

0,125

0,80

100
400
Pr. A. SOULAYMANI

0,05
0,025

0,10
0,10
Cours Statistique 2005

2
4

0,05
<0,001
22

Fluctuations de lchantillonnage

Ainsi, pour le mme cart absolu (10%), on prend beaucoup plus de risques avec des petits chantillons. Donc, lcart entre la composition de lchantillon et celle de la population a dautant moins de chance dtre dpass lorsque la taille de lchantillon est grande.
cest la loi des grands nombre

Pr. A. SOULAYMANI

Cours Statistique 2005

23

You might also like