You are on page 1of 14
2 Plan de sondage aléatoire simple sans remise (PESR) 2 Plan de sondage aléatoire simple sans remise (PESR) 1 Contexte Loi do probabilité : ‘On préleve un échantillon de n individus suivant un plan de sondage aléatoire simple sans remise (PESR pour Probabilités Egales Sans Remise) dans une population U. Soit W la var 6gale a 'échantillon obtenu. Alors la loi de W est donnée par FW = wew(O), oti P désigne la probabilité uniforme et W (2) désigne l'ensemble de tous les échantillons de n individus possibles avec un tel plan de sondage. Explication : Pour fixer les idées, on considére la situation simplifiée suivante ; on préléve au hasard et simultanément n individus de la population pour former un échantillon. L'univers associé & cette expérience aléatoire est { = {combinaisons de n individus parmi N}. Comme Mest fini et qu’il y a équiprobabilité, Putilisation de la probabilité uniforme P est justifiée. Tl vient POW oe we Wo) Or on a Card() = (%) et Card({W = w}) = 1, d’on le résultat. Situations de référence : Les différents types de prélévements décrits ci-dessous rentrent dans le cadre dun PESR T on préléve au hasard ot simultanément n individus de la population pour former un échan- tillon, IL on préléve au hasard et un a un n individus de la population pour former un échantillon, Vordre n'étant pas pris en compte. ©. Chmmnane uw 2 Plan de sondage aléatoire simple sans remise (PESR) Quelques commandes R : Pour illustrer un plan de sondage aléatoire de type PESR avec le logiciel R, on propose l'animation Library (animation) sample. simple(nrow = 10, ncol = 10, size = 15, p.col = c("blue", "red"), p.cex = c(1, 3)) Par exemple, pour faire un tirage sans remise de n = 20 individus dans une population de = 200 individus, on peut utiliser © la commande sample sample(1:200, 20, replace = F) © la commande srswor de la librairie sampling library (sampling) + srswor(20, 200) x = 1:20 x(t != 0) L’abréviation srswor signifie Simple Random Sampling WithOut Replacenent, sur de taille 200 constitué de 20 chiffres 1 Pécisons que t = srswor(20, 200) renvoie un vecte et de 180 chiffres 0. Les 1 sont positionnés aux indices des individus prélevés et les 0 aux autres. Un autre exemple : on considére la population U constit ée de N = 9 garcons et on pr échantillon de n = 3 individus suivant un plan de sondage aléatoire de type PESR U= c(*Bob", "Wico”, "ALi", "Fabien", "Malik", "John", "Jean", "Chris", "Karl") Library (sampling) t= srawor(3, 9) w= Ult t= 0} Dans la suite: © pour les résultats, on considére un plan de sondage aléatoire de type PESR et la var W égale a léchantillon obtenn, 2 Plan de sondage aléatoire simple sans remise (PESR) © pour les preuves, pour raison de simplicité, on se place dans Ia situation de référence I, © pour les commandes R, on utilisera dorénavant la librairie sampling. Tanx de sondage : (On appelle taux de sondage le réa Probabilités d’appartenance : © pour tout F€ {1,...)N)j la probabilite que individu w appartienne 8 W est Plu € W) © pour tout (i,j) € {1y..-)N)® avec i # j, Ia probabilité que les individus us et us appartiennent & W est n(n — 1) P((ui, uj) € W) = Preuve © Par la définition de la probabilité uniforme, on Card((us € WY) Plus € W) = Garam On a Card() = (%). Il reste @ calculer Card({u; € W)). Le nombre de possibilités pour que 1 soit dans 'échantillon est égal au nombre de possibilités de prélever n — 1 individus parmi les N— 1 autres que 1. Dott Card({uj € W}) = (If). On en déduit que nol ay wat nt (N-1)! on Plu; € W) “ay Nv © Avec un raisonnement similaire, on a rd({ (as, )) € WY) Card(y P((ui,w) € W) = On a Card() = (X). Il reste a caleuler Card({(ui,uj) € W}) 13 2 Plan de sondage aléatoire simple sans remise (PESR) Le nombre de possibilités pour que u ct uj soient dans l'échantillon est égal au nombre de possibilités pour prélever simultanément n — 2 individus parmi les N ~ 2 autres que w et uj, Dror Card({(us, uj) € W}) = (3). On en déduit que P((uiu)) €W) = a 2.2 Estimateurs Estimation aléatoire de Jy; : Un estimateur aléatoire de Jy est ie Bw = 5 owl wewy 1 si Pévénement A est réalisé, ot L désigne la fonction indicatrice définie par : 14 © sinon, Remarques : On peut également écrire cet estimateur © sous la forme _ 1 Bw =5 oe in) {Uys N PY Ae Fini ty €Weevestty Wy ~ ol o Bw = 5 ow DO Mwin=ud> toast of Wm est la var égale au m-éme individu de l’échantillon. En effet, comme W = (Wj,..., Wp) et tous les individus sont différents, on a fy LWe=ud = Luewy On peut montrer que, pour tout i € {1,..., N} et mé {1,...,n}, on a P(uy € Wn) = 1/N. u 2 Plan de sondage aléatoire simple sans remise (PESR) Espérance de Ty : Trestimatenr fy est sans Dials pour Ty E(Gw) = Bu Preuve : On propose deux prenves différentes Preuve I : En utilisant la linéarité de Vespérance, E (114) — P(A) et P(u; € W) n/N, il vient Prewue II: On posi 1M}, im Comme il y a autant 4’échantillons contenant u; que de possibilités pour prélever simalta- nément m= 1 individus parmi les NW = 1 autres que uj, on a 5° Daseugy = (N22). Done 15 2 Plan de sondage aléatoire simple sans remise (PESR) Variance de Fy: t Ta va iance de Gy ot 32, VGw) =0- N=. Preuve : Par la formule de la variance d’une somme de var, on obtient y M 1 ‘ v0) ~ v(1SSotucn) =v (Sntucn) + yeye (tients) a aja )+ BS s wiv’ (Lewy Mew ») (Pu ew)? De plus, comme P({ui € W}N {uj € W}) = P((ui,uy) € W) = n(n —1)/(NGV — 1)), il vient C(Lhwewy tyojew)) = E(Lenewr(ujewy) ~E (Xqwcw)) E (Lywyew)) = Pfu € WH {uj € W}) — Plus € W)P(uy € W) n(n—1) ny? NW-1) (Gy) En combinant ces égalités, on obtient van ~ 3 (5 (-)Sea§ (Fa -a)ETon) -#) (2E~)) 2. Plan de sondage aléatoire simple sans remise (P En utilisant la décomposition on obtient VGw) = D’autre part, on a sb Il s’ensuit 2 Plan de sondage aléatoire simple sans remise (PESR) Erreur quadratique moyenne de Ty + Trerreur quadratique moyenne de jy est Ie réel 3 BOM (Hw)(PESR|=B (Bw ~W)) = 0- NE La quantité EQM (Gy)|PESR] est une mesure de Verreur que commet Jy dans l'estimation de On constate que o plus n est grand/Véchantillon est grand, plus Jyy estime bien By « plus U est homogene/plus sf, est petit, plus Fy estime bien Fy Estimation aléatoire de sy: Un estimatour aléatoire de sr est ¥ ow \wi Lui -Iw)*kwewy Propriété de sf + 7a es b 2 L’estimateur sf, est sans biais pour 7, (Sethe aw Soudueny +H DS N (= WA pew) — 2ney + vai) “4 Eton 9h) 2 Plan de sondage aléatoire simple sans remise (PESR) On a Plu; € W) = n/N ot ‘ 1 SE sttqcy ok) ) = Or Par conséquent, Bk) = Gage’ arg) t n(N-1)-Ntny mi j-pN 2 Plan de sondage aléatoire simple sans remise (PESR) Estimations ponctuelles Estimation ponctuelle de J, Soit un échantillon de n individus de U. Une estimation ponctuelle de Jy; est la moyenne: échantillon Fo= Zul ear welques commandes R : Un exemple de calcul de 7, avec R est décrit ci-dessous Qi U= c(*Bob", “Nico”, "Ali", “Fabien”, "Malik", "John", "Jean", "Chris", "Kari") y = (72, 89, 68, 74, 81, 87, 76, 61, 84) n=3 Library (sampling) + = srswor(n, 9) bar_y.v = (1 /n) # sunty * t) bar_y_w Erreur d’estimation : Soit w un échantillon de n individus de U. L'erreur destimation que commet 7, en estimant By est le réel Probabilité d’erreur La probabilité de se tromper de plus de (100 x 8)%, 8 €]0, 1|, en estimant Gy par Gyy cst le reel a= Ty DL Mezom} (oy 20 2 Plan de sondage aléatoire simple sans remise (PESR) Estimation ponctuelle de sy t Estimation ponctuelle de Vécart-type de Ty # 24, Soit w un échantillon de n individus de U. Une estimation ponctuelle de sy; est Fécart-type corrigé-échantillon Tout comme la moyennepopulation, on peut aussi s‘intéresser & Verreur d’estimation et la. probabilité d’erreur, lesquelles se définissent de maniére similaire. uelques commandes R : Un exemple de calcul de sy avec R est décrit ci-dessous U-= c("Bob", "Nico", "Ali", "Fabien", "Malik", "John", "Jean", "Chris", "Karl") y = c(72, 89, 68, 74, 81, 87, 76, 61, 84) 3 library (sampling) t= srswor(n, 9) bar_y.w = (1 /n) « sumy « t) sou = sqrt(sum((y - bar_y_w)"2 * t) / (a - 1)) Soit wun échantilion den individus de 7. Une estimation ponctuclle de Pécart-type de By est le réel Intervalles de confiance Résuliat limite (Théoreme de Hajek) : Sin, Met N—n sont suffisamment grands, alors on 21 2 Plan de sondage aléatoire simple sans remise (PESR) Intervalle de confiance pour Jy + Soit © un échantillon de n individus de 0. Un intervalle de confiance pour Jy au niveau 100(1 — a)%, a €]0, If, est old 2q est le réel vérifiant P(|2| > 24) = a, Z~N'(Os1) Ty a 100(1 ~ a) chances sur 100 que Jy appartienne a Vintervalle ig, Quelques commandes R : Un exemple de fonction R pour calculer lintervalle de confiance pour Ty au nivean 100(1 — a)% est décrit ci-dessous icPESR = function(y, N, niveau) { Lengthy) bar_y_w = mean(y) z= qnorm(1 - (1 - niveau) / 2) s2w = sd(y)-2 var_bar_y.w = (1- n/N) * (s2.v /n) a= bar_y_w - z * sqrt(var_bar_y_v) b = bar_y.w + z + sqrt(var_bar_y_w) print(c(a, b)) } icPESR(y = c(2-1, 2.3, 4.1, 2.6, 7-1, 8.6), N= 100, niveau = 0.95) Cola renvoie : 2.329876, 6.603457. 22 2 Plan de sondage aléatoire simple sans remise (PESR) 2.5. Taille d’échantillon Incertitude absolue + Soit & un échantilion de n individus de UJ. On appelle incertitude absolue sur Jy, au niveau 100(1 ~ @)%, a €]0, 1[, la demi-longueur de ip, Plus dy est petit, plus lestimation de Jy par J, est précise. Incertitude relative : Soit w un échantillon dem individus de U ct d, Vincertitude absolue sur Gy au niveau 100(1 — 0)%, @ €]0,1[, On appelle incertitude relative sur Gy au nivean 100(1 ~ «)% le pourcentage (100 x a,)% ot dt, est le réel Taille d’échantillon : Soit w un échantillon prélevé lors d'une Gtude préliminaire. La taille @échantillon n A choisie pour avoir © une incertitude absolue sur Jy au niveau 100(1 — a)%, « €]0, 1, inférieure ou égale & do est le plus petit n tel que N2ds2 Na+ ae? dy Sdy on © une incertitude relative sur Gy; au niveau 100(1 — a)%, « €]0, 1, inférieure ou égale & (100 x )% est Ie plus petit m tel que a 23 2 Plan de sondage aléatoire simple sans remise (PESR) Quelques commandes R : Un exemple de fonction R pour calculer la taille n d'un échantillon partir de lincertitude absole sur Gy au nivean 100(1 — a)% est décrit ci-dessous, Lech = function, 62, 40, niveau) { 2 = qnorm(1 - (1 - niveau) / 2) ne N #924 2-2 / (N# do-2 + 92 # 2-2) print (ceiling(n)) } nech(N = 1000, 52 = 625, dO = 3, niveau = 0.95) Cola renvoie 211. 2.6 Sélection des individus Méthode du tri aléatoire : La méthode du tri aléatoire est un un plan de sondage aléatoire de ype PESR. Pour la mettre en axuvre, jombres 1,...,2r7 (indépendemment des uns des autres) suivant la loi uniforme 4((0,1)), © pour tout NN}, on alfecte & Vindividu 1; le nombre ay, © on sélectionne les n individus correspondant au n plus grandes valeurs de a1,...42% Quelques commandes R : Un exemple de commandes R sur la méthode du tri aléatoire est décrit ci-dessous W= 100 n= 10 x = runif (Nl) z = NULL for (i im 1:10)£ 2[4] = which.max(u) ufwnich.max(u)] = 0 } 24

You might also like