You are on page 1of 15
4 Plan de sondage éatoire simple avec remise (PEAR) 4 Plan de sondage aléatoire simple avec remise (PEAR) 4.1 Contexte Loi de probabilité : On prélave un échantilion de n individus suivant un plan de sondage aléatoire simple avec remise (PEAR pour Probabilités Egales Avec Remise) dans une population U. Soit W la var égale A l'échantillon obtens W = (Wi...) Wa) ot, pour tout m € {1,...,n}, Wm est la var égale au m-eme individu de 'échantillon. Alors, pour tout m € {I,...,n}, la loi de W; est donné PW, ji " (Wn = th) = sp FE eee N} oP désigne la probabilité uniforme. Preuve : Lunivers associé & cette expérience aléatoire est 2 = {ur,...,uv}". Comme 2 est fini ct que chaque individu a la méme probabilité d'etre prélev6, on considere la probabilité uniforme P ard({Wen = ui}) Card(Q) P(Wm = 4) On a Card( IN". Les prélévements étant avec remise, il y a N possibilités pour chacun des n— 1 individus autres que 1;. Done Card({Wm = uj}) = N"-2. Il vient el oe B(Win = us) o Situation de référence : On préléve au hasard et avec remise n individus pour former un éhan- 45 4 Plan de sondage aléatoire simple avec remise (PEAR) tillon, Chaque individu a la méme probabilité qu'un autre d’étre sélectionné. Cotte démarche est intéressante quand n est petit ou pour servir d’élément de comparaison avee une situation de type PESR. Conditions habituelles d’estimation : Les formules habituelles d’estimation sont associées a un plan de sondage aléatoire de type PEAR. Elles sont aussi utilisées dans le cas SR. (Sans Remise) lorsque n est beaucoup plus petit que V. Une convention existante est NV > 10n. Quelques commandes R : Par exemple, pour faire un tirage avec remise de n = 20 individus dans une population de NV = 200 individus, on peut utiliser © la commande sample sample(1:200, 20, replace = T) 6 la commande srswr de Ja libr: Library (sampling) t = srsur(20, 200) x = 1:200 x(t != 0] L’abréviation srsur signifie Simple Random Sampling With Replacenent, Précisons que t = srswr(20, 200) renvoie un vecteur de taille 200 constitné de chiffres entre 0 ct 20. Les chiffres non nuls m € {1,...,20} sont positionnés aux indices des individus prélevés 1m fois et les 0 aux autres Un autre exemple : on considere la population U constituée de N = 9 gargons et on préléve un échantillon de n= 3 individus suivant un plan de sondage aléatoire de type PEAR U= c(*Bob", "Nico", "ALi", "Fabien", "Malik", "John", "Jean", “Chris”, "Karl") Library (sampling) t srswr(3, 9) w= ULt I= 0] 46 4 Plan de sondage éatoire simple avec remise (PEAR) Dans la suite : © pour les résultats, on considére un plan de sondage aléatoire de R et la var W = (W,,..., Wr) gale a I'échantillon obtenu © pour les prouves, pour raison de simplicité, on se place dans la situation de référence, Probabilités d’appartenance : © pour tout ¢€ {I,..., NP Plu €W) © pour tout (i,j) € (1)... NJ? avec i # j P(uony) € © Ona Blu; € W) = 1-P(us ¢ W). Par la définition de la probabilité uniforme, on a dus ¢ WY) Card) Pew €W) On a Card(@) = N". I reste a caleuler Card({u; ¢ W}). Le nombre de possibilités pour que 1u; ne soit pas dans l'échantillon est égal au nombre de possibilités de choisir, pour chacum des n prélévements, un individu parm les N—1 autres que u;. D’ot Card({us ¢ W}) = (N—1)" On en déduit que Ow P(ui ¢ W) = Au final, on a 47 4 Plan de sondage aléatoire simple avec remise (PEAR) © La formule d'inchision-exclusion donne P((uj,a)) €W) = Pfu € WEA (ay € WP) (us € W) + P(uy € W) — P({us € WH fu; € WH. Calculons ehacune de ces probabilités. On a Plu; € W) = Flu; € W) =1 (: Diautre part, P({u; € W}U {uy € WH) =1- Phas © WE Tay © WY) = 1 PU ¢ WHO fu ¢ WY. Or Card({ui ¢ W) A fy 1, il est raisonnable de penser que Zn suit une Joi normale. Espérance de Jy : L'estimatenr Jy est sans biais pour Ty, EGw) = du: 49 4 Plan de sondage aléatoire simple avec remise (PEAR) - 1 wo Fin =u) = ao Preuve : En utilisant la linéarité de lespérance, E (1.4) = P(A) et F(Wn = us) = 1/N, il vient 1 * ry Lv Dtwews | =F ow LE wien) taal Variance de Gy: t Ta variance de Ty ost Preuve : Les prélévements étant avec remise et P(Wiy = u;) = 1/N, les var Tgw,—ng}s--+ Lyngnunh sont did. Par conséquent, on a Vw) ¥(EEnE ton «) 2e(SEmw -») nai st 1 1. Wn ~») av tos) En utilisant la formule de Kénig-Huyghens et le fait que, pour tout (f,) € {1, «NF avec 145, Loweuplywieus) = 0, on obtiont «(Sptmia) = (ors) (ste) =£ SY vastyw wujtov=u,) ) — | ov ovsva) ( ) a = YE (on-u) I Sue (yw -)) it = Suro, =u) (duew =u Foe 50 4 Plan de sondage éatoire simple avec remise (PEAR) D’autre part, on a I stensuit Anu final, il vient Erreur quadratique moyenne de Jy L'erreur quadratique moyenne de Jy est le réel N BQM(qw)|PEAR| = X=" st 0, On constate que © phus n est grand/V'échantillon est grand, plus Gy estime bien Fy, © plus U est homogane/plus s2, est petit, plus Jy estime bien Jy Remarque : estimation de yy par Tyy est plus précise avec un plan de sondage aléatoire de type PESR que d’un plan de sondage aléatoire de type PEAR. En effet, en évaluant les erreurs quadratiques moyennes, on a EQM Gw)[PESR] = (1 4 Plan de sondage éatoire simple avec remise (PEAR) EQM (Gw)|PEAR| = r Done EQM Gw)[PESR] < EQM Gy)[PEAR] Lestimation de Jy par Jy commet done moins d’erreur dans le cadre PESR que dans le cadre PEAR, Estimation aléatoire de sy: Un estimateur aléatoire de ay est owe Va Dosa? x Di We=w) Propriété de sf : Trestimateur sfy est sans biais pour ((N —1)/N)sf (siv) = Prouve : En remarquant que 3) 35 tv, j =n, il vient Loi -gw)? Yo Uwewa mel -4 (de So typrgcuy — 2 Dw OS Ayan 20 2 ne (= VEST Aiea 205 + wth) woDY Nove) im (= wh x Love. On a P(Wm = ui) 4 Plan de sondage aléatoire simple avec remise (PEAR) Dior E (sh) - (= PS evenu) vai) En remarquant que 4 Plan de sondage aléatoire simple avec remise (PEAR) 4.3. Estimations ponctuelles Estimation ponctuelle de Jy; : +n) un échantillon de v individus de U. Une estimation ponctuelle de Gy est Ia moyenne-éehantillon EHS aon Quelques commandes R : Un exemple de calcul de J, avec R est décrit ci-dessous U= c*Bob", “Nico”, "Ali", “Fabien”, "Malik", "John", "Jean", "Chris", "Karl") y = c(72, 89, 68, 74, 81, 87, 76, 61, 84) n=3 Library (sampling) + = srswr(n, 9) bar_y.v = (1 /n) + sun(y * t) bar_y_¥ Erreur d’estimation + Soit wun échantillon den individus de 0. Lrerreur estimation que commet J, en estimant By est le réel Cw = Wo ~ ul Probabilité d’erreur Ta probabilité de se tromper de plus de (100 x 8)%, B €]0, 1], en estimant Gy par Gy est le réel 1 wage DS Mason wea) 4 Plan de sondage éatoire simple avec remise (PEAR) Estimation ponctuelle de sy t Soit © = (wi,-.-,n) un Gchantilion de n individus de U. Une estimation ponctucllo de sy est Pécart-type corrigé-échantillon Quelques commandes R : Un exemple de calcul de s, avec R est décrit ci-dessous U= c(*Bob", “Nico”, “Ali”, “Fabien”, "Malik", "John", "Jean", "Caria", "Karl") y = c(72, 89, 68, 74, 81, 87, 76, 61, 84) n-3 Library (sampling) t = srswr(n, 9) bar_y.v = (1 /n) + sun(y * t) sw = sqrt (sum((y - bar_y_w)-2 * t) / (n - 1)) Estimation ponctuelle de l'écart-type de Ty # Soit w un échantillon de n individus de U. Une estimation ponctuelle de léeart-type de Tw est le réel su) = 4.4 Intervalles de confiance ‘Résultat en loi : Si on peut admettre que ¥ suit une Joi normale, alors ot T(v) désigne la loi de Student A v = n ~ 1 dogrés de liberté. Sin est grand, on peut utiliser approximation T(v) = .N'(0, 1) 4 Plan de sondage éatoire simple avec remise (PEAR) T-intervalle de confiance pour Jy; + Soit & un échantillon de w individus de U- On suppose que ¥ suit une Toi normale. Un intervalle de confiance pour Jy au nivean 100(1 ~a)%, a €]0, 1f, est ing = Bo talv)s..), Ty + talv)sGu)] = fr mey SH + tal) ot ta(v) est le réel vérifiant P((T| > ta(v)) =a, T~ TW), v= n—1 Quelques commandes R : Un exemple de fonction R pour calculer le ‘T-intervalle de confiance pour Jy aut niveau 100(1 — 0)% est décrit ci-dessous icPEAR = function(y, N, niveau) { Length (y) mu=n-t bar_y_w = mean(y) t= qt(t - (1 - niveau) / 2, mu) s2w = sd(y)"2 var_bar_y_w = s2u /n a = bar_y.w - t * sqrt(var_bar_y_v) b = bar_y_w + t * sqrt (var_bar_y_w) print(c(a, b)) } icPEAR(y = ¢(2.1, 2.3, 4-1, 2.6, 7-1, 8-6), N= 100, niveau = 0.95) Cola renvoie : 1.576111, 7.357222 Une autre possibilité utilisant des fonctions existantes est y= c@i, 23, 41, 26,71, 86) titest(y, conf.level 95)$conf.int Cela renvoie la méme chose que précédemment : 1.576111, 7.357222, 4 Plan de sondage éatoire simple avec remise (PEAR) Résultat Ii Si m est suffisamment grand, sans hypothése de loi normale sur ¥, on a V'ap- Intervalle de confiance (limite) pour Jy : Soit @ un échantillon de n individus de J. Un intervalle de confiance pour Jy au niveau 100(1 ~ a)%, a €]0, 1f, est ol za est le réel vérifiant P(|Z| > 24) = a, Z~ N(0.1) Quelques commandes R : Un exemple de fonction R pour calculer I'intervalle de confiance li mite pour Jj au niveau 100(1 — a)% est décrit ci-dessous iePEAR2 = functionty, W, niveau) { n= longth(y) bar_y_w = mean(y) + = qnorm(1 ~ (1 ~ niveau) / 2) s2.w = sd(y)-2 var_bar_y_w = s2v /n a= bar_y_w - t * sqrt(var_bar_y_v) b= bar_y_w + t ¥ sqrt (var_bar_y_v) print(c(a, b)) } AcPEARQ(y = (2.1, 2.3, 4.1, 2.6, 7.1, 8.6, 2.1, 2.3, 4.1, 2.6, 7-4, 8.6), N= 100, niveau = 0.95) Cela renvoie : 2.980777, 5.952! 4 Plan de sondage éatoire simple avec remise (PEAR) Résultat en loi : Si on peut admettre que ¥ suit une loi normale, alors 2 K=(n- YH ~Y) Su ot x2(v) désigne la loi du Chi-deux a v = n — 1 degrés de liberté. Intervalle de confiance pour sf Soit w un Gchantillon de m individus de U. On suppose que Y suit uno loi normale, Un intervalle de confiance pour 52, au niveau 100(1 ~ a)%, « €]0, If, est n-1y an) |” ot aa(v) et ba(v) sont les réels verifiant P(K > ag(v)) =1- 8, K>n=% K~ 20), v=n-1 Remarque : Les tests statistiques habituels s'appliquent (T-Test, Z-Test, ...). 4.5. Taille d’échantillon Incertitude absolue + Soit & un échantilion de n individus de J. On appelle incertitude absolue sur Gy au niveau 100(1 — @)%, « €]0, 1f, la demi-longueur de fg, (limite) [gz dy = 298(9,) = Za) = Plus dy est petit, plus lestimation de Jy par J, est précise. 4 Plan de sondage éatoire simple avec remise (PEAR) Incertitude relative : Soit @ un échantillon de n individus de U & d, Vincertitude absolue sur Gy au niveau 100(1 — 0)%, @ €]0,1{. On appelle incertitnde relative sur Jy au nivean 100(1 — «)% le pourcentage (100 x d',)% oft dt, est le réel ds d= =. Be Taille d’échantillon : Soit w un échantillon prélevé lors d'une étude préliminaire. La taille déchantillon n A choisir pour avoir © une incertitude absolue sur Gy; au niveau 100(1 — a)%, « €]0, 1, inférieure ou égale & da est le plus petit n tel que Zasw\? ace ne) © une incertitude relative sur J au niveau 100(1 ~ a)%, e €]0,1[, inférieure ou égale & (100 x )% est Ie plus petit m tel que eeu o n8(B5) Quelques commandes R : Un exemple de fonction R pour calculer la taille n d’un échantillon a partir de lincertude absolue de Fy au niveau 100(1 — a)% est décrit ci-dessous nlech = function(N, s2, dO, niveau) { z= qnorm(1 - (1 - niveau) / 2) n= 8242-2 / do-2 print(ceiling(n)) } nech(N = 100, 52 = 63, dO = 3, niveau = 0.95) Cola renvoie 27.

You might also like