You are on page 1of 8

1 A.

HAQIQ

L’´chantillonnage e
1 Introduction

Supposons que nous voulons avoir des informations sur la consommation d’´lectricit´ par m´nage e e e marocain (par exemple, nous voulons connaˆ la consommation moyenne, la dispersion par rapport ` ıtre a cette moyenne, la consommation minimale, la consommation maximale, ...). Pour cela, nous pouvons proc´der de deux mani`res diff´rentes: e e e 1- Utiliser les r´sultats d’un recensement g´n´ral. L’inconv´nient de cette m´thode est d’abord qu’elle e e e e e est tr`s coˆteuse et ensuite elle est entach´e d’erreurs provenant de fait que les r´sultats du recensement e u e e sont anciens et qu’ils ne prennent pas compte les derni`res ´volutions sociales et ´conomiques. e e e 2- Choisir un ´chantillon repr´sentatif de m´nages marocains. Calculer les caract´ristiques de cette e e e e ´chantillon (la moyenne, la variance, l’´cart-type,...). Extrapoler (g´n´raliser, ´tendre) les r´sultats de e e e e e e cette ´chantillon ` la population statistique totale ´tudi´e. e a e e Un ´chantillon repr´sentatif de la population ´tudi´e est une partie de cette population qui refl`te en e e e e e mieux la structure de la population ´tudi´e. Autrement dit, si dans la population ´tudi´e il y a 60 % e e e e de femmes et 40 % d’hommes, alors l’´chantillon doit comprendre 60 % de femmes et 40 % d’hommes. e Dans la pratique, deux cas peuvent ˆtre rencontr´s: e e 1- Le cas o` la population ´tudi´e est finie. u e e 2- Le cas o` on ne peut pas parler d’une population finie, dans ce cas l`, le concepte d’exp´rience u a e al´atoire est plus convenable. e Exemple: On veut tester l’honnˆtet´ d’une pi`ce de monnaie, pour cela on la lance de fa¸on r´p´titive. e e e c e e La population sera repr´sent´e par l’ensemble des lancers possibles. Un ´chantillon peut ˆtre constitu´, e e e e e par exemple, par les 50 premiers lancers o` l’on notera les pourcentages de faces et de piles. u

2
2.1

Cas d’un mod`le d’´chantillonnage e e
G´n´ralit´s et d´finitions e e e e

D´finition 1 : Soit X une variable al´atoire (v.a) d´finie de (Ω, A, P ) vers (Ω′ , A′ , PX ), o` Ω′ ´tant e e e u e ′ ′ l’espace des valeurs possibles de X, A ´tant la tribu d´finie sur Ω et PX la loi de probabilit´ de X. On e e e n e appelle mod`le d’´chantillonnage de taille n l’espace produit: (Ω′ , A′ , PX )n = ((Ω′ )n , A′n , PX ) associ´ e e ′ n n ′ e e a ` n exp´riences al´atoires ind´pendantes o` An est la tribu produit des ´v´nements de (Ω ) et PX e e e u la loi de probabilit´ jointe du n-upl´ (X1 , X2 , ...., Xn ); o` Xi est la v.a. correspondante ` l’exp´rience e e u a e num´ro i. e D´finition 2 : Soit X une variable al´atoire de loi de probabilit´ PX . On appelle ´chantillon de taille e e e e n de la variable X le n-upl´ (X1 , X2 , ...., Xn ) constitu´ de n v.a. totalement ind´pendantes et poss´dant e e e e toutes la mˆme distribution que X. e e e e e D´finition 3 : On appelle ´chantillon observ´ (x1 , x2 , ...., xn ) une r´alisation de l’´chantillon e (X1 , X2 , ...., Xn ). Autrement dit un ´chantillon observ´ est un point de lRn dont les coordonn´es sont e e e des r´elles, alors qu’un ´chantillon (X1 , X2 , ...., Xn ) est une suite de v.a. e e

. X2 . Xn ) un ´chantillon d’une v. Si (x1 .a.. . .. . x2 . V et V ′ e e Soit (X1 ... X2 . Y = h(X1 ..... Xn ) un ´chantillon. xn ) est l’´chantillon observ´.... xn ). V ar(V ) = u ee + . x2 . X2 . n i=1 n 1 ∑ ′ 3) V = (Xi − X)2 : la quasi-variance de l’echantillon. e 5) K = M ax(X1 . .. On e e e appelle statistique la v.. n i=1 n i=1 n 2) n 1∑ V ar(X) = V ar Xi n i=1 ( ) ( ) n ∑ 1 = V ar Xi n2 i=1 ( ) = n 1 ∑ V ar(Xi ) n2 i=1 car les Xi sont ind´pendantes e n 1 σ2 1 ∑ 2 σ = 2 . σ2 σ 2) V ar(X) = . Xn ) : le minimum de l’´chantillon. u n n−1 5) E(V ) tend vers σ 2 et V ar(V ) tend vers 0 lorsque n tend vers +∞ . de moyenne m et de variance σ 2 . Autrement dit une statistique est une fonction ` a valeurs r´elles de l’´chantillon. la valeur observ´e de la e e e e e statistique h est y = h(x1 .. Preuves: n n 1∑ 1∑ 1 1) E(X) = E Xi = E(Xi ) = n.m2 ′ ′ 2 ′ ′ 6) V = V . . X2 . 2.A. e e 2... n n n−1 2 3) E(V ) = σ .n. = n2 i=1 n n .(m4 − 3m2 ) 2n2 .. e n i=1 n 1∑ 2) V = e (Xi − X)2 : la variance de l’´chantillon. Les statistiques X. Xn ) : le maximum de l’´chantillon. e ′ V et V poss`dent les propri´t´s suivantes: e ee 1) E(X) = m.. E(V ) = σ (d’o` l’int´rˆt de V ) . n − 1 i=1 4) M = M in(X1 .. n n. HAQIQ 2 D´finition 4 : Soient h une fonction d´finie de lRn vers lR et (X1 ..σ 2 = . n m4 − 3m2 2m2 4) V ar(V ) = + .. e 6) E = K − M : l’´tendue de l’´chantillon.2 Exemples de Statistiques Les statistiques suivantes sont tr`s utilis´es dans la pratique: e e n 1∑ 1) X = Xi : la moyenne de l’´chantillon. σ(X) = √ ..3 Propri´t´s de X.. . X2 . o` m4 = E [(Xi − m)4 ] et m2 = E 2 [(Xi − m)2 ]... n−1 (n − 1)2 (n − 1)3 P 7) V −→ σ 2 quand n −→ +∞.. Xn )..m = m.a..

d´finie de (Ω. Xj[ = σ si i = j. e 2 Cov(Xi . n n m4 − 3m2 2m2 V ar(V ) = + n n−1 m4 et m2 ´tant constantes. 2. Envisageons ces deux cas. e e donc lim P [|V − E(V )| ≥ α] = 0. (n − 1)2 (n − 1)2 (n − 1)3 7) La propri´t´ 7 r´sulte de l’in´galit´ de Bienaym´ Tchebychev et de la propri´t´ 5. donc V ar(V ) −→ 0 quand n −→ +∞.A. P [|V − E(V )| ≥ α] ≤ (d’apr`s l’I. E(V ′ ) = E(V ) = σ 2 .1 Cas d’un ´chantillon de grande taille e e Th´or`me 1 : Soit X une v. ∀α > 0.σ = 1 − . soit ` un grand ´chantillon soit ` un ´chantillon d’une loi normale de e a e a e taille quelconque.σ 2 −→ σ 2 quand n −→ +∞. e il est fr´quent d’avoir affaire.T).(m4 − 3m2 ) 2n2 . A. P ) vers (lR.4.σ n 4) Le calcul de V ar(V ) est laiss´ ` titre d’exercice. n−→+∞ P tend 2. e n n ′ V . u n n n n ]2 ∑ 1 1∑ 1 ∑[ 2 2 3) V = (Xi − X) = (Xi − m + m − X) = (Xi − m) − (X − m) .m2 V ar(V ′ ) = V ar(V ) = + . Donc V −→ σ 2 quand n −→ +∞. Nous supposons que la loi de e e probabilit´ PX de X est quelconque et que E(X) = m et V ar(X) = σ 2 (on suppose que m et σ 2 e . ea ( ) n−1 2 1 tend 5) E(V ) = . HAQIQ σ D’o` σ(X) = √ . 6) V = n−1 n−1 n2 n. n i=1 n i=1 n i=1 E(V ) = n ] 1∑ [ E (Xi − m)2 + (X − m)2 − 2(Xi − m)(X − m) n i=1 3 n n n n ∑ 1 ∑ 2 ∑∑ = E(Xi − m)2 + E(X − m)2 − E [(Xi − m)(Xj − m)] n i=1 n i=1 j=1 i=1 n n 1 2 2 ∑∑ = n. ee e e e e ee V ar(V ) En effet: ∀α > 0.σ .σ + σ 2 − 2σ 2 = .B. Xj ) = 0 si i ̸= j (car les Xi sont ind´pendantes). e α2 tend Nous avons d´montr´ que: V ar(V ) −→ 0 quand n −→ +∞.σ + σ − V ar(Xi ) = n.4 Lois d’´chantillonnage e Dans cette section nous allons analyser les lois de probabilit´ des statistique X et V .σ + σ 2 − Cov(Xi . Xj ) n n i=1 j=1     On a Cov(Xi .a. n n i=1 n n Donc n−1 2 E(V ) = . BlR ). Dans la pratique. ) ] n ] 1 2∑ 1[ 2 n−1 2 2 2 E(V ) = n.

. . X2 . . alors e √ X −m n σ ( ) 4 −→ N (0. alors ( ) 10 N 50. N (m.A. si X1 ..i. e e e e e e 2 N (m.. alors Z = 2 Xi .a...V X −m = 2 + σ  .... Xn ) est un ´chantillon de X. σ 2 ) et soit (X1 .4.(X − m)2  2 i=1 n ( ∑ i=1 Xi − m σ n. N (m1 . avec m = 2 mi et σZ = 2 σi . X2 . σ n.a. m = 50.4 Loi de probabilt´ de V et de X e Th´or`me 3 (Th´or`me de Fisher): Soit (X1 . telles que X1 ..1 et 2. ) √ X −m 1) n . 5000 = N (50.2 c’est que dans le premier cas la loi e normale est une loi limite (approch´e) de X lorsque n devient grand. Si (X1 . HAQIQ existent). σ1 + σ2 ). . Lois Preuve: Ce r´sultat d´coule du th´or`me central limite (voir chapitre pr´c´dent). alors e e 2 2 X1 + X2 . N (mi . 1). σ2 ).V 3) Les v. 2. N m. σ ( Alors: ).. e σ σ2 Preuve de la 2 `me assertion du th´or`me: e e e On a: et n ∑ (Xi − m)2 = )2 n ∑ i=1 (Xi − X)2 + n.. X e suit exactement la loi normale 2. ea 2 Plus g´n´ralement. 2.i.3 Loi de probabilit´ de X e Supposons que X .4. X2 . e e e e n Remarque 1 : La diff´rence entrre les deux cas 2. σ 2 = 10. alors que dans le second cas. √ σ n . e e e e e e Application: Si n = 5000. Xn ) un ´chantillon tir´ suivant la loi de X ..a. Xn ) un ´chantillon tir´ suivant la loi de X. telles que Xi .2 X suit approximativement la loi Cas d’un ´chantillon d’une loi normale (de taille quelconque) e 2 2 Th´or`me 2 : Soient X1 et X2 deux v.V 2) . N (m1 + m2 . n et sont ind´pendantes. 1) quand n −→ +∞. e e n ∑ i=1 n ∑ i=1 n ∑ i=1 i = 1. 2. Il est e e ( ) 2 σ facile de voir que X ... N (m2 . X2 .. N (m. N (0. En effet. n−1 2 σ ( ) √ X −m n.4.. Xn sont des v. σi ). il suffit d’appliquer le th´or`me pr´c´dent. . σ1 ) et X2 . . χ2 . n. 2. σZ ). Preuve: laiss´ ` titre d’exercice.10−3 ).4.4.

n−1 2 σ Rappel: Loi de Student D´finition 5 : Soient X et Y deux variables al´atoires ind´pendantes telles que: X . Xn ) un ´chantillon tir´ suivant la loi de e e e e e e 2 X .V σ2 n−1 ( ) √ √ n − 1. Th´or`me 4 (Th´or`me de Student): Soit (X1 . e e e e Remarquons que: √ X −m n σ n. 1) quand n −→ +∞.(X − m) n.(X − m) √ √ = = . et donc dans les calculs on utilise la table de la e e e e loi normale N (0. On appelle loi de Student ` n degr´s de libert´ la loi suivie par la variable al´atoire T d´finie a e e e e n X par: T = √ . Stn . ) 2 2 1 o` u β(a. HAQIQ n ∑ ( Xi − m )2 i=1 5  Or σ . e e . Y n On note: T . n.1 Cas d’une population finie Notations Soit une population statistique compos´e de N individus (ou unit´s statistiques) rep´r´s par leur e e ee num´ro. Alors: ( ) √ X −m n σ . Lois 3 3. d`s que n ≥ 30 nous pouvons approximer une loi de Student ` n e a degr´s de libert´ par une loi normale centr´e r´duite. 1). χ2 .. Γ(a + b) a.V σ2 n−1 Preuve: La preuve d´coule du th´or`me de Fisher et de la d´finition de la loi de Student.. n) = √ . alors 1 n. La densit´ de probabilit´ de T est donn´e par: e e e n+1 t2 − 2 . Dans cette population on tire un ´chantillon de n individus (n < N ).β( . X2 . χ2 . Stn−1 . b) = 0 n≥1 ∫ 1 xa−1 . N (m. b > 0. σ ).(1 + ) 1 n n n. .. χ2 .. 1) et e e e Y . f (t.A.(1 − x)b−1 dx = Γ(a). Cette remarque est justifi´e par le fait que: e Stn −→ N (0. χ2 n et X − m  σ √ n 2 . N (0. V V′ Remarque 2 : Dans la pratique.Γ(b) .V .

1 Les caract´ristques de la population e La moyenne N ∑ j=1 N 1 ∑ αj N j=1 m= 3. αj : la valeur de la variable X pour l’individu num´ro j de la population ´tudi´e. pour cela.2 La variance n 1∑ (Xi − X)2 n i=1 V = 3. e e e Xj : la variable de rang j dans l’´chantillon tir´.. On extrapole ensuite les r´sultats de a e e l’´chantillon repr´sentatif ` la population globale..3 La quasi-variance V′ = n 1 ∑ (Xi − X)2 n − 1 i=1 . d´pense. HAQIQ 6 On d´signe par: e X: la variable statistique que nous voulons ´tudier (revenu. si e e e nous analysons le caract`re quantitatif.2.). dimension des pi`ces fabriqu´es. ce qui est tr`s coˆteux en e u argent et en temps. e e a 3.A.3. pour calculer m et σ 2 il faudrait faire un recensement.3. e e 3.2 3.1 Les caract´ristique d’un ´chantillon e e La moyenne n 1∑ Xi X= n i=1 3. e e e e . le revenu d’un m´nage. Par exemple. on a recours ` l’´chantillonnage.2 La variance σ2 = N ∑ αj P [X = αj ] = (αj − m)2 P [X = αj ] = j=1 N 1 ∑ (αj − m)2 N j=1 En toute rigueur. alors αj sera la valeur de revenu pour e e le m´nage j dans la population ´tudi´e.3.3 3.2.

e e e E(Xi ) = αj P [Xi = αj ] = αj V ar(Xi ) = E[(Xi − m)2 ] = E(X) = E[ V ar(X) = V ar[ car les Xi sont ind´pendantes.4 Les caract´ristques de X e N ∑ j=1 N ∑ j=1 N ∑ N 1 ∑ 1 = αj = m N N j=1 N 1 1 ∑ = (αj − m)2 N N j=1 On suppose que l’´chantillon est tir´ avec remise (ou ind´pendance). Abdelkrim HAQIQ D´partement de Math´matiques et Informatique e e Facult´ des Sciences et Techniques de Settat e Email: ahaqiq@gmail.com . e (αj − m)2 j=1 n n 1∑ 1∑ Xi ] = E(Xi ) = m n i=1 n i=1 n n 1∑ 1 ∑ σ2 n. n i=1 n i=1 n n Pr. HAQIQ 7 3.σ 2 Xi ] = 2 V ar(Xi ) = 2 = .A.

X3 . tandis que celles fabriqu´es par un industriel B ont e e une dur´e de vie moyenne de 1200 heures avec un ´cart-type de 100 heures. m) =⇒ e . 2 2 2 2 4 i=1 X3 + X4 X2 + X3 i=1 2 D´terminer les valeurs u1 . e Trois lampes sont connect´es de mani`re telle que si l’une d’entre elles claque.05 . D´terminer la probabilit´ pour que le vote e e a) de 200 b) de 1000 personnes choisies au hasard parmi le corps ´lectoral donne une majorit´ de voix en faveur de ce e e condidat. V = 1 . n).95 .80. W =√ . .05 . X) ( 1 1 1 et P (X < v) = α =⇒ > = α. le fractile d’ordre (1 − α) de la loi F (m. F (n. quelle est la probabilit´ pour e e e que les lampes A aient une dur´e moyenne de vie au moins: e a) sup´rieure de 160 heures. U = (Xi − X)2 . 1). quelle est la probabilit´ pour que e e e l’´clairage dure: e a) au moins 5000 heures ? b) au plus 4200 heures ? Exercice 4: Lors des ´lections. X2 . les r´sultats ont montr´ qu’un des condidats a obtenu 46 % des e e e voix. X v v Exercice 2: Les lampes ´lectriques fabriqu´es par un industriel A ont une dur´e de vie moyenne e e e de 1400 heures avec un ´cart-type de 200 heures. c) P (V ≤ v2 ) = 0. i.e. v2 et w1 satisfaisant aux ´quations suivantes: e e a) P (U < u1 ) = 0. n) est . e e Si l’on teste des ´chantillons al´atoires de 125 lampes de chaque marque. une autre s’allume. d) P (−w1 ≤ W ≤ w1 ) = 0. 1 R´sultat: X . e e En supposant que les dur´es de vie sont normalement distribu´es. v1 . X4 4 variables al´atoires ind´pendantes qui suivent toutes la loi normale e e centr´e r´duite N (0. b) P (V ≥ v1 ) = 0. e e 4 4 2 ∑ 1∑ X 2 + X2 X1 Posons: X = Xi .A. e b) sup´rieure de 250 heures e aux lampes B ? Exercice 3: Une marque donn´e de lampes ´lectriques ` une dur´e de vie moyenne de 1500 heures e e a e avec un ´cart-type de 150 heures. F (m. HAQIQ 8 Exercices Exercice 1: Soit X1 .