You are on page 1of 5

Biostatistique Master 2 Parasitologie Les estimations Dr SAIDANI Khelaf MCB

Estimations ponctuelles et par intervalles de confiance


1. Introduction
Estimer un paramètre ou une caractéristique (pourcentage, moyenne, écart type) de la
population consiste à chercher une valeur approchée de ce paramètre.
Un grand nombre de problèmes statistiques consistent en la détermination de la moyenne
« vraie », sur la base d’observations réalisées sur un échantillon. Cependant, on peut aussi
chercher à connaître les valeurs d’autres caractéristiques, comme par exemple les variances ,
les proportions.
Deux solutions se présentent pour ce genre de problèmes :
- Soit on cherche une valeur unique, la plus proche possible de la valeur vraie (celle de la
population) et on parle d’estimation ponctuelle
- Soit on cherche un intervalle susceptible de contenir la vraie valeur, avec bien sûr un
risque d’erreur admis à l’avance et on parle d’estimation par intervalle de confiance.
Dans la pratique, on préfère l’estimation par intervalle de confiance qui donne, en plus de
la valeur ponctuelle, une idée sur la précision de l’estimation avec un risque accepté au
préalable.
Ainsi, dans la suite du cours, on s’intéresse à l’intervalle de confiance dans la proportion,
de la moyenne et de l’écart type.

2. Estimation de la proportion par intervalle de confiance

L’intervalle de confiance de niveau de confiance 1 - α de la proportion, fondé sur la valeur


observée p, p étant calculée sur n individus, est donnée par l’intervalle ci-dessous :

On remarque que c’est un intervalle symétrique par rapport à la valeur ponctuelle p.

Exemple : n = 100, risque d’erreur α = 0,05 ou bien niveau de confiance 95%=0,95, p =


12%=0,12

Que représente 1,96 ? C’est l’écart réduit correspondant au risque 5%. Par exemple, pour le
risque 1%, on remplacera 1, 96 par 2,576 dans la formule précédente.

Conditions de validité : n×p≥5 et n×(p-1)≥5

Dans l’exemple précédant, on a 100 × 0,12= 12 ≥ 5.et100 × (1 - 0,12) = 88 ≥ 5.

1
Biostatistique Master 2 Parasitologie Les estimations Dr SAIDANI Khelaf MCB

Si ces conditions ne sont pas remplies, il faudra recourir à des tables spécialisées, il s’agit de
la loi binomiale.

3. Nombre d’individus nécessaires pour un risque et une précision donnés

De façon générale, si l’on souhaite obtenir un intervalle de confiance d’une proportion de


longueur 2i, il est nécessaire d’inclure un nombre d’individus au moins égal à :

Où uα = l’écart réduit correspondant au risque α, uα=1,96 pour le risque 0,05=5%, p= la


proportion attendue (généralement celle obtenue dans les études antérieures), i= la précision
voulue, elle est traditionnellement de 0,05. La précision d’une estimation n’est rien d’autre
que la demi-largeur de son intervalle de confiance.

Remarque : puisque n le nombre d’individus est un entier positif, on arrondit toujours, par
excès.
Exemple : quel est le nombre n d’individus nécessaires pour une précision de 0,04 si la
proportion attendue est de 10%=0,1. Faites le calcul pour les risques d’erreur 5% et 1%
Solution :
En application de la formule précédente, on a :
Pour le α=5%, uα =1,96 et n= (1,96)2 × 0,1 ×0,9/(0,04)2 = 216,08. En arrondissant, on a n= 217
Pour le α=1%, uα =2,576 et n= (2,576)2 × 0,1 ×0,9/(0,04)2 =373,262. En arrondissant n=374.

4. Estimation de la moyenne par intervalle de confiance


4.1. Cas de grands échantillons où n ≥ 30
Dans ce cas, le calcul de l’intervalle de confiance de la moyenne « vraie » dite de la
population, ne nécessite aucune autre condition à remplir. Calcul est basé sur le théorème
central limite.
Si la variance vraie est connue, IC est donnée par :

Si la variance de la population (variance vraie) n’est pas connue, on la remplace dans


l’expression précédente par son estimation ponctuelle s2.

Rappelons que ∑ ̅

2
Biostatistique Master 2 Parasitologie Les estimations Dr SAIDANI Khelaf MCB

L’intervalle de confiance de la moyenne est calculé selon cette formule :

Où m et s sont, respectivement la moyenne et l’écart type estimés sur l’échantillon de n


individus.
4.2. Cas de petits échantillons où n<30
Le calcul de l’intervalle de confiance, dans ce cas, n’est possible que si la variable étudiée
obéit à la loi normale. Il est calculé selon la formule :

Où tα est associé à une nouvelle distribution, dite de Student, à (n-1) degrés de liberté. Par
conséquent, la valeur tαse lit dans la table de Student à l’intersection de la ligne (n-1) et de la
colonne correspondant au risque α choisi, le plus souvent 0,05.

5. Estimation de la variance et donc de l’écart type


L’intervalle de confiance de la variance vraie estimée sur un échantillon de taille n est donnée
par l’expression :

σ2

est la valeur qui se lit dans la table de khi-deux à l’intersection du risque et du degré de
liberté (n-1).

est la valeur qui se lit dans la table de khi-deux à l’intersection du risque et du


degré de liberté (n-1), s c’est l’écart type estimé sur l’échantillon.

Pour l’intervalle de confiance de l’écart type, il suffit juste de prendre la racine carrée de
l’expression précédente.

Remarque importante : L’intervalle de confiance de la variance n’est pas symétrique


contrairement à ceux de la moyenne et de la proportion étant donné que la variance suit
la distribution de .

6. C’est quoi l’erreur standard (abrégé en anglais S.E. standard error)


Lorsqu'on dispose des valeurs d'un caractère quantitatif concernant un échantillon
d'individus tirés au sort dans une population, on peut calculer une estimation de certains
paramètres de ce caractère, par exemple sa moyenne ou sa variance.
Ainsi, on estime la moyenne du caractère dans la population en calculant la moyenne du
caractère dans l'échantillon ; on estime la variance du caractère dans la population en

3
Biostatistique Master 2 Parasitologie Les estimations Dr SAIDANI Khelaf MCB

calculant la variance du caractère dans l'échantillon et en multipliant le résultat obtenu par


où n est le nombre des individus constituant l'échantillon ; cette multiplication permet
en effet d'obtenir une estimation exacte en moyenne.
On déduit que l’erreur type ou erreur standard de la moyenne est égale à

Si la variance dans la population est inconnue, par conséquent l’écart type, on remplace σ par
son estimation s

Et l’erreur type (erreur standard) de la moyenne E.S. =


7. Exercices sur les estimations.


7.1. Exercice 1
Cochez les réponses vraies
L’estimation ponctuelle d’un paramètre de la population est
a) Une valeur exacte de celui-ci
b) Une valeur approchée ou approximative de celui-ci
c) Un intervalle qui contient la vraie valeur de ce paramètre
d) Basé sur un échantillon de n individus
L’estimation statistique permet
a) d’assigner à un paramètre de la population une valeur exacte
b) d’assigner à un paramètre de la population une valeur approchée sans risque d’erreur
c) d’assigner à un paramètre de la population une valeur approchée avec un risque
acceptable
d) d’induire des informations sur la population d’où est extrait l’échantillon
L’estimation statistique
a) est une méthode de statistique descriptive
b) est une méthode de statistique inductive
c) comprend uniquement l’estimation ponctuelle des paramètres
d) comprend aussi bien l’estimation ponctuelle que par intervalle de confiance
On préfère l’estimation par intervalle à l’estimation ponctuelle parce que
a) elle permet d’obtenir une valeur exacte du paramètre « vrai »
b) elle donne une idée relativement à la précision
c) elle comprend en soi l’estimation ponctuelle
d) il n’y a aucun risque d’erreur

7.2. Exercice 2
Si la prévalence d’une maladie estimée sur un échantillon de 200 personnes est de 12%
- Assignez un intervalle de confiance à la prévalence de cette maladie dans la population
aux risques d’erreur α 1%, 2% et 5%.
- Que remarquez-vous en comparant les 3 intervalles ?

4
Biostatistique Master 2 Parasitologie Les estimations Dr SAIDANI Khelaf MCB

- Quel est le nombre minimal de personnes à dépister pour avoir une précision de
0,02=2% ?
- Quelle est la condition nécessaire pour le calcul de l’intervalle de confiance ?

7.3. Exercice 3
On suppose que le taux des triglycérides suit une loi normale d’écart type 0,25g/l
On prend un échantillon tiré au hasard de 25 personnes et on obtient une moyenne m= 1g/l
- Quel intervalle de confiance assigner au taux des triglycérides au risque de 5%?
- Quel est le nombre de personnes n à inclure dans l’échantillon pour obtenir une
précision de 0,01

7.4. Exercice 4
On a mesuré la taille en cm de 400 nouveaux nés on a obtenu une moyenne de 49,5 cm
- Quel intervalle de confiance assigner à cette moyenne aux risques 1% et 5%, si l’écart
type dans la population des nouveaux nés est de 2 cm ?
- Comparez les 2 intervalles !
- Que faire pour améliorer la précision d’estimation ?

7.5. Exercice 5
A partir des valeurs de vente d’un produit donné durant 10 jours consécutifs, on a eu les
résultats : 8 6 11 9 8 10 5 7 7 10
- Obtenez des estimations ponctuelles pour les paramètres suivants dans la population
moyenne, variance, écart type, proportion des valeurs de vente supérieures à 7
- Peut-on assigner un intervalle de confiance à la proportion ? pourquoi ?
- Quelle est la condition nécessaire pour calculer un intervalle de confiance à la moyenne
« vraie » ?
I

7.6. Exercice 6
Un procédé de conditionnement d’un aliment produit des paquets d’un poids qui suit une
loi de distribution gaussienne avec un écart type de 55 grammes. Un échantillon de 50 paquets
pris au hasard a permis d’obtenir une moyenne de 980 grammes.
- Calculez un intervalle de confiance de niveau 99% (risque 1%) !
- L’hypothèse de normalité est-elle nécessaire ?
- Dans quel cas elle le sera ?

7.7. Exercice 7
La durée de vie de 20 lampes économiques a été mesurée, la moyenne a été de 4520 heures
avec un écart type de 750 heures.
- Si on suppose que la durée de vie soit considérée comme suivant une loi de distribution
normale, calculez un intervalle de confiance de niveau 95% à la moyenne !
- Calculez un intervalle de confiance à l’écart type précédent !
- Pourquoi l’hypothèse de normalité est obligatoire ?

You might also like