You are on page 1of 6

V - Principe des tests d’hypothèses

Un test statistique est une règle permettant de vérifier, à partir de données observées dans un
ou plusieurs échantillons, la validité de certaines hypothèses relatives à une ou plusieurs
populations. L'exécution d'un test statistique suppose trois étapes principales :
• Formulation de l'hypothèse à tester ou hypothèse nulle : cette hypothèse est notée (H0)
• Choix d'une fonction discriminante
• Décision en fonction du risque d'erreur admis.

V-1 : Hypothèse à contrôler


On peut distinguer différents types de tests destinés à contrôler une grande diversité
d'hypothèses nulles (H0).

• L'hypothèse nulle (H0) est, par exemple, l'hypothèse de normalité : un échantillon donné
peut être considéré comme extrait d'une population parent gaussienne : le test utilisé est un
test d'ajustement.

• Un test d'indépendance a pour but de tester, à partir d'un échantillon représentatif,


l'hypothèse nulle (H0) d'indépendance de deux caractères qualitatifs : par exemple,
l'indépendance entre la nature d'un traitement et l'effet d'un traitement.

• L'hypothèse nulle peut être qu'un paramètre estimé sur un échantillon (par exemple la
moyenne " x ") est une estimation du paramètre théorique correspondant d'une population-
parent : le test utilisé est un test de conformité :
• Citons enfin les tests d'homogénéité ou d'égalité : par exemple, le test de comparaison des
moyennes observées sur deux échantillons indépendants. L'hypothèse nulle est, dans ce cas,
l'égalité des moyennes théoriques des populations d'origine.

Dans les comparaisons de paramètres (moyennes, variances ou fréquences) l'hypothèse


nulle à contrôler peut être une égalité ou une inégalité. Dans le cas où(H0) est une égalité, on
parle d'hypothèse simple :
Dans le cas où (H0) est une inégalité, on parle alors d'hypothèse nulle composite.
Dans ce cas-là, la loi de probablité de la fonction discriminante utilisée n'est pas entièrement
définie par la réalisation de (H0). Nous n'aborderons pas les tests d'hypothèses nulles
composites.
V-2 : Fonction discriminante
Une fonction discriminante caractérisant un test statistique donné est une fonction Z des
résultats expérimentaux et éventuellement d'une valeur de référence (ou valeur théorique).
C'est une variable aléatoire qui suit une loi de probabilité connue lorsque l'hypothèse nulle
(H0) est vérifiée.

Prenons le cas d’une moyenne x estimée sur un échantillon de taille "n" prélevé dans une
population (supposée gaussienne) de moyenne µ et d’écart-type σ.
Soit à comparer la moyenne observée x (estimation de µ ) à une moyenne de référence µ0 ;
l’hypothèse nulle testée est donc (H0) : µ = µ0.
X − µ0
Nous verrons que la fonction discriminante Z = suit une loi de Gauss centrée
σ/ n
réduite lorsque l'hypothèse nulle (H0) est vérifiée.

Connaissant la loi de probabilité de la fonction discriminante "Z" lorsque l'hypothèse nulle


(H0) est vérifiée, il devient possible de calculer un intervalle ] z1 ; z2 [ tel que :
Pb ( Z ∈ [ z1 ; z2 ] ) = 1 - α (pour α fixé)
On peut donc dire que, lorsque l'hypothèse (H0) est vérifiée, la fonction discriminante "Z" a
une probabilité d'appartenir à l'intervalle ] z1 ; z2 [ égale à ( 1 - α ) et une probabilité de ne
pas appartenir à l'intervalle ] z1 ; z2 [ égale à "α".
L'intervalle ] z1 ; z2 [ correspond à l'intervalle de pari au risque "α" de première espèce, ou
au seuil de probabilité ( 1 - α ).

V-3 : Décision

Les valeurs de "α" les plus fréquemment choisies sont 0,05 et 0,01. Toutefois, l'utilisateur
reste libre de choisir d'autres valeurs pour "α".

Pour un test donné, il est donc possible de déterminer un intervalle ] z1 ; z2 [ tel que
Pb ( z1 < Z < z2 ) = 1 - α
lorsque l'hypohèse (H0) est vérifiée. L'intervalle ] z1 ; z2 [ constitue le domaine
d'acceptation de(H0) au risque "α" fixé. Les autres valeurs constituent le domaine de refus de
(H0).
Le risque "α" de première espèce apparaît donc comme le risque de refuser l'hypothèse nulle
(H0) alors que cette hypothèse (H0) est vérifiée.

On note quelquefois le risque "α" de première espèce (ou de type I) sous la forme :
α = Pb ( R H0 /H0) ⇔ Probabilité de refuser (H0) alors que (H0) est vraie
1
f(z)

0,8

0,6

0,4

Domaine d’acceptation Domaine de


0,2 Domaine de de H0
refus de H 0 refus de H 0
α1 α2
0 z1 z2
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

z1 = z α 1 avec Pb ( z ≤ z α 1 ) = α1 avec α1 + α2 = α.

z2 = z1−α 2 avec Pb ( z ≥ z1−α 2 ) = α2

En résumé :
On calcule la valeur numérique "zc" de la fonction discriminante à partir des valeurs
expérimentales.
On lit dans la table de la fonction de répartition de Z les valeurs z α / 2 et z 1−α / 2 telles que
:
α
Pb ( Z ≤ z α / 2 ) =
2
α
Pb ( Z ≤ z 1−α / 2 ) = 1 -
2

Si : zc ∈ ] z α / 2 ; z 1−α / 2 [ , on accepte (H0) au risque α

zc ∉ ] z α / 2 ; z 1−α / 2 [ , on refuse (H0) au risque α


N.B. : L’intervalle Ia = ] z α / 2 ; z 1−α / 2 [ est l’intervalle d’acceptation de (H0) au risque
α

Dans la pratique, on prend α = 0,05 ou α = 0,01.


La stratégie donnée ci-dessus concerne un test bilatéral. Dans ce cas, le risque "α" est réparti
de façon équivalente à gauche et à droite : α1 = α2 = α / 2.

V-4 : Spécification unilatérale ou bilatérale d’un test

On refuse donc (H0) chaque fois que la valeur observée de la fonction discriminante est dans
le domaine de refus. Ce faisant, on admet implicitement la validité d' une autre hypothèse(H
1)
dite alternative. Une hypothèse alternative est une hypothèse que l' on opposeà l' hypothèse
nulle (H0). Selon la connaissance plus ou moins précise de (H1) on répartit le risque "α" de
façon bilatérale ou de façon unilatérale.

Dans le cas d' untest bilatéral, le risque "α" de première espèce est réparti à gauche et à droite
α
de l' intervalle d' acceptationα(1 = α2 = ).
2
Dans le cas d' untest unilatéral, le risque "α" sera concentré soit à droite, soit à gauche, de
l' intervalle d' acceptation. Ce choix suppose une connaissance de 1(H
) plus précise que dans le
cas bilatéral. Un test unilatéral est plus puissant qu' un test bilatéral, mais il demande une
meilleure connaissance de l' hypothèse alternative (H1)

Exemple :
Prenons le test de comparaison d' une moyenne observée à une moyenne de référence µ0.
Dans ce cas, l' hypothèse nulle s' écrit :
(H0) µ = µ 0.

• Test bilatéral : (H1) µ ≠ µ 0.


En cas de rejet de (H0), on n'a aucune raison de penser que la moyenne observée est plus
grande (ou plus petite) que la moyenne de référence.

• Test unilatéral : (H1) µ > µ0 :


En cas de rejet de (H0) on sait que la moyenne observée est plus grande que la moyenne
de référence : on concentre le risque "α" à droite.
N.B. On peut avoir(H1): µ < µ 0 : dans ce cas, le risque "α" sera concentré à gauche.

Remarque :
Dans le cas d'une hypothèse nulle composite, le test utilisé est obligatoirement unilatéral :
nous n'aborderons pas ce problème. Notons que dans le cas d'une hypothèse nulle (H0)
simple, un test unilatéral est un cas particulier d'un test bilatéral : c'est le cas particulier où α1
= 0 et α2 = α (ou bien α1 = α et α2 = 0).

β" de deuxième espèce (ou de type II)


V-5 : Risque "β

L'erreur que l'on commet en acceptant une hypothèse fausse est l'erreur de seconde espèce. On
peut la désigner par le symbole A H0 / H/ 0 ou A H0 / H1 (H1 étant une hypothèse
alternative). Le risque "β" de deuxième espèce est le risque d'accepter (H0) alors que c'est une
hypothèse (H1), différente de (H0), qui est exacte.

On écrit : β = Pb ( A H0 / H1 )

Exemple :en contrôle de qualité,


- le risque de première espèce est le risque du vendeur, c'est-à-dire le risque de refuser un
produit alors que ce produit est bon,
- le risque de deuxième espèce correspond au risque de l'acheteur : c'est le risque d'accepter
un produit alors qu'il est mauvais.

La quantité ( 1 - β ) est appelée puissance du test. Pour un risque α fixé, le risque β de


deuxième espèce dépend de la taille de l'échantillon et de l'hypothèse alternative (H1). Le
calcul du risque β (donc la détermination de la puissance du test) peut être fait relativement
simplement pour certains tests. Dans le cas général, il est rare que ce problème possède une
solution simple et pratique.

Nous verrons que, "α" étant fixé, et pour une hypothèse alternative donnée, le risque β de
deuxième espèce dépend de la taille de l'échantillon observé. Ainsi, dans l'interprétation du
résultat d'un test statistique, il ne faut jamais sous-estimer l'importance du risque β. En
effet l'acceptation de l'hypothèse nulle (H0) peut résulter, non du fait que cette hypothèse est
vraie, mais uniquement du fait que les observations sont insuffisantes pour déclarer (H0)
inacceptable.

Avant de pouvoir affirmer valablement qu'une hypothèse (H0) est vraie, on devrait toujours
s'assurer que l'efficacité du test utilisé est suffisante pour mettre en évidence une telle
différence.
V-6 : Degré de significativité d’un test : probabilité critique pc.

Lorsqu'on refuse (H0), on peut essayer de chiffrer l'importance de la différence mise en


évidence par le test. Si zc est la valeur calculée de la fonction discriminante, on définit la
probabilité critique pc par :

• Test bilatéral : pc = Pb (Z ≥ zc ) (
= Pb Z ≤ − z c ) + Pb ( Z ≥ zc )
• Test unilatéral : pc = Pb ( Z ≥ zc ) si "α" à droite.
pc = Pb ( Z ≤ zc ) si "α" à gauche.

Dans la pratique, les calculateurs donnent la valeur de la fonction discriminante calculée et la


probabilité critique pc.
Ainsi :
Si pc ≤ α , on refuse (H0) au risque α.
pc > α , on accepte (H0) au risque α.

You might also like