You are on page 1of 271

Le cercle rptiteur de Borda :

une solution technologique fonde sur


l'tude statistique des erreurs alatoires
Publication n118 de la commission Inter-IREM Lyce s techniques
Commission Inter-IREM
Lyces techniques
Institut Galile
99, av. J.B. Clment
93430 VILLETANEUSE

2















UNIVERSITE Paris-Nord - I.R.E.M.


LA STATISTIQUE INFERENTIELLE
EN QUATRE SEANCES
Carnet de stage



272 pages















Dpt lgal : 4
me
trimestre 2002


3
AVANT-PROPOS


La statistique infrentielle est au programme de la plupart des BTS tertiaires et
industriels depuis une quinzaine d'annes. Ce thme, absent de la formation initiale de la
plupart des enseignants de mathmatique, a ncessit de gros efforts de formation continue.
Les formateurs tant peu nombreux, notre commission inter-IREM a organis de nombreuses
journes d'information dans les acadmies.
Les stages que notre commission a organis sur ce thme Paris pour les professeurs de
mathmatiques en BTS ont t ouverts aux professeurs des acadmies voisines (Amiens,
Caen, Dijon, Orlans, Rouen). Bien que portant sur de "nouveaux programmes de 1988", ces
stages n'ont pas dsemplis jusqu'en 2000 Les preuves d'examen de BTS n'ont intgr que
trs progressivement ces notions, pour laisser aux enseignants le temps de les approfondir.
Malgr cela il n'tait pas rare, il y a peu, de trouver dans des sujets de BTS des questions o la
distinction entre intervalle de confiance et test n'tait pas vidente, ou entre paramtres
tester et observations
Je m'occupe de la formation continue depuis 1977 et la statistique infrentielle est le
seul thme de formation qui ait ncessit durant cette priode un dispositif aussi tal dans le
temps.
Bien entendu l'outil informatique a permis de dvelopper rcemment les activits de
simulation.
Notre rflexion sur l'enseignement de la statistique infrentielle en BTS depuis une
quinzaine d'annes nous a t trs prcieuse pour aborder les nouveaux programmes apparus
en seconde la rentre 2000, mme si, comme plus personne ne l'ignore maintenant, les
"fourchettes" ne sont pas des "intervalles de confiance" Nous tions, par exemple, un des
rares groupes IREM (pour ne pas dire le seul) a avoir travaill et publi sur la simulation, la
demande notamment de Monsieur Jean-Louis Piednoir IGEN, dans le cadre de travaux
commands par la direction de l'enseignement scolaire du Ministre.
La pnurie de formateurs sur ce thme s'tendant aux sries gnrales, tout
naturellement, nous avons mis en place des stages de statistique et probabilits sur les
nouveaux programmes pour les classes de seconde, premire et terminale, Paris, pour les
acadmies d'Ile de France.
Philippe Dutarte, en s'appuyant notamment sur les travaux de la commission inter-
IREM lyces techniques, anime ces formations, ainsi que des journes d'information sur
l'usage des TICE en statistique et probabilits dans les acadmies, la demande des IA-IPR.
La brochure suivante est le document papier remis aux participants ces stages et
sances d'information au cours desquels Philippe Dutarte prsente diffrentes activits sur
calculatrices ou ordinateurs.
Nous esprons que ce "carnet de stage" rendra service aux collgues et les remercions
par avance de leurs remarques et suggestions.




Bernard VERLANT
Responsable de la Commission Inter-IREM
"Lyces techniques"

4

5







Cette brochure a t ralise par :


Philippe DUTARTE
dutarte@club-internet.fr


Christian KERN
Lyce Alain ALENON




Avec la participation de :

Marie-France NOUGUES Facult des Sciences de Montpellier
Christine DHERS Lyce Newton ENREA Clichy la Garenne
Genevive SAINT-PIERRE IREM de Paris-Nord
Dominique ARBRE Lyce Paul Constans Montluon
Franoise DELZONGLE Lyce Eiffel Cachan
Isabelle BRUN Lyce Pagnol Athis-Mons
Loc MAZO Lyce Follereau - Belfort

de la
Commission Inter-IREM "Lyces techniques"





Ralisation :
Bernard VERLANT, responsable de la C.I.I. L.P.-L.T.

6














Sance 1
POURQUOI LA LOI DE LAPLACE-GAUSS EST-
ELLE NORMALE ?
10
TP
Introduction aux variables alatoires
continues
30
TP Excel
Exprimentation du thorme limite
central
35

Annales du
BTS

Variables alatoires continues et loi
normale
46
Sance 2 ECHANTILLONNAGE ET ESTIMATION 63
TP Excel Intervalles de confiance 89
TP
La matrise statistique des procds
de production
99
TP Excel
Loi binomiale et intervalle de
confiance
105

Annales du
BTS

Echantillonnage et estimation 111
Sance 3 TESTS D'HYPOTHESES 138

TP
Calculatrices
Introduction aux tests statistiques 156
TP Excel
Normalit d'une production Test du
khi 2
164

Annales du
BTS

Tests d'hypothses 170
Sance 4
FIABILITE LOI EXPONENTIELLE
LOI DE WEIBULL
196
TP Excel
Ajustement une loi exponentielle ou
une loi de Weibull
232

Annales du
BTS
Loi exponentielle Loi de Weibull 240

Sommaire

7


8

QUELQUES DEFINITIONS ...










STATISTIQUE EXPLORATOIRE
Elle repose sur lobservation de phnomnes concrets (donc passs). Son but est de
rsumer, structurer et reprsenter (statistique descriptive ) linformation contenue dans les
donnes.
Lanalyse des donnes regroupe les techniques de visualisation de donnes
multidimensionnelles (analyse en composantes principales).
PROBABILITES
Thorie mathmatique abstraite modlisant des phnomnes o le "hasard" intervient.
STATISTIQUE INFERENTIELLE
D'abord dsigne comme "statistique mathmatique" (parce que la thorie des probabilits
y a une large place) ou "statistique inductive" (parce que la dmarche y est souvent
inductive, plutt que dductive, avec toute l'incertitude que cela sous-tend), elle prend son
essor en Angleterre au dbut du XX
e
sicle, avec Ronald A. Fisher et Karl Pearson, pour
rpondre des problmes pratiques, en agronomie et en biologie.
Son but est dtendre (infrer = tirer les consquences), la population toute entire, les
proprits constates sur un chantillon. Il sagit, ayant conscience des fluctuations
d'chantillonnage, destimer un paramtre, ou de tester une hypothse statistique,
concernant la population tudie. La statistique infrentielle a un aspect dcisionnel et le
calcul des probabilits y joue un rle fondamental, en particulier pour calculer les risques
d'erreur.
SIMULATION
La simulation est la mthode statistique permettant la reconstitution fictive de l'volution
d'un phnomne. En produisant des donnes, sous un certain modle (probabiliste), la
simulation permet d'en examiner les consquences, soit pour juger de l'adquation du
modle la ralit, soit pour obtenir (ou conjecturer) des rsultats difficiles, ou
impossibles, calculer.
STATISTIQUE
EXPLORATOIRE :
Statistique descriptive
Analyse des donnes

PROBABILITES

STATISTIQUE
INFERENTIELLE MODELISATION EXTRAPOLATION
PASSE
ECHANTILLON
FUTUR
POPULATION
SIMULATION

9
ARBRE GENEALOGIQUE DE LA
STATISTIQUE INFERENTIELLE














































Statistique
descriptive
Achenwall
(1719-1772)
(Allemagne)
description des Etats
tableaux croiss
Playfair (1759-1823
Angleterre)
premiers graphiques
Arithmtique
politique
Graunt (1620-1674)
Petty (1623-1687)
Huygens
Leibniz
Halley (1656-1742)
Deparcieux (1703-
1768)
mortalit et
dmographie
Probabilits

Fermat (1601-1665)
Pascal (1623-1662)
Huygens (1629-
1695)
J. Bernoulli (1654-
1705)
Moivre (1667-1754)
Bayes (1701-1761)
X
I
X
e

s
i

c
l
e

X
X
e

s
i

c
l
e

X
V
I
I
I
e


X
V
I
I
e

s
i

c
l
e

Loi normale
Laplace (1749-1827)
Gauss
Synthse de Qutelet
(1796-1874)
Distribution normale en
biologie
Homme moyen
Calcul des
probabilits

Laplace
Poisson (1781-1840)
Cournot (1801-1877)
Bienaym (1796-1878)
Tchebychev (1821-1894)

Borel (1871-1956)
Frchet (1878-1973)
Lvy (1886 1971)
Kolmogorov (1903-1987)
Statistique
mathmatique anglaise

Galton (1822-1911) :
Variabilit, rgression
Karl Pearson (1857-1936) :
coeff. corrlation khi 2
Statistique infrentielle

Fisher (1890-1962) :
thorie de l'estimation
Gosset (1876-1937) :
loi de Student statistique industrielle
Egon Pearson (1895-1980)
et Neyman (1894-1981) :
tests d'hypothses - estimation par intervalle de
confiance
Wald (1902-1923) :
thorie des dcisions
Shewhart (1891-1967) :
cartes de contrle industrielles
Weibull (1887-1979) :
fiabilit
Astronomie
Godsie
Thorie des
erreurs
Legendre (1752-
1833)
Gauss (1777-
1855)
Moindres carrs
Biologie
Hrdit (Darwin)
Biomtrie
Psychomtrie
Agronomie
Industrie
Economie
Mdecine


10

Sance 1 :
POURQUOI LA LOI DE LAPLACE-GAUSS
EST-ELLE NORMALE ?



A propos de la loi normale : "Tout le monde y croit cependant, me
disait un jour Monsieur Lippmann, car les exprimentateurs
s'imaginent qu'il s'agit d'un thorme de mathmatiques et les
mathmaticiens que c'est un fait exprimental."
Boutade rapporte par Henri Poincar 1912.





La loi de LaplaceGauss joue un rle central en statistique (on la dsigne souvent comme la
"reine des statistiques"). Il s'agit ici de voir pourquoi, et comment on peut le faire comprendre
aux tudiants de B.T.S.
La statistique infrentielle dans les programmes de B.T.S. est axe sur cette loi (sauf pour ce
qui concerne la fiabilit). Bien sr ce n'est pas la seule loi utile en statistique, mais on ne peut
pas, dans un horaire limit, trop embrasser, et les mthodes statistiques d'estimation ou de
tests bases sur d'autres lois reposent sur des principes analogues celles fondes sur la loi
normale et faisant partie du programme. Ce sont ces mthodes qu'il s'agit de bien faire
comprendre propos du modle "normal", en se laissant la possibilit d'envisager d'autres
modles, pour rpondre aux sollicitations des matires techniques ou des tudes rencontres
par les tudiants en stage.


11

Extraits du programme de BTS 2001 :
A propos des variables alatoires continues :
"L'exemple de la loi normale est suffisant. On pourra, en vue de l'tude de la fiabilit,
prsenter la loi exponentielle."
A propos de la statistique infrentielle :
"Sous l'impulsion notamment du mouvement de la qualit, les mthodes statistiques sont
aujourd'hui largement utilises dans les milieux conomique, social ou professionnel."
" l'objectif essentiel est d'initier les tudiants, sur quelques cas simples, au raisonnement et
mthodes statistiques et l'interprtation des rsultats obtenus."
"Il s'agit de faire percevoir, partir d'exemples figurant au programme, ce que sont les
procdures de dcision en milieu alatoire, ainsi que leur pertinence."
" dans le cadre de [la liaison avec les enseignements d'autres disciplines] on pourra
donner quelques exemples d'autres procdures que celles figurant au programme de
mathmatiques (par exemple l'utilisation du test du khi 2, de la loi de Student) [] mais
aucune connaissance leur sujet n'est exigible dans le cadre de ce programme."


Avant d'tudier le rle de la loi normale, se pose le problme pdagogique (dlicat) de
l'introduction des variables alatoires continues : passage du discret au continu, notion de
densit de probabilit, approximations et correction de continuit.

A - INTRODUIRE LES VARIABLES ALEATOIRES
CONTINUES

Il s'agit d'introduire la notion de fonction de densit, en montrant que, dans ce cadre, les
calculs, lis la notion d'aire, sont des calculs d'intgrales. On fera en particulier remarquer
que l'aire totale entre l'axe des abscisses et la courbe vaut 1, que la probabilit d'une valeur
ponctuelle est nulle...

On pourra commencer par une tude de la loi uniforme sur [0, 1], o les calculs sont
simples et peuvent tre relis une tude statistique du "random" de la calculatrice.
Voir le T.D. "lve" en annexe.
Soit X une variable alatoire de loi U [0 , 1]. Si son esprance

=
1
0
2
1
dx x tombe sous le
sens, il n'en est pas de mme pour son cart type 29 , 0
12
1
)
2
1
( ) (
1
0
2
= =

dx x X .
On peut valider ce calcul barbare, par une exprimentation statistique de la fonction
random de la calculatrice ou la fonction ALEA d'Excel.


Le programme incite au recours la simulation :
"La ralisation de simulations dans le cadre du modle probabiliste de rfrence peut
fournir un clairage intressant."



12

La moyenne affiche x et l'cart type calcul s
e
sont obtenus
sur un chantillon de taille n = 100 extrait alatoirement d'une
population rpartie selon la loi U [0, 1] de moyenne
=
1
2
et d'cart type 0,29.
On observe des fluctuations
entre les diffrents chan-
tillons choisis.
Savoir si n = 100 est suffisant pour des observations
correctes, demande de connatre les lois de ces fluctuations
(donnes par la "loi des grands nombres" et le "thorme
limite central"), ce que l'on abordera en fin de sance.

On peut ensuite se placer sur le terrain de l'analyse, pour rechercher des fonctions de
densits de variables alatoires.
Voir le T.D. "lve" en annexe .
Voir les exercices corrigs d'preuves de B.T.S. (exercices d'analyse).

B LE RLE DE LA LOI NORMALE

"L'invention", au dbut du XIX
e
sicle, de la loi "normale", dont l'usage est fondamental en
statistique, s'est faite par deux voies :
- celle, dans le cadre de la "thorie des erreurs", de la mthode des moindres carrs,
qui aboutit avec Carl Friedrich Gauss (1777-1855),
- et celle des thormes limites, avec l'nonc d'une premire version du thorme
limite central par Pierre Simon Laplace (1749-1827).

I LA LOI DES ERREURS

La moyenne est la meilleure "estimation" du point de vue
de la gomtrie euclidienne :

Adrien-Marie Legendre (1752-1833) publie en 1805, dans
ses "Nouvelles mthodes pour la dtermination des orbites
des comtes", la mthode consistant minimiser la somme
des carrs des carts. Cette mthode correspond
l'ajustement optimal pour la structure gomtrique
euclidienne. Soit une quantit inconnue, pour laquelle on
possde plusieurs mesures diffrentes x
1
, x
2
, ..., x
n
(il y a
toujours des erreurs alatoires irrductibles, il ne s'agit pas
des erreurs "systmatiques" que l'on sait dtecter et valuer).
On cherche "rsumer" au plus proche le vecteur
(x
1
, x
2
, ..., x
n
) par une valeur unique c'est dire par le
vecteur (, , ).
Pour la distance euclidienne, on a :
( ) ) ,..., , ( , ) ,..., , (
2 1
2
n
x x x d =

2
) (
i
x .
U [0, 1]
= 0,5
0,29
n = 100
x ; s
100

13
L'estimation

de rendant minimale la somme des carrs des carts

2
) (
i
x
correspond la moyenne.
En effet, ce minimum sera obtenu en annulant la drive par rapport , soit

= = 0 ) ( 2 ) (
2
i i
x x
d
d

qui donne

=
n
x x
n
...
1
+
.

La loi normale est celle qui rend l'estimation par la moyenne "optimale" d'un point de
vue probabiliste :

Indpendamment de Legendre, Gauss, alors directeur de l'observatoire de Gttingen,
parvient, dans le cadre de l'tude des orbites plantaires, cette mme mthode des
moindres carrs, dit-il ds 1794 (il en conteste la paternit Legendre, mais ne publiera
qu'en 1809). L'originalit de Gauss est d'tablir les liens qui existent entre cette mthode et
les lois de probabilit, aboutissant ainsi la "loi gaussienne".
Gauss pose ainsi le problme :
Quelle est la loi des erreurs pour laquelle
i
x
n
1
est la valeur de rendant maximale la
probabilit d'observer les valeurs x
1
, , x
n
?
En envisageant la question d'un point de vue probabiliste, on considrera donc que les
erreurs e
1
= x
1
, ..., e
n
= x
n
sont des ralisations de n variables alatoires
indpendantes E
1
, ..., E
n
de mme loi continue de densit f , dpendant de la valeur
inconnue .
La mthode du "maximum de vraisemblance" :
Pour donn, la probabilit d'effectuer des erreurs entre e
1
et e
1
+ de
1
, ..., e
n
et e
n
+ de
n
est
alors, en vertu de l'indpendance, le produit des probabilits, soit f(e
1
) de
1
... f(e
n
) de
n
.
On peut alors retourner le raisonnement ( la faon de Bayes) et se demander, les mesures
x
1
, ..., x
n
tant connues, quelle est la valeur de la plus vraisemblable. C'est dire, quelle
est la valeur de qui rendra maximale la probabilit d'observation des mesures x
1
, ..., x
n

(rellement observes) donc des erreurs e
1
, ...e
n
.
Il s'agit donc de rechercher , donc f, de sorte que f(x
1
)... f(x
n
) soit maximum
(ce qu'on appellerait ultrieurement "maximum de vraisemblance").
Le produit

) (
i
x f est maximum lorsque la somme

)) ( ln(
i
x f est maximale.
En drivant par rapport , on obtient la condition

d
x f d
i
) ( ln
= 0.
Sachant que la moyenne arithmtique

=
n
x x
n
...
1
+
correspond la valeur recherche de
et que cette moyenne vrifie l'quation en :

) (
i
x = 0 , Gauss en dduit que, pour i
allant de 1 n, il suffit de poser : ) (
) ( ln

i
i
x k
d
x f d
.
On a , en intgrant, ln f(x
i
- ) =
2
) (
2

i
x
k + cte soit
2
) (
2
) (


=
i
x
k
i
Ce x f , o l'on
retrouvera l'expression de la densit de la loi normale : le rel k est strictement positif (sans
quoi il ne peut s'agir d'une densit de probabilit) et dpend de la dispersion (ce que l'on
nommera plus tard l'cart type), le rel C est calcul de sorte que l'intgrale sur IR fasse 1.


14
On remarque rtrospectivement que si f(e
i
) =
2
2
i
e
k
Ce

, alors

2
2
) (
i
e
k
i
Ce e f est
maximum lorsque la somme des carrs des carts

2
i
e est minimale.

II LES THEOREMES LIMITES
L'approche de Laplace se situe dans la voie des lois limites, ouverte par Jacques Bernoulli
avec la loi des grands nombres.
1 Loi des grands nombres

"De faon apparemment paradoxale, l'accumulation
d'vnements au hasard aboutit une rpartition
parfaitement prvisible des rsultats possibles. Le hasard
n'est capricieux qu'au coup par coup."
"Le Trsor" - M. SERRES et N. FAROUKI,
article loi des grands nombres.


L'approche frquentiste des probabilits est fonde sur la
loi des grands nombres dont Jacques Bernoulli est
l'origine ("L'Art de conjecturer" 1713).









Loi des grands nombres (nonc "intuitif") :

On rpte de faon indpendante la mme exprience alatoire o l'on observe ou non
l'vnement A.
Plus on fait d'expriences, plus la frquence d'apparition de A se rapproche de la
probabilit de A.


Voyons comment, dans l'dition "mthodique" de l'Encyclopdie, Condorcet montre
l'intrt de l'approche frquentiste, en rapportant les travaux de Jacques Bernoulli.
Jacques Bernoulli (1654-1705)

15






Article PROBABILITE de l'Encyclopdie
par Condorcet.









A propos des "sources de probabilit "...














16
De faon plus prcise, on a le thorme suivant (loi faible des grands nombres, c'est dire
pour une convergence en probabilit) :
Soit un vnement A avec P (A) = p .
Soit X
i
, 1 i n , des variables alatoires de Bernoulli, indpendantes, de paramtre p
(X
i
vaut 1 si A est ralis l'exprience i et 0 sinon).
On note S X
n i
i
i n
=
=
=

1
(qui suit la loi binomiale B (n , p) ) et F
n
S
n
=
1
, la variable
alatoire correspondant la frquence d'observation de A sur les n expriences.
Alors, pour tout t > 0, P F p t
p p
n t
>

|
\

|
( ) 1 1
2
.

Dmonstration :
C'est une application de l'ingalit de Bienaym-Tchebichev qui affirme que, pour une
variable alatoire X d'esprance E(X) = et d'cart type (X) = 0, on a, pour tout t > 0,
2
1
) (
t
t X P > .
On peut, dans le cas d'une variable alatoire prenant un nombre fini de valeurs x
1
, ..., x
n
,
justifier cette dernire ingalit ainsi :
On a
2
=

=
=
n
i
i i
x X P x
1
2
) ( ) (

>
=
n
t x j
i i
i
x X P x

/
2
) ( ) (
et

>
=
n
t x j
i i
i
x X P x

/
2
) ( ) (

>
=
n
t x j
i
i
x X P t

/
2 2
) ( .
D'o
2
t
2

2
) ( t X P > .

Remarques :
La majoration est trs grossire et conduit des valeurs de n trs grandes. Pour retrouver
l'ordre de grandeur des nombres cits dans l'exemple de Bernoulli, on devra prciser la loi
de la variable alatoire F.
Prenons l'exemple de l'urne de Bernoulli, rapport dans l'Encyclopdie.
On a p = 3/5 et Bernoulli recherche, dans "l'Ars conjectandi" une valeur de n de sorte que :
999 , 0 02 , 0
5
3
02 , 0
5
3
|

\
|
+
n
S
P
n
o S
n
suit la loi B (n, 3/5). Problme nonc ici
avec des notations modernes (l'expression "que non pas toute autre supposition" n'est pas
suffisamment claire dans l'article de l'Encyclopdie
1
).
On veut donc 001 , 0 02 , 0
5
3

|
|

\
|
>
n
S
P
n
.
L'ingalit de Bienaym-Tchebichev donne, en prenant t = 32 :
001 , 0
5
2
5
3
32
5
3

|
|
|

\
|

>
n n
S
P
n
.
Ce qui conduit choisir n tel que 02 , 0
5
2
5
3
32 =

n
d'o n = 614400.

1
L'claircissement nous a t apport par Michel Henry de l'IREM de Besanon.

17
En tudiant soigneusement, dans le dveloppement du binme, les rapports d'un terme
son prcdent, Bernoulli parvient une majoration bien meilleure de n. C'est la valeur
25550 rapporte par Condorcet, mais, comme le dit ce dernier, "la difficult et la longueur
du calcul ne permettent pas de le rapporter ici en entier."
L'utilisation par Moivre de la formule de Stirling pour approcher la factorielle nous conduit
sur la piste de la loi normale et permettra une meilleur valuation de n (voir plus loin).

La loi forte des grands nombres nonce un rsultat analogue pour une convergence
presque sre (dite aussi convergence forte), c'est dire sauf sur un ensemble de probabilit
nulle.
2 Thorme de Moivre-Laplace
On sait que la somme de n variables alatoires de
Bernoulli, valant 1 avec la probabilit p et 0 sinon,
suit la loi binomiale de paramtres n et p.
En utilisant la formule de Stirling pour approcher la
factorielle, Moivre, dans la doctrine des chances,
publie en 1718, montre l'approximation de la
distribution binomiale, pour n grand et dans le cas
p = 1/2, par la loi "normale".
Pierre Simon Laplace gnralise en 1812 ce rsultat
au cas p quelconque.

Si les X
i
sont des variables de Bernoulli,
indpendantes et de mme paramtre p, pas trs
voisin de 0 ou de 1, alors
S X
n i
i
i n
=
=
=

1
suit approximativement, pour n assez
grand, la loi normale N ( ) np np p , ( ) 1 .

Ce thorme fournit ainsi une approximation d'une loi binomiale par la loi normale de
mme moyenne et mme cart type.
La planche de Galton
La "planche de Galton" est une illustration physique
(classique... mais spectaculaire) de l'approximation d'une loi
binomiale par une loi normale.
Galton, qui n'tait pas mathmaticien, prouva le besoin
d'imaginer et de faire raliser des procds physiques pour
comprendre les proprits de la loi normale.
Ecoutons Lucien March, introducteur en France de la
statistique mathmatique anglaise, nous dcrire l'instrument
dans son ouvrage "Les principes de la mthode statistique",
paru en 1930.
"La concentration des effets de l'association de sries
primaires [il s'agit du thorme limite central] peut tre
ralis mcaniquement dans un appareil fort simple,
analogue cet ancien jouet dans lequel une bille descend
travers un quinconce de clous pour finir par se poser dans une case numrote qui indique
le gain du jeu. Cet appareil est figur ci-aprs. Il comprend une trmie dbouchant au-
Francis Galton (18221911)

18
dessus d'un prisme dont l'arte partage
l'orifice de la trmie dans une proportion
donne [cette proportion est de 6/7 sur la
figure], de sorte que des grains, des grains de
sable par exemple, jets dans la trmie se
rpartissent de chaque ct du prisme dans la
proportion fixe sur l'autre face du prisme."
Puisqu'il y a 8 ranges de prismes et qu'un
grain de sable a, pour chaque prisme
rencontr, 6 chances sur 7 d'aller gauche, la
rpartition s'effectue selon le modle de la loi
binomiale B (8 ; 1/7).
En augmentant le nombre de ranges, on se
trouvera dans les conditions d'approximation
par la loi normale et l'on mettra ainsi en
vidence le "profil" de la courbe de Gauss.






On a ralis ci-contre une simulation sous Excel
d'une planche de Galton ayant 14 ranges avec
p = 0,5 . On peut comparer l'histogramme
observ avec, d'une part l'histogramme selon la
loi binomiale et d'autre part la densit de la loi
normale.

Condition empirique d'approximation de B (n, p) par N (np, (np(1-p)) :
On donne gnralement n > 30, np et n (1 p) suprieurs 5 (ou parfois 15, ou encore
20). La convergence est d'autant plus rapide que p est plus voisin de 0,5 , on ajoute donc
parfois que p ne doit tre "ni trop petit, ni trop grand".


Les programmes donnent, propos de l'approximation d'une loi binomiale par une loi de
Poisson ou une loi normale, les indications suivantes :
"Les rsultats sont admis, mais l'outil informatique peut permettre des approches
exprimentales."
"Aucune connaissance sur les critres d'approximation n'est exigible dans le cadre des
programmes de mathmatique."
"Les tudiants doivent savoir dterminer les paramtres."
"Il conviendra de mettre en vidence la raison d'tre de la correction de continuit lors de
l'approximation d'une loi binomiale par une loi normale ; toutes les indications seront
fournies."


Voir les exercices corrigs d'preuves de B.T.S.


19
Une exprimentation sur tableur est trs facile mettre en place.
L'instruction LOI.BINOMIALE(x ; n ; p ; FAUX) calcule P(X = x) o X suit la loi B (n, p).
L'instruction LOI.NORMALE(x ; ; ; FAUX) calcule f(x) o f est la densit d'une
variable alatoire Y de loi N (, ).
L'instruction LOI.POISSON(x ; ; FAUX) calcule P(Z = x) o Z suit la loi P ().
On peut alors prsenter les calculs comme l'indique l'image d'cran suivante (on recopiera
les instructions vers le bas, jusqu' x = 50) :


On reprsente sous forme d'histogramme les trois colonnes B, C, D. Le pas des x tant de
1, les valeurs donnes par la densit de la loi normale correspondent approximativement
la probabilit P(x 0,5 Y x + 0,5).
Sur l'image prcdente, on a n = 30 et p = 0,4. L'approximation normale est assez
satisfaisante, alors que les rsultats donns par la loi de Poisson de paramtre np = 12
(btons en 3
me
position) sont trop loigns.

Il suffit de modifier les valeurs de n et p dans les cellules A2 et B2 pour voir voluer les
graphiques et exprimenter " vu d'il" les conditions d'approximation (on peut ajuster
l'chelle en cliquant dans la zone de graphique puis en ne slectionnant qu'une partie des
trois sries reprsentes).

Voir les quelques exemples qui suivent.

Les conditions d'approximation sont cependant trs empiriques et dpendent de la
prcision ncessaire chaque domaine d'utilisation. Comme on va le voir plus loin,
l'approximation peut-tre assez convenable dans un certain secteur de l'histogramme et
beaucoup plus dfectueuse ailleurs.

20
0
0,05
0,1
0,15
0,2
0,25
0,3
1 2 3 4 5 6 7 8 9 10
Srie1 Srie2 Srie3
n = 8 ; p = 0,20
Ni la loi normale, ni la loi de Poisson ne sont
rellement adaptes (pour n petit il n'est gure
utile d'approcher la loi binomiale).
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18 Srie1 Srie2 Srie3
n = 30 ; p = 0,1
La loi de Poisson (srie 3) est globalement
prfrable pour approcher la loi binomiale
(srie 1)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1 2 3 4 5 6 7
Srie1 Srie2 Srie3
n = 30 ; p = 0,7
La loi Normale (srie 2) peut approcher la loi
binomiale (srie 1). La loi de Poisson est
totalement inadapte
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
1 2 3 4 5 6 7 8 9
Srie1 Srie2 Srie3
n = 50 ; p = 0,01
La loi de Poisson (srie 3) peut approcher la loi
binomiale (srie 1). La loi Normale est
totalement inadapte






































Correction de continuit :
L'approximation de X suivant la loi binomiale B (n , p) par Y de loi normale
N (np , np p ( ) 1 ) pourra tre amliore par une "correction de continuit"
correspondant au passage du discret au continu :
P(X = k) P(k 0,5 Y k + 0,5) .

Envisageons deux exemples poss au B.T.S.


21
Exemple 1 : (d'aprs BTS informatique de gestion 1999)
Une usine fabrique des objets d'un certain type.
La probabilit de l'vnement E : "l'objet est de deuxime choix" est P(E) = 0,28.
On prlve un chantillon de 100 objets, pris au hasard et avec remise dans la
production.
On note Y la variable alatoire qui, chaque chantillon de ce type, associe le nombre
d'objets de deuxime choix dans cet chantillon.
1) Quelle est la loi suivie par Y ?
2) On approche la loi de Y par une loi normale. Quels sont les paramtres de cette loi
normale ?
3) On veut calculer le nombre = P(Y 20). Expliquer pourquoi le calcul de , par
utilisation directe de la loi de Y , est long.
On note Z une variable alatoire de loi N (28 ; 4,49) et l'on admet que P(Z 19,5) est
une approximation satisfaisante de . Calculer P(Z 19,5) .














Exemple 2 : (BTS informatique de gestion 1995)
Dans cet nonc d'examen on approche la variable alatoire Y de loi B (400 ; 0,05) par
la variable alatoire Z de loi N (20 , 19 ), ce qui est raisonnable.
L'nonc demande donc d'approcher P(Y 10) par P(Z 10,5), ce qui correspond la
correction de continuit.
Dans la zone du calcul, la dissymtrie de la loi binomiale va l'encontre de la correction de
continuit : pas de chance, P(Z 10) aurait donn un meilleur rsultat.













Voir autres noncs de B.T.S.
AVEC SANS
P(Y >= 20) P(Z >= 19,5) P(Z >= 20)
0,97410863 0,9708275 0,962604
CORRECTION CORRECTION
0
0,005
0,01
0,015
0,02
0,025
0,03
18 19 20 21
0
0,02
0,04
0,06
0,08
0,1
1
8
2
1
2
4
2
7
3
0
3
3
3
6
Comparaison de
Y de loi B (400 ; 0,05)
et de Z de loi N (20 ; 19 )
0
0,02
0,04
0,06
0,08
0,1
5 8
1
1
1
4
1
7
2
0
2
3
2
6
2
9
0
0,005
0,01
0,015
5 6 7 8 9 10 11
AVEC SANS
P(Y <= 10) P(Z <= 10,5) P(Z <= 10)
0,0093986 0,01466953 0,01090735
CORRECTION CORRECTION

Comparaison de
Y de loi B (100 ; 0,28)
et Z de loi N (28 ; 4,49)

22
Frquences observes dans le schma de Bernoulli

Si les X
i
sont des variables de Bernoulli de
mme paramtre p alors, d'aprs le thorme
de Moivre-Laplace, la variable alatoire
F =

=
=
=
n i
i
i n
X
n
S
n
1
1 1
(frquence observe
sur un chantillon de taille n) suit
approximativement, pour n assez grand, la loi
normale N p
p p
n
,
( ) 1
|
\

| .

Appliquons ce rsultat au problme pos par Bernoulli et rapport dans l'Encyclopdie.
Si la proportion de boules blanches dans l'urne est p =
5
3
, la variable alatoire F suit
approximativement la loi N
|
|

\
|
n 5
6
,
5
3
.
1) Calculons, en fonction de n, le rel positif h tel que 99 , 0 )
5
3
5
3
( = + h F h P . On
dtermine ainsi un intervalle autour de 3/5 dans lequel la variable alatoire F prend ses
valeurs dans 99 % des cas.
On pose
n
F
T
5
6
5
3

= de sorte que T suit la loi normale N (0, 1).


On a
|
|
|
|

\
|

= +
n
h
T
n
h
P h F h P
5
6
5
6
)
5
3
5
3
( or on sait (loi normale standard)
que P ( 2,58 T 2,58) 0,99.
On en dduit que
n
h
5
6 58 , 2
= .

2) On peut exprimenter, en fonction de la taille n des prlvements, les fluctuations des
frquences de boules blanches observes en effectuant le programme suivant.
L'cran illustre la "convergence" (presque sre !) en uvre dans la loi des grands nombres.

chantillon
de taille n
frquence observe
f

urne
p = 3/5

23

TI 83 Accs aux fonctions
:FnOff
:ClrDraw
:PlotsOff
:0 Xmin
:500 Xmax
:100 Xscl
:0.5 Ymin
:0.7 Ymax
:0.1 Yscl
:DrawF 3/5
:DrawF 3/5+2.58(6)/(5(X))
:DrawF 3/52.58(6)/(5(X))
:For(J ,1 , 4)
:0 P
:For (I , 1 , 500)
:int(rand+3/5) A
:If A = 1
:P + 1 P
:Pt-On ( I , P / I )
:End
:End
FnOff par VARS Y-VARS On/Off puis choix 2
ClrDraw par 2
nd
DRAW DRAW puis choix 1
PlotsOff par 2
nd
STATPLOT puis PLOTS et choix 4
Xmin Xmax Xscl... par VARS Window...
DrawF par 2
nd
DRAW puis DRAW et choix 6
For par PRGM CTL et choix 4
int par MATH NUM et choix 5
rand par MATH PRB et choix 1
If par PRGM CTL et choix 1
= par 2
nd
TEST
Pt-On par 2
nd
DRAW POINTS puis choix 1
End par PRGM CTL puis choix 7

- Si p est inconnu et que la question est de savoir si p =
5
3
, on est dans la situation d'un test d'hypothse
(situation dcrite dans l'article de l'Encyclopdie) et les limites sont alors celles de la zone de rejet de
l'hypothse p =
5
3
, selon la taille n de l'chantillon.
- Si p est "totalement inconnu" et que l'on cherche l'estimer indpendamment de toute rfrence, on a la
situation (plus dlicate) de l'estimation. On parle alors d'intervalles de confiance dont les bornes
fluctuent en permanence, selon chaque chantillon et chaque valeur de n.
(Ces notions seront abordes dans les sances ultrieures de ce stage)

3) Dterminons n ( pour comparer aux rsultats de Bernoulli, cits par Condorcet) de sorte
que : |

\
|
> 02 , 0
5
3
F P =
1
1000
.
On veut
1000
999
6
5
02 , 0 = |

\
|

n
T P . On recherche donc, pour la loi N (0, 1) la valeur
de t telle que 2 (t) 1 =
1000
999
c'est dire t =
-1
(
2000
1999
). La table, ou la
calculatrice, donne t 3,29.
On a donc
6
5
02 , 0
n
3,29 d'o n 6495 ( comparer avec 25550 obtenu par
Bernoulli).
3 Thorme limite central
Laplace va plus loin que Gauss en montrant, en 1810, que sa "seconde loi des erreurs"
2

(la loi "normale") approche la distribution des moyennes arithmtiques de n erreurs
indpendantes de mme loi. Avec Laplace, la loi normale s'impose comme presque
universelle, puisque, mme si la distribution individuelle des erreurs ne suit pas une loi

2
Laplace avait introduit en 1774 une "premire loi des erreurs", de densit f(x) = (k/2)e
- kx
avec x IR, en
considrant les carts absolus des mesures par rapport la mdiane.
C
e
s

c
a
l
c
u
l
s

n
e

s
o
n
t

p
a
s


p
o
s
e
r

a
u
x

v
e
s


!
!

Abscisses :
taille n ,
de 0 500, des
prlvements
Ordonnes :
frquence f
des boules
blanches
dans le
prlvement
Limite de la
zone 99 %
selon la
taille n

24
normale, celle des moyennes des erreurs suit approximativement, sous certaines conditions
(indpendance, lois identiques), une loi normale. C'est sur ce rsultat que va s'appuyer
toute la statistique du XIX
me
sicle.

La dnomination de "loi normale" est utilise par Pearson en 1893. Quant au nom de
"thorme limite central", il a t propos par Polya en 1920 qui parle de "central limit
theorem of probability theory".

Thorme limite central (TLC) :
Soit X
i
des variables alatoires indpendantes, de mme loi, de moyenne et d'cart type
. Pour n suffisamment grand, la variable alatoire
X
n
=
1 1
1
n
S
n
X
n i
i
i n
=
=
=

suit approximativement la loi normale N |

\
|
n

, .

De faon plus prcise, la suite de variables alatoires
n
n
n
X
|
|
|

\
|

converge en loi vers la


loi N (0 , 1) (c. d. convergence simple des fonctions de rpartitions vers celle de la loi
normale centre rduite). Ce thorme est, pour cette raison, aussi dnomm "thorme de
la limite centre".

Pour n petit (n < 30), l'approximation par la loi de Student est prfrable. On y reviendra
plus loin.

En revanche, si les X
i
, indpendantes, suivent la mme loi normale N ( , ), alors
X
n
suit exactement la loi N

,
n
|
\

| mme pour n petit.



L'cart type
n

s'explique facilement et n'est pas spcifique au cadre gaussien. En


raison de l'indpendance des X
i
, on a :
( )
n
n
n
X V
n
X
n
V X V
n i
i
i
n i
i
i n
2
1
2
2 2
1
1
) (
1 1


=
=
=
=
= = =
|

\
|
= d'o ( )
n
X
n

= .

Cas des fluctuations des moyennes d'chantillon
D'aprs le T.L.C., les moyennes des chantillons se rpartissent approximativement selon
la loi normale N ( ,
n

) (voir la sance n 2 de ce stage, propos "d'chantillonnage"


o l'on reviendra sur l'interprtation du T.L.C. en termes d'chantillonnage).

Sur l'exemple d'une population rpartie selon la loi uniforme U [0, 1] (voir au dbut de
cette sance), on peut comparer les observations sur des simulations avec les rsultats
thoriques. On compltera les colonnes "observe" l'aide de plusieurs chantillons de
taille n = 100 simuls par la calculatrice.

25

Moyenne (sur plusieurs
chantillons de taille n)
Ecart type (sur plusieurs
chantillons de taille n)
Distributions
d'chantillonnage
Variables alatoires
thorique
(esprance)
observe thorique observ
Moyennes
des chantillons
de taille n

=
i
X
n
X
1

= 0,5
(T.L.C.)
n

0,029
(T.L.C.)

Variances
des chantillons
de taille n

=
2 2
) (
1
X X
n
S
i

12 100
99 1
2

n
n

= 0,0825
(voir estimation ponctuelle
de l'cart type - sance n 2)

n
4
4


0,0075







Le moment
4
d'ordre 4 vaut, dans le cas de l'exemple : ( ) [ ]

= = =
1
0
4 4
4
80
1
d )
2
1
( ) ( x x X E X E .
Lorsque les variables alatoires X
i
sont normales, S
2
suit la loi du
2
1 n
, de moyenne n 1 et d'cart type
2(n 1). Pour ces questions (hors-programme), consulter "Saporta" p.269 p.275.

On reviendra sur l'chantillonnage dans la 2
me
sance.

Sommes de variables alatoires indpendantes
Dans le cas des sommes de variables alatoires indpendantes, il est important de noter que
X + X 2 X .
En particulier, si E(X + X ) = 2E(X ) = E(2X ), en revanche, V(X + X ) = 2V(X ) alors
que V(2X ) = E(4X
2
) 4 E
2
(X ) = 4 V(X ).
voir exercices corrig de B.T.S.

Pourquoi la loi "normale" ?
Le thorme limite central explique ainsi l'apparition de la loi normale dans l'tude de
fluctuations dues l'addition de nombreux facteurs alatoires indpendants.
De faon gnrale, la loi normale modlisera les situations alatoires possdant de
nombreuses causes indpendantes dont les effets s'ajoutent, sans que l'un d'eux soit
prpondrant (qualit d'une production industrielle, erreurs de mesure, gestion de comptes
bancaires...).
C'est ainsi qu'au XIX
e
sicle le statisticien belge A. Qutelet, puis l'anglais Galton
retrouvrent exprimentalement cette distribution normale dans quantit de domaines. Ce
qui contribua attribuer un rle prpondrant la moyenne (sous l'hypothse d'une
distribution gaussienne, il s'agit du meilleur estimateur).
Le cercle rptiteur de Borda, construit par Lenoir (visible au muse du CNAM Paris)
permit ainsi, la fin du XVIII
e
et au tout dbut du XIX
e
sicle, de faire un gain important
en prcision dans les mesures godsiques. Il favorisa la mesure de la mridienne de
L
e
s

r

s
u
l
t
a
t
s

d
e
s

c
a
s
e
s

e
n

g
r
a
s

s
o
n
t

h
o
r
s
-
p
r
o
g
r
a
m
m
e

B
.
T
.
S
.

Moyenne des
variances
obtenues sur les
diffrents
chantillons
Indicateurs des fluctuations de la moyenne
et de la variance, entre plusieurs
chantillons de taille n

26
France en vue de la dfinition du mtre. Il s'agit d'un instrument mettant concrtement en
uvre le thorme de Laplace.
Aprs avoir dtermin les erreurs
systmatiques produites notamment par
l'instrument, demeurent, dans la mesure des
angles, des erreurs fortuites que l'on
considrera comme alatoires. Ces erreurs
rsultent de l'addition de nombreux facteurs
(habilet du gomtre, conditions
atmosphriques, hydromtrie, chaleur, jeu
ou mouvement de l'instrument), sans
qu'aucun soit prpondrant. On vrifie ainsi
exprimentalement qu'elles se distribuent
selon un loi normale.
Dans ces conditions, une estimation
optimale de l'angle consistera effectuer la
moyenne de n mesures. C'est ce que permet
mcaniquement l'instrument. On sait que le
gain en prcision, mesur par l'cart type
entre les moyennes, est multipli par un facteur
n
1
, du moins en supposant indpendantes
les mesures successives, ce qui n'est pas acquis (il faudrait en particulier que l'origine de
chaque mesure soit rigoureusement la division finale de la mesure prcdente, ce qui est
rarement ralis en raison du jeu des axes
3
).
La mesure se droule ainsi :













Etape 1 Etape 2 Etape 3
Les lunettes 1 et 2 tant
indpendantes (plateaux
dbrays), on vise les points
A et B.
Les lunettes 1 et 2 sont
solidaires (plateaux
embrays), on vise alors le
point B avec la lunette 1.
Les lunettes 1 et 2 sont
dbrayes, on vise alors le
point A avec la lunette 1. La
premire mesure a t
"mmorise" et la mesure
actuelle est la somme de
deux mesures de l'angle.
Il suffit de ritrer le
procd.


3
Nous remercions M.F. Jozeau, de l'IREM de Paris 7, de nous avoir signal ce problme.
B
A
B
A
B
A
1
1 1
2 2
2

27
Malgr le rle capital qu'elle joue en statistique, la loi normale est loin de dcrire tous les
phnomnes et il ne faut pas considrer comme "anormale" une variable alatoire qui ne
suit pas une loi de Laplace-Gauss.
Le "modle normal" sera valid par des tests comme celui de la droite de Henry prsent
ci-dessous (il existe des tests plus sophistiqus, comme celui de Kolmogorov, prsent la
fin de la sance 4, o l'on quantifie les risques d'erreur).

III - AJUSTEMENT A UNE DISTRIBUTION NORMALE :
DROITE DE HENRY


Programme 2001 de BTS :
"En liaison avec les enseignements d'autres disciplines, on pourra donner quelques
exemples d'autres procdures que celles figurant au programme de mathmatiques (par
exemple utilisation de la droite de Henry)".

1 - Le principe
On souhaite utiliser la technique de la rgression linaire selon les moindres carrs pour
quantifier la qualit de l'ajustement d'une distribution statistique observe avec celle d'une
loi normale.
Du point de vue des probabilits :
On dsigne par X une variable alatoire suivant la loi N ( ; ).
Sa fonction de rpartition F est donne, pour tout x IR, par :
y = F(x) = P(X x) = P(

x
) = P(

X
t) = (t) , avec t =

x
et o
est la fonction de rpartition de la loi N (0, 1), tabule dans le formulaire officiel.
Statistiquement, l'analogue de la fonction de rpartition est la frquence cumule : pour
une valeur x
i
de la distribution statistique, y
i
est la frquence cumule croissante.
Notons t
i
la valeur, donne par lecture inverse de la table de la loi N (0 ; 1), telle que
y
i
= (t
i
) t
i
=
-1
(y
i
).
Si la distribution statistique est extraite d'une population normale, le nuage de points (x
i
; t
i
)
devrait donc tre ajust par la droite d'quation t =

x
, que l'on nomme droite de
Henry (lequel a appliqu ce procd lors de l'tude de la prcision des tirs d'artillerie).

Historique statistique Modle probabiliste
Srie d'observations x
i
Variable alatoire X
Frquences cumules y
i
Fonction de rpartition F
Srie des valeurs t
i
=
-1
(y
i
)
t
i


i
x
(ajustement linaire)


=
X
T , de fonction de rpartition ,
suit la loi N (0, 1)

2 - Un exemple
La dure de vie, exprime en heures, des joints lvres PLAUSTRA - type IE - dfinit une
variable alatoire continue X.

28
L'tude de la dure de vie de 500 de ces joints a permis d'obtenir l'historique suivant.

Temps de bon
fonctionnement xi
500 700 900 1100 1300 1500 1700
Effectifs
ni
24 67 108 126 109 51 15
a - Sur calculatrice
Sur TI 83, on peut procder ainsi :

Oprations Procdure Accs aux fonctions
Effacer les listes. ClrList L
1
, L
2
, L
3
, L
4
ClrList par STAT EDIT choix 4
L
1
au clavier par 2
nd

Entrer en liste L
1
les temps de bon
fonctionnement x
i
(sauf le dernier
qui donnerait une frquence 1).
Entrer en liste L
2
les effectifs n
i

(sauf le dernier).
STAT EDIT choix 1 Edit...
puis ENTER

Entrer les 6 nombres dans chacune
des colonnes L
1
et L
2
.

Quitter l'diteur de listes 2
nd
QUIT
Calculer les frquences cumules
y
i
(en liste L
3
).
Calculer les valeurs t
i
=
1
(y
i
)
correspondantes (en liste L
4
).
cumSum(L
2
)/500 L
3

ENTER
seq(invNorm(L
3
(X)),X,1,6) L
4

ENTER
cumSum par 2
nd
LIST OPS puis
choix 6
par la touche STO4
seq par 2
nd
LIST OPS puis choix 5
invNorm par 2
nd
DISTR choix 3
Faire la rgression linaire sur les
listes L
1
et L
4
.
LinReg(ax+b) L
1
, L
4

ENTER
LinReg(ax+b) par STAT CALC
choix 4

On obtient les rsultats suivants :









La corrlation r 0,9995 justifie l'ajustement des dures de vie une distribution normale.
On a

1
0,0035 d'o estim 285,7 heures.
Puis

3,4001 qui conduit estimer 971,5 heures.



b - Sur ordinateur
Voir TP sur Excel en annexe.
c - A l'aide du papier Gausso-arithmtique
C'est une mthode graphique ("au jug"). Son intrt est sa grande simplicit, raison pour
laquelle elle est encore utilise dans le domaine technologique.
On a report en abscisses (chelle arithmtique), les temps de bon fonctionnement x
i
et en
ordonnes (chelle gaussienne proportionnelle
1
), les frquences cumules y
i
.

29








30


31
TRAVAUX
DIRIGES
T. D. : INTRODUCTION AUX
VARIABLES ALEATOIRES CONTINUES

Une variable alatoire discrte prend des valeurs "isoles" :
Une variable alatoire X suivant la loi binomiale B (n, p) prend comme valeurs
possibles les nombres entiers entre 0 et n.
Une variable alatoire X suivant la loi de Poisson P () prend comme valeurs
possibles les nombres entiers positifs.
On peut reprsenter la distribution d'une
variable alatoire discrte sous forme
d'histogramme avec des rectangles de base
1, o la probabilit P (X = k) est
proportionnelle (question d'chelle) l'aire
du rectangle correspondant.

Par exemple, ci-contre, la distribution de la
loi binomiale B (6 ,
2
1
).

Une variable alatoire continue peut prendre comme valeurs tous les nombres rels d'un
certain intervalle.
Sa distribution est donne par sa fonction de densit f . La probabilit qu'une ralisation de X
soit comprise entre a et b est alors ( un facteur d'chelle prs) l'aire situe sous la courbe
reprsentative de f, entre les droites d'quation x = a et x = b.


1 A partir d'une courbe de densit


1) Dans le cas ci-contre, on a :
P (1 X 3) =

3
1
d ) ( x x f .
Hachurer l'aire correspondante.
2) Dterminer :
P ( X = 2) =

2
2
d ) ( x x f = ..
Commenter votre rsultat : ...........................................
...................................................................................
...................................................................................
...................................................................................
...................................................................................

0
0,1
0,2
0,3
0,4
0 1 2 3 4 5 6


0 1 2 3
y = f (x) , densit de X

32

2 LOI UNIFORME SUR [0, 1]

1) Soit Y la variable alatoire qui correspond au tirage au hasard d'un nombre d'au plus 10
dcimales dans l'intervalle [0, 1[.
a) Justifier qu'il y a 10
10
rsultats possibles. .....................................................................................
b) Quelle est la probabilit de l'vnement "Y = 0,4536694833" ? ..................................................
et de l'vnement "Y = 0,5" ? ............................................................................................................
2) Soit X la variable alatoire qui correspond au tirage au hasard d'un nombre rel de
l'intervalle [0, 1] (il y a une infinit de rels dans cet intervalle).
Quelle est la probabilit de lvnement "X = 0,5 " ? ......................................................................
Quelle est, intuitivement, la probabilit de l'vnement " 0 X
2
1
" ? .........................................
3) La variable alatoire X admet comme densit la fonction f dfinie par : f (x) = 1 si x [0,
1] et f (x) = 0 si x [0, 1]. Utiliser la fonction f pour calculer :
a) P ( 0 X 0,5) =

5 , 0
0
d ) ( x x f ......
b) P (0,2 X
0,3)....
c) E (X ) =

1
0
. d ) ( x x f x .
d) V (X ) =

1
0
2
d ) ( )] ( [ x x f X E x , puis (X ) = ) (X V
...........................................................................................................................................................
e) Que vaut

1
0
d ) ( x x f ? Justifier le rsultat par un argument probabiliste.
...........................................................................................................................................................
4) Simulation de X avec la calculatrice :
Votre calculatrice contient une fonction "Random", symbolise par Ran# ou rand, qui simule
une ralisation d'une variable alatoire de loi uniforme sur [0, 1] (du moins, le choix au hasard
d'un nombre dcimal).
Effectuer Ran# ou rand sur votre calculatrice puis plusieurs fois EXE ou ENTER. Observer.
Le programme ci-dessous effectue 100 fois la fonction "Random" puis dtermine la moyenne
et lcart type des rsultats.

CASIO GRAPH 25 30 65 80 100 TI 82 83 TI 89 92
ClrList
Seq(0,I,1,100,1) List 1
For 1 I To 100
Ran# List 1[I]
Next
1-Variable List 1 , 1
:ClrList L
1

:seq(0,I,1,100,1) L
1

:For (I,1,100)
:rand L
1
( I )
:End
:Disp mean(L
1
)
:stdDev(L
1
)
:DelVar L1
:seq(0,i,1,100,1) L1

:For i , 1 , 100
:rand( ) L1[ i ]
:EndFor
:Disp mean(L1)
:Disp stdDev(L1)
Sur CASIO : On obtient CLRList par PRGM CLR ; Seq et List par OPTN LIST ; Ran# par OPTN PROB ;
1-Variable par PRGM EXIT MENU (F4) STAT CALC.
Sur TI : On obtient mean et stdDev par 2
nd
List MATH.

Comparer avec les valeurs thoriques E (X ) et (X ) :


1
1
0

33
3 RECHERCHE DE FONCTIONS DE DENSITES

1) Fonction "chapeau" :
Rechercher une fonction f telle que : f (x ) = 0 si x [-1;1],
f ( 1) = f (1) = 0 ,
f (0) > 0 ,
f est paire, reprsente par deux segments ,

=
1
1
1 d ) ( x x f .



2) Remplacer les segments de droites prcdents par des arcs de courbes d'quation y = a
cos(x) o a et sont dterminer en conservant les autres conditions.
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
3) Soit f dfinie sur IR par f (x ) =

<

0
0 0
2
x si ae
x si
x
, o a est une constante strictement positive.
a) Calculer, pour x 0, f ' (x ).
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
b) En dduire les variations de f.
...............................................................................................................................................
c) Dterminer
+ x
lim f (x ) puis dresser le tableau de variation de f.
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
d) Calculer , pour t > 0, I (t ) =

t
x x f
0
d ) ( .
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
e) Dterminer
+ t
lim I (t ).


Quelle valeur donner au rel a pour que f soit la fonction de densit d'une variable
alatoire X ?

34


f) Calculer, dans ces conditions, pour t > 0, J (t ) =

t
x x f x
0
d ) ( ,
puis l'esprance de X : E (X ) =
+ t
lim J (t ).

...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................

4) Soit la fonction f dfinie sur IR par f (x ) =
2
2
1
e
2
1
x

.
a) Montrer que f est paire. Qu'en dduit-on quant sa courbe reprsentative ?


b) Dterminer
+ x
lim f (x ). En dduire
x
lim f (x ).


c) Calculer, pour tout x IR , f '(x ). Dresser le tableau de variations de f.


d) Tracer, dans un repre orthogonal ( ) O; i ; j
r r
, la courbe C, reprsentant la fonction f.
e) Donner, l'aide de votre calculatrice, des valeurs approches des intgrales
suivantes :
I (1) =

1
1
d ) ( x x f ; I (2) =

2
2
d ) ( x x f
....
I (10) =

10
10
d ) ( x x f . .

35

T.P. Excel : EXPERIMENTATION DU
THEOREME LIMITE CENTRAL
Objectifs
Exprimenter le thorme limite central sur la simulation de 1000 donnes.
Trier des donnes pour comparer leur distribution une densit normale.
Contrler la normalit d'une distribution empirique par rgression linaire (droite de
Henry).
Appliquer ce procd pour un test de normalit d'une production industrielle.
1 - GENERATION D'UNE DISTRIBUTION DE 1000 VALEURS
Loi uniforme sur [0 , 1]
Lancer Excel

.
Dans la cellule A1, entrer la formule : =ALEA( )
Faire ENTREE puis, en approchant le pointeur de la
souris du carr noir situ dans le coin infrieur droit de
la cellule A1, celui-ci se transforme en une croix noire,
faire alors glisser en maintenant le bouton gauche enfonc pour recopier jusqu'en J1.
La fonction ALEA( ) gnre un nombre alatoire compris entre 0 et 1, c'est dire qu'elle
simule un rsultat d'une variable alatoire X suivant la loi uniforme sur [0 ; 1] : U ([0 , 1]).
Un peu de thorie avant de poursuivre... Cette loi continue admet comme fonction de
densit la fonction f dfinie par : f (x) =
1 0 1
0 0 1
si
si
x
x

[ , ]
[ , ]
.
Calculer, pour cette loi, sur la feuille rponse, l'esprance et la variance.
Somme de n = 12 variables alatoires indpendantes de mme loi
U [0 , 1]
On dsigne par Y une variable alatoire somme de n = 12 variables alatoires de mme loi
U [0 , 1]. Pour simuler 1000 ralisations de Y, procder ainsi :
Cliquer sur la cellule A1. Dans la Barre de formules, slectionner ALEA() (mettre en
vido inverse en balayant, bouton gauche de la souris enfonc) puis cliquer sur l'icne
Copier. Cliquer dans la barre de formules, ajouter la fin + puis cliquer sur l'icne Coller.
Rpter l'opration de faon avoir la somme de 12 fois la fonction ALEA( ) (rien voir
avec 12*ALEA( ) !). Faire ENTREE.
En approchant le pointeur de la souris du carr noir situ dans le coin infrieur droit de la
cellule A1, celui-ci se transforme en une croix noire, Recopier alors jusqu'en J1. Relcher
Recopier
Copier Coller
Barre de
formule

36
le bouton gauche de la souris puis Recopier vers le bas jusqu'en J100 (il faut que la
premire ligne soit slectionne avant de recopier
vers le bas).
Vous avez maintenant une simulation de 1000
ralisations alatoires de la variable Y.
Pour conserver ces 1000 valeurs, ou refaire une
nouvelle simulation quand on le dsire, cliquer dans
le menu Outils / Options... puis dans l'onglet
Calcul de la bote de dialogue, la rubrique Mode
de calcul, choisir Sur ordre puis OK.
Moyenne x et cart type s
e
d'un chantillon de 1000 valeurs
En A102 taper "moyenne" et en B102 entrer la formule : =MOYENNE(A1:J100) puis
ENTREE.
En A103 taper "cart type" et en B103 entrer la formule : =ECARTYPEP(A1:J100)
(Attention bien taper ECARTYPEP et non ECARTYPE qui correspond l'estimation de
l'cart type de la population dont est extrait l'chantillon) puis ENTREE.
Faire F9 pour une nouvelle simulation de 1000 valeurs.
Consigner vos rsultats sur la feuille rponse.
Valeurs thoriques de et
En rptant 12 fois la fonction ALEA() et en faisant la somme, on simule la somme de 12
variables alatoires indpendantes de loi U ([0 , 1]). On note et l'esprance et l'cart
type de cette somme.
Dterminer les paramtres thoriques et sur la feuille rponse.

2 - THEOREME LIMITE CENTRAL
Un nonc du thorme
Pourquoi, avec une expression analytique paradoxalement complique, la loi de Laplace-
Gauss est-elle si rpandue au point d'tre qualifie de "normale" ?
La rponse des mathmaticiens cette question est le Thorme limite central :

La somme de n variables alatoires indpendantes de mme loi
suit approximativement, pour n assez grand, une loi normale.

Expliquer, sur la feuille rponse, pourquoi, selon ce thorme, la variable alatoire Y
suit approximativement une loi normale.
Comparaison graphique de l'histogramme des 1000 donnes la
densit normale
Tri des donnes
On va regrouper les 1000 donnes en 17 classes de part et d'autre de la valeur 6.
Il faut entrer les bornes suprieures de ces classes.
Cliquer sur l'onglet Feuil2 (en bas).
En A1 taper "sup classes".
Onglet Calcul

37
En A2 entrer la valeur 2,25 . En A3, entrer la formule : =A2+0,5
Recopier vers le bas jusqu'en A18 puis
faire F9. Le calcul s'effectue et la dernire
cellule contient alors la valeur 10,25.
En B1 taper "effectifs ni".
Slectionner les cellules de B2 B18
(pour cela, cliquer sur B2 et glisser, en
gardant le bouton gauche de la souris
enfonc, jusqu'en B18, puis relcher le
bouton de la souris).
Alors que les cellules slectionnes
apparaissent en "vido inverse", cliquer
dans la barre de formules et taper :
=FREQUENCE(Feuil1!A1:J100;A2:A18)
puis valider en appuyant en mme temps
sur les touches CTRL MAJUSCULE et
ENTREE.
Excel calcule alors les effectifs de
chacune des classes (et non les frquences
comme semble l'indiquer le nom de la
fonction utilise).
En B19, cliquer sur l'icne de somme automatique puis sur ENTREE. Vous devriez
obtenir l'effectif total de 1000.
Comparaison avec les rsultats que fournirait la loi N (6 ; 1)
La fonction de densit de la normale N (6 ; 1) est dfinie sur IR par : f (x) =
1
2
1
2
6
2

e
x ( )
.
L'histogramme tant construit partir de classes d'amplitude 0,5 , chaque rectangle devrait,
dans le cadre de la loi normale N (6 ; 1), avoir comme hauteur 500 f (x) .
En C1, taper "valeurs xi". En C2, entrer la valeur 2. En C3, entrer la formule : =C2+0,5
puis recopier cette formule vers le bas jusqu'en C18 . Aprs F9, cette cellule contiendra la
valeur 10. En D1, taper "loi normale". En D2, entrer la formule :
=(500/RACINE(2*PI()))*EXP(-0,5*(C2-6)^2) puis recopier cette formule vers le bas
jusqu'en D18. Faire F9.
Cliquer sur l'icne Assistant
graphique.
Etape 1 sur 4 : dans l'onglet
Types personnaliss choisir
Courbes-Histogramme puis
cliquer sur Suivant.
Etape 2 sur 4 : dans l'onglet
Plage de donnes, sortir, par
l'icne indiqu ici, vers la feuille
de calcul. Y slectionner les
valeurs n
i
puis revenir, par
l'icne analogue, dans la bote de
dialogue.
Dans l'onglet Srie, pour la Srie
2 , Etiquettes des abscisses X,
Slectionner
Barre de
formules
Assistant
graphique
Sortie vers la
feuille de calcul

38
sortir, sur la feuille de calcul, slectionner les valeurs x
i
. Cliquer sur Ajouter puis, pour la
Srie 1, sortir, sur la feuille de calcul, slectionner les Valeurs (colonne des valeurs "loi
normale"). Cliquer sur Suivant.
Etape 3 sur 4 : dans l'onglet Lgende, dslectionner Afficher la lgende. Cliquer sur
Suivant.
Etape 4 sur 4 : cocher Sur une nouvelle feuille puis Terminer.
Cliquer, avec le bouton droit de la souris, sur un point de la courbe (Srie 1) puis choisir
Format de la srie de donnes... Dans l'onglet Motifs, pour Traits, augmenter un peu
l'paisseur et cocher la case Lissage, pour Marque, cocher Aucune puis faire OK.
Faire F9 pour une nouvelle simulation de 1000 valeurs.
Consigner vos commentaires sur la feuille rponse.

3- DROITE DE HENRY
On souhaite, dans ce paragraphe, utiliser la technique de la rgression linaire selon les
moindres carrs pour quantifier la qualit de l'ajustement de la distribution observe avec
une loi normale.
On dsigne maintenant par X une variable alatoire suivant la loi N ( , ).
Sa fonction de rpartition F est donne, pour tout x IR, par :
y = F(x) = P(X x) = P(
X

) = P(
X

t) = (t) , avec t =
x

et o
est la fonction de rpartition de la loi N (0 , 1), tabule dans le formulaire officiel.
Statistiquement, pour une valeur x
i
de la distribution, y
i
est la frquence cumule
croissante (analogue statistique de la fonction de rpartition). Notons t
i
la valeur, donne
par lecture inverse de la table de la loi N (0 , 1), telle que y
i
= (t
i
) t
i
=
-1
(y
i
).
S'il s'agit d'une distribution normale, le nuage de points (x
i
, t
i
) devrait donc tre ajust par
la droite d'quation t =
x

, que l'on nomme droite de Henry.


Sur la feuille 2, taper en E1 "ni cumuls" et E2, entrer la formule : =B2 puis en E3, la
formule : =E2+B3 puis Recopier vers le bas jusqu'en E18 puis faire F9. La valeur
calcule devrait tre 1000.
En F1, taper "frq cumul yi", puis en F2, entrer la formule : =E2/$B$19 puis recopier
vers le bas jusqu'en F18 (le symbole $ empche la modification de la rfrence de la
cellule lors de la recopie vers le bas). Faire F9.
En G1, taper "ti invnorm(yi)".
Cliquer en G2, puis sur l'icne
Coller une fonction.
Choisir Statistiques puis
LOI.NORMALE.STANDARD.INVERSE
et cliquer sur OK.
Dans la bote de dialogue, entrer
pour Probabilit : F2.
Cliquer sur OK.
Recopier vers le bas jusqu'en G18
puis faire F9.

Pour les valeurs 0 et 1 de y, Excel rpond pour t : #NOMBRE!
Pouvez-vous expliquer pourquoi ?
Coller une
fonction

39
On va maintenant reprsenter le nuage de points (x
i
; t
i
).
Cliquer sur l'icne Assistant graphique.
Etape 1/4 : choisir Nuages de
points (sous-type n1 sans courbe).
Cliquer sur Suivant.
Etape 2/4 : Onglet Plage de
donnes, sortir vers la feuille de
calcul pour y slectionner, parmi
les valeurs t
i
, celles ne contenant
pas #NOMBRE!
Revenir dans la bote de dialogue
de l'assistant graphique.
Onglet Srie, Valeurs X : sortir
slectionner les cellules contenant
les valeurs xi correspondantes.
Cliquer sur Suivant.
Etape 3/4 : Onglet Lgende,
dsactiver l'option Afficher la
lgende. Onglet Quadrillage, dsactiver les options. Cliquer sur Suivant.
Etape 4/4 : cocher Sur une nouvelle feuille puis cliquer sur Terminer.
On peut demander Excel d'ajouter sur le nuage de points (x
i
, t
i
) une courbe de tendance.
Cliquer sur le graphique. Aller dans le menu Graphique (en haut de l'cran) et cliquer sur
Ajouter une courbe de tendance... Dans la bote de dialogue, dans l'onglet Type choisir
Linaire puis dans l'onglet Option cocher
Afficher l'quation sur le graphique et
Afficher le coefficient de dtermination (R
2
) sur le graphique
puis cliquer sur OK.
La droite affiche est la droite de Henry, obtenue par ajustement linaire de t en x selon la
mthode des moindres carrs. Faire F9 pour une autre simulation de 1000 valeurs.
Exploiter sur la feuille rponse les rsultats affichs.
4- TEST DE NORMALITE D'UNE PRODUCTION
La dure de vie, exprime en heures, des joints lvres PLAUSTRA - type IE - dfinit une
variable alatoire continue X.
L'tude de la dure de vie de 500 de ces joints a permis d'obtenir l'historique suivant :

Temps de bon
fonctionnement x
i

500 700 900 1100 1300 1500 1700
Effectifs
n
i
24 67 108 126 109 51 15

Reprendre, sur la feuille 3 du classeur Excel, les techniques du 3 pour :
1) Crer un tableau contenant les valeurs x
i
, n
i
, les effectifs cumuls croissants y
i
et les
valeurs t
i
=
-1
(y
i
) correspondantes.
2) Reprsenter graphiquement le nuage de points (x
i
; t
i
).
3) Y indiquer la droite de Henry et le coefficient de dtermination.

Exploiter les calculs d'Excel pour montrer, sur la feuille rponse, que l'on peut ajuster
la distribution de la dure de vie des joints PLAUSTRA une loi normale dont on
prcisera les paramtres.
Sortie pour slection
dans la feuille de calcul

40
FEUILLE REPONSE
NOMS : .............................................................................................................

1- GENERATION D'UNE DISTRIBUTION DE 1000 VALEURS
Loi uniforme sur [0 , 1]
Soit X suivant la loi U ([0 , 1]).
E(X) =

1
0
dx x = ................................................................................................................................
V(X) = E(X
2
) - [E(X)]
2
=

1
0
2
dx x - [E(X)]
2
= ...................................................................................
Somme de n = 12 variables alatoires indpendantes de mme loi
U [0 , 1]
Moyenne x et cart type s
e
d'un chantillon de 1000 valeurs
Complter, pour quatre simulations, le tableau ci-dessous :
Simulation n 1 2 3 4
x
s
e

Valeurs thoriques de et
Soit Y = X
1
+ X
2
+ ... + X
12
o les X
i
sont indpendantes de loi U ([0 ; 1]).
= E(Y) = 12E(X) ..........................................................................................................................
= V Y V X ( ) ( ) = 12 = ................................................................................................................
Comparer x et s
e
: ................................................................................................................
...........................................................................................................................................................
2 - THEOREME LIMITE CENTRAL
Un nonc du thorme
Pourquoi peut-on considrer que Y suit approximativement une loi normale ? ...............................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
Quels sont, thoriquement, les paramtres de cette loi normale ? ....................................................
...........................................................................................................................................................
Comparaison graphique de l'histogramme des 1000 donnes la
densit normale
Comparer, sur plusieurs simulations, l'histogramme avec le profil de la densit normale : .............
...........................................................................................................................................................
...........................................................................................................................................................

41
L'utilisation du thorme limite central tait-elle justifie ? ............................................................
...........................................................................................................................................................
...........................................................................................................................................................

Imprimer le graphique (si possible) ou enregistrer le fichier

3- DROITE DE HENRY
On pose y = F(x) = (t) et t =
1
(y).
Pour les valeurs 0 et 1 de y, Excel rpond pour t : #NOMBRE! car
1
(0) correspondrait .........
...................et
1
(1) correspondrait .............................................................................................
Dterminer, pour plusieurs simulations, la valeur du coefficient de corrlation linaire R de
t en x :

Simulation 1 2 3 4
R

Peut-on estimer que la srie des 1000 donnes est issue d'une distribution normale ? ....................
Pour une simulation o R est au moins de 0,9, donner l'quation t = ax + b de la droite de
Henry fournie par Excel :
...........................................................................................................................................................
S'il s'agit de loi N ( ; ), la droite de Henry a comme quation : t =
1

.
En dduire une estimation de et de :
est estim .....................................................................................................................................
...........................................................................................................................................................
est estim .....................................................................................................................................
...........................................................................................................................................................

Comparer aux valeurs de et de attendues (1) : .........................................................................

4- TEST DE NORMALITE D'UNE PRODUCTION
Est-il raisonnable d'ajuster la distribution des dures de vie des joints PLAUSTRA une
loi normale ? .....................................................................................................................................
...........................................................................................................................................................
Quelle est l'quation t = ax + b de la droite de Henry calcule par Excel ?
...........................................................................................................................................................
En dduire une estimation de et : ...............................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................

Imprimer le graphique (si possible) ou enregistrer le fichier

42

Corrig et compte-rendu de l'activit EXCEL
"AJUSTEMENT A UNE LOI NORMALE"

1- GENERATION D'UNE DISTRIBUTION DE 1000 VALEURS

Loi uniforme sur [0 , 1]
Si X suit la loi U ([0 , 1], on a E(X) =
1
2
et V(X) =
1
12
.
Somme de n = 12 variables alatoires indpendantes de mme loi U [0 , 1]
Des valeurs exprimentales sur 1000 ralisations de Y :




Les valeurs thoriques sont = E(Y) = 6 et = (Y) = 12
1
12
= 1.
Les valeurs observes sur les 1000 donnes sont trs proches

2 - THEOREME LIMITE CENTRAL

Un nonc du thorme
La variable alatoire Y tant la somme de n = 12 variables alatoires indpendantes de
mme loi, elle suit approximativement (en supposant que n = 12 est assez grand) une loi
normale.
Il est clair que la moyenne et l'cart type de cette loi normale doivent tre ceux de Y cet
dire = 6 et = 1.

Comparaison de l'histogramme des 1000 ralisations de Y avec la densit de la
loi N (6 , 1)
0
50
100
150
200
250
2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10

Il suffit de faire F9, pour avoir aussitt une autre simulation. On exprimente ainsi
l'approximation donne par le thorme limite central. Il apparat ici que n = 12 est suffisant
pour une bonne approximation normale.



Simulation n 1 2 3 4
x
6.001 5.974 5.974 6.026
s
e
1.008 1.016 1.004 1.008


43















3- DROITE DE HENRY




















On aurait
1
(0) qui vaudrait - et
1
(1) qui vaudrait +, c'est la raison de la rponse
#NOMBRE!




De faon gnrale, R est trs proche de 1 et on peut donc affirmer que les 1000 donnes
sont issues d'une distribution approximativement normale.











0
50
100
150
200
250
2 3 4 5 6 7 8 9
1
0
0
50
100
150
200
250
2 3 4 5 6 7 8 9
1
0
Simulation 1 2 3 4
R 0,999 0,999 0,998 0,862

y = 1,0625x - 6,1176
R
2
= 0,9974
- 3
- 2
- 1
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9
y = 1,0055x - 5,7431
R
2
= 0,9937
- 3
- 2
- 1
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9

44
y = 0,9821x - 5,6104
R
2
= 0,9984
-3
-2
-1
0
1
2
3
4
0 1 2 3 4 5 6 7 8 9

Pour le graphique ci-dessus (par exemple), on a t = 0,9821 x - 5,6104.
D'o
1

= 0,9821 et est estim 1,02. Puis

= 5,6104 qui permet d'estimer 5,71.


Ces valeurs sont assez proches des valeurs thoriques : = 6 et = 1.

4- TEST DE NORMALITE D'UNE PRODUCTION




On obtient un coefficient de
corrlation R 0,9995 qui
justifie l'ajustement des dures
de vie une distribution
normale.
On a
1

= 0,0035 d'o
estim 285,7 heures.
Puis

= 3,4001 qui conduit


estimer 971,5 heures.







45

Annales du B.T.S. : VARIABLES ALEATOIRES
CONTINUES ET LOI NORMALE

EXERCICES D'ANALYSE A PROPOS D'UNE LOI CONTINUE

1 Conception des produits industriels 1997


Soient le nombre rel strictement positif a et f la fonction, de la variable relle t, dfinie
sur IR par

= <
=
0 ) ( alors 0 si
-
e ) ( alors 0 si
t f t
a t f t
at
.
1a) Montrer que, pour tout t de IR, f (t) 0.

b) Pour tout rel strictement positif, calculer, en fonction de x et de a, l'intgrale

=
x
t t f x F

0
d ) ( ) ( , en dduire
+ x
lim F(x).

c) Calculer l'aide d'une intgration par parties, en fonction de x et de a, l'intgrale

=
x
t t f t x J

0
d ) ( ) ( , en dduire
+ x
im l J(x)

2 Soit Y la variable alatoire qui toute ampoule prleve au hasard dans la production
de B associe la mesure, en heure, de sa dure de vie. On admet que la mesure, en heure, de
la dure de vie moyenne des ampoules de la production B est l'esprance mathmatique de
la variable alatoire Y note E(Y ) et vrifiant E(Y ) =
+ x
lim J(x) .
a) Exprimer E(Y ) en fonction de a.

b) Quelle doit tre la valeur de a pour que la dure de vie moyenne des ampoules de la
production B soit gale 1000 heures. Dans ce cas, pour tout rel positif, exprimer f (t) en
fonction de t.


2 D'aprs Groupement C 1999

1 On appelle f la fonction dfinie sur IR par : f (t) =
9
3
10

e
t

.
a) Dmontrer que f est une fonction dcroissante.
Dterminer sa limite en + et interprter gomtriquement ce rsultat.
b) Dterminer la limite de f en .
c) Tracer soigneusement la courbe reprsentative de f dans un repre orthogonal pour t
variant de 0 1500 (chelle : 1 cm pour 100 units sur l'axe des abscisses et 10 cm pour
une unit sur l'axe des ordonnes).

Epreuves
corriges
de B.T.S.

46
2 a) Rsoudre algbriquement dans IR l'quation f (t) = 0,5 ; donner la valeur exacte de la
solution, puis sa valeur approche arrondie l'unit.
b) En dduire l'ensemble des solutions de l'inquation f (t ) < 0,5.

4 On appelle T la variable alatoire associant toute machine d'un certain type sa dure,
en heures, de fonctionnement sans panne.
On admet que, pour t rel positif ou nul, f (t) reprsente la probabilit que T soit suprieur
t ainsi P(T > t) = f (t).
a) Calculer la probabilit qu'une telle machine fonctionne plus de 1000 heures sans panne.
b) Pourquoi peut-on affirmer qu'il y a plus de neuf chances sur dix qu'une telle machine
fonctionne sans panne plus de 400 heures ?


3 Maintenance Nouvelle Caldonie 1996


1) Calcul d'intgrales
Calculer en fonction du nombre rel positif t , les intgrales suivantes :
a) x t F
t
x
d e
200
1
) (

0
005 , 0

= ;
b) x x t J
t
x
d e
200
1
) (

0
005 , 0

=
c) x x t K
t
x
d e
200
1
) (

0
005 , 0 2

=

( On pourra utiliser des intgrations par parties pour calculer J(t) et K(t) ).

2) Interprtation en probabilits
Soit la fonction f dfinie par :

= =
< =

. 0 pour e
200
1
) (
, 0 pour 0 ) (
005 , 0
x x f
x x f
x

a) Calculer I = ) ( lim t F
t +
o F est dfinie au 1.
On admet que f est la densit de probabilit d'une variable alatoire T .
b) Calculer l'esprance mathmatique E(T) = ) ( lim t J
t +
de la variable alatoire T.
c) Calculer l'esprance mathmatique E(T
2
) = ) ( lim t K
t +
de la variable T
2
.
En dduire la variance V(T) = E(T
2
) [E(T)]
2
et l'cart type de la variable alatoire T.

3) Utilisation
On considre que la variable alatoire T correspond au temps de bon fonctionnement d'un
certain type de matriel.
a) La fonction de fiabilit associe variable alatoire T est dfinie sur [0, +[ par
R(t) = P(T > t). Montrer que R(t) = e

0,005 t
.
b) Calculer 10
3
prs : P(T > 300) , P(T > 100) et P(100 < T 300) .
c) Calculer la valeurs entire approche de t
0
telle que P(T t
0
) = 0,1 .


47
APPROXIMATION D'UNE LOI BINOMIALE PAR UNE LOI NORMALE
CORRECTION DE CONTINUITE

4 Groupement D 2001


Un magicien prtend qu'il peut souvent deviner distance la couleur d'une carte tire au
hasard d'un jeu de cartes bien battu et comportant des cartes de deux couleurs diffrentes
en nombre gal.
On appelle p la probabilit que le magicien donne une rponse juste (succs) lors d'un
tirage.
Si le magicien est un imposteur on a p =
2
1
, sinon p >
2
1
.
On appellera chantillon de taille n toute ralisation de n tirages successifs d'une carte dans
le jeu, avec remise.
On suppose p =
2
1
et on note Y la variable alatoire qui, tout chantillon de taille n,
associe le nombre de succs du magicien.
(On arrondira les probabilits au dix millime le plus proche.)

1. Dans cette question on prend n = 20.
Quelle est la loi suivie par Y ? Donner ses paramtres.
Calculer la probabilit P(Y = 15).

2. Dans cette question on prend n =100. On admet que la variable alatoire Y peut-tre
approche par une variable alatoire Z suivant une loi normale.
Prciser les paramtres de cette loi normale.
Utiliser cette approximation pour calculer P(Y > 60).


5 Groupement B 2000

Les ateliers de peinture d'un grand constructeur automobile fonctionnent l'aide de robots
permettant de positionner les pistolets autour de la carrosserie.
Ces robots sont constitus de trois parties : un bras
articul actionn par des vrins hydrauliques, un
groupe hydraulique et une armoire de contrle

Pannes mcaniques sur le bras articul
Les pannes mcaniques sur le bras articul, assez
frquentes, sont souvent sans gravit. Elles sont
gnralement dues l'encrassage par la peinture,
du jeu ou un blocage dans les articulations
mcaniques.
Les ateliers de peinture comptent 300 robots quips de bras articuls identiques dont les
pannes mcaniques surviennent de faon indpendante. Pour chaque bras articul, la
probabilit, qu'une semaine choisie au hasard, ce type de panne se produise est 0,05.
Une semaine tant choisie au hasard, on ralise, pour chacun des 300 robots, la mme
exprience alatoire consistant observer si son bras connat une dfaillance mcanique.
Armoire de
contrle
Bras
articul
Groupe
hydraulique

48
On dsigne par X la variable alatoire qui, toute semaine, associe le nombre de robots
dont le bras a connu une panne mcanique.

1) Expliquer pourquoi X suit une loi binomiale ; dterminer les paramtres de cette loi.
2) On approche X par la variable alatoire Y de loi normale de moyenne = 15 et d'cart
type = 3,77. Justifier le choix des paramtres et .
Soit E l'vnement "en une semaine, strictement plus de 20 robots ont connu une panne
mcanique sur leur bras articul".
3) Calculer, 10
2
prs, P(Y 20,5) (c'est, en utilisant l'approximation de X par Y, la
valeur de P(E) ).


6 Hygine Propret Environnement 1998 (nonc modifi)

Un contrle de la qualit d'une eau de baignade consiste mesurer le nombre de coliformes
contenus dans 100 ml (cent millilitres) de cette eau.
On dsigne par X la variable alatoire qui, tout prlvement au hasard de 100 ml d'eau
associe le nombre de coliformes, exprims en nombre entier de milliers, contenus dans
cette eau.
On admet que cette variable alatoire discrte X suit approximativement la loi normale de
moyenne = 4,5 et d'cart type = 2,4 .
On dsigne par Z la variable alatoire qui suit cette loi normale N (4,5 ; 2,4)

a) Donner une approximation de la probabilit de l'vnement "X > 4" en calculant
P(Z 4,5).

b) Donner une approximation de la probabilit de l'vnement "X > 8" en calculant
P(Z 8,5).

c) Calculer approximativement la probabilit d'avoir "X > 8" , sachant que l'vnement
"X > 4" est ralis en calculant P(Z 8,5 / Z 4,5).
SOMME DE VARIABLES ALEATOIRES DE LOI NORMALE

7 Industries cralires 1998

On suppose que le dlai entre une commande et sa livraison est de deux semaines.
Soit X
1
(respectivement X
2
) la variable alatoire qui, la premire (respectivement la
deuxime) semaine du dlai. associe la consommation de bl cette semaine l.
On suppose que X
1
et X
2
, sont indpendantes et suivent la loi normale de moyenne 5 et
d'cart type 0,2.
a) Quelle est la loi suivie par la somme Y = X
1
+ X
2
? Prciser ses paramtres.

b) Pour quelle valeur du nombre rel y, la probabilit que Y prenne une valeur infrieure
y est-elle gale 0,99 ?

Remarque : dans cet exercice la loi de Y n'est pas donne.


49

8 Productique bois 1998


Une entreprise commercialise des pieds de lit de type boule.
Ces pieds sont constitus d'une portion de boule en bois dans laquelle est embot un axe
mtallique de diamtre x (pice A) et d'une bague en matire plastique (pice B) de
diamtre intrieur y. La pice A est fabrique par l'entreprise et la pice B par un
fournisseur.

1 A toute pice A tire au hasard dans la production, on associe le diamtre x de son axe
mtallique, mesur en millimtres. On dfinit ainsi une variable alatoire X.
On admet que X suit la loi normale de moyenne 12 et d'cart type 0,03.

A toute pice B tire au hasard dans la production, on associe son diamtre intrieur y
mesur en millimtres. On dfinit ainsi une variable alatoire Y.
On admet que la variable alatoire Y suit la loi normale N (12,1 ; 0,04).

On note Z la variable alatoire Y - X qui, deux pices A et B tires au hasard, associe le
"jeu" y x.
Pour que le montage des pices soit possible, il faut que ce jeu soit au moins gal 0,01
mm. Les pices A et B tant produites dans des usines diffrentes, les variables X et Y sont
indpendantes.

1 La variable alatoire Z suit une loi normale. Quels sont ses paramtres ?

2 Calculer la probabilit de l'vnement le montage est possible .


9 Construction navale 1997

Les chantiers de l'Atlantique utilisent des remorques pour transporter des pices des
ateliers vers l'aire de prmontage des paquebots.
Une remorque ne peut transporter plus de 490 tonnes.

50
Les charges sont constitues de n plaques, prises au hasard, et numrotes de 1 n (n entier
naturel non nul). On note Z
i
la variable alatoire qui, toute pice numrote i, choisie au
hasard, associe la masse, en tonnes, de cette pice.
On suppose que les variables alatoires Z
i
(1 i n) sont indpendantes et qu'elles suivent
la mme loi normale de paramtres m = 0,9 et = 0,05.
On note T
n
= Z
1
+ Z
2
+ ........+ Z
n
la variable alatoire qui tout lot de n pices, associe la
masse totale des n pices et on suppose que T
n
suit une loi normale .

1 On sait que :
L'esprance mathmatique de T
n
est E[T
n
] = E(Z
1
) + E(Z
2
) + ........+ E(Z
n
) .
La variance de T
n
est V[T
n
] = V(Z
1
) + V(Z
2
) + ........+ V(Z
n
) .
Prciser, en fonction de n, les paramtres de la loi normale suivie par T
n
.

2 Quelle est la probabilit d'tre en surcharge si on met 544 pices sur la remorque ?



51

Corrig des exercices d'preuves de B.T.S.

1 Conception des produits industriels 1997

1 a) Pour tout rel t, e
a t
> 0, d'aprs l'nonc
a > 0 donc a e
a t
> 0 et f(t) 0.
b)
x at
x F
0
] [e ) (

= , F(x) =1 e
a x
,
+ x
lim e
a x
= 0,
+ x
lim F(x) = 1.
En posant :

=
=

=
=
at at
v(t)
u'(t
a t v
t t u
-e
1 )

e ) ( '
) (
,


=
x
at x at
x J
0
0
e ] e t [- ) ( dt,
x at
a
x J
at
0
]
e
- e t [- ) (

= ,
J(x) = x e
a x

a a
ax
1
e
1
+

,
+ x
lim e
a x
= 0,
+ x
lim x e
a x
= 0, donc
+ x
lim J(x) =
a
1
.

2 a)E(Y) =
+ x
lim J(x) =
a
1
.
b) E(Y) = 1000 quivaut
a
1
= 1000 et
a = 0,001 ; alors f (t) = 0,001 e
0,001 t
.

2 Groupement C 1999
1 a) f ' (t) =
9
2
10
3t 9
3
10
e
t

, pour tout rel t 0,


9
3
10
e
t

> 0 et
9
2
10
3t
> 0 donc pour tout t 0
f' (t) < 0 et f '(0) = 0,
f est strictement dcroissante sur IR.
9
3
10
lim
t
t

+
= ,
9
3
10
e lim
t
t

+
= 0 puisque
u
e lim
u
= 0 donc ) ( lim t f
t +
= 0.
L'axe des abscisses est asymptote la courbe
reprsentative de f .
b)
9
3
10
lim
t
t


= +,
9
3
10
e lim
t
t


= + puisque
u
e lim
+ u
= + donc ) ( lim t f
t
= +.
c)
Reprsentation graphique.


2 a) Les quations suivantes sont quivalentes
dans IR :
f (t) = 0,5 ,
9
3
10
e
t

= 0,5 , 5 , 0 ln
10
1
3
9
= t ,
2 ln 10
9 3
= t ,
3 3
2 ln 10 = t , t 885.
b) f est strictement dcroissante sur IR,
f (
3 3
2 ln 10 ) = 0,5 donc f (t) < 0,5 quivaut
3 3
2 ln 10 > t , l'ensemble des solutions de
l'inquation est donc l'intervalle ]
3 3
2 ln 10 , +[.

3 a) La probabilit qu'une telle machine fonctionne
plus de 1000 heures est P(T > 1000) = f (1000), or
f(1000) =
9
9
10
10
e

,
P(T > 1000) = e
1
, P(T > 1000) 0,368.
b) La probabilit qu'une telle machine fonctionne
plus de 400 heures est P(T > 400) = f (400).
Il s'agit de vrifier que f (400) > 0,9 or
f (400) =
9
3
10
400
e

, f (400) 0,93 donc on a bien


une probabilit suprieure 0,9.

3 Maintenance Nouvelle Caldonie 1997
1 a) F(t) =

t
x
0
005 , 0
e 005 , 0 dx ,
F(t) = [e
0,005 x

]
t
0
, F(t) = 1 e
0,005 t
.
b) J(t) =

t
x
x
0
005 , 0
e 005 , 0 dx .
On intgre par parties en posant :
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500

52

=
=

=
=
x x
x v
x u
x v
x x u
005 , 0 005 , 0
e ) (
1 ) ( '

e 005 , 0 ) ( '
) (
.
J(t) = [ x e
0,005 x

]
t
0
+ 200 F(t),
J(t) = t e
0,005 t

200 e
0,005 t

+ 200.
c) K(t) =

t
x
x
0
005 , 0 2
e 005 , 0 dx .
On intgre par parties en posant :

=
=

=
=
x
x
x v
x x u
x v
x x u
005 , 0
005 , 0
2
e ) (
2 ) ( '

e 005 , 0 ) ( '
) (
,
K(t) = [ x
2
e
0,005 x
]
t
0
+ 400 J(t),
K(t) = - t
2
e
0,005 t
400 t e
0,005 t
+ 80000 e
0,005 t

+
80000.

2 I =
+ t
lim e
0,005 t
,
+ t
lim e
0,005 t
= 0 , I = 1.
E(T) =
+ t
lim ( t e
0,005 t
2 e
0,005 t
+ 200),
E(T) = 200.
E(T
2
) =
+ t
lim ( t
2
e
0,005 t
400 t e
0,005 t
+ 80000 e

0,005t
+ 80000) K = 80000.
V(T) = E(T
2
) [E(T)]
2
= K 200
2
,
V(T) = 40000, (T) = ) ( V T = 200.
3 a) En fiabilit F est la fonction de dfaillance, R
dfinie sur [0, +[ par R(t) = 1 F(t) est la fonction
de fiabilit.
D'aprs ce qui prcde F(t) = 1 e
0,005 t

donc
R(t) = e
0,005 t
,

la variable alatoire T suit donc une
loi exponentielle de paramtre = 0,005.
b) P(T > 300) = R(300) = e
0,005 300
,
P(T > 300) = e
1,5
,
P(T > 300) = 0,223 10
3
prs.
P(T100) = 1 - e
0,005 100
,

P(T 100) = 1- e
- 0,5
,
P(T 100) = 0,393 10
3
prs.
P(100 < T 300) = F(300) F(100) ,
P(100 < T 300) = 1 0,616 = 0,384 10
3
prs.
c) P(T t
0
) = 0,1 quivaut F(t
0
) = 0,1 et
R(t
0
) = 0,9 et

e
0,005 t
0
= 0,9 d'o :
0,005 t
0
= ln 0,9 , t
0
= 200 ln 0,9 , t
0
21.

4 Groupement D 2001

1 a) On est en prsence d'une succession de 20
preuves indpendantes (tirage avec remise),
chacune ayant deux issues : la rponse est juste
avec la probabilit 0,5 ; la rponse est fausse avec
la probabilit 0,5.
La variable alatoire Y qui, tout tirage de 20
cartes, associe le nombre de rponses exactes suit
donc la loi binomiale B (20 ; 0,5).
P(Y = 15) =
15
20
C (0,5)
15
(0,5)
5
, P(Y = 15) =
15
20
C (0,5)
20
, P(Y = 15) 0,0179.

b) Si l'on approche Y par une variable alatoire de
loi normale, on doit choisir et correspondant
la moyenne et l'cart type de la loi binomiale.
L'esprance mathmatique de Y est E(Y) = n p,
donc = E(Y) = 100 0,5 = 50.
L'cart type de Y est (Y) = q p n ,
donc = (Y) = 5 , 0 5 , 0 100 = 5.
Z suit la loi normale N (50 ; 0,5),
5
50
=
Z
T suit
la loi normale N (0, 1).
On a ainsi :
P(Y > 60) P(Z 60,5) = P |

\
|

5
50 5 , 60
T ,
P(Z 60,5) = |

\
|

5
5 , 10
T P , P(Z 60,5) =
P(T 2,1),
P(Z 60,5) = 1 (2,1), P(Z 60,5) = 1 0,9821
P(Z 60,5) = 0,0179 10
4
prs, P(Y > 60)
0,0179 10
4
prs.

5 Groupement B 2000

1. Chaque semaine, on est en prsence de n
preuves alatoires indpendantes pouvant,
chacune, dboucher sur deux issues possibles : le
bras du robot n i connat une panne (avec la
probabilit p = 0,05) ou pas.
La variable alatoire X qui, chaque semaine,
associe le nombre de robots dont le bras a connu
une panne suit donc la loi binomiale de paramtres
n = 300 et p = 0,05.

2. Si l'on approche X par une variable alatoire de
loi normale, on doit choisir et correspondant
la moyenne et l'cart type de la loi binomiale.
Donc = E(X) = 15
et = (X) = 14 25 , 3,77 10
-2
prs.
3. On pose Z
Y
=
15
3 77 ,
qui suit la loi normale
N (0 ; 1).
On a ainsi : P(Y 20,5) = P Z
|
\

|
20 5 15
3 77
,
,

P(Y 20,5) 1 (1,46)
P(Y 20,5) 1 0,9279
P(Y 20,5) 0,07 10
2
prs.


53
6 Hygine Propret Environnement
1998

La variable alatoire Z suit la loi normale
N (4,5 ; 2,4), la variable alatoire
4 2
5 4
,
, Z
T

=
suit la loi normale N ( 0, 1 ).
a) P(Z 4,5) = P(T > 0 ), P(Z 4,5) = 0,5 alors que
P(X > 4) = P(T >
4 2
5 0
,
,
), P(X > 4) = (
4 2
5 0
,
,
),
P(X > 4) 0,583 soit environ 58 %.
b) P(Z 8,5) = P(T >
4 2
4
,
),
P(Z 8,5) = 1 (1,67),
P(Z 8,5) 0,0475 soit moins de 5 % alors que :
P(X > 8) = P(T >
4 2
5 3
,
,
), P(X > 8) = 1 (
4 2
5 3
,
,
),
P(X > 8) 0,072 soit plus de 7 %.
c) P(Z 8,5 / Z 4,5) =
) , Z (
)) , Z ( , Z ( (
5 4 P
5 4 P et 5 8 P


,
P(Z 8,5 / Z 4,5) =
) , Z (
) , Z ( (
5 4 P
5 8 P

,
P(Z 8,5 / Z 4,5) =
5 0
0475 0
,
,
,
P(Z 8,5 / Z 4,5) = 0,095 10
3
prs, alors que :
P(X > 8 / Z > 4) =
5832 0
072 0
,
,
,
P(X > 8 / Z > 4) = 0,123 10
3
prs.

7 Industries cralires 1998

a) On sait que pour deux variables alatoires
indpendantes X
1
et X
2
, suivant les lois normales
N (m
1
,
1
) et N (m
2
,
2
) alors la variable alatoire
X
1
+ X
2
suit la loi normale de moyenne m = m
1
+m
2

et d'cart type =
2 2
2 1
+
X
1
et X
2
suivent la loi normale N (5 ; 0,2) donc
m = 5 + 5 , m = 10.
=
2 2
2 0 2 0 , , + , (Y) = 0,2 2 .

b) La variable alatoire Y suit la loi normale
N(10 ; 0,2 ) 2 la variable alatoire T =
2 2 0
10
,
Y

suit la loi normale centre, rduite N (0, 1).
P(Y y) = 0,99 quivaut P( T
2 2 0
10
,
y
) = 0,99,
et (
2 2 0
10
,
y
) = 0,99 et
2 2 0
10
,
y
= 2,33
y = 10 + 0,2 2 2,33,
y =10,66 10
2
prs.
C'est pour y 10,66 que l'on a P(Y y) = 0,99.

8 Productique Bois 1998

1 Z est la diffrence de deux variables alatoires
indpendantes.
X suit la loi normale N (12 ; 0,03) et Y suit la loi
normale N (12,1 ; 0,04) alors Z suit la loi normale
N (m, ) avec m = 12,1 12 et
=
2 2
3 0 4 0 , , + .
Z suit la loi normale de moyenne m = 0,1 et d'cart
type = 0025 0, , = 0,05.

2 Z suit la loi normale N (0,1 ; 0,05).
La variable alatoire T =
05 0
1 0
,
, Z
suit la loi
normale centre rduite N (0, 1) .
P(Z 0,01) = P(T
05 0
09 0
,
,
) ,
P(Z 0,01) = P(T 1,8 )
P(Z 0,01) = (1,8) ,
P(Z 0,01) = 0,964 10
3
prs.

9 Construction navale 1997

1 les variables alatoires Z
i
(1 i n) sont
indpendantes et suivent la mme loi normale de
paramtres m = 0,9 et = 0,05.
L'esprance mathmatique de T
n
est
E[T
n
] = E(Z
1
) + E(Z
2
) + ........+ E(Z
n
) ,
E[T
n
] = 0,9 n.
La variance de T
n
est
V[T
n
] = V(Z
1
) + V(Z
2
) + ........+ V(Z
n
),
V[T
n
] = n (0,05)
2
.
(T
n
) = 0,05 n , la variable alatoire T
n
suit la loi
normale N (0,9 n ; 0,05 n ).

2 La variable alatoire note T
544
qui, tout lot de
544 pices associe la masse de ces 544 pices, suit
la loi normale N (0,9 n ; 0,05 n ) avec n = 544.
T
544
suit la loi normale N (489,6 ; 0,05 544 ) , la
variable alatoire U =
544 05 0
6 489
544
,
, T
suit la loi
normale centre, rduite N (0, 1) .
P(T
544
490) = P(U
544 05 , 0
4 , 0
) ,
P(T
544
490) = P(U 0,343) ,
P(T
544
490) = (0,343) ,
P(T
544
490) = 0,004 10
3
prs .

54
Supplment la sance n1
De lintrt de lurne de Bernoulli

Si la notion de vrit statistique devenait familire tous ceux qui
parlent ou crivent au sujet de questions o la vrit statistique est la
seule vrit, bien des sophismes et bien des paradoxes seraient
vits.
Emile Borel Le Hasard Alcan, 3
e
dition, 1914.

1 Lurne bicolore
On considre la situation dite de lurne de Bernoulli
comprenant deux sortes de boules, noires et blanches, et o la
proportion des boules noires est p.
On effectue n tirages au hasard et avec remise dans cette
urne. Le rsultat est nomm chantillon alatoire de taille n.












On note X la variable alatoire correspondant au nombre de boules noires dans un chantillon
alatoire de taille n. Cette variable suit la loi binomiale de paramtres n et p dont lesprance
est E(X) = np et lcart type (X) = ) 1 ( p p n .
De manire pouvoir comparer des tirages de tailles diffrentes, il est prfrable, plutt que
de considrer le nombre de boules noires, den considrer la frquence. On introduit donc la
variable alatoire F = X
n
1
.
Pour cette variable alatoire F, on a comme esprance E(F) =
n
1
E(X) = np
n

1
= p et
comme cart type (F) =
n
1
(X) =
n
1
) 1 ( p p n =
n
p p ) 1 (
.
Linterprtation de ces rsultats est que si lon prlve un grand nombre dchantillons
alatoires de tailles n et que lon considre la distribution des frquences observes, ces
frquences ont pour moyenne p (la frquence dans lurne) et pour cart type
n
p p ) 1 (
.
Cest bien sr cet indicateur de dispersion qui rend compte de la qualit dun chantillon de
taille n pour tmoigner de la frquence p dans lurne. Plus n est grand, plus linformation est
prcise, mais, ce qui est important cest que le gain en qualit dinformation est en
n
1
.
Jacques Bernoulli (1654-1705)

chantillon
de taille n
frquence observe
f

urne
p connu

55
2 Inquitudes Woburn : le cadre binomial
Woburn est une petite ville industrielle du Massachusetts, au Nord-Est des Etats-Unis. Du
milieu la fin des annes 1970, la communaut locale smeut dun grand nombre de
leucmies infantiles survenant dans certains quartiers de la ville. Les familles se lancent alors
dans lexploration des causes et constatent la prsence de dcharges et de friches industrielles
ainsi que lexistence de polluants. Dans un premier temps, les experts gouvernementaux
concluent quil ny a rien dtrange. Mais les familles sobstinent et saisissent leurs propres
experts. Une tude statistique montre quil se passe sans doute quelque chose dtrange .

Le tableau suivant rsume les donnes statistiques concernant les enfants de Woburn de
moins de 15 ans, pour la priode 1969-1979 (Sources : Massachusetts Department of Public
Health et Harvard University).

Enfants entre
0 et 14 ans
Population de
Woburn selon le
recencement de
1970
n
Nombre de cas
de leucmie
infantile observs
Woburn entre
1969 et 1979
Frquence des
leucmies
Woburn
f
Frquence des
leucmies aux
Etats-Unis
p
Garons 5969 9 0,00151 0,00052
Filles 5779 3 0,00052 0,00038
Total 11748 12 0,00102 0,00045

La question statistique qui se pose est de savoir si le hasard seul peut raisonnablement
expliquer les frquences observes Woburn, considres comme rsultant dun chantillon
prlev dans la population amricaine.
La population des Etats-Unis tant trs grande par rapport celle de Woburn, on peut
considrer que lchantillon rsulte dun tirage avec remise et simuler des tirages de taille n
avec le tableur.

Dans le cas des garons, simulons sur le tableur 100 chantillons de taille n = 5969 prlevs
dans une population o p = 0,00052. On reprsente sur un graphique les 100 frquences f des
cas de leucmie observs sur les chantillons simuls. La taille de cette simulation peut
demander quelques secondes de calcul, selon la puissance de lordinateur. Voici laffichage
que nous avons obtenu.


56

Cette simulation montre que plus de 95 % des fluctuations alatoires des valeurs de f
seffectuent dans lintervalle [0 ; 0,001].
Linstruction =NB.SI(B5972:CW5972;">=0,00151") entre en cellule D5974 confirme quici
aucun chantillon simul na montr une frquence de leucmie infantile chez les garons
atteignant le niveau de 0,00151 observ Woburn.
On ne peut donc pas raisonnablement attribuer au seul hasard le niveau trs
significativement lev des leucmies infantiles observes chez les garons Woburn.

Pour ce qui est des filles, nous simulons de manire analogue sur le tableur 100 chantillons
de taille n = 5779 prlevs dans une population o p = 0,00038. Lordinateur affiche les
rsultats suivants :


57

Cette fois, linstruction =NB.SI(B5782:CW5782;">=0,00052") entre en D5784 montre que
25 % des chantillons simuls avec p = 0,00038 font apparatre une frquence f suprieure
ou gale celle observe avec les donnes de Woburn. On peut donc penser que le taux de
leucmies infantiles observ chez les filles Woburn nest pas significativement
lev. Le hasard pourrait lexpliquer. La taille de lchantillon est en tout cas trop faible pour
mettre en vidence ici un phnomne anormal .

Le taux anormalement lev de leucmies infantiles chez les garons Woburn est
officiellement confirm par le Dpartement de Sant Publique du Massachusetts en avril
1980. Les soupons se portent alors sur la qualit de leau de la nappe phratique qui, par des
forages, alimente la ville. On dcouvre alors le syndrome du trichlorthylne. Les industriels
responsables de cette pollution sont traduits en justice, les familles obtiendront des
rparations financires et la dpollution des sites sera engage. Suite cette affaire, le
discours du nouveau maire montre bien le changement dattitude des autorits : notre
premire priorit, dira-t-il, est de nous assurer davoir un approvisionnement en eau propre et
saine .

58
Pour approfondir un peu le traitement probabiliste de cet exemple, on peut songer
approcher la loi binomiale.
Les faibles valeurs de p empchent, dans cet exemple, dutiliser la formule de fluctuation de
plus de 95 % des frquences au programme de seconde : [ p
n
1
, p +
n
1
] (voir
paragraphe suivant).
En revanche, avec les donnes concernant les enfants des deux sexes, on peut appliquer
lapproximation par la loi normale, puisque n 30 et np = 5,3 5. On sait alors quenviron
95 % des frquences obtenues sur les chantillons de taille n = 11748 dans une population o
p = 0,00045 fluctuent lintrieur de lintervalle :
[ p 1,96
n
p p ) 1 (
, p +
n
p p ) 1 (
] cest dire [0,00032 ; 0,00057]. La frquence
f = 0,00102 observe avec les enfants de Woburn est loin dappartenir cet intervalle.

Lorsque p est trop petit, on peut considrer la variable alatoire X correspondant au nombre
dobservations et qui suit la loi binomiale de paramtres n et p. Vu la taille de n, il nest pas
trs pratique dutiliser ici cette loi, que lon peut en revanche approcher par la loi de Poisson
de paramtre n p qui est bien adapte aux cas rares. Dans le cas des garons, on peut ainsi
calculer la probabilit dobserver un nombre de leucmies infantiles suprieur o gal celui
de Woburn en utilisant la loi de Poisson de paramtre n p = 5969 0,00052 3,1. On
obtient P ( X 9 ) 0,0047. Ce que lon peut interprter en disant que lexplication il ne se
passe rien dtrange a moins de 0,5 % de chances dtre exacte.

Qui peut encore, aprs un tel exemple, affirmer que la statistique est la forme la plus
labore du mensonge ?

3 Le cas Aamjiwnaag : mergence de lapproximation
normale
Pour prciser le comportement de la variable alatoire dchantillonnage F, on peut, dans
certains cas, recourir la loi normale. En effet, pour n assez grand (dans la pratique, on
prend n 30, np 5 et n(1 p) 5), la loi binomiale donne des rsultats proches de ceux
dune loi normale. On peut donc considrer que la variable alatoire F suit
approximativement une loi normale de moyenne p et dcart type
n
p p ) 1 (
.
On sait que la loi normale a comme proprit quenviron 95 % des observations se situent
dans un intervalle de rayon deux carts types autour de la moyenne. On pourra donc vrifier
quenviron 95 % des chantillons alatoires de taille n fournissent une frquence comprise
dans lintervalle [ p 2
n
p p ) 1 (
, p + 2
n
p p ) 1 (
]. Ce rsultat est trs important
car il mesure la variabilit naturelle des phnomnes alatoires.
On peut donner une version simplifie de cet intervalle, en le majorant.
La fonction p a p(1 p) atteint son maximum pour p =
2
1
donc, pour tout p, on a :
p(1 p) )
2
1
1 (
2
1
cest--dire p(1 p)
4
1
.
On en dduit que 2
n
p p ) 1 (
2
n 4
1
cest--dire 2
n
p p ) 1 (

n
1
.

59
Ainsi, lintervalle [ p 2
n
p p ) 1 (
, p + 2
n
p p ) 1 (
] est inclus dans lintervalle
[ p
n
1
, p +
n
1
].
Les lves de seconde peuvent exprimenter quenviron plus de 95 % des chantillons de
taille n fournissent une frquence comprise dans lintervalle [ p
n
1
, p +
n
1
].
Aamjiwnaag
Sources : Science et Vie fvrier 2006 Environnemental Health Perspectives octobre 2005
(article en ligne).
Les donnes proviennent dune tude effectue au Canada et montrant une diffrence (trs)
significative du sex-ratio la naissance (dficit de garons) sur une population expose une
pollution chimique. Dans ce cas particulier, linquitude provient du fait que bien que ces
industries canadiennes respectent les normes, une exposition prolonge de faibles doses de
polluants puisse avoir un impact sanitaire mesurable.
Le sex-ratio est le rapport du nombre de garons celui des filles la naissance. Il est
habituellement de 105 garons pour 100 filles.
Dans la rserve indienne dAamjiwnaag, situe au Canada, il est n entre 1999 et 2003,
n =132 enfants dont 46 garons.
Question statistique : la frquence des garons observe Aamjiwnaag pour la priode 1999-
2003 prsente-t-elle une diffrence significative au niveau 0,95 avec p = 0,512 ?
Etude des fluctuation des chantillons de taille n = 132

Limage ci-dessus correspond 100 simulations dun chantillon de taille 132 extraits au
hasard avec remise dune urne o la proportion du caractre considr est p = 0,512.
Lhistogramme correspond lobservation des 100 frquences dchantillons. Il sagit de la
rpartition de 100 valeurs observes de la variable alatoire F. Cette rpartition empirique est

60
comparer avec le modle de loi normale de moyenne p = 0,512 et dcart type
132
) 512 , 0 1 ( 512 , 0
0,044 donn par le thorme limite central.
La frquence observe Aamjiwnaag est f =
132
46
0,348.
Cette observation est trs loigne de la bande (apparaissant sur le graphique) des fluctuations
dans 95 % des cas sous lhypothse p = 0,512.
La diffrence observe est significative au seuil de 5 %.
Sous lhypothse que F suit la loi normale de moyenne p = 0,512 et dcart type 0,044 on a :
P(F 0,410) 0,99. La valeur observe Aamjiwnaag est donc infrieure ce que lon
observe dans 99 % des cas sur des chantillons de taille 132 lorsque p = 0,512.

Ltude statistique ntablit pas de causalit entre la pollution chimique et le dfaut
observ du sex-ratio. A la question Que peut-on tirer comme conclusion ? , on peut
seulement ici rpondre que cette tude pose question . La statistique donne lalerte, ce qui
est dj beaucoup. Le fait que la rserve soit situe au cur dindustries chimiques devient un
lment troublant sur lequel on doit enquter.
De faon gnrale, cest la notion de preuve statistique qui est ici en jeu. Il ne sagit pas
dune preuve au sens habituel mais dun lment probant, dune prsomption. Plutt que
de parler de preuve statistique , les anglo-saxons disent plus justement piece of evidence.
Dautres explications possibles du dsquilibre du sex-ratio pourraient tre lies au mode de
vie de ces indiens ou leur patrimoine gntique. Une tude statistique comparative a t
mene sur des indiens de la mme tribu vivant dans un autre environnement et a (d)montr
que ce ntait (sans doute) pas le cas. En revanche linfluence de certains produits chimiques
sur le sex-ratio a t tablie statistiquement par dautres tudes.
Une recherche sur Internet permettra davoir dautres lments sur ce dossier (qui a fait
polmique au Canada).
Influence de la taille de lchantillon : convergence quand n augmente
On peut exprimenter, en fonction de la taille n des prlvements, la convergence (presque
sre !) en uvre dans la loi des grands nombres.
On entre en B2 la formule
=ENT(ALEA()+0,512)
que lon recopie vers le bas jusqu la ligne 501.

Le cumul des rsultats est obtenu en colonne C en entrant en C2 la formule : =B2
puis en C3 la formule =C2+B3 que lon recopie vers le bas jusqu la ligne 501.
Les frquences sont obtenues en colonne D, en entrant en D2 la formule : =C2/A2
que lon recopie vers le bas.
Pour le rang n, les bornes de lintervalle de fluctuation de 99 % des frquences sont calcules
en colonne E et F.
En E2 on entre la formule
=0,512-2,58*RACINE(0,512*(1-0,512)/A2)
que lon recopie vers le bas.
En E2 on entre la formule
=0,512+2,58*RACINE(0,512*(1-0,512)/A2)
que lon recopie vers le bas.

61


Dautres simulations sont obtenues en faisant F9.

62
Sance 2 :
ECHANTILLONNAGE
ET ESTIMATION



"Mieux vaut prvoir sans certitude que de ne pas
prvoir du tout."
Henri Poincar "Science et hypothse".


"Il est toujours dangereux d'appliquer des formules
dont on n'a bien saisi ni le sens profond ni l'esprit."
Lucien March,
"Les principes de la mthode statistique" 1930.


A ECHANTILLONNAGE

"L'esprit statistique nat lorsque l'on prend conscience des fluctuations d'chantillonnage."
Programme de seconde 2000.

C'est la connaissance de la variabilit naturelle d'un phnomne, due au seul hasard, qui
permet la mthode statistique. Cette connaissance de la variabilit "normale" conduit, dans le
cadre de l'estimation, dfinir la "confiance" accorder aux estimations, et, dans le cadre des
tests, calculer des limites au del desquelles les variations seront considres comme
suffisamment "significatives" pour ne pas tre dues au seul hasard.
C'est donc en se fondant sur l'tude des fluctuations d'chantillonnage, que nous pourrons
conduire nos prises de dcision statistiques.
Nous commencerons par la situation des frquences, plus simple parce que ne mettant en jeu
qu'un seul paramtre, bien que ce cas puisse tre vu comme cas particulier de la moyenne.

63
I FLUCTUATIONS DECHANTILLONNAGE DUNE
FREQUENCE
1 Le problme de lchantillonnage
Une urne (connue) contient des boules blanches et des
boules noires en proportion p.
On souhaite tudier comment fluctuent les frquences f
de boules noires, observes sur des chantillons
(sondages) de taille n.
Dans la pratique, se pose le problme inverse (infrer
partir dun chantillon, par exemple pour un contrle de
qualit), mais ltude de lchantillonnage est ncessaire
dun point de vue thorique. Cest sur cette thorie que
sera construite lestimation.
2 Exprimentation et thorie des fluctuations d'chantillonnage
d'une frquence
Les activits de se paragraphes peuvent se pratiquer avant le
cours sur l'chantillonnage. Seule la connaissance de la loi
binomiale et de son approximation par la loi normale sont
ncessaires.
a Une exprimentation "physique" dans le cadre d'un
chantillonnage sans remise


On peut fabriquer un
appareil, semblable
l'appareil ci-contre,
contenant 200 billes
dont 10 billes noires.


La "population" est donc connue, avec p = 0,05.
En secouant, on vient remplir les n = 32 alvoles qui
matrialisent un chantillon. On observe alors une frquence f
de billes noires parmi les 32 billes.
Sur limage ci-dessus, par exemple, f =
32
3
0,09.
Il sagit bien sr dun chantillonnage exhaustif (sans remise).

Soit X la variable alatoire qui, tout chantillon de taille n = 32
prlev sans remise parmi les N = 200 billes, associe le nombre
de billes noires, contenues dans lchantillon.
La variable alatoire X suit la loi hypergomtrique
H(N , n , p), avec P (X = k) =
n
N
k n
Np N
k
Np
C
C C

.
Population (connue)
Proportion p de
boules noires
Echantillon
de taille n
Frquence f
observe ?
NORME
AFNOR
5.4 PLAN
DECHANTILLONNAGE
Plan selon lequel on
prlve un ou
plusieurs
chantillons en vue
dune information
recueillir et
ventuellement
dune dcision
prendre.
5.5
ECHANTILLONNA
GE AU HASARD
Prlvement de n
individus dans une
population de N
individus de telle
manire que toutes
les combinaisons
possibles de n
individus aient la
mme probabilit
dtre prleves.
5.6
ECHANTILLONNA
GE EXHAUSTIF
(sans remise)

64
La loi hypergomtrique n'est pas au programme des sections de B.T.S., cependant
l'exprimentation physique en classe laisse aux tudiants des images mentales trs fortes
concernant la distribution d'chantillonnage.
On pourra comparer le nombre moyen de billes noires dans un chantillon avec lesprance
E( X ) = np = 1,6 et lcart type avec ( X ) = ) 1 (
1
p np
N
n N

1,13 (lcart type avec


la loi binomiale serait denviron 1,23).
La variable alatoire F =
32
1
X qui, tout chantillon associe la frquence observe des
boules noires, a pour esprance E( F ) =
32
) ( X E
= 0,05 et pour cart type
32
) ( X
0,035.
b Simulation avec la touche random (ou ALEA) dans le cadre d'un
chantillonnage avec remise
Avec une calculatrice
En mode "normal" de calcul, taper l'instruction :
Int (Ran# + 0.05) ou int (rand + 0.05) ou int(rand() + 0.05) , selon les modles, puis faire
plusieurs fois EXE ou ENTER.

Sur T.I. : int sobtient par (MATH puis NUM) et rand par MATH puis PRB.
Sur CASIO : Int sobtient par (OPTN puis NUM) et Ran# par OPTN puis PRB.

Le rsultat affich est 1 ( = boule noire) avec une frquence de 0,05 ou 0 ( = boule
blanche) avec une frquence de 0,95.
Le programme suivant simule le calcul de f sur un chantillon de taille n = 32, prlev
avec remise.

Commentaires
CASIO (anciens
modles de la fx
7000G la CFX
9900GC)
CASIO 6910G -
9930 - 9940 - 9960
9990 et Graph xx
T.I. 81 T.I. 80 -82 - 83 -
85
T.I. 89 - 92
S compteur des
boules noires.
I compteur des 32
tirages

1 = boule noire ; 0 =
boule blanche.


Affichage de la
frquence f de
l'chantillon.
0 S
1 I
Lbl 1
Int ( Ran# +
0.05) + S S
I + 1 I
I 32 Goto 1

S 32
0 S
For 1 I To 32

Int ( Ran# +
0.05) + S S
Next
S 32
:0 S
:1 I
:Lbl 1
:int (rand + 0.05)
+ S S
:I + 1 I
:If I 32
:Goto 1
:Disp S 32
:0 S
:For (I,1,32)
:int (rand + 0.05)
+ S S
:End
:Disp S 32
:0 s
:For i,1,32
:int (rand() +
0.05) + s s
:End
:Disp s 32

Avec Excel
C'est extrmement simple, puisqu'il n'y a pas de programmation faire.
Dans la cellule A1, on entre la formule : =ENT(ALEA()+0,05)
que lon recopie jusqu la cellule A32, pour simuler un chantillon de taille 32, prlev
avec remise.
En A33, on peut calculer la frquence de lchantillon en faisant =SOMME(A1:A32)/32 .
Il suffit alors de recopier la premire colonne vers la droite pour simuler dautres
chantillons.


65
Introduction dune variable alatoire
On supposera dornavant que l'chantillonnage se fait avec remise (exhaustif) pour rester
dans le cadre des programmes. La norme AFNOR, indique ci-aprs prcise que l'on peut
raisonnablement faire cette hypothse si la proportion entre la taille n de l'chantillon et
celle de la population est infrieure 10 % (ce n'tait pas le cas de la machine billes).

La variable alatoire X qui, tout chantillon de taille n prlev
au hasard avec remise, associe le nombre de boules noires
observ, suit la loi binomiale B (n , p).
On appelle distribution dchantillonnage de la frquence des
boules noires dans les chantillons de taille n, la loi de
probabilit de la variable alatoire F =
n
1
X .
On a E ( F ) =
n
1
E ( X ) = p ,
et ( F ) =
n
1
( X ) =
n
p p ) 1 (
.
On peut, avec les lves, exprimenter la distribution
d'chantillonnage avec les calculatrices, dans l'exemple
prcdent (en parallle avec l'instrument bille), en restant dans
le cadre de la loi binomiale (on est d'ailleurs dans un cas o
l'approximation normale n'est pas valable puisque
np = 320,05 = 1,6 est infrieur 5).
On inscrit au tableau les frquences f qu'ils ont obtenues sur
leurs chantillons simuls.
On comparera la moyenne des frquences des billes noires sur au
moins une vingtaine d'chantillons avec lesprance de F
E( F ) =
32
05 , 0 32
32
) (
=
X E
= 0,05 et l'cart type entre les
diffrents chantillons avec l'cart type de F
32
95 , 0 05 , 0 32
32
) (
) (

= =
X
F

0,038.
Remarque (non destine aux lves) :
Pour que l'exprience fonctionne peu prs bien (il y a toujours un peu de suspense, mais
a rend la statistique vivante), un minimum de 20 chantillons est ncessaire. Examinons
cela sur le cas des moyennes de 20 frquences, que l'on espre trs proche de p = 0,05.
Soit la variable alatoire

=
=
20
1
20
1
i
i
F F o F
i
est la variable alatoire correspondant la
frquence obtenue sur le i
me
chantillon. On suppose les variables alatoires F
i

indpendantes (il ne faut pas faire cette exprience avec un lot de calculatrices neuves de
mme type o le random sera peu prs analogue !).
On a donc

= =
20
) (
20
1
) (
2
2

i
F Var F Var d'o 008 , 0
20
038 , 0
20
) ( =

F .
Un cart type de 0,008 sur une valeur mettre en vidence qui est 0,05 c'est encore
beaucoup.

On peut dire ensuite que pour simplifier les calculs (manipulation des coefficients du
binme...encore que les calculatrices soient trs performantes) lorsque n est grand (ou que
NORME
AFNOR
NORME
STATISTIQUE 5.6
(suite)
Lorsque chaque
individu prlev est
remis dans la
population avant
prlvement de
lindividu suivant,
lchantillonnage est
dit NON
EXHAUSTIF (avec
remise).
NOTE : Dans un
chantillonnage
exhaustif et au
hasard,
lindpendance des
individus tirs peut
tre considre
comme pratiquement

66
l'on cherche le dterminer car alors on a besoin d'une expression pratiquable ce qui n'est
pas le cas de la formule du binme), on utilisera l'approximation normale de la loi
binomiale :

D'aprs le thorme limite central (cas du thorme de Moivre Laplace), pour n assez
grand (et p et 1 p pas trop petits : on donne parfois np et n(1 p) suprieurs 5),
la variable alatoire X suit approximativement la loi normale N ( ) ) 1 ( , p np np et donc
F suit approximativement la loi normale N
|
|

\
|

n
p p
p
) 1 (
, .

Ceci sera mis en pratique dans l'exemple suivant.
3 Un exemple utile au citoyen
Voici un exemple dj historique : le 10 mai 1981, Franois Mitterrand a t lu avec
51,75 % des voix, alors que Valery Giscard d'Estaing n'a recueilli que 48,25 % des
suffrages (avec l'lection prsidentielle de 2002 a marche moins bien).
On effectue un sondage sur 1000 lecteurs, le jour de l'lection.
1) Soit F la variable alatoire qui, tout chantillon alatoire non exhaustif de taille 1000,
associe la frquence des lecteurs de Giscard sur l'chantillon. On peut supposer que F
suit une loi normale, en dterminer les paramtres.
On a 0158 , 0
1000
5175 , 0 4825 , 0

.
La variable alatoire F suit donc (approximativement) la loi normale
N (0,4825 ; 0,0158).
Ce qui veut dire qu'entre deux sondages alatoires de taille 1000, l'cart type est de
1,6 % ce qui, dans la situation prsente, est norme.
2) Quelle est la probabilit que ce sondage se trompe en donnant plus de 50 % de votants
pour Giscard (on calculera P ( F > 0,5) ).
On pose
0158 , 0
4825 , 0
=
F
T qui suit la loi N (0, 1).
On a ) 1076 , 1 ( 1 ) 1076 , 1 ( ) 5 , 0 ( = > = > T P F P o est la fonction de rpartition
de la loi normale centre rduite.
On trouve P ( F > 0,5) 0,1340.
On peut remarquer que la calculatrice TI83 ne peut ici faire le calcul avec la loi
binomiale B (1000 ; 0,4825).
3) Quelle devrait-tre la taille n du sondage, pour que cette probabilit soit infrieure
0,01 ?
On pose
n
F
T
5175 , 0 4825 , 0
4825 , 0

= qui suit la loi N (0, 1).


On a )
5175 , 0 4825 , 0
0175 , 0
( 1 )
5175 , 0 4825 , 0
0175 , 0
( ) 5 , 0 (

> = >
n
n
T P F P .
On recherche t tel que 01 , 0 ) ( = > t T P 99 , 0 ) ( = t .
La lecture inverse de la table donne t 2,33 (l'instruction invNorm(0.99) de la
calculatrice donne 2,3263). D'o 5175 , 0 4825 , 0
0175 , 0
327 , 2
2

|

\
|
> n .

67
Soit n 4415.
Pour ce type de calcul, l'approximation normale est ncessaire, sauf utiliser un
tableur.
4 Exprimentation sur Excel de la normalit de la distribution
d'chantillonnage

On considre une urne qui contient 40% de
boules noires (p = 0,40 ) et 60% de boules
blanches.
On prlve dans cette urne, au hasard et avec
remise, des chantillons de taille n .
Pour chaque chantillon i, on calcule la
frquence f
i


des boules noires.
On dsire tudier comment se rpartissent les
frquences f
i
des diffrents chantillons.
Influence de la taille n de l'chantillon, sur les fluctuations d'chantillonnage
On peut comparer la moyenne et surtout l'cart type d'chantillonnage, observs sur 50
chantillons, avec E ( F ) = p = 0,4 et ( F ) =
n
p p ) 1 (
, qui vaut environ 0,049
lorsque n = 100 et 0,015 lorsque n = 1000.
On observera donc qu'en multipliant par 10 la taille n de l'chantillon, on divise par
10 3 l'cart type de la distribution d'chantillonnage.
Sur les graphiques ci-dessous, on a regroup, la mme chelle, les frquences observes
f
i
en classes d'amplitude 0,025.







50 chantillons de taille n = 100





50 chantillons de taille n = 1000


Etude de la normalit de la distribution d'chantillonnage
On a regroup ci-aprs les frquences f
i
observes sur 100 chantillons de taille
n = 1000, en 11 classes. Puis on a trac la droite de Henry correspondante.
Le coefficient de corrlation linaire est un tmoin de la normalit de la distribution
d'chantillonnage.

Urne :
p = 0,40
Echantillon n i
taille n
frquence f
i

68











II - FLUCTUATIONS DECHANTILLONNAGE DUNE
MOYENNE
1 Distribution d'chantillonnage d'une moyenne

On considre une population de moyenne et d'cart
type .

On note X
i
la variable alatoire associant, tout
chantillon de taille n prlev au hasard avec remise, la
valeur obtenue au i
me
tirage, pour 1 i n.

On dsigne par X la variable alatoire X =

=
=
n i
i
i
X
n
1
1

qui, tout chantillon, associe la moyenne observe.
Les variables alatoires X
i
sont indpendantes et de mme loi (tirages avec remise).

D'aprs le thorme limite central, pour n assez grand,
X suit approximativement la loi normale N |

\
|
n

, .

Remarques :
Dans la pratique, pour l'utilisation de ce thorme limite, on demande gnralement
n 30.
Si la population est normale, c'est dire si les X
i
suivent la loi normale N ( , ), alors X
suit (exactement) la loi normale N |

\
|
n

, , mme si n est petit.


Si n est petit (n < 30) et que la population n'est pas normale, l'approximation de Student
est prfrable (voir plus loin).
2 Exemple d'application aux cartes de contrle
Un exemple intressant d'utilisation des fluctuations d'chantillonnage est celui de
l'tablissement de "cartes de contrle" dans le cadre du contrle de qualit.
Voir l'exercice de B.T.S. corrig "Construction navale 1998".
Voir le T.P. en annexe sur "La matrise statistique des procds de production."
Population (connue)
Moyenne
Ecart type
Echantillon
de taille n
Moyenne x ?
Ecart type s
n
?

69

B ESTIMATION

"Rien de plus ais que d'inventer des mthodes
d'estimation. [Reste ] distinguer les mthodes
satisfaisantes de celles qui ne le sont pas."
R.A. Fisher,
"Les mthodes statistiques adaptes la
recherche scientifique" Traduction 1947.




La statistique connut, au dbut du XX
e
sicle, une vritable rvolution, celle de l'infrence.
Il s'agit, partir de rsultats statistiques limits, observs sur un chantillon, d'infrer
toute une population pour laquelle on induira des estimations, partir des observations.
Cette dmarche trouve sa motivation dans des domaines appliqus spcifiques (laboratoires
agronomiques, industriels...), essentiellement en Grande Bretagne et aux Etats-Unis, mais
les outils ainsi crs trouveront, de part leur efficacit, des applications quasi universelles.
Depuis le XVIII
e
sicle, deux approches des probabilits coexistent : le point de vue
subjectif (reprsent par Bayes et Laplace), o l'on considre la probabilit en termes de
"raisons de croire", d'estimation du degr de confiance dans la ralisation d'un vnement
alatoire et le point de vue frquentiste, s'appuyant sur la loi des grands nombres de
Bernoulli et les thormes limites (Laplace), o l'on conoit la probabilit comme
stabilisation limite de la frquence lors de la rptition, un grand nombre de fois, de
l'vnement. Au XIX
e
sicle, Qutelet et ses successeurs ne retiendront de la synthse de
Laplace que l'aspect frquentiste, laissant en sommeil les techniques d'estimations
amorces au XVIII
e
.
Les formulations probabilistes de l'estimation rapparaissent, dans la mouvance de l'cole
de Karl Pearson, avec Ronald Aylmer Fischer (1890 1962) et William Sealy Gosset
alias Student (1876 1937), tous deux confronts un nombre insuffisant de donnes,
rendant plus difficile la perspective frquentiste. Fischer, travaillant l'tude des engrais
dans un centre agronomique, ne peut recourir qu' un nombre limit d'essais contrls,
Gosset, la brasserie Guinness de Dublin, ne dispose, pour ses tudes de qualit, que
d'chantillons de petite taille, en raison de la grande variabilit de la production qui n'en
permet pas l'homognit. Fischer et Gosset sont alors amens utiliser des notations
diffrentes pour la valeur thorique du paramtre d'une distribution de probabilit, et
pour l'estimation

de ce paramtre, aux vues des observations.


Cette innovation dans les notations rend possible le
dveloppement de la statistique infrentielle dans deux
directions, celle de l'estimation (domine par un esprit subjectif)
et celle de la thorie des tests d'hypothses (s'inscrivant
davantage dans la tradition frquentiste) que l'on abordera la
3
me
sance.
Ronald Fischer est gnralement prsent comme le pre de la
thorie de l'estimation selon le principe du "maximum de
vraisemblance" (introduit en 1912 et dvelopp jusqu'en 1922-
1925). Il prsente cette notion de vraisemblance comme
descendante de celle de "probabilit inverse" de Laplace.
R.A. Fisher

70
Fisher est, selon Droesbeke et Tassi
4
, "l'homme qui a fait de la statistique une science
moderne". Son ouvrage "Statistical Methods for Research Workers", publi en 1925 sera le
"best-seller" de la statistique, avec 14 ditions et des traductions en 6 langues.
Jerzy Neyman (1894 1981), est quant lui l'origine de la thorie de l'estimation par
intervalle de confiance. Mathmaticien d'origine russo-polonaise, Neyman fait un sjour
d'tude en 1924 l'University College qui le met en contact avec Fischer, Gosset, Karl et
Egon Pearson (avec lequel il correspondra beaucoup). En 1925, il assiste Paris aux cours
de Lebesgue, Hadamard et Borel. De retour en Pologne, il assure la direction du
dpartement statistique d'un institut de biologie. En 1934, il est en poste l'University
College aux cts d'Egon Pearson mais en 1938, l'approche de la guerre, il part pour
Berkeley, aux Etats-Unis.
Jerzy Neyman, par sa thorie de l'estimation par intervalle de confiance, est l'origine des
techniques modernes de sondage. Si les premiers essais d'application des probabilits aux
sondages alatoires datent de la fin XVIII
e
sicle, la notion de probabilit tant dans les
esprits lie l'incertitude, au dfaut de connaissance, les enqutes les plus exhaustives
possibles seront privilgies au cours du XIX
e
sicle. De 1895 jusque dans les annes
1930, le dbat sur la reprsentativit des chantillons agite les congrs de l'Institut
International de la Statistique. Dans un premier temps, jusque vers 1925, on se demande si
l'on peut raisonnablement procder par chantillonnage, ou s'il faut privilgier
systmatiquement les recensements. Puis partir de 1925, avec le dveloppement de
l'utilisation des sondages, en particulier aux Etats-Unis avec les enqutes d'opinion, la
discussion porte sur la faon de procder l'chantillonnage, entre les tenants du "choix
raisonn" et ceux de l'alatoire.
Le premier, Neyman prend nettement parti pour la mthode alatoire. Le hasard seul
permettant d'appliquer la thorie des probabilits et d'encadrer le risque, alors que la raison
humaine est vecteur d'introduction de biais. En 1934, Neyman montre que les hypothses
garantissant la convergence des estimateurs obtenus par "choix raisonn" ne peuvent tre
obtenues dans la pratique. De 1934 1937, il expose la thorie de l'estimation par
intervalles de confiance.
Une date dcisive pour l'affirmation de la mthode par chantillon alatoire reprsentatif
est celle du 3 novembre 1936, o F. D. Roosevelt remporte l'lection prsidentielle :
Le Literary Digest avait prdit la victoire du rpublicain Alf Landon partir d'un "vote de
paille" effectu sur plus de deux millions de personnes, alors que George Gallup avait
annonc celle de Roosevelt selon un chantillon reprsentatif rduit.
Il faut dire que le sondage du Literary Digest avait t effectu partir de listes du type
annuaire du tlphone (en 1936 !), membres de clubs... ce qui introduisait un biais certain.
Alf Landon, dont on a aujourd'hui oubli le nom, a pu ainsi se croire prsident quelques
heures, alors qu'il ne reu que 40% des suffrages.
Au del de l'chantillonnage alatoire simple, Neyman, en tudiant l'chantillonnage
stratifi tablit le lien entre l'alatoire et ce que l'on sait dj par ailleurs (par exemple par
un recensement donnant la rpartition par critres socioprofessionnels, types de familles,
ges...), par tirage au hasard l'intrieur de strates tablies a priori dans la population.


4
"Histoire de la Statistique" "Que sais-je ?" P.U.F. 1997.

71
I ESTIMATION D'UNE FREQUENCE
1 Le problme de l'estimation
C'est le problme inverse de celui de l'chantillonnage,
et celui qui se pose dans la pratique des sondages ou
des contrles de qualit : partir de la frquence f
observe sur un chantillon, estimer la frquence p
correspondante, dans la population.
Sauf prendre comme chantillon la population toute
entire (c'est un recensement et non un sondage) cette
estimation est alatoire (elle se fait l'aide d'une
variable alatoire nomme "estimateur", notion qui
n'est pas au programme de B.T.S.) et dpend du hasard
qui a amen l'chantillon. Il n'y aura aucune certitude. C'est le type mme du raisonnement
inductif, qui n'a pas, on le verra, le caractre de la rigueur habituelle en mathmatiques.
Mais c'est a ou rien.
On procde par sondages pour des raisons conomiques. Il se
peut, en particulier, qu'un contrle de qualit ncessite la
destruction des pices testes (mesures de rsistance aux
chocs...).

On peut matrialiser la
situation en apposant un
cache sur l'appareil
billes.
La proportion p de billes
noires dans l'appareil est
inconnue. On cherche
l'estimer partir de la
proportion f observe dans la lucarne correspondant un
chantillon.

Cependant, dans la suite, on supposera que les chantillons sont
prlevs avec remise.

2 Estimation ponctuelle
On prend comme estimation ponctuelle de p , la frquence f
observe sur l'chantillon.
Cette estimation a le dfaut de dpendre fortement de l'chantillon (et donc du hasard qui
l'a amen). Elle ne contient aucune indication de qualit de l'estimation, en particulier de la
taille n de l'chantillon utilis. On comprend que plus n est grand, meilleure est
l'information, mais de quelle faon ? Pour cela, on va utiliser nos connaissances en matire
d'chantillonnage, pour donner une "fourchette".
L'estimation est alors considre comme le rsultat d'une variable alatoire nomme
estimateur. Lorsque l'on connat la loi de l'estimateur, on peut construire des intervalles de
confiance.
La notion d'estimateur n'est pas au programme des sections de techniciens suprieurs.
Population (inconnue)
Proportion p ? de
boules noires
Echantillon
(connu)
de taille n
Frquence f
NORME
AFNOR
5.12 ESTIMATION
a) Opration ayant
pour but, partir
des observations
obtenues sur un ou
plusieurs
chantillons,
d'attribuer des
valeurs numriques
aux paramtres de la
population dont
ceou ces
chantillons sont
issus, ou de la loi de
probabilit
considre comme
reprsentant cette
population.
b) Rsultat de cette
opration.

72


Estimation :
Nombre ou
intervalle
f est une
estimation de p

Estimateur : Variable alatoire
F est un
estimateur sans
biais de p car
E (F ) = p

Le programme officiel indique cependant :

"Une illustration qualitative succincte des notions de biais et de convergence d'un
estimateur peut tre propose, mais toute tude mathmatique de ces qualits est hors
programme."

Nous procderons ainsi pour la question dlicate (quant sa prsentation aux lves) de
l'estimation de l'cart type, raison supplmentaire pour commencer avec les frquences
plutt qu'avec le couple moyenne et cart type.

3 Intervalle de confiance d'une frquence
a) CAS DES GRANDS ECHANTILLONS (n 30 ; np 5 ; n(1 p) 5)
On considre une urne o la proportion de boules noires est p (inconnu).
Introduisons la variable alatoire d'chantillonnage F qui, tout chantillon de taille n
prlev au hasard avec remise, associe la frquence f des boules noires contenues dans
l'chantillon.
On sait que nF suit la loi binomiale B (n , p) laquelle est proche (thorme de Moivre-
Laplace), sous les conditions prcises ci-dessus, de la loi normale N ( ) ) 1 ( , p np np .
On considrera donc que F suit approximativement la loi N
|
|

\
|

n
p p
p
) 1 (
, .
On peut, par exemple, dterminer le rel positif h tel que P (p h F p + h) = 0,95.
On trouve h = 1,96
n
p p ) 1 (
.
La thorie de l'chantillonnage fournit ainsi, pour chaque valeur de p fixe, un intervalle
de probabilit
(

n
p p
p
n
p p
p
) 1 (
96 , 1 ,
) 1 (
96 , 1 o la variable alatoire F prend
ses valeurs avec une probabilit de 0,95.

Supposons que n = 100 (la taille de l'chantillon est connue) et reprsentons, en fonction de
p, les courbes d'quation :
y = ) 1 ( 196 , 0 p p p et y = ) 1 ( 196 , 0 p p p + .
On obtient le graphique suivant.

73

0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1


Le graphique se lit ainsi : supposons, on n'en sait rien, que l'urne contienne 40 % de boules
noires, soit p = 0,4. L'intervalle de probabilit fourni par la thorie de l'chantillonnage est
[0,304 , 0,496]. C'est dire, qu'avant de prlever un chantillon, on a, sous cette
hypothse, 95 % de chances d'obtenir sur l'chantillon une frquence f comprise dans cet
intervalle.
L'estimation consiste en un renversement de point de vue : supposons que l'on observe une
frquence f = 0,6 de boules noires sur un chantillon (en ordonnes sur le graphique), on
prendra comme intervalle de confiance 95 % de p, l'intervalle obtenu, sur l'axe des
abscisses, partir des courbes prcdentes, soit, environ (par lecture graphique) :
[0,5 ; 0,7].


















Si l'on recherche l'expression algbrique des bornes de cet intervalle de confiance, il faut
rechercher p tel que : ) 1 ( 196 , 0 6 , 0 p p p = .
Valeur de p
I
n
t
e
r
v
a
l
l
e

d
e

p
r
o
b
a
b
i
l
i
t

c
h
a
n
t
i
l
l
o
n
n
a
g
e
)

0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
F
r

q
u
e
n
c
e

o
b
s
e
r
v

e


f


Intervalle de confiance pour p (estimation)

74
D'o l'quation du second degr : ( ) ) 1 ( 196 , 0 6 , 0
2 2
p p p = ,
c'est dire, 0 6 , 0 ) 2 , 1 196 , 0 ( ) 196 , 0 1 (
2 2 2 2
= + + + p p ,
dont les solutions sont, 10
- 3
prs, 0,502 et 0,691.
On remarque que l'intervalle de confiance n'est pas, a priori, exactement centr sur la
valeur f = 0,6.
On constate que les solutions obtenues sont trs proches de celles donnes par la formule
de l'intervalle de probabilit d'chantillonnage, o l'on remplacerait p par f !!

De faon gnrale, on proposera comme intervalle de confiance de la frquence p sur la
population totale, au coefficient de confiance de A %, l'intervalle :

(

n
f f
t f
n
f f
t f
A A
) 1 (
,
) 1 (


o t
A
est donn par la table de la loi normale N (0 , 1) tel que 2(t
A
) 1 = A %.

Dans le cas prcdent, pour f = 0,6 ; n = 100 et A = 95 %, on obtient t
A
= 1,96 et comme
intervalle de confiance pour p : [0,504 ; 0,696] , centr sur la valeur observe f = 0,6 .

Remarques (assez nombreuses !) :

A propos de la formule de l'intervalle de confiance d'une frquence :

Exposer la rsolution de l'quation du second degr aux tudiants n'est gure utile. On peut
se contenter de dire que cette formule peut "s'expliquer" par le fait que f est une estimation
ponctuelle de p et prsenter les choses comme suit.
On a l'quivalence : 95 , 0
) 1 (
96 , 1
) 1 (
96 , 1 =
|
|

\
|

n
p p
p F
n
p p
p P
95 , 0
) 1 (
96 , 1
) 1 (
96 , 1 =
|
|

\
|

n
p p
F p
n
p p
F P .
Le problme est que la valeur inconnue p se situe dans les bornes. On y substitue, faute de
mieux, son estimation ponctuelle f .

Certains utilisent l'estimation ponctuelle de l'cart type (dont on parlera plus loin) pour
donner la formule :
(

1
) 1 (
,
1
) 1 (
n
f f
t f
n
f f
t f
A A
.
Pourquoi pas ? De toutes faons a ne change pas grand chose et il faut bien comprendre
qu'en estimation les dcimales ont rapidement peu de signification (il faut tre modeste en
matire d'induction).

On peut galement fournir un argument gomtrique, ou, pour les sportifs qui voudront
tenter a en classe, un dveloppement limit (voir les encadrs suivants).


75

A propos de "probabilit" et "confiance" :
Le programme officiel insiste sur le point suivant :

"On distinguera confiance et probabilit :
- avant le tirage d'un chantillon, la procdure d'obtention de l'intervalle de confiance a
une probabilit 1 que cet intervalle contienne le paramtre inconnu,
- aprs le tirage, le paramtre est dans l'intervalle calcul avec une confiance 1 ."

En effet, on ne peut pas dire que p a 95 % de chances d'appartenir un intervalle de
confiance donn tel que [0,504 ; 0,696]. Cette expression ne contient rien d'alatoire, p
est, ou non, dans cet intervalle, sans que le hasard n'intervienne.
La probabilit porte sur la procdure d'estimation :
on a 95 , 0
) 1 (
96 , 1
) 1 (
96 , 1 =
|
|

\
|

n
p p
F p
n
p p
F P .
La seconde criture correspond un intervalle dont les bornes sont alatoires, centr sur
les valeurs de F et contenant p avec une probabilit de 0,95 (le problme est que cet
intervalle contient la valeur inconnue p dans son expression).
On peut dire que, sur un grand nombre d'intervalles de confiances (obtenus partir d'un
grand nombre d'chantillons), environ 95 % contiennent effectivement la valeur de p, ou

L'expression de l'intervalle de confiance
justifie par un dveloppement limit

Pour une valeur f observe, l'intervalle de
confiance de p 95% s'obtient en rsolvant en p
l'quation :
0 2
96 , 1 96 , 1
1
2
2 2
2
= +
|
|

\
|
+
|
|

\
|
+ f f
n
p
n
p .
On pose
n
x
96 , 1
= (proche de 0 pour n grand).
On a :
) 1 ( 2
) 1 ( 4 2
2
2 4 2
x
x f f x x f
p
+
+ +
=
( )
1
2
2
1
2 2
1
) 1 ( 4
1
1 ) 1 (
2
1
+
|
|
|

\
|
|
|

\
|

+ + = x x
f f
f f x x f .
On effectue un dveloppement limit de cette
expression l'ordre 1, au voisinage de x = 0 :
p = ( ) )) ( 1 ( )) ( 1 ( ) 1 (
2 1
x x x x f f x f + + ,
puis ) ( ) 1 ( x x f f x f p + =
avec
0
lim
x
(x) = 0 .
On retrouve ainsi l'expression des bornes de
l'intervalle de confiance 95 % :
) 1 (
96 , 1
f f
n
f .
(d'aprs Saporta p. 307)



Un argument gomtrique

L'ellipse d'quation :
0
100
96 , 1
2
100
96 , 1
1
2 2
2 2
=
|
|

\
|
+ + p py p y
a son grand axe (de symtrie)
proche de la droite d'quation
y = x.

76
encore, que l'on a 95% de chances d'exhiber un intervalle contenant p (avant le tirage de
l'chantillon).
b) CAS DES PETITS ECHANTILLONS (n < << < 30 ou np < << < 5 ou n(1 p) < << < 5)
On ne peut plus utiliser l'approximation par la loi normale, on utilise alors soit la loi
binomiale, soit un abaque (voir plus loin) ou des tables.
Ce paragraphe rpond au T.P. 1 du module "Statistique infrentielle" du programme.

"Estimation ponctuelle et par intervalle de confiance de la frquence, dans le cas d'une loi
binomiale connue, partir d'chantillons simuls.
La connaissance a priori de la loi sous-jacente permet de comparer le paramtre rel et
les estimations obtenues partir d'chantillons.
Aucune connaissance sur ce TP n'est exigible dans le cadre du programme de
mathmatiques."

On a p inconnu et supposons que la frquence du seul chantillon prlev est f = 0,2.
A partir de la frquence de cet chantillon, on dtermine les extrmits p
1
et p
2
de
l'intervalle de confiance de p au coefficient de confiance 95% de la faon suivante :










N.B. : les courbes reprsentes sur le schma ci-dessus, l'on t sous l'approximation
normale et ne sont pas exactes (voir l'abaque).

Voir le T.P. Excel "Loi binomiale et intervalle de confiance" donn en annexe.
0 1 0,2
p
2
p
1
Valeurs de p pour lesquelles
f 0,2 dans moins de 2,5% des
cas
Valeurs de p pour lesquelles
f 0,2 dans moins de 2,5% des
cas
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
f = 0,2
p
1
p
2

77
4 Exprimentation de la notion d'intervalle de confiance sur
Excel
La comprhension de la notion (dlicate) d'intervalle de confiance ncessite de se
confronter l'exprience. Ceci est possible grce la simulation sur tableur.

Voir le T.P. Excel "Intervalles de confiance" donn en annexe.

Travaillons sur un exemple o les scores taient particulirement
serrs :
Le 10 mai 1981, Franois Mitterrand a t lu avec 51,75 % des
voix, alors que Valery Giscard d'Estaing n'a recueilli que 48,25 %
des suffrages.
On suppose que l'on effectue des sondages le jour de l'lection, pour
estimer la proportion p des partisans de Giscard dans l'lectorat (en
ralit, p = 0,4825).
a Taille n = 100, coefficient de confiance 90 %
Pour simuler un sondage (chantillon prlev au hasard avec remise) de n = 100 personnes,
il suffit de recopier 100 fois la formule =ENT(ALEA()+0,4825), qui
renvoie la valeur 1 dans le cas d'un lecteur de Giscard et 0 sinon.
On peut faire calculer les bornes d'un intervalle de confiance 90 %
pour p, puis reprsenter les "fourchettes" ainsi obtenues, pour 10
sondages, l'aide d'un graphique de type "boursier".
En choisissant l'option "calcul sur ordre", il suffit ensuite de faire F9,
pour obtenir 10 nouveaux sondages et visualiser les fluctuations des
diffrents intervalles de confiance calculs :










On peut, par l'observation, rpondre aux questions suivantes :
Sur un exemple de 10 sondages,
- combien donnent une frquence f en faveur ( tort) de Giscard ( f > 0,5) ?
- combien d'intervalles prvoient compltement la victoire de Mitterrand (fourchette
entirement situe sous la valeur 0,5) ?
Deux intervalles de confiances ont-ils obligatoirement le mme centre ?
Deux intervalles de confiance peuvent-ils n'avoir aucun lment commun ?
Est-ce que p = 0,4825 appartient ncessairement l'intervalle de confiance donne par un
sondage ?
Quel est, sur 100 sondages observs, le pourcentage d'intervalles 90% de confiance ne
contenant pas la valeur p estimer ?

MITTERRAND

GISCARD
0
0 , 1
0 , 2
0 , 3
0 , 4
0 , 5
0 , 6
0 , 7
0 , 8
1 2 3 4 5 6 7 8 9 1 0
0
0 , 1
0 , 2
0 , 3
0 , 4
0 , 5
0 , 6
0 , 7
0 , 8
1 2 3 4 5 6 7 8 9 10
Cet intervalle ne contient
pas la valeur de p

78
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
1 2 3 4 5 6 7 8 9 10
b Taille n = 100, coefficient de confiance 95 %
Il suffit de changer la valeur 1,645 , utilise pour les intervalles de confiance 90 %, par
1,96 , pour faire de nouvelles observations.
Les intervalles de confiance 95 % se "trompent" moins souvent (statistiquement, on peut
observer qu'environ 95 % contiennent la valeur p) parce qu'ils sont plus "longs".
On peut observer de lgers carts d'amplitude entre les diffrents intervalles, selon que f est
petit (chantillon n 5) ou grand (chantillon n 2).
c Taille n = 1000, coefficient de confiance 95 %


La plus grande qualit de l'information
se traduit par une amplitude
notablement rduite des intervalles.
Il y a toujours, statistiquement, 95 %
qui ne contiennent pas p (sur l'image,
c'est le cas de l'chantillon n 7).


5 Des questions pour tester la comprhension des lves
Certains noncs l'examen posent parfois, aprs la dtermination d'un intervalle de
confiance, certaines questions permettant de juger de la comprhension des lves (qui
souvent ne font qu'appliquer une formule sans comprendre).
A la suite d'un TP de simulation tel que le prcdent, le nombre des rponses correctes des
tudiants ce genre de questions est en nette augmentation.

Voir les annales de B.T.S. donnes en annexe.

0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
1 2 3 4 5 6 7 8 9 10
L'intervalle de confiance de
l'chantillon n 5 ne contient pas
la valeur p = 0,4825 estimer.

79
Examinons ici deux exemples du BTS.

BTS Groupement B 2002 :
On considre un chantillon de 100 vhicules prlevs au hasard dans le parc de vhicules
neufs mis en circulation par l'entreprise en septembre 2001. Ce parc contient suffisamment de
vhicules pour qu'on puisse assimiler ce tirage un tirage avec remise.
On constate, qu'au bout de 6 mois de mise en circulation, 91 vhicules de cet chantillon n'ont
pas eu de sinistre.
a) Donner une estimation ponctuelle du pourcentage p de vhicules de ce parc qui n'ont pas eu
de sinistre 6 mois aprs leur mise en circulation.
b) Soit F la variable alatoire qui tout chantillon de 100 vhicules prlevs au hasard et
avec remise dans ce parc, associe le pourcentage de vhicules qui n'ont pas encore eu de
sinistre 6 mois aprs leur mise en circulation.
On suppose que F suit la loi normale
N (p ,
100
) 1 ( p p
), o p est le pourcentage inconnu de vhicules du parc qui n'ont pas eu de
sinistre 6 mois aprs leur mise en circulation.

Dterminer un intervalle de confiance du pourcentage p avec le coefficient de confiance
95 %.
c) On considre l'affirmation suivante :
le pourcentage p est obligatoirement dans l'intervalle de confiance obtenu la question b)
Est-elle vraie ? (On ne demande pas de justification.)

a) On estime p 0,63.
b) On trouve [0,535 ; 0,725].
c) Non, p n'est pas obligatoirement dans l'intervalle de confiance (la procdure amenant la
dtermination de cet intervalle a 95 % de chances d'aboutir un intervalle contenant p).

BTS Comptabilit gestion 1992 :
Dans cet nonc, on dtermine une estimation de la moyenne d'une population (le problme
est analogue celui d'une frquence), par intervalle de confiance centr sur la moyenne x
obtenue sur un chantillon, avec le coefficient de confiance 95%.
On pose ensuite la question suivante :
Rpondre par oui ou par non aux cinq questions suivantes :
a) Le nombre appartient-il obligatoirement cet intervalle de confiance ?
b) Le nombre a-t-il plus de chances de se trouver prs du centre que d'une extrmit de cet
intervalle de confiance ?
c) Avec un nouvel chantillon de 100 jours ouvrables prlev comme prcdemment, on
obtient de la mme faon un second intervalle de confiance de avec le coefficient de
confiance 95%.
Les deux intervalles de confiance sont-ils obligatoirement les mmes ?
Ces deux intervalles ont-ils obligatoirement le mme centre ?
Ces deux intervalles de confiance peuvent-ils n'avoir aucun lment commun ?

a) Non. Il est clair qu'il ne s'agit pas d'un intervalle 100 % de confiance. La procdure suivie ne
conduit un intervalle contenant que dans 95 % des cas.
b) Il est impossible de rpondre par oui ou par non cette question, qui est mal pose. Pour un
intervalle de confiance dj calcul et pour dtermin, quoique inconnu, il n'y a rien d'alatoire. Il
ne peut donc tre question de probabilits ou de "chances".
Maintenant, d'aprs le profil de la loi normale, on peut dire que la procdure de calcul des
intervalles de confiance a plus de chances d'amener un intervalle recouvrant vers son centre que
vers ses extrmits. Mais ne compliquons pas et il vaut mieux viter de poser ce genre de question.
c) La pratique des simulations montre clairement que les rponses aux trois questions poses sont :
non, non (les centres f
i
sont rarement les mmes) et oui (on peut avoir des intervalles disjoints,
auquel cas un au moins se trompe, mme si c'est relativement rare).

80
6 Utilisation d'abaques ou des fonctions intgres de certaines
calculatrices
a Abaque des intervalles de confiance 95 % d'une frquence


ABAQUE donnant, en fonction de la frquence f (en % en abscisses) observe sur un chantillon
de taille n , l'intervalle de confiance 95% de la PROPORTION p (en %) dans la population

En dehors des conditions de l'approximation normale (n < 30 ou np < 5 ou n(1 p) < 5),
l'abaque est calcul partir de la loi binomiale et les intervalles de confiance peuvent ne
pas tre symtriques autour de la valeur observe f .
Pour n "moyen" (de l'ordre de 30 100), on lit sur l'abaque (ou dans les tables) des
intervalles de confiance encore sensiblement diffrents de ceux donns par la formule
(

n
f f
t f
n
f f
t f
A A
) 1 (
,
) 1 (
, formule qui ne tient pas compte du fait qu'on
peut faire une correction de continuit dans l'approximation par la loi normale.

81
b Calculatrices

Modles de calculatrices :
CASIO Graph
80
TI 83 SHARP EL 9600
Intervalle de confiance
d'une frquence ou
proportion p d'une
population, partir de la
frquence f calcule sur
un chantillon de taille n.
STAT INTR Z 1-P
C-Level : entrer 0.95 ou 0.99 ou
...
x: entrer le nombre de succs
(x=fn)
n: entrer taille chantillon
affichage de l'intervalle de
confiance
STAT TESTS A:1-PropZInt
x: entrer le nombre de succs
(x=fn)
n: entrer taille chantillon
C-Level : entrer 0.95 ou 0.99 ou
...
affichage de l'intervalle de
confiance
STAT E TEST
17 InputStats ENTER
14 Zint1prop

II ESTIMATION D'UNE MOYENNE
1 Estimation ponctuelle

On prlve, au hasard et avec remise, un
chantillon de taille n dans une population.
On calcule la moyenne x et l'cart type s
n
de cet
chantillon.
Il s'agit d'estimer la moyenne et l'cart type ,
inconnus, de la population.


On prend comme estimation ponctuelle de , la moyenne x observe sur l'chantillon.
On prend comme estimation ponctuelle de , le nombre
n
s
n
n
s
1
= .
Population :
= ?
= ?
Echantillon
taille n
x ; s
n
connus
Estimateurs sans biais (dmonstration hors programme en
B.T.S.)

Soit X
i
la variable alatoire qui, au i
me
tirage, associe la mesure obtenue.
Les X
i
sont indpendantes, de mme loi de moyenne et d'cart type (tirages avec
remise).
Alors

=
i
X
n
X
1
est un estimateur sans biais de car E ( X ) = n
n

1
= et l'estimation
ponctuelle x est une ralisation de la variable alatoire X .
L'estimation s
2
est une ralisation de la variable alatoire ( )

=
=

=
n i
i
i n
X X
n
S
1
2
2
1
1
1
, qui est
un estimateur sans biais de la variance
2
.
Pour le justifier, on observe d'abord que :
( )

n
i
i
X
1
2
= ( )

+
2
X X X
i
= ( ) ( )

+ +
2 2
) ( ) ( 2 X X X X X X
i i
.
or

= = 0 ) ( X n X X X
i i
, d'o : ( )

n
i
i
X
1
2
= ( ) ( )

=
+
n
i
i
X n X X
1
2 2
.
On a ainsi ( ) ( )

= ) ( ) (
2
X V n X V X X E
i i
,
c'est dire ( ) ( ) n n X X E
i
2
2
2
=

, et donc ( )
2 2 2
1
) 1 (
1
= =

n S E
n
.

82

Remarques :
L'estimation
n
s
n
n
s
1
= est donne par la touche x
n-1
ou s de la calculatrice.
L'estimation de peut tonner. Elle est ainsi faite pour que , sur un grand nombre
d'chantillons, la moyenne des estimations soit gale . En effet, s
n
a tendance tre
gnralement infrieur (biais).
La dmonstration (voir encadr) est tout fait hors programme. En revanche, celui-ci nous
suggre une exprimentation par simulation (une "illustration qualitative succincte" peut
tre propose mais "toute tude mathmatique est hors programme").
Une telle illustration est rapidement possible, par simulation sur Excel.
On a choisi l'tude de l'estimateur de la variance,
dans le cadre d'une population distribue selon la
loi uniforme U [0, 1].
On prend comme estimation ponctuelle de , le
nombre
10
9
10
s s = .
On vrifie exprimentalement que s
2
est "en
moyenne" plus proche de
2
que s
10
2
.


Pour obtenir les rsultats de l'cran ci-dessus, on a simul 1000 chantillons de taille 10
selon la formule =ALEA() .
La variance s
10
2
sur un chantillon correspond la formule =VAR.P(Ax:Jx) (le P semble
signifier que l'on considre la plage de cellules suivante, ici l'chantillon, comme la
population de l'tude), alors que l'estimation s
2
de la variance de la population partir de
cet chantillon correspond la formule =VAR(Ax:Jx) .
En faisant F9 on simule une autre srie de 1000 chantillon.

Population :
= 0,5
=
12
1

Echantillon
taille n = 10
x
; s
10
connus
?

83
2 Estimation par intervalle de confiance
On considre la variable alatoire X qui, tout chantillon de taille n, associe sa
moyenne.
On sait que, au moins pour n assez grand (thorme limite central), X suit
(approximativement) la loi normale N
|
|

\
|
n

, .
On sait alors que P ( h X + h) = 0,95 pour h =
n

96 , 1 .
Ce qui quivaut P ( X h X + h) = 0,95 (intervalle dont les bornes sont
alatoires et qui contient avec une probabilit de 0,95).

De faon gnrale, on proposera comme intervalle de confiance de la moyenne de la
population totale, au coefficient de confiance de A %, l'intervalle :
(

+
n
t x
n
t x
A A

; , calcul partir de la moyenne x observe sur un chantillon de
taille n, o t
A
est donn par la table de la loi normale N (0 , 1) tel que 2(t
A
) 1 = A %.

Remarques :
Lorsque est connu et que n est grand, la situation est plus simple que pour les
frquences.

Ce qui prcde est valable pour les grands chantillons (n 30) ou les petits chantillons
issus d'une population normale, lorsque est connu.

Lorsque est inconnu et n 30, on utilise la formule prcdente, en remplaant par
son estimation
n
s
n
n
s
1
= .

Pour les petits chantillons issus d'une population normale, on utilise, lorsque est
inconnu, une loi de Student .
Dans certains domaines d'application, les petits chantillons sont la rgle. C'tait de le cas
pour William Gosset (1876-1937) alias Student, qui, pour ses contrles de qualit aux
brasseries Guinness, ne pouvait disposer de grands chantillons extraits d'une population
homogne cause de la grande variabilit des conditions de fabrication (temprature,
provenance du houblon, du malt, ).
Intervalle de confiance pour
Valeur de x
n
x y

96 , 1 =
Valeur de
x

84
LOI DE STUDENT

Si X est une variable alatoire de loi normale
centre rduite et Y une variable alatoire
indpendante de X de loi du khi 2 n degrs
de libert, alors, par dfinition, la variable
alatoire
Y
n X
suit la loi de Student n
degrs de libert.
La loi de Student n degrs de libert
admet comme fonction de densit la fonction
f dfinie sur IR par :
2 / ) 1 (
2
1 )
2
,
2
1
(
1
) (
+
|

\
|
+
=
n
n
t n
B n
t f ,
o la fonction eulrienne B est dfinie par
) (
) ( ) (
) , (
q p
q p
q p B
+

=
avec


=
0
1
) ( dt e t x
t x
.

Densit de Student pour 1, 2, 5, 10, 50
degrs de libert.
Le programme prvoit que, pour rpondre la demande des matires technologiques, on
peut donner des exemples de procdures fondes sur la loi de Student mais "aucune
connaissance leur sujet n'est exigible".

On considre une population rpartie
selon une loi normale de moyenne et
d'cart type , tous deux inconnus.
On prlve des chantillons alatoires non
exhaustifs de taille n.
Soit X
i
la variable alatoire qui associe au
i
me
tirage, son rsultat. Les X
i
sont
indpendantes de loi normale N ( , ).
On note :

=
i
X
n
X
1
et
2
2 2
1
X X
n
S
i
=

.
On sait que
n
X


suit la loi normale
centre rduite et on montre que
2
2

nS
est
indpendante de la prcdente et suit la loi
du khi 2 n 1 degrs de libert.
Dans ces conditions (voir l'encadr) la
variable alatoire T
n1
=
2
2
1
/

nS
n
n
X


suit la loi de Student n 1 degrs de
libert.
Le calcul des intervalles de confiance sera
donc bas sur cette variable alatoire
1
1

n
S
X
T
n
suivant la loi de
Student n 1 degrs de libert.

Pour un niveau de confiance 1 , on lira
dans la table le nombre t tel que :
= 1 ) ( t T t P =

1 ) 1 ( t n
S
X
t P
=

1 )
1 1
(
n
S
t X
n
S
t X P .
Et on prendra ainsi comme intervalle de confiance de au niveau 1 :

(

1
,
1 n
s
t x
n
s
t x
n n
o x et s
n
sont la moyenne et l'cart type de l'chantillon,

ou encore,
(

+
n
s
t x
n
s
t x , o s est l'estimation de , calcule sur l'chantillon.

85
Exemple :
Sur un chantillon de taille n = 20, extrait avec remise d'une population normale, on obtient
une moyenne x = 24,75 et un cart type s
n
= 1,12.
a) Donner un intervalle de confiance de la moyenne de la population, avec un niveau de
confiance de 95 %.
Le nombre de degrs de libert est 1 = n = 19. Pour un coefficient de confiance de
95 % la table donne (P = 0,05) t = 2,093. Les bornes de l'intervalle de confiance sont
donc donnes par
19
12 , 1
093 , 2 75 , 24 , d'o l'intervalle : [24,21 ; 25,29].
b) Reprendre le calcul avec n = 30 et comparer avec l'intervalle obtenu avec la loi normale.
Pour 29 degrs de liberts, on lit t = 2,042 alors que la loi normale donne t = 1,96.
Les intervalles de confiance sont trs voisins :
[24,32 ; 25,18] avec la loi de Student et [24,34 ; 25,16] avec la loi normale.

Table de distribution de T ( loi de Student )
: degrs de libert. P : probabilit que T prenne une valeur extrieur [t , t].
Pour les grands chantillons, on retrouve
les valeurs fournies par la loi N (0 , 1)

86
3 Utilisation des fonctions intgres de certaines calculatrices
ou de l'ordinateur
a - Calculatrices
Modles de
calculatrices :
CASIO Graph 80 TI 83 SHARP EL 9600
Intervalle de
confiance d'une
moyenne m d'une
population, partir de
la moyenne x
calcule sur un
chantillon de taille n.
STAT INTR Z (si pop;
connu) ou t (si pop.
Inconnu) 1-S
Data : Var
C-Level : 0.95 ou 0.99 ou ...
(ou xn-1) : entrer pop.
ou estim
x : entrer x chantillon
n: entrer taille chantillon
affichage de l'intervalle de
confiance
STAT TESTS 7:ZInterval
(Si pop connu) ou
8:TInterval (Si inconnu)
Inpt: Stats
x : entrer x chantillon
(ou Sx) : entrer pop. ou
son estim
n : entrer taille chantillon
C-Level : entrer 0.95 ou 0.99
ou ...
affichage de l'intervalle de
confiance
STAT E TEST
17 InputStats ENTER (mode
valeurs numriques)
12 Zint1samp (Si pop
connu) ou
06 Tint1samp (Si
inconnu)
b Sur Excel
Pour un intervalle de
confiance d'une moyenne
, on peut, lorsque l'cart
type de la population est
connu, utiliser la fonction
INTERVALLE.CONFIANCE .
Par exemple, si l'on entre :
= 0,05 (confiance 95%)
= 2 et n = 400,
on obtient la valeur 0,196
qui est le rayon de l'intervalle de confiance. Ainsi, si l'on a obtenu x = 239 sur un
chantillon, l'intervalle de confiance de 95 % sera [239 0,196 ; 239 + 0,196].
III Tableau rsum des notations
Population Echantillon Estimation
Variable alatoire
(estimateur)
Loi de probabilit
f
r

q
u
e
n
c
e

p f f

=
i
X
n
F
1

o X
i
suit la loi B (1 , p)
N
|
|

\
|

n
p p
p
) 1 (
,
Approximativement,
pour n 30
m
o
y
e
n
n
e

x x

=
i
X
n
X
1
avec
E (X
i
) = et (X
i
) =
N
|
|

\
|
n

, ,
si X
i
normales, ou
approximativement
pour n 30

c
a
r
t

t
y
p
e

s
n
n
s
n
n
s
1
=

( )

=
=

=
n i
i
i n
X X
n
S
1
2
2
1
1
1

2
2
1
) 1 (

n
S n
suit la
loi
2
1 n
,
si X
i
normales

Les rsultats encadrs en gras sont hors programme

87





88



T.P. Excel : INTERVALLES DE CONFIANCE
Objectifs
Sur la base d'un nonc d'examen :
- Etudier un chantillon issu d'une distribution normale (moyenne pondre , cart type,
histogramme).
- Dterminer un intervalle de confiance pour la moyenne de la population et tudier
l'impact du coefficient de confiance et de la taille de l'chantillon.
- Exprimenter la dpendance des intervalles de confiance l'chantillon choisi.

OUVERTURE D'UN FICHIER ET MISE EN PLACE DE
L'ENVIRONNEMENT
Lancer Excel.
Pour marquer le titre :
Cliquer dans la cellule C1, choisir Taille 12 Gras et taper le titre : "INTERVALLES DE
CONFIANCE" puis sur la touche ENTREE.
Slectionner (en maintenant enfonc le bouton gauche de la souris), les cellules de C1 F1
puis cliquer sur l'icne Fusionner et centrer puis sur l'icne d'encadrement.












1 ETUDE D'UN ECHANTILLON
Un sujet de BTS
(D'aprs BTS Btiment 1998)
Une usine produit des fils de 6 mtres de long utiliss pour la fabrication de panneaux de
treillis soud.
On suppose que la variable alatoire X qui, chaque fil choisi dans la production de la
journe, associe son diamtre en millimtres, suit une loi normale de moyenne et d'cart
type = 0,1.
On cherche estimer partir des rsultats d'un chantillon de la production journalire.
Taille
12
Gras
Fusionner
et centrer

89
On mesure le diamtre exprim en millimtres de chacun des n = 40 fils d'un chantillon
choisi au hasard et avec remise dans la production d'une journe. On regroupe les rsultats
en classes dont les effectifs sont les suivants :

classes ]3,25 ; 3,35] ]3,35 ; 3,45] ]3,45 ; 3,55] ]3,55 ; 3,65] ]3,65 ; 3,75] ]3,75 ; 3,85]
effectifs 1 8 19 9 2 1
Etude de l'chantillon
Cliquer sur A3 et taper, en gras, "Etude d'un
chantillon de taille 40".
En A4 taper "Centres xi" et entrer de A5
A10 les centres des classes.
En B4 taper "Effectifs ni" et entrer de B5
B10 les effectifs correspondants.
En supposant que les effectifs sont
regroups aux centres des classes, vous allez
calculer avec le tableur, la moyenne x et
l'cart type s de l'chantillon.
Comme Excel ne possde pas de fonction
intgre permettant le calcul direct d'une
moyenne (et d'un cart type) pondre, vous
allez en dtailler le calcul.
En C4, taper "ni xi".
En C5, entrer la formule : =A5*B5
puis approcher le pointeur de la souris du
carr noir situ dans le coin infrieur droit
de la cellule C5. Lorsque le pointeur se
transforme en une croix noire, faire glisser
en maintenant le bouton gauche enfonc, jusqu' la cellule C10 (on a recopi la formule
vers le bas).
En A12, inscrire "Moyenne chantillon" et en C12 entrer la formule :
=SOMME(C5:C10)/40
(la formule s'inscrit en
mme temps dans la
barre de formule en haut).
Pour dterminer l'cart type, procder ainsi :
En D4 taper "ni*xi^2" (le symbole ^ de
puissance s'obtient en appuyant
simultanment sur CTRL ALT et la
touche ).
En D5 entrer la formule :
=B5*A5^2 que vous recopiez vers le
bas jusqu'en D10.
En A13, taper "Variance chantillon" et en C13, entrer la formule :
=SOMME(D5:D10)/40-C12^2
Enfin, en A14 taper "Ecart type chantillon" et en C14 entrer la formule :
=RACINE(C13)
Recopier vers le bas

90
Reprsentation sous forme d'histogramme

Slectionner (bouton gauche de la
souris enfonc) la plage des valeurs
d'effectifs (de B5 B10).

Cliquer sur l'icne de l'assistant
graphique.

Etape 1/4 : Choisir Histogramme et
cliquer sur Suivant.
Etape 2/4 : Aller dans l'onglet Srie
et la rubrique Etiquette des abscisses
cliquer sur l'icne de sortie vers la feuille
de calcul pour venir y slectionner les
valeurs de A5 A10 (retour dans
l'assistant graphique par le mme icne
situe dans la bote Assistant graphique).
Cliquer sur Suivant.
Etape 3/4 : Dans l'onglet Lgende
dsactiver Afficher la lgende puis cliquer
sur Suivant.
Etape 4/4 : Cocher l'option En tant
qu'objet dans la Feuil1 puis cliquer sur
Terminer.

L'histogramme peut tre en dehors de la
zone d'impression. Pour le dplacer,
cliquer (gauche) dans la Zone de
graphique de l'histogramme puis, en
maintenant le bouton gauche enfonc,
dplacer le graphique.
Complter la feuille rponse.
2 DETERMINATION D'INTERVALLES DE CONFIANCE
POUR LA MOYENNE
Intervalle de confiance 95%
On cherche, partir de l'chantillon tudi sur la feuille de calcul 1, donner un intervalle
de confiance pour la moyenne des diamtres en millimtres pour la production du jour.
Cliquer sur l'onglet Feuil 2 pour accder une autre feuille de calcul.
Dans la cellule A1, taper, en gras, "Intervalles de confiance".
En A3, taper "Taille chantillon" puis en D3 taper 40.
En A4, taper "Moyenne chantillon" puis en D4 taper 3,515.
En A5, inscrire "Ecart type population" et en D5 la valeur 0,1.
En A6, inscrire "Coefficient de confiance" et en D6 la valeur 0,95.
En A7 inscrire "t pour 2(t)-1=coef confiance" (la lettre s'obtient en choisissant la police
Symbol puis avec la touche p).
Assistant graphique
Sortie vers la
feuille de calcul

91
Cliquer sur D7 puis sur l'icne Coller une fonction, choisir Statistiques puis
LOI.NORMALE.INVERSE et cliquer sur OK.
Dans la bote de dialogue,
inscrire la rubrique
Probabilit (1 + D6) / 2
(la cellule D6 contient le
coefficient de confiance).
Pour Esprance inscrire la
valeur 0 et pour Ecart_type
la valeur 1
(il s'agit de la loi N (0;1)).
Puis cliquer sur OK.
En A8 inscrire "Borne infrieure IC"
puis en D8, taper la formule :
=D4-D7*0,1/RACINE(D3)

En A9 inscrire "Borne suprieure IC" puis en D9, taper la formule :
=D4+D7*0,1/RACINE(D3)
En A10, inscrire "Amplitude IC" et en D10, taper la formule : =D9-D8 .
Inscrire les rsultats sur la feuille rponse.
Impact du coefficient de confiance et de la taille de l'chantillon
Double cliquer (gauche) sur la cellule D6 de faon modifier le coefficient de confiance.
Remplacer 0,95 par 0,99. Faire ENTREE.
Inscrire les rsultats sur la feuille rponse.
Revenir en D6 0,95. Modifier cette fois en D3 la taille de l'chantillon : remplacer 40 par
100 (on suppose que l'on conserve la mme moyenne d'chantillon).
Inscrire les rsultats sur la feuille rponse.

On dsire connatre la taille de l'chantillon de sorte avoir un intervalle de confiance
95% pour d'amplitude 0,02. Procder ainsi :
Drouler le menu Outils/Valeur cible...
Dans la bote de dialogue, entrer :
Cellule dfinir : D10
Valeur atteindre : 0,02
(attention Excel n'accepte pas 0.02)
Cellule modifier : D3
Cliquer sur OK.

La rponse tant approximative, modifier le contenu de la cellule D3 de faon dterminer
la taille minimale.

Inscrire les rsultats sur la feuille rponse.
3 DEPENDANCE D'UN INTERVALLE DE CONFIANCE A
L'ECHANTILLON CHOISI
Un intervalle de confiance est calcul partir d'un chantillon. Pour prendre conscience de
cette dpendance, vous allez supposer que X suit la loi normale N ( ; 0,1) avec = 3,504
et simuler la prise de plusieurs chantillons de taille n = 100.
Coller une fonction

92
Cliquer sur l'onglet Feuil3.
En A1, taper "chantillons", puis, en B1, entrer la formule suivante, qui simule une
ralisation de la variable alatoire X de loi N (3,504 ; 0,1) :
=3,504+0,1*COS(2*PI()*ALEA())*RACINE(-2*LN(ALEA()))
Recopier vers le bas la cellule B1 jusqu'en B40. Vous avez simul un chantillon alatoire
de taille 40.
En A45, taper "moyenne xi" et, en B45, entrer la formule :
=MOYENNE(B1:B40)
En A42, taper "rayon IC90%". Vous allez calculer le rayon
d'un intervalle de confiance 90 % de , grce la
fonction INTERVALLE.CONFIANCE d'Excel, connaissant
=0,1 et n = 40.
En B42, entrer la formule : =INTERVALLE.CONFIANCE(0,10;0,1;40)
En A43 taper "inf IC", puis, en A44, "sup IC".
Entrer les formules, en B43 : =B45-B42 puis, en B44 : =B45+B42 .
Ce sont les bornes de l'intervalle de confiance. Celui-ci contient-il la valeur relle de , ici
suppose tre gale 0,504 ? Pour le faire apparatre, inscrire en A47 "valeur IC", puis
entrer en B47 la formule : =ET(3,504>=B43;3,504<=B44)
Vous avez sans doute remarqu qu' chaque nouveau calcul, un autre chantillon alatoire
est gnr. On va exploiter ceci pour observer de nombreuses simulations.
Slectionner les cellules de B1 B47, puis recopier-les jusqu' la colonne K.
Vous disposez alors des rsultats de 10 chantillons. Pour totaliser le nombre d'intervalles
ne contenant pas , taper en A48, "total FAUX/10" et entrer en B48 la formule :
=NB.SI(B47:K47;FAUX)
Cliquer sur l'icne de l'assistant
graphique.
Etape 1/4 : choisir le type Boursier,
premier sous-type.
Etape 2/4 : sortir sur la feuille de calcul,
slectionner les trois lignes de B43
K45.
Etape 3/4 : dslectionner, dans l'onglet Lgende,
l'option Afficher la lgende.
Etape 4/4 : cocher sur une nouvelle feuille.

Pour faire de nouvelles simulations, appuyer sur F9.
Rpondre aux questions de la feuille rponse.

93

FEUILLE REPONSE

NOMS : .............................................................................................................

1 ETUDE D'UN ECHANTILLON
Moyenne de l'chantillon de taille 40 : .............................................................................................
Ecart type de l'chantillon de taille 40 : ............................................................................................

Si possible, joindre l'impression de la feuille 1 ou enregistrer sur disquette.
2 DETERMINATION D'INTERVALLES DE CONFIANCE
Impact du coefficient de confiance et de la taille de l'chantillon
Intervalle de confiance A % pour , centr sur x , obtenu partir d'un chantillon de
taille n (arrondir les rsultats 10
3
prs) :
Coefficient de
confiance
Taille n de
l'chantillon
Intervalle de
confiance obtenu
pour
Amplitude de
l'intervalle de
confiance
95 % 40
99 % 40
95 % 100

Expliquer les diffrences d'amplitude des intervalles de confiance,
- Selon la valeur du coefficient de confiance :
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
- Selon la taille de l'chantillon :
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
Taille n de l'chantillon de sorte que l'intervalle de confiance 95% soit d'amplitude
infrieure 0,02 : ..............................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
Vrification de l'amplitude pour cette valeur de n : ..........................................................................
...........................................................................................................................................................

Si possible, joindre l'impression de la feuille 2 ou enregistrer sur disquette.
... / ...

94
3 DEPENDANCE D'UN INTERVALLE DE CONFIANCE A
L'ECHANTILLON CHOISI
Soit un intervalle de confiance 90 %, calcul sur un chantillon de 40 valeurs.
Le nombre appartient-il toujours l'intervalle de confiance ? ...................................................

Avec un nouvel chantillon de 40 mesures, on obtient de la mme faon un second
intervalle de confiance de avec le coefficient de confiance 90 %.
Les deux intervalles de confiance sont-ils obligatoirement les mmes ? .......................................
Ces deux intervalles ont-ils obligatoirement le mme centre ? ......................................................
Ces deux intervalles de confiance peuvent-ils n'avoir aucun lment commun ? ..........................

Faire 10 simulations de 10 chantillons de taille 40, et noter, chaque fois, le nombre
d'intervalles de confiance 90 % ne contenant pas :
Simulation
1 2 3 4 5 6 7 8 9 10
Nombre
de FAUX


Sur ces 100 intervalles de confiances, combien, au total, ne contenaient pas ? .........................
Sur un grand nombre d'intervalles de confiance 90 % de , obtenus sur un grand
nombre d'chantillons, combien ne contiennent pas la valeur estimer ? .......................................

Si possible, joindre l'impression du graphique ou enregistrer sur disquette.


95

Corrig du TP sur Excel
"INTERVALLES DE CONFIANCE" Dure : 1h30

1 ETUDE D'UN ECHANTILLON
Moyenne de l'chantillon de taille 40 : x = 3,515 .
Ecart type de l'chantillon de taille 40 : s 0,096 10
3
prs.












2 DETERMINATION D'INTERVALLES DE CONFIANCE
Impact du coefficient de confiance et de la taille de l'chantillon








Expliquer les diffrences d'amplitude des intervalles de confiance,
- Selon la valeur du coefficient de confiance :
Si l'on augmente le coefficient de confiance (de faon avoir plus de chances de contenir ),
l'amplitude de l'intervalle augmente (fourchette moins prcise).
- Selon la taille de l'chantillon :
Si l'on augmente la taille de l'chantillon, l'amplitude de l'intervalle diminue, car on a une
information plus prcise avec un chantillon plus grand.
Taille n de l'chantillon de sorte que l'intervalle de confiance 95% soit d'amplitude
infrieure 0,02 :
L'outil "valeur cible", donne n 367 qui correspond une amplitude lgrement suprieure
0,02.
En tatnnant, on trouve que n = 385 est la plus petite taille donnant une amplitude, de
l'intervalle de confiance 95 %, infrieure 0,02.

3 DEPENDANCE D'UN INTERVALLE DE CONFIANCE A L'ECHANTILLON
CHOISI

On obtient des graphiques du type ci-contre :

Sur cette image, les intervalles de confiance
obtenus partir des chantillons 6 et 7, ne
contiennent pas la moyenne = 3,504.



Coefficient de
confiance
Taille n de
l'chantillon
Intervalle de
confiance obtenu
pour
Amplitude de
l'intervalle de
confiance
95 % 40 [3,484 ; 3,546] 0,062
99 % 40 [3,474 ; 3,556] 0,081
95 % 100 [3,495 ; 3,535] 0,039

0
5
10
15
20
3,3 3,4 3,5 3,6 3,7 3,8

3,35
3,4
3,45
3,5
3,55
3,6
1 2 3 4 5 6 7 8 9 10

96
Soit un intervalle de confiance 90 %, calcul sur un chantillon de 40 valeurs.
Le nombre appartient-il l'intervalle de confiance ? Pas forcment.

Avec un nouvel chantillon de 40 mesures, on obtient de la mme faon un second intervalle
de confiance de avec le coefficient de confiance 90 %.
Les deux intervalles de confiance sont-ils obligatoirement les mmes ? Non.
Ces deux intervalles ont-ils obligatoirement le mme centre ? Non.
Ces deux intervalles de confiance peuvent-ils n'avoir aucun lment commun ? Oui (dans
un cas extrme).

Exemple de 10 simulations de 10 chantillons de taille 40 (soit 100 chantillons), avec le
nombre d'intervalles de confiance 90 % ne contenant pas :




Sur ces 100 intervalles de confiances, 7 ne contenaient pas .
Sur un grand nombre d'intervalles de confiance 90 % de , obtenus sur un grand nombre
d'chantillons, combien ne contiennent pas la valeur estimer ? 10 % .


Simulation
1 2 3 4 5 6 7 8 9 10
Nombre
de FAUX
0 1 0 1 0 3 0 1 2 1


97






98

T.P. : LA MAITRISE STATISTIQUE DES
PROCEDES DE PRODUCTION

Dans le cadre de la "Matrise Statistique des Procds", on tudie la variabilit de la
production. Un des objectifs est de dtecter les anomalies, en temps rel.

L'exemple tudi, issu de l'industrie automobile, est une
presse d'emmanchement de poulie sur une pompe de
direction assiste. Les performances de la presse sont
variables, cette variabilit ayant de nombreuses causes
possibles : main-d'uvre, matriel, matire premire,
environnement de l'atelier, mthodes d'organisation...
L'emmanchement de la poulie sur l'axe de la pompe est
mesur par la cote de 39,9 mm indique sur le schma ci-
contre.

On a mesur cette cote, 10
-2
mm prs, sur 40 ensembles pompe-poulie, produits de faon
successive dans la production en srie. Les observations sont reprsentes, dans l'ordre
chronologique, sur le schma suivant.
I ETUDE DE NORMALITE
Une premire tape consiste voir si les variations observes peuvent raisonnablement
rsulter d'un phnomne suivant une loi normale.
Pompe
Poulie
cote 39,9 mm
39,7
39,75
39,8
39,85
39,9
39,95
40
40,05
1 4 7
1
0
1
3
1
6
1
9
2
2
2
5
2
8
3
1
3
4
3
7
4
0
cote d'emmanchement en mm
Numro d'ordre de
l'ensemble pompe-
poulie

99
Nous allons d'abord regrouper les 40 observations en 10 classes d'gale amplitude 0,025 et
construire un histogramme. Les rsultats sont les suivants :

centres des
classes
39,775 39,8 39,825 39,85 39,875 39,9 39,925 39,95 39,975 40
effectifs 1 1 2 6 5 9 8 6 1 1

Dans un deuxime temps, nous allons comparer ces rsultats observs ceux, thoriques,
correspondant une variable alatoire X de loi normale N (, ). Cette comparaison se fera
l'aide, d'une part des frquences cumules observes, et, d'autre part, de la fonction de
rpartition de X.

1) Frquences cumules observes :
On note x
i
les bornes suprieures des classes et y
i
les frquences cumules correspondantes.
C'est dire que y
i
est la frquence des observations infrieures ou gales x
i
.
Calculer la frquence cumule de la case "oublie".

bornes sup
des classes
x
i
39,7875 39,8125 39,8375 39,8625 39,8875 39,9125 39,9375 39,9625 39,9875 40,0125
frquences
cumules
y
i
0,025 0,05 0,25 0,375 0,6 0,8 0,95 0,975 1

2) Frquences thoriques selon la loi normale :
Si X suit la loi N (, ) alors

X
T

= suit la loi normale centre rduite N (0, 1) et


y
i
= F(x
i
) = P(X x
i
) = ) ( ) (
i i
i
t t T P
x X
P = = |

\
|


avec

x
t
i
i

= et o
est la fonction de rpartition de la loi N (0, 1), tabule dans le formulaire officiel de BTS.
On peut, partir des frquences cumules observes y
i
, calculer, par lecture inverse de la
table de la loi N (0, 1), les valeurs t
i
telles que ) ( ) (
1
i i i i
y t t y

= = .
Calculer, 10
-2
prs, la valeur t
7
oublie dans le tableau ci-dessous, c'est dire telle que
P(T t
7
) = 0,8 o T suit la loi normale N (0, 1).

y
i
0,025 0,05 0,1 0,25 0,375 0,6 0,8 0,95 0,975 1
t
i
1,96 1,645 1,281 0,674 0,319 0,253 1,645 1,96

0
1
2
3
4
5
6
7
8
9
10
39,775 39,8 39,825 39,85 39,875 39,9 39,925 39,95 39,975 40

100
3) Rgression linaire (droite de Henry) :
Si la distribution observe est extraite
d'une population normale, on devrait
avoir

x t
i i

1
.

a) Sur le graphique ci-contre, on a
reprsent les points de coordonnes
(x
i
, t
i
).
Les points semblent-ils pratiquement
aligns ?

b) Calculer une quation t = ax + b de
la droite d'ajustement de t en x selon la
mthode des moindres carrs pour le
tableau ci-dessous (on arrondira 10
-3
prs) :

x
i
39,7875 39,8125 39,8375 39,8625 39,8875 39,9125 39,9375 39,9625 39,9875
t
i
1,96 1,645 1,281 0,674 0,319 0,253 0,842 1,645 1,96

c) Que vaut le coefficient de corrlation r ? Comment peut-on l'interprter ?
d) Vrifier que, d'aprs les rsultats prcdents, on peut approximativement prendre
=
a
1
0,05 et =
a
b
39,9.

Voici, titre indicatif, d'autres graphiques permettant de visualiser la normalit des
donnes :


Frquences cumules croissantes observes y
i

et fonction de rpartition F de la loi N (39,9 ; 0,05)




0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
39,7875 39,8375 39,8875 39,9375 39,9875
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
39,75 39,8 39,85 39,9 39,95

101

Histogramme des observations
et densit de la loi normale N (39,9 ; 0,05)
II CAPABILITE
Le bureau d'tude a dfini, pour cette cote, l'intervalle de tolrance suivant :
[39,9 0,2 mm ; 39,9 + 0,2 mm] . C'est dire, qu'en dehors de cet intervalle,
l'emmanchement sera considr comme non conforme.
Le procd de fabrication est considr comme "capable" lorsque la probabilit de
fabrication d'une pice hors tolrance est infrieure 2 /
oo
.
Si le procd n'est pas capable, il fabriquera, en quantit inacceptable, des pices hors
normes. Dans ce cas, avant de le mettre sous contrle, on essaiera au pralable de
l'amliorer, pour le rendre capable.
1) On suppose que la variable alatoire X qui, chaque ensemble poulie-pompe choisi au
hasard, associe sa cote d'emmanchement en mm, suit la loi normale N (39,9 ; 0,05).
Calculer la probabilit que cette cote soit acceptable, c'est dire : P(39,7 X 40,1).
2) Peut-on considrer le procd de fabrication comme capable ?
III CARTE DE CONTROLE POUR LES MOYENNES
Pour la surveillance de la production venir, on envisage d'tablir une "carte de contrle
aux moyennes". On supposera que la valeur de reste stable mais qu'une drive sur la
valeur de est craindre. La cote de l'emmanchement pompe-poulie tant un "point
Scurit-Rglementation", la norme prvoit de prlever rgulirement des chantillons de
n = 5 ensembles pompe-poulie, sur lesquels on calculera la moyenne des 5 cotes
d'emmanchement.
1 Drive systmatique d'un ct de la moyenne
On suppose ici que X suit la loi N (39,9 ; 0,05).
On considre l'exprience alatoire consistant prlever avec remise un chantillon de 5
ensembles pompe-poulie dans la production et calculer la moyenne x des cotes
d'emmanchement de cet chantillon.
Soit A l'vnement "la moyenne x est suprieure ou gale 39,9". Compte-tenu de la
symtrie de la loi normale, on a P(A) = 0,5.
On prlve, de faon indpendante, N chantillons.
0
1
2
3
4
5
6
7
8
9
10
39,78 39,8 39,83 39,85 39,88 39,9 39,93 39,95 39,98 40

102
a) Montrer que la variable alatoire Y qui, ces N chantillons, associe le nombre de fois
que l'vnement A s'est produit, suit la loi binomiale de paramtres N et 0,5.
b) Calculer, en fonction de N, la probabilit que chacun des N chantillons amne une
moyenne suprieure 39,9.
c) Dterminer le plus petit entier N tel que 0,5
N
0,01 , puis le plus petit entier N tel que
0,5
N
0,002.
d) Justifier la rgle selon laquelle, si
apparaissent 7 chantillons successifs de
moyenne suprieure 39,9 (comme sur la
figure), l'alerte est donne et, dans le cas de 9
chantillons successifs au dessus de la
moyenne, la production est arrte pour
rglage.

2 Limites de surveillance et d'acceptation
On suppose ici que la variable alatoire X qui, chaque ensemble pompe-poulie prlev au
hasard dans la production, associe la cote d'emmanchement exprime en mm, suit la loi
normale N (39,9 ; 0,05).
a) Soit X la variable alatoire qui, chaque chantillon de 5 ensembles pompe-poulie
prlev au hasard et avec remise, associe la moyenne des cotes d'emmanchement de cet
chantillon.
Justifier que X suit la loi normale de moyenne 39,9 et d'cart type 0,022 10
-3
prs.
b) Des limites de surveillance sont fixes, sur la carte de contrle, 39,857 mm et
39,943 mm. Calculer, 10
-2
prs, P(39,857 X 39,943).
c) Pour calculer les limites d'acceptation, dont le dpassement provoque l'arrt de la
production, calculer, 10
-3
prs, le rel h tel que P (39,9 h X 39,9 + h) = 0,998.
39,9
moyenne
chantillons successifs
39,943
39,857
39,9
moyenne d'chantillon
numro d'chantillon
limite d'acceptation
limite de surveillance
limite de surveillance
limite d'acceptation

103

Corrig des travaux pratiques
"Matrise statistique des procds de production"

I Normalit
1) La frquence cumule manquante est 1 , 0
40
4
3
= = y .
2) On a 8 , 0 ) ( 8 , 0 ) ( = = t t T P ce qui donne, par lecture inverse de la table des
valeurs de la fonction de rpartition , 84 , 0 t .
3) a) Les points de coordonnes (x
i
, t
i
) sont pratiquement aligns.
3 b) On obtient, l'aide de la calculatrice, une quation de la droite de rgression de t en x
selon la mthode des moindres carrs : t = ax + b avec a 20,482 et b 817,107.
3 c) Le coefficient de corrlation linaire est r 0,994 qui est trs proche de 1. Ce qui va
dans le sens d'un ajustement par une loi normale.
3 d) On a alors = 1/a 0,049 puis = b/a 39,894.

II Capabilit
1) On trouve que P(39,7 X 40,1) 1 (la calculatrice donne 0,99994).
Remarque : la condition d'une probabilit de 2/
oo
hors tolrance correspond un cart la
moyenne de l'ordre de 3 pour une loi normale.
2) La probabilit prcdente tant suprieure 0,9973 , on peut donc considrer le
processus comme capable.

III Carte de contrle pour la moyenne

1) Drive systmatique d'un ct de la moyenne
a) On a la rptition de N expriences alatoires indpendantes, avec deux issues possibles
(A se ralise, avec la probabilit 0,5 , ou non), o Y associe ces N expriences, le nombre
de fois que A s'est ralis. Donc Y suit la loi B (N ; 0,5).
b) On a P(Y = N ) = 0,5
N
.
c) On a 0,5
N
0,01 N ln(0,01) / ln(0,5) soit N 6,64. Le plus petit N est donc 7.
On a 0,5
N
0,002 N ln(0,002) / ln(0,5) soit N 8,96. Le plus petit N est donc 9.
d) Il y a moins de 1% de chances que le processus soit sous contrle (avec = 39,9)
lorsqu'on observe 7 points conscutifs au-dessus de 39,9. La probabilit tombe moins de
2
0
/
00
dans le cas de 9 points conscutifs au-dessus de 39,9. Il y a donc lieu, dans ce dernier
cas, d'arrter la production, pour contrle.
On a, bien sr, des rgles analogues, pour l'observation de points conscutifs en-dessous
de39,9.

2) Limites de surveillance et d'acceptation
a) On sait, d'aprs le cours sur l'chantillonnage, que si X suit la loi N (39,9 ; 0,05) alors X
suit la loi normale N (39,9 ;
5
05 , 0
), soit un cart type d'environ 0,022 10
-3
prs.
b) On a P(39,857 X 39,943) 0,95 10
-2
prs.
c) On cherche h tel que 2(h/0,022) 1 0,998 d'o h 0,068 10
-3
prs.




104

T.P. Excel : LOI BINOMIALE ET INTERVALLE
DE CONFIANCE

On considre une production dont la frquence p
d'lments dfectueux est inconnue.
On prlve dans cette production un chantillon de
n = 10 pices et on observe la frquence f d'lments
dfectueux de cet chantillon, qui peut tre considr
comme prlev au hasard et avec remise.
On cherche estimer p par un intervalle de confiance
avec le coefficient de confiance de 95%, mais la taille
n de l'chantillon est trop petite pour pouvoir approcher par une loi normale la loi de la
variable alatoire F qui tout chantillon de taille n associe la frquence de ses lments
dfectueux.
I APPROCHE STATISTIQUE PAR SIMULATION
Dans un chantillon de taille n = 10 on observe 2 lments dfectueux. Donc f = 0,2.
On cherche, l'aide de f = 0,2 , donner une estimation de p par un intervalle de confiance
avec le coefficient de confiance 95%.
1 Simulation pour p connu
Imaginons d'abord que l'on connaisse la valeur de p, soit p = 0,05 par exemple, et simulons
1000 chantillons de taille 10.
Ouvrir un fichier Excel.
En A1 crire p et en B1 entrer la valeur 0,05.
En A2 crire f puis en B3 entrer la formule =ENT(ALEA()+$B$1)
Cliquer sur la cellule B3 et approcher le pointeur de la souris du coin infrieur droit. Quant
le pointeur se transforme en une croix noire, recopier vers la droite en gardant le bouton
gauche de la souris enfonc, jusqu'en K3. Les 1 obtenus indiquent les lments dfectueux
dans un premier chantillon de taille 10.
En A3 entrer la formule =SOMME(B3:K3)/10 qui donne la valeur de f pour cet
chantillon.
Slectionner les cellules de A3 K3 puis recopier vers le bas jusqu' la ligne 1002 pour
simuler 1000 chantillons.
Cliquer sur le 1 de la premire ligne puis sur l'icne Centrer.
Centrer de mme la colonne A.


En C1 crire f>=0,2 et entrer en D1 la formule =NB.SI(A3:A1002;">=0,2")/1000
p ?
Taille
n = 10
Frquence observe
f
Centrer

105
qui correspond la frquence des valeurs de f suprieures ou gales 0,2 sur les 1000
chantillons que vous avez simuls.
En E1 crire f<=0,2 puis entrer en F1 la formule donnant la frquence des valeurs de f
infrieures ou gales 0,2 sur les 1000 chantillons que vous avez simuls.

Complter la feuille rponse.
2 Recherche exprimentale d'un intervalle de confiance
En ralit p est inconnu et la frquence du seul chantillon prlev est f = 0,2.
A partir de la frquence de cet chantillon, nous allons dterminer les extrmits p
1
et p
2

de l'intervalle de confiance de p au coefficient de confiance 95% de la faon suivante :










Changer en B2 les valeurs de p de faon complter la feuille rponse.
II UTILISATION DE LA LOI BINOMIALE
1 Intervalle de confiance pour p avec f = 0,2
Cliquer sur l'onglet Feuil2.
Ecrire en A1 p, puis entrer en B1 sa
valeur, par exemple 0,01.
Ecrire en C1 f, puis entrer en D1 sa
valeur 0,2.
En A2 crire P(F>=f).

Soit F la variable alatoire qui associe tout chantillon de taille 10 la frquence f de ses
lments dfectueux. La variable alatoire 10F correspond au nombre d'lments
dfectueux de l'chantillon et suit la loi binomiale B (10, p).
On a P(F 0,2) = 1 P(F 0,1) = 1 P(10F 1).
En B2 entrer la formule =1 LOI.BINOMIALE(10*D1 1;10;B1;VRAI)
La valeur logique VRAI indique qu'il s'agit d'un calcul cumul.
En A3 crire P(F<=f) puis en B3 la formule =LOI.BINOMIALE(10*D1;10;B1;VRAI)

On va chercher dterminer la valeur p
1
de p telle que P(F 0,2) 0,025.
0 1 0,2
p
2
p
1
Valeurs de p pour lesquelles
f 0,2 dans moins de 2,5% des
cas
Valeurs de p pour lesquelles
f 0,2 dans moins de 2,5% des
cas

106



Cliquer dans la cellule B2 puis dans
le menu Outils choisir Valeur
cible puis complter la bote de
dialogue comme ci-contre.
Faire OK.
Recopier sur la feuille rponse la
valeur p
1
obtenue, arrondie 10
2

prs.




Dterminer la valeur p
2
de p telle que P(F 0,2) 0,025 en utilisant l'Outil Valeur
cible partir de la cellule B3.

Complter la feuille rponse.
2 Intervalle de confiance pour p avec f = 0,4
On suppose cette fois que l'chantillon prlev amne 4 lments dfectueux sur les 10
prlevs. Modifier la cellule D1 puis utiliser l'Outil Valeur cible

Complter la feuille rponse.

107

FEUILLE REPONSE
NOMS : .............................................................................................................

I APPROCHE STATISTIQUE PAR SIMULATION
1 Simulation pour p connu
Pour p = 0,05 quelle est, parmi les 1000 chantillons que vous avez simuls, la frquence
de ceux pour lesquels f 0,2 ? ........................................................................................................
En A2 remplacer la valeur de p par 0,01.
Pour p = 0,01 quelle est, parmi les 1000 chantillons que vous avez simuls, la frquence
de ceux pour lesquels f 0,2 ? ........................................................................................................
Effectuer d'autres simulations en appuyant sur la touche F9. Lorsque p = 0,01 a-t-on
beaucoup de chances d'observer sur un chantillon une frquence f = 0,2 ? ...................................
2 Recherche exprimentale d'un intervalle de confiance
En B1 entrer pour p la valeur 0,2 puis faire plusieurs fois F9.
p = 0,2 se situe-t-il avant ou aprs p
1
? .............................................................................................
...........................................................................................................................................................
Entrer en B1 pour p la valeur 0,03 puis 0,04 , faire plusieurs fois F9 puis cocher la rponse
apporte par vos simulations : u 0,03 p
1
u 0,03 p
1
u 0,04 p
1
u 0,04 p
1
.
Entrer en B1 pour p la valeur 0,54 puis 0,57 , faire plusieurs fois F9 puis cocher la rponse
apporte par vos simulations : u 0,54 p
2
u 0,54 p
2
u 0,57 p
2
u 0,57 p
2
.
II UTILISATION DE LA LOI BINOMIALE
1 Intervalle de confiance pour p avec f = 0,2
Indiquer l'intervalle de confiance [p
1
, p
2
] pour p avec le coefficient de confiance 95%
obtenu pour p partir de la valeur f = 0,2.
...........................................................................................................................................................
...........................................................................................................................................................
Le centre de cet intervalle est-il la frquence f = 0,2 de l'chantillon prlev ?
...........................................................................................................................................................
2 Intervalle de confiance pour p avec f = 0,4
Indiquer l'intervalle de confiance [p
1
, p
2
] pour p avec le coefficient de confiance 95%
obtenu pour p partir de la valeur f = 0,4.
...........................................................................................................................................................
...........................................................................................................................................................

108

Corrig du TP Excel
"ESTIMATION D'UNE FREQUENCE PAR UN INTERVALLE DE CONFIANCE
A L'AIDE D'UNE LOI BINOMIALE"

I APPROCHE STATISTIQUE PAR SIMULATION
1 Simulation pour p connu

Lorsque p = 0,01 on observe que l'on a f 0,2 dans moins de 1% des cas, ce qui rend peu
probable l'observation de f = 0,2.

2 Recherche exprimentale d'un intervalle de confiance




D'aprs ces simulations, on a, en observant la valeur de la cellule D1 par rapport 2,5% :
0,02 p
1
0,03.



D'aprs ces simulations, on a, en observant la valeur de la cellule F1 par rapport 2,5% :
0,54 p
2
0,57.

II UTILISATION DE LA LOI BINOMIALE
1 Intervalle de confiance pour p avec f = 0,2
On trouve [0,025 ; 0,556] comme intervalle de confiance de p avec le coefficient de
confiance 95% partir de f = 0,2.
La valeur observe f = 0,2 n'est pas le centre de cet intervalle.

2 Intervalle de confiance pour p avec f = 0,4
On trouve [0,122 ; 0,738] comme intervalle de confiance de p avec le coefficient de
confiance 95% partir de f = 0,4.


109



110

Annales du B.T.S. : ECHANTILLONNAGE ET
ESTIMATION

DISTRIBUTION D'ECHANTILLONNAGE D'UNE FREQUENCE

1 Analyses biologiques 1999


On dcide de construire un test qui, la suite des contrles sur un chantillon de 50 sportifs
prlev au hasard, permette de dcider si, au seuil de signification de 10 %, le pourcentage
de sportifs susceptibles d'tre contrls positifs est de p = 0,02.
Soit F la variable alatoire qui, tout chantillon alatoire (suppos non exhaustif) de 50
sportifs contrls, associe le pourcentage de sportifs contrls positivement.
On suppose que F, suit la loi normale N
|
|

\
|

n
p p
p
) 1 (
, o p = 0,02 et n = 50.
Dterminer, le rel positif a tel que P(p a F p + a) = 0,9.

DISTRIBUTION D'ECHANTILLONNAGE D'UNE MOYENNE

2 Construction navale 1998 (Carte de contrle aux moyennes)


Une entreprise produit en grande srie des bagues de verrouillage utilises pour la
fabrication de raccords rapides. Ces bagues, en alliages, sont obtenues sur une presse
automatique. Plusieurs outillages sont en service suivant les alliages utiliss et les
dimensions obtenir.
On suppose que la variable alatoire X qui, toute bague prleve au hasard dans la
fabrication de l'entreprise, associe son diamtre intrieur exprim en millimtres, suit la loi
normale de moyenne m = 24,20 et d'cart type = 0,045.

1 La procdure de contrle est base sur des prlvements intervalles rguliers,
d'chantillons de 20 bagues. La production est suffisamment importante pour qu'on puisse
assimiler un prlvement de 20 bagues un prlvement alatoire avec remise.
On nomme X la variable alatoire qui tout prlvement de 20 bagues associe la
moyenne des diamtres intrieurs des 20 bagues.
a - Quelle est la loi de probabilit suivie par X ?
Quels sont les paramtres de cette loi ?
b - Dterminer un intervalle [Ls
1
, Ls
2
] centr en m = 24,20 et tel que la variable
alatoire X prenne une valeur dans cet intervalle avec la probabilit 0,95.
(Les nombres Ls
1
et Ls
2
s'appellent les limites de surveillance).
c - Dterminer un intervalle [Lc
1
, Lc
2
] centr en m = 24,20 et tel que la variable alatoire
X prenne une valeur dans cet intervalle avec la probabilit 0,99.
Epreuves
corriges
de B.T.S.

111
(Les nombres Lc
1
et Lc
2
s'appellent les limites de contrle).

2 La procdure de contrle prvoit qu'aprs chaque prlvement, on mesure les diamtres
intrieurs des 20 bagues obtenues, on calcule leur moyenne x et
- si x n'appartient pas l'intervalle [Lc
1
, Lc
2
] on procde immdiatement aux rglages,
- si x appartient l'un des intervalles [Lc
1
, Ls
1
] ou [Ls
2
, Lc
2
] on prlve immdiatement
un autre chantillon (procdure d'alerte).
Sur un prlvement de 20 bagues, on obtient les mesures suivantes :

diamtre x
i
[24,09 ; 24,11] [24,11 ; 24,13] [24,13 ; 24,15] [24,15 ; 24,17] [24,17 ; 24,19]
effectif n
i
1 2 3 4 3
diamtre x
i
[24,19 ; 24,21] [24,21 ; 24,23] [24,23 ; 24,25] [24,25 ; 24,27] [24,27 ; 24,29]
effectif n
i
2 2 1 1 1

Quelle dcision doit-on prendre au vu de ce prlvement ?


3 D'aprs Groupement B 2000


Dans cette question, on veut contrler la moyenne de l'ensemble des diamtres, en mm,
des pieds de boulons constituant un stock trs important.

On note Y la variable alatoire qui, chaque boulon tir au hasard dans le stock, associe le
diamtre, en mm, de son pied.
La variable alatoire Y suit la loi normale de moyenne inconnue et d'cart type = 0,1.

On dsigne par Y la variable alatoire qui, chaque chantillon alatoire de 100 boulons
prlev dans un stock, associe la moyenne des diamtres des pieds de ces 100 boulons (le
stock est assez important pour que l'on puisse assimiler ces prlvements des tirages avec
remise).

a) Justifier que, sous l'hypothse que la moyenne de la variable alatoire Y est 10, la
variable alatoire Y suit la loi normale de moyenne 10 et d'cart type 0,01.

b) Dterminer le nombre rel positif h tel que P(10 h Y 10 + h) = 0,95.


4 Plastiques et composites 1998 (recherche de la taille de l'chantillon)


Un atelier produit en grande srie des pices cylindriques.
On dsigne par X la variable alatoire associant, chaque pice tire au hasard dans la
production, son diamtre x, en millimtres.
On suppose que X suit la loi normale de moyenne 12,50 et d'cart type 0,02.
On note X la variable alatoire qui, tout chantillon de n pices pris au hasard et avec
remise dans la production, associe la moyenne des diamtres des n pices.
On note P
n
la probabilit que cette variable alatoire X appartienne l'intervalle :
[12,495 ; 12,505].

112
On suppose n assez grand et on rappelle que dans ce cas X suit approximativement la loi
normale de moyenne 12,50 et d'cart type
n
,02 0
.
En utilisant cette loi, dterminer la taille minimale n de l'chantillon pour que la probabilit
P
n
soit suprieure ou gale 0,97.


5 Conception et ralisation de carrosseries 1998 (recherche de n)


Une machine perce un trou dans une patte de fixation de bouclier avant.
La variable alatoire qui, chaque patte de fixation associe le diamtre du trou mesur en
millimtres suit la loi normale de moyenne = 16,56 et d'cart type = 0,19.
On prlve dans la production un chantillon de taille n.

Calculer n pour que la moyenne des diamtres sur les pices prleves appartienne
l'intervalle [16,4 ; 16,72] avec la probabilit 0,95.



ESTIMATION D'UNE FREQUENCE

6 Informatique de gestion 1998


Dans un pays voisin, on doit bientt lire le prsident de la rpublique. Afin d'apprcier ses
chances, le candidat A fait procder un sondage un mois avant la date du scrutin.
On tire au hasard 900 personnes dans l'ensemble de tous les lecteurs (compte tenu du
nombre total d'lecteurs, le tirage peut tre assimil un tirage avec remise).
Sur ces 900 personnes, 435 ont dclar voter pour le candidat A.
1 Donner une estimation ponctuelle, 10
2
prs, de la proportion p d'lecteurs favorables
au candidat A.
2 On note F
n
la variable alatoire qui, tout chantillon de n lecteurs, associe la
proportion p
n
d'lecteurs favorables A. (On sait que F
n
, suit approximativement une loi
normale de moyenne p et d'cart type
n
p p ) 1 (
).
On considre alors le sondage prcdent (n = 900 et 435 personnes sur 900 sont favorables
A). Donner, pour l'estimation de p, un intervalle de confiance avec le coefficient de
confiance 95 %. Les bornes de cet intervalle seront donnes 10
2
prs.
On sait que, dans ce cas, on commet une erreur faible en remplaant, dans l'cart type,
) p ( p 1 par ) p ( p
n n
1 .
3 Un organe de presse dsire publier le rsultat du sondage. Au vu des rsultats
prcdents, la diffusion de l'intervalle de confiance peut-elle intresser les lecteurs ?
Pourquoi ?


113


7 Constructions mtalliques 1999


Une socit fabrique des poutrelles mcaniques.
On cherche estimer le pourcentage p, inconnu, des poutrelles dfectueuses de la
production.
On admet que la variable alatoire F, qui, tout chantillon de 100 poutrelles prises au
hasard dans la production (prlvement assimil un tirage avec remise), associe le
pourcentage de poutrelles dfectueuses de cet chantillon, suit la loi normale N (p,
n
p p ) 1 (
)
On prlve un tel chantillon dans la production. On constate qu'il contient 3 poutrelles
dfectueuses parmi les 100.

1) Donner, partir de cet chantillon, une estimation ponctuelle f du pourcentage p.

2) Dterminer une estimation de p par un intervalle de confiance centr en f avec un
coefficient de confiance gal 90 %. Pour les bornes de cet intervalle, on donnera des
valeurs approches comportant deux dcimales.


8 Opticien lunetier 1999


Un opticien vend beaucoup d'appareils photographiques.
L'opticien s'intresse aux appareils autofocus avec zoom. Il veut estimer par un intervalle
de confiance le pourcentage p d'acheteurs d'appareils autofocus avec zoom dans sa
clientle.

1) Dans un chantillon de 100 clients, 60 achtent un tel appareil.
a) Donner l'estimation ponctuelle de p fournie par cet chantillon.
b) Donner une estimation de p par un intervalle de confiance avec le coefficient de
confiance 95 %.

2)Dterminer la taille n, n tant suprieur 30, d'un chantillon de clients pour qu'un
intervalle de confiance de p, centr sur l'estimation ponctuelle trouve prcdemment soit
[0,557 ; 0,643] avec le coefficient de confiance 90 %.

ESTIMATION D'UNE MOYENNE

9 Groupement C 2000 (cart type connu)


On s'intresse au diamtre de pices d'un certain type fabriques dans une entreprise.
On admet que la variable alatoire X qui, chaque pice prleve au hasard, associe son
diamtre exprim en millimtres, suit une loi normale de moyenne 250 et d'cart type 2.

114
Aprs un certain temps de fonctionnement de la machine, pour vrifier le bien fond de
l'hypothse prcdente, on s'intresse la moyenne des diamtres des pices produites.
Pour cela, on tudie un chantillon de 100 pices prises au hasard et avec remise dans la
production.
La moyenne x des diamtres des pices de cet chantillon est gale 249,7.
On suppose que la variable alatoire X qui, tout chantillon de 100 pices prleves au
hasard et avec remise, associe la moyenne des diamtres de ces pices suit une loi normale
de moyenne inconnue et d'cart type
100
2
.
Au vu de l'chantillon, dterminer un intervalle de confiance centr en x de la moyenne
avec le coefficient de confiance 95%.


10 Groupement D 1999 (estimation ponctuelle de l'cart type)


Une entreprise fabrique des pots de peinture.
Elle les fait livrer habituellement par lots de 20 pots ou de 100 pots. On se propose
d'tudier les variations de la quantit d'un certain produit A contenu dans chaque pot.
On a contrl le dosage du produit A la sortie de deux chanes de fabrication.
Deux chantillons de 100 pots ont t analyss ; l'un provient de la chane n l, l'autre de la
chane n2.
Le tableau suivant donne la rpartition de l'chantillon de la chane n l en fonction de la
masse de produit A exprime en grammes.

m (en g) [100, 102[ [102, 104[ [104, 106[ [106, 108[ [108, 110[ [110, 112[ [112, 114[ [114, 116[
Effectifs 1 3 25 32 27 6 4 2

On donne des valeurs approches de la moyenne m
2
et de l'cart type s
2
de l'chantillon
fabriqu par la chane n 2 : m
2
= 107 et s
2
= 2 (en grammes).
Dans les questions 1 et 2 les valeurs seront arrondies au dixime le plus proche.

l En prenant les centres des classes, calculer une valeur approche de la moyenne m
l
et de
l'cart type s
1
de l'chantillon issu de la chane n l.

2 En considrant les rsultats obtenus dans la premire question, donner les estimations
ponctuelles :
- des quantits moyennes
1
et
2
de produit A pour les productions de ces deux chanes,
- des carts types
1
et
2
correspondants.


11 Chimiste 1999 (estimation ponctuelle de l'cart type)


Deux laboratoires A et B fabriquent des tubes essai et les conditionnent dans des paquets.
Tous les paquets contiennent le mme nombre de tubes.

1. On note X
1
la variable alatoire prenant pour valeur le nombre de tubes dfectueux par
paquet provenant de l'entreprise A. Sur un chantillon alatoire de 49 paquets provenant du
laboratoire A les nombres des tubes dfectueux par paquet sont les suivants :


115
7 5 5 4 4 4 9 7 9 2 7 8 7 8 4
4 9 10 5 10 6 4 5 6 1 2 5 7 8 0
6 0 1 5 2 0 5 2 3 3 4 1 3 10 1
0 10 2 7

Calculer une valeur approche 10
2
prs de la moyenne m
1
et de l'cart type s
1
de cet
chantillon. On admet dans la suite de cet exercice qu'une estimation ponctuelle
1
de la
moyenne
1
de la variable alatoire X
1
est 4,84 et qu'une estimation ponctuelle
1
de
l'cart type
1
de X
1
est 2,99.

2. On note X
2
la variable alatoire prenant pour valeur le nombre de tubes dfectueux par
paquet provenant de l'entreprise B. Sur un chantillon alatoire de 64 paquets provenant de
l'entreprise B on a obtenu une moyenne m
2
de 3,88 tubes dfectueux et un cart type s
2
de
1,45.
En dduire une estimation ponctuelle
2
de la moyenne
2
de la variable alatoire X
2
et
une estimation ponctuelle
2
de l'cart type
2
de X
2
.


12 Groupement B 1999 (cart type connu)


Une entreprise de matriel pour l'industrie produit des modules constitus de deux types de
pices : P
1
et P
2
.
Dans cette question on s'intresse au diamtre des pices P
2
.
Soit X la variable alatoire qui, tout chantillon de 60 pices P
2
prleves au dans la
production de la journe considre, associe la moyenne des diamtres des pices de cet
chantillon.
La production est assez importante pour qu'on puisse assimiler tout prlvement un tirage
avec remise.
On suppose que X suit la loi normale de moyenne et d'cart type
60

avec = 0,084.
On mesure le diamtre, exprim en centimtres, de chacune des 60 pices P
2
d'un
chantillon choisi au hasard et avec remise dans la production d'une journe.
On constate que la valeur approche arrondie 10
3
prs de la moyenne x de cet
chantillon est x = 4,012.

a) A partir des informations portant sur cet chantillon, donner une estimation ponctuelle,
10
3
prs, de la moyenne du diamtre des pices P
2
produites pendant cette journe.

b) Dterminer un intervalle de confiance centr en x de la moyenne des diamtres des
pices P
2
produites pendant la journe considre, avec le coefficient de confiance 95%.

c) On considre l'affirmation suivante : "la moyenne est obligatoirement entre 3,991 et
4,033". Peut-on dduire de ce qui prcde qu'elle est vraie ?


116

13 Btiment 1998 (cart type inconnu)


Une usine adhrente de "l'ADETS" (Association pour le dveloppement du treillis soud)
fabrique en grande srie diffrents types de treillis souds pour la construction.
L'usine produit des fils de 6 mtres de long utiliss pour la fabrication de panneaux de
treillis soud de type "903".
On mesure le diamtre exprim en millimtres de chacun des 40 fils d'un chantillon choisi
au hasard et avec remise dans la production d'une journe.
On constate que les valeurs approches arrondies, 10
- 3
prs, de la moyenne x et de
l'cart type s des diamtres pour cet chantillon sont x = 3,512 et s = 0,095.

1 Proposer une estimation ponctuelle, 10
3
prs, de la moyenne et de l'cart type
du diamtre des fils produits pendant cette journe.

2 Soit X la variable alatoire qui, tout chantillon de taille n = 40 prlev au hasard et
avec remise, associe la moyenne des diamtres des fils de cet chantillon. On suppose que
X suit la loi normale N ( ,
40

). On prend pour valeur de l'estimation ponctuelle


obtenue au 1.
a) Dterminer un intervalle de confiance centr en x de la moyenne de la population,
avec le coefficient de confiance 95 % .
b) Le nombre appartient-il l'intervalle de confiance obtenu au a) ? Expliquer.
Le nombre a-t-il plus de chances d'tre infrieur x que d'tre suprieur x ?
Expliquer.


14 Opticien lunetier 2000


On s'intresse la longueur de l'ensemble des pices produites par une machine le 6
octobre 1999. Elles sont assembles par lots de 50. Un lot pris au hasard est considr
comme un chantillon de la fabrication. Le tableau suivant dcrit la distribution des
longueurs des pices de ce lot.


Longueur des pices* Nombre de pices
[107 ; 108[ 1
[108 ; 109[ 6
[109 ; 110[ 14
[110; 111[ 20
[111 ; 112[ 9

*exprime en mm

1 . On suppose que la longueur d'une pice est gale la valeur centrale de la classe dans
laquelle elle est rpertorie. Calculer la moyenne x des longueurs des pices de
l'chantillon, ainsi que son cart type s . On retiendra pour x et s leurs valeurs arrondies
au centime. Le dtail des calculs n'est pas demand.

117

2. Dduire des rsultats obtenus la question prcdente, une estimation ponctuelle de la
moyenne des longueurs des pices de la fabrication.

3. On admet que la variable alatoire L qui, chaque chantillon de 50 pices, associe la
moyenne des longueurs de pices de cet chantillon, suit la loi normale N ( ,
50
1
).
Estimer par un intervalle de confiance la moyenne des longueurs des pices de la
fabrication avec le coefficient de confiance 0,9.


15 Productique textile 1999


Dans les parties A et B on tudie la charge de rupture d'un fil de "soie discontinue" stock
sur un enrouleur.

A) Pour cette partie, les valeurs numriques seront arrondies au millime.

On a fait un essai dynamomtrique sur un fil de soie discontinue stock sur un enrouleur.
Les 12 prouvettes de fil lestes sont prleves au hasard sur la partie extrieure de
l'enroulement.
On a obtenu les rsultats suivant :

numro de l'prouvette 1 2 3 4 5 6 7 8 9 10 11 12
charge de rupture en newtons 2,4 2,4 2,1 2,4 2,3 2,3 1,8 2,3 2,5 2,1 1,9 2,1

On note X la variable alatoire qui, chaque prouvette prleve au hasard sur la partie
extrieure de l'enroulement, associe la charge de rupture en newtons de cette prouvette.
Dduire, du tableau ci-dessus, une estimation ponctuelle de l'esprance mathmatique et
de l'cart type de la variable alatoire X.

B) 1) Une autre srie de 35 mesures dynamomtriques d'prouvettes prleves au hasard
sur le fond de l'enroulement et exprimes en newtons a donn les rsultats suivants
regroups par classes de mme amplitude :

classes [1,6 ; 1,7] ]1,7 ; 1,8] ]1,8 ; 1,9] ]1,9 ; 2,0] ]2,0 ; 2,1] ]2,1 ; 2,2] ]2,2 ; 2,3] ]2,3 ; 2,4]
effectifs 2 3 5 9 8 4 3 1

Calculer la moyenne y de l'chantillon des 35 prouvettes.

2) On note Y la variable alatoire qui, chaque prouvette prleve au hasard sur le fond
de l'enroulement, associe la charge de rupture, exprime en newtons, de cette prouvette.
On note respectivement
1
et
1
la moyenne et l'cart type de la variable alatoire Y.
On note Y la variable alatoire qui, tout chantillon de taille 35 prlev au hasard dans le
fond de l'enroulement (tirage assimil un tirage avec remise), associe la moyenne des 35
prouvettes prleves.
On admet que la variable alatoire Y suit la loi normale N (
1
;
35
1

).
On suppose
1
connu :
1
= 0,17.

118
Dterminer un intervalle de confiance au niveau 99% de la moyenne
1
de la charge de
rupture d'une prouvette prleve au fond de l'enroulement.




16 Agro-quipement 1999


9 agro-equipement 99

Un atelier fabrique des joints d'un certain modle, utiliss dans la construction de moteurs.
Dans cet exercice on s'intresse la dure de vie de tels joints pendant l'tat de marche
d'un moteur.
On prlve au hasard, dans l'ensemble des joints fabriqus, un chantillon de 64 units. La
mesure de la dure de vie des joints de cet chantillon a fourni les rsultats suivants :

Dure de vie en heures [500 ; 900[ [900 ; 1100[ [1100 ; 1300[ [1300 ; 1500[ [1500 ; 1700[ [1700 ; 2100[
Nombre de joints 2 9 13 25 11 4

1) On fait l'approximation suivante : dans chaque classe, tous les lments son placs au
centre de la classe. Calculer alors la moyenne et l'cart type de cette srie statistique
(donner la valeur exacte de la moyenne et une valeur approche 10
1
prs de l'cart
type).

2) On s'intresse maintenant l'ensemble des joints fabriqus ; leurs dures de vie
constitue une srie statistique de moyenne inconnue et d'cart type estim 260
heures.

On dsigne par X la variable alatoire qui, tout chantillon de 64 joints, prlev au
hasard dans la production, associe la moyenne des dures de vie de ces joints. Ce tirage
peut tre assimil un tirage avec remise.
On rappelle que X suit la loi normale N ( ,
64
260
).
En utilisant l'chantillon prcdent, dterminer un intervalle de confiance, pour la moyenne
relative l'ensemble des joints, avec le coefficient de confiance 95 %.


17 Chimiste 2000


Dans la fabrication de comprims effervescents, il est prvu que chaque comprim doit
contenir 1625 mg de bicarbonate de sodium. Afin de contrler la fabrication de ces
mdicaments, on a prlev un chantillon de 150 comprims et on a mesur la quantit de
bicarbonate de sodium pour chacun d'eux. Les rsultats obtenus sont rsums dans le
tableau suivant :

Classes [1610, 1615[ [1615, 1620[ [1620, 1625[ [1625, 1630[ [1630, 1635[
Effectifs 7 8 42 75 18


119
1) En convenant que les valeurs mesures sont regroupes au centre de chaque classe,
calculer une valeur approche 10
2
prs de la moyenne x et de l'cart type s de cet
chantillon.

2) A partir des rsultats obtenus pour cet chantillon, assimil un chantillon non
exhaustif, donner les estimations ponctuelles et de la moyenne et de l'cart type
de la quantit de bicarbonate de sodium dans la population (forme de l'ensemble de tous
les comprims fabriqus et suppose trs grande).

Dans la question suivante on prendra pour valeur de son estimation .

3) On appelle X la variable alatoire qui, tout chantillon de taille n = 150 associe la
quantit moyenne de bicarbonate de sodium de cet chantillon.

a) La loi de X peut-elle tre approche par une loi classique ? Si oui, laquelle ? Donner
ses paramtres ?

b) Dterminer un intervalle de confiance de la quantit moyenne de bicarbonate de sodium
dans la population avec le coefficient de confiance 95 %.

Calculer l'amplitude de cet intervalle et interprter le rsultat.

c) Quelle devrait tre la taille minimum de l'chantillon prlev pour connatre avec le
coefficient de confiance 95 % la quantit moyenne de bicarbonate de sodium dans la
population 1 mg prs


18 Groupement D 2000 ( inconnu et "petite" taille ! Recherche du seuil)


On tudie le rsultat de la pese d'un objet de masse m (exprime en grammes).

On admet que la variable alatoire X qui prend comme valeurs les rsultats (exprims en
grammes) de la pese d'un mme objet donn suit la loi normale de moyenne et d'cart
type ..

PARTIE B
Dans cette partie, on suppose que et sont inconnus.
On a relev dans le tableau suivant les rsultats de 10 peses d'un mme objet :

masse en grammes 72,20 72,24 72,26 72,30 72,36 72,39 72,42 72,48 72,50 72,54

Les rsultats seront arrondis au centime le plus proche.

1) Calculer la moyenne et l'cart type de cet chantillon.

2) En dduire des estimations ponctuelles de la moyenne et d'cart type de la variable
X.


120
3) Dans la suite, on admet que la variable alatoire qui tout chantillon de 10 peses
associe la moyenne de ces peses suit une loi normale. En prenant pour cart type la valeur
estime en 2), donner un intervalle de confiance au seuil de 5% de la moyenne .

4) L'cart type de l'appareil de pese, mesur partir de nombreuses tudes antrieures, est
en ralit, pour un objet ayant environ cette masse, de 0,08. Dans cette question, on prend
donc = 0,08

Donner un intervalle de confiance au seuil de 5 % de la moyenne .
Dterminer ( l'unit prs) pour que au seuil de %, un intervalle de confiance de soit
[72,31 ; 72,43].

* Remarque : Le programme des STS exclut l'tude d'chantillons de taille infrieure 30
lorsque l'cart type est inconnu (l'utilisation de la loi de Student est alors prfrable ! ).


121

Corrig des exercices d'preuves de B.T.S.

1 Analyses biologiques 99

On appelle F la variable alatoire qui, tout
chantillon de 50, associe le pourcentage de sportifs
contrls positivement.
On admet que sous l'hypothse p = 0,02, F suit la
loi normale N
|
|

\
|

n
p p
p
) 1 (
, o p = 0,02
et n = 50.
Donc F suit N (0,02 ; 0,0198).
On pose T =
0198 , 0
02 , 0 F
alors T suit la loi normale
centre rduite.
Cherchons un rel a positif tel que :
P(0,02 a F 0,02 + a) = 0,9 ,
P(
0198 , 0
a
T
0198 , 0
a
) = 0,9
2 P(T
0198 , 0
a
) 1 = 0,9 ,
P(T
0198 , 0
a
) = 0,95 ,
Par lecture inverse de la table de la loi normale
centre rduite on a
0198 , 0
a
= 1,645
donc a = 1,645 0,0198, a = 0,0326.
Remarque : n'tant pas dans les conditions
habituelles d'approximation de la loi binomiale par
la loi normale (np > 5), celle-ci semble peu
adquate.

2 Construction navale 98

1 La variable alatoire X suit la loi normale de
moyenne 24,20 et d'cart type 0,045, nous savons
que la variable X suit alors la loi normale de
moyenne
E( X ) = 24,20 et d'cart type
' =
5 2
045 0,
0,01006 donc ' = 0,01 10
4
prs.
2 La variable alatoire X suit la loi normale
N (24,2 ; 0,01), la variable alatoire T =
01 0
2 24
,
, X

suit la loi normale centre rduite N (0, 1).
P(24,2 a X 24,2 + a) = 0,95 quivaut
P(
0,01
a
T
0,01
a
) = 0,95 et
2 (
0,01
a
) 1 = 0,95 et
0,01
a
= 1,96 ,
a = 0,0196, [Ls
1
,Ls
2
] [24,180, 24,220].

2 P(
0,01
a
T
0,01
a
) = 0,99 et
2 (
0,01
a
) 1 = 0,99 et
0,01
a
= 2,575 ,
a = 0,02575 [Lc
1
, Lc
2
] [24,174, 24,226].

3 On trouve avec une calculatrice x = 24,178,
x [Lc
1
, Ls
1
] donc on doit prlever immdiatement
un autre chantillon.

3 Groupement B 2000

1 Si Y suit la loi normale N (10 ; 0,1) ; la variable
alatoire Y suit la loi normale N (10 ;
100
1 , 0
),
donc Y suit la loi normale N (10 ; 0,01) .

2 Y suit la loi normale N (10 ; 0,01) donc la
variable alatoire U =
01 , 0
10 Y
suit la loi normale
centre, rduite N (0, 1).
P(10 h Y 10 + h) =
P(
01 , 0
10 10 h
Y
01 , 0
10 10 + h
),
P(10 h Y 10 + h) = P(
01 , 0
h
Y
01 , 0
h
),
P(10 h Y 10 + h) = 2 (
01 , 0
h
) 1
P(10 h Y 10 + h) = 0,95 si et seulement si
2 (
01 , 0
h
) 1 = 0,95 qui est quivalent
(
01 , 0
h
) = 0,975, ((1,96) = 0,975
donc
01 , 0
h
= 1,96 , h = 0,0196, h 2.

4 Plastiques et composites 98
La variable alatoire X qui, tout chantillon
alatoire non exhaustif de taille n associe sa
moyenne, suit la loi normale N (12,5 ;
n
,02 0
),

122
la variable alatoire
n
,
, X
T
02 0
5 12
= suit la loi
normale centre rduite N (0,1).
P(12,495 X 12,505) 0,97 quivaut
97 0
02 0
005 0
02 0
005 0
P , ) n
,
,
T n
,
,
( et
985 0 25 0 , ) n , ( , 17 2 25 0 , n , d'o
n
25 0
17 2
,
,
, n 8,68,
n 75,34, la valeur minimale de n est donc 76.

5 Conception et ralisation de carrosseries
98
La variable alatoire X suit la loi normale
N (16,56 ; 0,19). La variable alatoire X qui,
tout chantillon alatoire non exhaustif de taille n
associe sa moyenne, suit la loi normale
N (16,56 ;
n
,19 0
), la variable alatoire
n
,
, X
T
19 0
56 16
= suit la loi normale centre
rduite N (0,1).
P(16,4 X 16,72) = 0,95 quivaut
95 0
19 0
16 0
19 0
16 0
P , ) n
,
,
T n
,
,
( = et
95 0 1
19 0
16 0
2 , ) n
,
,
( = et
975 0
19 0
16 0
, ) n
,
,
( = ,
96 1
19 0
16 0
, n
,
,
= d'o
n =
16 0
19 0 96 1
,
, ,
, n 2,33
n = 5,41, la valeur minimale de n est donc 6.

6 Informatique de gestion 1998

1 Une estimation ponctuelle de p est
900
435

frquence obtenue dans l'chantillon prlev, donc
p = 0,48 10
2
prs, une estimation ponctuelle
de ) p ( p 1 est ) , ( , 48 0 1 48 0 0,49959 d'o
une estimation ponctuelle de l'cart type 10
2

prs :
F

=
30
5 0,
,
F

= 0,017

10
3
prs .
2 Un intervalle de confiance avec le coefficient de
confiance de 95% correspondant cet chantillon
est : [ f 1,96
F

; f + 1,96
F
] =
[
900
435
- 1,96 0,017 ;
900
435
+ 1,96 0,017].
On obtient [0,45 ; 0,52].

3 La partie la plus tendue de l'intervalle se trouve
infrieure 0,5 soit infrieure 50 %, on peut donc
estimer que le candidat A a peu de chance d'tre
lu.

7 Constructions mtalliques 99
a) Une estimation ponctuelle de p est f =
100
3
,
f = 0,03 pourcentage obtenu dans l'chantillon.

b) Une estimation par intervalle de confiance de p
avec le coefficient de confiance de 90%
correspondant cet chantillon est
approximativement :
[f t

n
) f ( f 1
, f + t

n
) f ( f 1
]
2 (t

) 1 = 0,90 quivaut (t

) =
2
90 , 1
,
t

= 1,645 , f = 0,03 et n = 100. On obtient :


[0,031,645
100
97 , 0 03 0 ,
; 0,03+1,645
100
97 , 0 03 0 ,
],
I
c
= [0,00 ; 0,06] 10
2
prs .
Remarque : la condition d'approximation nf > 5
n'tant pas vrifie, on peut plutt consulter
l'abaque de la page 75 qui fournit pour n = 100 et
f = 0,3 , l'intervalle : [0,005 ; 0,08].

8 Opticien lunetier 1999
1) a) Le pourcentage de clients est f =
100
60
,
f = 0,6. Une estimation ponctuelle de p est 0,06.

b) Une estimation par intervalle de confiance de p
avec le coefficient de confiance de 95%
correspondant cet chantillon est
approximativement :
[f t

n
) f ( f 1
, f + t

n
) f ( f 1
]
2 (t

) 1 = 0,95 quivaut (t

) =
2
95 , 1
,
t

= 1,96 , f = 0,6 et n = 100. On obtient :


[0,6 1,96
100
4 , 0 6 0 ,
; 0,6 + 1,96
100
4 , 0 6 0 ,
],
I
c
= [0,504 ; 0,696] 10
3
prs .

2) Si on conserve 0,6 comme valeur de f et comme
estimation de p, un intervalle de confiance de p

123
avec le coefficient de confiance de 90 %
correspondant un chantillon de taille n est :
I
c
= [0,6 1,645
n
4 , 0 6 , 0
; 0,6 + 1,645
n
4 , 0 6 , 0
], si
cet intervalle est gal [ 0,557 ; 0,643 ] alors
0,643 0,557 = 2 1,645
n
24 , 0
,

n =
086 , 0
24 , 0 645 , 1 2
, n 18,74 ,
n = 351 .

9 Groupement C 2000

On dsigne par X la variable alatoire qui tout
chantillon non exhaustif de 100 pices associe la
moyenne des diamtres de ces 100 pices,
X suit la loi normale N ( ;
100
2
).
I = [ x t
100
2
, x + t
100
2
] o x est la moyenne
d'un chantillon alatoire non exhaustif.
Si le coefficient de confiance est 2 (t) 1 = 0,95,
alors (t) = 0,975 et t 1,96.

I = [249,7 1,96 0,2 ; 249,7 + 1,96 0,2],

I = [249,308 ; 250,092] 10
3
prs.

10 GROUPEMENT D 99

1 Avec une calculatrice on obtient, en grammes
m
1
= 107,5 et s
1
= 2,5

2 a) Pour estimation de la moyenne de la
population on prend la moyenne m de l'chantillon,
donc
1
et
2
sont estims respectivement par
107,5 et 107.

b) Pour estimation ponctuelle de l'cart type de la
population on prend s
1 n
n
donc

1
est estim par 2,5
99
100
,
1
2,5 et

2
est estim par 2
99
100
,
2
2.

11 - CHIMISTE 99

1. m
1
= 4,84 ; s
1

= 2,96 10
2
prs.

2. m
2
= 3,88 ; s
2

= 1,45 alors
2
est estim par
2
= 3,88 et
2
par
2
1,46.

12 GROUPEMENT B 99

a) Pour estimation de la moyenne de la
population on prend la moyenne x de l'chantillon,
donc on estime par 4,012 10
3
prs.

b) La variable alatoire X suit la loi normale
N (,
n

) ; donc la variable alatoire


n
X


suit
la loi normale centre, rduite N (0, 1).
L'intervalle [ x 1,96
n

; x + 1,96
n

] est, par
dfinition, l'intervalle de confiance de la moyenne
de la population avec le coefficient de confiance
95 %. D'aprs a) x = 4,012 ; = 0,084 ; n = 60.
Avec ces valeurs numriques, l'intervalle de
confiance de avec le coefficient de confiance
95% est [3,991 ; 4,033].
c) D'aprs l'approche frquentiste des probabilits,
si on prlevait un trs grand nombre de tels
chantillons, environ 95 pour 100 d'entre eux
contiendraient la moyenne inconnue de la
population. En fait on n'en prlve qu'un seul et on
ne peut pas savoir si celui-ci contient ou non le
nombre , mais la mthode mise en uvre permet
d'obtenir un intervalle contenant dans 95 cas sur
100 donc, la moyenne n'appartient pas
ncessairement l'intervalle de confiance.

13 BTIMENT 98
1 estim par x = 3,512 ,
estim par s
39
40
= 0,096 10
3
prs.

2 a) Un intervalle de confiance de la moyenne de
la population est
[ x 1,96
n

; x + 1,96
n

] = [3,482 ; 5,542].
b) D'aprs l'approche frquentiste des probabilits
si on prlevait un trs grand nombre d'chantillons,
environ 95 % d'entre eux contiendraient la moyenne
inconnue .
En fait on n'en prlve qu'un seul et on ne peut pas
savoir si celui-ci contient ou non le nombre .

c) On ne peut galement savoir si a plus de
chances de se trouver prs du centre que d'une
extrmit de cet intervalle.

14 OPTICIEN LUNETIER 2000
1. La calculatrice donne pour moyenne et cart type
de l'chantillon : x = 110,1 et s

0,9798.
A 10
2
prs on a x = 110,1 et s

0,98.

124

2. Une estimation ponctuelle de la moyenne est
= x = 110,1

3. Une estimation par intervalle de confiance de
avec le coefficient de confiance de 90%
correspondant cet chantillon est
approximativement :
I = [ x t


50
1
; x + t

50
1
] avec x = 110,1
2 (t

) 1 = 0,90 quivaut (t

) =
2
90 , 1
,
t

= 1,645 d'o l'intervalle :


I = [110,1 1,645
50
1
; 110,1 + 1,645
50
1
],
I = [ 109,87 ; 110,33]

15 PRODUCTIQUE TEXTILE 99
A) La calculatrice donne, 10
3

prs, pour
moyenne et cart type de l'chantillon x = 2,217 et
s

= 0,207.
Une estimation ponctuelle de la moyenne est
= x = 2,22 une estimation ponctuelle de l'cart
type est 0,207
11
12
soit = 0,22 10
2
prs.

B) 1) La moyenne de l'chantillon de 35
prouvettes est y = 1,99 10
2
prs.
2) Une estimation ponctuelle de la moyenne
1
de
la variable alatoire Y est 1,99.
Si le coefficient de confiance est 2 (t) 1 = 0,99,
alors (t) = 0,995 et t 2,575.
On donne
1
= 0,17 avec y = 1,99 et n = 35 , on
obtient : [1,99 2,575
35
17 , 0
; 1,99 + 2,575
35
17 , 0
] .
Donc un intervalle de confiance de avec le
coefficient de confiance 95 % est [1,91 ; 2,06] .

16 AGRO-EQUIPEMENT 99

1) La calculatrice donne pour moyenne et cart type
de l'chantillon : x = 1346,875 et s

= 256,2
10
1

prs.

2) On rappelle que X suit une loi normale de
moyenne inconnue et d'cart type
64
260

Si le coefficient de confiance est 2 (t) 1 = 0,95,
alors (t) = 0,975 et t 1,96.
I = [ x - t
n

, x + t
n

] o x est la moyenne d'un


chantillon alatoire non exhaustif, n la taille de
l'chantillon et l'cart type de la population.
I = [1346,875 1,96
8
260
; 1346,875 + 1,96
8
260
],
I = [1283,15 ; 1410,55] 10
2
prs.





17 CHIMISTE 2000

1) La calculatrice donne, 10
2

prs, pour
moyenne et cart type de l'chantillon x = 1625,47
et s

= 4,66.

2) Une estimation ponctuelle de la moyenne est
= x = 1625,47 une estimation ponctuelle de
l'cart type est 4,66
149
150
soit 10
2
prs
= 4,67.

3) a) La variable alatoire X suit la loi normale
N (,
n

) avec inconnu et l'cart type estim


10
2
prs par = 4,67 d'o X suit
approximativement la loi normale N (,
150
67 , 4
)
soit la loi normale N (, 0,38).

b) Un intervalle de confiance de la moyenne est
I = [ x t 0,38 , x + t 0,38] o x est la moyenne
d'un chantillon alatoire non exhaustif.
Si le coefficient de confiance est 2 (t) 1 = 0,95,
alors (t) = 0,975 et t 1,96.
I = [1625,47 1,96 0,38 ; 1625,47 + 1,96 0,38],

I = [1624,72 ; 1626,22] 10
2
prs.
L'amplitude de l'intervalle est 2 1,96 0,38 1,5
pour diminuer cette amplitude il faut augmenter la
taille des chantillons.

c) Si l'amplitude de l'intervalle de confiance est 1
alors 2 1,96
n
67 , 4
= 1 ,
n 2 1,96 4,67 ,

n = 356.

18 GROUPEMENT D 2000

B 1 La calculatrice donne la moyenne de
l'chantillon x 72,369 soit x= 72,37 10
2
prs
et l'cart type de l'chantillon s 0,11121 soit
s = 0,11 10
2
prs.


125
2 Une estimation ponctuelle de la moyenne de la
population est 72,37.
Une estimation ponctuelle de l'cart type de la
population est
9
10
1112 , 0 0,1172 soit
0,12 10
2
prs.

3 Un intervalle de confiance de la moyenne est :
I = [ x t
10
12 , 0
, x + t
10
12 , 0
] o x est la moyenne
d'un chantillon alatoire non exhaustif.
Si le coefficient de confiance est
2 (t) 1 = 0,95, alors (t) = 0,975 et t 1,96.
I = [72,37 1,96
10
12 , 0
, 72,37 + 1,96
10
12 , 0
],
I = [72,30 ; 72,44] 10
2
prs.
4) Si I = [72,31 ; 72,43] on a t
10
08 , 0
= 0,06 d'o
08 , 0
10 06 , 0
= t , t 2,37 la table du formulaire donne
2(2,37) 1= 2 0,9911 1,
2(2,37) 1= 0,9822, donc une unit prs le
coefficient de confiance est 0,98. Au risque de 2%
un intervalle de confiance de est [72,31 ; 72,43].





TESTS D'HYPOTHESES
126
Supplment la sance n2
chantillonnage et estimation

CHANTILLONNAGE
Un exemple utile au citoyen : llection prsidentielle de
2002 (pisode 1)

Lattitude de lopinion vis vis des sondages est souvent sans nuance : on leur prte des
pouvoirs de prdiction quils nont pas (en omettant souvent de fournir les fourchettes )
et (ou) on dclare quils se trompent 9 fois sur 10.
On peut mettre en parallle le dernier sondage publi par BVA et effectu sur 1000
lecteurs (Jacques Chirac 19 %, Lionel Jospin 18 %, Jean-Marie Le Pen 14 %) avec le
rsultat du premier tour (Jacques Chirac 19,88 %, Lionel Jospin 16,18 %, Jean-Marie Le
Pen 16,86 %) et poser la question le sondage est-il faux ? .
Si le sondage avait la prtention de prvoir exactement les rsultats, ou ne serait-ce que
lordre des candidats, il serait bien sr faux. Mais cette prtention nest pas scientifique,
comme nous lapprend lobservation des fluctuations dchantillonnage.
Dans un sondage politique, tout se passe comme si on tirait au sort les 1000 lecteurs. En
fait, essentiellement parce quun vritable tirage au hasard revient trop cher (il est trs
coteux de devoir interroger prcisment la personne qui a t tire au sort et pas une
autre), on a recourt dautres mthodes, comme celle des quotas, mais avec une qualit
quivalente au tirage totalement alatoire.
Avec la mthode des quotas, il n'existe pas de loi mathmatique permettant de
dterminer la marge d'erreur d'un sondage, en pratique toutefois, on considre que la
marge d'erreur des sondages par quotas est gale, voire infrieure celle des sondages
alatoires.
Jean-Franois Doridot, directeur du dpartement opinion d'Ipsos Le Monde 17/03/02.
TESTS D'HYPOTHESES
127
On peut donc dire que dans la situation prcdente, simuler un sondage bien fait
consiste faire tourner 1000 fois une roue de loterie partage en quatre secteurs de 20 %
(Jacques Chirac), 16 % (Lionel Jospin), 17 % (Jean-Marie Le Pen) et 47 % (autres
candidats) correspondant ltat de lopinion le jour de llection.


La simulation dune telle roue de loterie est facile mettre en place avec un tableur.
Le gnrateur de nombres alatoires fournit un nombre au hasard dans lintervalle
[0, 1[. Il suffit alors de partager cet intervalle proportionnellement aux pourcentages des
secteurs de la roue de loterie, ce qui peut tre demand aux lves.
Ainsi, linstruction =ALEA() entre en cellule A1
et linstruction =SI(A1<=0,2;"Chirac";SI(A1<=0,36;"Jospin";SI(A1<=0,53;"LePen";"Autre")))
entre en cellule B1 simule le sondage dun lecteur.
Il suffit de recopier ces instructions 1000 fois vers le bas pour simuler un sondage de 1000
personnes puis 100 fois vers la droite pour simuler 100 sondages.

Chirac
20%
Jospin
16%
Le Pen
17%
Autres
47%
TESTS D'HYPOTHESES
128

Dune certaine faon tous ces sondages sont corrects et lobservation du nuage de
points correspondant aux frquences des trois candidats sur 100 sondages suffit prendre
conscience des fluctuations dues au hasard.

TESTS D'HYPOTHESES
129

ESTIMATION
1 Un exemple utile au citoyen : llection prsidentielle de
2002 (pisode 2)

On reprend lexemple du premier tour de 2002.
Sur la simulation dun sondage de taille 1000 le jour de llection ( sorti des urnes ), on
peut calculer les intervalles de confiance 95 % pour chacun des trois candidats :

On peut reprsenter ces trois intervalles de confiance en utilisant le diagramme boursier
du tableur. Il faut pour cela avoir, dans cet ordre, la borne infrieure, la borne suprieure et
le centre de lintervalle de confiance.
Sur limage dcran suivante, on a dabord entr en E5 la formule
=NB.SI(B2:B1001;"C")/1000 puis en E3 la formule
=E5-1,96*RACINE(E5*(1-E5)/1000) et en E4 la formule
=E5+1,96*RACINE(E5*(1-E5)/1000) .



TESTS D'HYPOTHESES
130

En faisant F9, on obtient un autre sondage.

TESTS D'HYPOTHESES
131
On peut galement, pour un seul candidat, reprsenter simultanment les intervalles de
confiances calculs sur 100 sondages, ci-dessous dans le cas de Lionel Jospin.

On constate alors quenviron 95 % de ces intervalles de confiance recouvrent la valeur
obtenue par le candidat le jour de llection : pour Lionel Jospin, environ 95 % des
intervalles de confiance coupent la droite dquation y = 0,16.
TESTS D'HYPOTHESES
132

Simulation d'une distribution continue par
inversion de sa fonction de rpartition

Cette mthode est gnrale et elle est praticable lorsque lexpression analytique de la fonction
de rpartition est simple (cas de la loi exponentielle) ou que lon dispose dun moyen de
calcul approch (cas de la loi normale).
La mthode repose sur le rsultat suivant :

Si X est une variable alatoire relle, de fonction de rpartition F continue,
strictement croissante, alors la variable alatoire Y = F(X) est uniformment
distribue sur [0, 1].

Ainsi, si l'on tire n nombres au hasard r
i
, parmi des nombres uniformment rpartis sur [0, 1],
un chantillon de la distribution de X sera donn par F
1
(r
i
).

Distribution exponentielle
Une variable alatoire T de loi exponentielle de paramtre a une fonction de rpartition F
dfinie sur [0 , +[ par : F(t) = P(T t) =

t
t f
0
) ( dt =

t
0
e
t
dt = 1 e
t
.
Pour simuler les ralisations de T, il suffit, d'aprs la mthode prcdente, de calculer des
valeurs
1

ln(1 - r
i
) o les valeurs r
i
sont donnes par le gnrateur de nombres alatoires.
Et comme les nombres 1 - r
i
sont aussi uniformment distribus sur [0, 1], on peut dire que les
ralisations d'une variable alatoire suivant la loi exponentielle de paramtre sont simules
par l'instruction : = LN(ALEA()) / .
1
0
r
F
1
(r)
TESTS D'HYPOTHESES
133
Exemple : simulation de la loi E ( = 0,005) dont lesprance est 200
005 , 0
1
= .

Distribution normale
On peut accder sur le tableur la fonction de rpartition inverse F
1
dune variable alatoire
de loi normale de moyenne et dcart type par la fonction :
=LOI.NORMALE.INVERSE( t ; ; )

Exemple : simulation dun chantillon de taille 100 extrait dune population de loi normale de
moyenne = 6 et dcart type = 1 :



TESTS D'HYPOTHESES
134

Des sujets rcents de BTS
Groupement B 2006

Une entreprise fabrique des chaudires de deux types :
des chaudires dites chemine ,
des chaudires dites ventouse .
On considre un chantillon de 100 chaudires prleves au hasard dans un stock important.
Ce stock est assez important pour quon puisse assimiler ce tirage un tirage avec remise.
On constate que 94 chaudires sont sans aucun dfaut.

1 Donner une estimation ponctuelle de la frquence inconnue p des chaudires de ce stock
qui sont sans aucun dfaut.

2 Soit F la variable alatoire qui, tout chantillon de 100 chaudires prleves au hasard et
avec remise dans ce stock, associe la frquence des chaudires de cet chantillon qui sont sans
aucun dfaut.
On suppose que F suit la loi normale de moyenne p et dcart type
100
) 1 ( p p
, o p est la
frquence inconnue des chaudires du stock qui sont sans aucun dfaut.
Dterminer un intervalle de confiance de la frquence p avec le coefficient de confiance
95 %. Arrondir les bornes 10
2
.

3 On considre laffirmation suivante : la frquence p est obligatoirement dans lintervalle
de confiance obtenu la question 2 .
Est-elle vraie ? (On ne demande pas de justification.)

lments de rponse

D. 1 f = 0,94, donc une estimation ponctuelle de p est p = 0,94.

0,5 point

C. 2 Un intervalle de confiance est :
I =
(

1
) 1 (
,
1
) 1 (
n
f f
t f
n
f f
t f
avec f = 0,94 ; n = 100 et t = 1,96.
I [0,89 ; 0,99].






1,5 point
C. 3 Non, la frquence p nappartient pas obligatoirement I.

0,5 point


TESTS D'HYPOTHESES
135

Groupement B 2004 Nouvelle Caldonie

Une machine doit percer des pices mtalliques
carres en leur centre, not O sur la figure. En
ralit le centre du trou circulaire ainsi ralis
est un point P proche du point O et variable
d'une pice l'autre.
On note (x, y) les coordonnes du point P dans
le repre orthonormal de la figure, o l'unit est
le millimtre.
On note z la distance OP.

On souhaite avoir une estimation de la moyenne
2
des
distances OP sur la production d'une journe.
Sur un chantillon de 64 pices prleves au hasard et
avec remise dans la production de cette journe, on constate que la moyenne z et l'cart type
s
2
des distances OP en mm sont, arrondis 10
2
, z = 2,01 et s
2
= 1,04 .
1 A partir des informations portant sur cet chantillon, donner une estimation ponctuelle de
la moyenne
2
et de l'cart type
2
des longueurs OP pour la production de la journe ;
arrondir 10
2
.
2 Soit Z la variable alatoire qui, tout chantillon de 64 pices prleves au hasard et avec
remise dans la production de la journe, associe la moyenne des longueurs OP de cet
chantillon.
On suppose que Z suit la loi normale de moyenne inconnue
2
et d'cart type
64
05 , 1
.
Dterminer un intervalle de confiance centr en z de la moyenne
2
des longueurs OP pour la
production, avec le coefficient de confiance 95%. (On arrondira les bornes de l'intervalle
10
2
).
3 On considre l'affirmation suivante : "la moyenne
2
est obligatoirement dans l'intervalle
de confiance obtenu la question prcdente".
Cette affirmation est-elle vraie ? (Donner la rponse sans explication).

lments de rponse

C.1 Estimation ponctuelle de
2
: 2,01 .
Estimation ponctuelle de
2
: 04 , 1
63
64
1,05 .
1 point
C.2
[
64
05 , 1
96 , 1 01 , 2 ;
64
05 , 1
96 , 1 01 , 2 + ] [1,75 ; 2,27] .

1,5 point
C.3 Non.

0,5 point

P
x
y
O
TESTS D'HYPOTHESES
136

Groupement B 2004

Une entreprise fabrique, en grande quantit, des tiges
mtalliques cylindriques pour l'industrie. Leur
longueur et leur diamtre sont exprims en
millimtres.

Dans cet exercice, les rsultats approchs sont arrondir 10
2
.
Dans cette question on s'intresse au diamtre des tiges.
Soit D la variable alatoire qui, tout chantillon de 50 tiges prleves au hasard et avec
remise dans la production d'une journe, associe la moyenne des diamtres des tiges de cet
chantillon.
On suppose que D suit la loi normale de moyenne inconnue et d'cart type
50

avec
= 0,19.
On mesure le diamtre, exprim en millimtres, de chacune des 50 tiges d'un chantillon
prlev au hasard et avec remise dans la production de la journe considre.
On constate que la valeur approche arrondie 10
2
de la moyenne x des diamtres des tiges
de cet chantillon est x = 9,99.

1 A partir des informations portant sur cet chantillon, donner une estimation
ponctuelle de la moyenne des diamtres des tiges produites dans cette journe.

2 Dterminer un intervalle de confiance centr sur x de la moyenne des diamtres
des tiges produites pendant la journe considre, avec le coefficient de confiance
95 %.

3 On considre l'affirmation suivante : " la moyenne est obligatoirement dans
l'intervalle de confiance obtenu la question 2 ".
Est-elle vraie ? (On ne demande pas de justification).

lments de rponse


C.1 = 9,99 .

0,5 point
C.2
[ x 1,96
n

, x + 1,96
n

]
= [9,99 1,96
50
19 , 0
; 9,99 1,96
50
19 , 0
] = [9,94 9,94 9,94 9,94 ; 10,04 10,04 10,04 10,04].

1 point
C.3 Non.

0,5 point


TESTS D'HYPOTHESES
137
Sance 3 :
TESTS D'HYPOTHESES



"La seule certitude que j'ai, c'est d'tre dans le doute."
Pierre DESPROGES - 1986.





Il y a deux dbouchs "naturels" l'tude statistique des fluctuations d'chantillonnage.
Le premier est celui de l'estimation. Dans ce cas, on n'a aucun a priori sur le (ou les)
paramtre(s) estimer sur la population. On construira alors un intervalle de confiance
gnralement centr sur la frquence f (ou la moyenne x ) calcule sur l'chantillon.
Dans bien des situations, on a une ide a priori de la valeur p
0
(ou
0
) que devrait avoir la
frquence p (ou la moyenne ) sur la population. Si l'on se demande si un d est truqu, on
cherche savoir si la frquence p de sortie du 6 est gale p
0
=1/6. Dans le cas d'un contrle
de qualit, il existe sans doute une norme, ou un seuil de rentabilit, qui fait qu'on s'interroge
si la proportion p de pices dfectueuses dans la production est infrieure p
0
= 0,10 (par
exemple).
TESTS D'HYPOTHESES
138
Il reviendra Jerzy NEYMAN (1894-1981) et Egon PEARSON (1895-1980, fils de Karl) de
proposer vers 1930 une dmarche de
dcision universellement admise.
Ils ont remarqu que, dans la plupart des
situations, les deux hypothses, H
0
et H
1
en
concurrence, ne sont pas symtriques. Il y en
une dont le rejet, lorsqu'elle est vraie, peut
avoir de graves consquences, ou bien, une
des deux hypothses est privilgie comme
issue d'une thorie en vigueur, bien tablie.
La thorie des tests statistiques se prsente
donc comme un problme de choix entre
deux dcisions possibles : accepter ou refuser
l'hypothse privilgie H
0
.

I UN EXEMPLE D'INTRODUCTION
"La statistique est comparable un fusil charg qui, en
des mains inexprimentes, peut amener de graves
accidents."
Cheysson, cit par March dans "Les principes
de la mthode statistique" 1930.

Les notions d'erreur de seconde espce et de puissance d'un test ne sont pas au programme
de BTS. Les choix de construction du test ne sont pas demands l'examen. Il est hors de
question de faire un cours, ou d'exiger des connaissances sur ces sujets. Cependant ces
notions sont essentielles la comprhension d'un test (en particulier l'erreur de 2
nde

espce), on les abordera donc ici dans un cadre concret et particulirement signifiant.
Le programme indique d'ailleurs :

"On soulignera que la dcision prise, rejet ou acceptation, dpend des choix faits a priori
par l'utilisateur : choix de l'hypothse nulle, choix du seuil de signification."

Prenons un exemple : un laboratoire affirme, qu' la diffrence de ses concurrents, dont le
produit est efficace 80%, le sien l'est 90%. Deux tests sont envisageables selon le point
de vue.
Test fabriquant :
H
0
: p = 0,9 test unilatral gauche.
Ce test ne rejettera l'hypothse selon laquelle le nouveau produit est meilleur ( p = 0,9) que
si le rsultat de l'chantillon va significativement dans l'autre sens.
Test client :
H
0
: p = 0,8 test unilatral droite.
Le client privilgie l'hypothse p = 0,8. Il n'est prt changer d'avis que si les rsultats de
l'chantillon sont significativement meilleurs.
C'est certainement au niveau de l'utilisation des tests statistiques qu'une incomprhension
des principes conduira le plus des rponses inappropries. On voit l le rle formateur
que nous avons jouer par rapport une utilisation "presse bouton" des logiciels.

On se placera, pour l'exemple qui suit, dans un cas simple (test d'une frquence dans un
cadre binomial), sur un sujet sensible (la russite un examen) o les diffrents enjeux
(risques) ont une signification claire.
E. Pearson J. Neyman
TESTS D'HYPOTHESES
139
NORMES AFNOR

5.30 TEST STATISTIQUE
Procdure base sur une
fonction des observations (c'est
dire une statistique) d'un ou
de plusieurs chantillons et
conduisant rejeter, avec un
certain risque d'erreur, une
hypothse gnralement
appele "hypothse nulle".

5.39 TEST BILATERAL
Test pour lequel l'hypothse
nulle est rejete si la statistique
utilise prend une valeur situe
hors d'un intervalle dtermin.
Souvent l'intervalle est choisi
de telle manire que la
probabilit de rejet, lorsque
l'hypothse nulle est vraie, soit
galement partage de part et
d'autre de celui-ci. On dit alors
que le test est "symtrique".

5.40 TEST UNILATERAL
Test pour lequel l'hypothse
nulle est rejete si la statistique
utilise prend une valeur
infrieure (suprieure) une
valeur donne.

5.36 HYPOTHESE
ALTERNATIVE
Hypothse que l'on oppose
l'hypothse nulle.

5.34 ERREUR DE PREMIERE
ESPECE
Erreur commise lorsqu'on
rejette l'hypothse nulle alors
que celle-ci est vraie. La
probabilit d'une telle erreur
s'appelle "risque de premire
espce".
Il s'agit de faire comprendre les lments essentiels suivants :
La construction du test doit se faire avant la
prise d'chantillon. Elle doit faire l'objet d'un
protocole sur lequel se mettent d'accord les deux
partis en prsence, ici professeurs et lves, dans
les relations commerciales, vendeur et acheteur.
D'o la ncessit d'une normalisation des tests
(voir les normes de l'AFNOR pour l'industrie).
C'est un non sens statistique de construire le test
aprs le prlvement de l'chantillon. On pourrait
conclure ce que l'on veut !
Les erreurs sont invitables ( la diffrence
des autres domaines des mathmatiques, il s'agit
ici d'valuer et d'accepter les risques). Ces erreurs
sont de deux types et les choix effectus pour la
construction du test correspondent un
compromis entre la matrise des risques et et
la taille n de l'chantillon (cot du contrle).
Bien qu'hors programme des BTS, ce sont des
enjeux importants du test, et on peut les faire
comprendre, sans entrer dans une tude
systmatique.
L'erreur de 1
re
espce tant la plus facile
matriser ( ne peut tre dtermine que si l'on
connat les lois de probabilit sous H
1
), c'est sur
elle, et l'hypothse H
0
, que sera construit le test.
Cela conduit privilgier H
0
: si la forme de la
rgion d'acceptation dpend de la nature de H
1

(bilatral ou unilatral), ses limites ne dpendent
que de H
0
( partir de laquelle, on les calcule).
Les deux hypothses ne jouent donc pas un rle
symtrique.
Il faut mettre en vidence les diffrentes
tapes d'un test, dont le plan est :

1. Construction du test :
a - Choix des hypothses H
0
et H
1
(test
bilatral ou unilatral).
Ce choix est dirig par l'nonc. Celui de
et n est impos l'examen.
b - Calcul, sous l'hypothse H
0
, de la
rgion critique au seuil (ou de la zone
d'acceptation).
c - Enonc de la rgle de dcision.
2. Utilisation du test :
Prlvement d'un chantillon et prise de dcision, selon le rsultat observ.
TESTS D'HYPOTHESES
140
Remarques : des dtails de vocabulaire.
Comme il y a deux types d'erreurs, il y a deux risques possibles :
Dans le test du fabriquant (ou du vendeur) o l'hypothse H
0
correspond "la fabrication
est conforme" :
"On rejette tort H
0
au risque de %" (risque du vendeur, qui se trouve alors ls car on
rejette sa production alors qu'elle est conforme, pas de chance, l'chantillonnage a fait
ressortir les mauvaises pices).
"On accepte tort H
0
au risque de %" (risque du client, pas de chance pour lui car
l'chantillonnage n'a pas mis en vidence le fait que la livraison n'est pas conforme).
Il n'est donc pas correct de dire, comme on le lit dans certains sujets d'examen, que l'on
"accepte H
0
au risque ". Dans le cas extrme d'un test 0%, on accepte H
0
les yeux
ferms, mais pas au risque de 0% ! Parler plutt de seuil, c'est moins risqu !
La terminologie d'hypothse "nulle" vient peut tre du fait que son acceptation implique
gnralement une action nulle (pas de modification) ou signifie un effet nul (dans le cas
d'un mdicament en mdecine par exemple). En tous cas elle n'est pas "nulle" au sens que
pourraient lui donner les lves : c'est l'hypothse gnralement privilgie.

L'exprimentation, par simulation du test, permet, en ressentant le hasard, de mieux vivre
les enjeux. On propose, dans le TD joint en annexe, une simulation sur calculatrices, plus
pratique dans le cadre habituel de la classe, mais l'analogue sur Excel est plus visuel.
On prend alatoirement comme valeur de p, 1/3 ou 0,60 (avec une probabilit 0,5 dans
chaque cas). On simule alors un QCM de 20 questions indpendantes, avec chacune trois
propositions, o la probabilit de bonne rponse est, chaque question, p. Le test
(l'examen) consiste, pour le professeur, dtecter si l'tudiant rpond au hasard. Il suffit,
sur Excel, de faire F9, pour avoir une autre simulation d'un QCM. On observe alors un
nombre non ngligeable d'erreurs de 2
me
espce (on considre qu'on a rpondu au hasard
alors que c'est faux), particulirement injustes.

Voir en annexe le T.D. : "Introduction aux tests statistiques" pour mieux comprendre
la situation.

Il y a quatre cas possibles : tudiant rpondant avec p = 1/3 (au hasard) et recal, tudiant
rpondant avec p = 0,60 et accept, tudiant rpondant avec p = 1/3 et accept (erreur 1),
tudiant rpondant avec p = 0,60 et recal (erreur 2).
L'tudiant ne rpond pas au hasard (p = 0,60) L'tudiant rpond au hasard (p = 1/3)
TESTS D'HYPOTHESES
141
466
17
122
395
0
100
200
300
400
500
600
mauvais
recal
ERREUR
1
ERREUR
2
bon reu
487
28
131
354
0
100
200
300
400
500
600
mauvais
recal
ERREUR
1
ERREUR
2
bon reu












On peut faire des statistiques, en simulant 1000 QCM de 20 questions et en comptabilisant
les quatre cas possibles :












Il suffit de faire F9, pour avoir aussitt une autre simulation de 1000 QCM. On voit bien
les niveaux de chaque erreur.
Les probabilits thoriques d'observation des erreurs de 1
re
et 2
nde
espce sont ici
respectivement
1
2
1,9 % et
1
2
12,2 % (en effet les probabilits d'avoir p =
1
3
et
p = 0,6 sont 0,5 chacune).
Soit x le nombre de bonnes
rponses au QCM.
Lorsqu'on est recal pour
x 10 , l'erreur de 1
re

espce (seuil du test)
correspond aux rectangles
clairs 11, 12, 13 etc. et
l'erreur de 2
nde
espce (pour
p = 0 ,60) aux rectangles
foncs 10, 9, 8, 7, 6, 5 etc.
On peut ensuite modifier la
zone d'acceptation (la barre
de l'examen) pour en
valuer aussitt l'impact :
le passage de x 10 x 8
pour tre recal l'examen, diminue visiblement l'erreur de 2
nde
espce, en augmentant
l'erreur de 1
re
espce (seuil du test).
Erreur de 2
nde
espce Erreur de 1
re
espce
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
TESTS D'HYPOTHESES
142
II - TESTS D'UN PARAMETRE (OU PARAMETRIQUES)
1 - TEST D'UNE FREQUENCE
a) Position du problme

On s'interroge sur la frquence p d'un phnomne dans
une population. Mais, au lieu de chercher estimer p, en
ignorant tout (cas de "l'estimation"), on souhaite le
comparer une valeur fixe p
0
, attendue.
Aprs construction d'un test, il s'agit de voir si la valeur
f observe sur un chantillon est vraisemblable, avec
l'hypothse nulle "p = p
0
".
A la diffrence de l'estimation, o l'on construit un intervalle de confiance partir de f
(centr sur f et qui fluctue selon l'chantillon), on construit ici une zone d'acceptation de
l'hypothse nulle partir de p
0
, fixe avant le prlvement de l'chantillon (centre sur p
0

dans le cas bilatral).
Les tests intervenant dans les relations commerciales (vendeur/acheteur), contrles de
qualit, des normes (voir ci-contre) dfinissent (pour chaque type de produit) les
conditions du test et les rgles de dcision.
b) Plan du test d'une frquence
1. Construction du test :
a - Choix des hypothses :
H
0
: " p = p
0
".
H
1
: " p p
0
" (test bilatral) ou
H
1
: " p > p
0
" (unilatral droite) ou H
1
: " p < p
0
"
(unilatral gauche).
b - Dtermination de la rgion critique au seuil :
Sous l'hypothse H
0
, la variable alatoire F, qui chaque
chantillon de taille n associe la frquence observe, suit
approximativement, pour n assez grand, la loi normale
N
|
|

\
|

n
p p
p
) 1 (
,
0 0
0
. On calcule alors le rel positif h
tel que :
P( p
0
h F p
0
+ h) = 1 (cas bilatral) ou
P( F p
0
+ h) = 1 (cas unilatral droite) ou
P( p
0
h F ) = 1 (cas unilatral gauche).
c - Enonc de la rgle de dcision.
On prlve un chantillon de taille n, pour lequel on
calcule la frquence f du phnomne.
La rgle de dcision est de trois types.





chantillon de
taille n
frquence
observe f
Population : frquence p = p
0
?
NORMES AFNOR

5.35 SEUIL DE
SIGNIFICATION
Valeur du risque de premire
espce lorsque l'hypothse
nulle est une hypothse simple.
Notation : .

5.37 ERREUR DE SECONDE
ESPECE
Erreur commise lorsqu'on ne
rejette pas l'hypothse nulle
alors que celle-ci est fausse. La
probabilit d'une telle erreur
s'appelle "risque de seconde
espce". Dans un test
paramtrique, ce risque dpend
de la valeur vrai du paramtre
(ou des paramtres).
Notation : .

5.38 PUISSANCE D'UN TEST
Complment l'unit du risque
de seconde espce.
TESTS D'HYPOTHESES
143

G Si f [ p
0
h , p
0
+ h] , on rejette H
0
au risque (cas bilatral) ;
ou f ] , p
0
+ h] (unilatral droite)
ou f [ p
0
h , + [ (unilatral gauche).
G Sinon, on accepte H
0
au seuil .

2. Utilisation du test :
Prlvement d'un chantillon et prise de dcision, selon le rsultat observ.

Voir les annales de BTS .

Remarques : Dans le cas unilatral, les lves ont parfois des difficults comprendre
- que l'hypothse alternative n'est pas le contraire de l'hypothse nulle ;
- que, pour tester p > p
0
, ce qui nous intresse, on parte de hypothse nulle p = p
0

(changement de point de vue par rapport au test bilatral o l'hypothse nulle est
bien ce que l'on cherche tester) ;
- que, pour tester p > p
0
, on recherche P(F p
0
+ h).
c) Utilisation des fonctions de la calculatrice







Les calculatrices affichent le nombre z =
n
f f
p f
) 1 (
0

, ainsi que la probabilit


P (T -z) + P (T z) dans le cas bilatral.
C'est cette zone qui est ombre sur la courbe de densit de la loi N (0;1). Si sa surface est
suprieure au seuil de rejet, l'hypothse H
0
est accepte.
Ainsi si la probabilit calcule est 0.0662 par exemple, l'hypothse H
0
est accepte au seuil
de rejet de 5% mais rejete au seuil de 10%. La probabilit affiche est donc le seuil limite
d'acceptation de l'hypothse nulle.

Test bilatral Test unilatral droite Test unilatral gauche
Les courbes sont centres sur p
0
. En fonc, les rgions critiques (rejet de H
0
).
CASIO Graph 80 TI 83 SHARP EL 9600
STAT TEST Z 1-P
propp0 <p0 >p0 choix
bilatral ou non
p0 : entrer p
x : n: entrer nombre succs
et taille chant.
STAT TESTS 5:1-
PropZTest
p0 : entrer p0
x : n: entrer nb succs et
taille chant.
propp0 <p0 >p0 choix
bilatral ou non
STAT E TEST
17 InputStats ENTER
10 Ztest1prop

TESTS D'HYPOTHESES
144
chantillon de
taille n
moyenne
observe x
Population : moyenne =
0
?
cart type
2 - TEST D'UNE MOYENNE
a) Position du problme

On s'interroge sur la moyenne d'une population.
Mais, au lieu de chercher estimer , en ignorant
tout (cas de "l'estimation"), on souhaite le comparer
une valeur fixe
0
, attendue.
Aprs construction d'un test, il s'agit de voir si la
moyenne x observe sur un chantillon est
vraisemblable, avec l'hypothse nulle " =
0
".
A la diffrence de l'estimation, o l'on construit un intervalle de confiance partir de x
(centr sur x ), on construit ici une zone d'acceptation de l'hypothse nulle partir de
0

(centre sur
0
dans le cas bilatral).
b) Plan du test d'une moyenne lorsque est connu ou n grand
1. Construction du test :
a - Choix des hypothses :
H
0
: " =
0
".
H
1
: "
0
" (test bilatral) ou
H
1
: " >
0
" (unilatral droite) ou H
1
: " <
0
" (unilatral gauche).
b - Dtermination de la rgion critique au seuil :
Sous l'hypothse H
0
, la variable alatoire X , qui chaque chantillon de taille n associe la
moyenne observe, suit approximativement, pour n assez grand, la loi
N |

\
|
n

,
0
(lorsque est inconnu, on le remplace, pour n 30, par son estimation s,
calcule partir de l'cart type s
n
de l'chantillon
n
s
n
n
s
1
= ).
On calcule alors le rel positif h tel que :
P(
0
h X
0
+ h) = 1 (cas bilatral) ou
P( X
0
+ h) = 1 (cas unilatral droite) ou P(
0
h X ) = 1 (cas
unilatral gauche).
c - Enonc de la rgle de dcision.
On prlve un chantillon de taille n, dont calcule la moyenne x .
G Si x [
0
h ,
0
+ h] , on rejette H
0
au risque (cas bilatral) ;
ou x ] ,
0
+ h] (unilatral droite)
ou x [
0
h , + [ (unilatral gauche).
G Sinon, on accepte H
0
au seuil .

2. Utilisation du test :
Prlvement d'un chantillon et prise de dcision, selon le rsultat observ.

Voir annales de BTS .

Remarques : Le fait que soit inconnu, conduit parfois des noncs ambigus, o l'on
prlve l'chantillon avant la construction du test, de faon estimer l'cart type.

TESTS D'HYPOTHESES
145
c) Utilisation des fonctions de la calculatrice ou de l'ordinateur
Sur calculatrices :












La calculatrice affiche le nombre z =
n
x

, ralisation sur l'chantillon de la variable


alatoire
n
X
T

= , ainsi que le seuil limite d'acceptation de l'hypothse nulle (la


probabilit P (T z) + P (T z) dans le cas bilatral).

Sur Excel :

La fonction "TEST.Z" permet
un test bilatral d'une
moyenne, partir des donnes
d'un chantillon.

Dans la bote de dialogue,
renseigner chaque rubrique
comme suit.
Matrice : cellules contenant les mesures de l'chantillon.
x : valeur de la moyenne .
Sigma : valeur de l'cart type de la population.
La valeur affiche est le seuil limite d'acceptation de l'hypothse nulle.

d) Cas ou est inconnu et n petit : test de Student
Lorsque n est assez petit, et que est inconnu, le test adapt est bas sur la loi de Student
("T-Test" des calculatrices).

"Exemples d'utilisation du test de Student (cas des petits chantillons)"
"Ce TP n'est raliser qu'en liaison avec les enseignants des disciplines professionnelles
et seulement si, dans celles-ci, ces procdures sont utilises."
"Aucune connaissance son sujet n'est exigible dans le cadre du programme de
mathmatiques."
TP5 du module "Statistique infrentielle".
CASIO Graph 80 TI 83 SHARP EL 9600
STAT TEST Z 1-S
Data: Var
: 0 <0 >0 choix bilatral ou
unilat.
0: entrer
: entrer pop. ou estim
x : entrer x chantillon
n : entrer taille chantillon
CALC ou DRAW
Affichage de z et de la probabilit
associe
STAT TESTS 1:Z-Test
Inpt: Stats
0 : entrer 0
x : entrer x chantillon
: entrer pop. ou son estimation
s
n : entrer taille chantillon
: =0 <0 >0 choix bilatral ou
unilat.
Calculate ou Draw
Affichage de z et de la probabilit
associe
STAT E TEST
17 InputStats ENTER
08 Ztest1samp


TESTS D'HYPOTHESES
146

William Sealy Gosset alias Student (1876 1937) est le prcurseur des statisticiens
industriels. Il fit toute sa carrire dans les brasseries Guinness,
dlaissant les possibilits qui lui furent offertes d'une carrire
universitaire. Considr par les brasseurs comme l'un des leurs,
occupant ses loisirs la statistique en vue de l'amlioration de la
production, ses changes avec les statisticiens universitaires
taient parfois vus d'un mauvais oeil par ses employeurs. Ceci
explique le surnom de Student utilis pour dnommer la loi dont
il est l'origine. En effet, la socit Guinness l'autorisa publier
ses articles condition qu'il use au choix, du pseudonyme
"Pupil" ou "Student". Gosset choisit le second.

Considrons, qu'au sein d'une production rpartie selon une loi normale de moyenne et
d'cart type , on prlve au hasard un chantillon de taille n (petit). On note X
i
la variable
alatoire qui, au i
me
tirage, associe son rsultat. On suppose que les X
i
sont indpendantes,
de mme loi normale N (, ).
On note encore

=
=
n
i
i n
X
n
X
1
1
.
Lorsque =
0
, la variable alatoire X -
0
suit la loi normale N
|
|

\
|
n

, 0 qui n'est pas


connue car est inconnu. En statistique il est tentant, quand on a un paramtre inconnu
de le remplacer par son estimation.
On sait que la variable alatoire S
n-1

2
=

n
i
i
X X
n
1
2
) (
1
1
est un estimateur sans biais de

2
, E(S
n-1

2
) =
2
(et fournit, pour n assez grand, une "bonne" estimation ponctuelle de

2
). L'ide de Student a t d'introduire la variable alatoire
1
0

=
n
S
X
n T

=
n
S
X
n
0
1

.
Il a montr que si =
0
alors T suit une loi de probabilit, indpendante de , que l'on
peut calculer et appele loi de Student n 1 degrs de libert.

1. Construction du test :
a - Choix des hypothses :
H
0
: " =
0
".
H
1
: "
0
" (test bilatral) ou " >
0
" (unilatral droite) ou " <
0
" ( gauche).
b - Dtermination de la rgion critique au seuil :
Sous l'hypothse H
0
, la variable alatoire
n
S
X
n T
0
1

= ,
o S
n

2
=

n
i
i
X X
n
1
2
) (
1
, suit la loi de Student n 1 degrs de libert.
La table donne alors le rel positif h tel que :
P( h T h) = 1 (cas bilatral) ou
P( T h) = 1 (cas unilatral droite) ou P( h T ) = 1 (cas unilatral
gauche).
TESTS D'HYPOTHESES
147
c - Enonc de la rgle de dcision.
On prlve un chantillon de taille n, dont calcule la moyenne x et l'cart type s
n
.
On calcule
n
s
x
n t
0
1

= .
G Si t [ h , h] , on rejette H
0
au risque (cas bilatral) ;
ou t ] , h] (unilatral droite)
ou t [ h , + [ (unilatral gauche).
G Sinon, on accepte H
0
au seuil .

2. Utilisation du test :
Prlvement d'un chantillon et prise de dcision, selon le rsultat observ.

Exemples :
En prlevant avec remise un chantillon de taille n = 15 dans une population normale de
moyenne , on souhaite tester l'hypothse H
0
: = 30 contre H
1
: 30 au seuil de 5%.
Construction du test : pour = 0,05 et = 14, la valeur critique fournie par la table (voir
page 80) est h = 2,145.
Utilisation du test : on prlve un chantillon de taille 15 avec remise sur lequel la
moyenne est x = 37,2 et l'cart type s
15
= 6,2.
On a 14
2 , 6
30 2 , 37
= t 4,35. On constate que 4,35 > 2,145, on rejette donc l'hypothse
H
0
au seuil de 5%.
Mme exemple que le prcdent dans le cadre unilatral droite :
On teste H
0
: = 30 contre H
1
: > 30 au seuil de 5%.
Sur la table de la page 80 (construite pour le cas bilatral) on recherche, en raison de la
symtrie de la loi de Student, la probabilit P = 0,10 (P/2 = 0,05) et on obtient la valeur
critique h = 1,761. L'hypothse H
0
est rejete.

TESTS D'HYPOTHESES
148
chantillon de
taille n
2
frquence f
2
Population 2 : frquence p
2
?

chantillon de
taille n
1
frquence f
1
Population 1 : frquence p
1
?

III - TESTS DE COMPARAISON (OU DE LA DIFFERENCE
SIGNIFICATIVE)
1 - COMPARAISON DE DEUX FREQUENCES
a) Position du problme

On souhaite comparer les frquences p
1
et p
2
d'un mme phnomne, dans deux
populations.
Aprs construction d'un test, il s'agit de voir si la diffrence f
1
f
2
des frquences
observes sur un chantillon de chaque population est vraisemblable, avec l'hypothse
nulle "p
1
= p
2
" (a-t-on une diffrence significative ?).
b) Plan du test de comparaison de deux frquences
1. Construction du test :
a - Choix des hypothses :
H
0
: " p
1
= p
2
".
H
1
: " p
1
p
2
" (test bilatral) ou
H
1
: " p
1
> p
2
" (unilatral droite) ou H
1
: " p
1
< p
2
" (unilatral gauche).
b - Dtermination de la rgion critique au seuil :
Sous l'hypothse H
0
, la variable alatoire D = F
1
F
2
, qui chaque paire d'chantillons de
taille n
1
et n
2
, respectivement issus des populations 1 et 2, associe la diffrence f
1
f
2
des
frquences observes, suit approximativement, pour n
1
et n
2
assez grands, la loi
N
|
|

\
|

2
2 2
1
1 1
) 1 ( ) 1 (
, 0
n
f f
n
f f
(les variances s'ajoutent si l'on suppose F
1
et F
2

indpendantes).

Remarque : sous l'hypothse H
0
on suppose l'galit des frquences dans les deux
populations, certains prennent alors comme cart type de D l'expression
|

\
|
+
2 1
1 1
) 1 (
n n
f f o
2 1
2 2 1 1
n n
f n f n
f
+
+
= .

On calcule alors le rel positif h tel que :
P( h D h) = 1 (cas bilatral) ou P( D h) = 1 (cas unilatral droite) ou
P( h D ) = 1 (cas unilatral gauche).
c - Enonc de la rgle de dcision.
On prlve un chantillon de taille n
1
dans la population 1, puis un chantillon de taille n
2

dans la population 2, pour lesquels on calcule la diffrence des frquences observes
f
1
f
2
.
G Si f
1
f
2
[ h , h] , on rejette H
0
au risque (cas bilatral) ;
TESTS D'HYPOTHESES
149
ou f
1
f
2
] , h] (unilatral droite)
ou f
1
f
2
[ h , + [ (unilatral gauche).
G Sinon, on accepte H
0
au seuil .

2. Utilisation du test :
Prlvement des deux chantillons et prise de dcision, selon le rsultat observ.

Voir annales de BTS.
c) Utilisation des fonctions de la calculatrice






2 - COMPARAISON DE DEUX MOYENNES
a) Position du problme








On souhaite comparer les moyennes
1
et
2
de deux populations.
Aprs construction d'un test, il s'agit de voir si la diffrence
1
x
2
x des moyennes
observes sur un chantillon de chaque population est vraisemblable, avec l'hypothse
nulle "
1
=
2
".
b) Plan du test de comparaison de deux moyennes (grands chantillons ou
carts types connus)
1. Construction du test :
a - Choix des hypothses :
H
0
: "
1
=
2
".
H
1
: "
1

2
" (test bilatral) ou
H
1
: "
1
>
2
" (unilatral droite) ou H
1
: "
1
<
2
" (unilatral gauche).
b - Dtermination de la rgion critique au seuil :
Sous l'hypothse H
0
, la variable alatoire
2 1
X X D = , qui chaque paire d'chantillons
de taille n
1
et n
2
, respectivement issus des populations 1 et 2, associe la diffrence x
1
x
2

des moyennes observes, suit approximativement, pour n
1
et n
2
assez grands, la loi
N
|
|

\
|
+
2
2
2
1
2
1
, 0
n n

(les variances s'ajoutent si l'on suppose
1
X et
2
X indpendantes).
On calcule alors le rel positif h tel que :
P( h D h) = 1 (cas bilatral) ou
P( D h) = 1 (cas unilatral droite) ou P( h D ) = 1 (cas unilatral
gauche).
CASIO Graph 80 TI 83 SHARP EL 9600
STAT TEST Z 2-P
p1: p2 <p2 >p2 choix bilatral ou
non
entrer nombre de succs et tailles des
chantillons
Affichage comme les tests prcdents
STAT TESTS 6:2-PropZTest
entrer nombre de succs et tailles des
chantillons
p1: p2 <p2 >p2 choix bilatral ou
non
Affichage comme les tests prcdents
STAT E TEST
17 InputStats ENTER
11 Ztest2prop

chantillon de
taille n
2
moyenne
2
x

Population 2 : moyenne
2
?
cart type 2
chantillon de
taille n
1
moyenne
1
x
Population 1 : moyenne
1
?
cart type 1
TESTS D'HYPOTHESES
150
c - Enonc de la rgle de dcision.
On prlve un chantillon de taille n
1
dans la population 1, dont calcule la moyenne x
1
,
puis, un chantillon de taille n
2
dans la population 2, pour lequel la moyenne vaut x
2
.
G Si x
1
x
2
[ h , h] , on rejette H
0
au risque (cas bilatral) ;
ou x
1
x
2
] , h] (unilatral droite)
ou x
1
x
2
[ h , + [ (unilatral gauche).
G Sinon, on accepte H
0
au seuil .

2. Utilisation du test :
Prlvement des deux chantillons et prise de dcision, selon le rsultat observ.

Voir annales de BTS.
c) Utilisation des fonctions de la calculatrice ou de l'ordinateur
Sur calculatrices :








Sur Excel :

"L'utilitaire d'analyse" (qu'il faut ventuellement installer) permet l'accs l'outil :
"Z-test de la diffrence significative minimale".
CASIO Graph 80 TI 83 SHARP EL 9600
STAT TEST Z 2-S
Data : Var
1: 2 <2 >2 choix bilatral ou
unilatral
Entrer cart types (ou estimation) des
pop. moyennes et tailles des
chantillons.
Affichage analogue aux tests prcdents
STAT TESTS 3:2-SampZTest
Inpt: Stats
Entrer moyennes et tailles des
chantillons, cart types (ou estimation)
des populations
1: 2 <2 >2 choix bilatral ou
uni.
Pooled : NO
Affichage analogue aux tests prcdents
STAT E TEST
17 InputStats ENTER
09 Ztest2samp

TESTS D'HYPOTHESES
151
IV TESTS D'AJUSTEMENT

"Exemples d'utilisation de la droite de Henry, du test du
2
"
"Ce TP n'est raliser qu'en liaison avec les enseignants des disciplines professionnelles
et seulement si, dans celles-ci, ces procdures sont utilises."
"Aucune connaissance son sujet n'est exigible dans le cadre du programme de
mathmatiques."
TP5 du module "Statistique infrentielle".

Les tests d'ajustement ont pour but de vrifier qu'un chantillon provient ou non d'une
variable alatoire de distribution donne (connue).
Une premire mthode, empirique, peut consister comparer la forme de l'histogramme
des frquences observes aux histogrammes thoriques (dans le cas discret) ou au profil
des fonctions de densit (dans le cas continu) des diffrents modles possibles. Cette
mthode peut dj permettre d'liminer certains modles mais la qualit de l'ajustement
n'est pas mme quantifie.
1 PROCEDURES D'AJUSTEMENT LINEAIRE
Dans bien des cas, une transformation fonctionnelle (un changement de variable), on dit
aussi une anamorphose (effet de perspective en peinture), permet de ramener l'ajustement
une rgression linaire selon les moindres carrs. On se contentera mme parfois d'un
ajustement linaire "au jug" par utilisation d'un papier fonctionnel.
C'est le cas de l'ajustement une loi exponentielle (papier semi-logarithmique) ou une loi
de Weibull (papier d'Alan Plait) que nous envisagerons dans le cadre de la fiabilit.
L'ide est la mme dans le cadre d'un ajustement une loi normale selon la procdure de la
droite de Henry (papier gausso-arithmtique), dj vue.
Ces procdures sont simples mettre en uvre mais ont le dfaut de ne pas quantifier les
risques d'erreurs lors de la prise de dcision, ce que permet en revanche la procdure des
tests d'hypothses. Le test du khi 2 est expos ci-dessous, le test de Kolmogorov, plus
adapt pour tester une distribution continue (normalit par exemple), est expos la fin de
la 4
me
sance.
2 LE TEST DU KHI-DEUX
C'est Karl Pearson (1857 1936) que l'on doit le critre du
khi-deux, permettant de juger de la qualit d'ajustement d'une
distribution thorique une distribution observe. Pour cette
tude, Karl Pearson eut recours de nombreux lancers de
pices de monnaie ou de ds, effectus par lui-mme, ses
lves ou ses proches. On ne disposait pas encore des
techniques de simulation

Par dfinition, la loi du khi-deux (ou chi-deux) n degrs de
libert est la loi suivie par la somme S des carrs de n
variables alatoires indpendantes de loi normale centre
rduite.

TESTS D'HYPOTHESES
152
Soit une variable alatoire discrte ou discrtise, c'est dire divise en k classes de
probabilits p
1
, , p
k
.
Soit un chantillon de taille n de cette variable alatoire, fournissant pour chaque classe des
effectifs x
1
, , x
k
.
Il s'agit de comparer ces effectifs aux valeurs thoriques :

Classes Effectifs observs Effectifs thoriques
1 x
1
t
1
= np
1


k x
k
t
k
= np
k


Il faut dcider d'un critre d'adquation des observations par rapport au modle thorique.
De faon classique, on choisira l'cart quadratique rduit, not
2
obs
et valant :
2
obs
=

k
i
i
i i
t
t x
1
2
) (
.
De grandes valeurs de
2
obs
rendraient le modle suspect.
Pour tudier la variabilit de ce critre, introduisons la variable alatoire

=
k
i
i
i i
np
np X
T
1
2
) (
avec n X
k
i
i
=

=1
o X
i
est la variable alatoire correspondant
l'effectif de la i
me
classe.
K. Pearson a dmontr que la loi de T est approximativement, pour n grand, une loi du
2

k 1 degrs de libert (on peut noter que la relation ci-dessus fait que la valeur de X
k
est
dtermine ds que les valeurs de X
1
, , X
k -1
sont connues).

La loi du khi-deux est tabule.
Sur Excel, la fonction LOI.KHIDEUX(valeur t ; degrs de liberts) fournit la probabilit
P(T > t) et la fonction KHIDEUX.INVERSE( probabilit p ; degrs de libert) renvoie la
valeur t telle que P(T > t) = p.
Construction d'un test du khi-deux
Choix des hypothses :
H
0
: pour tout 1 i 6, la probabilit que X
prenne une valeur dans la classe i est p
i
.
H
1
: il existe i tel que la probabilit prcdente
diffre de p
i
.

Dtermination de la rgion critique :
Si H
0
est vraie, la variable alatoire

=
k
i
i
i i
t
t X
T
1
2
) (
suit approximativement la
loi du khi-deux k 1 degrs de libert.
On recherche sur une table le rel t tel que,
P(T > t) = .
D'o la zone d'acceptation de H
0
au seuil :
[0, t].

Densit du khi-deux 5 degrs de
libert
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0 5 10 15
Rejet de H
0
Acceptation de H
0
11,07
5%
95%
TESTS D'HYPOTHESES
153
Rgle de dcision :
Soit
2
obs
l'cart quadratique rduit obtenu entre les effectifs observs et les effectifs
thoriques. Si
2
obs
t on accepte H
0
au seuil de 5%. Si
2
obs
> t on rejette H
0
.

Remarques :
Si l'on utilise l'chantillon pour estimer indpendamment j paramtres de la loi teste, le
degr de libert du khi-deux devient : k 1 j. Par exemple k 3 pour une loi normale o
l'on estime et l'aide de x et s
n-1
.
La loi de T n'est qu'approche et on donne la condition np
i
> 5 pour l'effectif de chaque
classe (sinon on regroupe les classes effectif trop faible). C'est pour vrifier cette
condition que l'on pratique le test du khi-deux sur les effectifs et non sur les frquences.

Voir le TP Excel : NORMALITE D'UNE PRODUCTION TEST DU KHI 2.
TESTS D'HYPOTHESES
154



ANNALES DU B.T.S. TESTS D'HYPOTHESES
155
TRAVAUX
DIRIGES

T.P. Calculatrices : INTRODUCTION AUX
TESTS STATISTIQUES

Dans un lyce syldave, les professeurs, exasprs par le manque de travail d'une partie des
tudiants de BTS, dcident d'tablir un examen de passage la fin du premier semestre (les
murs syldaves sont assez rudes ...).
L'examen se prsentera sous la forme d'un QCM de 20 questions indpendantes. A chaque
question, trois rponses sont proposes, dont une seule est exacte. Un tudiant n'ayant fournit
aucun travail, rpondra au hasard et donc, correctement, avec une probabilit p =
1
3
chaque
question.
L'objectif des professeurs est de recaler ce type d'tudiant, avec une
probabilit d'environ 95 %.
Pour cela il faut dfinir la barre d'acceptation avant
l'preuve, de sorte que les tudiants souscrivent au
protocole ("rgles du jeu") de l'examen.

On peut considrer ce QCM comme un test
statistique devant permettre de dtecter si l'tudiant qui le passe
rpond au hasard ( p =
1
3
). Le QCM est un chantillon alatoire
non exhaustif de ses rponses.
I - CONSTRUCTION DU TEST
1) Choix des hypothses
On teste l'hypothse H
0
: " p =
1
3
" (appele "hypothse nulle"), contre l'hypothse
alternative H
1
: " p >
1
3
" (c'est un test "unilatral").
L'hypothse nulle correspond un tudiant rpondant au hasard. L'hypothse alternative
doit "au contraire" correspondre un tudiant qui a travaill. Pourquoi ne prend-on pas
" p
1
3
" ? .........................................................................................................................................
...........................................................................................................................................................
2) Calcul de la zone d'acceptation de H
0

On suppose que H
0
est vraie : l'tudiant rpond au hasard. On dsigne par X la variable
alatoire qui, chaque tudiant de ce type, associe le nombre de ses bonnes rponses au
QCM.
Quelle est le loi de X (justifier) ? ....................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
Reu

l
'exame
Etudiant : p =
1
3
?
QCM : n = 20
taux de bonnes
rponses f %
ANNALES DU B.T.S. TESTS D'HYPOTHESES
156
n = 20 et p = 1/3
k P(X <= k)
0 0,00030073
1 0,00330802
2 0,01759263
3 0,06044646
4 0,15151086
5 0,29721389
6 0,47934269
7 0,66147148
8 0,80945113
9 0,90810423
10 0,96236343
11 0,9870267
12 0,99627543
13 0,99912119
14 0,99983263
15 0,99997492
16 0,99999715
17 0,99999977
18 0,99999999
19 1
20 1

A l'aide de la table ci-contre, dterminer le nombre k de bonnes rponses tel que P(X k)
soit le plus proche possible de 95 %.
............................................................................................
............................................................................................
Quand le nombre de bonnes rponses est infrieur ou gal
k, on acceptera H
0
.
S'il est strictement suprieur k, on supposera que
l'tudiant a travaill et l'on rejettera H
0
, avec un risque de
rejet tort de : = P( X > k).
Quel est, ici, le risque ? ..................................................
Sur le graphique suivant, indiquer la zone d'acceptation et
la zone de rejet de H
0
.


3) Rgle de dcision
Enoncer la rgle de dcision de l'examen.
...........................................................................................................................................................
...........................................................................................................................................................
II - UTILISATION DU TEST ET ERREURS
1) Exprimentation du test
Le programme suivant choisit alatoirement une valeur de p : avec une chance sur deux,
p =
1
3
ou p = 0,60 (cas d'un tudiant ayant moyennement travaill). Puis, il simule le
passage de l'examen et affiche le nombre x de rponses correctes ainsi que la valeur de p.
CASIO TI 82 - 83 TI 89 - 92
13+Int(Ran# +.5)(.6-13) P
0 X
For 1I To 20
Int(Ran# + P)+X X
Next
Xp
P
:1/3+int(rand+.5)(.6-1/3) P
:0 X
:For(I,1,20)
:int(rand+P)+X X
:End
:Disp X , P
:1/3+int(rand()+.5)(.6-1/3) p
:0 x
:For i,1,20
:int(rand()+p)+x x
:EndFor
:Disp x , p
L'examen conduit-il toujours une dcision juste ?
...........................................................................................................................................................
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ANNALES DU B.T.S. TESTS D'HYPOTHESES
157
n = 20 p = 0,60
k P(X <= k)
0 1,09951E-08
1 3,40849E-07
2 5,04126E-06
3 4,7345E-05
4 0,000317031
5 0,001611525
6 0,006465875
7 0,021028927
8 0,056526367
9 0,127521246
10 0,244662797
11 0,404401275
12 0,584107062
13 0,749989328
14 0,874401027
15 0,949048047
16 0,984038837
17 0,996388528
18 0,999475951
19 0,999963438
20 1

2) Les erreurs
Il y a quatre situations possibles.
Les erreurs de dcision sont de deux
types : "rejeter H
0
tort" (erreur de
premire espce correspondant au
risque ) ou "accepter H
0
tort".

Relier chaque dessin la case qui lui
correspond dans le tableau.



Etudiant qui n'a pas
travaill et est recal

Etudiant qui a
travaill et est recal

Etudiant qui a
travaill et est reu
l'examen

Etudiant qui n'a pas
travaill et est reu
l'examen
3) L'erreur de 2
nde
espce
Un tudiant se manifeste alors. Il est srieux et travailleur,
mais, mal assur, il perd souvent une partie de ses moyens
l'examen. Il estime cependant sa probabilit de bien rpondre
une question p = 0,6.
"C'est pas juste ! Bien qu'ayant une probabilit de bonne
rponse de 60 %, j'ai une chance sur quatre d'tre recal !"
Vrifier l'affirmation de cet tudiant, qui craint d'tre victime
d'une erreur de 2
me
espce (utiliser la table ci-contre, des
valeurs cumules de la loi B (20 ; 0,60) ).
...................................................................................................
...................................................................................................
...................................................................................................
Il faut avouer que ce n'est pas trs moral vis vis de cet
tudiant.
Pour diminuer le risque de 2
me
espce,
l'tudiant propose de baisser la barre
d'admission 8 : si le nombre x de
bonnes rponses est tel que x 7,
l'tudiant est recal, si x 8,
l'tudiant est reu.
Quel est, dans ces conditions, le risque de 2
me
espce, pour
un tudiant tel que p = 0,60 ? ..........................................................................................................
...........................................................................................................................................................
Mais que devient le risque d'admettre un tudiant n'ayant pas travaill ? .....................................
...........................................................................................................................................................
...........................................................................................................................................................
Dcision
Ralit
H
0

accepte
H
1

accepte
H
0

vraie
1

ERREUR DE
1
re
ESPECE
H
1

vraie

ERREUR DE
2
me
ESPECE
1

ANNALES DU B.T.S. TESTS D'HYPOTHESES
158
III - TEST DE 100 QUESTIONS
Les professeurs jugeant ce risque de premire espce inacceptable, dcident, pour diminuer
sans augmenter , de proposer un QCM de 100 questions.
1) Construction du test
Choix des hypothses :
On teste l'hypothse H
0
: " p =
1
3
" , contre H
1
: " p >
1
3
" .
Calcul de la zone d'acceptation de H
0
, au seuil de 5 % :
On suppose que H
0
est vraie : p =
1
3
. On dsigne par X la variable alatoire qui, chaque
tudiant de ce type, associe le nombre de ses bonnes rponses au QCM. On sait que X suit
la loi B (100 ,
1
3
). Pour simplifier les calculs, on approche la loi de X par une loi normale.
Quels en sont les paramtres ? ..........................................................................................................
On note F = X
100
1
, la variable alatoire correspondant aux frquences des bonnes
rponses un QCM. En supposant que F suive une loi normale, quels en sont les
paramtres, sous l'hypothse H
0
? .....................................................................................................
Dterminer le rel h tel que, sous l'hypothse H
0
, P(F h) = 0,95.
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
Rgle de dcision :
...........................................................................................................................................................
...........................................................................................................................................................
2) Simulation
Reprendre le programme prcdent, en remplaant 20 par 100.
Comparer l'efficacit de ce Q.C.M. au prcdent (observer la frquence des erreurs de
premire et seconde espce).
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
ANNALES DU B.T.S. TESTS D'HYPOTHESES
159
POUR ALLER PLUS LOIN ...
Puissance du test
Plaons nous maintenant du point de vue de l'tudiant, pour lequel p = p
0
et qui se
proccupe de sa probabilit d'tre reu : 1 ( p
0
) = P( F > 0,41 p = p
0
).
Montrer que, si p = p
0
, on a 1 ( p
0
) = P( F > 0,41) =
|
|

\
|


) 1 (
41 , 0
10 1
0 0
0
p p
p
, o est
la fonction de rpartition de la loi N (0 , 1). .....................................................................................
...........................................................................................................................................................
La fonction p a 1 (p) se nomme
"puissance" du test et est reprsente ci-
contre.
Lire sur le graphique, la probabilit
d'tre reu au nouvel examen, d'un
tudiant tel que p = 0,40 , puis tel que
p = 0,60. Confirmer par le calcul.
Est-ce raisonnable ?
..................................................................
..................................................................
..................................................................
..................................................................
...........................................................................................................................................................
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,2 0,4 0,6 0,8 1
valeur de p
p
r
o
b
a
b
i
l
i
t


d
'

t
r
e

r
e

u

ANNALES DU B.T.S. TESTS D'HYPOTHESES
160
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
distribution
sous H
1
distribution
sous H
0

Corrig des travaux dirigs
"INTRODUCTION AUX TESTS STATISTIQUES"

I CONSTRUCTION DU TEST
1) Le cas p < 1/3 n'est pas envisag (que dire d'un tudiant cherchant rpondre faux ?). La
forme de la rgion de rejet dpend de H
1
qui correspond uniquement p > 1/3 (l'tudiant ne
rpond pas au hasard).
2) Si H
0
est vraie, on a p = 1/3. Rpondre au Q.C.M. est alors la rptition de 20 expriences
alatoires indpendantes, avec deux issues possibles (bonne rponse avec p = 1/3, ou
mauvaise rponse) et o X associe le nombre de bonnes rponses. La variable alatoire X
suit donc la loi binomiale B (20, 1/3).
Avec la table fournie, on constate que k = 10, avec P(X 10) 0,96.
Le risque est donc 4%.
3) Rgle de dcision
Soit x le nombre de bonnes rponses au Q.C.M.,
si x 10 alors H
0
est accepte et l'tudiant est RECALE,
si x 11 alors H
0
est refuse et l'tudiant est ADMIS.

II UTILISATION DU TEST ET ERREURS
1) La simulation permet de "vivre" les alas du hasard, et d'observer les deux types
d'erreurs.
2) On observe deux types d'erreurs de dcision.
L'erreur de premire espce correspond l'tudiant qui n'a pas travaill et est reu
l'examen.
L'erreur de seconde espce correspond l'tudiant qui a travaill et est recal.
3) L'erreur de seconde espce :
Si H
1
est vraie, on a p = 0,6 et la variable alatoire X suit alors la loi binomiale B (20 ; 0,60).
On a alors P(X 10) 0,24 et donc 24 %.













L'acceptation de H
0
tant fixe x 10, l'erreur de 1
re
espce (seuil) correspond aux
rectangles clairs 11, 12, 13 ..., de la distribution sous H
0
, et l'erreur de 2
nde
espce (pour
p = 0 ,6) aux rectangles foncs 10, 9, 8, 7, 6, 5 ...
En abaissant la barre d'admission 8 (H
0
accepte lorsque x 7), on alors, d'aprs la table
de la loi B (20 ; 0,60), 2 %.
Mais alors, d'aprs la table de la loi B (20 ; 1/3), 100 66 = 34 % !

III TEST DE 100 QUESTIONS
1) Construction du test
ANNALES DU B.T.S. TESTS D'HYPOTHESES
161
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
valeur de p
p
r
o
b
a
b
i
l
i
t


d
'

t
r
e

r
e

u
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
valeur de p
p
r
o
b
a
b
i
l
i
t


d
'

t
r
e

r
e

u
n = 100 n = 20
Sous l'hypothse H
0
, on approche la loi B (100, 1/3) de la variable alatoire X par la loi
normale N
|

\
|

3
2
3
1
100 ,
3
100
.
La variable alatoire F = X
100
1
suit alors approximativement la loi N
|
|

\
|
30
2
,
3
1
.
On pose
30
2
3
1

=
F
T , qui suit la loi N (0, 1). On a P(F h) = P(T
2
30
3
1
|

\
|
h ) = 0,95 d'o,
d'aprs la table de la loi normale centre rduite,
30
2
645 , 1
3
1
+ = h 0,41.
La rgle de dcision du test de 100 questions, au seuil de 5 % est donc :
Soit x le nombre de bonnes rponses. Si x 41, le candidat est recal. Si x 42, le candidat
est admis.
2) Puissance du test
Sous l'hypothse p = p
0
, la variable alatoire F suit approximativement la loi normale
N
|
|

\
|

100
) 1 (
,
0 0
0
p p
p . On a donc P(F > 0,41) = P(T > 10
) 1 (
41 , 0
0 0
0

p p
p
) et la probabilit
d'tre reu est donc bien 1 ( p
0
) = P( F > 0,41) =
|
|

\
|


) 1 (
41 , 0
10 1
0 0
0
p p
p
.
Pour un tudiant tel que la probabilit de bonne rponse est p = 0,4 , la probabilit d'tre
reu l'examen est 1 - (0,4) = 1 - (0,204) 0,42.
Pour un tudiant tel que la probabilit de bonne rponse est p = 0,6 , la probabilit d'tre
reu l'examen est 1 - (0,6) = 1 - (-3,88) 0,99995.
Ces rsultats sont "raisonnables", c'est dire conformes ce que l'on attend d'un examen.
Ce test est donc "puissant" en ce sens que son pouvoir de discrimination est important.















Comparaison des courbes de puissance des tests au seuil de 5 %, pour n = 20 questions
et pour n = 100 questions.


ANNALES DU B.T.S. TESTS D'HYPOTHESES
162





ANNALES DU B.T.S. TESTS D'HYPOTHESES
163

T.P. Excel : NORMALITE D'UNE PRODUCTION
TEST DU KHI-DEUX


On souhaite placer sous contrle statistique la fabrication
d'un galet (sorte de roulette) pour la cote de 10 mm
correspondant la figure ci-contre.
On souhaite tester si la production se fait, pour cette cote,
selon la loi normale N (10 ; 0,1).
Pour cela, on prlvera dans la production un chantillon
alatoire de taille 100. Vu la quantit produite, on pourra
considrer que ce prlvement est effectu avec remise.

I SIMULATION D'UN ECHANTILLON
DE 100 GALETS EXTRAIT D'UNE PRODUCTION

Ouvrir Excel.
En A1 crire : anormal.
En A2 entrer la formule : =ENT(ALEA()+0,5)
Cette formule permettra qu'une fois sur deux, la
production simule ne soit pas de distribution
normale.
En B1 crire : chantillon.
En B2 entrer la formule :
=10+0,1*COS(2*PI()*ALEA())*RACINE(2*LN(ALEA()))+$A$2*0,3*ENT(ALEA()+0,1)
La premire partie de cette formule simule une ralisation selon la loi N (10 ; 0,1) alors que
la seconde partie, lorsque A2 contient la valeur 1, introduit une perturbation.
Cliquer dans B2 puis, lorsque le pointeur de la souris s'est transform en croix noire,
glisser pour recopier vers le bas jusqu'en B101.
Vous allez regrouper les rsultats de l'chantillon en 10 classes.
En C1 crire : sup classes.
En C2 entrer la borne suprieure de la premire classe, soit : 9,65.
En C3 entrer la formule : =C2+0,1 puis recopier vers le bas jusqu'en C11.
En D1 crire : centres.
En D2 entrer la formule : =C2 0,05 puis recopier vers le bas jusqu'en D11.
En E1 crire : effectifs obs.
De faon a compter les effectifs de chaque classe, slectionner (croix blanche) les cellules
de E2 E11 puis, sans appuyer sur Entre, taper la formule :
=FREQUENCE(B2:B101;C2:C11)
puis valider en appuyant simultanment sur CTRL MAJUSCULE ENTREE.
On doit comparer les effectifs observs ceux, thoriques, que donnerait la loi normale
N (10 ; 0,1).
En F1 crire : probas tho.
En F2 entrer la formule : =0,1*LOI.NORMALE(D2;10;0,1;FAUX)
10 mm
ANNALES DU B.T.S. TESTS D'HYPOTHESES
164
puis recopier vers le bas jusqu'en F11.
En G1 crire : effectifs tho.
En G2 entrer la formule : =100*F2 puis recopier vers le bas jusqu'en G11.
Complter la feuille rponse.
II COMPARAISON DES HISTOGRAMMES
Une premire faon d'tudier la
normalit de la production est de
comparer les histogrammes observs et
thoriques.
Slectionner les cellules de E2 E11
ainsi que (appuyer sur la touche CTRL)
de G2 G11 puis cliquer sur l'icne de
l'Assistant graphique.
Etape 1/4 :
Choisir Histogramme et cliquer sur
Suivant.
Etape 2/4 :
Dans l'onglet Srie, la rubrique
Etiquette des abscisses (X) : sortir vers
la feuille de calcul (en cliquant sur
l'icne) pour slectionner les centres des
classes, puis revenir dans l'Assistant
graphique par l'icne analogue.
Cliquer sur Terminer.


Complter la feuille rponse.
II TEST DU KHI-DEUX
Vous allez regrouper les classes trop faible effectif.
En H1 crire : xi.
En H4 entrer la formule : =E2+E3+E4
En H5 entrer la formule : =E5 et recopier vers le bas jusqu'en H7.
En H8 entrer la formule : =SOMME(E8:E11)
En I1 crire : ti.
En I4 entrer la formule : =G2+G3+G4
En I5 entrer la formule : =G5 et recopier vers le bas jusqu'en I7.
En I8 entrer la formule : =SOMME(G8:G11)
La procdure du test du khi-deux
Soit X la variable alatoire qui tout galet pris au hasard dans la production associe sa cote
en mm.
On considre un chantillon de taille 100 de cette variable alatoire, fournissant pour
chaque classe des effectifs x
1
, , x
6
.
Il s'agit de comparer ces effectifs aux valeurs thoriques.



Assistant
graphique
Sortie vers
la feuille de
calcul
ANNALES DU B.T.S. TESTS D'HYPOTHESES
165
Centre de classe Effectifs observs Effectifs thoriques
9,7 x
1
t
1

9,9 x
2
t
2


10,1
10,35 x
5
t
5


Il faut dcider d'un critre d'adquation des observations par rapport au modle thorique.
De faon classique, on choisira l'cart quadratique rduit, not
2
obs
et valant
2
obs
=

5
1
2
) (
i
i
i i
t
t x
. De grandes valeurs de
2
obs
rendraient le modle suspect.
En J1 crire : cart.
En J4 entrer la formule : =(I4-H4)^2/I4 puis recopier vers le bas jusqu'en J8.
En I10 crire : khi 2 obs.
En J10 entrer la formule : =SOMME(J4:J8)
Pour tudier la variabilit de ce critre, on introduit la variable alatoire

=
5
1
2
) (
i
i
i i
t
t X
T
avec 100
5
1
=

= i
i
X .
On montre que la loi de T est approximativement une loi connue sous le nom de khi 2 4
degrs de libert (en effet la relation ci-dessus fait que la valeur de X
5
est dtermine ds
que les valeurs de X
1
, , X
4
sont connues).
La loi du khi-deux est tabule. Sur Excel :
La fonction KHIDEUX.INVERSE( probabilit p ; degrs de libert) renvoie la valeur t
telle que P(T > t) = p.
En I11 crire : limite accept.
En J11 entrer la formule : =KHIDEUX.INVERSE(0,05;4)
En I13 crire : test khi 2.
En J13 entrer la formule : =SI(J10<J11;"NORMAL";"ANORMAL")
En I14 crire : ralit.
En J14 entrer la formule : =SI(A2=0;"NORMAL";"ANORMAL")
Faire plusieurs fois F9 pour renouveler les simulations.

Complter la feuille rponse.

ANNALES DU B.T.S. TESTS D'HYPOTHESES
166

FEUILLE REPONSE
NOMS : .............................................................................................................
I SIMULATION D'UN ECHANTILLON DE 100 GALETS EXTRAIT
D'UNE PRODUCTION
1) Quelle est l'amplitude des 10 classes o l'on regroupe les donnes de l'chantillon ?
...........................................................................................................................................................
2) On considre la variable alatoire X qui, chaque galet pris au hasard dans la
production, associe sa cote en mm. On suppose que X suit la loi normale N (10 ; 0,1) de
fonction de densit f. On a alors P(9,55 X 9,65) =

65 , 9
55 , 9
) ( dx x f .
Justifier que cette probabilit vaut environ 0,1 f(9,6) (c'est ainsi qu'elle est calcule en
F2). ....................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
II COMPARAISON DES HISTOGRAMMES
Comment, en analysant les histogrammes, peut-on dceler que la production ne se fait pas
selon une loi normale ?
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
II TEST DU KHI-DEUX
Construction d'un test du khi-deux au seuil de 5%
Choix des hypothses :
H
0
: pour tout 1 i 5, la probabilit que X prenne une valeur dans la classe i est p
i
.
H
1
: il existe i tel que la probabilit prcdente diffre de p
i
.
Dtermination de la rgion critique : Si H
0
est vraie, la variable alatoire

=
5
1
2
) (
i
i
i i
t
t X
T , o X
i
est la variable alatoire correspondant l'effectif de la i
me
classe,
suit approximativement la loi du khi-deux 4 degrs de libert.
Le rel t tel que, P(T > t) = est donn par Excel : on a t
D'o la zone d'acceptation de H
0
au seuil :
Rgle de dcision : Soit
2
obs
l'cart quadratique rduit obtenu entre les effectifs observs
et les effectifs thoriques. Le nombre
2
obs
est contenu dans la cellule .
Si
2
obs
t on accepte H
0
au seuil de 5%. Si
2
obs
> t on rejette H
0
.
Utilisation du test : Observez-vous des erreurs de dcision ? .......................................................
...........................................................................................................................................................
En J11 remplacer 0,05 par 0,10. A quoi cela correspond-il ? ..........................................................
Qu'observe-t-on sur de nombreuses simulations ? ...........................................................................
ANNALES DU B.T.S. TESTS D'HYPOTHESES
167

Elments de rponse pour l'activit
"NORMALITE D'UNE PRODUCTION TEST DU KHI 2"

Un exemple de dcision correcte :


























Au seuil de 5%, les erreurs de premire espce se produisent, sous H
0
, dans 5% des cas,
donc ici 2,5% des simulations (on est sous H
0
dans 50% des cas).
Une erreur de premire espce :



















ANNALES DU B.T.S. TESTS D'HYPOTHESES
168


ANNALES DU B.T.S. TESTS D'HYPOTHESES
169

Annales du B.T.S. : TESTS D'HYPOTHESES


TEST D'UNE FREQUENCE

1 Analyses biologiques 1999


Les statistiques ont permis d'tablir qu'en priode de comptition la probabilit, pour un
sportif pris au hasard, d'tre dclar positif au contrle antidopage est gale 0,02.
On dcide de construire un test qui, la suite des contrles sur un chantillon de 50 sportifs
prlev au hasard, permette de dcider si, au seuil de signification de 10 %, le pourcentage
de sportifs contrls positifs est de p = 0,02.

a) Construction du test bilatral :
Soit F la variable alatoire qui, tout chantillon alatoire (suppos non exhaustif) de 50
sportifs contrls, associe le pourcentage de sportifs contrls positivement.
On suppose que F, suit la loi normale N
|
|

\
|

n
p p
p
) 1 (
, o p = 0,02 et n = 50.
Enoncer une hypothse nulle H
0
et une hypothse alternative H
1
pour ce test bilatral.
Dterminer, sous l'hypothse H
0
, le rel positif a tel que P(p a F p + a) = 0,9.
Enoncer la rgle de dcision du test.

b) Utilisation du test :
Dans l'chantillon E deux contrles antidopage ont t dclars positifs. En appliquant la
rgle de dcision du test cet chantillon assimil un chantillon alatoire non exhaustif,
peut-on conclure au seuil de risque 10 % que l'chantillon observ est reprsentatif de
l'ensemble de la population sportive ?


2 Biochimiste 1994


On effectue des contrles d'alcoolmie d'automobilistes dans une rgion donne un jour
donn. Les statistiques permettent d'tablir que la probabilit qu'un automobiliste choisi au
hasard dans les conditions prcdentes prsente un contrle positif est 2 % .
Dans une ville donne de cette rgion, on effectue au hasard 200 contrles de taux
d'alcoolmie d'automobilistes, dans les conditions prcdentes.
Les taux d'alcoolmie mesurs ont donn les rsultats suivants :

Taux d'alcoolmie T
i
en g/l [0 ; 0,2[ [0,2 ; 0,4[ [0,4 ; 0,6[ [0,6 ; 0,8[ [0,8 ; 1[ [1 ; 1,2[ [1,2 ; 1,5[ [1,5 ; 2[
Effectifs 42 78 52 19 4 2 2 1

1 En choisissant pour valeurs observes les centres de classes, calculer les valeurs
approches de la moyenne x et de l'cart type s du taux d'alcoolmie de cet chantillon.

Epreuves
corriges
de B.T.S.
ANNALES DU B.T.S. TESTS D'HYPOTHESES
170
2 Un contrle est considr comme positif si le taux d'alcoolmie mesur est suprieur ou
gal 0,8 g/l. Calculer la frquence (proportion) de contrles positifs de cet chantillon.

3 On dsigne par F la variable alatoire qui, tout chantillon de 200 contrles, associe la
proportion des contrles positifs de cet chantillon. On assimile ces chantillons des
chantillons non exhaustifs et on admet que F suit la loi normale N (p ,
200
) 1 ( p p
) o
p = 0,02 est la proportion de contrles positifs dans la population de cette rgion.
Construire un test qui permette de dcider, au seuil de 5 %, si l'chantillon prcdent est
reprsentatif de l'ensemble des contrles de la rgion.


3 Groupement D 2001 (Test unilatral)

Un magicien prtend qu'il peut souvent deviner distance la couleur d'une carte tire au
hasard d'un jeu de cartes bien battu et comportant des cartes de deux couleurs diffrentes
en nombre gal.
On appelle p la probabilit que le magicien donne une rponse juste (succs) lors d'un
tirage.
Si le magicien est un imposteur on a p =
2
1
, sinon p >
2
1
.
On appelle F la variable alatoire qui, tout chantillon de taille n, associe la frquence des
succs obtenus par le magicien au cours des n tirages d'une carte. On admet que F suit la
loi normale de moyenne inconnue p et d'cart type
n
p p ) 1 (
et on choisit n = 100.
On construit un test unilatral permettant de dtecter, au risque de 5%, si le magicien est
un imposteur.
On choisit comme hypothse nulle H
0
: p =
2
1
, et comme hypothse alternative H
1
: p >
2
1
.

1. Calculer, sous l'hypothse H
0
, le rel positif h tel que ( ) 95 , 0
2
1
= + h F P .

2. Enoncer la rgle de dcision du test.

3. Sur un chantillon de taille 100, le magicien a obtenu 64 succs. Peut-on considrer, au
risque de 5%, que le magicien est un imposteur ?


4 Etude et conomie de la construction 1998


Une entreprise de btiment a constat qu'un certain nombre de mitigeurs thermostatiques,
poss par elle, avait un mauvais fonctionnement. Ce mauvais fonctionnement est d une
pice cylindrique monte sur cette catgorie de mitigeur. L'entreprise, pose 304 mitigeurs.
La variable alatoire F qui, tout chantillon de 304 pices, associe la frquence de dfauts
est une variable alatoire qui suit la loi normale N (p,
304
) 1 ( p p
).
La production est suffisamment importante pour que l'on puisse assimiler tout chantillon
de 304 pices 304 tirages alatoires et indpendants.
ANNALES DU B.T.S. TESTS D'HYPOTHESES
171

a) Construire un test unilatral permettant d'accepter ou de refuser l'hypothse selon
laquelle, au seuil de 5%, p = 0,05. Pour cela :
- on choisira pour hypothse H
0
: p = 0,05 et pour hypothse H
1
: p > 0,05 ;
- on dterminera le rel positif a tel que sous l'hypothse H
0
: P(F a) = 0,95 ;
- on dterminera la rgion critique au seuil de 5 % ;
- on noncera la rgle de dcision.

b) On sait qu'il y a 18 dfauts sur 304 pices. Utiliser le test prcdent pour conclure si, au
seuil de 5 %, l'on accepte ou refuse l'affirmation : p = 0,05.


5 Maintenance 1993


Une machine fabrique des tiges en grande srie. La production tant importante on assimile
tout prlvement d'chantillon un prlvement avec remise.
La machine est suppose bien rgle quand la proportion de pices acceptables est
suprieure ou gale 90 %. Pour contrler le rglage de la machine on construit un test
permettant de dcider si, au seuil de 5 %, la machine est bien rgle et on prlve de temps
en temps des chantillons alatoires de 150 tiges.

a) Construction du test unilatral :
Soit F la variable alatoire qui tout chantillon alatoire de 150 tiges associe le
pourcentage de tiges acceptables dans cet chantillon.
On choisit pour hypothse nulle H
0
: p = 90 % ,
et pour hypothse alternative H
1
: p < 90 % .
Dterminer le nombre rel h tel que sous l'hypothse H
0
P(F > h) = 0,95.
Enoncer la rgle de dcision de ce test.

b) Utilisation du test :
On prlve un chantillon alatoire de 150 tiges. On trouve 22 tiges dfectueuses.
Quel est le pourcentage de tiges acceptables de cet chantillon ?
En appliquant la rgle de dcision du test cet chantillon non exhaustif, peut-on conclure,
au seuil de 5 %, que la machine est bien rgle ?

TEST DE COMPARAISON DE DEUX FREQUENCES

6 Comptabilit Gestion Nouvelle Caldonie 1994


Les nouveaux modles de tlviseurs " 70 cm ", que va fabriquer une usine, sont de deux
types : modle (1) et modle (2). Une enqute pralable la fabrication, ralise auprs de
400 mnages de la population S des mnages des "quartiers sud" de la ville V, indique
qu'entre les deux modles de tlviseurs, 63 % prfrent le modle (1). La mme enqute,
ralise auprs de 500 mnages de la population N
des mnages des "quartiers nord" de la ville, indique que 67 % prfrent le modle (1).
ANNALES DU B.T.S. TESTS D'HYPOTHESES
172
On note F
S
la variable alatoire qui, tout chantillon de 400 mnages pris au hasard et
avec remise dans la population S, associe la proportion de mnages de cet chantillon qui
prfrent le modle (1).
On note F
N
la variable alatoire qui, tout chantillon de 500 mnages pris au hasard et
avec remise dans la population N, associe la proportion de mnages de cet chantillon qui
prfrent le modle (1).
On suppose que la loi de la variable D = F
S
F
N
est approximativement une loi normale
de moyenne p
S
p
N
inconnue et d'cart type 0,032 (p
S
et p
N
tant les pourcentages de
prfrence dans les populations S et N).

Construire, puis mettre en oeuvre un test permettant de dcider s'il y a une diffrence
significative, au seuil 5 %, entre les pourcentages de prfrence issus des deux chantillons
de l'enqute pralable.

On peut ajouter pour aider les candidats:
- L'hypothse H
0
est donne par p
S
= p
N

, noncer l'hypothse alternative H
1
.
- Dterminer l'intervalle [ a; a] tel que, sous l'hypothse H
0
, P( a D a) = 0,95
- Enoncer la rgle de dcision du test.
- Utiliser ce test avec les deux chantillons de l'nonc et conclure.

On peut galement construire un test unilatral de comparaison.

TEST D'UNE MOYENNE

7 Groupement C 2001


Un client rceptionne une commande. Il prlve un chantillon de 125 billes choisies au
hasard et avec remise dans le lot reu et constate que le diamtre moyen est gal 25,1.
Pour les billes fabriques par l'entreprise, la variable alatoire X qui prend pour valeurs
leurs diamtres suit une loi normale d'cart type 0,44.
L'entreprise s'est engage ce que la moyenne des diamtres des billes fournies soit de 25.
Le client dcide de construire un test bilatral permettant de vrifier l'hypothse selon
laquelle le diamtre des billes du lot reu est de 25.

1) Quelle est l'hypothse nulle H
0
? Quelle est l'hypothse alternative H
l
?

2) On dsigne par X la variable alatoire qui, tout chantillon de 125 billes, prises au
hasard et avec remise, associe la moyenne des diamtres obtenus.
a) Donner sous l'hypothse nulle la loi de X . En prciser les paramtres.
b) Dterminer le nombre a tel que P(25 a < X < 25 + a) = 0,95
c) noncer la rgle de dcision du test.

3) Au vu de l'chantillon, au risque de 5 %, que peut conclure le client sur le respect de
l'engagement de l'entreprise ?

ANNALES DU B.T.S. TESTS D'HYPOTHESES
173

8 Domotique 1998


On fabrique des pices en srie. Soit X la variable alatoire qui, toute pice prise au
hasard dans la production, associe sa cote exprime en mm. On sait que X suit une loi
normale d'cart type = 2,4 mm, mais on a des doutes sur l'esprance mathmatique de
X.
Afin de vrifier l'esprance mathmatique de X, on prlve un chantillon de 50 pices. On
assimile tout chantillon de 50 pices un chantillon alatoire non exhaustif. Sur le
tableau suivant on trouve la distribution des mesures des cotes arrondies l'entier le plus
proche :

Cotes 147 148 149 150 151 152 153 154
Effectifs 2 3 5 10 9 9 8 4

Calculer la moyenne x de cet chantillon. On ne calculera pas son cart type.
On suppose que la variable alatoire X qui tout chantillon de 50 pices prleves au
hasard associe la moyenne des cotes des pices de cet chantillon suit la loi normale
N ( ;
50
4 2,
).
On veut construire un test bilatral pour permettre d'accepter ou de rejeter, au risque 5 %,
l'hypothse selon laquelle l'esprance mathmatique de X est 150 mm.
On prend comme hypothse nulle H
0
: " = 150",
et comme hypothse alternative H
1
: " 150".

a) Trouver un rel positif h tel que, sous l'hypothse H
0
:
P(150 h X 150 + h) = 0,95
b) Enoncer la rgle de dcision.
c) Utiliser ce test avec l'chantillon des 50 pices propos dans cet nonc et conclure.


9 Systmes constructifs bois et habitat 1999


Une machine fabrique des barres en grande srie. On veut vrifier le bon rglage de la
machine.

On appelle L la variable alatoire qui prend pour valeur la longueur d'une barre. On admet
que L suit une loi normale de moyenne et d'cart type 1.

Dans le cas o la machine est bien rgle, la moyenne est gale 1000.
On appelle L la variable alatoire qui prend pour valeur la moyenne des longueurs des
100 barres d'un chantillon alatoire.

1 On construit un test d'hypothse bilatral permettant de vrifier le bon rglage de la
machine au seuil de 2 %.
a) Donner l'hypothse nulle H
0
et l'hypothse alternative H
1
.
b) Sous l'hypothse H
0
, quelle est la loi de L ?
c) Dterminer la rgion critique et noncer la rgle de dcision relative ce test.
ANNALES DU B.T.S. TESTS D'HYPOTHESES
174

2 a) On a regroup par classes les longueurs des barres d'un chantillon :

Longueur [997 ; 999[ [999 ; 1001[ [1001 ; 1003[
Quantit 14 75 11

Dterminer une valeur approche de la moyenne l de la longueur des barres prleves, en
supposant que dans chaque classe tous les lments sont situs au centre.
b) Au vu de cet chantillon, que peut-on conclure quant au rglage de la machine ?


10 Groupement C 1999


Un lyce achte son papier pour photocopieur une entreprise. On appelle X la variable
alatoire qui chaque feuille, prise au hasard, associe son paisseur en microns. Le
fabricant spcifie que X suit la loi normale de moyenne 110 et d'cart type 3.
Le lyce met l'preuve les affirmations du fabricant concernant la moyenne de la variable
alatoire X. On suppose que l'cart type est connu et gal 3. Pour cela, il tudie un
chantillon de 1000 feuilles prises au hasard dans une livraison. L'tude de l'paisseur de
ces feuilles donne, en microns, une moyenne de 109,9.

1 On effectue un test d'hypothse bilatral ; prciser quelle est l'hypothse nulle H
0
et
l'alternative H
1
.

2 On dsigne par X la variable alatoire qui tout chantillon de 1000 feuilles tires au
hasard et avec remise associe la moyenne des paisseurs des feuilles de cet chantillon.
Quelle est, sous l'hypothse H
0
, la loi de probabilit de X ?

3 Au vu de l'chantillon tudi, peut-on admettre que la moyenne est 110 ? Faire un test
au seuil de 10 %.


11 Comptabilit et Gestion 1999


Un fabricant de vtements de sport et de loisirs commercialise directement une partie de sa
production.
Le fabricant dsire savoir si la campagne promotionnelle entreprise a permis de modifier le
montant moyen des achats.
Il ralise une enqute auprs d'un chantillon de 50 client choisis au hasard et avec remise ;
la dpense moyenne pour cet chantillon est de 597 F.
Soit Y la variable alatoire qui, tout chantillon de 50 clients pris au hasard et avec
remise, associe moyenne de leurs achats.
On rappelle que Y suit la loi normale de moyenne et d'cart type
50

(on prendra pour


la valeur 195).

1
re
rdaction
Construire un test bilatral permettant d'accepter ou de refuser, au seuil de signification de
5 % l'hypothse selon laquelle le montant moyen des achats a t modifi.
ANNALES DU B.T.S. TESTS D'HYPOTHESES
175
Pour rpondre cette question :
choisir pour hypothse nulle H
0
: = 550 et pour hypothse alternative H
1
: 550,
dterminer la rgion critique au seuil de signification de 5%,
noncer la rgle de dcision,
utiliser le test avec l'chantillon prcdent et conclure.

2
me
rdaction
Construire un test unilatral permettant d'accepter ou de refuser, au seuil de signification
de 5 % l'hypothse selon laquelle le montant moyen des achats a t augment.
Pour rpondre cette question :
choisir pour hypothse nulle H
0
: = 550 et pour hypothse alternative H
1
: > 550,
dterminer le nombre rel positif h tel que P(Y h) = 0,95, en dduire la rgion critique au
seuil de signification de 5%,
noncer la rgle de dcision,
utiliser le test avec l'chantillon prcdent et conclure.

Dans l'preuve de l'examen on aurait d prciser si le test est unilatral ou bilatral.


12 Traitement des matriaux 1999


Un client commande un lot de pices dont on lui annonce que la moyenne des paisseurs
de nickel dpos est 25 microns. Ce client veut vrifier cette affirmation et mesure les
paisseurs de nickel d'un chantillon de 30 pices prleves avec remise dans ce lot. Il
obtient les rsultats suivants :

Epaisseurs en microns [22 ; 22,5[ [22,5 ; 23[ [23 ; 23,5[ [23,5 ; 24[ [24 ; 24,5[
Effectifs 1 1 2 3 5
Epaisseurs en microns [24,5 ; 25[ [25 ; 25,5[ [25,5 ; 26[ [26 ; 26,5[ [26,5 ; 27[
Effectifs 6 4 4 2 2


1 Calculer la moyenne
e
x et l'cart type
e
, de cet chantillon 10
2
prs.
Les calculs intermdiaires ne sont pas demands.

2 En dduire que l'cart type estim du lot entier est, 10
2
prs, de 1,12.

3 Soit X la variable alatoire qui, tout chantillon de taille n = 30 prlev au hasard et
avec remise dans ce lot, associe l'paisseur moyenne de nickel dpos sur les 30 pices
prleves. On suppose que X suit la loi normale de paramtres et
n

o et sont la
moyenne et l'cart type des paisseurs de nickel en microns dpos sur les pices du lot.

1
re
rdaction
a) On prend = 1, 12. Construire un test bilatral permettant d'accepter ou de refuser ce
lot, au seuil de 5%, vu le cahier des charges qui impose = 25.
b) Doit-on, partir de l'chantillon indiqu dans la question 1, accepter ou refuser ce lot en
utilisant ce test ?

ANNALES DU B.T.S. TESTS D'HYPOTHESES
176
2
me
rdaction
a) On prend = 1, 12. Construire un test unilatral permettant d'accepter ou de refuser ce
lot, au seuil de 5%, vu le cahier des charges qui impose > 25.
b) Doit-on, partir de l'chantillon indiqu dans la question 1, accepter ou refuser ce lot en
utilisant ce test ?

Dans cette question, on aurait pu prciser si le test est unilatral ou bilatral.


13 Comptabilit et Gestion 1990


Avant d'engager une campagne publicitaire, la direction de l'hypermarch vous demande
de construire un test unilatral qui, au vu des chiffres d'affaires journaliers des trente jours
ouvrables suivant cette campagne, permettra de dcider si, au seuil de signification 5%, la
moyenne des chiffres d'affaires journaliers a augment, c'est--dire dpass 1,5 million de
francs, la suite de cette campagne publicitaire.

1 Construction du test unilatral :
On note la moyenne inconnue de la nouvelle population des chiffres d'affaires
journaliers obtenus aprs la campagne publicitaire et on suppose que l'cart type de cette
population est 0,3 million de francs.
Soit Z la variable alatoire qui, tout chantillon alatoire, non exhaustif, de trente chiffres
d'affaires journaliers de cette nouvelle population, associe la moyenne de ceux-ci. On
suppose que Z suit la loi normale de moyenne et d'cart type
30
3 0,

a) Choisir une hypothse nulle H
0
et une hypothse alternative H
1
pour ce test unilatral .
b) Dterminer le nombre rel h tel que, sous l'hypothse H
0
, on ait : P(Z h ) = 0,95.
c) noncer la rgle de dcision de ce test.

2 Utilisation de ce test :
Les chiffres d'affaires journaliers pendant les trente jours ouvrables suivant la campagne
publicitaire sont donns par le tableau suivant :

chiffre daffaires 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 2,3
Nombre de jours 1 2 2 8 8 2 2 1 2 1 0 1

a) Calculer la moyenne des chiffres d'affaires journaliers pendant ces trente jours.
b) En appliquant la rgle de dcision du test cet chantillon de trente chiffres d'affaires
journaliers que l'on assimile un chantillon alatoire non exhaustif, peut-on conclure, au
seuil de signification 5 % qu' la suite de la campagne publicitaire la moyenne des chiffres
d'affaires journaliers a dpass 1,5 millions de francs ?

ANNALES DU B.T.S. TESTS D'HYPOTHESES
177
TEST DE COMPARAISON DE DEUX MOYENNES

14 Chimiste 1999


Deux laboratoires A et B fabriquent des tubes essai et les conditionnent dans des paquets.
Tous les paquets contiennent le mme nombre de tubes.

1. On note X
1
la variable alatoire prenant pour valeur le nombre de tubes dfectueux par
paquet provenant de l'entreprise A. Sur un chantillon alatoire de 49 paquets provenant du
laboratoire A les nombres des tubes dfectueux par paquet sont les suivants :

7 5 5 4 4 4 9 7 9 2 7 8 7 8 4
4 9 10 5 10 6 4 5 6 1 2 5 7 8 0
6 0 1 5 2 0 5 2 3 3 4 1 3 10 1
0 10 2 7

Calculer une valeur approche 10
2
prs de la moyenne m
1
et de l'cart type s
1
de cet
chantillon. On admet dans la suite de cet exercice qu'une estimation ponctuelle
1
de la
moyenne
1
de la variable alatoire X
1
est 4,84 et qu'une estimation ponctuelle
1
de
l'cart type
1
de X
1
est 2,99.

2. On note X
2
la variable alatoire prenant pour valeur le nombre de tubes dfectueux par
paquet provenant de l'entreprise B. Sur un chantillon alatoire de 64 paquets provenant de
l'entreprise B on a obtenu une moyenne m
2
de 3,88 tubes dfectueux et un cart type
2
de
1,45.
En dduire une estimation ponctuelle
2
de la moyenne
2
de la variable alatoire X
2
et
une estimation ponctuelle
2
de l'cart type
2
de X
2
.

3. On se propose de construire un test d'hypothse pour comparer les qualits de
production des laboratoires A et B.
On note
1
X la variable alatoire prenant pour valeur le nombre moyen de tubes dfectueux
par paquet dans des chantillons alatoires de 49 paquets de la production du laboratoire A.
On note
2
X la variable alatoire prenant pour valeur le nombre moyen de tubes dfectueux
par paquet dans des chantillons alatoires de 64 paquets de la production du laboratoire B.

3.1 Le nombre d'observations tant important, on admet que les lois de probabilit de
1
X
et
2
X peuvent tre approches par des lois normales.
Exprimer la moyenne et l'cart type de chacune de ces variables alatoires en fonction de
ceux de X
1
et de X
2
. Dans toute la suite, on considre donc que
1
X et
2
X sont deux
variables alatoires indpendantes suivant une loi normale.

3.2 On note D la variable alatoire telle que : D =
1
X
2
X .
Quelle est la loi de probabilit de D ? Dterminer la moyenne et l'cart type de D. Justifier.

4. Dans cette question, on admet que D suit la loi normale N (
1

2
; 0,46).
On pose pour hypothse nulle H
0
:
1
=
2
et pour hypothse alternative H
1
:
1

2
.

4.1 Calculer, sous l'hypothse H
0
, les nombres h et k tels que
P ( h < D < h) = 0,99 et P ( k < D < k) = 0,95.
ANNALES DU B.T.S. TESTS D'HYPOTHESES
178

4.2 Enoncer la rgle de dcision relative ce test lorsqu'on choisit un seuil de signification
de 1 %, puis de 5 %.

4.3 Peut-on conclure aprs examen des chantillons donns dans les questions 1 et 2 que la
diffrence des moyennes observes est significative au seuil de risque de 1 % ? Au seuil de
risque de 5 % ?


15 Groupement D 1999 (Test de comparaison unilatral !)


Une entreprise fabrique des pots de peinture.
On se propose d'tudier les variations de la quantit d'un certain produit A contenu dans
chaque pot.
On a contrl le dosage du produit A la sortie de deux chanes de fabrication.
Deux chantillons de 100 pots ont t analyss ; l'un provient de la chane n l, l'autre de la
chane n 2.
Le tableau suivant donne la rpartition de l'chantillon de la chane n l en fonction de la
masse de produit A exprime en grammes.

m (en g) [100, 102[ [102, 104[ [104, 106[ [106, 108[ [108, 110[ [110, 112[ [112, 114[ [114, 116[
Effectifs 1 3 25 32 27 6 4 2

On donne des valeurs approches de la moyenne m
2
et de l'cart type s
2
de l'chantillon
fabriqu par la chane n 2 : m
2
= 107 et s
2
= 2 (en grammes).

Dans les questions 1 et 2 les valeurs seront arrondies au dixime le plus proche.

l En prenant les centres des classes, calculer une valeur approche de la moyenne m
l
et de
l'cart type s
1
de l'chantillon issu de la chane n l.

2 En considrant les rsultats obtenus dans la premire question, donner les estimations
ponctuelles :
des quantits moyennes
1
et
2
de produit A pour les productions de ces deux chanes,
des carts types
1
et
2
correspondants.

3 On se propose de tester si la diffrence des moyennes observes dans les deux
chantillons est due des fluctuations d'chantillonnage ou si la chane de fabrication n l
produit des pots contenant davantage de produit A que la chane n 2.
On note
1
X la variable alatoire qui tout chantillon alatoire de 100 pots provenant de la
chane n 1 associe la quantit moyenne de produit A dans cet chantillon.
On note
2
X la variable alatoire qui tout chantillon alatoire de 100 pots provenant de
la chane n 2 associe la quantit moyenne de produit A dans cet chantillon.
On admettra que :

1
X suit une loi normale de paramtres
1
et
10
1

;

2
X suit une loi normale de paramtres
2
et
10
2

;

1
X et
2
X sont des variables alatoires indpendantes ;
ANNALES DU B.T.S. TESTS D'HYPOTHESES
179
D =
1
X
2
X suit une loi normale.
On choisit l'hypothse nulle H
0
:
1
=
2
contre l'hypothse alternative H
1
:
1
>
2
.

a) Calculer la variance de la variable alatoire D. On appelle (D) son cart type.
Vrifier que (D) 0,32.
b) Calculer au centime le plus proche le rel a tel que, sous H
0
, P(D a) = 0,99.
c) Au vu des rsultats observs, l'hypothse nulle H
0
est-elle accepte ou rejete (au seuil
de 1 %) ?

ANNALES DU B.T.S. TESTS D'HYPOTHESES
180

Corrig des exercices d'preuves de B.T.S.

1 Analyses biologiques 99
a) Construisons un test bilatral permettant, la
suite du prlvement au hasard d'un chantillon de
n = 50 sportifs, de tester au seuil de 10%
l'hypothse H
0
selon laquelle le pourcentage de
sportifs contrls positivement est p = 0,02.
L'hypothse alternative tant H
1
: p 0,02.

On appelle F la variable alatoire qui, tout
chantillon de 50, associe le pourcentage de sportifs
contrls positivement.
On admet que sous l'hypothse H
0
, F suit la loi
normale N
|
|

\
|

n
p p
p
) 1 (
, o p = 0,02 et n =
50.
donc F suit N (0,02 ; 0,0198).
(Remarque : cette approximation est discutable,
dans la mesure o la condition np > 15 n'est pas
ralise).
Dterminons la rgion critique :
On pose T =
0198 , 0
02 , 0 F
alors T suit la loi normale
centre rduite.
Cherchons un rel a positif tel que :
P(0,02 a F 0,02 + a) = 0,9 ,
P(
0198 , 0
a
T
0198 , 0
a
) = 0,9
2 P(T
0198 , 0
a
) 1 = 0,9 ,
P(T
0198 , 0
a
) = 0,95 .
Par lecture inverse de la table de la loi normale
centre rduite on a
0198 , 0
a
= 1,645
donc a = 1,645 0,0198 = 0,0326.
Ainsi la rgion d'acceptation du test est
I = [0,02 0,0326 ; 0,02 + 0,0326] soit
I = [ 0,0124 ; 0,0526].
La rgion critique est donc IR I
Enonc de la rgle de dcision:
On calcule dans un chantillon alatoire, suppos
non exhaustif, de taille 50, le pourcentage f
d'individus sportifs contrls positivement.
Si f I on accepte H
0
et l'chantillon observ est
reprsentatif de l'ensemble de la population sportive
au seuil de risque de 10%
Si f I on rejette H
0
et on accepte H
1
. Dans ce cas
l'chantillon observ n'est pas reprsentatif de
l'ensemble de la population sportive au seuil de
risque de 10%.
b) Application du test :
Dans l'chantillon E , 2 contrles antidopage ont t
dclars positifs sur 50 donc f =
50
2
= 0,04, f I



Par consquent H
0
est accepte et l'chantillon
observ est reprsentatif de l'ensemble de la
population sportive au risque de 10%.

2 - Biochimiste 94
1 x = 0,386 s = 0,249 10
- 3
prs.
2 f = 0,045 .
3 Construction du test :
Choix de H
0
: p = 0,02 ;
Choix de H
1
: p 0,02
Dtermination de la rgion critique :
Sous H
0
on a p = 0,02 , F suit la loi normale
N (p,
200
1 ) p ( p
), F suit la loi N (0,02 ; 0,0099).
La variable alatoire : T =
0099 0,
p F
associe F,
suit la loi normale N (0,1). P(p a F p + a) =
0,95 quivaut P(-
0099 0,
a
T
0099 0,
a
) = 0,95
et
2(
0099 0,
a
) - 1 = 0,95 et
0099 0,
a
= 1,96 ,
a = 0,0194 10
- 4
prs.
P( 0,0006 F 0,0394) = 0,95.

Rgle de dcision :
On calcule dans un chantillon de contrles de taux
d'alcoolmie, suppos non exhaustif de taille 200, le
pourcentage f de contrles positifs.
si f [ 0,0006 ; 0,0394 ] on accepte H
0
.
si f [ 00006 ; 0,0394 ] on rejette H
0
et on
accepte H
1
.


Utilisation du test :
On a trouv f = 0,045, f [ 0,0006 ; 0,0394 ] on
rejette H
0
et on accepte H
1
.
On conclut, au seuil de signification 5 %, que
l'chantillon n'est pas reprsentatif de l'ensemble
des contrles de la rgion.

3 Groupement D 2001
Construction du test :
Choix de H
0
: p = 0,5 ;
Choix de H
1
: p > 0,5.

Dtermination de la rgion critique :
ANNALES DU B.T.S. TESTS D'HYPOTHESES
181
Sous H
0
on a p = 0,5 , F suit la loi normale N
(p,
100
5 , 0 5 , 0
), F suit la loi N (0,5 ; 0,05).
La variable alatoire : T =
05 , 0
5 , 0 F
associe F,
suit la loi normale N (0,1).
P(F 0,5 + h) = 0,95 quivaut P(T
05 , 0
h
) =
0,95 et (
05 , 0
h
) = 0,95 et
05 , 0
h
= 1,645 ,
h = 0,05 1,645 , h = 0,082 10
- 3
prs.
P(F 0,582) = 0,95 10
- 3
prs.

Rgle de dcision :
On calcule dans un chantillon de taille 100 le
pourcentage f de succs.
si f 0,582 on accepte H
0
.
si f > 0,582 on rejette H
0
et on accepte H
1
.

Utilisation du test :
On a f =
100
64
, f = 0,64 , f > 0,582 donc on
rejette H
0
et on accepte H
1
.
On conclut, au seuil de signification 5 %, que p est
significativement suprieur 0,5, on peut
considrer, au risque de 5 %, que le magicien n'est
pas un imposteur.

4 Etudes et conomie de la construction

Construction du test :
Choix de H
0
: p = 0,05 ;
Choix de H
1
: p > 0,05.

Dtermination de la rgion critique :
Sous H
0
on a p = 0,05 , F suit la loi normale
N (p,
304
) 1 ( p p
), F suit la loi N (0,05 ; 0,0125).
La variable alatoire : T =
0125 , 0
p F
associe F,
suit la loi normale N (0,1).
P(F a) = 0,95 quivaut P(T
0125 , 0
05 , 0 a
) = 0,95
et (
0125 , 0
05 , 0 a
) = 0,95 et
0125 , 0
05 , 0 a
= 1,645 ,
a = 0,05 + 0,0125 1,645 , a = 0,0705 10
- 4
prs.
P(F 0,07) = 0,95 10
- 3
prs.

Rgle de dcision :
On calcule dans un chantillon de 304 pices le
pourcentage f de dfauts.
si f 0,07 on accepte H
0
.
si f > 0,07 on rejette H
0
et on accepte H
1
.

Utilisation du test :
On a trouv f =
304
18
, f 0,059 , f 0,07 donc
on accepte H
0
. On conclut, au seuil de signification
5 %, que l'on accepte l'affirmation p = 0,05.

5 - Maintenance 93

a) Construction du test unilatral :
Hypothse nulle H
0
: p = 0,9 ,
Hypothse alternative H

1
: p < 0,9.
Dtermination de la rgion critique :
Sous l'hypothse H
0
, F suit la loi normale
N (0,9 ;
150
1 0 9 0 , ,
). La variable T =
150
1 0 9 0
9 0
, ,
, F


suit la loi normale centre rduite N (0 ; 1).
Donc sous H
0
: P( F > h) = 0,95 quivaut
P(T >
150
1 0 9 0
9 0
, ,
, h

) = 0,95 . Or P(T > - 1,645) = 0,95,


donc
150
1 0 9 0
9 0
, ,
, h

= 1,645,
h = 0, 9 - 1,645
150
1 0 9 0 , ,
, h 0,8597,
P(F > 0,8597) = 0,95
Rgle de dcision :
On prlve un chantillon alatoire non exhaustif
de 150 tiges, on calcule le pourcentage f de tiges
acceptables de cet chantillon :
Si f 85,97 % on accepte H
0 ,
on rejette H
1
.
Si f < 85,97 % on rejette H
0 .
on accepte H
1
.

b) Utilisation du test :
Le pourcentage de tiges acceptables est :
f = 85,33 %
f < 85,97 % on rejette H
0
on accepte H
1
.
Au seuil de 5%, on conclut que la machine n'est pas
bien rgle.

6 - Comptabilit et gestion Nouvelle
Caldonie 94

On sait que la variable alatoire D = F
S

F
N
suit la
loi normale N (p
S
p
N
; 0,032).

Construction du test :
Choix de lhypothse nulle H
0
: p
S
= p
N
.
Lhypothse alternative H
1
est: p
S
p
N

.
Dtermination de la rgion critique :
ANNALES DU B.T.S. TESTS D'HYPOTHESES
182
Sous H
0
, D suit la loi normale N (0 ; 0,032) et
032 0,
D
, suit la loi normale N (0, 1).
Quel que soit le nombre rel t 0, on a :
P( - t
032 0,
D
t ) = 2(t) - 1 .
La condition 2(t) - 1 = 0,95 donne t = 1,96.
On en dduit : P(- 0,06272 D 0,06272) = 0,95.

nonc de la rgle de dcision du test :
Dans la population S (respectivement N), on
prlve un chantillon alatoire non exhaustif de
taille n
S
= 400 (respectivement n
N
= 500), on calcule
la proportion f
S
de mnages de cet chantillon qui
prfrent le modle (1)

(respectivement f
N
).
Soit d = f
S
f
N
.
Si d [- 0,06272 ; 0,06272], on accepte H
0
.
Si d [- 0,06272 ; 0,06272], on rejette H
0
, on
accepte H
1
.

Utilisation du test :
Les chantillons prlevs ont donn f
S

= 0,63 et
f
N
= 0,67.
On a donc d = 0,04 , d [- 0,06272 ; 0,06272], on
accepte H
0
et par suite, on accepte lhypothse, au
seuil de signification 5 %, que les pourcentages
dans deux quartiers n'ont pas de diffrence
significative.

7 Groupement C 2001

1 Choix de H
0
: = 25, choix de H
1
: 25.
2 a) Sous H
0 ,
X suit la loi normale
N (25 ; 0,44), X suit la loi normale de moyenne
= 25 et d'cart type
n

=
125
44 , 0
donc X suit la
loi normale N (25 ;
125
44 , 0
) N (25 ; 0,039).
b) T =
039 , 0
25 X
suit la loi normale centre rduite
N (0, 1), P(25 - a X 25 + a) = 0,95 quivaut
2 (
039 , 0
a
) 1 = 0,95 et (
039 , 0
a
) = 0,975 ,
039 , 0
a
= 1,96 , a = 0,0764 10
- 4
prs.
P(24,9236 X 25,0764) = 0,95.
Si H
0
est vraie on a 95% de chances de prlever un
chantillon alatoire dont la moyenne appartient
l'intervalle I = [24,9236 ; 25,0764] soit 5% de
chance que cette moyenne soit l'extrieur de I.
La rgion critique est l'extrieur de l'intervalle
I = [24,9236 ; 25,0764].
c) Rgle de dcision :
On prlve un chantillon alatoire, non exhaustif,
de taille 150.
On calcule sa moyenne x ,
si x I on accepte H
0
et on rejette H
1
;
si x I on accepte H
1
et on rejette H
0
.


3 Utilisation du test :
x = 25,1 qui n'appartient pas l'intervalle
[24,9236 ; 25,0764].
On rejette lhypothse H
0
: = 25, on accepte
l'hypothse H
1
: 25.
Le client peut conclure, au risque 5%, que
l'entreprise ne respecte pas l'engagement .

8 Domotique 1998

Avec la calculatrice on trouve x = 151.
a) Sous H
0 ,
X suit la loi normale N (150 ; 2,4) ,
X suit la loi normale N (150 ;
50
4 2,
).
T =
50 4 2
150
/ ,
X
suit la loi normale centre rduite
N (0, 1), P(150 - h X 150 + h) = 0,95
quivaut 2 (
4 2
50
,
h
) 1 = 0,95 et
(
4 2
50
,
h
) = 0,975 ,
4 2
50
,
h
= 1,96 , h =
50
4 2 96 1 , ,
,
h = 0,665 10
- 3
prs.

b) P(149,335 X 150,665) = 0,95.
Si H
0
est vraie on a 95% de chances de prlever un
chantillon alatoire dont la moyenne appartient
l'intervalle I = [149,335 ; 150,665] soit 5% de
chance que cette moyenne soit l'extrieur de I.
La rgion critique est l'extrieur de l'intervalle
I = [149,335 ; 150,665].
On prlve un chantillon alatoire, non exhaustif,
de taille 50.
On calcule sa moyenne x ,
si x I on accepte H
0
et on rejette H
1
;
si x I on accepte H
1
et on rejette H
0
.

c) Utilisation du test :
x = 151 , x [149,335 ; 150,665] on rejette H
0
.
On conclut, au seuil de 5%, que la moyenne des
cotes des pices de la production n'est pas 150 mm.

9 SCBH 99
l a) L'hypothse nulle H
0
est : = 1000 et
l'alternative H
1
est 1000.

ANNALES DU B.T.S. TESTS D'HYPOTHESES
183
b) Sous l'hypothse H
0
: = 1000, la variable
alatoire L suit la loi normale N (1000,
100
1
).
c) L suit la loi normale N (1000 ; 0,1) donc la
variable alatoire U =
1 , 0
1000 L
suit la loi normale
centre, rduite N (0, 1).
P(1000 h L 1000 + h) = )
1 , 0 1 , 0
(
h
U
h
P

,
P(1000 h L 1000 + h) = 2 (
1 , 0
h
) 1,

Donc P(1000 h L 1000 + h) = 0,98 si et
seulement si 2 (
1 , 0
h
) 1 = 0,98, qui est
quivalent 2 (
1 , 0
h
) = 1,98, (
1 , 0
h
) = 0,99 ,
Dans le formulaire on trouve
1 , 0
h
2,32,
P(999,768 L 1000,232) = 0,98.
La rgion critique est l'extrieur de l'intervalle :
I = [999,768 ; 1000,232].
Rgle de dcision : On prlve au hasard et avec
remise un chantillon de 100 barres et on calcule la
moyenne l des diamtres des paisseurs des
feuilles de cet chantillon.
Si l appartient l'intervalle [999,768 ; 1000,232],
on accepte H
0
au seuil de 2 %.
Sinon on rejette H
0
et on accepte H
1
ce mme
seuil.
2 Pour l'chantillon de l'nonc l = 999,94 l est
compris entre 999,768 et 1000,232, au seuil de 2 %,
on accepte H
0
, on rejette H
1
: on conclut, au seuil de
2 %, que la machine est bien rgle.

10 Groupement C 99
l L'hypothse nulle H
0
est : = 110 et l'alternative
H
1
est 110.

2 X suit la loi normale N (, 3) ; la variable
alatoire X suit la loi normale N (,
1000
3
) o
est la moyenne inconnue des paisseurs des
feuilles.
Sous l'hypothse H
0
: = 110, la variable alatoire
X suit la loi normale N (110,
1000
3
).
3 X suit la loi normale N (110,
1000
3
) donc la
variable alatoire U =
1000
3
110 X
suit la loi normale
centre, rduite N (0, 1). P(110 h X 110 +
h) = )
3
1000
1000
3
110
3
1000
(
h X h
P

,
P(110 h X 110 + h) =
)
3
1000
3
1000
(
h
U
h
P

,
P(110 h X 110 + h) = 2 ( ) 1000
3
h
) 1
P(110 h X 110 + h) = 0,90 si et seulement si
2 ( 1000
3
h
) 1 = 0,90 qui est quivalent
( 1000
3
h
) = 0,95, (1,645) = 0,95 donc
1000
3
h
= 1,645 , h = 0, 15606.
h = 0, 156 est le nombre rel positif tel que
P(110 h X 110 + h) = 0,90.
La rgion d'acceptation est I = [109,844 ; 110,156].
Rgle de dcision :
On prlve au hasard et avec remise un chantillon
de 1000 feuilles et on calcule la moyenne x des
diamtres des paisseurs des feuilles de cet
chantillon.
Si x appartient l'intervalle [109,844 ; 110,156],
on accepte H
0
au seuil de 10 %.
Sinon on rejette H
0
et on accepte H
1
ce mme
seuil.
Pour l'chantillon observ x = 109,9 est compris
entre 109,844 et 110,156 on accepte H
0
au seuil de
10 % : on conclut, au seuil de 10 %, que la
moyenne des paisseurs des feuilles est gale
110 microns.

11 Comptabilit et gestion 99

1
re
rdaction
a) L'hypothse nulle H
0
est : = 550 et l'alternative
H
1
est 550.

b) Sous l'hypothse H
0
: = 550, la variable
alatoire Y suit la loi normale N (550,
50
195
).
ANNALES DU B.T.S. TESTS D'HYPOTHESES
184
La variable alatoire U =
50
195
550 Y
suit la loi
normale N (0, 1). P(550 h Y 550 + h) =
) 50
195
50
195
(
h
U
h
P

,
P(550 h Y 550 + h) = 2 ( 50
195
h
) 1,

P(550 h Y 550 + h) = 0,95 si et seulement si
2 ( 50
195
h
) 1 = 0,95 qui est quivalent
50
195
h
= 1,96 , h 54,051.
P(495,949 Y 604,051) = 0,95.
La rgion d'acceptation est I = [496 ; 604].

Rgle de dcision : On prlve au hasard et avec
remise un chantillon de 50 clients et on calcule la
moyenne x des achats des clients de cet
chantillon.
Si x appartient [496 ; 604] on accepte H
0
au
seuil de 5 %. Sinon on rejette H
0
et on accepte H
1

ce mme seuil.
Pour l'chantillon observ x = 597 est compris
entre 496 et 604 on accepte H
0
au seuil de 5 % : on
conclut, au seuil de 5 %, que la moyenne des
dpenses est gale 550 F.

2
me
rdaction
a) L'hypothse nulle H
0
est : = 550 et l'alternative
H
1
est 550.
b) Sous l'hypothse H
0
: = 550, la variable
alatoire Y suit la loi normale N (550,
50
195
).
La variable alatoire U =
50
195
550 Y
suit la loi
normale centre rduite N (0, 1).
P( Y 550 + h) = ) 50
195
(
h
U P ,
P( Y 550 + h) = ( 50
195
h
),
P(550 h Y 550 + h) = 0,95 si et seulement si
2 ( 50
195
h
) 1 = 0,95 qui est quivalent
50
195
h
= 1,645 , h 45,364.
P( Y 595,364) = 0,95.
La rgion critique est l'ensemble des valeurs
infrieures 595,364.

Rgle de dcision : On prlve au hasard et avec
remise un chantillon de 50 clients et on calcule la
moyenne x des achats des clients de cet
chantillon.
Si x 595,364 on accepte H
0
au seuil de 5 %.
Sinon on rejette H
0
et on accepte H
1
ce mme
seuil.
Pour l'chantillon observ x = 597 est suprieur
595,364 on rejette H
0
au seuil de 5 % : on conclut,
au seuil de 5 %, que la moyenne des dpenses est
gale 550 F.



12 Traitement des matriaux 99

Premire rdaction :
a) Construction du test :
Choix de H
0
: = 25 ;
choix de H
1
: 25.
Sous H
0 ,
X suit la loi normale N (25 ; 1,12) , X
suit la loi normale N (25 ;
30
12 , 1
), T =
30 / 12 , 1
25 X

suit la loi normale centre rduite N (0, 1).
P(25 - h X 25 + h) = 0,95 quivaut
P(
12 , 1
30 h
T
12 , 1
30 h
) et
2 (
12 , 1
30 h
) 1 = 0,95,
et (
12 , 1
30 h
) = 0,975 ,
12 , 1
30 h
= 1,96 ,
h =
30
12 , 1 96 , 1
, h = 0,4008 10
4
prs.
P(24,60 X 25,40) = 0,95 10
2
prs.
Si H
0
est vraie on a 95% de chances de prlever un
chantillon alatoire dont la moyenne appartient
l'intervalle I = [24,60 ; 25,40] soit 5% de chance
que cette moyenne soit l'extrieur de I.
La rgion critique est l'extrieur de l'intervalle
I = [24,60 ; 25,40].

Rgle de dcision :
On prlve un chantillon alatoire, non exhaustif,
de taille 30.
On calcule sa moyenne x ,
si x I on accepte H
0
et on rejette H
1
;
si x I on accepte H
1
et on rejette H
0
.


b) Utilisation du test :
x = 24,75 , x [24,60 ; 25,40] on accepte H
0
.
On accepte le lot, au seuil de 5%.

Deuxime rdaction :
a) Construction du test :
ANNALES DU B.T.S. TESTS D'HYPOTHESES
185
Choix de H
0
: = 25 ;
choix de H
1
: < 25.
Sous H
0 ,
X suit la loi normale N (25 ; 1,12) , X
suit la loi normale N (25 ;
30
12 , 1
), T =
30 / 12 , 1
25 X

suit la loi normale centre rduite N (0, 1).
P( X > 25 h) = 0,95 quivaut
P( T >
12 , 1
30 h
) = 0,95 et (
12 , 1
30 h
) = 0,95
et
12 , 1
30 h
= 1,645 , h =
30
12 , 1 645 , 1
,
h = 0,03364 10
4
prs, P( X > 24,66) = 0,95 .
Si H
0
est vraie on a 95% de chances de prlever un
chantillon alatoire dont la moyenne soit
suprieure 24,66 soit 5% de chance que cette
moyenne soit infrieure 24,66 l'extrieur de I.
La rgion critique est l'extrieur de l'intervalle
I = [24,60 ; 25,40].
Rgle de dcision :
On prlve un chantillon alatoire, non exhaustif,
de taille 30.
On calcule sa moyenne x ,
si x 24,66 on accepte H
0
et on rejette H
1
;
si x < 24,66 on accepte H
1
et on rejette H
0
.

b) Utilisation du test :
x = 24,75 , x 24,66 on accepte H
0
. On accepte le
lot, au seuil de 5%.

13 - Comptabilit et gestion 90

1 a) Choix de H
0

: la moyenne des chiffres
d'affaires journaliers de l'hypermarch aprs la
campagne publicitaire est = 1,5 (million de
francs).
Choix de H
1

: > 1,5.

b) Dtermination de la rgion critique :
Sous l'hypothse H
0
, on a = 1,5, donc Z suit la
loi normale N (1,5 ; 0,3) et la variable alatoire
centre rduite T associe Z dfinie par :
T = ) , Z (
,
5 1
3 0
30
suit la loi N (1, 0).
Par suite, P(Z h) = 0,95 quivaut successivement

P(T ) , h (
,
5 1
3 0
30
) = 0,95 ;
( ) 5 , 1 (
3 , 0
30
h ) = 0,95 ; ) , h (
,
5 1
3 0
30
= 1,645 ,
d'o h = 1,590.

c) On prlve un chantillon non exhaustif de taille
30 dans la population des chiffres d'affaires
journaliers obtenus aprs la campagne publicitaire.
On calcule la moyenne de cet chantillon.
Si 1,590 on accepte H
0
, et on rejette H
0
.
Si > 1,590 on rejette H
0
, et on accepte H
1
.

2 a) 1,623.
b) > 1,590 on rejette H
0
, et on accepte H
1
.
On conclut, au seuil de signification 5%, qu' la
suite de la campagne publicitaire la moyenne des
chiffres d'affaires journaliers a augment, c'est--
dire dpass 1,5 million de francs.

14 - Chimiste 99
1. m
1
= 4,84 ; s
1

= 2,96 10
2
prs.
2. m
2
= 3,88 ; s
2

= 1,45 alors
2
est estim par
2
= 3,88 et
2
par
2
1,46.

3.1 E(
1
X ) =
1
et E(
2
X ) =
2
;
(
1
X ) =
49
1

, (
1
X ) =
7
1

et
(
2
X ) =
64
2

, (
2
X ) =
8
2


3.2
1
X et
2
X sont deux variables alatoires
indpendantes suivant une loi normale donc
D =
1
X
2
X suit la loi normale de moyenne
inconnue
1

2
inconnue et d'cart type
64 49
2
2
2
1

+ .
4.1 Construction du test :
H
0
:
1
=
2
ou
1

2
= 0 ;
H
1
:
1

2

.
Dtermination de la rgion critique :
Sous H
0
, D suit la loi normale N (0 ; 0,46) .
La variable T =
46 , 0
D
suit la loi normale N (0, 1).
P( h < D < h ) = 0,99 quivaut
P(
46 , 0
h
< T <
46 , 0
h
) = 0,99 ;
46 , 0
h
= 2,58
soit h 1,19 et P( - 1,19 < D < 1,19) = 0,99.
L'extrieur de l'intervalle I = [- 1,19 ; 1,19] est la
rgion critique du test au risque de 1 %.
En procdant de mme au seuil 5%,
46 , 0
k
= 1,96,
k 0,90 et P(- 0,90 < D < 0,90) 0,95.
L'extrieur de l'intervalle I = [- 0,90 ; 0,90] est la
rgion critique du test au risque de 5 %.
4.2 Rgle de dcision :
On prlve deux chantillons alatoires non
exhaustifs on calcule leurs moyennes m
1
, m
2
et
m
1
m
2

Si m
1
m
2
I on accepte H
1
.
Si m
1
m
2
I on accepte H
1
on rejette H
0
.
4.3 Utilisation du test : m
1
m
2
= 0,96
ANNALES DU B.T.S. TESTS D'HYPOTHESES
186
Au seuil de 1% on a 0,96 [ 1,19 ; 1,19] on
accepte H
0

.
Au seuil de 5%, 0,96 [ 0,9 ; 0,9] on rejette H
0

et on accepte H
1
.

On conclut, au seuil de signification 1% qu'il n'y a
pas de diffrence significative entre les moyennes,
mais au seuil de 5% on ne peut pas accepter cette
hypothse.

15 Groupement D 99

l Avec une calculatrice on obtient, en grammes
m
1
= 107,5 et s
1
= 2,5
Pour effectuer les calculs on a suppos que, dans
chacune des classes, tous les lments taient
placs au centre. Les nombres ainsi obtenus ne sont
donc que des valeurs approches de m
1
et s
1
.

2 a) Pour estimation de la moyenne de la
population on prend la moyenne m de l'chantillon,
donc
1
et
2
sont estims respectivement par 107,5
et 107.
b) Pour estimation ponctuelle de l'cart type de la
population on prend s
1 n
n
donc
1
est estim par
2,5
99
100
,
1
2,5 et
2
est estim par
2
99
100
,
2
2.

3 a) V(D) = V(
1
X ) + V(
2
X ),
V(D) 0,25
2
+ 0,2
2
, V(D) 0,1025.
D'o (D) = ) ( V D , (D) 0,32.
b) Sous l'hypothse H
0
, D suit approximativement
la loi normale N (0 ; 0,32) donc la variable
alatoire U =
32 , 0
D
suit approximativement la loi
normale centre, rduite N (0, 1).
P(D a) = 0,99 quivaut P(U
32 , 0
a
) = 0,99,
c'est dire (
32 , 0
a
) = 0,99,
d'aprs la table de la loi normale N (0, 1),
32 , 0
a
2,33, a 0,75. P(D 0,75) 0,99.

c) On prlve au hasard et avec remise un
chantillon de 100 pots provenant de la chane n 1
et on dtermine la quantit moyenne m
1
de produit
A, en grammes.
On fait de mme avec la chane n 2, on obtient une
moyenne m
2
, on calcule d = m
1
m
2
.
Rgle de dcision :
Si d > 0,75 on rejette H
0
, on accepte H
1
au seuil de
1 %.
Si d 0,75 on accepte H
0
au seuil de 1 %.
Pour les deux chantillons observs, m
1
= 107,5 et
m
2
= 107
donc m
1
m
2
= 0,5 , d = 0,5.
d 0,75 on accepte H
0
au seuil 1 %.
Au seuil de 1 %, la fabrication n 1 ne produit pas
des pots contenant davantage de produit A que la
chane n 2.





FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
187
Supplment la sance n3

1 Retour Aamjiwnaang
Sources : Science et Vie fvrier 2006 Environnemental Health Perspectives octobre 2005
(article en ligne).

Les donnes proviennent dune tude effectue au Canada et montrant une diffrence (trs)
significative du sex-ratio la naissance (dficit de garons) sur une population expose
une pollution chimique. Dans ce cas particulier, linquitude provient du fait que bien que
ces industries canadiennes respectent les normes, une exposition prolonge de faibles
doses de polluants puisse avoir un impact sanitaire mesurable.
Le sex-ratio est le rapport du nombre de garons celui des filles la naissance. Il est
habituellement de 105 garons pour 100 filles.
Dans la rserve indienne dAamjiwnaag, situe au Canada, il est n entre 1999 et 2003,
n =132 enfants dont 46 garons.
Question statistique : la frquence des garons observe Aamjiwnaag pour la priode
1999-2003 prsente-t-elle une diffrence significative avec p = 0,512 ?

Construction dun test unilatral au risque de 1 %
On privilgie lhypothse selon laquelle le sex-ratio est normal cest--dire que la
probabilit davoir un garon est p = 0,512 et on ne rejettera cette hypothse que si
lobservation est significativement infrieure p , cest--dire si la frquence obtenue
sur lchantillon est infrieure au seuil correspondant 1 % des chantillons sous
lhypothse p = 0,512.

Choix des hypothses :
H
0
: ..........................................................................................................................................
H
1
: ..........................................................................................................................................

Dtermination de la zone de rejet de H
0
:
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
188
Soit F la variable alatoire correspondant la frquence des garons sur un chantillon
alatoire de 132 naissances (on vitera dans ce contexte d voquer des tirages avec
remise , mais il sagit bien de ce modle).
On suppose que F suit approximativement une loi normale.
Sous lhypothse H
0
, indiquer les paramtres de cette loi (on arrondira 10
3
).
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
Dterminer le rel h positif tel que, sous lhypothse H
0
, P( F > h) = 0,99 (on arrondira
10
3
).
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
Rgle de dcision du test :
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
Mise en oeuvre du test
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................
...........................................................................................................................................................

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
189
2 Des sujets rcents de BTS

Groupement B 2003 (moyenne bilatral)

Dans une usine du secteur de
l'agroalimentaire, une machine
embouteiller est alimente par un
rservoir d'eau et par une file
d'approvisionnement en
bouteilles vides, selon le schma
ci-contre.
L'exercice consiste en une tude
statistique du bon
fonctionnement de ce systme.

Test d'hypothse

Pour contrler le bon fonctionnement de la machine, on construit un test d'hypothse
bilatral sur la moyenne, test qui sera mis en uvre toutes les heures.
Pour une production d'une heure, la variable alatoire Z qui, toute bouteille prise au
hasard dans cette production associe sa contenance en litres suit la loi normale de moyenne
et d'cart type = 0,01. Dans cette question la moyenne est inconnue.
On dsigne par Z la variable alatoire qui, chaque chantillon alatoire de 100 bouteilles
prlev dans cette production d'une heure, associe la moyenne des contenances des
bouteilles de cet chantillon (la production pendant une heure est assez importante pour
que l'on puisse assimiler ces prlvements des tirages avec remise).
On considre que la machine est bien rgle lorsque = 1,5 .
L'hypothse nulle est H
0
: " = 1,5".
L'hypothse alternative est H
1
: " 1,5".
Le seuil de signification du test est fix 0,05.

a) Justifier le fait que, sous l'hypothse nulle H
0
, Z suit la loi normale de moyenne 1,5 et
d'cart type 0,001.
b) Sous l'hypothse nulle H
0
, dterminer le nombre rel h positif tel que :
) 5 , 1 5 , 1 ( h Z h P + = 0,95.
c) Enoncer la rgle de dcision permettant d'utiliser ce test.
d) On prlve un chantillon de 100 bouteilles et on observe que, pour cet chantillon, la
moyenne des contenances est z = 1,495 .
Peut-on, au seuil de 5%, conclure que la machine est bien rgle ?

lments de rponse

a) Sous H
0
la variable alatoire Y suit la loi normale de moyenne 1,5 et d'cart type
100
01 , 0
.
b) 96 , 1
001 , 0

h
d'o h 0,002.
Rservoir
Machine
File de sortie File d'entre
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
190
c) Zone d'acceptation de H
0
:
[1,498 ; 1,502].
d) La moyenne observe y n'appartient pas l'intervalle d'acceptation.
H
0
est rejete, au risque de 5%.

Groupement B 2005 (moyenne bilatral)

Une usine fabrique, en grande quantit, des rondelles dacier pour la construction. Leur
diamtre est exprim en millimtres.

Dans cet exercice, sauf indication contraire, les rsultats approchs
sont arrondir 10
2
.

On se propose de construire un test dhypothse pour contrler la moyenne de
lensemble des diamtres, en millimtres, de rondelles constituant une grosse livraison
effectuer.
On note X
2
la variable alatoire qui, chaque rondelle prleve au hasard dans la livraison,
associe son diamtre.
La variable alatoire X
2
suit la loi normale de moyenne inconnue et dcart type


= 0,17 .
On dsigne par
2
X la variable alatoire qui, chaque chantillon alatoire de 100
rondelles prlev dans la livraison, associe la moyenne des diamtres de ces rondelles (la
livraison est assez importante pour que lon puisse assimiler ces prlvements des tirages
avec remise).

Lhypothse nulle est H
0
: = 90. Dans ce cas la livraison est dite conforme pour le
diamtre.
Lhypothse alternative est H
1
: 90.
Le seuil de signification du test est fix 0,05.

1 Enoncer la rgle de dcision permettant dutiliser ce test en admettant, sous lhypothse
nulle H
0
, le rsultat suivant qui na

pas tre dmontr :
P (89,967
2
X 90,033) = 0,95.

2 On prlve un chantillon de 100 rondelles dans la livraison et on observe que, pour cet
chantillon, la moyenne des diamtres est x = 90,02 .
Peut-on, au seuil de risque de 5%, conclure que la livraison est conforme pour le
diamtre ?

lments de rponse


D.1 Rgle de dcision :
Soit x la moyenne calcule sur un chantillon de 100
rondelles prleves au hasard.
Si x [89,967 ; 90,033] la livraison est considre comme
conforme(au seuil de 5%).
Sinon, la livraison est considre comme non conforme (au






FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
191
risque de 5%).

1 point

D.2 La livraison est considre conforme, au seuil de 5%. 0,5 point

BTS Chimiste 2005 frquences comparaison unilatral
(tude critique de lnonc)

Une entreprise fabrique des appareils de mesure qui doivent satisfaire un cahier des
charges.
Lentreprise met en place un nouveau dispositif sens amliorer la fiabilit des
appareils produits. Deux chanes de fabrication sont mises en service : la chane n 1,
sans nouveau dispositif et la chane n 2 avec le nouveau dispositif. Afin de tester
lhypothse selon laquelle le nouveau dispositif amliore de manire significative la
fiabilit des appareils produits, on a prlev de manire alatoire 200 appareils la
sortie de chacune des deux chanes de fabrication.
Un pourcentage p
1
(resp. p
2
) dappareils issus de la chane n 1 (resp. n 2) ont
fonctionn parfaitement pendant les trois premiers mois.

1.
a) Expliquer pourquoi on met en place un test unilatral.
b) On prend pour hypothse nulle H
0
: p
1
= p
2
. Prciser lhypothse H
1
alternative
qui va tre oppose lhypothse H
0
.

On note F
1
(resp. F
2
) la variable alatoire qui chaque chantillon de taille 200
provenant de la chane n 1 (resp. n 2) associe la frquence f
1
(resp. f
2
) dappareils
ayant parfaitement fonctionn pendant trois mois.
Sur les deux chantillons prlevs, on a obtenu des valeurs observes qui sont :
f
1
= 87% et f
2
= 93%.
On note D = F
2
F
1
.
Sous lhypothse nulle, les deux chanes sont censes produire le mme pourcentage p
dappareils conformes et la loi suivie par D (celle que lon adopte) est la loi normale
n (0 ;
200
) 1 (
200
) 1 ( p p p p
+

).
On prend p = 0,9 car
(

+
=
2
2 1
f f
p .

2. Prciser les paramtres de la loi suivie par D.

3. Si est le seuil de risque, on dsigne par h

le rel positif tel que : P(D h

) = 1 .
a) On suppose dans cette question que = 0,01.
Dterminer la valeur arrondie au centime de h

.
Enoncer la rgle de dcision du test.
Conclure quant lefficacit prsume du nouveau dispositif au seuil de risque
0,01.
b) On suppose dans cette question que = 0,05.
Dterminer h

.
Enoncer la rgle de dcision du test.
Conclure quant lefficacit prsume du nouveau dispositif au seuil de risque
0,05.
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
192

Le BTS Chimiste 2005 a propos (exercice 1, partie B) un test de comparaison de deux
frquences qui nous a sembl cumuler plusieurs difficults, selon une prsentation pouvant
prter confusion, en particulier sur la diffrence entre une frquence observe sur un
chantillon et une frquence inconnue sur une population, ainsi que sur la signification du
seuil de risque. Les professeurs prsents ont dailleurs not que seule la partie de lnonc
concernant le test dhypothse tait accompagne dun corrig dtaill, voulant sans doute
contribuer, de faon louable, clairer les correcteurs sur le sujet, sans toutefois y parvenir
compltement.
Les difficults de cet exercice sont les suivantes :
Le test est unilatral, situation asymtrique assez dlicate.
Il porte sur les frquences, cas plus rare dans les sujets dexamen et qui ncessite une
estimation de lcart type de la variable alatoire correspondant la diffrence
observe, qui est assez difficile, et lude par lnonc,
Deux seuils de risque sont proposs, lun pour lequel lhypothse nulle est accepte,
lautre pour lequel elle est refuse, sans que lon ait bien conscience des enjeux, et le
corrig est assez troublant cet gard.
Compte-tenu du choix qui a t fait, de nous prsenter le cas le plus difficile au programme
de ce BTS, une grande rigueur dans la rdaction aurait permis dy voir plus clair. Nous
faisons quelques suggestions en italiques.

Le test mis en place tudie la fiabilit des appareils produits . Il aurait t utile de
dfinir ds le dpart ce que lon entendait par l, puisquil sagit du caractre tudi. Par
exemple :
Un appareil est considr comme fiable lorsquil a correctement fonctionn pendant
les 3 premiers mois .
Cest du moins ce que lon comprend daprs la suite de lnonc.
Il faudrait ensuite dfinir clairement les deux populations dans lesquelles seffectuera
lchantillonnage. Lnonc affirme seulement :
, on a prlev de manire alatoire 200 appareils la sortie de chacune des deux
chanes de fabrication.
Un pourcentage p
1
(resp. p
2
) dappareils issus de la chane n1 (resp. n2) ont
fonctionn parfaitement pendant les trois premiers mois.
A la lecture de cette phrase, on pourrait imaginer que les pourcentages p
1
et p
2
ont t
observs, peut-tre sur les chantillons. Il nen est rien. Il faut comprendre que ces
pourcentages p
1
et p
2
sont inconnus (ce qui nest pas dit ! ) malgr le pass du ont
fonctionn . Bien sr, on ne voit pas pourquoi, si p
1
et p
2
taient connus, on samuserait
les tester. Il est bien entendu essentiel de comprendre que ces pourcentages
correspondent aux deux populations tudies et quils sont inconnus. Ils joueront le rle de
probabilits de succs dans lchantillonnage. On aurait pu dire :
On tudie les productions des deux chanes pendant un mois [par exemple]. On note
p
1
(resp. p
2
) le pourcentage, inconnu, des appareils considrs comme fiables dans la
production de la chane n 1 (resp. n 2).
On prlve au hasard (la production est suffisamment importante pour assimiler ce
prlvement un tirage avec remise) 200 appareils dans la production de la chane
n1 durant ce mois, dont on tudie le bon fonctionnement pendant trois mois. On note
f
1
la frquence observe des appareils nayant pas connu de panne pendant trois mois
sur cet chantillon. On procde de mme avec la production de la chane n 2, en
notant f
2
la frquence observe des appareils considrs comme fiables sur un
chantillon de taille 200.

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
193
On examine ensuite la loi de la variable alatoire D = F
2
F
1
sous lhypothse nulle.
Le texte nonce l quelques certitudes alors que lon ne va pas utiliser la vraie loi de D
(mme sous lhypothse nulle), fonde sur des lois binomiales avec un paramtre p
inconnu, mais que lon va procder au mieux . (Le texte parle cet endroit dappareils
conformes , cest une coquille, il sagit dappareils fiables ).
Sous lhypothse nulle, on a p
1
= p
2
= p et la variable alatoire D = F
2
F
1
suit
approximativement (ce nest pas dit dans lnonc) la loi normale de moyenne nulle et
dcart type inconnu (on oublie de le dire)
200
) 1 (
200
) 1 ( p p p p
+

, puisque
Var (D) = Var (F
1
) + Var (F
2
). Reste, pour pouvoir construire le test, estimer la valeur de
cet cart type.
On ne peut pas crire, comme cest fait dans lnonc :
On prend p = 0,9 car
(

+
=
2
2 1
f f
p .
Mme si H
0
est vraie, il ny a bien sr aucune raison dobserver des frquences f
1
et f
2

telle que
2
2 1
f f
p
+
= . Lcriture
2
2 1
f f
p
+
= entretient la confusion entre les frquences
f
1
et f
2
observes et la frquence p inconnue, mme sous lhypothse nulle.
Il serait prfrable dcrire :
On estimera la valeur p inconnue par
2
93 , 0 87 , 0
9 , 0
+
= et on supposera donc que
D a pour cart type
200
1 , 0 9 , 0
200
1 , 0 9 , 0
+

.
Ce nest quune supposition, et mme sous H
0
, on ne connat pas lcart type de D.

La dernire question de lexercice (la question 3.) pose le problme du choix, a priori, du
seuil de risque . On fait faire llve deux tests, lun avec = 0,01 qui conduit
accepter H
0
, lautre avec = 0,05, qui conduit rejeter H
0
. Il est certes important de faire
constater que selon le choix de , la rponse du test peut-tre diffrente, le professeur
ayant la charge, en formation, den expliquer les enjeux. Lexplication donne par le
corrig dans le cas de lacceptation de H
0
pour = 0,01 laisse cependant perplexe :
aucune raison de refuser H
0
le nouveau dispositif ne semble pas avoir amlior la
fiabilit des appareils. Mais le risque de se tromper est trs faible ; les calculs tant
effectus sous lhypothse H
0
, on nen doute pas a priori.
Que veut-on dire par l ? Quand on accepte H
0
(comme ici), le risque de se tromper
est inconnu, il nest pas trs faible . En fait, ce risque inconnu est dautant plus lev
que est, comme ici, petit. Ce quil faudrait dire, cest quavec = 0,01, le risque de
rejeter tort H
0
est trs faible. Ce qui veut dire quon tient a priori conserver H
0
, peut-
tre parce que le nouveau procd de fabrication est trs onreux, et quon ne rejettera H
0

que si la diffrence observe est trs significative. Cest peut-tre ce quentend le corrig
quand il dit de lhypothse H
0
quon nen doute pas a priori .

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
194

Groupement B 2007 (moyenne bilatral)

Une usine fabrique des ventilateurs en grande quantit. On sintresse trois types de
pices : laxe moteur, appel pice de type 1, les pales, appeles pice de type 2 et le
support, appel pice de type 3.
Une importante commande de pices de type 3 est passe auprs dun sous-traitant. La
hauteur du support doit tre de 400 millimtres.
On se propose de construire un test dhypothse bilatral pour contrler, au moment de la
livraison, la moyenne de lensemble des hauteurs, en millimtres, des pices de type 3.
On note Z la variable alatoire qui, chaque pice de type 3 prleve au hasard dans la
livraison associe sa hauteur.
La variable alatoire Z suit la loi normale de moyenne inconnue et dcart type = 5.
On dsigne par Z la variable alatoire qui, chaque chantillon alatoire de 100 pices de
type 3 prlev dans la livraison, associe la moyenne des hauteurs des pices de cet
chantillon. La livraison est assez importante pour que lon puisse assimiler ces
prlvements des tirages avec remise.
Lhypothse nulle est H
0
: = 400.
Lhypothse alternative est H
1
: 400.
Le seuil de signification du test est fix 0,05.

1 Sous lhypothse H
0
, on admet que la variable alatoire Z suit la loi normale de
moyenne 400 et dcart type 0,5.
Dterminer sous cette hypothse le nombre rel h positif tel que :
P(400 h Z 400 + h) = 0,95.

2 En dduire la rgle de dcision permettant dutiliser ce test.

3 On prlve un chantillon alatoire de 100 pices dans la livraison reue et on observe
que, pour cet chantillon, la moyenne des hauteurs des pices est z = 399,12.
Peut-on, au seuil de 5 %, conclure que la livraison est conforme pour la hauteur ?

lments de rponse

C. 1 h = 0,98.

1 point

A. 2 On prlve au hasard et avec remise, un chantillon de 100
pices dans la livraison et on calcule la moyenne z des hauteurs
des pices de cet chantillon.
La rgle de dcision est :
Si z appartient lintervalle [399,02 ; 400,98], on accepte H
0

au seuil de 0,05.
Sinon on rejette H
0
et on accepte H
1
.







1 point

A. 3 z = 399,12 appartient lintervalle dacceptation.
On accepte lhypothse H
0
: la livraison est considre comme
conforme pour la hauteur.


0,5 point



FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
195
Sance 4 :
FIABILITE
LOI EXPONENTIELLE
LOI DE WEIBULL

"Carpe diem."
Conseil picurien.

La fiabilit est l'tude statistique des dures de vie (temps de bon fonctionnement) ou des
dfaillances. Le terme "fiabilit" est un nologisme introduit dans les annes 1960 pour
traduire le terme anglais "reliability". Elle a comme spcificits, d'une part une modlisation
(des dures de vie) par des variables alatoires positives (la loi normale n'est plus "reine"),
d'autre part une interprtation et un vocabulaire particulier : la fonction de rpartition est la
fonction de "survie", ou fonction de "fiabilit", la "fonction de hasard" correspondant au "taux
de mortalit" ou au "taux d'avarie" joue un rle central.
Les mesures de dure de vie se sont longtemps limites l'tude de la dure de vie humaine,
pour des applications dmographiques et dans le domaine des assurances (assurances vies et
rentes viagres). Ce n'est qu'avec une industrie standardise, au XX
e
sicle, que l'on s'est
intress d'autres types de dure de vie. Avant la production en srie, chaque pice tait faite
"sur mesure" et cette individualisation empchait le traitement statistique. Cependant, le mot
"fiabilit" n'est pas encore mentionn dans le "Grand Larousse du XX
e
sicle" dit en 1930.
Au del de la fiabilit industrielle apparaissent de nouvelles applications, notamment dans le
domaine biomdical (survie de patients atteints de cancers) ou conomique (modlisation
de la dure de vie des entreprises ou de la dure de sjour au chmage)
5
.

5
Renseignements donns par Droesbeke, Fichet, Tassi dans "Analyse statistique des dures de vie" Economica
1989.
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
196
Nous commencerons par une tude statistique de la dure de vie humaine (parce que nous
sommes tous concerns). Ce biais culturel pour aborder la fiabilit n'est bien sr pas celui que
l'on suit avec les tudiants de B.T.S. pour lesquels ce module est au programme.

I - EXEMPLE D'INTRODUCTION : Etude statistique des
tables de mortalit
1 - La premire table de mortalit connue
En 1662, apparat dans les Observations naturelles et politiques sur les bulletins de
mortalit de la ville de Londres, la premire table de mortalit jamais construite. La voici
reproduite ci-contre (Source : "Les
mathmatiques sociales" - Dossier Pour la
Science de juillet 1999 - article de Herv Le
Bras).
Considrons le second tableau
correspondant aux survivants. Dans le
vocabulaire de la fiabilit, il s'agit de la
fonction de fiabilit, note t a R (t)
(fiabilit se dit "reliability" en anglais) o t
est le temps.
Il s'agit d'une modlisation. A partir de
l'observation qu'au bout de 6 ans, il y a 64 %
de survivants et 1 % au bout de 76 ans, on a
recherch une suite gomtrique pour les
pourcentages de survivants chaque
dcennie intermdiaire.
Les calculs ont t faits de manire
approximative. Les logarithmes sont connus
l'poque mais leur usage se limite
l'astronomie.
Rechercher une raison q , avec 0 < q < 1,
constante, comme coefficient multiplicateur
du nombre de survivants, revient
considrer que le taux de mortalit entre 6 et
76 ans est le mme (ici q
8
5
correspond
3 dcs pour 8 personnes sur 10 ans).
Herv Le Bras prcise que la notion de taux
de mortalit n'apparatra que bien plus tard
et analyse cela par la conception, que l'on
avait l'poque, de la mort (dtermine par
Dieu, ou les astres...).

Compte-tenu de ce qu'tait la mortalit
infantile, on avait cependant cart les 6 premires annes de vie. Cela conduit
rechercher une fiabilit "de type exponentielle", correspondant au hasard total ("coups du
sort").

"Puisque nous avons trouv que sur 100
conceptions prises au dpart, peu prs
36 n'atteignent pas l'ge de 6 ans, et que
peut-tre une seule survit 76 ans,
ayant sept dcennies entre 6 et 76 ans,
nous avons recherch six moyennes
proportionnelles entre 64, ceux qui sont
encore vivants 6 ans, et l'unique
survivant 76 ans, et nous trouvons que
les nombres suivants sont pratiquement
assez prs de la vrit ; car les hommes
ne meurent pas selon des proportions
exactes, ni selon des fractions : de l
procde la table suivante, savoir que
sur 100 il en meurt
dans les six premires annes 36
dans la dcennie suivante 24
dans la seconde dcennie 15
dans la troisime dcennie 9
dans la quatrime 6
dans la suivante 4
dans la suivante 3
dans la suivante 2
dans la suivante 1."
"De l, il s'ensuit que sur 100 personnes
conues, il en reste,
au bout de six annes pleines 64
au bout de 16 ans 40
au bout de 26 25
au bout de 36 16
au bout de 46 10
au bout de 56 6
au bout de 66 3
au bout de 76 1
80 0."

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
197



Voici ci-contre, sur Excel,
l'ajustement exponentiel
correspondant cet exemple.







2 - La mortalit en France selon le recensement de 1992
A partir du tableau de donnes (page suivante), on peut construire les courbes suivantes :









Frquence des survivants t a R (t) Taux de mortalit t a (t)

On constate que la courbe des survivants n'a pas la mme allure que lorsque la mortalit est
suppose constante. Sur le second graphique, le taux de mortalit, aprs une lgre
dcroissance - mortalit infantile - est nettement croissant au del de 40 ans ( (n) est le
rapport du nombre de dcs durant l'intervalle [n , n + 1], au nombre de survivants la date
n : (n) =
) (
) 1 ( ) (
n R
n R n R +
). Lorsque le taux de mortalit n'est pas constant, on cherchera
le modliser sous forme d'une fonction puissance, ce qui conduira aux lois de Weibull.
Dans le cas des survivants ("fiabilit R(t)") aprs 40 ans, la loi de Weibull conduit au
modle suivant

Moyennes proportionnelles entre 0,64 et 0,01
y = 1,0606e
-0,0557x
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0 20 40 60 80
t (annes)
R
(
t
)

(
f
r

q
u
e
n
c
e
s

d
e
s

s
u
r
v
i
v
a
n
t
s
)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 10 20 30 40 50 60 70 80 90 100
0
0 , 0 5
0 , 1
0 , 1 5
0 , 2
0 , 2 5
0 , 3
0 , 3 5
0 10 2 0 3 0 4 0 5 0 60 7 0 8 0 90 1 0 0
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
40 50 60 70 80 90 100
Donnes relles Courbe y = exp(-[(t-16)/65]^5)
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
198

age ti
survivants
S(ti)
R(ti)
Taux de
mortalit en
%
age ti
survivants
S(ti)
R(ti)
Taux de
mortalit en
%
0 100000 1 50 90889 0,90889 0,59
1 99264 0,99264 0,74 51 90322 0,90322 0,62
2 99204 0,99204 0,06 52 89717 0,89717 0,67
3 99166 0,99166 0,04 53 89075 0,89075 0,72
4 99138 0,99138 0,03 54 88390 0,8839 0,77
5 99113 0,99113 0,03 55 87633 0,87633 0,86
6 99092 0,99092 0,02 56 86819 0,86819 0,93
7 99073 0,99073 0,02 57 85949 0,85949 1,00
8 99054 0,99054 0,02 58 85024 0,85024 1,08
9 99036 0,99036 0,02 59 84020 0,8402 1,18
10 99019 0,99019 0,02 60 82930 0,8293 1,30
11 99001 0,99001 0,02 61 81757 0,81757 1,41
12 98982 0,98982 0,02 62 80496 0,80496 1,54
13 98960 0,9896 0,02 63 79156 0,79156 1,66
14 98935 0,98935 0,03 64 77722 0,77722 1,81
15 98904 0,98904 0,03 65 76216 0,76216 1,94
16 98864 0,98864 0,04 66 74636 0,74636 2,07
17 98809 0,98809 0,06 67 72986 0,72986 2,21
18 98736 0,98736 0,07 68 71244 0,71244 2,39
19 98633 0,98633 0,10 69 69400 0,694 2,59
20 98515 0,98515 0,12 70 67441 0,67441 2,82
21 98388 0,98388 0,13 71 65417 0,65417 3,00
22 98249 0,98249 0,14 72 63301 0,63301 3,23
23 98108 0,98108 0,14 73 61080 0,6108 3,51
24 97971 0,97971 0,14 74 58703 0,58703 3,89
25 97830 0,9783 0,14 75 56195 0,56195 4,27
26 97684 0,97684 0,15 76 53558 0,53558 4,69
27 97535 0,97535 0,15 77 50827 0,50827 5,10
28 97382 0,97382 0,16 78 47975 0,47975 5,61
29 97218 0,97218 0,17 79 45014 0,45014 6,17
30 97041 0,97041 0,18 80 41965 0,41965 6,77
31 96856 0,96856 0,19 81 38811 0,38811 7,52
32 96669 0,96669 0,19 82 35539 0,35539 8,43
33 96482 0,96482 0,19 83 32239 0,32239 9,29
34 96287 0,96287 0,20 84 28914 0,28914 10,31
35 96077 0,96077 0,22 85 25623 0,25623 11,38
36 95853 0,95853 0,23 86 22409 0,22409 12,54
37 95621 0,95621 0,24 87 19338 0,19338 13,70
38 95381 0,95381 0,25 88 16437 0,16437 15,00
39 95131 0,95131 0,26 89 13734 0,13734 16,44
40 94865 0,94865 0,28 90 11282 0,11282 17,85
41 94581 0,94581 0,30 91 9112 0,09112 19,23
42 94278 0,94278 0,32 92 7217 0,07217 20,80
43 93952 0,93952 0,35 93 5571 0,05571 22,81
44 93598 0,93598 0,38 94 4168 0,04168 25,18
45 93222 0,93222 0,40 95 3019 0,03019 27,57
46 92825 0,92825 0,43 96 2150 0,0215 28,78
47 92400 0,924 0,46 97 1511 0,01511 29,72
48 91933 0,91933 0,51 98 1046 0,01046 30,77
49 91429 0,91429 0,55 99 712 0,00712 31,93
(Source : INSEE)
II LOI EXPONENTIELLE
1 Premire approche : pannes taux d'avarie constant
Cette approche correspond l'tude des temps de bon fonctionnement d'un matriel taux
d'avarie constant.
Taux d'avarie et fonction de dfaillance
On dsigne par T la variable alatoire qui, tout matriel tir au hasard, associe sa dure
de vie ou temps de bon fonctionnement avant dfaillance (TBF).
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
199
On se place dans le cas o T est une variable alatoire de type continu prenant ses valeurs
dans ]0;+[ et possdant une densit de probabilit f .
La fonction de rpartition F de la variable alatoire T est telle que, pour tout t 0,

= =
t
dx x f t T P t F
0
) ( ) ( ) ( . F est appele fonction de dfaillance (F comme "failure").
On note, pour tout t 0 , ) ( 1 ) ( ) ( t F t T P t R = > = . R est appele fonction de fiabilit
(R comme "reliability").
La question maintenant est celle du choix d'une loi pour la variable alatoire T, conforme
aux observations statistiques et modlisant la fiabilit du matriel.
Ce choix dpend de l'aspect du taux d'avarie, dfini statistiquement par :
nombre de dfaillants au cours d' une priode
survivants au dbut de la priode nombre de
.
On dfinira, d'un point de vue probabiliste, le taux d'avarie moyen par unit de temps entre
t et t+h par :
[t;t+h]
=
) ( 1
) ( ) (
t F
t F h t F

h
1
.
Pour dfinir le taux d'avarie instantan
l'instant t, la dmarche est analogue celle
suivie pour dfinir la vitesse instantane.
Le taux d'avarie instantan l'instant t est
alors dfini par :
(t) =
) ( 1
1
t F
0
lim
h
h
t F h t F ) ( ) ( +
=
) ( 1
) ( '
t F
t F

.


Taux d'avarie constant
On suppose que le taux d'avarie est constant. La fonction de dfaillance F vrifie alors,
pour t 0,
=
) ( 1
) ( '
t F
t F

d'o ln(1 F(t)) = t + k puis F(t) = 1 + Ce


t
.
Sachant qu'il n'y a pas de dfaillance avant l'instant t = 0, on doit avoir F(0) = 0.
La solution particulire F vrifiant la condition F(0) = 0 est alors dfinie par :
F(t) = 1 e
-t
pour t 0 , fonction de rpartition de la loi exponentielle E () de
paramtre .
Simulation d'un historique de pannes
A titre d'exprimentation, on peut simuler un historique de pannes taux d'avarie constant.
Une pice est suppose avoir un taux d'avarie par heure de 0,007. Chaque heure,
l'instruction int(rand + 0.007) donne 0 s'il n'y a pas eu de panne durant l'heure et donne 1
(avec la probabilit 0,007) s'il y a eu panne durant l'heure. Le temps de bon fonctionnement
correspond au temps d'attente de la valeur 1, ce qui est simul par le programme suivant.

Commentaires CASIO
sans instruction While
CASIO T.I. 80 - 81
(sans instruction While)
T.I. 82 83 85 89 92
(G)
I : compteur du temps
de bon
fonctionnement (en
heures).
-1 I
Lbl 1
I + 1 I
Int ( Ran# + 0.007 ) =
0 Goto 1
I
0 I
While Int( Ran# +
0.007 ) = 0
I + 1 I
WhileEnd
I
:-1 I
:Lbl 1
:I + 1 I
: If int (rand+0.007) =
0
:Goto 1
:Disp I
:0 I
:While int( rand +
0.007 ) = 0
:I + 1 I
:End
:Disp I
F(t+h)
t t + h
F(t)
A
B
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
200
(*) Sur TI 89 et 92 la syntaxe est rand( ).


pass

STATISTIQUES

Historique de pannes.
recherche d'un
modle
(ajustement du nuage
de points)
PROBABILITES

Thorie mathmatique
permettant le calcul
prvisionnel.

Prvisions pour le

futur

La mise en commun des simulations nous a permis de faire un historique sur 200 TBF :

TBF (h) 25 50 75 100 125 150 175 200 225 250 275 300 325 350
R(ti) % 64 61 56 50 43 35 29 24 18 15 12 9 8 5

On obtient, sur papier semi-log., avec les
rsultats prcdents, un nuage de points
l'alignement trs convenable sur le point
de coordonnes (t = 0 , 100%), sauf pour
le dernier.

Ci-contre, simulation analogue et
visualisation de l'ajustement exponentiel
sur Excel.



Modlisation
Le temps tant discret dans la simulation (saut d'heure en heure), on simule une loi
gomtrique plutt qu'une loi exponentielle.

















2- Seconde approche : temps d'attente d'un succs dans un
processus de Poisson
De faon plus gnrale, la
loi exponentielle apparat
correspondre au temps
d'attente entre deux
succs d'un processus de
Poisson (pannes taux d'avarie constant mais aussi appels un standard tlphonique,

T : temps d'attente d'une
panne
X : nombre de pannes
sur [0 ; t = 286]
Processus de Poisson Temps continu E ( = 0,007) P (t 2)
Schma de Bernoulli Temps discret
G (p = 0,007)
avec P (T=k) = p(1-p)
k 1
B (286 ; 0.007)

0,007



0,993
0,007



0,993
Loi gomtrique (temps
d'attente du premier
succs dans un schma de
Bernoulli)
0
t

1 fois 2 fois 3 fois n fois
E () E () E () E ()
...
n+1 fois
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
201
arrives un guichet de banque, arrives de vhicules...). Un processus de Poisson possde
trois caractristiques : il est sans mmoire, rythme contant, correspondant des
vnements rares.

On peut suivre ici l'nonc du BTS Maintenance aronautique 94 qu'il est intressant de
proposer aux lves.
Voir galement les annales du B.T.S.

On considre un atelier comprenant de nombreuses machines identiques fonctionnant
indpendamment.

a) On appelle X
t
la variable alatoire qui, chaque machine choisie au hasard, associe le
nombre de pannes pendant l'intervalle de temps [0, t]. On admet que X
t
suit la loi de
Poisson de paramtre t.
Dterminer la probabilit que X
t
soit nulle .
On a P(X
t
= 0) = e
t
.

b) On appelle T la variable alatoire prenant comme valeur, pour chaque machine choisie
au hasard, l'instant de la premire panne.
En utilisant le a), dterminer R(t) = P(T > t).
On a R(t) = P(T > t) = P(X
t
= 0) = e
t
.

c) En dduire, pour t 0, F(t) = P(T t) puis f(t) = F '(t).
On obtient F(t) = 1 R(t) = 1 e
t
.
Donc f(t) = e
t
.

d) a tant un nombre rel strictement positif fix, on note I(a) =

a
dt t f t
0
) ( .
Dmontrer l'aide d'une intgration par parties que I(a) = )
1
(
1

a e
a
.
Calculer la limite de I(a) quand a tend vers +. Que reprsente cette limite ?
On constate que
+ a
lim I(a) =

1
. Pour une variable alatoire continue, ce calcul
fournit la valeur de l'esprance.

On a ainsi montr que, si T suit la loi exponentielle E (), l'esprance des temps de
bon fonctionnements (Mean Time Between Failures) vaut MTBF = E(T) = 1/ .


e) t et h tant deux nombres rels strictement positifs, dmontrer que la probabilit
conditionnelle P(T > t+h T > t) ne dpend que de h (et pas de t). On dit que T est "sans
mmoire".
On a P(T > t+h T > t) =
h
e
t R
h t R
t T P
h t T P
=
+
=
>
+ >
) (
) (
) (
) (
qui ne dpend que de h.
(On peut ne pas traiter cette question avec les lves, le conditionnement reste un sujet
dlicat.)
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
202
3 L'exemple de la dsintgration atomique
Le programme de terminale S applicable la rentre 2002 contient, propos de la loi
exponentielle, les lments suivants :

"Contenus :
Exemples de lois continues : - loi de dure de vie sans vieillissement."
"Modalits de mise en uvre :
Application la dsintgration radioactive : loi exponentielle de dsintgration des
noyaux."
"Commentaires :
Ce paragraphe est une application de ce qui aura t fait en dbut d'anne sur
l'exponentielle et le calcul intgral."

On peut, ce propos, tudier les extraits suivants du livre d'Emile Borel, "Le hasard"
(dition de 1914), contemporain des dcouverte de Pierre et Marie Curie.
L'exercice peut galement tre propos en B.T.S.


Pierre Curie (1859-1906) pousa en 1895 une
tudiante d'origine polonaise, Marie Sklodowska
(1867-1934). Leur collaboration aboutit la
dcouverte du polonium et du radium, ce qui leur
valut de recevoir en 1903, en commun avec Henri
Becquerel, le prix Nobel de physique. Marie
Curie, reste veuve, isola le radium pur et en
dtermina la masse atomique. Elle reut, ce titre,
le prix Nobel de chimie en 1911.

La radioactivit est une suite de dsintgrations
par lesquels les noyaux des lments radioactifs
voluent spontanment vers un tat plus stable. Ce
faisant, ils peuvent mettre un noyau d'hlium
(particule ), un lectron (particule

) ou un
positron (particule
+
). Les noyaux obtenus sont
en gnral dans des tats excits et se dsexcitent
en mettant un photon nergtique (rayon ).

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
203

[]
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
204







[]
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
205
On considre une matire radioactive et on note T la variable alatoire qui tout atome
radioactif pris au hasard associe le temps d'attente avant sa dsintgration.
On suppose que T est une variable alatoire continue de densit f , dfinie sur ]0, +[.
On dsigne par F la primitive de f dfinie sur [0, +[ par

=
t
dx x f t F
0
) ( ) ( = P(T t).

Soit t > 0 quelconque et considrons l'intervalle de temps [t, t + s].

1) Emile Borel affirme : "en un temps donn, une substance radioactive dtermine se
trouve perdre, en vertu du phnomne de la radioactivit, une proportion rigoureusement
dtermine de son poids."



Justifier que la proportion de poids perdu par la substance pendant l'intervalle de temps
[t, t + s] est :
) (
) (
t T P
s t T t P
>
+
.
Montrer que ce rapport peut s'crire
) ( 1
) ( ) (
t F
t F s t F

+
.

2) On dsigne par "taux moyen de dsintgration par unit de temps entre t et t + s " la
quantit
s t F
t F s t F
1
) ( 1
) ( ) (

+
et par "taux instantan de dsintgration au temps t " la limite
h(t) =
s t F
t F s t F
s
1
) ( 1
) ( ) (
lim
0

.
Montrer que h(t) =
) ( 1
) ( '
t F
t F

.

3) D'aprs le texte, la dcomposition radioactive se "distingue" par son invariance et, pour
tout t IR, h(t) = h est constant.
On a donc, pour tout t IR, h
t F
t F
=
) ( 1
) ( '
. En dduire que k ht t F + = )) ( 1 ln( o k est
une constante relle.

4) Dterminer F(0) et en dduire que, pour tout t 0,
ht
e t F

= 1 ) ( .
Donner l'expression de f (t).

5) A la fin du texte, E. Borel dit qu'un "calcul facile" donne
hy
e y T P

= > ) ( . Vrifier
cette affirmation.

6) Soit a un nombre rel strictement positif fix. On note

=
a
dt t f t a I
0
) ( ) ( .
Dmontrer, l'aide d'une intgration par partie, que )
1
(
1
) (
h
a e
h
a I
ha
+ =

.

7) Dterminer l'esprance de T (temps "moyen" d'attente d'une dsintgration) :
) ( lim ) ( a I T E
a +
= .
0 t t + s
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
206

8) Simulation et comparaison aux rsultats thoriques :

a) On suppose que h = 0,07.
Montrer que l'instruction, sur calculatrice, int(rand + 0.07) simule pour une unit de temps,
la dsintgration ventuelle de l'atome.
Effectuer plusieurs fois le programme suivant. Que simule-t-il ?

CASIO
sans instruction While
CASIO
avec instruction While
T.I. 80 - 81
(sans instruction While)
T.I. 82 83

T.I. 89 92

-1 I
Lbl 1
I + 1 I
Int ( Ran# + 0.07 ) =
0 Goto 1
I
0 I
While Int( Ran# +
0.07 ) = 0
I + 1 I
WhileEnd
I
:-1 I
:Lbl 1
:I + 1 I
: If int (rand+0.07) = 0
:Goto 1
:Disp I
:0 I
:While int( rand +
0.07 ) = 0
:I + 1 I
:End
:Disp I
:0 i
:While int( rand( ) +
0.07 ) = 0
:i + 1 i
:EndWhile
:Disp i

b) Complter le programme prcdent afin de simuler 200 temps de dsintgration et de
calculer le temps moyen.

CASIO
sans instruction While
CASIO
avec instruction While
T.I. 80 - 81
(sans instruction While)
T.I. 82 83

T.I. 89 92

Seq(0 , I , 1 , 200 , 1)
List 1
For 1 N To 200
-1 I
Lbl 1
I + 1 I
Int ( Ran# + 0.07 ) =
0 Goto 1
I List 1[N]
Next
Mean (List 1)
Seq(0 , I , 1 , 200 , 1)
List 1
For 1 N To 200
0 I
While Int( Ran# +
0.07 ) = 0
I + 1 I
WhileEnd
I List 1[N]
Next
Mean (List 1)
:seq(0 , I , 1 , 200 ,
1) L
1

:For(N , 1 , 200)
:-1 I
:Lbl 1
:I + 1 I
: If int (rand+0.07) = 0
:Goto 1
:End
:I L
1
(N)
:End
:Disp mean(L
1
)
:seq(0 , I , 1 , 200 ,
1) L
1

:For(N , 1 , 200)
:0 I
:While int( rand +
0.07 ) = 0
:I + 1 I
:End
:I L
1
(N)
:End
:Disp mean(L
1
)
:seq(0 , i , 1 , 200 ,
1) L1
:For n , 1 , 200
:0 i
:While int( rand( ) +
0.07 ) = 0
:i + 1 i
:EndWhile
:i L1[n]
:EndFor
:Disp mean(L1)

Comparer le temps moyen x obtenu sur 200 temps simuls avec E(T) =
07 , 0
1 1
=
h
.
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
207

Corrig de l'exercice : "Dsintgration atomique"

1) P(T > t) correspond au pourcentage (thorique) d'atomes non dsintgrs au temps t.
P(t T t + s) correspond au pourcentage (thorique) d'atomes se dsintgrant durant
l'intervalle de temps [t, t + s].
On a ensuite P(T > t) = 1 P(T t) = 1 F(t) et
) ( ) ( ) ( ) ( ) ( ) (
0 0
t F s t F dx x f dx x f dx x f s t T t P
t s t s t
t
+ = = = +

+ +
.
2) C'est la dfinition de la drive (on retrouve la notion de vitesse instantane).
3) On intgre.
4) On a la condition initiale F(0) = P(T 0) = P(T = 0) = 0.
5) On a P(T > y) = 1 P(T y) = 1 F(y) = e
hy
.
6) On intgre par parties. 7) On trouve E(T) =
h
1
.
8) Les temps d'attentes sont extrmement imprvisibles (voir premier cran ci-dessous).
Les moyennes observes sur 200 temps sont trs proches de l'esprance thorique
(obtenue au 6) : 1/h 14,3.











Remarque : approche de la loi exponentielle par les probabilits conditionnelles et l'quation
fonctionnelle de l'exponentielle.
C'est, par exemple, la dmarche suivie dans le document d'accompagnement du nouveau
programme de terminale S.







Puisque le phnomne est "sans mmoire", on a, pour tout t 0 et tout s 0 :
P( T > t + s T > t ) = P( T > s ).
En utilisant la dfinition des probabilits conditionnelles, on obtient :
) (
)) ( ) ((
t T P
t T s t T P
>
> + >
= P( T > s ).
C'est dire : P(T > t + s ) = P(T > t ) P(T > s ).
On a ainsi, pour tout t 0 et tout s 0 , R(t + s ) = R(t ) R(s ).
On retrouve l'quation fonctionnelle de la fonction exponentielle et on peut en dduire que
R( t ) = e
k t
.

Cette dmarche peut sembler plus lgante mais la manipulation des probabilits
conditionnelles est conceptuellement plus difficile. Par ailleurs, elle occulte le rle central
jou par le taux d'avarie ("fonction de hasard" ou taux de dsintgration). La prsentation
prcdente est davantage celle utilise en physique (voir les manuels de physique).

t t + s
s
0
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
208
4 Dtermination pratique de
a - Par changement de variable et rgression linaire
Comme R(t) = e
-t
ln R(t) = t , lorsque le nuage de points (t
i
, ln R(t
i
) ) est
correctement ajust (selon la mthode des moindres carrs) par la droite d'quation
y = a t + b avec b 0, on peut considrer que la variable alatoire T , correspondant aux
temps de bon fonctionnement, suit la loi exponentielle de paramtre = a.

Remarque propos du calcul des frquences observes :
Les frquences observes de matriels survivants R(t
i
) correspondent a priori
R(t
i
) =
n
n
i
1 o n
i
est le dfaillances l'instant t
i
(mthode des rangs bruts).
Pour de petits chantillons ( n 50), on prfre, selon la mthode des rangs moyens de
Johnson, estimer R(t
i
) par R(t
i
) =
1
1
+

n
n
i
(cela vite d'avoir R(t
n
) = 0 alors qu'avec un
chantillon plus grand, on aurait probablement encore au moins un matriel en
fonctionnement au temps t
n
).
Quand n < 20, on prend la mthode des rangs mdians de Johnson o R(t
i
) =
4 , 0
3 , 0
1
+

n
n
i

(cette mthode n'est pas utilise l'preuve de mathmatique).

Exemple : voir BTS Systmes constructifs bois et habitats 98 .
b - Ajustement graphique, sur papier semi-logarithmique
Sur papier semi-logarithmique, on a, en abscisses une chelle arithmtique pour le temps
et, en ordonnes, une chelle logarithmique (log dcimal) pour la fiabilit :
On sait que R(t) = e
-t
d'o ln R(t) = t et log R(t) =
10 ln
) ( ln t R
= t
10 ln

.
On obtient donc une reprsentation linaire de la fiabilit.
Dterminer la pente d'une droite sur du papier semi-logarithmique n'est pas pratique. On
obtiendra en considrant la MTBF (1/) : R(t) = e
-t
R(1/) = e
1
0,368.








Exemple : voir BTS Domotique 96.
y = R(t)
1
0,368
MTBF = 1/
MTBF = 1/
0,368
1
R(t)
0
log R(t)
sur papier millimtr sur papier semi-logarithmique
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
209
5 Application de la loi exponentielle l'tude des files d'attente

CASIO T.I.


















ViewWindow 0,2000,500,0,15,5

? L
? M
0 B
1 Q
(-ln Ran#) L C
Plot C,Q
(-ln Ran#) M R
(-ln Ran#) L A
Lbl 1
A > R Goto 3
R - A R
Lbl 2
C + A C
B + QA B
Q + 1 Q
(-ln Ran# ) L A
Goto 4
Lbl 3
A - R A
C + R C
B + QR B
Q - 1 Q
(-ln Ran# ) M R
Lbl 4
Plot C , Q
C 2000 Goto 5
Q = 0 Goto 2
Goto 1
Lbl 5
B C
:0 Xmin
:2000 Xmax
:500 Xscl
:0 Ymin
:15 Ymax
:5 Yscl
:PlotsOff
:ClrDraw
:Input L
:Input M
:0 B
:1 Q
:(-ln (rand)) / L C
:Pt-On (C,Q)
:(-ln (rand)) / M R
:(-ln (rand)) / L A
:Lbl 1
:If A > R
:Goto 3
:R - A R
:Lbl 2
:C + A C
:B + QA B
:Q + 1 Q
:(-ln (rand)) / L A
:Goto 4
:Lbl 3
:A - R A
:C + R C
:B + QR B
:Q - 1 Q
:(-ln (rand)) / M R
:Lbl 4
:Pt-On(C , Q)
:If C 2000
:Goto 5
:If Q = 0
:Goto 2
:Goto 1
:Lbl 5
:Disp B / C


III - LOI DE WEIBULL

Le nom de Wallodi Weibull (1887 1979) est attach celui de
la fiabilit. D'origine sudoise, Weibull travailla comme
inventeur (roulements billes, marteau lectrique... ) et
ingnieur conseil dans de nombreuses socits sudoises ou
allemandes, par exemple chez SAAB. Il s'intressa aux
problmes de rsistance des matriaux, en particulier ceux de
fatigue et de rupture des tubes vide. C'est dans ce cadre
qu'apparat en 1939 pour la premire fois la distribution de
Weibull. Mais l'article qui eut le plus d'influence fut publi en
1951 dans le "Journal of Applied Mechanics" sous le titre "A
Statistical Distribution Function of Wide Applicability" o sont
dcrit sept cas d'utilisation de la distribution de Weibull. En
effet, l'intrt de cette distribution, outre ses proprits
analytiques satisfaisantes, est de permettre un bon ajustement
d'une grande varit de problmes de dure de vie.

Arrive d'une
machine en panne
Rparation
Sortie de
machine
File d'attente
Le programme suivant, aprs introduction
des valeurs de et , simule sur un
graphique, l'volution de la longueur de la
file d'attente en fonction du temps, puis
affiche la longueur moyenne de la file
d'attente (y compris la machine en
rparation) sur l'intervalle de temps
[0 ; 2000 h].
E ( = 0,25)
E ( = 0,30)
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
210
1 - Aspect gnral des taux d'avarie
On constate exprimentalement, que pour la plupart des matriels, la courbe reprsentative
du taux d'avarie (instantan) en fonction du temps, a la forme suivante :





Courbe en baignoire


Lorsque est constant, on prendra pour
T la loi exponentielle.
Lorsque varie, on cherchera un modle
parmi les lois de Weibull.





2 - Loi de Weibull
Pour couvrir tous les cas o le taux d'avarie (t) varie avec le temps, Weibull a choisi pour
une fonction dpendant de trois paramtres : ; et .
La variable alatoire T qui, tout matriel tir au hasard, associe son temps de bon
fonctionnement avant dfaillance, suit la LOI DE WEIBULL de paramtres ; ;
lorsque le taux d'avarie est :
1
) (

\
|
=

t
t avec t > , > 0 , > 0.

Rle des diffrents paramtres :
est le "paramtre de forme" : son choix permet d'ajuster l'allure de la forme
exprimentale de l'volution du taux d'avarie :





(paramtre de position) fixe l'origine de l'tude (t > ).
(paramtre d'chelle) permet, lorsque = 1, d'avoir = 1/ , constante arbitraire.


0 t
(t)
Pannes
prcoces
Vie utile
Usure
Loi exponentielle
Lois de Weibull
y = (t)
= 1
= 0,5
= 3
= 1
(cas de la loi
exponentielle)
> 1 < 1
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
211
FONCTION DE FIABILITE, DE DEFAILLANCE, DENSITE :
On a vu que, par dfinition, (t) =
) ( 1
) ( '
t F
t F

d'o

t
dx x

) ( = [ ]
t
x F

)) ( 1 ln( = lnR(t).
Donc, R (t) =

\
|

t t
dx
x
dx x
e e

1
) (
.
Ainsi, lorsque T suit la loi de Weibull de paramtres , , , on a :

\
|

\
|
|

\
|

\
|
= = =
t t t
e
t
t f e t F e t R
1
) ( 1 ) ( ) ( .
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 1 2 3 4 5 6

MTBF :
E(T) =

+ + = + =

+

+
)
1
1 ( ) (
0
1
dx e x dt t tf
x
o est la fonction d'Euler.
Puis on peut calculer (T) = B avec B =
2
))
1
1 ( ( )
2
1 (

+ +
En conclusion, MTBF = E(T) = A + ; (T) = B , o A et B proviennent d'un calcul
d'intgrale et sont donns par la table du formulaire.
3 - Dtermination des paramtres de la loi de Weibull
a) Par rgression linaire
Pour se ramener un ajustement linaire, on doit passer deux fois au logarithme :

\
|

=
t
e t R ) (

\
|
=
t
t R )) ( ln( ) ln( ) ln( ))] ( ln( ln[

= t t R .
On dtermine de sorte que le nuage de points de coordonnes x
i
= ln(t
i
) et
y
i
= ln( ln R(t
i
)) soit correctement ajust par une droite d'quation y = ax + b.
On a alors ln( lnR(t)) = a ln(t ) + b c'est dire lnR(t) = (t )
a
e
b

soit R(t) =
a
a b
e
t
|

\
|

/
e

.
On a ainsi un ajustement par la loi de Weibull de paramtres ; = a ; = e
b/a
.

Exemple: Dans le cas de la mortalit aprs 40 ans, on a, sur Excel, choisi = 16 de sorte
que, dans l'ajustement linaire du nuage (x
i
, y
i
) le coefficient de corrlation r soit le plus
Densits de Weibull
de paramtres = 0,5 ; 1 ; 2 ; 3 ; 4
= 0 , = 2
= 4
(proche de la densit normale)
= 0,5
= 1
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
212
proche possible de 1. Le coefficient est alors donn par la pente a de de la droite de
rgression, et le coefficient par e
b/a

: 5 et 65.

On peut alors calculer la MTBF, qui reprsente l'esprance de vie d'un franais de 40 ans,
soit un ge de 75 ans.

Paramtres
r 0,99500975
16
5,2747657
64,5713411
MTBF 75,4702922
12,971447






Exemple : BTS Groupement B 2000 spcialit Maintenance industrielle.
b) Par ajustement graphique sur le "papier de Weibull"
Cas o = 0 :
On suppose dans ce qui suit que = 0 (origine des dfaillances t = 0), ce qui est le cas le
plus frquent l'examen.
Il existe dans ce cas un papier spcial, dit "papier de Weibull" ou "d'Allan Plait" qui
transforme le trac de la fonction de dfaillance F en une droite.
De R(t) =

\
|

t
e , on dduit ln R(t) =

\
|

t
donc ln
) (
1
t R
=

\
|
t
,
puis ln(ln
) (
1
t R
) = [ln t ln ] d'o ln(ln
) ( 1
1
t F
) = [ln t - ln ].
En posant Y = ln(ln
) ( 1
1
t F
) et X = ln t , on obtient l'quation d'une droite :
Y = X ln .


Sur le papier de Weibull, on distingue les axes
suivants :

Sur l'axe not " " : le temps t.
Sur l'axe "marge suprieure" : X = ln t.
Sur l'axe "marge gauche" : F(t) en %.
Sur l'axe not " " : Y = ln(ln
) ( 1
1
t F
).



99,9
0 -2 4
1 100
0

0,1
X=ln t
Y=ln[ln(1/(1 F(t)))]
-1
F(t) = ?
y = 5,2748x - 21,984
R
2
= 0,99
-7
-6
-5
-4
-3
-2
-1
0
1
2
3 3,5 4 4,5
xi
y
i
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
213
On peut demander aux lves de retrouver le pourcentage F(t) correspondant
l'intersection de l'axe " " avec la marge gauche : la condition Y = 0 conduit
ln(ln
) ( 1
1
t F
) = 0 c'est dire F(t) = 1 e
1
63,2 %.

Si, lorsque l'on reporte sur ce papier les points M(t
i
; F(t
i
)), on obtient un "bon" alignement
selon une droite D , on en dduit que = 0.
Cette droite a pour quation Y = X ln , avec X = ln t et Y = ln(ln
) ( 1
1
t F
).
Pour le point de D d'ordonne Y = 0, on a X = ln t = ln . L'chelle de l'axe not " " tant
logarithmique, on en dduit que la valeur du paramtre est donne par l'intersection de D
avec l'axe not "".
Le paramtre est le coefficient directeur de la droite D . Si l'on considre la parallle D '
D passant par le point de coordonnes (X = 0, Y = 0), D ' a pour quation : Y = X.
Pour X = 1, on a donc Y = . En graduant l'axe des valeurs de "vers le bas", la valeur
du paramtre pourra se lire directement l'intersection de la droite D ' avec l'axe not
" ".

D'o la procdure suivante :

Reporter les points (t
i
;F(t
i
)).
Tracer une droite D d'ajustement du nuage de
points (si = 0).
Reporter la parallle D ' D partir du point
d'abscisse 1 de l'axe not " ".
Reprer sur les axes correspondants les
valeurs des paramtres et .



Exemple BTS Maintenance 98.

Cas o 0 :
Lorsque 0, les points reports sur le papier de Weibull sont voisins d'une courbe non
rectiligne.
Lorsque > 0, on peut lire une valeur trs approximative de en prolongeant la courbe
"vers le bas", en effet on a 0 ) ( lim =

t F
t
(pas de dfaillance) d'o =

Y
t
lim .
On prend comme TBF : t
i
et, avec ce changement de variable, on se ramne au cas
prcdent o " = 0".

Exemple BTS Maintenance Nouvelle Caldonie 95 ( = 60).

99,9
1 100
0

0,1
D

D '

= 0
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
214
IV ESTIMATION DES PARAMETRES D'UNE LOI
EXPONENTIELLE OU DE WEIBULL
Ce paragraphe constitue un approfondissement des prcdents et n'est pas "indispensable en
premire lecture".

Les modules "Statistique infrentielle" et "Fiabilit" des programmes de mathmatiques en
BTS parus en 2001 insistent sur les outils statistiques, souvent sophistiqus, utiliss par les
logiciels industriels spcialiss que certains de nos tudiants peuvent tre amens
rencontrer (en particulier lors de stages). Il s'agit alors pour le professeur de
mathmatiques, d'avoir le recul ncessaire pour clairer ces lves sur la signification de
ces mthodes.

Extraits du programme :
"Les mthodes statistiques sont aujourd'hui largement utilises dans les milieux
conomique, social ou professionnel. Des procdures plus ou moins labores sont mises
en uvre []. Des logiciels spcialiss excutent automatiquement les calculs, suivant les
normes AFNOR ou ISO."
"L'objectif essentiel [] est d'amener les tudiants prendre du recul vis--vis des
mthodes utilises."
"On montrera que l'utilisation du papier de Weibull permet d'obtenir une estimation des
paramtres de cette loi, partir de la fonction de rpartition empirique. (L'utilisation de
logiciels ad hoc donne directement une estimation optimale des mmes paramtres et
permet, en outre, d'obtenir un intervalle de confiance)."

L'objectif de ce chapitre est d'apporter quelques lments thoriques concernant
l'estimation selon le maximum de vraisemblance et l'obtention d'intervalles de confiance
qui en dcoule.
1 LA METHODE DU MAXIMUM DE VRAISEMBLANCE
Cette mthode a t dveloppe par R. A. Fischer ds sa premire publication statistique en
1912. On peut cependant en trouver trace dans les travaux, au XVIII
e
sicle, de J. H.
Lambert et Daniel Bernoulli, puis de C. F. Gauss dans le cadre de la dtermination de la
loi normale. La popularit de cette mthode vient du fait de son applicabilit une large
varit de modles statistiques, permettant des investigations l o d'autres mthodes ne
permettent pas d'accder.

On considre une variable alatoire continue X , de fonction de densit f , laquelle dpend
d'un paramtre estimer. L'estimation de se fera partir d'un chantillon de n
ralisations indpendantes de X : soit x
1
, x
2
, , x
n
ces observations. L'ide consiste
estimer par la valeur rendant la plus probable l'observation des valeurs x
1
, x
2
, , x
n
(qui
ont rellement t obtenues sur l'chantillon).
On note X
i
la variable alatoire fournissant le i
me
lment de l'chantillon. Les X
i
sont donc
indpendantes, de mme loi que X. Ces variables alatoires tant continues, on ne calcule
pas exactement la probabilit ( )
I
i
i i
x X P ) ( = , qui est nulle, mais la probabilit
( )
I
i
i i i i
dx x x X P ) ] , [ ( + .
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
215
En vertu de l'indpendance des X
i
, on a :
( )
I
i
i i i i
dx x x X P ) ] , [ ( + = ) ] , [ (
1

=
+
n
i
i i i i
dx x x X P =

=
n
i
i i
dx x f
1
) , ( .
On recherchera ainsi tel que la "vraisemblance"

=
=
n
i
i
x f L
1
) , ( soit maximale (L pour
"likelihood"), ce qui revient maximiser ln L =

=
n
i
i
x f
1
) , ( ln .
Une condition ncessaire est donc que l'estimation de soit solution de
0 ) , ( ln ln
1
=


n
i
i
x f L nomme quation de vraisemblance.

2 ESTIMATION DU PARAMETRE D'UNE LOI EXPONENTIELLE
PAR LA METHODE DU MAXIMUM DE VRAISEMBLANCE
Dans ce qui suit on considre que la variable alatoire T associant son temps de bon
fonctionnement tout matriel d'un certain type pris au hasard, suit une loi exponentielle
de paramtre . On cherche estimer la valeur de d'aprs les temps de bon
fonctionnement (t
1
, , t
n
) obtenus sur un chantillon alatoire de taille n.
Estimation du paramtre par le maximum de vraisemblance
On a ici comme densit de probabilit pour T, f(t) =
t
e

et l'on cherche maximisant la


quantit ln L = ( )

n
i
t
i
e
1
ln

i
t n ln .
L'quation de vraisemblance s'crit donc 0 ln =

0 =
i
t
n

.
L'estimation de obtenue selon la mthode du maximum de vraisemblance sera donc
i
t
n
.
Exemple
Un chantillon alatoire de 9 temps de bon fonctionnement a donn les valeurs suivantes :
30 ; 50 ; 90 ; 130 ; 170 ; 230 ; 300 ; 410 ; 580.
L'estimation de fournie par le maximum de vraisemblance est donc :
0045 , 0
580 ... 30
9

+ +
.

Remarque :
La mthode d'estimation par rgression linaire selon les moindres carrs, fonde sur
l'quivalence
t
e t R

= ) ( t y t R = = ) ( ln , fournit, comme estimation de , la valeur
0,004 (voir les calculs ci-aprs, raliss selon la mthode des "rangs moyens" o les
frquences empiriques R(t
i
) sont obtenues en divisant l'effectif des survivants par n + 1 au
lieu de n ).
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
216
y = -0,004x - 0,006
R
2
= 0,9996
-2,5
-2
-1,5
-1
-0,5
0
0 100 200 300 400 500 600

ti R(ti) yi = ln(R(ti))
30 0,9 -0,10536052
50 0,8 -0,22314355
90 0,7 -0,35667494
130 0,6 -0,51082562
170 0,5 -0,69314718
230 0,4 -0,91629073
300 0,3 -1,2039728
410 0,2 -1,60943791
580 0,1 -2,30258509

Remarque : par cette mthode, la droite d'ajustement ne passe pas ncessairement par le
point (0, 0), ce qui est d aux variations alatoires.

L'estimation fournie par la mthode du maximum de vraisemblance n'est pas
ncessairement optimale. Ainsi l'estimateur correspondant au maximum de vraisemblance
pour la loi exponentielle, la variable alatoire

=
i
T
n
, n'est pas sans biais (la variable
alatoire T
i
est celle qui associe son temps de bon fonctionnement au matriel numro i
test, sur les n matriels tests indpendamment jusqu' dfaillance). En effet, on montre
que
1
) (

=
n
n
E .
Ainsi le maximum de vraisemblance a tendance, "en moyenne" surestimer un peu
(surtout sur de petits chantillons).
En revanche, ( ) ( )

1 1 1
= =

i
T
n
E E ainsi

1
est un estimateur sans biais de la MTBF,
estime alors par t t
n
i
=

1
.
L'avantage de l'estimateur

=
i
T
n
donn par le maximum de vraisemblance est qu'il
permet de construire un intervalle de confiance pour , ce que ne permet pas l'estimation
par rgression linaire.
Intervalle de confiance pour
Plutt que de considrer la variable alatoire

=
i
T
n
dont la loi ne fait pas partie des
lois usuelles, on tudie la variable alatoire

n
i
T
1
2 .
Lorsque T
i
suit la loi exponentielle de paramtre , la variable alatoire
i
T suit une loi
gamma de paramtre 1 et la variable alatoire 2T
i
suit une loi du khi 2 2 degrs de
libert. Les T
i
tant indpendantes, la variable alatoire

n
i
T
1
2 suit une loi du khi 2 2n
degrs de libert
6
.

6
Pour les proprits liant ces lois, on peut consulter : SAPORTA "Probabilits, analyse des donnes et
statistique" Ed. Technip pages 40-41.
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
217
On peut alors dterminer un intervalle de probabilit pour la variable alatoire

n
i
T
1
2 en
utilisant la table du khi 2.
On recherche dans la table les nombres
2
, 2

n
et
2
1 , 2

n
tels que :



2 1 ) 2 (
2
1 , 2
2
, 2
=
n i n
T P

ce qui quivaut


2 1
2 2
2
1 , 2
2
, 2
=
|
|

\
|

i
n
i
n
T T
P .


Pour les temps de bon fonctionnement t
i
obtenus sur l'chantillon de taille n, on prendra
comme intervalle de confiance de au coefficient de confiance 1 2 :

(
(

i
n
i
n
t t 2
,
2
2
1 , 2
2
, 2

.
Exemple
On reprend l'exemple prcdent, pour lequel 1990 =
i
t .
La table du khi 2 (ou la fonction KHIDEUX.INVERSE d'Excel) donne, pour un
2
2n = 18
degrs de libert :
2
05 , 0 ; 18
9,390 et
2
95 , 0 ; 18
28,869
(attention, sur Excel, on indique la probabilit " droite"
et non " gauche").
On aura donc comme intervalle de confiance pour au
niveau de confiance de 90 % :
[0,0023 ; 0,0073] .
3 ESTIMATION DES PARAMETRES D'UNE LOI DE WEIBULL
PAR LA METHODE DU MAXIMUM DE VRAISEMBLANCE
Dans ce qui suit on considre que la variable alatoire T associant son temps de bon
fonctionnement tout matriel d'un certain type pris au hasard, suit une loi de Weibull. On
suppose que = 0 et on cherche estimer les valeurs de et d'aprs les observations d'un
chantillon alatoire de taille n.
Estimation du paramtre
On a dans ce cas la densit

\
|

\
|
=
t
e
t
t f
1
) ( .
Temporairement, on pose

1
= de sorte que

t
e t t f

=
1
) ( .
densit du khi 2 2n degrs de libert

2
1 , 2

n

2
, 2

n

12
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
218
On a ln ( )

= =
+ + = =
n
i
i i
n
i
i
t t t f L
1 1
ln ) 1 ( ln ln ) ( ln

.
D'o ln

= =
+ + =
n
i
i
n
i
i
t t n n L
1 1
ln ) 1 ( ln ln

.
L'quation de vraisemblance conduit annuler les drives partielles, par rapport et ,
de l'expression prcdente :

0 ln
0 ln
L

=
= +


0
0 ) (ln ln

i
i i i
t

n
t t t
n
.
On recherche donc l'estimation de vrifiant : 0 ) (ln ln = +

i i
i
i
t t
t
n
t
n
.

On n'a donc pas une formule explicite de l'estimateur (la variable alatoire permettant
l'estimation) de selon le maximum de vraisemblance. L'estimation sera alors obtenue par
approximations successives.
Exemple
Un chantillon alatoire de 11 temps de bon fonctionnement a donn les valeurs t
i
du
tableau suivant. On ajuste la loi de T une loi de Weibull de paramtre = 0.
Sur Excel, on peut utiliser l'Outils "Valeur cible" pour rechercher une valeur de
rendant la quantit

i i
i
i
t t
t
n
t
n
) (ln ln proche de 0. On peut ensuite affiner
cette recherche par ttonnement en modifiant le contenu de la cellule contenant
l'estimation.


FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
219
On peut aussi obtenir une estimation de selon le maximum de
vraisemblance par approximations successives, par exemple en
partant d'une valeur
0
donne et de la formule de rcurrence
suivante :
n
t
t
t t
i
i
i i
k
k
k

=
+
ln ln
1
1

.

Cela qui conduit (voir le tableau ci-contre), aprs quelques
itrations, estimer par la valeur 3,46.

On utilise galement, dans ce contexte
7
, la mthode de Newton
d'approximations successives.

Remarque :
La mthode d'estimation ("habituelle") par rgression linaire
selon les moindres carrs (ou le papier de Weibull), base sur
l'quivalence

\
|

=
t
e t R ) ( y = x ln
o l'on a pos x = ln t et y = ln[ ln R(t)] , conduit aux rsultats
ci-dessous :

ti F(ti) R(ti) xi=ln(ti)
yi=ln(-lnR(ti))
14 0,09090909 0,90909091 2,63905733 -2,35061866
19 0,18181818 0,81818182 2,94443898 -1,60609005
24 0,27272727 0,72727273 3,17805383 -1,14427809
26 0,36363636 0,63636364 3,25809654 -0,79410601
29 0,45454545 0,54545455 3,36729583 -0,50065122
31 0,54545455 0,45454545 3,4339872 -0,23767695
36 0,63636364 0,36363636 3,58351894 0,01153414
40 0,72727273 0,27272727 3,68887945 0,26181256
43 0,81818182 0,18181818 3,76120012 0,53341735
46 0,90909091 0,09090909 3,8286414 0,87459138
48 1 0 3,87120101 #NOMBRE!

Cette mthode, o les valeurs de F(t
i
) sont calcules selon les rangs bruts, donne donc
comme estimation de la valeur 2,6.

L'estimation par maximum de vraisemblance prsentant un biais, sensible sur de petits
chantillons. On peut d'ailleurs affiner le rsultat prcdent en utilisant la mthode des
"rangs mdians", o R(t
i
) =
4 , 0
3 , 0
1
+

n
n
i
(n
i
tant le nombre de dfaillant), la rgression
linaire conduit alors estimer par la valeur 2,88 .
Remarque : quand on n'a pas d'expression analytique pour un estimateur (comme c'est le
cas ici pour celui de par le maximum de vraisemblance), la recherche des proprits de

7
Pour l'utilisation du maximum de vraisemblance en fiabilit, on pourra consulter : C. Cocozza-Thivent
"Processus stochastiques et fiabilit des systmes" Ed. Springer 1997.
y = 2,6446x - 9,4031
R
2
= 0,9923
-3
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
0 1 2 3 4 5
k
2
4,82285736
2,98984586
3,74064906
3,33082585
3,52862579
3,42662084
3,47755519
3,45169721
3,46471624
3,45813378
3,46145485
3,45977746
3,46062421
3,46019665
3,46041251
3,46030353
3,46035855
3,46033077
3,4603448
3,46033771
3,46034129

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
220
l'estimateur peut se faire par simulation. On pourrait ainsi corriger le biais de l'estimateur
de par le maximum de vraisemblance.
L'avantage de la mthode du maximum de vraisemblance sera, ici encore, d'obtenir des
estimateurs partir desquels on peut dduire des intervalles de confiance. C'est ce que nous
montrons plus loin pour le paramtre , mais les calculs permettant d'obtenir des
intervalles de confiance sur sont ici trop compliqus.
Les tables de Johnson indiquent qu'au niveau de confiance de 90%, pour un chantillon de
taille n = 11, il faut prvoir une "erreur" de l'ordre de 35%. Ainsi pour

2,6 on obtient
l'intervalle [1,69 ; 3,51] et pour

3,46 l'intervalle [2,24 ; 4,67] .


Mann, Shafer et Singpurwalla ont, plus prcisment, dtermin des formules analytiques et
des tables de calcul, utilisant la distribution du khi deux
8
.
Estimation du paramtre par le maximum de vraisemblance
Reprenons les rsultats donns prcdemment par la mthode du maximum de
vraisemblance. On a comme condition ncessaire : 0 =

i
t

n
o

1
= .
Si l'on suppose que est connu, on a donc une estimation de par :

i
t
n 1
d'o

1
|
|

\
|
=

n
t
i
.
On a ainsi une expression explicite de l'estimateur

|
|

\
|
=

n
T
i
du maximum de
vraisemblance ( la diffrence de

) ce qui facilite l'obtention d'intervalles de confiance


(en supposant connu).

Exemple

On reprend l'exemple prcdent, avec = 2,6.
L'estimateur du maximum de vraisemblance
fournit comme estimation de la valeur : 34,98.

Remarque :
La mthode d'estimation par rgression linaire
donnait :
2,6446 ln = 9,4031 d'o 35,01.




8
Voir C. Mascovici, J. C. Ligeron "Utilisation des techniques de fiabilit en mcanique" Ed. Lavoisier.
t
i
ti ^ 2,6 estim.
14 954,845032 34,979425
19 2112,3183
24 3877,47698
26 4774,53086
29 6342,12496
31 7542,93567
36 11127,2156
40 14633,7617
43 17661,1096
46 21046,0386
48 23508,6244

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
221
Intervalle de confiance pour
Par rapport ce que fournit l'estimation par rgression linaire, l'avantage de l'estimateur

|
|

\
|
=

n
T
i
obtenu, lorsque est connu, par le maximum de vraisemblance, est qu'il
permet d'obtenir un intervalle de confiance.
On a

i
T
n
1
et l'on va voir que les variables alatoires

i i
T Y = suivent une loi
exponentielle (situation dj envisage au paragraphe prcdent).
En effet, si T suit une loi de Weibull de paramtres = 0, et , sa fonction de rpartition
est donne par F(t) =

\
|

t
e 1 .
On a alors, pour l'expression de la fonction de rpartition de la variable alatoire T

:
P(T

y) =


y
e y F y T P

= = 1 ) ( ) (
/ 1 / 1
. Ce qui montre que T

suit une loi


exponentielle de paramtre

1
= .
Lorsque Y
i
suit la loi exponentielle de paramtre , la variable alatoire
i
Y suit une loi
gamma de paramtre 1. Les Y
i
tant indpendantes,

n
i
Y
1
suit une loi gamma de
paramtre n et

n
i
Y
1
2 suit une loi du khi 2 2n degrs de libert.
On peut alors dterminer un intervalle de probabilit pour la variable alatoire

n
i
Y
1
2 en
utilisant la table du khi 2 :



2 1 ) 2 (
2
1 , 2
2
, 2
=
n i n
Y P

ce qui quivaut


2 1
2 2
2
1 , 2
2
, 2
=
|
|

\
|

i
n
i
n
Y Y
P .
Revenons alors aux paramtres de
Weibull avec

1
= et

i i
T Y = :
On a donc

2 1
2 2
2
, 2
2
1 , 2
=
|
|

\
|


n
i
n
i
T T
P ,
c'est dire

2 1
2 2
/ 1
2
, 2
/ 1
2
1 , 2
=
|
|
|

\
|
|
|

\
|

|
|

\
|

n
i
n
i
T T
P .
densit du khi 2 2n degrs de libert

2
1 , 2

n
0
2
, 2

n

12
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
222
Pour les temps de bon fonctionnement t
i
obtenus sur l'chantillon de taille n et compte tenu
de l'galit

n t
i
=

, on prendra comme intervalle de confiance de au coefficient de


confiance 1 2 :
(
(
(

|
|

\
|
|
|

\
|

/ 1
2
, 2
/ 1
2
1 , 2
2
,
2

n n
n n
.

Exemple
On reprend l'exemple prcdent, pour lequel on avait n = 11 temps de bon fonctionnement
avec = 2,6 et 98 , 34 .
Donnons un intervalle de confiance pour au niveau de confiance 1 2 = 90 % :
(
(
(

|
|

\
|
|
|

\
|
6 , 2 / 1
2
05 , 0 ; 22
6 , 2 / 1
2
95 , 0 ; 22
22
98 , 34 ,
22
98 , 34

.
La table du khi 2 donne, pour un
2
22 degrs de libert :
2
05 , 0 ; 22
12,338 et
2
95 , 0 ; 22
33,924 .
On aura donc comme intervalle de confiance pour 90 % : [29,61 ; 43,70] .
Intervalle de confiance pour la MTBF et la fiabilit
Dans le cas o l'on suppose connu, on obtient facilement des intervalles de confiance
pour la M.T.B.F. et la fiabilit, partir de l'intervalle de confiance [
1
,
2
] calcul pour .
On sait que la M.T.B.F. est donne par E(T) = A (lorsque = 0) o

= + =
0
/ 1
)
1
1 ( dx e x A
x

est donn par une table du formulaire du BTS.


On aura donc comme intervalle de confiance pour la MTBF : [ ]
2 1
, A A .
De mme, puisque la fiabilit est donne par
|
|

\
|
|

\
|
=

t
t R exp ) ( , on aura comme
intervalle de confiance pour la fiabilit l'instant t :
(
(

|
|

\
|
|

\
|

|
|

\
|
|

\
|



2 1
exp , exp
t t
.
Exemple
On reprend les donnes prcdentes o = 2,6 ;
1
= 29,61 et
2
= 43,70.
La table du formulaire du BTS donne pour = 2,6 la valeur A 0,8882 d'o un intervalle
de confiance 90 % (dans le cas o l'on considre connu) pour la MTBF : [26,2 ; 38,9].
Dans le cas inconnu, il existe un abaque (norme NF X 06-501) selon la taille n de
l'chantillon et le niveau de confiance.
Pour la fiabilit l'instant t = 25 (par exemple), on obtient comme intervalle de confiance
90 % (en supposant = 2,6) : [0,525 ; 0,792].

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
223
V TEST D'ADEQUATION AU MODELE DE LA LOI
EXPONENTIELLE OU DE WEIBULL
Ce paragraphe constitue un approfondissement et n'est pas "indispensable en premire
lecture". La question de l'adquation un modle est particulirement mise en lumire
dans les modules "Statistique infrentielle" et "Fiabilit" des programmes de BTS parus en
2001, o l'on insiste sur les apports des logiciels spcialiss.

Extraits du programme :
"On soulignera que la validit d'une mthode statistique est lie l'adquation entre la
ralit et le modle la reprsentant."
"[] Dans le cadre de cette liaison, on pourra donner quelques exemples d'autres
procdures que celles figurant au programme de mathmatiques [], en privilgiant les
aspects qualitatifs, mais aucune connaissance leur sujet n'est exigible dans le cadre de
ce programme."
"Des logiciels spcialiss excutent automatiquement ces calculs, suivant les normes
AFNOR ou ISO."

L'objectif de ce paragraphe est d'apporter quelques lments thoriques concernant le test
de Kolmogorov mis en uvre dans les logiciels de fiabilit que les tudiants sont
susceptible de rencontrer dans la pratique, en particulier lors des stages. Le professeur de
mathmatiques pourra alors clairer les tudiants sur la signification de ces tests.
1 LA QUESTION DE L'ADEQUATION D'UN MODELE AUX
OBSERVATIONS
Il y a plusieurs degrs de sophistication dans l'tude de l'adquation d'un modle au
donnes statistiques empiriques. Le premier degr est l'ajustement graphique, "au jug",
utilisant un papier fonctionnel : si les points correspondant aux temps de bon
fonctionnement observs sont pratiquement aligns sur le papier semi-logarithmique
(respectivement sur le papier de Weibull), on considrera que le modle de la loi
exponentielle (respectivement d'une loi de Weibull de paramtre = 0) est adapt. Cette
procdure, encore largement utilise dans l'industrie, est trs simple (elle ncessite peu de
calculs) mais la qualit de l'ajustement n'est aucunement quantifie.
Un deuxime degr consiste intgrer dans les procdures prcdentes un ajustement
linaire selon la mthode des moindres carrs. Le coefficient de corrlation linaire est
alors un tmoin numrique de la qualit de l'ajustement. En revanche, les risques d'erreur
que l'on prend en choisissant tel ou tel modle ne peuvent tre quantifis en termes de
probabilit.
Le dernier degr consiste mettre en uvre
un test statistique d'hypothse qui permettra
d'valuer au moins le risque d'erreur de
premire espce. Ces procdures sont, du
point de vue thorique, trs labores, mais on
les trouve proposes dans les logiciels
spcialiss, o tous les calculs sont pris en
charge.
Il s'agit alors de comprendre la signification
des paramtres affichs par le logiciel
9


9
L'image correspond au logiciel "FiabExpert" distribu par la socit Knowllence (www.knowllence.com).
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
224
(paramtres choisir ou rsultats calculs), de faon effectuer les choix en connaissance
de cause. Sur l'exemple, on doit choisir le "niveau du test" (il s'agit bien sr du risque de
premire espce), puis sont affichs (ici pour un modle de loi exponentielle) "l'cart
maximum" et "D" indiquant si la loi est "acceptable" pour le test mis en uvre.
Il serait bon de savoir quoi tout cela correspond.

Dans ce qui suit on considre la variable alatoire T associant son temps de bon
fonctionnement tout matriel d'un certain type pris au hasard. On possde un chantillon
alatoire de n ralisations indpendantes de T, c'est dire n temps de bon fonctionnement
t
1
, , t
n
. On recherche la loi de T reprsentant ces observations.

2 TEST DE KOLMOGOROV
Ce test s'applique une variable alatoire de fonction de rpartition continue. Il est par
exemple utilis pour tester la normalit d'une distribution. On l'appliquera ici au problme
de l'adquation aux lois exponentielle et de Weibull. Ce test est d, dans le cas (comme ici)
d'un chantillon, Kolmogorov en 1933, et tendu par Smirnov au cas de la comparaison
entre deux chantillons, en 1939.
Principe du test
Soit T une variable alatoire de fonction de rpartition continue F. Le test est fond sur la
distance D
n
entre la fonction de rpartition empirique F
n
*
observe et la fonction de
rpartition thorique F
0
(continue) de la variable alatoire T, sous l'hypothse H
0
: F = F
0

du modle test.
On suppose que les n valeurs observes de la variable alatoire T (les n temps de bon
fonctionnement, dans le cadre de la fiabilit) sont ordonns : t
1
t
2
t
n
.
La fonction F
n
*
est constante par intervalles, dfinie par

<
=
+
n
i i n
t t
t t t
n
i
t t
t F
si 1
[ , [ si
si 0
) (
1
1
*
.
La distance utilise est ) ( ) ( sup
0
*
t F t F D
n
t
n
= qui est atteinte en l'un des points de
discontinuit de F
n
*
:
|

\
|
=

) ( ) ( , ) ( ) ( max
*
0 1
*
0 i n i i n i
i
n
t F t F t F t F D .
t
1
t
2
t
i
t
n

F
n
*
(t
i
) = i/n
F
0
(t
i
)
F
n
*
(t
i-1
)
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
225
Soit T
1
, , T
n
les variables alatoires indpendantes de mme loi que T fournissant les n
temps de bon fonctionnement : on peut considrer que l'on teste n matriels identiques,
fonctionnant indpendamment jusqu' dfaillance, et que T
i
est la variable alatoire
correspondant au temps de bon fonctionnement du i
me
matriel (ici les t
i
ne sont pas
ordonns).

On considre la "fonction" alatoire dont la fonction de rpartition empirique (observe)
est une ralisation : { } t T i
n
t F
i n
= / card
1
) (
~
*
(pour chaque valeur de t 0, ) (
~
*
t F
n
est
une variable alatoire).
Soit la variable alatoire ) ( ) (
~
sup
0
*
t F t F D
n
t
n
= . On montre que la loi de D
n
est
indpendante de F
0
et, pour n grand, Kolmogorov a dmontr le thorme limite suivant :

Sous l'hypothse que F
0
est la fonction de rpartition continue de T, on a :
) ( ) 1 ( ) (
2 2
2
y K e y D n P
Z k
y k k
n
n
= <

+
( fonction K de Kolmogorov ).

La loi de D
n
est tabule (mme pour n petit voir page suivante), ce qui permet la
dtermination de la zone d'acceptation de H
0
pour un certain seuil de risque :

La construction et mise en uvre du test au seuil de risque (premire espce) est la
suivante :
Choix des hypothses :
H
0
: F = F
0
contre H
1
: F F
0
.
Recherche de la zone d'acceptation de H
0
:
Sous l'hypothse H
0
, les probabilits ) ( <
n
D P correspondent celles de la table de
Kolmogorov-Smirnov. On y recherche donc la valeur d
n
telle que = < 1 ) (
n n
d D P .
La zone d'acceptation de H
0
sera donc [0, d
n
[.
Rgle de dcision :
Sur un chantillon de taille n on calcule :
|

\
|
=

) ( ) ( , ) ( ) ( max
*
0 1
*
0 i n i i n i
i
n
t F t F t F t F D .
Si D
n
< d
n
on accepte l'hypothse H
0
au seuil .
Si D
n
d
n
on refuse l'hypothse H
0
au risque de se tromper.
T
2
0
T
n
0
T
1
0 t
1
t
2

t
n
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
226
TABLE DE KOLMOGOROV-SMIRNOV
Valeurs d
n
telles que P = P(D
n
< d
n
)
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
227
TABLE DE KOLMOGOROV-SMIRNOV
Valeurs d
n
telles que P = P(D
n
< d
n
)
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
228
Exemple 1 (loi exponentielle)
On suppose que l'on dispose des
n = 9 temps de bon fonctionnement
t
i
ordonns suivants (d'aprs BTS
maintenance 1995) :
30, 50, 90, 130, 170, 230, 300, 410,
580.
On recherche si une modlisation
par la loi exponentielle est
envisageable. Une estimation (par
rgression linaire), sous cette
hypothse, du coefficient a
conduit la valeur = 0,0040
(mthode des rangs moyens).

On effectue un test de Kolmogorov au seuil de 5%.
Choix des hypothses :
H
0
: pour tout t 0, P(T t) = F
0
(t) =
t
e
004 , 0
1


contre H
1
: il existe t 0 tel que P(T t) F
0
(t).
Recherche de la zone d'acceptation de H
0
au seuil de 5%.
On recherche dans la table de Kolmogorov-Smirnov la valeur d
n
, pour n = 9, telle que, sous
l'hypothse H
0
, P(D
9
< d
9
) = 0,95. On trouve d
9
= 0,43001.
On calcule avec les 9 temps de bon fonctionnement de l'chantillon la valeur de
|

\
|
=

) ( ) ( , ) ( ) ( max
*
0 1
*
0 9 i n i i n i
i
t F t F t F t F D o la fonction de rpartition empirique sera
calcule selon la mthode des rangs moyens.
On a obtenu sur Excel :


t
i

F
9
*(t
i
) rangs
moyens
F
0
(t
i
) ) ( ) (
*
9 0 i i
t F t F ) ( ) (
1
*
9 0

i i
t F t F

30 0,1 0,11307956 0,01307956
50 0,2 0,18126925 0,01873075 0,08126925
90 0,3 0,30232367 0,00232367 0,10232367
130 0,4 0,40547945 0,00547945 0,10547945
170 0,5 0,49338301 0,00661699 0,09338301
230 0,6 0,60148096 0,00148096 0,10148096
300 0,7 0,69880579 0,00119421 0,09880579
410 0,8 0,80601996 0,00601996 0,10601996
580 0,9 0,90172641 0,00172641 0,10172641

D9 0,10601996

L'cart D
9
0,106 calcul sur l'chantillon est infrieur d
9
= 0,43001.
On accepte donc, au seuil de risque de 5%, l'hypothse H
0
selon laquelle T suit une loi
exponentielle de paramtre 0,004.

FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
229

Remarque :

On a reprsent ici les
fonctions de rpartition
empiriques F
9
*
(en
escaliers) et thorique F
0
.






Le logiciel FiabExpert affiche les rsultats ci-contre, pour un test de Kolmogorov 5%.
Ce qui est nomm "D de Kolmogorov" est la valeur limite pour l'acceptation de H
0
, fournie
par la table.
Ce qui est nomm "Ecart
maximum" est la valeur
max ) ( ) (
0
*
9 i i
t F t F calcule
avec = 0,00397 comme le
montre la vrification suivante effectue sur Excel :
cette valeur est 0,019959771.

Le logiciel semble ainsi sous estimer
l'cart D
9
entre les fonctions de
rpartition empirique et thorique, du
moins lorsque la fonction de
rpartition empirique F
n
*
est dfinie
comme constante par morceaux. De
ce fait, elle a tendance s'loigner de
F aprs chaque valeur t
i
, comme on
le voit sur la figure(on pourrait aussi la dfinir comme affine par morceaux).

Il semble que, dans la pratique, on prenne plus souvent
|

\
|
= ) ( ) ( max
*
0 i n i
i
n
t F t F D plutt
que
|

\
|
=

) ( ) ( , ) ( ) ( max
*
0 1
*
0 i n i i n i
i
n
t F t F t F t F D qui , du fait de la dfinition de la
fonction de rpartition empirique en escaliers, a tendance surestimer l'cart au modle.

0
0,2
0,4
0,6
0,8
1
0 100 200 300 400 500 600
FIABILITE LOI EXPONENTIELLE LOI DE WEIBULL
230

Exemple 2 (loi de Weibull)
Prenons l'exemple donn l'preuve du BTS Maintenance Nouvelle Caldonie 1995.
On dispose des 10 temps de bon fonctionnement suivants :
71 ; 78 ; 84 ; 90 ; 96 ; 104 ; 110 ; 120 ; 130 ; 145 .
En utilisant la mthode des rangs moyens et le papier de Weibull, on a estim que la
variable alatoire T suit une loi de Weibull de paramtres = 60 ; = 1,6 et = 50.

On effectue un test de Kolmogorov au seuil de 5%.
Choix des hypothses :
H
0
: pour tout t 0, P(T t) = F
0
(t) =
( )
6 , 1
50
60
1

t
e
contre H
1
: il existe t 0 tel que P(T t) F
0
(t).
Recherche de la zone d'acceptation de H
0
au seuil de 5%.
On recherche dans la table de Kolmogorov-Smirnov la valeur d
n
, pour n = 10, telle que,
sous l'hypothse H
0
, P(D
10
< d
10
) = 0,95. On trouve d
10
= 0,40925.
On calcule avec les 10 temps de bon fonctionnement de l'chantillon la valeur de
|

\
|
=

) ( ) ( , ) ( ) ( max
*
0 1
*
0 10 i n i i n i
i
t F t F t F t F D o la fonction de rpartition empirique sera
obtenue selon la mthode des rangs moyens.
On a obtenu sur Excel :


ti F*(ti) rangs moyens F
0
(ti) abs(F*(ti)-F
0
(ti)) abs(F*(ti-1)-F
0
(ti))


71 0,090909091 0,084871086 0,006038005


78 0,181818182 0,17718359 0,004634592 0,086274499


84 0,272727273 0,265833596 0,006893677 0,084015414


90 0,363636364 0,357001671 0,006634693 0,084274398


96 0,454545455 0,446335677 0,008209778 0,082699313


104 0,545454545 0,557372856 0,01191831 0,102827401


110 0,636363636 0,632120559 0,004243078 0,086666013


120 0,727272727 0,73781915 0,010546423 0,101455514


130 0,818181818 0,819709771 0,001527953 0,092437044


145 0,909090909 0,903413909 0,005677 0,085232091


max : max :


0,01191831 0,102827401


L'cart D
10
0,103 calcul sur l'chantillon est infrieur d
10
= 0,40925.
On accepte donc, au seuil de risque de 5%, l'hypothse H
0
selon laquelle T suit une loi de
Weibull de paramtres = 60 ; = 1,6 et = 50.

On donne ci-contre l'affichage du logiciel
FiabExpert sur cet exemple.
De mme que pour l'exemple prcdent,
seul l'cart max ) ( ) (
0
*
10 i i
t F t F est pris en
compte, ce qui semble correspondre la
pratique en entreprise.
ANNALES DU B.T.S. - FIABILITE
231

T.P. Excel : AJUSTEMENT A UNE LOI
EXPONENTIELLE OU A UNE LOI DE WEIBULL

Objectifs
Utiliser la rgression linaire selon les moindres carrs pour ajuster une distribution
observe un modle exponentiel ou de Weibull.
Calculer une estimation des paramtres caractristiques de la loi.

I AJUSTEMENT A UNE LOI EXPONENTIELLE
(D'aprs BTS Maintenance 1995.)

Une quipe a relev durant une anne les temps de fonctionnement, en heures, entre deux
rglages conscutifs d'une machine de conditionnement et a obtenu les temps de bon
fonctionnement, rangs en ordre croissant, suivants :
30 ; 50 ; 90 ; 130 ; 170 ; 230 ; 300 ; 410 ; 580 .
On souhaite, partir de cet historique, modliser les dures de bon fonctionnement par une
loi exponentielle.
1 REGRESSION LINEAIRE
Lancer Excel.
Prparer le tableau ci-contre.
On va dterminer les frquences de
dfaillances F(t
i
) par la mthode des rangs
moyens :
En B2 entrer la valeur 0,1.
En B3 entrer la formule = B2 + 0,1
Recopier vers le bas (on approche le
pointeur de la souris du coin infrieur droit
de la cellule B2, quant celui-ci se transforme
en croix noire, on glisse, en appuyant sur le bouton gauche de la souris) jusqu'en B10.
En C2 entrer la formule = 1 B2
Recopier vers le bas jusqu'en C10.
En D2 entrer la formule = LN(C2)
Recopier vers le bas jusqu'en D10.

Lorsque la variable alatoire T correspondant au temps de fonctionnement suit une loi
exponentielle de paramtre , on a R(t) = e
t
.
En prenant le logarithme, on a l'quivalence : R(t) = e
t
ln R(t) = t.
Si le modle exponentiel est adapt, on devrait donc avoir des points (t
i
, y
i
) , avec
y
i
= ln R(t
i
) , pratiquement aligns sur la droite d'quation y = t.
Vous allez procder un ajustement linaire selon la mthode des moindres carrs, sur le
nuage de points (t
i
, y
i
) .

ANNALES DU B.T.S. - FIABILITE
232
Slectionner les cellules de A2 A10 puis,
en appuyant en mme temps sur la touche
CTRL, slectionner les cellules de D2
D10. Cliquer alors sur l'icne Assistant
Graphique.
A l'tape 1/4, choisir Nuage de points puis
cliquer sur Terminer.
Avec le bouton droit de la souris, cliquer
sur la lgende du graphique et choisir
Effacer.


Avec le bouton droit de la souris, cliquer
sur un point du graphique et choisir
Ajouter une courbe de tendance
Dans l'onglet Type choisir Linaire. Dans
l'onglet Options cocher Afficher
l'quation sur le graphique et Afficher le
coefficient de dtermination (R
2
) sur le
graphique.



Complter la feuille rponse.

2 ESTIMATION DES PARAMETRES
L'ajustement linaire prcdent incite choisir le modle exponentiel.
En dterminer le paramtre sur la feuille rponse.

Complter la feuille rponse.

II AJUSTEMENT A UNE LOI DE WEIBULL
(D'aprs BTS Maintenance Nouvelle Caldonie 1995.)

Une machine fabrique des pices cylindriques en grande srie.
Le parc de l'atelier comporte 10 machines fonctionnant dans les mmes conditions.
Afin d'tudier la fiabilit de ces machines, on relve le nombre de jours de bon
fonctionnement avant la premire dfaillance. Les rsultats sont :
110 ; 104 ; 78 ; 145 ; 130 ; 90 ; 120 ; 96 ; 71 ; 84.
On dsigne par T la variable alatoire qui, tout machine de ce type, associe sa dure de
vie.

ANNALES DU B.T.S. - FIABILITE
233
1 REGRESSION LINEAIRE ET ESTIMATION DE
Cliquer sur l'onglet Feuil2 puis prparer le tableau ci-dessous :


Dans la colonne B, on calcule les frquences de dfaillance selon la mthode des rangs
moyens.
En B2 entrer la formule = 1/11
En B3 entrer la formule = B2 + 1/11 puis recopier vers le bas jusqu'en B11.
En C2 entrer la formule = 1 B2 puis recopier vers le bas jusqu'en C11.
On va provisoirement donner au paramtre la valeur 0.
En H3 entrer la valeur 0.
En D2 entrer la formule = LN(A2 H$3) , puis recopier vers le bas jusqu'en D11 (le
symbole $ permet de conserver la rfrence 3 lors du recopiage).
En E2 entrer la formule = LN( LN(C2)) , puis recopier vers le bas jusqu'en E11.

Lorsque T suit une loi de Weibull de paramtres , , , on a

\
|

=
t
e t R ) ( .
Or, en prenant deux fois le logarithme, on a l'quivalence :

\
|

=
t
e t R ) ( ln( ln(R(t))) = ln(t ) ln() y = x ln()
en posant y = ln( ln(R(t))) , calculs dans la colonne E, et x = ln(t ) , calculs dans la
colonne D.
On est donc amen rechercher de sorte avoir une rgression linaire "correcte" de y
en x.
En H2 entrer la formule = COEFFICIENT.CORRELATION(E2:E11;D2:D11)
Il s'agit de dterminer de sorte que ce coefficient de corrlation soit le plus proche
possible de 1.

Dans le menu Outils choisir Valeur cible
Remplir la bote de dialogue ainsi :
Cellule dfinir : H2
Valeur atteindre : 1
Cellule modifier : H3
Puis cliquer sur OK.

Excel recherch une valeur de de sorte amliorer
l'alignement des points de coordonnes (x
i
, y
i
).
Arrondir au mieux le rsultat en prenant pour , dans la
cellule H3, une valeur entire.
ANNALES DU B.T.S. - FIABILITE
234

Complter la feuille rponse.

2 ESTIMATION DE ET CALCUL DE LA M.T.B.F.
Le paramtre de forme correspond la pente de la droite de rgression de y en x.
En H4 entrer la formule =PENTE(E2:E11;D2:D11)
Le paramtre est tel que : b = ln =

b
e

.
En H5 entrer la formule =EXP( ORDONNEE.ORIGINE(E2:E11;D2:D11)/H4)

On sait que la MTBF est alors donne par MTBF = + A o le nombre A est fourni par
le formulaire de l'examen pour la valeur de trouve. Cette valeur A est galement donne
par l'instruction EXP(LNGAMMA(1+1/)) d'Excel.
En G7 taper : MTBF .
En H7 entrer la formule = H3 + H5*EXP(LNGAMMA(1+1/H4))


Complter la feuille rponse.


ANNALES DU B.T.S. - FIABILITE
235

FEUILLE REPONSE
NOMS : .............................................................................................................

I AJUSTEMENT A UNE LOI EXPONENTIELLE
1 REGRESSION LINEAIRE
Quelle est l'quation de rgression linaire y = a t + b affiche par Excel ?
...........................................................................................................................................................
En dduire, l'aide cette quation, une expression de R(t) sous la forme R(t) = e
a t + b
.
...........................................................................................................................................................
Calculer le coefficient de corrlation linaire r (c'est ici l'oppos de la racine du coefficient
de dtermination R
2
) : ......................................................................................................................
Comment peut-on interprter la valeur de r ? ...................................................................................
2 ESTIMATION DES PARAMETRES
Donner une valeur approche 10
2
prs de e
b
: ........................................................................
En prenant comme valeur approche e
b
= 1, donner l'expression de R(t) :
...........................................................................................................................................................
En dduire qu'on peut considrer que T suit une loi exponentielle.
En donner le paramtre :
...........................................................................................................................................................
...........................................................................................................................................................
Calculer la M.T.B.F. :
...........................................................................................................................................................
II AJUSTEMENT A UNE LOI DE WEIBULL
1 REGRESSION LINEAIRE ET ESTIMATION DE
Quelle est la valeur entire de pour laquelle le coefficient de corrlation linaire r est le
plus proche de 1 ?
On trouve =
Quelle est alors la valeur de r ? ........................................................................................................
En dduire qu'on peut considrer que T suit une loi de Weibull.
...........................................................................................................................................................
...........................................................................................................................................................
2 ESTIMATION DE ET CALCUL DE LA M.T.B.F.
Les estimations obtenues sont les suivantes :

=
=
M.T.B.F. = .

ANNALES DU B.T.S. - FIABILITE
236

Corrig de l'activit EXCEL
"AJUSTEMENT A UNE LOI EXPONENTIELLE OU A UNE LOI DE WEIBULL"

I AJUSTEMENT A UNE LOI EXPONENTIELLE
1 REGRESSION LINEAIRE
On obtient les rsultats suivants :















D'aprs l'ajustement linaire, on a R(t) = e
0,004 t 0,006
.
Le coefficient de corrlation linaire est r 0,9998.
Comme r est, en valeur absolue, trs proche de 1, on peut dire que le nuage de point est
pratiquement align.

2 ESTIMATION DES PARAMETRES
On a e
0,006
0,99.
En prenant e
0,006
= 1, on a R(t) = e
0,004 t
.
On peut donc considrer que T suit la loi exponentielle de paramtre = 0,004.
On a M.T.B.F. = 1/ = 1/0,004 250 heures.


II AJUSTEMENT A UNE LOI DE WEIBULL
1 REGRESSION LINEAIRE ET ESTIMATION DE
Pour = 0, on obtient r 0,98.












La valeur optimale de est = 60. On a alors r 0,9997.
Comme r est trs proche de 1, on peut en dduire qu'il est raisonnable de considrer que T
suit une loi de Weibull de paramtre = 60.

ANNALES DU B.T.S. - FIABILITE
237


2 ESTIMATION DE ET CALCUL DE LA M.T.B.F.
Les rsultats obtenus sont les suivants :















ANNALES DU B.T.S. - FIABILITE
238




ANNALES DU B.T.S. - FIABILITE
239

Annales du B.T.S. : LOI EXPONENTIELLE
LOI DE WEIBULL

LOI EXPONENTIELLE

1 Systmes constructifs bois et habitat 1998


Un systme dclenche automatiquement, en fonction de la temprature et de la vitesse du
vent, l'ouverture et la fermeture d'un store extrieur protgeant la vitrine d'un magasin.
Une tude statistique a permis d'obtenir les valeurs suivantes de la fonction de fiabilit
t R (t) du systme o t dsigne le nombre de jours depuis l'installation de celui-ci.

t 90 200 360 500 750 1000 1200 1500
R(t) 0,89 0,76 0,61 0,51 0,36 0,25 0,19 0,13
ln[R(t)]

a) Reproduire et complter le tableau prcdent. On donnera les valeurs dcimales
arrondies 10
3
de ln[R(t)].

b) Tracer le nuage de points correspondant la srie statistique (t, ln[R(t)]). En abscisse,
100 jours seront reprsents par 1 centimtre et, en ordonne, 1 unit sera reprsente par 5
centimtres.

c ) Donner une quation de la droite d'ajustement y = m t + p obtenue par la mthode des
moindres carrs et tracer celle-ci sur le graphique prcdent. Les valeurs dcimales
arrondies 10
6
prs des coefficients m et p peuvent tre obtenues directement l'aide
d'une calculatrice.
Montrer qu'en utilisant cette quation on obtient : R (t) = 1,003413 e
0,001374 t
.

d) On admet pour la suite que R (t) = e
0,001374 t
; ainsi la fiabilit du systme suit une loi
exponentielle.
Donner une valeur approche 10
6
prs du taux d'avarie du systme, puis la MTBF
(moyenne du temps de bon fonctionnement) au jour prs.

e) Calculer, 10
2
prs, la probabilit de voir le systme tomber en panne pendant l'anne
de garantie, c'est dire avant 365 jours.


2 Informatique de gestion 1999


On considre une production de composants d'un certain type. On admet que la variable
alatoire T qui, tout composant tir au hasard dans la production, associe sa dure de vie t,
exprime en heures, suit une loi exponentielle de paramtre .
Epreuves
corriges
de B.T.S.
ANNALES DU B.T.S. - FIABILITE
240

1.a) On note R la fonction de fiabilit ; donner l'criture de R(t) en fonction de et de t.
b) On admet que R(600) = 0,93. Calculer la valeur exacte de . Donner sa valeur dcimale
arrondie 10
5
prs, lue sur la calculatrice.

2. On prendra dans cette question : = 0, 0001.
a) Dterminer la MTBF de T (moyenne des temps de bon fonctionnement).
b) Calculer, 10
2
prs, la probabilit P(T > 1500).


3 Domotique 1996


On s'intresse un type de constituant fonctionnant dans un appareil, en moyenne, trois
heures par jour. On note T la variable alatoire qui, tout constituant alatoire, associe sa
dure de vie en jour et on note pour t > 0, R(t) = P(T > t).
L'tude des temps de bon fonctionnement d'un lot de constituants fabriqus par une
machine a permis de placer 6 points de coordonnes (t
i
, R(t
i
)) sur du papier semi-
logarithmique, voir annexe.

1 La variable T suit une loi exponentielle de paramtre :
- Expliquer pourquoi.
- Estimer en se servant du graphique.
- En dduire R(t) en fonction de t.

2A l'aide du graphique, dterminer successivement la probabilit qu'un constituant
fonctionne :
- plus de 100 jours ;
- moins de 50 jours.
Retrouver ces rsultats par le calcul, en utilisant l'expression de R(t) trouve au 1.

ANNEXE :


















ANNALES DU B.T.S. - FIABILITE
241

4 Maintenance 1995


L'quipe de maintenance a relev durant une anne les temps de fonctionnement, en
heures, entre deux rglages conscutifs d'une machine de conditionnement et a obtenu les
temps de bon fonctionnement, rangs en ordre croissant, suivants :

30 ; 50 ; 90 ; 130 ; 170 ; 230 ; 300 ; 410 ; 580 .

1 A l'aide de la mthode des rangs moyens complter le tableau suivant :

TBF t
i
F(t
i
) R(t
i
) y
i
= ln R(t
i
)
....... .......... .......... ...........

2 A l'aide de la calculatrice, dterminer une quation y = at + b de la droite d'ajustement
des valeurs de y celles de t, ainsi que le coefficient de corrlation entre t et y.

3 En prenant pour valeurs approches : a = 0,004 et b

= 0 donner l'expression de R(t).
En dduire la loi suivie par la variable alatoire mesurant la dure de bon fonctionnement.
Calculer la MTBF .

4 Dterminer par le calcul la priodicit de rglage systmatique base sur une fiabilit de
80 % .


5 Domotique 1993


La commande d'un portail automatique est compose de trois lments : une commande
manuelle infrarouges type plip, un rcepteur et un vrin lectrique.
Pour tudier la fiabilit du systme on a relev le nombre de jours de bon fonctionnement
avant panne et on a obtenu le tableau suivant :

t
i
100 250 450 600 750 900 1100 1400
R(t
i
) 0,86 0,69 0,51 0,41 0,32 0,26 0,19 0,12

o t
i
dsigne le nombre de jours et R(t
i
) la valeur prise par la fonction de fiabilit la date
t
i
.

a) Tracer le nuage de points M
i
(t
i
; R(t
i
)) sur du papier semi-logarithmique.

b) On admet que la fiabilit du systme suit une loi exponentielle.
En dduire graphiquement la MTBF, puis le taux d'avarie.

c)Calculer la probabilit de voir le systme tomber en panne durant l'anne de garantie.

ANNALES DU B.T.S. - FIABILITE
242

6 Utiliser le papier semi-log ou la calculatrice que prfrez-vous ?


On a relev, durant une priode de 1500 heures la dure de vie de 24 lments identiques,
mis en service la mme heure.
On a obtenu les rsultats suivants :

Dure de vie en heures [0, 100] ]100, 200] ]200, 300] ]300, 400] ]400, 500]
Nombre de dfaillants 5 4 3 3 2
Dure de vie en heures [500, 600] ]600, 750] ]750, 1000] ]1000, 1500]
Nombre de dfaillants 1 2 2 2

1 En utilisant la mthode des rangs moyens complter le tableau :

TBF t
i
F(t
i
) en % R(t
i
) en % y
i
= ln R(t
i
)
......... ............. ............. ............

2 Tracer le nuage de points M( t
i
; R(t
i
) ) sur du papier semi-logarithmique, en dduire
que la variable alatoire qui mesure la dure de vie des lments suit une loi exponentielle.
Dterminer graphiquement la MTBF.

3 En dduire le paramtre et l'cart type de cette loi exponentielle ainsi que l'expression
de R(t) .

4 Dterminer graphiquement et par le calcul le pourcentage d'lments de ce type encore
en service au bout de 900 heures et quel instant t
0
la fiabilit dun lment est de 50 % .
Etant donn qu linstant t
0
, la fiabilit dun lment est de 50 %, dterminer, cet
instant t
0
, celle dun systme de deux lments monts en parallle si lon admet que
les deux lments fonctionnent de faon indpendante.

5 On monte en srie 2 lments. Montrer que la variable alatoire qui mesure la dure de
vie de ce type de systme suit une loi exponentielle dont on dterminera le paramtre.
(On admettra encore l'indpendance du fonctionnement des deux lments).

6 A l'aide de la calculatrice, dterminer une quation y = a t + b de la droite d'ajustement
des valeurs de y celles de t, ainsi que le coefficient de corrlation entre t et y .
En dduire l'expression de R(t) et comparer le paramtre de cette loi avec celui obtenu au
3.


7 Groupement C 1999 (Analyse)


On appelle f la fonction dfinie sur IR par : f (t) =
9
3
10

e
t

.
1a) Dmontrer que f est une fonction dcroissante.
Dterminer sa limite en + et interprter gomtriquement ce rsultat.
b) Dterminer la limite de f en .
ANNALES DU B.T.S. - FIABILITE
243
c) Tracer soigneusement la courbe reprsentative de f dans un repre orthogonal pour t
variant de 0 1500 (chelle : 1 cm pour 100 units sur l'axe des abscisses et 10 cm pour
une unit sur l'axe des ordonnes).

2a) Rsoudre algbriquement dans IR l'quation f (t) = 0,5 ; donner la valeur exacte de la
solution, puis sa valeur approche arrondie l'unit.
b) En dduire l'ensemble des solutions de l'inquation f (t ) < 0,5.

3 On appelle T la variable alatoire associant toute machine d'un certain type sa dure,
en heures, de fonctionnement sans panne.
On admet que, pour t rel positif ou nul, f (t) reprsente la probabilit que T soit suprieur
t ainsi P(T > t) = f (t).
a) Calculer la probabilit qu'une telle machine fonctionne plus de 1000 heures sans panne.
b) Pourquoi peut-on affirmer qu'il y a plus de neuf chances sur dix qu'une telle machine
fonctionne sans panne plus de 400 heures ?


8 Maintenance Nouvelle Caldonie 1996 (Analyse)


1) Calcul d'intgrales
Calculer en fonction du nombre rel positif t , les intgrales suivantes :
a) x t F
t
x
d e
200
1
) (

0
005 , 0

= ;
x x t J
t
x
d e
200
1
) (

0
005 , 0

= ;
x x t K
t
x
d e
200
1
) (

0
005 , 0 2

= .

( On pourra utiliser des intgrations par parties pour calculer J(t) et K(t) ).

2) Interprtation en probabilits
Soit la fonction f dfinie par :

= =
< =

. 0 pour e
200
1
) (
, 0 pour 0 ) (
005 , 0
x x f
x x f
x
a) Calculer I = ) ( lim t F
t +
o F est dfinie au 1.
On admet que f est la densit de probabilit d'une variable alatoire T .
b) Calculer l'esprance mathmatique E(T) = ) ( lim t J
t +
de la variable alatoire T.
c) Calculer l'esprance mathmatique E(T
2
) = ) ( lim t K
t +
de la variable T
2
.
En dduire la variance V(T) = E(T
2
) [E(T)]
2
et l'cart type de la variable alatoire T.

3) Loi exponentielle
a) Montrer que la fonction de fiabilit associe variable alatoire T est dfinie sur
[0, +[ par R(t) = e

0,005 t
.
b) Calculer 10
3
prs : P(T > 300) , P(T > 100) et P(100 < T 300) .
c) Calculer la valeurs entire approche de t
0
telle que P(T t
0
) = 0,1 .

ANNALES DU B.T.S. - FIABILITE
244

9 Maintenance et exploitation des matriels aronautiques 1994


Un exemple de loi exponentielle

A) tant un nombre rel strictement positif on considre la fonction f dfinie sur IR de
la manire suivante :


= =
= <
x
x f x
x f x

e ) ( alors 0 si
0 ) ( alors 0 si
.

Soit X la variable alatoire relle qui admet la fonction f pour densit de probabilit ;
on dit que X suit la loi exponentielle de paramtre .

1Dterminer la fonction de rpartition F de la variable alatoire X dfinie sur [0, +[
par F(x) =

x
t t f

0
d ) (

et reprsenter graphiquement F sur [0, +[ .
2 a tant un nombre rel positif fix on note : I(a) =

a
t t f t

0
d ) ( .
a) Dmontrer l'aide d'une intgration par parties que : I(a) = )
1
( e
1


a
a
.
b) Calculer la limite de I(a) quand a tend vers +. Que reprsente cette limite ?

3 t et h tant deux nombres rels strictement positifs dmontrer que la probabilit
conditionnelle P( X > t + h / X > t) ne dpend que de h.
On dit que X est sans "mmoire".

B) 1 On appelle Y
t
la variable alatoire qui, toute priode de dure t exprime en
heures, associe le nombre d'appels reus par un standard tlphonique pendant cette
priode de dure t. On admet que Y
t
suit la loi de Poisson de paramtre t.
Dterminer la probabilit que Y
t
soit nulle.

2Ayant choisi une origine des temps on appelle X la variable alatoire prenant pour
valeur le temps d'attente du premier appel.
a) Exprimer en fonction de et de t la probabilit P(X > t), puis la probabilit P(X t).
b) En dduire que X suit une loi exponentielle.

ANNALES DU B.T.S. - FIABILITE
245
LOI DE WEIBULL

10 Maintenance 2000

Maintenance du systme lectronique des armoires de contrle :
Le service de maintenance prconise, pour les armoires de contrle, des interventions
prventives (par changement de certains lments lectroniques). La priode de ces
interventions sera dtermine partir d'un historique de pannes d'une armoire de contrle
choisie au hasard.
Les neuf premiers temps de bon fonctionnement (en jours) de cette armoire de contrle
sont les suivants (rangs en ordre croissant ) : 31 ; 42 ; 67 ; 77 ; 89 ; 95 ; 122 ; 144 ; 173 .
Soit T la variable alatoire qui, toute armoire de contrle, associe son temps de bon
fonctionnement. On cherche ajuster la loi de T une loi de Weibull.
A l'aide d'un tableur, on a obtenu le tableau et le graphique ci-dessous, o F(t
i
) et R(t
i
)
correspondent respectivement dfaillance et la fiabilit au temps t
i
(selon la mthode
des rangs moyens) :

Sur le graphique ci-dessus, figure la droite de rgression D de y en x, obtenue par la
mthode des moindres carrs, avec son quation dans un repre orthogonal, ainsi que le
carr r
2
du coefficient de corrlation linaire.
On admet que

ln quivaut ) ( = =
|

\
|

x y e t R
t
,
o l'on a pos x = ln t et y = ln[ln R(t)].

1. Dduire des informations prcdentes les rsultats ci-dessous :
a) Le nuage des points de coordonnes (x
i
, y
i
) est correctement ajust par cette droite D ;
b) On peut considrer que T suit une loi de Weibull de paramtre = 0 ;
c) On peut prendre, pour les deux autres paramtres, = 1,75 (arrondi au centime) et
= 109 (arrondi l'unit).
(On pourra utiliser l'quivalence encadre ci-dessus.)
2. Dterminer, par le calcul, la priodicit d'interventions prventives base sur une
fiabilit de 80%.

t
i
F(t
i
) R(t
i
) x
i
=ln(t
i
) y
i
=ln[-lnR(t
i
)]
31 0,1 0,9 3,43398720 -2,25036733
42 0,2 0,8 3,73766962 -1,49993999
67 0,3 0,7 4,20469262 -1,03093043
77 0,4 0,6 4,34380542 -0,67172699
89 0,5 0,5 4,48863637 -0,36651292
95 0,6 0,4 4,55387689 -0,08742157
122 0,7 0,3 4,80402104 0,18562676
144 0,8 0,2 4,96981330 0,47588500
173 0,9 0,1 5,15329159 0,83403245

y = 1,7522 x - 8,2171
r
2
= 0,9882
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
0 1 2 3 4 5 6
D
ANNALES DU B.T.S. - FIABILITE
246

11 Maintenance 1998


Un distributeur automatique labore du jus d'orange en mlangeant de l'eau et du concentr
d'orange.

Une tude de fiabilit de ce type de distributeur a permis d'obtenir le tableau suivant o t
i

est le temps de bon fonctionnement exprim en jours et F(t
i
) le pourcentage cumul de
distributeurs hors d'usage l'instant t
i
.

t
i
(en jours) 46 48 55 60 64 68 80
F(t
i
) (en %) 12,5 25 37,5 50 62,5 75 87,5

1 Placer les points de coordonnes (t
i
, F(t
i
)) sur le papier de Weibull fourni en annexe.
Expliquer pourquoi cette distribution peut tre ajuste par une loi de Weibull dont on
dterminera les paramtres. Calculer la MTBF.

2 Dterminer par le calcul et graphiquement la priodicit d'un entretien systmatique
reposant sur une fiabilit de 90 % .



12 Maintenance 1997


Un tour commande numrique fabrique en grande srie des cylindres.
Dans un premier temps le service de maintenance dcide d'tablir une carte de contrle qui
permette de dcider du moment o il est ncessaire de rgler le tour.
Dans un deuxime temps le service de maintenance dcide d'utiliser cette carte de contrle
pour relever les temps couls entre deux rglages successifs du tour et obtenir ainsi un
fichier historique permettant de dterminer une priodicit de rglage systmatique base
sur une fiabilit de 90 % .

Dtermination de la priodicit de rglage systmatique .
L'quipe de maintenance a relev pendant plusieurs mois les temps de fonctionnement, en
heures, entre deux rglages conscutifs du tour et a tabli le tableau suivant :

t
i
(en heures) 10 11 12 13 14 15 16 17 18 19 20
F(t
i
) (en %) 10 15 23 30 40 50 63 74 84 92 95

o t
i
reprsente le temps de fonctionnement entre deux rglages conscutifs et F(t
i
) le
pourcentage cumul de rglages effectus avant le temps t
i
.

1 Placer les points de coordonnes (t
i
, F(t
i
)) sur le papier de Weibull fourni en annexe .
Expliquer pourquoi cette distribution peut tre ajuste par une loi de Weibull dont on
dterminera les paramtres. Donner l'expression de R(t).

2 Calculer la MTBF et la probabilit de ne pas avoir de rglage faire avant cette MTBF.

ANNALES DU B.T.S. - FIABILITE
247
3 Dterminer graphiquement et par le calcul la priodicit de rglage systmatique base
sur une fiabilit de 90 % .


13 Maintenance Nouvelle Caldonie 1995


Une machine fabrique des pices cylindriques en grande srie .
Le parc de l'atelier comporte 10 machines fonctionnant dans les mmes conditions.
Afin d'tudier la fiabilit de ces machines, on relve le nombre de jours de bon
fonctionnement avant la premire dfaillance. Les rsultats sont :

110 ; 104 ; 78 ; 145 ; 130 ; 90 ; 120 ; 96 ; 71 ; 84 .

On dsigne par T la variable alatoire qui, toute machine de ce type , associe sa dure de
vie.

1 En utilisant la mthode des rangs moyens et l'aide du papier graphique de Weibull
fourni en annexe,
a) vrifier que la variable alatoire T suit une loi de Weibull de paramtre = 60 ;
b) dterminer les deux autres paramtres de cette loi ;
c) dterminer quel instant t
0
la fiabilit d'une telle machine est de 70 %.

2 Vrifier par le calcul le rsultat obtenu dans la question 1) c) .

3 Calculer la M.T.B.F .

14 Maintenance Nouvelle Caldonie 1998


La socit qui vous emploie utilise une pice OS 117 sur une de ses machines.
Le fabricant des pices OS 117 affirme que leur dure de vie moyenne est de 600 heures.
Vous devez contrler l'affirmation du fabricant et tudier la fiabilit de ces pices car leur
cot est important et le dlai de livraison est d'un mois.
Vous possdez l'historique de panne des 36 dernires pices dj utilises.
On dsigne par X la variable alatoire qui, chaque pice OS 117, prleve au hasard dans
la production, associe sa dure de vie exprime en heures.

Dans un deuxime temps vous dcidez d'tudier l'aide de l'historique prcdent la
fiabilit des pices OS 117. Cela vous a permis de constater que la variable alatoire X suit
approximativement la loi de Weibull de paramtres = 100 heures, = 3 et = 500
heures.

1 Dterminer la MTBF et lcart type de cette variable alatoire, donner l'expression de
R(t).

2 Dterminer par le calcul, quel instant t, la pice OS 117 a une fiabilit gale 0,9..

3 La pice OS 117 fonctionne 16 heures par jour (y compris les jours fris). Ds la
dfaillance de cette pice on la remplace par la seule pice en stock et on commande
immdiatement une autre pice. Le dlai de livraison est de 30 jours.
ANNALES DU B.T.S. - FIABILITE
248
Quelle est la probabilit que la pice OS 117 tombe en panne avant l'arrive de la pice de
rechange ?


15 Maintenance 1994


On tudie la dure de vie d'un certain type de composants lectriques fabriqus par une
usine.
On dsigne par T la variable alatoire qui chaque composant, prlev au hasard dans la
production , associe sa dure de vie exprime en mois.
Aprs une tude statistique, on admet que T suit la loi de Weibull de paramtres : = 0 ;
= 2,4 ; = 50 .

1 Reprsenter sur le papier de Weibull fourni en annexe la fonction de dfaillance F
correspondante.

2 Dterminer graphiquement 1% prs les probabilits des vnements suivants :
a) " la dure de vie d'un composant est infrieure 10 mois " ;
b) " la dure de vie d'un composant est comprise entre 10 mois et 50 mois ".

3 Dterminer par le calcul, puis l'aide du graphique, le temps au bout duquel un
composant doit tre chang, sachant que sa probabilit de survie doit rester suprieure
90%.
Comparer les deux rsultats.

4 Un systme (S) est constitu de deux composants du type prcdent, monts en srie et
fonctionnant de manire indpendante ( le systme (S) est donc dfaillant ds qu'un de ses
composants l'est ). Dterminer le temps au bout duquel (S) doit tre chang, sachant que la
probabilit de survie de (S) doit rester suprieure 90%.


16 Maintenance Nouvelle Caldonie 1995


Une usine fabrique des engrenages. Le service de maintenance a relev leurs dures de vie
en usure acclre. les rsultats sont consigns dans le tableau ci-dessous :

Dure de vie (heures) 250 350 400 510 550 600 750 800
F(t
i
) en pourcentages 3 11 18 40 50 63 91 96

F(t
i
) est le pourcentage d'engrenages hors service la date t
i
.

1 A l'aide du papier de Weibull justifier que la variable alatoire qui prend pour valeurs la
dure de vie des engrenages peut tre ajuste par une loi de Weibull. Dterminer les
paramtres de cette loi.

2 a) Calculer la M.T.B.F. et l'cart type de cette loi de Weibull.
b) Dterminer par le calcul au bout de combien de temps, 5% des engrenages sont
dfectueux. Vrifier graphiquement le rsultat obtenu.
ANNALES DU B.T.S. - FIABILITE
249

3Une transmission mcanique comporte une srie de trois engrenages identiques dont les
dures de vie suivent la loi prcdente et fonctionnent de faon indpendante.
Quelle est la probabilit que la dure de vie d'un tel systme soit au moins de 300 heures ?


17 Utiliser le papier de Weibull ou la calculatrice que prfrez-vous ?


A) Une usine utilise 19 machines de mme modle. Ltude du bon fonctionnement en
heures, avant la premire panne de chacune de ces 19 machines, a permis dobtenir
lhistorique suivant :

TBF en heures
[0, 250] ]250, 450] ]450, 600] ]600, 800] ]800, 1100] ]1100,1400]
Nombre de pannes
1 2 2 3 4 4

Trois autres machines ont fonctionn correctement au moins jusqu la date : 1400 heures.

1 Dterminer laide du papier de Weibull les paramtres de la loi de Weibull ajustant
cette distribution. Donner lexpression de R(t).

2 Calculer la MTBF et l'cart type de cette loi.

3 Dterminer graphiquement puis par le calcul la priodicit dun entretien systmatique
bas sur une fiabilit de 0,9.

4 Dterminer graphiquement et par le calcul, la probabilit quune machine de ce type
fonctionne plus de 2000 heures sans panne.

5 Donner l'expression du taux d'avarie que peut-on dire de sa reprsentation graphique ?.

6 On pose u
i
= ln t
i
et v
i
= ln( ln R(t
i
) )
a) Montrer par la mthode des moindres carrs, l'aide de la calculatrice, que les points
M
i
(u
i
, v
i
) peuvent tre ajusts par une droite d'quation v = a u + b .
Donner le coefficient de corrlation entre u et v.
b) En prenant des valeurs approches 10
- 1
prs des coefficients montrer que l'quation
peut s'crire : v = 2 u 14.
En dduire une expression de R(t) sous la forme :

=
) (
e ) (
t
t R


B) On modifie l'nonc de la partie A de la manire suivante :
Une usine utilise 19 machines de mme modle. Ltude du bon fonctionnement en heures,
avant la premire panne de chacune de ces 19 machines, a permis dobtenir lhistorique
suivant :

TBF en heures [1000, 1250] ]1250, 1450] ]1450, 1600] ]1600, 1800] ]1800, 2100] ]2100, 2400]
Nombre de pannes 1 2 2 3 4 4

Trois autres machines ont fonctionn correctement au moins jusqu la date : 2400 heures.

1 Placer sur le mme papier de Weibull que celui de la partie A les points N
i
(t
i
, F(t
i
)) ,
vrifier que = 1000. Donner lexpression de R(t).

ANNALES DU B.T.S. - FIABILITE
250
2 Calculer la MTBF et l'cart type de cette loi.

3 Dterminer graphiquement puis par le calcul la priodicit dun entretien systmatique
bas sur une fiabilit de 0,9.

4 Dterminer graphiquement et par le calcul, la probabilit quune machine de ce type
fonctionne plus de 2000 heures sans panne.

5 Donner l'expression du taux d'avarie que peut-on dire de sa reprsentation graphique ?


18 Maintenance 1997 (Analyse : influence du paramtre de forme)


La variation du paramtre de forme permet d'ajuster une grande quantit de distributions
exprimentales une loi de Weibull. On dsigne par f

la fonction de densit et par F

la
fonction de dfaillance de la variable alatoire T suivant une telle loi.
On dsigne par C

la courbe reprsentative de f

dans un repre orthogonal (O ; j , i


r r
) les
units graphiques tant de 5 cm sur l'axe des abscisses et de 10 cm sur l'axe des
ordonnes.
Dans cet exercice on considre les deux cas = 1 et = 2 lorsque les deux autres
paramtres de la loi de Weibull sont = 1 et = 0 .

1 Etude du cas = 1 :

On rappelle que la fonction f
1
et la fonction F
1
sont alors dfinies sur [ 0, + [ par :
f
1
(t) = e
t
et F
1
(t) =

t
0
f
1
(x) dx.
a) Construire la courbe C
1
dans le repre (O ; j , i
r r
).
On ne demande pas l'tude de la fonction f
1
.
b) Calculer, en fonction de t , l'intgrale F
1
(t) et en dduire la probabilit P(T 1)
10
3
prs.
c) Calculer I(t) =

t
0
x f
1
(x) dx . (On pourra effectuer une intgration par parties) .
Dterminer l'esprance mathmatique E(T) =
+ t
im l I(t) .

2 Etude du cas = 2 :

On rappelle que la fonction f
2
et la fonction F
2
sont alors dfinies sur [ 0, + [ par :
f
2
(t) = 2t e
t
2

et F
2
(t) =

t
0
f
2
(x) dx .
a) On admet que
+ t
im l f
2
(t) = 0. Etudier le sens de variation de f
2
.
b) En posant u = t
2
et en utilisant le dveloppement limit l'ordre 1 de e
u
au voisinage
de 0, dmontrer que le dveloppement limit l'ordre 3 de f
2
au voisinage de 0 est dfini
par : f
2
(t) = 2t 2t
3
+ t
3
(t) avec
+ t
im l (t) = 0.
ANNALES DU B.T.S. - FIABILITE
251
En dduire une quation de la tangente D C
2
au point d'abscisse 0, et la position
relative de D et de C
2
au voisinage de ce point.
c) Construire la tangente D et la courbe C
2
dans le repre (O ; j , i
r r
) utilis au 1.
d) Dmontrer que F
2
(t) = 1 e
t
2

et en dduire la valeur de t telle que P(T t) = 0,05 .


ANNALES DU B.T.S. - FIABILITE
252
Corrig des exercices d'preuves de BTS

1 SYSTEME CONSTRUCTIFS BOIS ET HABITATS
98
a)
t 90 200 360 500 750 1000 1200 1500
R(t) 0,89 0,76 0,61 0,51 0,36 0,25 0,19 0,13
ln[R(t)] -0,117 -0,274 -0,494 -0,673 -1,022 -1,386 -1,661 -2,040
b)

















c) A l'aide de la calculatrice on obtient :
r = 0,999858 10
6
prs.
Une quation de la droite de rgression
de y en t est : y = 0,001374 t 0,003407.
On en dduit 10
6
prs :
R(t) = e
0,001374 t 0,003407
,
R(t) = e
0,001374 t
e
0,003407
,
R(t) = 1,003413 e
0,001374 t
.
d) On admet R(t) = e
0,001374 t
.


Nous sommes en prsence d'une loi
exponentielle donc le taux d'avarie est
= 0,001374 et MTBF =

1

001374 , 0
1
MTBF = , MTBF 728 jours .
e) La probabilit de tomber en panne avant
365 jours est F(365) = 1 R(365),
F(365) = 1 e
0,001374 365
, F(365) 0,3944.

2 INFORMATIQUE DE GESTION 99
1) a) R(t) = e
t
.
b) R(600) = 0,93 quivaut e
600
= 0,93
et 600 = ln 0,93 , =
600
93 , 0 ln
,
= 0,00012 10
5
prs.
2) a) R(t) = e
0,0001 t
, MTBF =

1
,
MTBF =
0001 , 0
1
, MTBF = 10 000 heures.
b) P(T > 1500) = R(1500),
P(T > 1500) = 0,86 10
2
prs.

3 - DOMOTIQUE 96

1 Sur le papier semi-logarithmique les points sont
sensiblement aligns, la droite d'ajustement passe
par le point de coordonnes (0, 1). La droite de
rgression de ln R(t) en t a une quation de la forme
: ln R(t) = a t + b avec pour t = 0, R(t) = 1 donc b =
0, R(t) = e
at
, l'approximation par une loi
exponentielle est donc justifie.
Si dsigne le paramtre de cette loi exponentielle
R(t) = e
- t
, R(

1
) = e
- 1
donc R(

1
) = 0,368,
d'aprs le graphique, R(t) = 36,8 % pour t 200
jours,

1
= 200, 0,005, R(t) = e
- 0,005 t
.
2 La probabilit qu'un constituant fonctionne :
- plus de 100 jours est P(T > 100) = R(100) ;
- moins de 50 jours est P(T < 50) = 1 R(50).
Graphiquement on trouve : R(100) 0,60 ;
1 R(50) 1 0,78 soit 0,22.
Par le calcul : R(100) = e
- 0,005 100
,
R(100) = e
- 0,5
, R(100) 0,606.
1 R(50) = 1 e
- (0,005)(50)
,
1 R(50) = e
- 0,25
, 1 R(50) 0,221.

4 - MAINTENANCE 95
1
t
i
F(t
i
) R(t
i
) ln R(t
i
)
30 0,1 0,9 0,10536
50 0,2 0,8 0,22314
90 0,3 0,7 0,356675
130 0,4 0,6 0,510825
170 0,5 0,5 0,69315
230 0,6 0,4 0,91629
300 0,7 0,3 1,20397
410 0,8 0,2 1,609438
580 0,9 0,1 2,302585
ANNALES DU B.T.S. - FIABILITE
253

2 A l'aide de la calculatrice on obtient :
r = 0,999813.
On obtient une quation de la droite de rgression
de y en t :
y = 3,953. 10
3
t 0,00599.
On en dduit :
ln [R(t)] = 0,004 t 0,006 10
3
prs .
R(t) = e
0,004 t 0,006
.

3 On prend 1 comme valeur approche de e
0,006
donc R(t) = e
0,004 t
.


Nous sommes en prsence d'une loi exponentielle
donc MTBF =

1

004 , 0
1
MTBF = = 250 h .

4 La date t
0
telle que R(t
0
) = 0,80 est telle que
e
0,004 t
0
= 0,80 , 0,004 t
0
= ln 0,80 ,
t
0
55,8 heures .
La priodicit d'un entretien systmatique est donc
d'environ 56 heures.

5 - DOMOTIQUE 93

Le nuage de points M(t
i
;R(t
i
)) peut tre ajust par
une droite passant par le point de coordonnes
(0 ; 1) .
b) La variable alatoire qui mesure la dure de vie
des pices de ce type suit une loi exponentielle.
La MTBF 640 donc le paramtre est
0,0015625

et R(t) = e
- 0,00156 t
.

c) R(365) 0,565 , F(365) = 1 R(365) 0,435.
La probabilit de voir le systme tomber en panne
durant l'anne de garantie est donc environ 43,5%.
(graphiquement : R(365) 56% ).


6 - 1
t
i
100 200 300 400 500 600 750 1000 1500
n
i
5 9 12 15 17 18 20 22 24
F(t
i
)
%
20 36 48 60 68 72 80 88 96
R(t
i
)% 80 64 52 40 32 28 20 12 4

0,01
0,1
1
0 200 400 600 800 1000 1200 1400 1600
t en heures
460
0,368
320
0,5
2 Le nuage de points M(t
i
, R(t
i
)) peut tre ajust
par une droite passant par le point de coordonnes
(0;1) , la variable alatoire qui mesure la dure de
vie des pices suit donc une loi exponentielle.
Sur la droite le point dordonne 36,78% a pour
abscisse t 460 donc MTBF 460 heures.

3 Le paramtre est 1/460 0,0022

et
R(t) = e
- t/460
,

R(t) = e
- 0,0022 t
.

4 On trouve graphiquement R(900) 14 % et par
le calcul R(t) = e
- 900/460
0,138. Pour R(t
0
) = 0,5
on trouve sur le graphique t
0
320 h.
Par le calcul R(t
0
) = 0,5 quivaut e
- t0/460
= 0,5,
460
0
t
= - ln 0,5, t
0
= 460 ln 2, t
0
318,84, t
0
319.
Si R(t
0
) = 0,5 alors F(t
0
) = 0,5 .
Le systme de 2 lments monts en parallle est
dfaillant si les deux lments sont dfaillants.
Les deux lments fonctionnant de faon
indpendante, la probabilit que le systme soit
dfaillant est : F
S
(t
0
) = (0,5)
2
= 0,25 .
La fiabilit du systme linstant t
0
est donc
R
S
(t
0
) = 1 - F
S
(t
0
) R
S
(t
0
) = 0,75.

5 Le systme S ' de deux lments monts en srie
fonctionne la date t si les deux lments
fonctionnent la date t . Les deux lments
fonctionnant de faon indpendante, la fiabilit la
date t est R
S'
(t) = R(t)
2

R
S'
(t) = (e
- t/460
)
2
, R
S'
(t) = e
- t/230
.
La fiabilit diminue , la MTBF n'est plus alors que
de 230 heures.

6 On trouve en prenant les valeurs approches :
R(t) = e
0,002 t
, rponse sensiblement identique
celle trouve au 3.
ANNALES DU B.T.S. - FIABILITE
254
7 GROUPEMENT C 99
1 a) f ' (t) =
9
2
10
3t 9
3
10
e
t

, pour tout rel t 0,


9
3
10
e
t

> 0 et
9
2
10
3t
> 0 donc pour tout t 0
f' (t) < 0 et f '(0) = 0,
f est strictement dcroissante sur IR.
9
3
10
lim
t
t

+
= ,
9
3
10
e lim
t
t

+
= 0 puisque
u
e lim
u
= 0 donc ) ( lim t f
t +
= 0.
L'axe des abscisses est asymptote la courbe
reprsentative de f .

b)
9
3
10
lim
t
t


= +,
9
3
10
e lim
t
t


= + puisque
u
e lim
+ u
= + donc ) ( lim t f
t
= +.



c)




















3 a) Les quations suivantes sont quivalentes
dans IR : f (t) = 0,5 ;
9
3
10
e
t

= 0,5 ;
5 , 0 ln
10
1
3
9
= t ,
2 ln 10
9 3
= t ,
3 3
2 ln 10 = t , t 885.

b) f est strictement dcroissante sur IR,
f (
3 3
2 ln 10 ) = 0,5 donc f (t) < 0,5 quivaut
3 3
2 ln 10 > t , l'ensemble des solutions de
l'inquation est donc l'intervalle ]
3 3
2 ln 10 , +[.

4 a) La probabilit qu'une telle machine fonctionne
plus de 1000 heures est P(T > 1000) = f (1000), or
f(1000) =
9
9
10
10
e

, P(T > 1000) = e


1
,
P(T > 1000) 0,368.

b) La probabilit qu'une telle machine fonctionne
plus de 400 heures est P(T > 400) = f (400).
Il s'agit de vrifier que f (400) > 0,9 or
f (400) =
9
3
10
400
e

, f (400) 0,93 donc on a bien


une probabilit suprieure 0,9.




0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500
ANNALES DU B.T.S. - FIABILITE
255

8 - MAINTENANCE Nouvelle Caldonie 96
1 a) F(t) =

t
x
0
005 , 0
e 005 , 0 dx ,
F(t) = [e
0,005 x

]
t
0
, F(t) = 1 e
0,005 t
.
b) J(t) =

t
x
x
0
005 , 0
e 005 , 0 dx .
On intgre par parties :
J(t) = [ x e
0,005 x

]
t
0
+ 200 F(t),
J(t) = t e
0,005 t

200 e
0,005 t

+ 200.
c) K(t) =

t
x
x
0
005 , 0 2
e 005 , 0 dx .
On intgre par parties :
K(t) = [ x
2
e
0,005 x
]
t
0
+ 400 J(t),
K(t) = - t
2
e
0,005 t
400 t e
0,005 t
80000 e
0,005 t

+
80000.

2 I =
+ t
lim e
0,005 t
,
+ t
lim e
0,005 t
= 0 , I = 1.
E(T) =
+ t
lim ( t e
0,005 t
2 e
0,005 t
+ 200),
E(T) = 200.
E(T
2
) =
+ t
lim ( t
2
e
0,005 t
400 t e
0,005 t
+ 80000
e
0,005t
+ 80000).
K = 80000.
V(T) = E(T
2
) [E(T)]
2
= K 200
2
,
V(T) = 40000, (T) = ) ( V T = 200.
3 a) En fiabilit F est la fonction de dfaillance, R
dfinie sur [0, +[ par R(t) = 1 F(t) est la fonction
de fiabilit.
D'aprs ce qui prcde F(t) = 1 e
0,005 t

donc
R(t) = e
0,005 t
,

la variable alatoire T suit donc une
loi exponentielle de paramtre = 0,005.

b) P(T > 300) = R(300) = e
0,005 300
,
P(T > 300) = e
1,5
,
P(T > 300) = 0,223 10
3
prs.
P(T100) = 1 - e
0,005 100
,

P(T 100) = 1- e
- 0,5
,
P(T 100) = 0,393 10
3
prs.
P(100 < T 300) = F(300) F(100) ,
P(100 < T 300) = 0,384 10
3
prs.

c) P(T t
0
) = 0,1 quivaut F(t
0
) = 0,1 et
R(t
0
) = 0,9 et

e
0,005 t
0
= 0,9 d'o :
0,005 t
0
= ln 0,9 , t
0
= 200 ln 0,9 , t
0
21.




9 - MAINTENANCE ET EXPLOITATION DES
MATRIELS ARONAUTIQUES 94

A) 1 F(x) = [e
- .t
]
x
0
, F(x) = 1 e
x
.

2 a) On intgre par parties en posant :

=
=

=
=
t t
t v
t u
t v
t t u
. .
e ) (
1 ) ( '

e ) ( '
) (


I(a) = [- te
- .t
]
a
0
-

a
t
dt
0
.
e ,
I(a) = [- t e
- .t

t .
e
]
a
0
,
I(a) =

1
+ e
a
( a

1
) .
b)
+ a
lim e
a
= 0

,
+ a
lim a e
a
= 0


,
donc
+ a
lim I(a)

=

1
= E(X).


3 P(X > t) = e
- t
, P(X > t + h) = e
-(t+h)
,
P(X > t + h / X > t) = e
- h
.

B) 1 P(Y
t
= k) =
!
e ) (
.
k
t
t k

,
P(Y
t
= 0) =
! 0
e ) (
. 0 t
t

, P(Y
t
= 0) = e


.t
.

2 a) P(X > t) = P(Y
t
= 0) donc P(X > t) = e


.t
,
P(X t) = 1 e


.t
.

b) P(X < t) = R(t) = e


.t
donc X suit la loi
exponentielle de paramtre .


10 - MAINTENANCE 2000

1. a) Le coefficient de corrlation linaire valant
environ 0,994 , il est trs proche de 1, ce qui justifie
l'ajustement linaire du nuage (x
i
; y
i
) par la droite
D (on constate par ailleurs graphiquement le bon
alignement des points sur la droite de rgression).
b) D'aprs l'quivalence donne, l'alignement des
points de coordonnes (x
i
, y
i
) implique que
l'expression de R(t) correspond une loi de Weibull
de paramtre = 0.
c) D'aprs les valeurs obtenues par le tableur,
= 1,7522 (coefficient directeur de la droite de
rgression) et
ln = 8,2171 donne
=
7522 , 1
2171 , 8
e d'o 109.

ANNALES DU B.T.S. - FIABILITE
256
On prendra = 0 ; = 1,75 et = 109.

2. On rsout R(t) = 0,80 qui quivaut
75 , 1
109
e
|

\
|

t
= 0,8 et
( )
75 , 1
1
8 , 0 ln
109
=
t
d'o t 46,3.
On prvoira donc une intervention prventive tous
les 46 jours.

11 - MAINTENANCE 98
1 Sur la graphique les points sont sensiblement
aligns on est donc en prsence d'une loi de
Weibull de paramtre = 0.
On trouve graphiquement = 66 et = 4,2.
MTBF = A+ , on trouve dans le formulaire pour
= 4,2 et = 66 : A = 0,9089 d'o
MTBF 59,99 jours , MTBF 60 jours.


2 R(t
0
) = 0,9 quivaut F(t
0
) = 0,10, on lit sur le
papier de Weibull t
0
= 38jours.
R(t) =
2 , 4
)
66
(
e
t

,
2 , 4 0
)
66
(
e
t

= 0,9 quivaut
9 , 0 ln )
66
(
2 , 4 0
=
t
et
2 , 4
1
0
) 9 , 0 ln (
66
=
t
et
t
0
38,6 jours.
La priodicit d'un entretien systmatique bas sur
une fiabilit de 90 % est donc de 38 jours.

12 - MAINTENANCE 97
1 Sur la graphique les points sont sensiblement
aligns on est donc en prsence d'une loi de
Weibull de paramtre = 0, on trouve
graphiquement :
= 16 et = 5 donc R(t) = e
(t/16)
5
.

2 MTBF = A + on trouve dans le formulaire
pour = 5 : A = 0,9182 , MTBF 14,7 heures,
par le calcul R(14,7) 0,52.

3 R(t
0
) = 0,9 quivaut F(t
0
) = 0,10 , on lit sur le
papier de Weibull t
0
= 10 heures.
Par le calcul R(t
0
) = 0,9 quivaut e
(t
0
/16)
5
= 0,9
et (
16
0
t
)
5
= 0,9 et
16
0
t
= ( ln 0,9)
0,2
et t
0
10,2 heures. La priodicit d'un rglage
systmatique base sur une fiabilit de 90 % est
donc de 10 heures.
ANNALES DU B.T.S. - FIABILITE
257
13 - MAINTENANCE NOUMEA 95
1 a)


Sur le papier de Weibull on place les points de
coordonnes M
i
(t
i
60 , F(t
i
)) .
Les points sont pratiquement aligns on a donc
bien = 60.

b) On trouve = 50 et = 1,6.

c) A l'instant t
0
on a R(t
0
) = 0,7 donc F(t
0
) =
0,3 soit 30 % .
On lit sur le papier de Weibull t
0
60 = 25
donc t
0
= 25 + 60 soit t
0
= 85 jours.

2 R(t
0
) = 0,7 donc e
6 , 1 0
)
50
60
(

t
= 0,7 ,
[
50
60
0
t
]
1,6
= ln 0,7, t
0
= 60 + 50 ( ln 0,7)
6 , 1
1
,
t
0
= 86,3 jours.

3 MTBF = A + or = 1,6 donc A = 0,8966,
MTBF = 104,83 donc MTBF = 105 jours.


14 MAINTENANCE NOUVELLE CALEDONIE 98
1 Le formulaire donne pour = 3 : A = 0,8930 ,
= 100 donc MTBF = A+ = 546,5 h.
Le formulaire donne pour = 3 : B = 0,325 ,
= 500 donc lcart type = B = 162,5 h.
Dure de vie t
i
en jours 71 78 84 90 96 104 110 120 130 145
Effectifs cumuls N
i
1 2 3 4 5 6 7 8 9 10
F(t) =
1 + n
N
i
=
11
i
N

9,09 18,18 27,27 36,36 45,45 54,55 63,64 72,73 81,82 90,91
t = t 60 11 18 24 30 36 44 50 60 70 85
ANNALES DU B.T.S. - FIABILITE
258
R(t) = exp
(
(

\
|

3
500
100 t


2 Si R(t) = 0,9 alors
3
500
100
|

\
|

t
= ln 0,9 qui
quivaut
500
100 t
= ( ln 0,9)
1/3
et
t = 100 + 500( ln 0,9)
1/3
d'o t 436,15 heures.

3 Le dlai avant l'arrive de la pice de rechange
est 16 30 = 480 heures.
La probabilit de dfaillance avant 480 heures est
F(480) = 1 R(480).
F(480) = exp
(
(

\
|

3
500
100 480
,
F(480) = 1 0,6447, F(480) 0,355. La
probabilit de rupture de stock est donc 35,5 %.


15 - MAINTENANCE 94
1
2 a) Graphiquement : P(T < 10) = F(10) 2% .
b) Graphiquement : P(10 < T < 50) =
F(50) F(10) 61%.
3 On cherche t
0
tel que R(t
0
) > 0,9 donc
F(t
0
) < 0,1 ; 9 , 0 e donc e ) (
4 , 2 0 4 , 2 0
)
50
( )
50
(
0
=

t t
t R ,
(
50
0
t
)
2,4
ln (0,9) , donc t
0
50 ( ln(0,9))
1/2,4

le calcul donne t
0
19,57 mois .
Graphiquement t
0
20 mois , rsultats identiques
un mois prs .

4 Soit T
1
et T
2
les variables alatoires qui
mesurent les dures de vie respectives de deux
composants de (S) tirs au hasard. Soit R
1
(t) et
R
2
(t) les fiabilits respectives des deux composants
et soit R
S
(t) la fiabilit du systme .
Lorsque le systme est constitu par le montage en
srie de deux composants R
S
(t) = P(T
1
t et T
2
t)
.
La dure de vie du 1
er
composant est indpendante
du 2
ime
et les variables T
1
et T
2
suivent la mme
loi que T donc R
S
(t) = [P(T t )]
2
= [R(t)]
2
,

donc
ANNALES DU B.T.S. - FIABILITE
259
R
S
(t
0
) > 0,9 quivaut [R(t
0
)]
2
> 0,9 et
R(t
0
) > (0,9)
1/2
, R(t
0
) > 0,95. Par le calcul
(comme au 3) on trouve t
0
14,66 mois.

P(T < t
0
) < 0,05, F(t
0
) < 5% , graphiquement
t
0
14,5 mois.

16 - MAINTENANCE NOUMEA 93
1 On place sur le papier de Weibull les points de
coordonnes (t
i
, F(t
i
)).

On constate que ces points sont aligns ce qui
justifie que la variable alatoire qui mesure la dure
de bon fonctionnement peut tre ajuste par une loi
de Weibull de paramtre = 0 .
On trouve = 600 heures et = 4 .

2 a) Le formulaire donne la MTBF = A + et
l'cart type = B.
Pour = 4, on lit dans la table A = 0,9064 et
B = 0,254, donc MTBF = (0,9064)(600) + 0 ,
MTBF = 543,84 heures.
= 0,254 600 = 152,4 heures.
b) Ici R(t) = e
4
)
600
(
t


si 5% des engrenages sont
dfectueux au bout de t heures, alors t est solution
de R(t) = 0,95 donc e
4
)
600
(
t


= 0,95,
(
600
t
)
4
= ln(0,95), t = 600 ( ln 0,95)
0,25
,
t
0
= 285,5 heures .
Vrification graphique :

t
0
est l'abscisse du point d'ordonne 5, situ sur la
droite obtenue la question 1 .On lit t
0
285 h.

3 La probabilit qu'un engrenage fonctionne au
moins 300 heures est R(300) 0,9394.
La transmission fonctionne si et seulement si les
trois engrenages sont en tat aprs 300 heures;
d'autre part ces engrenages fonctionnent de faon
indpendante, donc la probabilit que la dure de
vie du systme soit au moins de 300 heures est
p (0,9394)
3
, soit p 0,83.

17 Papier ou calculatrice ?
A 1
t
i
250 450 600 800 1100 1400
F(t
i
) en % 5 15 25 40 60 80




Le nuage de points est presque rectiligne, on en
dduit = 0, la droite d'ajustement D coupe l'axe
des abscisses au point d'abscisse = 1100, la
parallle D passant par le point d'abscisse 1 coupe
l'axe donnant les valeurs de tel que = 2
2
)
1100
(
e ) (
t
t R

= .


2 Pour = 2 on trouve dans la table A = 0,8862
B = 0,463, MTBF = A + donc MTBF 975 h
= B 509 heures .

3 Dterminons la priodicit d'un entretien
systmatique bas sur une fiabilit de 90 % :
Graphiquement : F(t) =10% , on trouve sur le
papier de Weibull t = 360 heures.
Par le calcul : e
- (t/1100)
2

= 0,9 quivaut
(
1100
t
)
2
= - ln 0,9 et t = 1100 ( ln 0,9 )
1/2

t 357 heures. Il faut faire un entretien
systmatique au moins toutes les 360 heures.
4 Graphiquement : F(2000) = 96%,
R(2000) = 1 F(2000) , R(2000) = 4%.
Par le calcul : e
- (2000/1100)
2

3,7%.

5 (t) = )
1100
(
1100
2 t
1
,
(t) = 1,65. 10
6
t, le taux d'avarie est faible, sa
coube reprsentative est une droite.

B 1 On obtient les mmes valeurs de F(t) les
points sont donc dplacs d'un cart de 1000 h ,
F(1250) = 5%, F(1450) = 15% etc...

2

MTBF = A + , MTBF 975 + 1000,
MTBF = 1975 h,
= B 509 heures.

3 Graphiquement : F(t) = 10% pour t = 1360 h.
Par le calcul : (
1100
1000 t
)

2

= - ln 0,9 et
t = 100 +1100 ( ln 0,9 )
1/2 ,
t 1357 h.

4 Graphiquement : F(2000) = 57%,
R(2000) = 43%.
Calcul : R(2000) 43,7 %.

5 (t) = )
1100
1000
(
1100
2 t
, la courbe reprsentative
est une droite qui ne passe plus par l'origine.

18 - MAINTENANCE 97

1 f
1
(t) = e
t
a) Voir graphique.
b) F
1
(t) =

t
x x f

0
1
d ) ( , F
1
(t) =

t
x
x

0
d e = [ e
x
]
t
0
,
F
1
(t) = 1 e
t
.
P(T 1) = 1 e
1
, P(T 1) = 0,632 10
3
prs.
Brochure 118 La statistique infrentielle en quatre sances
261
c) I(t) =

t
x x f x

0
1
d ) ( =

t
x
x x

0
d e , en posant
u(x) = x , v(x) = e
x
on a
u(x) = 1 , v(x) = e
x
, on obtient :
I(t) = [ x e
x
]
t
0

t
x
x

0
d e ,
I(t) = t e
t
[ e
x
]
t
0
,
I(t) = t e
t
e
t
+ 1,
de
+ t
lim e
- t
= 0, et de

+ t
lim t e
- t
= 0, on dduit :


E(T) =
+ t
lim I(t) = 1 .

2 a) f
2
(t) = 2 t e
- t
2
,

f
2
'(t) = 2 e
- t
2
4 t
2
e
- t
2

,
f
2
'(t) = 2 e
- t
2
(1 2 t
2
),
f
2
'(t) est du signe de 1 2 t
2
,
f
2
dfinie sur [ 0 ; +[ , f
2
'(t) = 0 pour t
0
=
2
2
,
f(t
0
) 0,857 .

t 0 t
0
+
f
2
'(t) + 0

f
2
(t)
f(t
0
)
0 0

b) Le dveloppement limit de e
u
l'ordre 1, au
voisinage de 0 est : e
u
= 1 + u + u
1
(u) avec


0
lim
u

1
(u) =0,

le dveloppement limit l'ordre 2
de e
- t
2
est : 1 t
2
+ t
2

2
(t) avec
0
lim
t

2
(t) = 0 ,
le dveloppement limit l'ordre 3 de f
2
(t) au
voisinage de 0 est : f
2
(t) = 2t (1 t
2
) + t
3

3
(t),
f
2
(t) = 2t 2t
3
+ t
3

3
(t) avec :
0
lim
t

3
(t) = 0.
On en dduit que l'quation de la tangente D C
2

au point d'abscisse nulle est y = 2 t.
La position de C
2
par rapport D, au voisinage de
O, dpend du signe de : f
2
(t) 2t = 2t
3
+ t
3

3
(t)
qui est

du signe contraire de t, donc C
2
est au
dessous de D au voisinage de l'origine.

c) Voir graphique ci-aprs :
d) F
2
(t) =

t
x x f

0
2
d ) ( , F
2
(t) =

t
x
x x

0
d e 2
2
,
(e
- x
2
)
'
= 2 x

e
- x
2
donc F
2
(t) = [ e
- x
2
]
t
0
,
F
2
(t)= e
- t
2
+ 1 , F
2
(t) = 1 e
- t
2
.
P(T t) = 0,05 quivaut F
2
(t) = 0,05 et
e
- t
2
= 0,95 et t
2
= ln 0,95 , t = ln 0,95 ,
t 0,22648 , t = 0,226 10
3
prs.

Brochure 118 La statistique infrentielle en quatre sances
262
Supplment la sance n4




1 Un exercice de terminale S sur la loi exponentielle
Simulation dune loi exponentielle

1) Soit X une variable alatoire de loi uniforme sur l'intervalle ]0, 1].
a) Comment peut-on simuler, l'aide d'une calculatrice ou d'un tableur, une srie de
ralisations de la variable alatoire X ?
b) Soit a un rel de l'intervalle ]0, 1], calculer P(X a).

2) Soit T la variable alatoire dfinie par X T ln
1

= o est un rel strictement positif.


Montrer que les valeurs prises par la variable alatoire T appartiennent l'intervalle
[0, + [.

3) Soit t un rel de l'intervalle [0, + [, montrer que P(T t) = 1 e
t
.

4) Dduire de la question prcdente la fonction de densit f de la variable alatoire T (on
pourra montrer que, pour t 0, f(t) = ) ( t T P
dt
d
).
Quelle est la loi de T ?

5) Comment peut-on simuler, l'aide d'une calculatrice ou d'un tableur, une srie de
ralisations d'une variable alatoire de loi exponentielle de paramtre = 0,005 ?
Effectuer une simulation d'une telle srie de 10 valeurs.
Brochure 118 La statistique infrentielle en quatre sances
263


Elments de rponse

1a) On simule X en faisant rand ou Ran# sur la calculatrice, ou ALEA() sur Excel et en
rptant autant de fois que dsir.
b) On a, pour tout a ]0, 1], P(X a) =

1
1
a
dx = 1 a.
2) Si x ]0, 1], (1/) ln x [0, + [ donc T est valeurs dans l'intervalle [0, + [.
3) On a, pour tout t [0, + [,
P(T t) = P( (1/) lnX t) = P( X e
t
) = 1 e
t
car e
t
]0, 1].
4) Si t < 0 alors f(t) = 0 car T est valeurs dans [0, + [.
Si t 0, P(T t) =

t
dx x f
0
) ( = 1 e
t
d'o f(t) = (1 e
t
) ' = e
t
.
On reconnat la fonction de densit de loi exponentielle de paramtre . Il s'agit donc de la
loi de la variable alatoire T.

5) D'aprs ce qui prcde, on peut simuler une ralisation d'une variable alatoire de loi
exponentielle de paramtre 0,005 par l'instruction :
ln(rand) / 0,005 c'est dire 200 ln(rand) ou 200 ln(Ran#) sur calculatrice ;
ou 200*LN(ALEA( )) sur Excel.
On a beau le savoir, les ralisations successives
d'une variable alatoire de loi exponentielle
sont toujours impressionnantes
(a c'est du hasard !) :











Brochure 118 La statistique infrentielle en quatre sances
264
2 Test du khi-deux
Les tests d'ajustement ont pour but de vrifier si un chantillon donn peut raisonnablement
ou non provenir des ralisations indpendantes d'une variable alatoire de distribution connue.
Une premire mthode, empirique, peut consister comparer la forme de l'histogramme des
frquences observes aux histogrammes thoriques, dans le cas discret, ou au profil des
fonctions de densit, dans le cas continu, des diffrents modles possibles. Cette mthode
nest pas ridicule et peut dj permettre d'liminer certains modles mais la qualit de
l'ajustement n'est pas mme quantifie.
On franchit une premire tape lorsque lon peut quantifier la qualit de lajustement laide
dun coefficient de rgression. Dans bien des cas en effet, une transformation fonctionnelle,
un changement de variable, permet de ramener l'ajustement une rgression linaire selon les
moindres carrs. Cest ainsi que procde le tableur lorsque, sur une courbe en nuage de
points , on demande une courbe de tendance . Cette procdure est simple mettre en
uvre mais a le dfaut de ne pas quantifier les risques d'erreurs lors de la prise de dcision, ce
que permet en revanche la procdure des tests d'hypothse.
C'est Karl Pearson (1857 1936) que l'on doit le critre du khi-deux, permettant de juger de
la qualit d'ajustement d'une distribution thorique une distribution observe. Pour cette
tude, Karl Pearson eut recours de nombreux lancers de pices de monnaie ou de ds,
effectus par lui-mme, ses lves ou ses proches. On ne disposait pas encore des techniques
de simulation
Le cas des petits pois de Mendel
Nous exposons tout dabord la procdure du test du khi-deux sur un exemple tir de
lhistoire.
Paradoxalement, l'absence de variabilit peut tre aussi suspecte que ses dbordements et
permet galement de dtecter statistiquement des fraudes. C'est ainsi que Ronald Fisher
examina les donnes exprimentales qui permirent Gregor Johann Mendel (1822-1884)
d'tayer sa thorie de l'hrdit.
Dans la plupart des cas, les rsultats exprimentaux de Mendel taient tonnamment
proches de ceux prvus par sa thorie. Fisher montra que Mendel, sous l'hypothse que sa
thorie tait exacte, et compte tenu de la variabilit naturelle des expriences, ne pouvait
observer des rsultats si proches des valeurs thoriques, qu'avec une probabilit infrieure
0,00004 , autant dire humainement impossible. On peut ainsi penser que Mendel avait
truqu ses chiffres, ou du moins n'avait retenu que les expriences les plus favorables, pour
mieux imposer sa thorie dans un environnement plutt hostile.
Voyons l'exemple des petits pois.
Brochure 118 La statistique infrentielle en quatre sances
265
La thorie de Mendel prvoit que le croisement de petits pois jaunes et ronds avec des
petits pois verts et anguleux donnera naissance quatre nouvelles varits, dans les
proportions ci-dessous.

Types de petits pois Proportions thoriques
1. Jaune rond
16
9
1
= p
2. Jaune anguleux
16
3
2
= p
3. Vert rond
16
3
3
= p
4. Vert anguleux
16
1
4
= p

Mendel prtend avoir ralis 556 observations sur les rsultats de ces croisements, et
compar ses observations aux valeurs thoriques attendues. Le tableau suivant indique les
rsultats quil prsente.

Types de petits pois Effectifs observs Valeurs thoriques
1. Jaune rond x
1
= 315 t
1
= 312,75
2. Jaune anguleux x
2
= 101 t
2
= 104,25
3. Vert rond x
3
= 108 t
3
= 104,25
4. Vert anguleux x
4
= 32 t
4
= 34,75

Ladquation est presque parfaite, un peu
trop peut-tre. Mendel a-t-il eu de la
chance ?
Bien sr, sa thorie est un modle. D'abord
parce qu'on n'espre pas observer des
quarts de petits pois, ensuite parce que le
hasard intervient et qu'une certaine
variabilit naturelle entre les
observations possibles est prvoir.
Pour valuer cette variabilit, on peut faire
tourner le modle de Mendel. En
l'occurrence, il s'agirait de faire tourner
556 fois la roue ci-contre, o les diffrents secteurs correspondent aux proportions
thoriques des quatre espces de petit pois.

On prfrera sans doute recourir une simulation sur le tableur.
La formule =ENT(1+16*ALEA()) fournit un entier alatoire entre 1 et 16, de manire
quirpartie. Il suffit ensuite de dcider qu'entre 1 et 9, il s'agit de l'espce 1 de petits pois,
qu'entre 10 et 12, il s'agit de l'espce 2, etc.
Sur une feuille de calcul, on a entr en A2 la formule =ENT(1+16*ALEA()) et en B2 la
formule =SI(A2<10;1;SI(A2<13;2;SI(A2<16;3;4))) qui indique la catgorie de petit pois
correspondante.
Aprs avoir slectionn les cellules A2 et B2, on les a recopies vers le bas jusqu la ligne
557 pour simuler les observations quaurait pu faire Mendel, en supposant son modle
hrditaire parfaitement conforme la ralit.
Les effectifs de chacune des quatre catgories sont comptabiliss dans la colonne F. La
cellule F2 contient par exemple la formule =NB.SI(B2:B557;1) .
1
2 3
4
Brochure 118 La statistique infrentielle en quatre sances
266
La diffrence entre les effectifs observs et les effectifs thoriques est mesure en
utilisant lcart quadratique rduit , cest dire
i
i i
t
t x
2
) (
. On pondre en effet selon la
valeur t
i
de leffectif thorique car en dehors du cas de lquirpartition, les carts absolus
ne sont pas comparables.
La cellule G2 contient ainsi la formule (F2-E2)^2/E2 . La somme des carts quadratiques
rduits est effectue dans la cellule G8. Cest la quantit que lon nomme khi-deux
observ ,
2
obs
=

4
1
2
) (
i
i
i i
t
t x
.
De grandes valeurs de
2
obs
rendraient le modle de Mendel suspect. La simulation
montre ici fournit
2
obs
4,5 alors que les expriences de Mendel conduisent
2
obs

0,47.
La simulation, en appuyant plusieurs fois sur la touche F9, montre qu'un rsultat aussi bon
que celui de Mendel (sous l'hypothse que le modle est correct) est assez rare.
Pour prciser cela, calculons quelques probabilits.
On peut introduire les quatre variables alatoires X
1
, ..., X
4
qui, chaque ralisation de 556
expriences indpendantes, font respectivement correspondre l'effectif x
i
de chaque espce
de petit pois. Les variables alatoires X
i
, sous l'hypothse du modle de Mendel, suivent
des lois binomiales de paramtre n = 556 et p = p
i
avec
16
9
1
= p ,
16
3
2
= p ,
16
3
3
= p ,
16
1
4
= p .
Pour tudier la variabilit du critre du khi-deux, introduisons la variable alatoire

=
4
1
2
) (
i
i
i i
t
t X
T avec 556
4
1
=

= i
i
X .
En notant n le nombre total de donnes (on a ici n = 556), l'effectif thorique de la classe i
est t
i
= np
i
.
Karl Pearson a dmontr que, pour n assez grand, la variable alatoire

=
i
i i
np
np X
T
2
) (
suit approximativement une loi tabule et connue sous le nom de
Brochure 118 La statistique infrentielle en quatre sances
267
loi du
2
3 degrs de libert (en effet la relation ci-dessus fait que la valeur de X
4
est
dtermine ds que les valeurs de X
1
, X
2
et X
3
sont connues), qui ne dpend pas de n.
Sur Excel la fonction LOI.KHIDEUX(valeur t ; degrs de liberts) fournit la probabilit
P(T > t).
Cette fonction permet alors d'obtenir
P(T > 0,47) 0,925 do
P(T 0,47) 0,075.
Mendel avait donc environ 7,5 % de chances
d'obtenir de si bons rsultats.

A titre d'illustration, pour situer le rsultat de Mendel, la fonction de rpartition
t a F(t) = P(T t) pour T suivant la loi du khi-deux 3 degrs de libert est reprsente
ci-dessous.
On veut bien croire en la chance de Mendel, 7,5 % cest rare mais pas trop. Le problme
est qu'en raison de l'indpendance des diffrentes sortes d'expriences, Fisher a pu
additionner les diffrents
2
obs
et aboutir ainsi
2
obs
< 42, avec 84 degrs de libert.
C'est la probabilit que cet vnement se produise qui est de
l'ordre de 0,00004 , comme on le constate sur le tableur.
Une enqute sur les manuscrits de Mendel a, par la suite,
montr que certains rsultats d'exprience avaient t gratts
et corrigs ...
Fonction de rpartition du khi-deux 3 degrs de libert
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0,47
Brochure 118 La statistique infrentielle en quatre sances
268
Une prsentation du test du khi-deux
Par dfinition, la loi du khi-deux n degrs de libert est la loi suivie par la somme des
carrs de n variables alatoires indpendantes de loi normale centre rduite.
Soit une variable alatoire discrte ou discrtise, c'est dire divise en k classes de
probabilits p
1
, , p
k
.
Soit un chantillon de taille n de cette variable alatoire, fournissant pour chaque classe des
effectifs x
1
, , x
k
.
Il s'agit de comparer ces effectifs aux valeurs thoriques :

Classes Effectifs observs Effectifs thoriques
1 x
1
t
1
= np
1


k x
k
t
k
= np
k


Il faut dcider d'un critre d'adquation des observations par rapport au modle thorique.
De faon classique (et parce quon aboutit ainsi une loi connue ), on choisit l'cart
quadratique rduit, not
2
obs
et valant :
2
obs
=

k
i
i
i i
t
t x
1
2
) (
.
De grandes valeurs de
2
obs
rendraient le modle suspect.
Pour tudier la variabilit de ce critre, on considre la variable alatoire

=
k
i
i
i i
np
np X
T
1
2
) (
avec n X
k
i
i
=

=1
o X
i
est la variable alatoire correspondant
l'effectif de la i
e
classe.
Karl Pearson a dmontr que la loi de T est approximativement, pour n grand, une loi du
2
k 1 degrs de libert (on peut noter que la relation ci-dessus fait que la valeur de X
k

est dtermine ds que les valeurs de X
1
, , X
k -1
sont connues).

Sur Excel, la fonction LOI.KHIDEUX(valeur t ; degrs de liberts) fournit la probabilit
P(T > t) et la fonction KHIDEUX.INVERSE( probabilit p ; degrs de libert) renvoie la
valeur t telle que P(T > t) = p.

La construction d'un test du khi-deux se fait
selon les tapes suivantes.
Choix des hypothses :
H
0
: pour tout 1 i 6, la probabilit que X
prenne une valeur dans la classe i est p
i
.
H
1
: il existe i tel que la probabilit
prcdente diffre de p
i
.

Dtermination de la rgion critique :
Si H
0
est vraie, la variable alatoire

=
k
i
i
i i
t
t X
T
1
2
) (
suit approximativement
la loi du khi-deux k 1 degrs de libert.
Densit du khi-deux 5 degrs de
libert
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0 5 10 15
Rejet de H
0
Acceptation de H
0
11,07
5%
95%
Brochure 118 La statistique infrentielle en quatre sances
269
On recherche sur une table le rel t tel que, P(T > t) = .
D'o la zone d'acceptation de H
0
au seuil : [0, t].

Rgle de dcision :
Soit
2
obs
l'cart quadratique rduit obtenu entre les effectifs observs et les effectifs
thoriques.
Si
2
obs
t on accepte H
0
au seuil de 5%.
Si
2
obs
> t on rejette H
0
.
Remarques :
Si l'on utilise l'chantillon pour estimer indpendamment j paramtres de la loi teste, le
degr de libert du khi-deux devient : k 1 j. Par exemple k 3 pour une loi normale o
l'on estime et l'aide de x et s
n-1
.
La loi de T n'est qu'approche et on donne la condition np
i
> 5 pour l'effectif de chaque
classe (sinon on regroupe les classes effectif trop faible). C'est pour vrifier cette
condition que l'on pratique le test du khi-deux sur les effectifs et non sur les frquences.
Lien entre le khi-deux et le critre utilis en terminale pour
lquidistribution
Le test du khi-deux sappuie sur la variable alatoire

=
k
i
i
i i
t
t X
T
1
2
) (
o X
i
est la
variable alatoire correspondant leffectif de la classe i et t
i
leffectif thoriquement
prvu par le modle pour cette classe.
Dans le cas dun modle quirparti, comme on lenvisage en terminale ES et S (chapitre
prcdent), les effectifs thoriques sont tous gaux
k
n
t
i
= avec k le nombre de classes et
n le nombre total dobservations. Les diffrentes classes ayant toutes le mme poids
thorique, il est inutile de pondrer lcart quadratique. De plus, pour n assez grand, la
condition dapproximation par la loi du khi-deux sera satisfaite, sans que lon ait
surveiller si un effectif est trop faible. Pour ces deux raisons, les programmes de terminales
envisagent donc comme critre dadquation, la somme des carts quadratiques sur les
frquences. Cest dire que le test de terminale est fond sur la variable alatoire D
2
=

k
i
i
k
F
1
2
)
1
( o F
i
est la variable alatoire correspondant la frquence de la classe i.
Le lien entre les variables D
2
et T est facile faire.
On a : kn D
2
=

=

k
i
i
k
F n
n
k
1
2 2
)
1
( =

=
k
i
i
k
n
k
n
F n
1
2
) (
.
Ainsi, on a k n D
2
= T.




Brochure 118 La statistique infrentielle en quatre sances
270
Brochure 118 La statistique infrentielle en quatre sances
271










REFERENCES




Elments thoriques au niveau lyce et B.T.S. :
"Linduction statistique au lyce illustre par le tableur" - P. Dutarte - Ezd.
Didier.
"Statistique et probabilits - BTS industriels" - B. Verlant et G. Saint-Pierre - Ed.
Foucher.
"Statistique et probabilits - BTS tertiaires" - B. Verlant et G. Saint-Pierre - Ed.
Foucher.

Elments thoriques au niveau suprieur :
"Probabilits, analyse des donnes et statistiques" - G. Saporta - Ed. Technip.
"Statistique" - Wonnacott - Ed. Economica.

Brochures diffuses par l'IREM Paris-Nord:
"Simulation d'expriences alatoires de la 1
re
au BTS"
"Simulation et statistique en seconde"
"Enseigner la statistique au lyce : des enjeux aux mthodes"
"Statistique et citoyennet"

Histoire :
"Histoire de la statistique" - J.-J. Droesbeke et P. Tassi - "Que sais-je ?" n2527 -
PUF.
"La politique des grands nombres" A. Desrosires La Dcouverte/Poche.

You might also like