You are on page 1of 22

Probabilités et Statistiques

IUP MIAGE
Licence
2005-06

Exercices

Gilles Faÿ
UFR de Mathématiques
Université des Sciences et Technologies de Lille
gilles.fay@univ-lille1.fr
http ://math.univ-lille1.fr/∼fay
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 1. Analyse combinatoire et premiers calculs de probabilités

Ex 1. 1) En considérant les lettres de l’alphabet : Combien peut-on former de mots de 2


lettres ? Combien peut-on former de mots de 2 lettres constitués d’une consonne suivie d’une
voyelle ? Combien peut-on former de mots de 2 lettres constitués d’une consonne et d’une
voyelle ?
2) Combien d’équipes de 3 personnes peut-on former à partir d’un groupe de 5 personnes ?
3) Combien de manières de placer 9 convives autour d’une table ronde ? D’une table rec-
tangulaire (avec un “président de table”) ?
4) Avec 17 chevaux au départ, combien y a-t-il de tiercés possibles ? Dans le désordre ?
Combien y-a-t il de tiercé dans l’ordre en autorisant les ex-aequo ?

Ex 2. On tire 8 cartes dans un jeu de 32 cartes. Quelle est la probabilité de


1) tirer tous les coeurs ?
2) tirer les 4 as ?
3) tirer 5 coeurs et 3 trèfles ?
4) tirer 5 coeurs ni plus ni moins et 3 rois ni plus ni moins ?

Ex 3. Combien de fois faut-il lancer une pièce bien équilibrée pour que la probabilité de ne
1
faire aucune face soit inférieure à 100 ?

Ex 4. On forme un comité de 4 membres choisis au hasard parmi 7 personnes dont 2 frères.


Quelle est la probabilité pour que les deux frères soient choisis ? Pour que l’un d’entre eux au
moins soit choisi ? Pour qu’aucun ne soit choisi ?

Ex 5. Dans une loterie où les billets sont numérotés de 000 000 à 999 999, quelle est la
probabilité pour que les 6 chiffres d’un billet pris au hasard soient tous différents ?

Ex 6. Une urne contient n boules blanches (n ≥ 5) et 10 boules noires. On tire au hasard et


simultanément 10 boules de l’urne.
1) Quelle est la probabilité pn pour que l’on ait tiré exactement 5 boules noires ?
2) Etudier le sens de variation de la suite pn et calculer limn→∞ pn .

1
Ex 7. On place dans une urne 10 boules numérotées de 1 à 10. On tire 2 boules.
1) Quelle est la probabilité pour que la somme des points obtenus soit paire si on tire les
boules simultanément ?
2) Quelle est la probabilité pour que la somme des points obtenus soit paire si on tire les
boules successivement et avec remise entre les tirages ?
3) Quelle est la probabilité pour que la somme des points obtenus soit paire si on tire les
boules successivement et sans remise entre les tirages ?
1
Ex 8. Soient A et B des événements tels que P(A) = 5 et P(A ∪ B) = 12 .
1) Supposons que A et B soient des événements incompatibles. Calculer P(B).
2) Supposons que A et B soient des événements indépendants. Calculer P(B).
3) Calculer P(B) en supposant que l’événement A ne peut être réalisé que si l’événement
B est réalisé.

Ex 9. 1) Montrer que, pour 3 événements A, B et C quelconques, on a

P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)

2) Généraliser dans le cas de n événements A1 , ..., An quelconques.

Ex 10. Soient A, B et C des événements, E1 = A ∩ B ∩ C et E2 = A ∩ (B ∪ C)


1) Montrer que E1 et E2 sont incompatibles.
2) Déterminer l’ensemble E1 ∪ E2 .
3) On sait que P(A) = 0.6, P(B) = 0.4P(C) = 0.3P(B ∩ C) = 0.1, P(A ∩ C) =
0.1, P(A ∩ B) = 0.2 et P(A ∩ B ∩ C) = 0.05 . Calculer P(E1 ) et P(E2 ).

Ex 11. Soit Ω={1,2,...,9,10}.


1) Déterminer la probabilité P sur Ω telle que P({i}) soit proportionnel à i. Calculer
P ({résultat pair}) et P ({résultat premier}).
2) Déterminer la probabilité P 0 sur Ω telle que les nombres pi = P 0 ({i}) vérifient les 2
conditions : p10 = 2p1 et pi = a + b.i ∀i ∈ Ω. Calculer P 0 ({le résultat est un carré parfait}).

Ex 12. On lance un dé pipé de telle sorte que la probabilité d’apparition d’une face soit
proportionnelle au numéro inscrit sur cette face. Quelle est la probabilité d’apparition de chaque
face ?

Ex 13. On constitue une file d’attente en attribuant au hasard des numéros d’ordre à n per-
sonnes (n ≥ 2). Deux amis A et B se trouvent dans cette file d’attente.
1) Quelle est la probabilité que les deux amis soient situés l’un derrière l’autre ?
2) Quelle est la probabilité que les deux amis soient distants de r places (i.e. séparés par
r − 1 personnes) ?

2
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 2. Probabilités conditionnelles - Formule de Bayes

Ex 1. Un conducteur sobre a une chance sur 1000 d’avoir un accident de voiture au cours
d’une période ; un conducteur ivre a une chance sur 50 d’avoir un accident au cours de la même
période. On admet qu’un conducteur sur 100 conduit en état d’ivresse. Quelle est la probabilité
pour qu’il y ait un accident et que le conducteur soit ivre ? Lorsqu’il y a un accident, quelle est
la probabilité pour que le conducteur soit ivre ?

Ex 2. Deux usines fabriquent les mêmes pièces. La première en produit 70% de bonnes et
la deuxième 90%. Les deux usines fabriquent la même quantité de pièces.
1) Quel est le pourcentage de bonnes pièces sur l’ensemble du marché, supposé alimenté
par les 2 usines ?
2) On achète une pièce ; elle est bonne ; quelle est la probabilité pour qu’elle provienne de
la deuxième usine ?
3) Mêmes questions lorsque la première usine produit 2,5 fois plus que la deuxième.

Ex 3. On lance 2 fois un dé pipé tel que P{1} = P{3} = P{4} = 81 et P{2} = P{6} = 14 .
Quelle est la probabilité que la somme des points obtenus soit supérieure à dix (strictement)
sachant :
1) qu’un des résultats est 6 ?
2) que le premier résultat est 6 ?

Ex 4. Olivier, Xavier et Philippe jouent à la balle. Olivier envoie la balle à Xavier 3 fois
sur 4, et à Philippe 1 fois sur 4. Xavier l’envoie à Olivier 3 fois sur 4 et à Philippe 1 fois sur 4.
Philippe envoie toujours la balle à Xavier. Au départ Philippe a la balle.
1) Calculer les probabilités Pn , Qn et Rn qu’au nième lancé, Olivier, Xavier et Philippe
respectivement aient la balle. (exprimer Pn , Qn et Rn en fonction de Pn−1 , Qn−1 et Rn−1 )
2) Calculer les limites de Pn , Qn et Rn lorsque n tend vers l’infini.

Ex 5. Trois coffres notés C1 , C2 , C3 ont chacun deux tiroirs, et dans chaque tiroir, il y a
une pièce. Le coffre C1 contient 2 pièces d’or, C2 2 pièces d’argent et C3 une pièce d’or et une
d’argent.

1
1) On ouvre au hasard l’un des 6 tiroirs et on trouve une pièce d’argent. Quelle est la
probabilité pour que l’on ait ouvert un tiroir du coffre C2 ?
2) On ouvre à nouveau et indépendamment de la première fois l’un des 6 tiroirs et on
trouve encore une pièce d’argent. Quelle est la probabilité pour que l’on ait ouvert deux fois le
même coffre ?

Ex 6. Sur le trajet d’un avion de guerre se trouvent deux stations radar ennemies armées
d’une batterie anti-aérienne. L’avion a une probabilité égale à 41 d’être détecté par la première
station, et, étant détecté, il a 3 chances sur 5 de ne pas être abattu. Si l’avion n’a pas été détecté
par la première station, il aborde la seconde dans les mêmes conditions que la première. Par
contre, si la première station l’a détecté sans l’abattre, il est détecté à coup sûr par la seconde, et
il n’a plus que 2 chances sur 5 de s’en sortir.
1) Calculer la probabilité de l’événement E="l’avion survole la première station sans être
abattu".
2) Calculer la probabilité de l’événement F="l’avion survole les deux stations sans être
abattu".
3) Sachant que l’avion a été abattu, quelle est la probabilité qu’il l’ait été par la première
station ?

Ex 7. On considère 3 urnes : U1 , U2 et U3 telles que : U1 contient 5 boules blanches et 3


boules noires, U2 contient 4 boules blanches et 4 boules noires, U3 contient 1 boule blanche et 7
boules noires. Un individu décide de choisir l’une des trois urnes de la manière suivante : il lance
un dé non pipé ; si le nombre obtenu est : "1","2" ou "3", il choisit l’urne U1 ; s’il sort le "4", il
choisit U2 ; sinon il choisit U3 . Ayant choisi une urne par le procédé indiqué ci-dessus, l’individu
en question prélève successivement au hasard deux boules de l’urne choisie en remettant la
boule après chaque tirage.
1) Quelle est la probabilité de tirer deux boules blanches ?
2) Quelle est la probabilité de tirer deux boules de couleurs différentes ?
3) Sachant que la deuxième boule est blanche, quelle est la probabilité que l’individu ait
choisi U2 ?
Reprendre toutes les questions mais cette fois en supposant le tirage sans remise.

Ex 8. A l’ouverture d’un magasin libre-service il y a 150 litres de lait dont 100 seulement
sont frais.
1) Si le premier client de la journée choisit au hasard 2 litres de lait, quelle est la probabi-
lité pour qu’ils soient frais ?
2) Si un client arrive alors que 50 litres ont déjà été achetés, quelle est la probabilité pour
que ce client prenne 2 litres de lait frais ?

2
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 3. Variables aléatoires discrètes

Ex 1. On jette 2 dés. Soit X la variable aléatoire égale au plus petit des 2 nombres obtenus,
Y la variable aléatoire égale au plus grand des 2 et Z la différence, en valeur absolue, des points
obtenus.
1) Donner la loi de X. Pour cela, on pourra s’aider d’un tableau 6x6 représentant tous les
tirages et indiquer dans chaque case la valeur de X correspondante.
2) De même, donner les lois de Y et de Z.
3) Calculer E(X), Var(X), E(Y ), Var(Y ), E(Z) et VarZ.
4) Deviner le signe de cov(X, Y ) puis calculer sa valeur exacte.

Ex 2. Le nombre X de kilogrammes de tomates récoltés dans un jardin en une semaine est


une variable aléatoire à valeurs entières telle que :
x 0 1 2 3
P(X ≤ x) 0,1 0,6 0,9 1
Calculer E(X) et var(X).

Ex 3. Loi géométrique. On effectue une série d’expériences indépendantes jusqu’à la pre-


mière réalisation d’un événement A. Dans chaque expérience la probabilité de l’événement A
est égale à p. Quelles sont l’espérance et la variance du nombre X d’expériences à effectuer ? On
pourra admettre les formules suivantes, valables pour des nombre a, |a| < 1 :
∞ ∞ ∞
X 1 X a X a(a + 1)
aj = , jaj = , j 2 aj =
1−a (1 − a)2 (1 − a)3
j=0 j=0 j=0

Ex 4. On considère 2 avions, un biréacteur B et quadriréacteur Q. On suppose que tous les


réacteurs de ces avions ont la même probabilité p de tomber en panne et qu’ils sont indépendants
les uns des autres. Soient X la variable aléatoire, nombre de réacteurs de B tombant en panne et
Y la v.a., nombre de réacteurs de Q tombant en panne.
1) Déterminer les lois de X et Y.
2) On estime qu’un avion ne peut achever son vol que si la moitié au moins de ses réacteurs
fonctionne normalement. Indiquer selon les valeurs de p, celui des 2 avions qui offre la meilleure
sécurité.

1
Ex 5. Au cours d’une expérience sur le comportement des animaux, des rats doivent choisir
4 portes d’apparence identique, dont l’une est dite "bonne" et les 3 autres sont dites "mauvaises".
Chaque fois qu’il choisit une mauvaise porte, le rat reçoit une décharge électrique désagréable
et est ramené à son point de départ, et cela jusqu’à ce qu’il choisisse la bonne porte.
1) Le rat n’a aucune mémoire : il choisit à chaque essai de façon équiprobable entre les 4
portes. Déterminer la loi de la v.a.r. X, nombre d’essais effectués par le rat. Calculer E(X).
2) Le rat a une mémoire parfaite : à chaque nouvel essai, il évite les mauvaises portes choi-
sies précédemment et il choisit de façon équiprobable entre celles qu’il n’a pas encore essayées.
Déterminer la loi de la v.a.r. Y, nombre d’essais effectués par le rat. Calculer E(Y ).

Ex 6. Une urne contient n boules numérotées de 1 à n (n≥2). On en prélève 2 simultané-


ment. Soient X et Y les v.a.r. égales respectivement au plus petit et au plus grand des 2 nombres
apparus.
1) Déterminer les lois de probabilité de X et Y.
2(k−1) 2(n−k)
2) En déduire les valeurs de : nk=2 n(n−1) et n−1
P P
k=1 n(n−1) ..

Ex 7. On tire successivement, avec remise, 10 livres d’un lot comprenant : 10 de latin, 20


de grec, 15 de maths et 5 de chimie. Soit X le nombre de livres de latin obtenus.

1) Quelle est la loi de X ?


2) Calculer E(X) et var(X).
3) Calculer P(X ≥ 3) et P(X = 4).

Ex 8. X suit une loi B(n,p).

1) Ecrire la probabilité que X s’écarte de sa moyenne d’au moins 3 écarts-types.


2) Faire le calcul pour n=6 et p= 13 .
3) Comparer, dans ce cas-là, à ce que donne l’inégalité de B-Tchebyschef.

Ex 9. X et Y sont 2 v.a.r. indépendantes telles que : E(X) = E(Y ) = var(X) = E(Y 2 ) =


1. Soit Z = 2X + Y , T = X − 2Y , U = 2X 2 + 2Y 2 . Calculer E(Z), E(T ), E(U ), E(ZT ),
cov(Z, T ), var(Z) et var(T ).

Ex 10. Combien de fois faut-il jeter une pièce pour avoir une probabilité supérieure ou égale
à 0,9 que la fréquence du nombre de piles sortis soit comprise entre 0,4 et 0,6 ? .

Ex 11. X1 ∼ B(10 ;0,5) ; X2 ∼ B(20 ;0,5). X1 et X2 sont indépendantes. On pose Y=X1 +


X2 . Calculer de 2 façons différentes : P(Y = 3), E(Y ) et σ(Y). Calculer P(12 ≤ Y < 20).

Ex 12. Une compagnie aérienne assure une liaison entre New-York et Washington et une
liaison New-York-Montréal. On suppose que le nombre de retards par semaine à l’arrivée de
Washington suit une loi de Poisson de paramètre 1 et que le nombre de retards à l’arrivée de
Montréal suit une loi de Poisson de paramètre 2. Pour une semaine donnée, calculer la proba-
bilité pour que le nombre total de retards enregistrés à l’arrivée de Washington et Montréal soit
inférieur à 5 (on précisera et on critiquera l’hypothèse nécessaire à ce calcul).

2
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 4. Variables aléatoires à densité

Ex 1. On considère une fonction F définie par



a
 si x ≤ −1;
F (x) = bx + c si x ∈] − 1, 1[;

d si x ≥ 1.

1) Déterminer les valeurs de a, b, c et d telles que F soit une fonction de répartiton d’une
variable aléatoire à densité.
2) Représenter F graphiquement.
3) Déterminer la densité de probabilité associée à F .

Ex 2. Un arrêt de bus est desservi tous les quarts d’heures exacts ( i.e. à 8h, 8h15, 8h30 etc.).
Un usager arrive à l’arrêt à un instant aléatoire uniformément réparti sur 8h-8h30. On modélise
son instant d’arrivée par X la variable aléatoire égale au nombre de minutes écoulée depuis 8h
au moment de l’arriver de l’usager à l’arrêt de bus. On a donc X ∼ U([0, 30]).
1) Avec quelle probabilité l’usager attend-t-il le bus moins de 5 minutes ? plus de 10 mi-
nutes ?
Un autre usager arrive à l’arrêt Y minutes après 8h, avec Y une variable aléatoire de densité

g(y) = a(30 − y)2 1[0,30] (y).

2) Déterminer a et représenter f graphiquement.


3) Calculer la probabilité que l’usager attende le bus moins de 5 minutes ? plus de 10
minutes ?

Ex 3. Soit f la fonction définie sur R par :

x 7−→ ke−|x| .

1) Déterniner k pour que f soit la densité de probabilité d’une v.a.r. X.


2) Déterminer la fonction de répartition de X.
3) Soit Y = X 2 . Déterminer la densité de Y.

1
Ex 4. Soit X et Y deux v.a. liées par la relation

Y = exp(X).

1) Déterminer la loi de Y lorsque X est de loi uniforme sur [0, 1], (c’est à dire une variable
de densité constante sur [0, 1]). Tracer la densité et la fonction de répartition de Y . Que vaut
E(Y ) ? var(Y ) ?
2) Déterminer la loi de Y lorsque X est de loi normale N (0, 1), c’est à dire une variable
de densité  2
1 x
f (x) = √ exp − , x∈R
2π 2
Que vaut P(Y ≥ 1) ?

Ex 5. Soit X une v.a.r. dont la densité est définie par :


a
f (x) = .I (x)
x4 [1,+∞[
1) Déterminer a.
2) Déterminer FX la fonction de répartition de X et la représenter graphiquement.
3) Calculer, sous réserve d’existence, E(X p ) pour p ∈ N.
4) Quelle est la densité de Y = log(X) ? Que valent E(Y ) et Var(Y ) ?
5) Donner, grâce à Bienaymé-Tchebyschev, un majorant de la probabilité que X s’écarte
de sa moyenne, en valeur absolue, de plus de 2 écarts types. Faire le calcul exact, et comparer.

Ex 6. Soit X une v.a. qui suit une loi exponentielle de paramètre λ > 0. On considère la
v.a.r. Y = [X], où [X] désigne la partie entière de X.
1) Trouver la loi de Y ainsi que E(Y ) et Var(Y ).
2) Même question pour Z = X − Y .

Ex 7. Une variable aléatoire X admet pour densité la fonction f suivante :

f (x) = 6x(1 − x)1[0,1] (x).

1) Vérifier que f est bien une densité de probabilité.


2) Calculer la fonction de répartition F de la v.a.r. X.
3) En utilisant cette fonction de répartition, évaluer les probabilités P(X ≤ 1/2), P(1/3 ≤
X ≤ 2/3), P(X ≥ 1/6).
4) Calculer l’espérance de X. Pouvait-on s’y attendre ?
5) Calculer la variance de X.

2
Ex 8. 1) Z suit une loi N (0, 1) ; quelle est la probabilité pour que : a) Z < 1, 2 ? b)
0, 8 < Z < 1, 2 ? c) Z < −1, 2 ? d) −0, 4 < Z < 1, 5 ? e) |Z| > 0, 01 ? f) |Z| < 0, 92 ?
2) X suit une loi du χ2 à 11 degrés de liberté. Trouver u tel que P(X ≤ u) = 0.99.
Trouver la valeur de P(X ≥ 4.575). Trouver t1 et t2 tels que P(t1 ≤ X ≤ t2 ) = 0.98.
3) T suit une loi de Student à 5 degrés de liberté. Trouver u tel que P(T ≤ u) = 0.25 et
u0 tel que P(|T | ≤ u) = 0.98.

Ex 9. On a constaté que la répartition du taux de cholestérol pour un grand nombre de


personnes est la suivante :
taux inférieur à 165 cg : 58%
taux supérieur à 180 cg : 4%
1) Sachant que la répartition du taux de cholestérol suit une loi normale, calculer l’espé-
rance et l’écart-type de cette loi.
2) On admet que le nombre de personnes dont le taux est supérieur à 183 cg doivent
subir un traitement. Quel est le nombre de personnes à soigner dans une population de 100000
personnes ?

Ex 10. Une banque a connu quelques difficultés de trésorerie ; son conseil d’administration
décide d’organiser la gestion de manière à ce qu’il y ait 999 chances sur 1000 de toujours pou-
voir faire face aux demandes de retrait des déposants. (On suppose qu’il n’y a aucun mouvement
de panique parmi les déposants ; les habitants de ce pays mènent une vie paisible et ne se préoc-
cupent pas les uns des autres) La banque a 1000 clients, le dêpot de chaque client est 1000 francs.
La probabilité pour qu’un client retire son argent un jour donné est 0,001. Dans ces conditions,
combien la banque doit-elle conserver de liquidités journalières pour obéir au principe de gestion
qui a été posé ?

Ex 11. On considère une v.a.r. X telle que E(X) = m et σ(X) = σ.


On réalise n réalisations indépendantes de X, ce qui fournit l’échantillon X1P
, ..., Xn de n va-
riables aléatoires de même loi que X. On pose X = n1 ni=1 Xi et S 0 2 = n−1
1 n 2
P
i=1 (Xi − X)
1) La loi de X est inconnue mais on sait que n=25, m=160 et σ=40. Calculer une approxi-
mation de P(150 ≤ X ≤ 170) à l’aide du théorème central limite. Quelle minoration de la
probabilité précédente donne l’inégalité de Bienaymé-Tchebycheff ?
2) La loi de X est inconnue, m=160, σ=40, trouver les valeurs de n pour lesquelles on peut
écrire : P(155 ≤ X ≤ 165) ≥ 0, 95 i) en utilisant le théorème central limite ; ii) en utilisant
l’inégalité de B-Tchebycheff.
3) On suppose que X∼ B(2,θ). Si θ=0,4 et n=25, calculer P(0, 68 ≤ X ≤ 0, 92) de façon
exacte, puis en utilisant le TCL.
Si θ=0,0075 et n=100, calculer P(X > 0) par l’approximation de Poisson, puis en utilisant le
TCL. Quelle est la meilleure approximation ?

Ex 12. On modélise la durée de vie d’un processeur (en années) par une loi exponentielle de
paramètre 1/2.
1) Que vaut la durée de vie moyenne de ce processeur ?

3
2) Avec quelle probabilité le processeur vit-il plus de 6 mois ?
3) Avec quelle probabilité le processeur vit-il mois de 3 mois ?
4) Avec quelle probabilité le processeur vit-il entre 3 et six mois ?
5) Chaque vente de processeur rapporte 100 euros a son fabriquant, sauf s’il doit être
échangé pendant les six mois de garantie, auquel cas il ne rapporte plus que 30 euros. Combien
rapporte en moyenne un processeur ? On pourra définir une variable “gain” Y égale à 100 ou 30
avec des probabilités bien choisies, puis calculer son espérance.
6) On constate un an après sa mise en service qu’un processeur fonctionne. Avec quelle
probabilité va-t-il tenir encore 6 mois ?

Ex 13. 1) Un chef d’entreprise quitte son domicile A à 8h45 et se rend à son bureau qui
ouvre à 9h. Il utilise pour cela sa voiture de sport ; la durée du trajet est une v.a.r. gaussienne de
moyenne 12mn et d’écart-type 3mn. Quelle est la probabilité qu’il arrive à l’heure ?
2) Sa secrétaire habite dans une autre localité B et se rend à son bureau en prenant d’abord
le train à 7h45 ; le train la dépose à la gare de C ; de là elle doit marcher 5mn pour prendre
un autobus à 8h40 qui la dépose devant son bureau. La durée du trajet en train est une v.a.r.
gaussienne de moyenne 42mn et d’écart-type 3mn, tandis que celle du trajet en bus est une v.a.r.
gaussienne de moyenne 15mn et d’écart-type 5mn. Quelle est la probabilité que la secrétaire
arrive en retard ? Quelle est la probabilité que le chef d’entreprise constate à 9h que sa secrétaire
n’est pas encore arrivée ?

4
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 5. Utilisation des théorèmes limites dans la pratique

Ex 1. (d’après le sujet d’examen de janvier 2001.) Un ordinateur de type serveur doit sa-
tisfaire les requêtes de 50 terminaux (clients). À un instant donné, chaque terminal sollicite le
serveur avec une probabilité de 0.4. Soit X le nombre de terminaux sollicitant le serveur à un
instant donné.
1) Quelle est la loi de X ? On précisera toutes les hypothèses faites.
2) Par quelle autre loi de probabilité peut-on approcher celle de X. On justifiera cette
approximation.
3) En utilisant l’approximation précédente, calculer une valeur approchée des probabilités
P(X < 12) et P(X ∈ [18, 22]). On comparera cette dernière valeur à la valeur exacte.
4) On suppose que le serveur ne peut satisfaire que N requêtes simultanées. Déterminer la
valeur minimale de N telle que les requêtes des clients soient toutes satisfaites 99% du temps ?
5) Ce serveur reçoit aussi des requêtes du réseau internet, dont le nombre Y au cours
d’une période d’une minute est une variable aléatoire de type Poisson de paramètre λ. On ne
connait pas λ. Une expérience sur 15 minutes fournit l’échantillon suivant

0 3 2 0 1 2 2 1 0 1 4 2 3 2 2.

Proposer en la justifiant une estimation du paramètre λ et en déduire une estimation de la proba-


bilité P(Y > 3).

Ex 2. Une étude montre que le temps passé par chaque visiteur sur un site donné est de 40
secondes avec un écart type de 30 secondes. 50 personnes sont passées par ce site en une journée.
Calculer la probabilité que le temps passé total soit a) supérieur 2100 secondes ; b) compris entre
1800 et 2500 secondes.

Ex 3. La probabilité qu’un chien soit vecteur d’une certaine bactérie est de 34%. Sur un
échantillon de 1000 animaux, est-il probable que 400 soient vecteurs ?

1
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 6. Statistique descriptive

Ex 1. Une enquête statistique auprès de 100 familles a conduit à la répartition suivante selon
le nombre d’enfants :
xi 0 1 2 3 4 5 6 7 8
ni 13 32 21 12 10 7 2 1 2

1. Représenter cette série de trois différentes façons.


2. Calculer la moyenne et l’écart-type.

Ex 2. Un échantillon de 500 étudiants a été classé selon les 2 critères suivants : cycle d’étude
(X) et appréciation vis-à-vis de la quantité de travail exigée (Y ).

X \Y insuffisant moyen excédentaire


1er cycle 69 37 194
2è cycle 44 65 56
3è cycle 17 8 10

Calculez les distributions marginales et et une distribution conditionnelles et représentez-les


graphiquement.

Ex 3. On demande à 13 motards combien d’accidents de la route et d’interventions chirur-


gicales ils ont subi dans leur passé. On obtient la série suivante :
X 0 1 0 0 1 2 1 0 0 0 1 2 1
Y 1 1 0 1 0 1 2 1 0 0 1 3 0
Donner les distributions jointe et marginales de X et Y .

Ex 4. Un ornithologue note à chacune de ses sorties le nombre d’espèces d’oiseaux qu’il


observe (variable X). Les données de ses 50 dernières sorties sont regroupées dans le tableau
ci-dessous :
]40,45] ]45,50] ]50,55] ]55,60] ]60,65]
8 14 15 6 7

Tracer l’histogramme et le polygone des effectifs de cette série statistique.

1
Ex 5. (d’après juin 98) Le tableau qui suit donne la répartition des notes de mathématiques
de 120 étudiants d’une université :
modalités ]30,50] ]50,60] ]60,70] ]70,80] ]8,90] ]90,100]
effectifs 4 11 21 43 32 9

1. Représenter cette série.


2. Tracer le polygone des effectifs et celui des effectifs cumulés.

Ex 6. On a pesé 40 adolescents, dont voici les poids en kg :


37, 46, 41, 32, 39, 52, 45, 54, 36, 40,
31, 53, 35, 42, 35, 36, 43, 49, 51, 42,
42, 39, 45, 51, 44, 53, 43, 39, 46, 39,
52, 34, 39, 50, 36, 45, 41, 36, 49, 36.
1) Représenter la distribution des poids et déterminer son (ou ses) mode(s).
2) Grouper ces données en partageant l’intervalle [30,5 ; 54,5] en 8 classes de même am-
plitude. Tracer l’histogramme correspondant.
3) Même question avec 4 classes. Indication : on peut utiliser la question précédente.
4) La règle de Sturge conseille que le nombre de classes pour n observations soit proche
de k donné par :
10
k =1+ log10 n.
3
Si on suit cette règle, combien de classes faut-il considérer ?

Ex 7. Le tableau qui suit donne les poids respectifs de 12 pères (caractère statistique X) et
de leurs fils aînés (caractère statistique Y) :

X 65 63 67 64 68 62 70 66 68 67 69 71
Y 68 66 68 65 69 66 68 65 71 67 68 70

1) Représenter cette série.


2) Donner une équation de la droite de régression DY /X de Y par rapport à X .
3) Combien “devrait” peser le fils aîné d’un père de 72 kg ?

Ex 8. X et Y désignent 2 caractères statistiques. Les droites de régression DY /X (de Y


relativement à X) et DX/Y (de Y relativement à X) admettent pour équations respectives :

DY /X : y = 0, 431 x + 4, 866
DX/Y : x = 0, 554 y + 6, 384

1. Calculer les moyennes x et y des deux caractères.


2. Calculer le coefficient de corrélation linéaire ρ(X, Y ) (justifier son signe !).
3. Déterminer σ(X) et σ(Y ) sachant que Cov(X, Y ) = 9, 751.

2
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 7. Estimation statistique

Ex 1. Soit (X1 , X2 ) un échantillon de 2 variables i.i.d. admettant pour densité :

3x2
f (x) = si 0 < x < θ
θ3
= 0 sinon,

où θ est un paramètre strictement positif.


1) Montrer que les estimateurs suivants sont sans biais :
2 7
θ̂1 = (X1 + X2 ); θ̂2 = max(X1 , X2 ).
3 6
2) Calculer le risque quadratique moyen (RQM) de θ̂1 .
3) Calculer la fonction de répartition de X1 . En déduire celle de max(X1 , X2 ), puis la
densité g de max(X1 , X2 ).
4) Grâce à l’expression de g, calculer E(θ̂1 ), E(θ̂12 ) et en déduire le RQM de θ̂1 .
5) Quel estimateur choisir ?
6) Déterminer le meilleur estimateur, au sens de l’RQM, de la forme Tc (X1 , X2 ) =
c(X1 + X2 ), où c est une constante. Est-il sans biais ?
7) Application numérique : x = (1.5, 4.2)

Ex 2. Soit X1 , ..., Xn un échantillon d’une loi normale de moyenne θ et de variance θ(1−θ),


où θ est un paramètre inconnu appartenant à θ =]0, 1[.
1) Ecrire les équations de vraisemblance et montrer que la détermination du maximum de
vraisemblance se ramène à la résolution d’une équation du 3ème degré (que l’on ne cherchera
pas à résoudre).
2) On considère les statistiques :
n
1X 2
Tn = X̄n , Un = Xi
n
i=1

Montrer que Tn et Un sont des estimateurs des moments, sans biais et convergents de θ. Lequel
choisir ? On pourra utiliser que pour une variable X ∼ N (m, σ 2 ), E(X 4 )... XXX

1
Ex 3. La durée de fonctionnement X d’une ampoule électrique suit une loi normale. On
examine 12 ampoules et on enregistre les résultats suivants :
1 P
x = 58 jours et 12 (xi − x)2 =99.

Déterminer les intervalles de confiance :


1) de la moyenne de X à 95%.
2) de la variance de X à 99%.

Ex 4. Sur un échantillon de 30 pièces fabriquées par une machine, 6 ont défectueuses.


1) Trouver un intervalle de confiance à 95%, puis à 99,8% de la proportion réelle de pièces
défectueuses fabriquées par la machine.
2) Reprendre cette question avec 60 pièces défectueuses sur 300.

2
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 8. Tests d’hypothèses statistiques

Ex 1. On dispose d’un échantillon de taille n d’une variable aléatoire normale d’epérance


µ et de variance 1. On veut tester l’hypothèse H0 :µ = 0.
1) Construire la région critique d’un test dont le risque de première espèce est fixé à 5%
dans les deux cas suivants : i) test bilatéral : hypothèse alternative H1 :µ 6= 0. ii) test unilatéral :
hypothèse alternative H1 :µ > 0.
2) Représenter sur un graphique les risques de deuxième espèce β dans le deux cas, pour
µ = 1/2 ; les comparer pour n = 100. Comment varie β en fonction de α à n constant ?
3) Comment varient les régions critiques en fonction de la taille n de l’échantillon lors-
qu’on maintient α constant ? Que se passe-t-il alors pour β ?
4) Dans le cas d’un test unilatéral, que doit valoir n pour déceler dans 95% des cas un
écart à H0 au moins égal à 1/2 ? Même question pour un test bilatéral et un écart absolu au
moins égal à 1/2.
5) Que se passe-t-il pour un échantillon de grande taille, si la variable X suit une loi
quelconque d’espérance inconnue et de variance 1 ?

Ex 2. Un industriel fabrique des pièces pour assemblage dont la longueur X suit un loi
N (m, 10). Si dans la production, on a m ≤ 10, elle est considérée comme correcte, en revanche
si m ≥ 12, elle est irrémédiablement perdue (entre les deux, les pièces sont alésables). De quelle
taille d’échantillon doit-on disposer pour bâtir un test de m ≤ 10 contre m ≥ 12 qui limite à
5% les risques des deux espèces.

Ex 3. Trois statisticiens notés A,B et C ont examinés des étudiants et ont dû les classer en
“bons” et “médiocres”. Les résultats obtenus sont résumés dans le tableau suivant. Tester, par un

A B C Total
Bons 100 94 112 306
Médiocres 10 28 16 54
Total 110 122 128 360

test du χ2 , l’hypothèse selon laquelle le nombre d’étudiants médiocres est le même pour chaque
examinateur (au niveau 5% puis au niveau 1%).

1
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 9. TP no 1 de Statistiques avec le logiciel R


Statistiques descriptives

Ex 1. Initiation à la syntaxe de R Lire les transparents et tester les commandes indiqués


ainsi que des exemples issus de votre imagination pour appréhender la manipulation des données
de R , principalement des listes, vecteurs et matrices.
Continuer la découverte de R à travers les statistiques en suivant les notes de cours dis-
tribuées. LA commande à connaître étant help. La commande example est utile aussi, elle
fournit des exemples d’utilisation de la commande donnée en argument (ex : example(pie)).
On ne demande pas d’assimiler toute la syntaxe ni le vocabulaire, mais de s’imprégner un peu
de l’esprit de R.

Ex 2. On se propose de travailler maintenant sur des données réelles. À cet effet, R dis-
pose d’un certain nombre de jeux de données (data sets) dont la liste est accessible via la
commande data(), et dont certains sont devenus des classiques pour les enseignants et les
chercheurs en statistique. Nous allons commencer par le jeu mtcars que l’on charge en tapant
data(mtcars) et qui est décrit comme une commande dans un fichier d’aide : help(mtcars).
On y apprend des choses indispensables sur ces données, en particulier la définition de la po-
pulation des caractères étudiées (Remarque : tout n’est pas toujours très clair ni très complet
dans ces aides ; en particulier, on ne saurait donner la définition de certains caractères, sûrement
connus des amateurs de moteurs). Après avoir fait attach(mtcars), les colonnes du tableau
de données sont accessibles par leur nom uniquement (ex : mpg au lieu de mtcars$mpg).
1) Quelle est la population étudiée, de quelle taille est-elle ?
2) Quels sont les caractères étudiés, de quelle nature sont-ils (quantitatifs discrets, quan-
titatifs continus, qualitatifs) ?
3) Etudier le caractère cyl : distribution (tableau modalité/effectif), représentation gra-
phique.
4) Calculer les paramètres statistiques de ce caractère.
5) Donner le tableau de contingence du couple carb-cyl.
6) Représenter la consommation de ces voitures mpg par un histogramme.
7) Donner le premier décile pour le caractère mpg. Que signifie-t-il ?
8) Tracer la “boites à moustaches” (boxplot) pour mpg.

1
9) Quel graphe produit la commande boxplot(mpg∼cyl). Regarder ce que cela donne
sur d’autres choix de “formule”.
10) En utilisant la commande tapply ou aggregate, calculer la consommation moyenne
pour les moteurs à 4,6 et 8 cylindres (en une commande).
11) Calculer la moyenne et la variance de mpg.
12) Observer l’effet d’une translation des mesures sur la moyenne et sur la variance.
13) Observer l’effet d’une multiplication des données (changement d’échelle) sur la moyenne,
sur la variance et sur l’écart-type.
14) En utilisant summary, retrouver tous les paramètres de position du caractère étudié et
d’un autre au choix.

Ex 3. Traiter les exercices 1, 5 et 6 de la Fiche 1 de Travaux Dirigés.

2
Université des Sciences et Technologies de Lille
U.F.R. de Mathématiques

IUP MIAGE 2ème année Année 2005-06

Fiche 10. TP no 2 de Statistiques avec le logiciel R

Ex 1. 1) Simuler une séquence de 100 tirages à “pile ou face” (que l’on pourra modéliser
par des zéros et des uns) et tracer l’évolution de la fréquence empirique des “pile” en fonc-
tion du nombre de tirages. Ainsi, pour la séquence de taille sept 0, 1, 0, 1, 1, 1, 0 la
fréquence empirique du nombre de 1 est 0/1, 1/2, 1/3, 2/4, 3/5, 4/6, 4/7. .
Pour calculer cette fréquence empirique, on pourra appliquer la fonction cumsum) au vecteur
des 0-1.
2) Observer la convergence de cette fréquence empirique, vers ...
3) Quelle est la loi du nombre de Pile sur 200 tirages.
4) En déduire une façon simple de simuler la fréquence empirique des piles au bout de
200 tirages sans passer par la simulation de la suite complète de 0 et de 1.
5) La fréquence empirique du nombre de pile au bout de 200 tirages est donc une variable
aléatoire. On s’intéresse à sa distribution. Pour l’étudier numériquement, on va procéder à la
réalisation d’un grand nombre (N=1000) de tirages indépendants de cette variable, on stockera
ces résultat dans un vecteur √ f de taille N dont on tracera l’histogramme (fonction hist). Re-
présenter l’histogramme de 200(f − 0.5). De quelle forme est cet histogramme ? Quel est le
résultat de cours que l’on a illustré ?

Ex 2. Soit X une variable aléatoire de loi normale N (1, 1) et X une variable aléatoire de loi
de Poisson P(2) ; X et Y sont indépendantes. Que vaut E(XY ) ? Il est plus délicat de calculer
mathématiquement E(X 2 /(X 2 + Y 2 )). Proposer une méthode numérique pour approcher cette
valeur théorique.

Ex 3. Manipulation de la fonction t.test pour le calcul d’intervalles de confiance pour


la moyenne et pour les tests.
Soit x un vecteur de données. On peut vouloir réaliser l’un ou l’autre des deux objectifs :
1. Donner un intervalle de confiance de niveau alpha pour la moyenne à partir de l’échan-
tillon.
2. tester l’égalité de la moyenne théorique d’un échantillon avec une valeur moy supposée,
ou avec la moyenne d’un autre échantillon.
Dans le premier cas, on tapera

1
> alpha=0.98
> t.test(x,conf.level=alpha)

Le test renvoie plusieurs réponses, celle qui nous intéresse ici est la ligne suivant “alpha
percent confidence interval :”. Dans le second cas et pour un risque de première espèce alpha,
on tapera

> moy=1
> alpha=0.05
> t.test(x,mu=moy,conf.level=1-alpha)

Le résultat important est ici la p.value. Cette p.value est le risque de première espèce
critique au dessus duquel on accepte H0 et en dessous duquel on rejette H0 . Une p.value très
petite, par exemple 10−2 , vous dit qu’à risque de première espèce 10%,5%, 2%, vous rejettez
H0 mais qu’à risque 1% et en dessous vous l’acceptez. Autrement dit il faut être très conservatif
pour accepter H0 . Si cette p.value est ridiculement petite, cela veut dire que l’hypothèse doit
être rejetée. Exemple

> x=rnom(100)
> t.test(x,mu=0.5)

1) On tire un échantillon gaussien de moyenne nulle, de variance 1 et de taille 100. On


teste l’hypothèse moy=1. Quel est la p.value pour votre échantillon ? Recommencer avec un
autre échantillon pui en faisant varier la moyenne supposée (regarder pour des valeurs mu plus
grande, et des valeurs proches de zéro). Interpréter les résultats.
2) Charger les données “woman labour” en tapant Peut-on affirmer qu’il y a une hausse
significative de la proportion des femmes dans la représentation syndicale dans les grandes villes
américaines de 1968 à 1972. On fera un test d’égalité de moyenne entre deux échnatillon.
3) Charger les données iris (data(iris)). Afficher le vecteur représentant la lon-
gueur des pétales. Tracer les histogrammes ce ce caractère statistique pour chacune des variétés
séparément(cf. dernière colonne du vecteur iris.
4) Donner des intervalles de confiance à 95% pour la longueur des pétales pour chacune
des trois catégories.