You are on page 1of 51

Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.

1
UNIVERSITE PARIS-DAUPHINE
Dpartement MIDO
A.M.Boussion/Probabilits DU MI2E 2me anne (2008-2009)
TABLE DES MATIERES
Chapitre 3 : Couples alatoires 2
1 - Loi dun couple alatoire (X, Y) 3
2 - Couple alatoire discret 4
3 - Couple alatoire continu 9
4 - Covariance de deux variables alatoires 18
5 - Annexe : srie double, intgrale double 20
Chapitre 4 : Lois conditionnelles
Variables alatoires indpendantes 35
1 - Lois conditionnelles d'un couple discret 35
2 - Lois conditionnelles d'un couple continu 38
3 - Proprits de lesprance conditionnelle 41
4 - Couple de v.a. indpendantes 42
5 - Indpendance mutuelle 46
6 - Sommes de variables alatoires indpendantes - lois stables 48
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.2
Chapitre 3 : Couples alatoires
Soit (, A, P) lespace de probabilit associ une certaine exprience alatoire. Au
dbut du chapitre 2, on a vu qu'on peut sur dfinir simultanment plusieurs
variables alatoires.
Reprenons lexemple de l'urne RBV du poly 1 : on tire n fois une boule avec remise
dans une urne contenant une boule rouge, une blanche et une verte ; X est le
nombre de boules rouges obtenues, et Y le rang d'apparition de la premire boule
rouge (avec la convention Y = n+1 sil ny a aucune boule rouge dans lchantillon).
On peut dterminer sparment la loi de X (loi binmiale) et celle de Y (loi
gomtrique tronque). La v.a. X peut prendre la valeur n (dans le cas o on ne sort
que des boules rouges) et la v.a. Y aussi (dans le cas o la premire boule rouge
apparat au dernier tirage seulement), mais on remarque que pour n 2 on ne peut
avoir simultanment X = n et Y = n.
De mme, si Y = n+1 est ralis, on aura ncessairement X = 0.
Do lintrt dtudier ce qui se passe simultanment pour X et Y.
On considre dsormais deux variables alatoires X et Y dfinies sur le mme espace
de probabilit (, A, P), et on se pose les questions suivantes :
Comment dfinir simultanment la loi de X et Y, quon appellera loi jointe (ou loi
conjointe ) ?
Peut-on partir de la loi conjointe, retrouver la loi de X et celle de Y appeles lois
marginales ?
Inversement, suffit-il de connatre les lois de X et de Y pour reconstituer la loi
conjointe ?
Dterminer la loi dune variable alatoire fonction du couple :
T = (X, Y) (par exemple, T = X + Y)
De mme, dterminer la loi dun couple alatoire fonction du couple :
(U, V) = ((X, Y), (X, Y)) (par exemple, (U, V) = (X + Y, X - Y))
La loi de X est-elle modifie si lon connat la valeur prise par Y ? On introduira ce
propos les notions dindpendance et de loi conditionnelle.
On rpondra aux trois premires questions dans ce chapitre, et la dernire dans le
chapitre suivant.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.3
1 - Loi dun couple alatoire
a) Couple alatoire
Dfinition 3.1.1 :
On appelle couple alatoire un couple (X, Y) de variables alatoires dfinies sur le
mme espace de probabilit (, A, P).
Le couple (X, Y) est aussi appel vecteur alatoire de dimension 2.
Proposition et dfinition 3.1.2 : (admise)
Si (X, Y) est un couple alatoire, alors pour tout borlien B de R
2
,
[(X,Y) B] = { /(X(),Y()) B} est un vnement.
On pose : P
(X,Y)
(B)=P[(X,Y)B]
P
(X, Y)
est une probabilit sur lespace probabilisable (R
2
, B(R
2
)).
On lappelle loi du couple (X, Y).
On admettra que la loi P
(X, Y)
est totalement connue si on connait P
(X, Y)
[I
1
x I
2
]
pour tout pav I
1
x I
2
de R
2
.
On peut mme se limiter aux pavs de type ]-, x] x ]-, y].
Notation : P({ /X() x et Y() y}) = P[(X x) (Y y)]
= P(X x , Y y)
La virgule est ici une notation allge pour remplacer lintersection.
b) Fonction de rpartition dun couple
Dfinition 3.1.3 :
On appelle fonction de rpartition du couple (X, Y) la fonction de deux variables
dfinie par :
(x,y)R
2
F
(X,Y)
(x,y)=P(Xx,Yy)
F
(X, Y)
caractrise la loi du couple, mais son emploi est un peu moins ais qu'en
dimension 1.
Dans le cadre de ce cours, on se limitera aux cas o X et Y sont toutes les deux
discrtes, ou toutes les deux densit.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.4
2 - Couple alatoire discret
a) Loi conjointe dun couple discret
Dfinition 3.2.1 :
On appelle couple alatoire discret un couple alatoire (X, Y) dont les composantes X
et Y sont des v.a. discrtes (finies ou dnombrables).
On suppose que l'ensemble X() (respectivement Y()) des valeurs de X
(respectivement Y) est index par une partie I (respectivement J) de N.
Dfinitions et proposition 3.2.2 :
La loi conjointe du couple (X, Y) est dfinie par :
- l'ensemble X() x Y() = { (x
i
, y
j
) / i I, j J}
- la suite double (p
ij
) de rels tels que : i I j J p
ij
= P(X = x
i
, Y = y
j
)

iIjJp
ij
0

(i,j)IxJ

p
ij
=

iI

jJ

p
ij
=

jJ

iI

p
ij
=1
Rciproquement, on admettra que si on se donne un sous-ensemble A fini ou
dnombrable de R
2
, A = { (x
i
, y
j
) / i I, j J}, et une famille (p
ij
) de rels vrifiant les
proprits ci-dessus, il existe un couple discret (X, Y) tel que X() x Y() = A, et dont
la loi est donne par les p
ij
.
On a alors P[(X, Y) B] =

{i,j/(x
i
,y
j
)B}

p
ij
(somme double, finie ou non)
pour tout borlien B de R
2
.
{ Remarque 1 : Les conditions simultanes p
ij
0 et

(i,j)IxJ

p
ij
= 1 impliquent que :
0 p
ij
1 pour tout i et j.
{ Remarque 2 :
Dans le cas fini, les galits

1in


1jm
p
ij
=

i=1
n

j=1
m
p
ij
=

j=1
m

i=1
n
p
ij
ne posent pas
de problmes : elles rsultent des proprits de la somme (commutativit et
associativit)
Dans le cas dnombrable, ces galits restent vraies : c'est le thorme de Fubini
des sries doubles positives (voir 5 en annexe de ce chapitre).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.5
{ Remarque 3 : En gnral, on a simplement (X, Y)() 1 X() x Y() car il est
possible que pour certains couples (i, j), (X = x
i
)(Y = y
j
) = .
Dans lexemple cit en introduction de ce chapitre (p.2), on a :
X() = [[0, n]], Y() = [[1, n+1]] , alors que (X = n)(Y = n) = .
b) Lois marginales
Proposition et dfinition 3.2.3 :
Posons :

iIp
i.
=

jJ

p
ij

jJp
.

j
=

iI

p
ij

On a pour tout i p
i.
=P(X=x
i
) et pour tout j p
.

j
=P(Y=y
j
)
La famille {(x
i
, p
i.
) / i I} dfinit la loi de X , appele loi marginale de X.
La famille {(y
j
, p
.

j
) / j J} dfinit la loi de Y, appele loi marginale de Y.
Dans le cas fini,

il peut tre commode

de prsenter la loi du couple sous forme de
tableau :
X
\

Y
y
1
y
j
y
m
x
1
p
11
p
1j
p
1m

x
i
p
i1
p
ij
p
im
p
i.

somme en ligne
x
n
p
n1
p
nj
p
nm

p
.

j
\
somme de tous
les termes = 1
somme en colonne
k Exemple :
Soit un couple (X, Y) valeurs entires tel que :
i N j N P(X = i, Y = j) = a
i+j
i!j!
a) Calculer la constante a.
b) Calculer les lois marginales de X et Y.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.6
La donne de la loi du couple (X, Y) permet donc de connatre les lois de X et de Y.
* Attention ! La rciproque est fausse : la connaissance des lois marginales ne suffit
pas en gnral pour reconstituer la loi du couple. Deux couples de lois conjointes
diffrentes peuvent avoir des lois marginales identiques.
k Exemple :
Une urne contient a boules noires et b boules blanches.
a) On tire successivement deux boules avec remise. On note X
1
(respectivement X
2
)
la variable de Bernoulli gale 1 si la boule tire au premier (respectivement second)
tirage est blanche. Donner la loi du couple (X
1
, X
2
), et calculer les lois marginales.
b) Mmes questions pour le couple (Y
1
, Y
2
), dfini de manire analogue lorsque le
tirage a lieu sans remise.
c) Variable alatoire fonction dun couple discret
On peut comme en dimension 1 introduire par composition dapplications une
variable alatoire fonction de deux autres variables alatoires.
k Exemples : T = X + Y, U = XY, V = max (X, Y)
Proposition 3.2.4 : (admise)
Si (X, Y) est un couple discret, et si est une fonction quelconque de X() xY() dans
R, alors T = (X, Y) est une variable alatoire discrte.
Loi de (X, Y) :
On reprend les notations prcdentes.
Posons t
ij
= (x
i
, y
j
)
On obtient une famille finie ou dnombrable de rels {u
ij
} que l'on indexe par une
partie K de N. Une mme valeur u
k
peut tre obtenue pour des couples (x
i
, y
j
)
distincts.
On pose alors : q
k
=

{(i,j)/(x
i
,y
j
)=z
k
}

p
ij
La famille { (t
k

, q
k
) / k K} dfinit la loi de T = (X, Y).
Application : Loi de la somme X + Y de deux variables alatoires valeurs entires
Soient X et Y deux v.a. valeurs dans N. On pose S = X + Y.
Alors S prend des valeurs entires, et pour tout entier k :
P(S=k)=

i=0
k
P(X=i,Y=k-i)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.7
k Exemple : Soit (X, Y) un couple discret dont la loi conjointe est donne par :

X()=Y()=N
iNjNP(X=i,Y=j)=
1
2e
2

i+j
i!j!
Trouver la loi de S.
Esprance de (X, Y) :
Thorme 3.2.5 : Thorme de transfert discret (admis)
La v.a. discrte (X, Y) a une esprance si et seulement si

iI

jJ

(x
i
, y
j
) p
ij
existe,
et on a alors : E[(X,Y)]=

iI

jJ

(x
i
,y
j
)p
ij

{ Remarque : Ce thorme est tout fait analogue au thorme 2.5.4. Son intrt est
de calculer directement l'esprance de (X, Y) partir de la loi du couple, sans
chercher auparavant la loi de la v.a. relle (X, Y).
k Exemple d'application : Esprance de la somme de deux v.a. discrtes
On suppose que X et Y ont une esprance.
tape 1 : X + Y a aussi une esprance (cette tape est inutile si X et Y sont finies)
D'aprs le thorme ci-dessus, E(X + Y) a une esprance ssi

iI

jJ

x
i
+ y
j
p
ij
< +
x
i
+ y
j
x
i
+ y
j
d'o (p
ij
> 0) x
i
+ y
j
p
ij
(x
i
+ y
j
) p
ij
=

x
i
p
ij
+ y
j
p
ij
en sommant en i et j :

iI

jJ

x
i
+ y
j
p
ij

iI

jJ

x
i
p
ij
+

iI

jJ

y
j
p
ij
or

iI

jJ

x
i
p
ij
=

iI

x
i

jJ

p
ij
=

iI

x
i
p
i.
< + puisque E(X) existe
et

iI

jJ

y
j
p
ij
=

jJ

iI

y
j
p
ij
=

jJ

y
j
p
.

j
< + puisque E(Y) existe
(interversion des sommes) (calcul symtrique du prcdent)
d'o la conclusion.
tape 2 : calcul de E(X+Y)
E(X + Y) =

iI

jJ

(x
i
+ y
j
) p
ij
=

iI

x
i

jJ

p
ij
+

jJ

y
j

iI

p
ij
=

iI

x
i

p
i.
+

jJ

y
j
p
.

j
= E(X) + E(Y)
(ceci est la dmonstration dans le cas particulier de deux v.a. discrtes du rsultat gnral admis au
chapitre 2 proprits 2.5.3)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.8
d) Couple alatoire fonction dun couple discret
On peut aussi considrer un couple (U, V) fonction de (X, Y)
k Exemples : (U, V) = (X + Y, X - Y)
(U, V) = (min(X, Y), max (X, Y))
Proposition 3.2.6 : (admise)
Si (X, Y) est un couple discret, et si est une application quelconque de X() xY()
dans R
2
, alors (U, V) = (X, Y) est un couple alatoire discret.
Loi de (X, Y) : Comme en dimension 1, il faut commencer par dterminer les
ensembles de valeurs U() et V().
U() = { u
k
/ k K }
V() = { v
l
/ l L }
On pose alors : q
kl
=

{(i,j)/(x
i
,y
j
)=(u
k
,v
l
)}

p
ij
La famille { (u
k

, v
l
, q
kl
) /(k, l) K x L} dfinit la loi de (X, Y).
k Exemple :
Dans une urne contenant n boules numrotes de 1 n (n 2), on tire deux fois une
boule sans remise.
X et Y sont les numros respectifs de la premire et de la deuxime boule tires.
On pose U = min(X, Y) et V = max(X, Y).
Donner la loi du couple (X, Y), puis celle du couple (U, V).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.9
3 - Couple continu
En dimension 1, on remarque que lorsquon passe des v.a. discrtes aux v.a.
continues, dans les calculs (calcul de la probabilit que la v.a. soit dans un intervalle
donn, calcul de lesprance etc) les sommes (finies ou non) sont remplaces par
des intgrales.
On a vu que les calculs relatifs aux couples discrets font intervenir des sommes
doubles. On doit donc sattendre ce que les calculs relatifs aux couples continus
ncessitent des intgrales doubles.
a) Densit conjointe d'un couple alatoire continu
Dfinitions et proprit 3.3.1 :
On appelle fonction de densit surR
2
une fonction f de R
2
dans R ayant les
proprits suivantes :
i) f est positive,
ii) - ou bien f est continue sur R
2
,
- ou bien il existe un domaine D dont la frontire est une courbe de classe
C
1
par morceaux tel que f est continue sur D, et nulle sur le complmentaire de D,
iii)

-
+

-
+
f(u, v) du dv = 1
Le couple alatoire (X, Y) est dit continu ou densit s'il existe une fonction f
ayant les trois proprits ci-dessus telle que :
(x, y) R
2
P(X x, Y y) =

-
y
[

-
x
f(u, v) du ] dv
f est une densit de probabilit du couple (X, Y).
Rciproquement, on admettra que pour toute fonction f ayant les trois proprits
ci-dessus, il existe un couple alatoire (X, Y) dfini sur un espace de probabilit
convenable (, A, P), et admettant la fonction f pour densit.
{ Remarques :
La condition ii) de rgularit sur f peut tre considrablement allge, mais elle
sera ralise dans tous les exemples vus dans le cadre de ce cours. On vrifiera sur
tous les exemples proposs que l'on peut calculer sans difficults l'intgrale double
du iii) par le thorme de Fubini (c'est--dire que toutes les fonctions d'une variable
que l'on aura intgrer seront bien continues par morceaux).
Bien qu'en toute rigueur on ne puisse pas dire que (X, Y)() est inclus dans D, on a
P[(X, Y) D] = 1, ce qui pour les calculs revient au mme.
Comme en dimension 1, la densit de probabilit du couple (X, Y) n'est pas unique.
Toute fonction intgrable gale f presque partout (voir la dfinition au 5) est aussi
une densit de probabilit de (X, Y). On utilisera en particulier cette remarque pour
supposer D ouvert pour certains calculs (ce qui revient remplacer D par D priv de
sa frontire).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.10
k Exemples de densits :
- f(x, y) = 1
[0, 1]
2
(x, y) : on dit que (X, Y) suit la loi uniforme sur [0, 1] x [0, 1]
- plus gnralement : f(x, y) =
1
aire(D)
1
D
(x, y) loi uniforme sur le domaine D
(D tant ncessairement d'aire finie)
- f(x, y) = (x + y) 1
{0 x 1, 0 y 1}
- f(x, y) = 2e
-(x+2y)
1
R
+
2
(x, y)
- f(x, y) = e
-y
1
R
+
(x) 1
[x, +[

(y)
b) Fonction de rpartition et loi d'un couple continu
Certaines proprits des lois continues vues en dimension 1 se gnralisent :
Dfinition et proprit 3.3.2 : (admise)
La fonction de rpartition du couple (X, Y) est dfinie par :
(x, y) R
2
F
(X, Y)
(x, y) = P(X x, Y y)
=

-
y
[

-
x
f(u, v) du ] dv =

-
x
[

-
y
f(u, v) dv ] du
Cest une fonction continue, admettant des drives partielles secondes continues
presque partout (c'est--dire sauf peut-tre sur les ventuels points de discontinuit
de f), et on a :

2
F
(X,Y)
yx
(x,y)=f(x,y) en tout point (x, y) o f est continue.
Rciproque : (admise)
Si un couple (X, Y) a une fonction de rpartition continue sur R
2
et admettant
presque partout des drives partielles secondes continues, alors ce couple admet
une densit. Toute fonction positive gale presque partout

2
F
(X,Y)
yx
est une
densit du couple (X, Y).
On obtient la densit dun couple continu en drivant deux fois (en x et en y) sa
fonction de rpartition en tout point o cela est possible.
Lordre de drivation na pas dimportance ; daprs le thorme de Schwarz, en tout
point (x, y) o les drives partielles secondes sont continues, on a :

2
F
(X,Y)
yx
(x, y) =

2
F
(X,Y)
xy
(x, y)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.11
Proprit 3.3.3 : (admise)
Si le couple (X, Y) admet une densit, pour tous rels x et y,
P(X = x, Y = y) = 0.
On crit de manire formelle en tout point (x, y) o f est continue :
P(x < X x + dx, y < Y y + dy) = f(x, y) dx dy
Thorme 3.3.4 :
Probabilit qu'un couple soit dans un pav de R
2
:
P(a<Xb,c<Yd)=

[a,b]x

[c,d]

f(x,y)dxdy
pour tous rels a < b, c < d avec ventuellement a ou c = -, b ou d = + .
Si a, b, c, d sont finis, cette expression peut s'crire avec la fonction de rpartition :
P(a < X b, c < Y d) = F
(X, Y)
(b, d) - F
(X, Y)
(a, d) - F
(X, Y)
(b, c) + F
(X, Y)
(a, c)
On peut crire indiffremment des ingalits strictes ou larges :
P(a < X b, c < Y d) = P(a X b, c Y d) = P(a < X < b, c < Y < d) =
Plus gnralement, probabilit qu'un couple soit dans un borlien B de R
2
: (admis)
P[(X,Y)B]=

f(x,y)dxdy=

R
2

f(x,y)1
B
(x,y)dxdy
pour tout borlien B de R
2
(tous les borliens vus dans ce cours seront suffisamment
rguliers pour que les intgrales ci-dessus aient le sens vu au 5 de ce chapitre).
k Exemples :
Pour (X, Y) de densit f(x, y) = (x + y) 1
{0 x 1, 0 y 1}
, calculer P(X >
1
2
, Y >
1
2
)
Pour (X, Y) de densit f(x, y) = e
-y
1
R
+
(x) 1
[x, +[

(y), calculer P( X + Y 1)
c) Densits marginales
Dfinition 3.3.5 :
La densit marginale f
X
de X est la fonction : x f
X
(x)=

-
+
f(x,y)dy
X est une variable relle densit, et f
X
est une densit de X.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.12
De mme, la densit marginale f
Y
de Y est la fonction : y f
Y
(y)=

-
+
f(x,y)dx
La donne de la densit du couple (X, Y) permet donc de calculer la densit de X et
celle de Y.
* Attention 1 !
Comme dans le cas discret, la connaissance des densits marginales ne suffit pas en
gnral pour reconstituer la densit du couple.
k Exemple :
f(x, y) = y e
-(x+y)
1
R
+
(x) 1
R
+
(y)
g(x, y) = e
-y
1
R
+
(x) 1
[x, +[

(y)
f et g sont des densits de couples diffrentes, mais leurs densits marginales sont les
mmes.
* Attention 2 !
Si le couple (X, Y) a une densit, les v.a. relles X et Y sont des v.a. densit, mais la
rciproque est fausse :
Soit X suivant une loi exponentielle de paramtre 1, et Y = -X.
Y a pour densit la fonction x e
x
1
]-, 0]
(x) , mais le couple (X, Y) n'a pas de
densit dans R
2
.
d) Variable alatoire fonction dun couple continu
Proposition 3.3.6 : (admise)
Soit (X, Y) un couple continu, de densit f. D'aprs la dfinition d'une densit, ou bien
la fonction f est continue sur R
2
(auquel cas on pose D = R
2
), ou bien il existe un
domaine D dont la frontire est une courbe de classe C
1
par morceaux tel que f est
continue sur D, et nulle sur le complmentaire de D.
Soit une fonction relle dfinie et continue sur D.
Alors T = (X, Y) est une variable alatoire relle (dfinie au moinspresque
srement).
* Attention ! T ne sera pas toujours une variable densit.
Loi de (X, Y) :
Mthode 1 : Utilisation de la fonction de rpartition
Pour dterminer la loi de T, on calcule sa fonction de rpartition :
t R F
T
(t) = P(T t) = P((X, Y) t) = P[(X, Y) D
t
]
en notant D
t
= { (x, y) R
2
/ (x, y) t }
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.14
Les calculs par les mthodes 2 et 3 sont trs similaires ; ils ncessitent l'utilisation de
la formule de changement de variable dans l'intgrale double.
Esprance de (X, Y) :
Thorme 3.3.7 : Thorme de transfert continu
La v.a. (X, Y) a une esprance si et seulement si

-
+

-
+
(x, y) f(x, y) dx dy < + ,
et on a : E[(X,Y)]=

-
+

-
+
(x,y)f(x,y)dxdy
{ Remarque : on a utilis le thorme de transfert discret (thm 3.2.5) pour dmontrer
que si (X, Y) est un couple discret tel que X et Y ont une esprance, alors X + Y a une
esprance et E(X + Y) = E(X) + E(Y).
On pourrait de mme utiliser le thorme de transfert continu pour dmontrer la
mme proprit si (X, Y) est un couple densit.
En fait, la relation E(X + Y) = E(X) + E(Y) est plus gnrale car elle est vraie ds que X
et Y ont une esprance, mme lorsque le couple (X, Y) n'est ni un couple discret, ni
un couple densit (par exemple si X continue et Y discrte : cf ex 22 du TD2).
e) Couple alatoire fonction dun couple continu
Proposition 3.3.8 : (admise)
Soit (X, Y) un couple continu de densit f, et D le domaine de R
2
introduit dans la
dfinition de f.
Si est une application de D dans R
2
continue sur D, alors (X, Y) est un couple
alatoire.
Lapplication est dfinie par : (x, y) = ((x, y), (x, y))
On a donc : (X, Y) = (U, V) avec U = (X, Y) et V = (X, Y)
(Le couple (U, V) est dfini presque srement)
La loi de (X, Y) tant connue, on cherche la loi du couple (U, V).
Le thorme 3.3.11 ci-dessous donne une condition suffisante pour que le couple
alatoire (U, V) ait une densit. Il ncessite au pralable les rappels suivants :
Dfinitions et proprit 3.3.9 : (voir 5)
Soient U et V deux ouverts de R
2
.
est continment diffrentiable sur U si les fonctions et admettent en tout
point de U des drives partielles premires continues.
(l'hypothse "U ouvert" vite des problmes de dfinition des drives partielles sur
une ventuelle frontire)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.15
est un C
1
-diffomorphisme de U sur V si :
_
_
_
_
_
_
_
estcontinmentdiffrentiablesurU
estbijectivedeUsurV

estcontinmentdiffrentiablesurV
Le jacobien de est le dterminant de la matrice jacobienne :
J

(x,y)=dt
_
[
[
[


_
_
_
_

x
(x,y)

y
(x,y)

x
(x,y)

y
(x,y)

Thorme 3.3.10 : Formule du changement de variable (voir 5)


Soit un C
1
-diffomorphisme d'un ouvert U sur un ouvert V de R
2
, et un sous-
ensemble de U dont la frontire est une courbe de classe C
1
par morceaux.
Soit k une fonction continue sur ().
Si l'une des deux intgrales ci-dessous existe, l'autre existe aussi et elles sont gales :

])
k(x,y)dxdy=

k[(u,v)]J

(u,v)dudv
Thorme 3.3.11 : Soit (X, Y) est un couple de densit f partir de laquelle on
dfinit le domaine D ; soit un C
1
-diffomorphisme dfini sur D (on peut sans
restreindre la gnralit supposer D ouvert)
Alors le couple alatoire (U, V) = (X, Y) admet une densit sur R
2
.
Calcul d'une densit g de (U, V) : Mthode "de la fonction muette"
Cette mthode repose sur le thorme suivant (admis) :
Thorme 3.3.12 :
Pour qu'un couple alatoire (X, Y) admette une fonction f pour densit, il faut et il
suffit que pour toute fonction h continue borne sur R
2
, on ait :
E[h(X, Y)] =

-
+

-
+
h(x, y) f(x, y) dx dy
Pour dterminer une densit de (U, V), on cherche donc une fonction g telle que,
pour toute fonction h continue borne sur R
2
, on ait :
E[h(U, V)] =

-
+

-
+
h(u, v) g(u, v) du dv
Or E[h(U, V)] = E[h((X, Y)] = E[ho(X, Y)] =

-
+

-
+
ho(x, y) f(x, y) dx dy
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.16
=

h[(x, y)] f(x, y) dx dy (1)


On applique la formule de changement de variable 3.3.10 avec :
k(x, y) = h[(x, y)] f(x, y) , = (D) , et =

ce qui donne :
(1) =

]j
k(x, y) dx dy =

k [

(u, v) ] J

-1
(u, v) du dv
=

]D)
h(u, v) f[
-1
(u, v)] J

-1
(u, v) du dv
D'o une expression de la densit cherche g :
g(u,v)=
_
_
_
_
_
f[
-1
(u,v)]J

-1
(u,v)si(u,v)(D)
0sinon
Il est recommand de la redmontrer cette formule au cas par cas, et non de
l'apprendre par coeur.
* Attention !
Ecrire " est bijective" n'a pas de sens : il faut absolument prciser l'ensemble de
dpart D et l'ensemble d'arrive . On crit alors : " est bijective de D sur " .
Pour dterminer le domaine = (D), il est primordial de procder soigneusement
par quivalence.
k Exemple : Soit (X, Y) un couple de densit f avec f(x, y) =
1
x
2
y
2
1
[1, +[
(x) 1
[1, +[
(y)
Dterminer la densit du couple (U, V) o
_
_
_
_
_
U=
1
X
V=
X
Y
{ Remarques :
Le thorme 3.3.11 est la gnralisation la dimension 2 du thorme 2.4.5.
Ce thorme peut tre utilis pour dterminer la densit de U = (X, Y).
On choisit une deuxime application de manire ce que = (, ) soit un C
1
-
diffomorphisme, et que les calculs soient aussi simples que possible.
Par exemple : si U = X + Y, on choisira usuellement :
(x, y) = ((x, y), x)) ou (x, y) = ((x, y), y) ou (x, y) = ((x, y), x - y)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.17
par la mthode de la fonction muette :
- on crit que pour toute fonction h continue borne sur R
E[h(U)] =

h[(x, y)] f(x, y) dx dy


- on transforme cette intgrale avec la formule du changement de variable de
manire faire apparatre

]D)
h(u) f[
-1
(u, v)] J

-1
(u, v) du dv
On intgre alors en v pour obtenir une intgrale du type

h(u) g(u) du : la fonction g


ainsi mise en vidence est une fonction de densit de U.
ou bien : on pose V = (X, Y), on dtermine dabord la loi du couple (U, V), puis on
calcule la loi marginale de U.
k Exemple :
Soit (X, Y) un couple de densit f(x, y) = (x + y) 1
{0 x 1, 0 y 1}
Dterminer une densit de U = X + Y.
Autre mthode de calcul d'une densit de (U, V) : utilisation de la fonction de
rpartition
Dans certains cas le thorme 3.3.11 n'est pas applicable directement parce que
l'application n'est pas bijective sur D ; on peut alors utiliser la fonction de
rpartition.
L'exemple typique de cette situation est : U = min(X, Y), V = max(X, Y)
k Exemple :
Soit (X, Y) un couple de densit f(x, y) = (x + y) 1
{0 x 1, 0 y 1}
Dterminer une densit de (U , V) = (min(X, Y), max(X, Y))
(indication : commencer par calculer pour u et v rels P(U u, V v)
Remarque : cet exemple peut nanmoins aussi se traiter par la mthode de la
fonction muette, en crivant E[h(U, V)] comme une intgrale double en x et y que
l'on spare en deux parties : une intgrale sur {x < y} et une autre sur {y < x},
l'ensemble {x = y} tant ngligeable.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.18
4 - Covariance de deux variables alatoires
Dans ce paragraphe, on considre un couple alatoire (X, Y) tel que X et Y ont une
variance. On note
X
et
Y
leurs cart-types respectifs.
a) Covariance et coefficient de corrlation de deux v.a.
Proposition 3.4.1 :
Si X et Y ont une variance, la v.a. XY a une esprance.
Proposition 3.4.2 : Ingalit de Cauchy-Schwarz
[E(XY)]
2
E(X
2
)E(Y
2
)
Il y a galit si et seulement si X et Y sont proportionnelles presque srement.
Dfinitions 3.4.3 :
On appelle covariance de X et Y le rel dfini par :
cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y)
On appelle coefficient de corrlation de X et Y le rel dfini par :
(X,Y)=
cov(X,Y)

condition que
X
> 0 et
Y
> 0
(cest--dire condition que X et Y ne soient pas quasi-certaines)
Contrairement la covariance, le coefficient de corrlation est indpendant des
units choisies pour X et Y.
Si cov(X,Y)=0 , on dit que X et Y sont non corrles.
Proprits 3.4.4 :
Soient X et Y deux v.a. admettant une variance, et soient et j deux rels.
cov(X,X)=Var(X)
cov(X,Y)=cov(Y,X) la covariance est symtrique
cov(X
1
+jX
2
,Y)=cov(X
1
,Y)+jcov(X
2
,Y) la covariance est bilinaire
Si de plus X et Y ne sont pas quasi-certaines :
(X,Y)1
(X,Y)=1 Y est presque srement une fonction affine de X ( et
inversement)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.19
b) Variance dune somme
Thorme 3.4.5 : Variance d'une somme
Si X et Y ont une variance, il en est de mme pour X + Y , et on a :
Var(X+Y)=Var(X)+Var(Y)+2cov(X,Y)
Gnralisation n variables : Si n variables alatoires X
1
, , X
n
ont une variance,
alors il en est de mme pour leur somme, et on a :
Var(

i=1
n
X
i
)=

i=1
n
Var(X
i
)+2

1i<jn

cov(X
i
,X
j
)
Cas particulier important : Si les X
i
sont non corrles deux deux (ce qui est vrai
en particulier si les X
i
sont indpendantes, voir chapitre suivant), la variance de la
somme est gale la somme des variances :
Var(

i=1
n
X
i
)=

i=1
n
Var(X
i
)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.20
5 - Annexe : Srie double, intgrale double
A - Srie double
a) Srie double positive
Dfinitions 3.5.1 :
On appelle suite double une application de N x N dans R.
On note : (i, j) u
ij
La suite est dite positive si pour tout (i, j) de N x N u
ij
0
{ Remarque : Pour simplifier les notations, on suppose ici que i et j dcrivent N tout
entier, mais les rsultats exposs ci-dessous restent vrais si i et j dcrivent seulement
des parties infinies (I et J respectivement) de N.
Soit une suite double positive (u
ij
). Pour tout entier i fix, on tudie la convergence
de la srie

u
ij
: la somme de cette srie est soit +, soit un rel s
i
(ncessairement
positif). Si pour tout i fix

u
ij
= s
i
rel, on peut envisager de calculer

s
i
.
La somme S de cette srie est soit +, soit un rel (lui aussi ncessairement positif).
On la note : S =

i=0
+
(

j=0
+
u
ij
) ou plus simplement

i=0
+

j=0
+
u
ij
ou mme

u
ij
(Si

u
ij
diverge au moins pour un entier i, on posera

i=0
+
(

j=0
+
u
ij
) = +)
Symtriquement, pour tout entier j fix, la somme de la srie

u
ij
est soit +, soit
un rel
j
(ncessairement positif). Dans ce dernier cas, on peut envisager de calculer

j
, que l'on note

j=0
+
(

i=0
+
u
ij
).
k Exemples :
Si cest possible, calculer

u
ij
et

u
ij
dans les cas suivants :
- (i, j) N
2
u
ij
=
i+j
i!j!
- (i, j) N
2
u
ij
=
j
i
si 1 j i ; u
ij
= 0 sinon
-

(i, j) N
2
u
ij
= (
1
i
)
j
si i 2 et j 2 ; u
ij
= 0 sinon
Thorme et dfinition 3.5.2 : Thorme de Fubini -Tonelli : (admis)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.21
Soit une suite double positive (u
ij
)
Alors :

i=0
+
(

j=0
+
u
ij
) =

j=0
+
(

i=0
+
u
ij
)
L'galit est vraie que le rsultat soit fini ou non.
La srie double positive

u
ij
est dite convergente si l'une des deux sommes :

i=0
+

j=0
+
u
ij
et

j=0
+

i=0
+
u
ij
est finie (ce qui assure que l'autre l'est aussi).
La valeur U commune ces deux sommes est appele somme de la srie double.
On note : U =

(i,j)N
2

u
ij
ou plus simplement U =

i,j

u
ij
Le calcul de la somme U peut se faire en thorie dans n'importe quel ordre, mais en
pratique il arrive qu'un calcul soit plus simple que l'autre (et mme parfois possible
dans un seul sens).
Thorme 3.5.3 : Thorme de comparaison des sries doubles positives :
Soient deux suites doubles (u
ij
)

et

(v
ij
) telles que : (i, j) N
2
0 u
ij


v
ij
Si la srie double

v
ij
converge et a pour somme V, alors la srie double

u
ij
converge aussi, et sa somme U vrifie : U V.
dm : Il suffit d'appliquer deux fois le thorme de comparaison des sries doubles positives.
b) Srie double absolument convergente
Dfinition 3.5.4 : La srie double

u
ij
est dite absolument convergente si la srie
double positive

u
ij


est convergente.
Thorme et dfinition 3.5.5 : Thorme de Fubini
Soit

u
ij
une srie double absolument convergente. Alors :
1 - pour tout entier i , la srie

u
ij
est absolument convergente. Soit s
i
sa somme.
2 - pour tout entier j , la srie

u
ij
est absolument convergente. Soit
j
sa somme.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.22
3 - Les sries

s
i
et

j
sont absolument convergentes, et leurs sommes sont
gales.
La valeur commune U

i=0
+

j=0
+
u
ij
et

j=0
+

i=0
+
u
ij
est la somme de la srie double.
Comme pour les sries positives, on note : U =

(i,j)N
2

u
ij
ou U =

i,j

u
ij
dm :
On pose : (i, j) N
2
v
ij
=
u
ij
+u
ij
2
et w
ij
=
u
ij
-u
ij
2
On remarque que : u
ij
= v
ij
- w
ij
De plus on a pour tout i et j : - u
ij
u
ij
u
ij
, d'o 0 v
ij
u
ij
et 0 w
ij
u
ij

D'aprs le thorme 3.5.3, les deux sries doubles positives

i,j

v
ij
et

i,j

w
ij
sont convergentes.
On appelle V et W leurs sommes respectives.
Pour que la srie double

i,j

u
ij
soit convergente, il est ncessaire que pour tout i fix, la srie

u
ij
soit convergente, autrement dit que la srie

u
ij
soit absolument convergente.
Si on note s
i
la somme de cette srie, on a pour tout i : s
i
=

j=0
+
u
ij

j=0
+
u
ij
.
Par hypothse

i=0
+

j=0
+
u
ij
+, autrement dit la srie de terme gnral

j=0
+
u
ij
est convergente,
ce qui assure d'aprs le thorme de comparaison des sries simples positives que la srie de terme
gnral s
i
est convergente : la srie de terme gnral s
i
est donc bien absolument convergente.
Notons U =

i=0
+
s
i
Par dfinition : U =

i=0
+

j=0
+
u
ij
=

i=0
+

j=0
+
(v
ij
- w
ij
) = lim
n+

i=0
n

j=0
+
(v
ij
- w
ij
)
Or pour tout i fix, les sries de terme gnral v
ij
et w
ij
sont convergentes (puisque les sries doubles
positives le sont). On en dduit :

j=0
+
(v
ij
- w
ij
) =

j=0
+
v
ij
-

j=0
+
w
ij
d'o pour tout entier n :

i=0
n

j=0
+
(v
ij
- w
ij
) =

i=0
n

j=0
+
v
ij
-

i=0
n

j=0
+
w
ij
En passant la limite quand n tend vers +, on trouve U = V - W
Un calcul symtrique assure que la srie de terme gnral
j
est absolument convergente, et que sa
somme vaut aussi V -W.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.23
{ Remarque : Le calcul de la somme d'une srie double absolument convergente se
ramne donc deux calculs successifs de sommes de sries simples, condition
d'avoir vrifi d'abord que la srie est bien absolument convergente.
Il peut arriver en effet qu'on puisse donner un sens aux sommes doubles

i=0
+

j=0
+
u
ij
et

j=0
+

i=0
+
u
ij
, mais si la srie double n'est pas absolument convergente, ces deux sommes
doubles ne seront pas forcment gales.
Les sries doubles utilises en Probabilits sont toutes absolument convergentes.
Cas particulier : Soient

u
i
et

v
j
deux sries simples absolument convergentes
de sommes respectives U et V. Posons : w
ij
= u
i
v
j
Alors la srie double

w
ij
est absolument convergente et sa somme W = U V.
Proprits 3.5.6 :
Si les sries doubles

u
ij
et

v
ij
sont absolument convergentes et ont pour
sommes respectives U et V, alors la srie double

(u
ij
+ v
ij
) est absolument
convergente et a pour somme U + V.
Si la srie double

u
ij
est absolument convergente et a pour somme U, alors pour
tout rel la srie double

(u
ij
) est absolument convergente et a pour somme U.
Si les sries doubles

u
ij
et

v
ij
sont absolument convergentes et ont pour
sommes respectives U et V, et si u
ij


v
ij
pour tout i et pour tout j, alors on a : U V.
Autrement dit : l'ensemble des sries doubles absolument convergentes est un
espace vectoriel rel, et l'application qui une srie double absolument convergente
associe sa somme est une forme linaire positive (ou croissante).
B - Intgrale double
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.24
Ce paragraphe n'expose pas la construction traditionnelle de l'intgrale double. Il a
simplement pour but de donner aussi vite que posible les outils ncessaires aux
calculs relatifs aux couples alatoires densit.
a) Fonction relle de deux variables
Dfinition 3.5.7 :
f est une fonction relle de deux variables si cest une application dune partie D
f
de
R
2
dans R. On note : (x, y) f(x, y)
D
f
est le domaine de dfinition de f.
k Exemples :
f(x, y) = x


y-x
2
; D
f
= {(x, y) R
2
/ y x
2
}
en repre orthonorm, les points de D
f
sont les points de R
2
situs au-dessus de la parabole
d'quation y = x
2
.
f(x, y) = ln(1 - x
2
- y
2
) ; D
f
= {(x, y) R
2
/ x
2
+ y
2
< 1}
en repre orthonorm, ce sont les points du disque ouvert de centre O et de rayon 1 .
Dfinition 3.5.8 : On appelle graphe de la fonction f le sous-ensemble de R
3
dfini
par : G
f
= { (x, y, z) R
3
/ (x, y) D
f
et z = f(x, y) }
Le graphe d'une fonction de deux variables est une surface de R
3
.
Dfinition 3.5.9 : Soit f une fonction de deux variables dfinie sur une partie D
f
de
R
2
. Soit (x
0
, y
0
) un point de D
f
. On dit que f est continue en (x
0
, y
0
) si :
> 0 > 0 (x, y) D
f
(

(x-x
0
)
2
+(y-y
0
)
2
< |f(x, y) - f(x
0
, y
0
)| < )
Si f est continue en tout point (x, y) de D
f
, on dit que f est continue sur D
f
.
k Exemples :
Toutes les fonctions de deux variables construites par composition partir des
fonctions usuelles (polynmes, puissance, ln, exponentielle) sont continues sur leur
domaine de dfinition (rsultat admis) :
f(x, y) = xy+y ; f(x, y) =

x
y+1
; f(x, y) = x e
2x-y
f(x, y) = 1
D

(x, y) =
_
_
_1si(x,y)D
0sinon
o D est une partie de R
2
limite par une courbe de classe C
1
par morceaux.
f est dfinie sur R
2
, elle est continue sauf aux points de la frontire de D.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.25
Lorsquon a une fonction de deux variables x et y, on peut fixer une des variables
(par exemple y) que lon considre comme un paramtre. On se ramne ainsi une
fonction relle dune seule variable : x f(x, y), dont on peut tudier les proprits.
On montre par exemple aisment que si la fonction de deux variables f est continue
(dfinition ci-dessus), alors lapplication partielle x f(x, y) est une fonction dune
variable continue. De mme pour lapplication y f(x, y) (dans ce cas, cest x que
lon considre comme un paramtre). Mais la rciproque est fausse : la continuit des
applications partielles ne suffit pas pour assurer la continuit de la fonction de deux
variables.
Dfinitions 3.5.10 :
Si lapplication x f(x, y) est drivable, sa drive est appele drive partielle du
premier ordre de f par rapport la variable x et est note
f
x
(x, y).

f
x
(x,y)=lim
h0

f(x+h,y)-f(x,y)
h

Symtriquement, on peut dfinir


f
y
(x, y).
Une drive partielle par rapport x se calcule en considrant que dans lexpression
de f(x, y), y est un paramtre fix et en drivant par rapport la variable x.
k Exemples :
f(x, y) = x

e
xy
;
f
x
(x, y) = (xy + 1) e
xy
et
f
y
(x, y) = x
2
e
xy
f(x, y) = x

y + x
2
+ 1 ;
f
x
(x, y) =

y + 2x et
f
y
(x, y) =
x
2

y
f(x, y) = y lnx + x ;
f
x
(x, y) =
y
x
+ 1 et
f
y
(x, y) = lnx
Les drives partielles sont des fonctions de deux variables, dont on peut tudier les
ventuelles proprits de drivabilit.
Si la fonction x
f
x
(x, y) admet une drive partielle du premier ordre en x, cette
drive est appele drive partielle du second ordre de f par rapport la variable x
et note

2
f
x
2
(x, y).
Si la fonction x
f
x
(x, y) admet une drive partielle du premier ordre en y, cette
drive est appele drive partielle du second ordre de f par rapport aux variables
x et y (dans cet ordre) et note

2
f
yx
(x, y).
Symtriquement, on peut dfinir

2
f
y
2
(x, y) et

2
f
xy
(x, y).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.26
{ Remarque : Pour retenir plus facilement la notation (ordre de drivation des
variables), penser que :

2
f
yx
=

y
(
f
x
) .
k Exemples :
f(x, y) = x

e
xy
:

2
f
x
2
(x, y) = (x+2) y e
xy
,

2
f
yx
(x, y) = x (xy+2) e
xy
,

2
f
y
2
(x, y) = x
3
e
xy
et

2
f
xy
(x, y) = (2x + x
2
y) e
xy
f(x, y) = x

y + x
2
+ 1 :

2
f
x
2
(x, y) = 2 ,

2
f
yx
(x, y) =
1
2

y
,

2
f
y
2
(x, y) =
-x
4y
3/2
et

2
f
xy
(x, y) =
1
2

y
f(x, y) = y lnx + x :

2
f
x
2
(x, y) = -
y
x
2
,

2
f
yx
(x, y) =
1
x
,

2
f
y
2
(x, y) = 0 et

2
f
xy
(x, y) =
1
x
Thorme 3.5.11 : Thorme de Schwarz (admis)
Si les drives partielles secondes croises

2
f
yx
et

2
f
xy
d'une fonction f de deux
variables existent au voisinage d'un point et sont continues en ce point, alors elles
sont gales en ce point.
b) Notion d'intgrale double sur R
2
Soit f une fonction positive de R
2
dans R.
Dans le cadre de ce cours, on suppose f suffisamment rgulire pour que l'on puisse
envisager de calculer les intgrales successives ci-dessous. On vrifiera sur les
exemples traits que cette condition de rgularit est bien ralise.
Pour tout y fix, si la fonction x f(x, y) est continue sauf peut-tre en un nombre
fini de points, on peut calculer

-
+
f(x, y) dx : le rsultat est soit un rel positif (y), soit
+ (dans le cas o l'intgrale diverge). Si l'ensemble des rels y tels que (y) est non
dfinie (parce que (y) = + ) ou non continue en y est un sous-ensemble de R
vide ou fini, on peut envisager de calculer

-
+
(y) dy.
Ce rsultat de deux intgrales simples successives est soit un rel positif, soit +, et
on le note

-
+
[

-
+
f(x, y) dx ] dy.
Symtriquement, on calcule

-
+
[

-
+
f(x, y) dy ] dx.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.27
k Exemples :
Si cest possible, calculer

-
+
[

-
+
f(x, y) dx ] dy et

-
+
[

-
+
f(x, y) dy ] dx dans les cas
suivants :
f(x, y) =
_
_
_
2x+ysi0x1et0y1
0sinon
f(x, y) =
1
x
2
+y
2
+1
f(x, y) =
_
_
_
_
_
e
-x
2
y
six>1ety>0
0sinon
Thorme et dfinition 3.5.12 : Thorme de Fubini-Tonelli (admis)
Soit f une fonction positive de R
2
dans R, suffisamment rgulire pour que l'on
puisse envisager de calculer les intgrales successives dont on a parl (cette condition
sera vrifie au cas par cas sur les exemples traits).
Alors :

-
+
[

-
+
f(x, y) dx ] dy =

-
+
[

-
+
f(x, y) dy ] dx
L'galit est vraie que le rsultat soit fini ou non.
On pose alors :

R
2
f(x, y) dx dy = la valeur commune des deux intgrales.
Si

R
2
f(x, y) dx dy < +, la fonction f est dite intgrable surR
2
.
Interprtation gomtrique : en repre orthonorm,

R
2
f(x, y) dx dy est le volume
(fini ou infini) compris entre le plan horizontal xOy et le graphe de f (ici f 0, donc
son graphe est au-dessus du plan xOy).
Le thorme de Fubini-Tonelli permet, en utilisant les intgrations successives, de
connatre la nature de l'intgrale double, et sa valeur si elle est convergente.
k Exercice : Sur les exemples ci-dessus, dire si la fonction f est intgrable sur R
2
et
dans l'affirmative, prciser la valeur de l'intgrale double.
Thorme 3.5.13 : Thorme de comparaison des intgrales de fonctions positives :
Soient f et g deux fonctions "suffisamment rgulires" de R
2
dans R, telles que :
0 f g
Si g est intgrable sur R
2
, il en est de mme pour f, et on a :

R
2
f(x, y) dx dy

R
2
g(x, y) dx dy
Si f n'est pas intgrable sur R
2
, g ne le sera pas non plus.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.28
Thorme et dfinition 3.5.14 : Thorme de Fubini
Soit une fonction f de R
2
dans R, telle que f soit intgrable sur R
2
(c'est--dire f
"suffisamment rgulire" et

R
2
f(x, y) dx dy < + )
Alors, les deux intgrales

-
+
[

-
+
f(x, y) dx ] dy et

-
+
[

-
+
f(x, y) dy ] dx
existent et sont gales.
On pose :

R
2
f(x, y) dx dy = la valeur commune des deux intgrales.
ide de la dm :
Mme principe que ce qui a t fait pour les sries doubles
On dfinit les fonctions g et h sur R
2
par g =
f

+f

2
et h =
f

-f

2
On a : f = g - h ; de plus 0 g f

et 0 h f

D'aprs le thorme 3.5.13, les deux fonctions g et h



sont intgrables sur R
2
.
On appelle J et K leurs intgrales respectives.
On montre alors que

-
+
[

-
+
f(x, y) dx ] dy = J - K, et de mme pour

-
+
[

-
+
f(x, y) dy ] dx.
Ce thorme permet de calculer l'intgrale double par deux intgrations successives
une fois qu'on s'est assur qu'elle est absolument convergente l'aide du thorme
prcdent.
{ Remarque 1 :
Dans le cas particulier o f s'crit f(x, y) = g(x) h(y) (f est dite variables sparables),
f est intgrable sur R
2
si et seulement si les deux fonctions g et h le sont sur R, et
on a :

R
2

f(x, y) dx dy = [

-
+
g(x) dx ] [

-
+
h(y) dy]
{ Remarque 2 :
Le calcul de

R
2
f(x, y) dx dy peut se faire en thorie indiffremment en calculant

-
+
[

-
+
f(x, y) dx ] dy ou

-
+
[

-
+
f(x, y) dy ] dx.
Mais dans la pratique, il se peut que l'un des deux calculs soit plus facile que l'autre,
ou mme que le calcul explicite ne soit faisable que dans un sens (dernier exemple de
la p.27).
Proprits 3.5.15 : (gnralisation des proprits vues pour l'intgrale simple)
Si f et g sont des fonctions de deux variables intgrables sur R
2
, pour tous rels et
j, la fonction f + j g est intgrable sur R
2
, et on a :

R
2
( f + j g)(x, y) dx dy =

R
2
f(x, y) dx dy + j

R
2
g(x, y) dx dy
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.29
Autrement dit : L'ensemble des fonctions de deux variables intgrables sur R
2
est un
espace vectoriel, et l'application qui une fonction de cet espace associe son intgrale
est une forme linaire.
Si f intgrable est positive,

R
2
f(x, y) dx dy 0.
Si f et g sont intgrables, et si f g ,

R
2
f(x, y) dx dy

R
2
g(x, y) dx dy .
Lintgrale sur R
2
est une forme linaire croissante.
Si f est intgrable,

R
2
f(x, y) dx dy

R
2
f(x, y) dx dy
c) Intgrale double sur un domaine D
Soit f une fonction dfinie sur une partie D
f
de R
2
et D une partie de R
2
incluse dans
D
f
. On note f
D
la fonction de R
2
dans R dfinie par :
f
D
(x, y) =
_
_
_f(x,y)si(x,y)D
0sinon
On suppose que f
D
satisfait aux hypothses de rgularit vues plus haut (dans les
exemples que l'on traitera, D est une partie de dont la frontire est une courbe de
classe C
1
par morceaux, et f est continue sur D).
Dfinition et notation 3.5.16 :
Si la fonction f
D
est intgrable,

R
2
f
D
(x, y) dx dy est appele intgrale de f sur D.
On la note

f(x, y) dx dy .
{ Remarque : Par abus de notation, on crira f
D
(x, y) = f(x, y) 1
D
(x, y) (cest un abus
de notation car f nest pas forcment dfinie sur R
2
tout entier).
On a donc :

f(x, y) dx dy =

-
+

-
+
f(x, y) 1
D
(x, y) dx dy ,
de mme quen dimension 1 on peut crire (avec le mme abus de notation) :

a
b
f(x) dx =

-
+
f(x) 1
[a, b]
(x) dx
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.32
d) Ensemble ngligeable de R
2
- Fonctions gales presque partout
Dfinitions 3.5.18 :
Une partie D de R
2
est ngligeable si sa fonction indicatrice 1
D
est intgrable
d'intgrale nulle.
Dans le cadre de ce cours, les parties ngligeables de R
2
que nous considrerons
seront uniquement du type suivant :
- ensemble fini ou dnombrable de points ;
- courbes de classe C
1
par morceaux.
Deux fonctions f et g de R
2
dans R sont gales presque partout si elles concident
sauf sur un ensemble ngligeable.
e) Changement de variable
Soient U et V deux ouverts de R
2
, et une application de U dans V.
: (x, y) (u, v)
_
_
_u=(x,y)
v=(x,y)
Dfinitions et proprit 3.5.19 :
est continment diffrentiable sur U si les fonctions et admettent en tout
point de U des drives partielles premires continues.
est un C
1
-diffomorphisme de U sur V si :
_
_
_
_
_
_
_
estcontinmentdiffrentiablesurU
estbijectivedeUsurV

estcontinmentdiffrentiablesurV
On appelle matrice jacobienne de :
_
[
[
[


_
_
_
_

x
(x,y)

y
(x,y)

x
(x,y)

y
(x,y)
Le jacobien de est le dterminant de la matrice jacobienne. On le note J

(x, y).
k Exemple : Si est une application linaire bijective de R
2
dans lui-mme, c'est un
C
1
-diffomorphisme. Il existe une matrice A inversible telle que :
_
[
[


_
_
_
u
v
= A
_
[
[


_
_
_
x
y
Dans ce cas, la matrice jacobienne est gale A (elle ne dpend pas de (x, y)) , et le
jacobien = dt (A).
Thorme 3.5.20 : Formule du changement de variable (admise)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.33
Soit un C
1
-diffomorphisme d'un ouvert U sur un ouvert V de R
2
, et D un sous-
ensemble de U dont la frontire est une courbe de classe C
1
par morceaux.
Soit k une fonction continue sur (D).
Si l'une des deux intgrales ci-dessous existe, l'autre existe aussi et elles sont gales :

]D)
k(u,v)dudv=

k[(x,y)]J

(x,y)dxdy
( k [ (x, y) ] s'crit aussi k [ (x, y), (x, y) ] )
{ Remarque : On admettra que le thorme reste valable si est dfini sur D priv
ventuellement dun ngligeable de R
2
.
Rappel de la formule de changement de variable en dimension 1 :
Soit une bijection de classe C
1
dfinie sur le segment [a, b], et soit k une fonction
continue sur le segment ([a, b]). On pose = (a) et = (b). On a :

k(u)du=

a
b
k[(x)](x)dx
A retenir : De mme quen dimension 1, on remplace u par (x) dans l'expression de
la fonction k et formellement du par (x)dx , en dimension 2, pour passer des
variables (u, v) aux variables (x, y), on remplace u et v par leur expression en
fonction de x et y dans la fonction intgrer et on remplace formellement dudv
par J

(x,y)dxdy.
Il ne faut surtout pas oublier de modifier le domaine sur lequel on intgre, de mme
qu'en dimension 1, lorsqu'on fait un changement de variable il faut modifier les
bornes de l'intgrale.
Le but du changement de variable est de transformer une intgrale double
complique en une plus simple calculer ; il arrive frquemment que par un
changement de variable bien choisi, on se ramne une fonction variables
sparables intgrer sur un pav.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.34
k Exemple : Coordonnes polaires
est l'application de R
+
x [ 0, 2 ]

dans R
2
dfinie par : (u, v) = (, ) avec
_
_
_u=cos
v=sin
On a J

(, ) = d'o :

]D)

k(u,v)dudv=

k(cos,sin)dd
A retenir : Lorsque le changement de variable consiste passer des coordonnes
cartsiennes (u, v) aux coordonnes polaires (, ), on remplace u par cos, v par
sin, et dudv par dd .
On doit penser passer aux polaires lorsque le domaine sur lequel on intgre scrit
simplement laide des coordonnes polaires
(exemples : D = (u > 0, v > 0) ; D = un disque de centre O, etc )
k Application : Montrer que

-
+
e
- u
2
/2
du =

2 .
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.35
Chapitre 4 : Lois conditionnelles
Variables alatoires indpendantes
1 - Lois conditionnelles dun couple discret
Esprances conditionnelles
Soit (X, Y) un couple discret de loi {(x
i
, y
j
) , p
ij
/ i I, j J} (notations du chapitre 3 )
a) Loi conditionnelle de X sachant (Y = y)
Dfinition 4.1.1 : Fixons j tel que p
.

j
= P(Y = y
j
) 0.
On a i I P(X = x
i
/Y = y
j
) =
P(X=x
i
,Y=y
j
)
P(Y=y
j
)
=
p
ij
p
.

j
La donne de {(x
i
,
p
ij
p
.

j
)/iI} dfinit la loi conditionnelle de X sachant que Y = y
j
On a bien : i I
p
ij
p
.

j
0 et

iI


p
ij
p
.

j
= 1
On peut dfinir symtriquement la loi conditionnelle de Y sachant que X = x
i
.
b) Esprance conditionnelle de X sachant B (B vnement)
Dfinition et proposition 4.1.2 :
Soit B un vnement de probabilit non nulle.
On appelle esprance conditionnelle de X sachant B, et on note E(X/B) le rel (s'il
existe) dfini par: E(X/B)=

iI

x
i
P(X=x
i
/B)
E(X/B) est lesprance de la v.a. discrte X calcule par rapport la probabilit
conditionnelle P(. /B) (et non pas par rapport la probabilit initiale P).
Pour que E(X/B) existe, il suffit que E(X) existe.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.36
k Exemple : Si X = 1
A
]A A) alors E(1
A
/B) = P(A/B)
En particulier si B = (Y = y) (sous rserve que P(Y = y) > 0)
E(X/Y=y)=

iI

x
i
P(X=x
i
/Y=y)
E(X/Y = y) est l'esprance de la v.a. X calcule par rapport la loi conditionnelle de X
sachant Y = y

.
c) Esprance conditionnelle de X sachant Y (Y variable alatoire)
Supposons que E(X/Y = y) existe pour tout y de Y() (cette condition sera en
particulier ralise si E(X) existe et si P(Y = y) > 0 pour tout y de Y()). On dfinit
ainsi sur Y() une fonction valeurs dans R, que l'on note h :
y h(y) = E(X/Y= y)
Dfinition 4.1.3 :
On appelle esprance conditionnelle de X sachant Y et on note E(X/Y) la variable
alatoire h(Y)
on peut aussi crire : h(Y)=E(X/Y)=

jJ

E(X/Y=y
j
)1
(Y=y
j
)

En effet : pour tout de , il existe un unique y


j
tel que Y() = y
j
.
Si P(Y = y
j
) 0, on pose E(X/Y)() = E(X/Y= y
j
)
k Exemple :
Si X = 1
A
et Y = 1
B
]A A, B A) avec 0 < P(B) < 1 :
E(1
A
/1
B
) () =
_
_
_
P(A/B)siB
P(A/B
c
)siB
{ Remarque : La variable alatoire h(Y) peut n'tre dfinie que presque srement
(c'est--dire dfinie sauf peut-tre sur un ngligeable de j.
En effet, pour tel que Y() = y
j
avec P(Y = y
j
) = 0, on ne peut calculer E(X/Y)(),
mais P(Y = y
j
) = 0 signifie justement que lvnement (Y = y
j
) est ngligeable, de plus
une runion finie ou dnombrable de ngligeables est ngligeable (au cas o on
aurait P(Y = y
j
) = 0 pour plusieurs indices j).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.37
A retenir : Comment calculer concrtement lesprance conditionnelle E(X/Y) ?
1 - On part de la loi conjointe du couple (X, Y), on calcule la loi marginale de Y, puis
pour tout y tel que P(Y = y) 0, on dtermine la loi conditionnelle de X sachant que
Y = y.
2 - On calcule alors E(X/Y = y), esprance de la v.a. X par rapport la probabilit
conditionnelle P(. /Y = y). On obtient une expression dpendant de y.
3 - Dans cette expression, on remplace y (rel) par Y (variable alatoire).
{ Remarque :
Les tapes 1 et 2 demandent en gnral des calculs, alors que l'tape 3 s'crit en une
ligne.
Mais l'tape 2 peut quelquefois aussi tre trs rapide : si la loi conditionnelle de X
sachant Y = y est une loi classique, les rsultats du cours sur l'esprance donnent
alors directement la valeur de l'esprance conditionnelle.
k Exemples :
Si elle existe, calculer E(X/Y) dans les deux cas suivants :
la loi conjointe du couple (X, Y) est donne par :
_
_
_
_
_
_
_
X()=Y()=N
iNjNP(X=i,Y=j)=
1
2e
2

i+j
i!j!
la loi conjointe du couple (X, Y) est donne par :
_
_
_
_
_
_
_
X()=Y()=N*
iN*jN*P(X=i,Y=j)=
2(j-1)
(j+1)j
i+1

Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.38
2 - Lois conditionnelles dun couple continu
Esprances conditionnelles
Soit (X, Y) un couple continu de densit conjointe f.
On note f
X
et f
Y
les densits marginales de X et de Y.
a) Densit conditionnelle de X sachant Y = y
Dfinition 4.2.1 : Pour tout rel y tel que 0 < f
Y
(y) <+, on appelle densit
conditionnelle de X sachant que Y = y la fonction de la variable x paramtre par y,
note f
X/Y=y
: xf
X/Y=y
(x)=
f(x,y)
f
Y
(y)

Cette fonction f
X/Y=y
est bien une fonction de densit : elle est dfinie, positive,
continue par morceaux ( vrifier sur les exemples), et

-
+
f
X/Y=y
(x) dx = 1.
{ Remarque : La fonction f
X/Y=y
nexiste pas pour toutes les valeurs de y. Mais,
lorsquelle existe pour un y fix, elle est comme toutes les fonctions de densit
dfinie sur R tout entier (si elle est ventuellement nulle sur une partie de R, ne pas
oublier de le prciser).
Interprtation : Supposons pour simplifier f et f
Y
dfinies et continues sur R
2
et R
respectivement. Soit [ a, b] un intervalle de R et h > 0 :
P (X [a, b]

/ Y [ y, y+h] ) =
P(X[a,b]

,Y[y,y+h])
P(Y[y,y+h])
=

y
y+h

a
b
f(x,t)dxdt

y
y+h
f
Y
(t)dt
En passant la limite quand h tend vers 0, on trouve :

a
b
f(x,y)dx
f
Y
(y)
=

a
b
f
X/Y=y
(x) dx
ce qui justifie la terminologie.
On crit quelquefois : P (X [a, b]

/Y = y ) =

a
b
f
X/Y=y
(x) dx
mais c'est une notation formelle car on ne peut ici dfinir directement la probabilit
conditionnelle P(X [a, b]

/Y = y ) puisque P(Y = y) = 0.
On peut dfinir symtriquement la densit conditionnelle de Y sachant X = x.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.39
k Exemple :
Soit un couple (X, Y) dont la densit conjointe est :
f(x, y) = 6 x 1
D
(x, y) avec D = { (x, y) R
2
/ x 0, y 0, x + y 1}
Calculer la densit conditionnelle de X sachant que Y = y, en prcisant pour quelles
valeurs de y elle existe.
b) Esprance conditionnelle de X sachant Y = y
Dfinition et proposition 4.2.2 :
Pour tout rel y tel que 0 < f
Y
(y) <+, on appelle esprance conditionnelle de X
sachant Y= y le rel (s'il existe) : E(X/Y=y)=

-
+
xf
X/Y=y
(x)dx
C'est l'esprance d'une v.a. continue ayant pour densit la fonction f
X/Y=y
.
Pour que E(X/Y = y) existe, il suffit que E(X) existe. (admis)
c) Esprance conditionnelle de X sachant Y
Supposons que E(X/Y = y) existe pour tout y tel que f
Y
(y) 0 (cette condition sera
en particulier ralise si E(X) existe)
Dfinition 4.2.3 :
On appelle esprance conditionnelle de X sachant Y et on note E(X/Y) la variable
alatoire h(Y) o h est la fonction dfinie par :
h(y) = E(X/Y = y) =

-
+
x f
X/Y=y
(x) dx
Dans tous les cas que nous rencontrerons, h(y) est dfini sauf peut-tre en un
nombre fini de points y
1
y
n
, mais comme P(Y = y
i
) = 0, l'ensemble :
{ / h(Y()) n'est pas dfini} est un ensemble de probabilit nulle.
La variable alatoire h(Y) est donc dfinie presque srement.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.40
A retenir : Comment calculer concrtement lesprance conditionnelle E(X/Y) ?
La dmarche est la mme que pour les couples discrets :
1- On part de la densit conjointe du couple (X, Y), on calcule la densit marginale f
Y
de Y, puis pour tout y tel que 0 < f
Y
(y) < + , on dtermine f
X/Y=y
, densit
conditionnelle de X sachant Y = y.
2- On calcule alors E(X/Y= y), esprance d'une v.a. continue ayant pour densit la
fonction f
X/Y=y
. On obtient une expression dpendant de y.
3- Dans cette expression, on remplace y (rel) par Y (variable alatoire).
k Exemples :
Si elle existe, calculer E(X/Y) dans les cas suivants :
une densit conjointe du couple (X, Y) est :
(x, y) f(x, y) = 6 x 1
D
(x, y) avec D = { (x, y) R
2
/ x 0, y 0, x + y 1}
Y suit la loi continue uniforme sur [0, 1] et une densit conditionnelle de X sachant
Y = y est : x f
X/Y=y
(x) = y 1
[0, 1/y]
(x)
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.41
3 - Proprits de lesprance conditionnelle
Proposition 4.3.1 : Proprits du rel E(X/Y = y)
Si X = a (constante), E(X/Y=y)=a
R j R E(X
1
+jX
2
/Y=y)=E(X
1
/Y=y)+jE(X
2
/Y=y)
(linarit)
X0E(X/Y=y)0 et X
1
X
2
E(X
1
/Y=y)E(X
2
/Y=y)
(croissance)
Remarque : Ces proprits sont identiques (et pour cause !) celles de l'esprance
ordinaire vue au chapitre 2.
Proposition 4.3.2 : Proprits de la v.a. E(X/Y)
Si X = a (constante), E(X/Y)=a
R j R E(X
1
+jX
2
/Y)=E(X
1
/Y)+jE(X
2
/Y)
X0E(X/Y)0 et X
1
X
2
E(X
1
/Y)E(X
2
/Y)
(lesprance conditionnelle est une application linaire croissante)
Thorme 4.3.3 : (en partie admis)
Si X a une esprance, la v.a. E(X/Y) a aussi une esprance, et on a :
E(X)=E[E(X/Y)] (galit de deux rels)
Autrement dit : les variables alatoires X et E(X/Y) ont mme moyenne.
Pour toute fonction de R

dans R telle que (Y) est une variable alatoire et telle
que X (Y) a une esprance :
E[X(Y)/Y]=(Y)E(X/Y) (galit de deux variables alatoires)
En particulier : E[(Y)/Y]=(Y)
Autrement dit : si X est une variable alatoire fonction de Y, E(X/Y) = X.
Ce thorme important permet de simplifier considrablement certains calculs : il est
quelquefois plus rapide de calculer E[ E(X/Y) ] que E(X).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.42
k Exemple discret :
Soient n urnes numrotes de 1 n. Pour i = 1, , n, l'urne ni contient i boules
numrotes de 1 i. On choisit au hasard une urne, puis dans cette urne on tire au
hasard une boule.
On note X le numro de l'urne choisie, et Y celui de la boule tire.
1 - Donner la loi de X et son esprance.
2 - Calculer E(Y/X), puis en dduire E(Y) par le thorme ci-dessus.
3 - Calculer directement E(Y) partir de la loi de Y. Comparer les deux mthodes.
k Exemple continu :
Soit (X, Y) un couple tel que :
- X suit la loi exponentielle de paramtre ;
- la loi conditionnelle de Y sachant X = x est la loi U([0, x]).
Calculer E(Y).
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.43
4 - Couple de v.a. indpendantes
a) Cas discret
Dfinition 4.4.1 :
Soit (X, Y) un couple alatoire discret, tels que X() = { x
i
/ i I } et Y() = { y
j
/ j J }
Les variables X et Y sont indpendantes si :
iIjJP(X=x
i
,Y=y
j
)=P(X=x
i
)P(Y=y
j
)
ou encore : iIjJp
ij
=p
i.
p
.

j
k Exemple 1 :
Soient A et B deux vnements. Les variables alatoires 1
A
et 1
B
sont indpendantes
si et seulement si les vnements A et B sont indpendants (dfinition 1.4.1 du ch1).
k Exemple 2 :
Une urne contient a boules noires et b boules blanches (a et b entiers non nuls). On
tire 2 fois une boule, et pour i = 1, 2, on note X
i
la variable de Bernoulli qui vaut 1 si
la boule tire au i
me
tirage est blanche, et 0 sinon.
X
1
et X
2
sont indpendantes si le tirage se fait avec remise.
X
1
et X
2
ne sont pas indpendantes si le tirage se fait sans remise.
{ Remarque : Pour vrifier l'indpendance de deux v.a. dont on connat la loi
conjointe, il n'est pas indispensable de calculer leurs lois marginales. Il suffit de
regarder si l'expression donnant P(X = x
i
, Y = y
j
) peut s'crire comme le produit
d'une fonction de x
i
par une fonction de y
j
.
k Exemple :
Soit un couple (X, Y) tel que X() = Y() = N.
Etudier l'indpendance de X et Y lorsque la loi du couple est donne par :
i N j N P(X = i, Y = j) =
1
e
2

1
i!j!
i N j N P(X = i, Y = j) =
1
2e
2

i+j
i!j!
b) Cas continu
Dfinition 4.4.2 :
Si (X, Y) est un couple continu de densit f : les variables X et Y sont indpendantes si
(x,y)R
2
f(x,y)=f
X
(x)f
Y
(y) (presque partout)
On dit que la densit du couple est le produit tensoriel des densits de X et Y.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.44
k Exemples : Dans le cas dun couple continu, si la densit f(x, y) peut scrire comme
le produit dune fonction de x par une fonction de y, alors X et Y sont indpendantes.
Mais :
attention la normalisation :
si f(x, y) =
x

y
1
[0, 1]
(x) 1
]0, 1[
(y), X et Y sont bien indpendantes, mais il ne faut pas se
prcipiter pour conclure que f
X
(x) = x 1
[0, 1]
(x) et f
Y
(y) =
1

y
1
]0, 1[
(y).
En fait f
X
(x) = 2x 1
[0, 1]
(x) et f
Y
(y) =
1
2

y
1
]0, 1[
(y)
attention aux fonctions indicatrices :
si f(x, y) = 6 x 1
D
(x, y) avec D = { (x, y) R
2
/ x 0, y 0, x + y 1}, X et Y ne sont
pas indpendantes parce que 1
D
(x, y) ne peut pas scrire comme le produit dune
indicatrice en x par une indicatrice en y (D nest pas un pav).
c) Loi d'un couple de v.a. indpendantes
Proposition 4.4.3 :
Si les variables X et Y sont indpendantes, la donne des lois de X et de Y suffit pour
connatre la loi du couple.
On dit que la loi du couple est le produit tensoriel des lois marginales.
Proposition 4.4.4 : Soient deux variables X et Y indpendantes.
Soient deux couples rels (a, b) et (c, d) tels que a b et c d (avec ventuellement a
ou c = -, b ou d= +)
Alors : P(aXb,cYd)=P(aXb)P(cYd)
On a des relations analogues en changeant certaines ingalits larges en ingalits
strictes (attention ! faire ce changement de manire symtrique dans lgalit, cest
important si les v.a. sont discrtes)
En particulier : Si (a, b) = ]-, x] et (c, d) = ]-, y] la relation ci-dessus s'crit :
xRyRF
(X,Y)
(x,y)=F
X
(x)F
Y
(y)
La fonction de rpartition du couple est le produit tensoriel des fonctions de
rpartition de X et Y.
{ Remar que : Cette proprit est en fait quivalente la dfinition de
lindpendance. Elle permet de gnraliser la notion dindpendance lorsquon a un
couple (X, Y) dont lune des composantes est discrte et lautre continue.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.45
d) Lois conditionnelles et indpendance
Proposition 4.4.5 :
Soit (X, Y) un couple alatoire. Les conditions suivantes sont quivalentes :
i) Les variables X et Y sont indpendantes.
ii) La loi conditionnelle de X sachant Y = y

est la loi de X, pour tout y tel que cette loi
conditionnelle est dfinie
iii) La loi conditionnelle de Y sachant X = x

est la loi de Y, pour tout x tel que cette loi
conditionnelle est dfinie.
Thorme 4.4.6 :
Si X et Y sont indpendantes, et si X a une esprance,
E(X/Y)=E(X)
Dans ce cas, la variable alatoire E(X/Y) est quasi-certaine.
Le terme quasi-certaine (et non pas certaine) vient de la remarque faite plus haut que
lesprance conditionnelle n'est peut-tre dfinie que presque srement.
e) Fonctions de v.a. indpendantes
Thorme 4.4.7 :
Soit (X, Y) un couple de v.a. indpendantes.
Pour toutes fonctions et telles que les esprances ci-dessous existent, on a :
E[(X)(Y)]=E[(X)]E[(Y)]
Corollaire 4.4.8 :
Soient X et Y indpendantes et admettant une variance. Alors : cov(X,Y)=0
Deux v.a. indpendantes sont non corrles (d'o la justification a posteriori de la
dernire assertion de la proposition 3.4.5) .
La rciproque est fausse en gnral.
k Exemple :
Soit X une v.a. suivant une loi uniforme sur {-1, 0, 1}. On pose Y = X
2
. Montrer que X
et Y sont non corrles mais qu'elles ne sont pas indpendantes.
Thorme 4.4.9 : (admis)
Soient X et Y des v.a. indpendantes, et soient et des fonctions telles que (X) et
(Y) soient des variables alatoires.
Alors (X) et (Y) sont indpendantes.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.46
5 - Indpendance mutuelle
Les dfinitions et proprits vues au paragraphe prcdent se gnralisent au cas
d'une famille finie ou dnombrable de variables alatoires.
a) Indpendance mutuelle
Dfinitions 4.5.1 :
famille finie de v.a. :
Les n variables alatoires discrtes X
1
, , X
n
sont dites mutuellement indpendantes
si
(x
1
,,x
n
)X
1
()xxX
n
()P(X
1
=x
1
,,X
n
=x
n
)=

i=1
n
P(X
i
=x
i
)
Les n variables alatoires cont i nues X
1
, , X
n
sont dites mutuel l ement
indpendantes si la densit f du vecteur (X
1
, , X
n
) vrifie :
(x
1
,,x
n
)R
n
f(x
1
,x
2
,,x
n
)=f
X
1
(x
1
)f
X
n
(x
n
) (au moins presque partout)
(pour tout i, f
X
i
est la densit marginale de X
i
)
suite de v.a. :
Les variables alatoires d'une suite (X
n
)
n1
sont dites mutuellement indpendantes si
pour tout entier n fix 2, les v.a. X
1
, , X
n
le sont.
k Exemple 1 :
Si les (A
i
)
1in

sont des vnements, et (1
A
i
)
1in

leurs fonctions indicatrices, dire
que les v.a. (1
A
i
) sont mutuellement indpendantes revient dire que les (A
i
)

sont
des vnements mutuellement indpendants (dfinition 1.4.4 du chapitre 1).
k Exemple 2 :
Dans une urne contenant a boules noires et b boules blanches (a et b entiers non
nuls), on tire une infinit de fois une boule avec remise, et on note X
i
la variable de
Bernoulli qui vaut 1 si la boule tire au ime tirage est blanche, et 0 sinon.
La suite (X
n
)
n1
est une suite de v.a. indpendantes.
Proposition 4.5.2 :
Si les (X
i
)

forment une famille de v.a. mutuellement indpendantes, il en est de
mme pour toute sous-famille.
L'indpendance mutuelle d'une famille (finie ou dnombrable) de variables alatoires
entrane donc en particulier l'indpendance deux deux de ces variables. La
rciproque est fausse.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.47
Proposition 4.5.3 : Gnralisation de la Proposition 4.4.4 :
Si les variables X
1
, , X
n
sont mutuellement indpendantes , alors :
Pour tous intervalles (a
i
, b
i
) de R :
P[X
1
(a
i
,b
i
),,X
n
(a
i
,b
i
)]=

i=1
n
P[X
i

(a
i
,b
i
)]
b) Fonctions de v.a. indpendantes
Thorme 4.5.4 : Gnralisation du Thorme 4.4.6 : (admis)
Soient X
1
, , X
n
des variables alatoires mutuellement indpendantes.
Soient
1
, ,
n
des fonctions telles que Y
1
=
1
(X
1
), Y
2
=
2
(X
2
), et Y
n
=
n
(X
n
)
sont des variables alatoires.
Les variables alatoires Y
1
, Y
2
, ,Y
n
sont mutuellement indpendantes.
Plus gnralement, soient
1
, ,
m
des fonctions telles que :
Y
1
=
1
(X
1
, X
2
, , X
k
1
), Y
2
=
2
(X
k
1
+1
, , X
k
2
), et Y
m
=
m
(X
k
m-1
+1
, , X
n
) sont
des variables alatoires (1 k
1
< k
2
< < k
m-1
< n).
Les variables alatoires Y
1
, Y
2
, ,Y
m
sont mutuellement indpendantes.
{ Remarque : L'ordre de numrotation des v.a. X
i
n'a pas d'importance. On est sr
de l'indpendance des Y
j
si pour tout i, la variable X
i
apparait au maximum une fois
dans la dfinition des Y
j
.
k Exemple 1 : Si X, Y, Z, T, U sont mutuellement indpendantes, alors :
- X
2
, Y
2
, e
Z
et T
3
sont indpendantes,
- de mme : max(X, Y, T) et Z
2
,
- de mme : XY, Z + T et U.
k Exemple 2 : Si (X
n
)
n1
est une suite indpendante de v.a., pour tout entier n 2 les
v.a. X
1
+ + X
n-1
et X
n
sont indpendantes.
k Exercice :
Soit (X
n
)
n1
une suite indpendante de variables de Bernoulli de mme paramtre p
(0 < p < 1).
Pour tout n 1, on pose Y
n
= X
2n-1
X
2n
, et Z
n
= X
n
X
n+1
. Etudier l'indpendance de la
suite (Y
n
)
n1
, puis celle de la suite (Z
n
)
n1
.
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.48
6 - Somme de v.a. indpendantes - Lois stables
a) Somme de v.a. indpendantes valeurs entires
On se limite ici au cas particulier des v.a. discrtes valeurs dans N, ce qui recouvre
toutes les lois discrtes usuelles.
Thorme et dfinition 4.6.1 :
Soit (X, Y) un couple de v.a. discrtes indpendantes valeurs dans N.
Alors la v.a. S = X + Y est valeurs dans N, et on a :
kNP(S=k)=

i=0
k
P(X=i)P(Y=k-i)=

j=0
k
P(X=k-j)P(Y=j)
Si on pose P(X = i) = p
i
, P(Y = j) = q
j
et P(Z = k) = r
k
, lgalit ci-dessus scrit :
kNr
k
=

i=0
k
p
i
q
k-i

On dit que la suite (r


n
) est le produit de convolution des suites (p
n
) et (q
n
).
Corollaire 4.6.2 :
Somme de deux variables binmiales indpendantes
_
_
_
_
_
_
_
X~B(n,p)
Y~B(m,p)
XetYindpendantes
X + Y ~ B(n+m, p)
Somme de deux variables de Poisson indpendantes
_
_
_
_
_
_
_
X~P()
Y~P(j)
XetYindpendantes
X + Y ~ P( + j)
On dit que, sous lhypothse dindpendance, les lois binmiales (respectivement de
Poisson) sont stables pour la somme.
Par rcurrence, cette proprit de stabilit se gnralise des sommes finies :
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.49
Thorme 4.6.3 : Gnralisation n variables
Somme de variables binmiales indpendantes
_
_
_
_
_
i[[1,n]]X
i
~B(n
i
,p)
(X
i
)
1in
mutuellementindpendantes

i=1
n
X
i
~ B(

i=1
n
n
i
, p)
Somme de n variables de Bernoulli indpendantes de mme paramtre p
_
_
_
_
_
i[[1,n]]X
i
~B(1,p)
(X
i
)
1in
mutuellementindpendantes

i=1
n
X
i
~ B(n, p)
Somme de variables de Poisson indpendantes
_
_
_
_
_
i[[1,n]]X
i
~P(
i
)
(X
i
)
1in
mutuellementindpendantes

i=1
n
X
i
~ P(

i=1
n

i
)
b) Densit dune somme de v.a. indpendantes continues
Thorme et dfinition 4.6.4:
Soit (X, Y) un couple de v.a. indpendantes de densits respectives f et g.
Alors la somme S = X + Y a une densit h dfinie par :
h(s)=

-
+
f(x)g(s-x)dx=

-
+
f(s-y)g(y)dy
La fonction h s'appelle produit de convolution des fonctions f et g.
* Attention ! dans le calcul du produit de convolution, ne pas oublier les indicatrices
qui peuvent figurer dans la dfinition des fonctions de densit f et g.
k Exemple :
Calculer la densit de la somme de deux variables alatoires indpendantes qui
suivent la mme loi uniforme sur l'intervalle [0, 1].
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.50
De mme que dans le cas discret, il existe des lois continues stables :
Corollaire 4.6.5 :
Somme de deux v.a. exponentielles indpendantes de mme paramtre :
_
_
_
_
_
_
_
X~E()
Y~E()
XetYindpendantes
X + Y ~ G(2,
1

)
Somme de deux lois Gamma indpendantes :
_
_
_
_
_
_
_
X~G(a,)
Y~G(b,)
XetYindpendantes
X + Y ~ G(a + b, )
Somme de deux v.a. gaussiennes indpendantes :
_
_
_
_
_
_
_
X~N(m,
2
)
Y~N(m,
2
)
XetYindpendantes
X + Y ~ N(m + m,
2
+
2
)
Sous lhypothse dindpendance, les lois Gamma (respectivement normales) sont
stables pour la somme.
Thorme 4.6.6 : Gnralisation n variables
Somme de n v.a. exponentielles indpendantes de mme paramtre :
_
_
_
_
_
i[[1,n]]X
i
~E()
(X
i
)
1in
mutuellementindpendantes

i=1
n
X
i
~ G(n,
1

)
Somme de lois Gamma indpendantes :
_
_
_
_
_
i[[1,n]]X
i
~G(a
i
,b)
(X
i
)
1in
mutuellementindpendantes

i=1
n
X
i
~ G(

i=1
n
a
i
, b)
Somme de v.a. gaussiennes indpendantes :
_
_
_
_
_
i[[1,n]]X
i
~N(m
i
,
i
2
)
(X
i
)
1in
mutuellementindpendantes

i=1
n
X
i
~ N(

i=1
n
m
i
,

i=1
n

i

2
)
Ces rsultats s'obtiennent de manire immdiate par rcurrence sur n partir du
thorme prcdent.
c) Utilisation de la fonction gnratrice des moments
Universit Paris Dauphine / DUMI2E 2me anne / Probabilits 2008-2009 : Cours A.M.B. 2me partie p.51
Les calculs de produits de convolution du corollaire 4.6.5 peuvent tre trs fastidieux
(lois Gamma - lois normales). Or le mme rsultat peut s'obtenir beaucoup plus
facilement en utilisant la fonction gnratrice des moments, dont on sait qu'elle
caractrise la loi d'une variable alatoire.
Thorme 4.6.7 : Fonction gnratrice d'une somme de v.a. indpendantes
Soient X et Y des v.a. indpendantes, admettant des fonctions gnratrices des
moments notes M
X
et M
Y
respectivement.
Alors la fonction gnratrice des moments de la somme X + Y existe, et elle est gale
au produit (ordinaire) des fonctions gnratrices de X et Y :
tD
M
X
D
M
Y
M
X+Y
(t)=M
X
(t)M
Y
(t)
k Exercice :
Retrouver en utilisant ce thorme la proprit de stabilit pour la somme des lois
suivantes sous l'hypothse d'indpendance :
- loi binmiale
- loi de Poisson
- loi Gamma
- loi normale

You might also like