Professional Documents
Culture Documents
M. BOUTAHAR
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
PLAN:
Chapitre 1: Simulation des lois de probabilits Chapitre 2: Estimation paramtrique Chapitre 3: Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
fonction densit (density) fonction de rpartition (probability) fonction quantile (quantile) gnrateur alatoire (random)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Distribution beta binomial Cauchy chi-squared exponential F (Fisher) gamma geometric hypergeometric log-normal logistic negative normal Poisson Student's t uniform Weibull
Nom sur R beta binom cauchy chisq exp f gamma geom hyper lnorm logis binomial norm pois t unif weibull
Arguments shape1, shape2, ncp size, prob location, scale df, ncp rate df1, df2, ncp shape, scale prob m, n, k meanlog, sdlog location, scale nbinom size, prob mean, sd lambda df, ncp min, max shape, scale
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
1. Loi de Bernoulli:
Denition 1 On dit que 0
X B (p), E = { , P (X = ) = p .
si 1
P (X =
, et
, not
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
2. Loi de Poisson
Denition 2 On dit que
positif.
P(),
si
PX k e
summary(Ni)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Min. 1.00
Median 5.00
Mean 4.93
Max. 12.00
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
3. Loi Uniforme
Denition 3 On dit que
X X U [a, b],
[ , ],
ab
si
not
f (x ) = b a 1 a b (x ) =
1
1 b a
0
x [a , b ]
[ , ]
(1)
sinon.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R x = runif(400) gnre une loi uniforme sur [0,1] summary(x)
1st Qu.
Median
Mean
3rd Qu.
0.2617
0.5306
0.5135
0.7578
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R x= runif(400) plot(x,type="l", col="blue", lwd=3) abline(h=0.5, col="red", lwd=3) hist(x,col="blue")
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
4. Loi Normale
Denition 4 On dit que variance
2,
not
X N (m , ) f (x ) = e
2
1
et de
, R
(2)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R x = rnorm(100,0,1) gnre une suite normale de moyenne 0 et de variance 1. summary(x)
1st Qu.
Median
Mean
3rd Qu.
-0.7267
-0.2680
-0.1827
0.5006
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R x= rnorm(400,0,1) plot(x,type="l", col="blue", lwd=3) abline(h=0, col="red", lwd=3) hist(x,col="blue")
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
5. Loi Exponentielle
Denition 5 On dit que not
X X E ()
> 0,
f (x ) =
si
0 (3)
sinon.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
1st Qu.
Median
Mean
3rd Qu.
0.290900 7.277000
0.701300
0.974800
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R x= rexp(400,1) plot(x,type="l", col="blue", lwd=3) abline(h=1, col="red", lwd=3) hist(x,col="blue")
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Estimation paramtrique
Supposons que l'on veut estimer suite
( i , 1 ).
i n
en se basant sur la
Denition 6 On appelle
= (
F X , ..., Xn) F
1
, o
Rn
dans
R.
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
espace
Denition 7
un chantillon de taille
, avec
On dnit la
loi empirique
1
de
par
Pn = n
o
n k =1
(4)
Xk .
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Denition 8
un chantillon de taille .
, et de loi empirique
Soit
forme
de la
=1
Soit
L'estimateur
est la v.a.r.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Q ({xk }) = qk = Fk (Q ) = Q ({xk }) = P (X = xk ). qk xk
r k =1
1 et on veut estimer
{ 1 , ..., r } E
1
tel que
qk = Fk (Pn) = n
n j =1
1{X =x } .
j k
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
empirique de
mk = Fk (Q ) = E (X k ) = x k dQ (x ), mk
1
est donn par 1
( , E) = (R, B)
et que
Xi
a son moment
mk = Fk (Pn) = n Xjk .
j =1
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
m m
2 1
2 1 de
1 et
1 sont respectivement
1
m = X n = n Xj
j =1
et
m m = n Xj (X n) = n (Xj X n) . j j
2 2 1
1
=1
=1
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Soit
X = (X , ..., Xn)
1
un chantillon de taille
de fonction de rpartition
Si Si
Q Q
La vraisemblance de
X n L(, X ) = f (Xi ).
est dnie par
F (x ). f (x ) = Q ( x ) = P (X = x ) f (x ) = F xx .
( )
i =1
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
L(, X ) =
n i =1
n
sup
i =1
f (Xi )
log (
f Xi )
= 0.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
1. Loi de Bernoulli :
un chantillon de taille
de paramtre inconnu
log(1
p))),
log
i =1
=1
=1
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
1. Loi de Gauss :
un chantillon de taille
sont inconnues.
L( m , , X ) = n
2
log ( , , ) 1 ( i ) = 0; = 2 i =1 n log (, 2 , ) 1 ( i )2 = 0; = 2 + 4 2 2 2 i =1
Lm X m L X n
2 2
M. BOUTAHAR
log
log 2
1 2 2
n i =1
( i
X m)
X m
X m
2
m = X n, = n (Xi X n) . i
1
=1
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Score
la quantit
S ()
log (, ) .
L X
(5)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Denition 10 On appelle
I ()
E (S () t S ()) L L E (, X ) (, X ) i j L(, X ) E .
log log
1i ,j d
log
i j
1i ,j d
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
1. Loi de Gauss :
un chantillon de taille
2 2
n i =1 ( i n 1 i =1 ( i 2 4
X m) X m)
6
2 log (, ) =
L X
(mX n ) 4
n 2 +
4
(mX n ) 4
n i =1 ( i
X m)
I ()
2 0
2 4
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Theorem 11
(Borne de Cramer-Rao) On suppose que: i. L(, X ) > P .p.s . ii. L(, X ) est presque srement direntiable sur et que le vecteur Score S () est centr et de carr intgrable pour P . iii. I () est inversible. Alors pour toute variable alatoire T de carr P -intgrable vriant E (L(, X )T ) = E ( L(, X )T ), on a var (T ) BCR = t ( E (T ))I ()( E (T )).
0
(6)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Corollaire 12
Si T est un estimateur sans biais de g () R et si g est direntiable, alors var (T ) BCR = t ( g ())I ()( g ()).
1
(7)
Denition 13 Si l'estimateur
sans biais de
g () R
atteint la borne de
ecace.
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
m:
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Xt , t =
1, ...,
Xt
Les
= 1 t ,1 + .... + p t ,p + t , = 1, ..., .
sont les variables explicatives et sont connues, est le vecteur des paramtres inconnus,
u t
(8)
= t (1 , ..., p ) t
Zt k
,
(H.1):
E (ut ) =
0,
,
STATISTIQUES AVEC LE LOGICIEL R
t n
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
(H.2): (
E ut us ) =
2
0
si si
t=s t=s
, 2
inconnue.
Z=(
1t n,1j p est une matrice de taille(n,p) connue, t p est un v.a. centr rduit, = (1 , ..., p ) R , et R+
,
sont inconnus.
Zt j )
X = Z + U , rang (Z ) = p.
M. BOUTAHAR STATISTIQUES AVEC LE LOGICIEL R
(9)
On suppose que
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
de
= arg min ||
X Z|| ,
2
= ( t ZZ)1 t Z
(10)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Theorem 14
(11)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Theorem 15
u N ( , In).
0
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Theorem 16
Corollary 17
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
H
o
: j = 0
rgion critique
2 jj
a t
1/2 (
n p)
(12)
Student
t (n p) (n p )
1
de la loi de
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
j p
2 jj
a t
1/2 (
n p)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Prvision
Zn
+1
t(
, prvoir la ralisation de
Xn = t Zn + un , E ( un ) = , E ( un ut ) = , t n .
+1 +1 +1 +1 +1
0 0 1
M. BOUTAHAR STATISTIQUES AVEC LE LOGICIEL R
(H.1), (H.2) et
Zn
+1,1 , ...,
Zn
Xn
+1
+1,p ) ?
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
un
+1 (perturbation alatoire),
est inconnu.
Prvision optimale
Xn
+1
= t n+1 . (1 )
est donn par
Xn
+1
1/2 (
n p)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
data(cars), plot(cars)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
distt =
+ 2
speedt + ut ,
Programme sur R t
<
Call:lm(formula = cars$dist ~cars$speed) Residuals: Min 1Q Median 3Q Max -29.069 -9.525 -2.272 9.215 43.201
M. BOUTAHAR STATISTIQUES AVEC LE LOGICIEL R
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Coecients: Estimate Std. Error t value Pr (> |t |) (Intercept) -17.5791 6.7584 -2.601 0.0123 * cars$speed 3.9324 0.4155 9.464 1.49e-12 *** Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: 15.38 on 48 degrees of freedom Multiple R-Squared: 0.6511, Adjusted R-squared: 0.6438 F-statistic: 89.57 on 1 and 48 DF, p-value: 1.490e-12
M. BOUTAHAR STATISTIQUES AVEC LE LOGICIEL R
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Residuals:
Les estimations
1 =-17.5791, 2 =3.9324.
value, une valeur plus petite que 0.01 nous conduit au rejet de H0 c'est dire que le paramtre est signicatif. Pour notre modle le paramtre
l'est.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
||u ||2 n p .
Lorsqu'il y'a une constante dans le modle de rgression multiple, on appelle coecient de dtermination le scalaire
R
o
X=n
1
n t =1
Xt
X X n X X n
2 2
et
vecteur
( , 1).
Plus
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Adjusted R-squared Ra =
:
(1
R )nnp
2 2
1 , o 1
p Ra
est le ne croit
F-statistic F=
On a sous
Ra R .
2
l'hypothse nulle
u:
: 1 = ... = p = 0;
rsidus sous
0 la statistique
H u:
0 et
H F (p, n p)
1.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R
t1 < lm(cars$dist ~cars$speed-1), summary(t1) Call: lm(formula = cars$dist ~cars$speed -1) Residuals: Min 1Q Median 3Q Max -26.183 -12.637 -5.455 4.590 50.181
M. BOUTAHAR STATISTIQUES AVEC LE LOGICIEL R
Coecients:
Estimation non-paramtrique
Le
Estimate Std. Error t value Pr (> |t |) cars$speed 2.9091 0.1414 20.58 < 2e-16 *** Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: 16.26 on 49 degrees of freedom Multiple R-Squared: 0.8963, Adjusted R-squared: 0.8942 F-statistic: 423.5 on 1 and 49 DF, p-value: < . e . R
2 2 16
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
<
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Exemple 2. Rgression multiple: On considre l'volution de l'ozone en fonction de la temprature, du vent et de la radiation solaire.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Programme sur R
-14.219
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
Coecients: Estimate (Intercept) -64.34208 air$Temp air$Wind *** air$Solar.R 0.05982 0.02319 2.580 1.65209 -3.33359 Std. Error 23.05472 0.25353 0.65441 t value -2.791 6.516 -5.094
Pr (>| t |)
0.00623 ** 2.42e-09 *** 1.52e-06
0.01124 *
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 21.18 on 107 degrees of freedom (42 observations deleted due to missingness) Multiple R-squared: 0.6059, Adjusted R-squared: 0.5948 F-statistic: 54.83 on 3 and 107 DF, p-value:
M. BOUTAHAR
< 2.2 16
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
n = (
taille
F X , ..., Xn)
1
est un estimateur de
. n
lorsque la
tends vers
+.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
est un estimateur
fortement consistant de
:
(13)
p .s n .
Denition 20 On dit que si
est un estimateur
faiblement consistant de
:
(14)
P n .
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
Theorem 21
Si n estun estimateurde , posons bn = E (n) , (i.e. le biais de n), vn = var(n); on suppose que i. bn ( c'est dire n est asymptotiquement sans biais), ii. vn . Alors n est un estimateur consistant de .
0 0
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
On suppose que
( i)
N( ,
5 1)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
lorsque
mn()
et
n () > 0
n n () L n ()
on dit que
N( ,
0 1);
(15)
n est asymptotiquement normal. limn n () est l'esprance asymptotique de n , 2 n . limn n () est la variance asymptotique de
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
On suppose que i. L'application f (x ) est deux fois continment f (x ) est continue direntiable sur , .p.s . et en uniformment par rapport x . ii. E ( f (X )) = , E ( f (X )/f (X )) = , iii. < I () = E (( f (X )) ) < . Alors nI ()(n ) N ( , ).
log
Theorem 23
2 log 2
log 0 1
log
2 2
0 1
(16)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
Exemple 1.
log(
Loi de Bernoulli
log
2 1
donc
p( p) p p
1 On a aussi
n n
( n )
N( ,
0 1).
N( ,
0 1).
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Consistance de L'estimateur Convergence en loi
Exemple 2.
=
1
log (
donc
f X )=X
, 1 () = ((
E X
)2 ) = 2 .
n (mn m) n (mn m)
2
M. BOUTAHAR
N( ,
0 1).
On a aussi
N( ,
0 1).
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Estimation non-paramtrique
X , ..., Xn.
1 1
f (x ) =
k i =1
i 1[a ,a + [ ( ),
i i
x a
(17)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
k i =1 i ( i +1
i) = 1
et
i ( i +1 i ) = F (
1
P X [ai , ai
+1 [).
i ( i +1 i ) =
+1[
=1
+1
ai .
STATISTIQUES AVEC LE LOGICIEL R
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Programme sur R x
<
rnorm(500)
hist(x,breaks=50,col="blue")
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
( i ),
souvent
construite en fonction des donnes (comme dans R). Problme des extrmits
a ak
1 et
mais...
k (ai ) ai ai
et
doivent dpendre de
pour que
converge vers
+1
[ i , i +1 [
aa
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
2.Estimateur noyau
Au lieu de considrer une approximation uniforme autour de chaque
Xi ,
f (x ) = nh K x Xi h i
1
(18)
=1
h un facteur d'chelle.
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Sur R on peut utiliser les noyaux suivants 1) Le noyau normal [kernel=gaussian ou g] 2) Le noyau d'Epanechnikov [kernel=epanechnikov ou e]
K (y ) = C ( y )
1
2 2
1[1,1] (
y)
K (y ) = ( + y )I
1 "optcosine".
1[1,0] (
y) + ( y)
1
1[0,1] (
y ).
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Le choix de la fentre h
est crucial:
f (x ), Xi
Xi
contribuent
biais trs grand et une variance trs petite. Si h petit, peu de contribuent l'estimation de
f (x ),
on obtient un estimateur avec un biais trs petit et une variance trs grande
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Le choix
hn = n
1/5
(en
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
d (f , f ) = E
De la dcomposition
f (x ) f (x ) dx ,
2 2
d (f , f ) =
f (x ) E f (x ) dx +
var
f (x )dx
2
=(biais^2+var)
et les approximations
f (x ) E f (x ) f (x ) hn
2
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
exp
( i )2
2 2
X x hn
2
f (x ) hn,
2
f (x ) hn,
2 4
et que le terme de variance est approximativement Par consquent, l'erreur tend vers 0 quand
hn nhn
nh
1
n
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
hopt = n (f (x )) dx
2
1/5
hopt
Pour rsoudre ce problme il existe plusieurs mthodes: La fentre optimale base sur "rule of thumb", avec le noyau de Gauss, a la forme
hopt =
o
0.9 min(,
75 1.34 1/5
q n
25 )
25 et
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Sur R il y a les mthodes suivantes: -bw.nrd0 implmente la "rule-of-thumb" de Silverman. -bw.nrd une variation de la prcdente, Scott (1992). -bw.ucv et bw.bcv utilisent la validation croise non biaise et biaise respectivement. -bw.SJ implmente la mthode de Sheather & Jones (1991).
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Exemple 3: On considre la srie des prcipitations annuelles "precip", la densit estime avec les 6 choix possibles est donne par
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Exemple 4. La distribution des salaires annuels dans une population contenant d'individus
Ni
n=
touchant le salaire
si
si
(en euro )
Ni
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Contenu
1 2
Simulation des lois de probabilits Estimation paramtrique Estimateurs empiriques Estimateur du maximum de vraisemblance Estimateur des moindres carrs
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Xt
comme une
Zt j
,.
linaire entre
Xt Zt j
et
, si celle-ci existe.
Xt Zt j .
et
Xt = r (Zt
o
,1 , ...,
Z t p ) + ut ,
,
t n
(19)
ut
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
La fonction r peut tre estime par plusieurs mthodes: 1) le rssogramme 2) la mthode des k voisins les plus proches 3) la mthode base sur les splines 4) la mthode du noyau entre autre. On se contente ici de prsenter la mthode du noyau.
Estimateur noyau
Posons
( i , i )1i n
XZ
Zi = (Zi
,1 , ...,
Zi p ).
,
telle que
Xi = r (Zi ) + ui ,
M. BOUTAHAR
i n
(20)
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
7.Rgression non-paramtrique
r (x ) =
n i
=1
n i
=1
si sinon
n i =1
K ((x Zi )/hn) =
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Collomb (1976 ou 1977a) donne une valuation asymptotique du biais et de la variance: que:
deux fonctions
a(x ) b(x )
et
telles
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
h R+
n
min
E f (x ) f (x ))
cn
4/(p +4)
hn
est crucial.
Sur R la fonction glkerns permet l'estimation de la fonction et ses drives avec un choix adaptatif pour la fentre
hn .
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
Exemple: On reprend les donnes sur la distance de freinage: Programme sur R data(cars) library(lokern) plot(dist~speed, data = cars, main = "Fentre adaptative") t13
<
glkerns(cars$speed, cars$dist)
lines(t13$x.out,t13$est, col=2)
M. BOUTAHAR
Simulation des lois de probabilits Estimation paramtrique Estimation : Thorie asymptotique Estimation non-paramtrique Estimation de la densit de probabilit Rgression non-paramtrique
on obtient
M. BOUTAHAR