You are on page 1of 17

2.

Elemente de teoria estimaiei


2.1 Generaliti
n toate aplicaiile statisticii matematice n economie, n tehnic i, n general, n tiinele
experimentale, este necesar s cunoatem legitatea dup care are loc evoluia fenomenului
studiat, adic legea de repartiie a variabilei aleatoare, prin intermediul creia este cuantificat
caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n
domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut.
Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre
funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat.
Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale
parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri).
Pentru a nelege mai bine cum stau lucrurile s dm unele exemple.
Exemplul 2.1.1. Dac variabila aleatoare X reprezint numrul de apeluri la o central
telefonic, ntr-un interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie
x

Poisson ce depinde de parametrul a > 0 : X : a a x , x = 0,1,2,3,... , adic


e

x!

x
a
P ( X = x; a ) = e a , pentru x = 0,1,2,3,... .
x!
n cadrul unui proces de producie, o caracteristic important o constituie procentul p de
rebut. Dac X este variabila aleatoare ce d numrul de produse corespunztoare ce se obin
n x
ntr-o selecie repetat de volum n, atunci: P ( X = x; p ) = Cnx p x (1 p ) , x = 0,1, 2,.., n .
S mai considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de
repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei
anumite componente. n multe situaii, variabila T este caracterizat de densitatea de
1 t
e , t > 0
repartiie: fT ( t ; ) =
, unde parametrul > 0 .
0, t 0

Este vorba de o lege de repartiie de form exponenial cu un singur parametru > 0 .


n fine, dac X reprezint abaterile unei piese prelucrate de la cot nominal menionat n
fia tehnologic, atunci X urmeaz o lege normal N ( m, ) , a crei densitate de repartiie

1
este: f ( x; m, ) =
e
2
( m, ) R ( 0, ) .

( x m )2
22

, x R , care este o lege de repartiie cu doi parametri

n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este,
adic valorile exacte ale parametrilor care intervin.
Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c
avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea
complet a legii de repartiie, adic avem o problem complet specificat.
Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face
pe baza unei selecii de volum n: X1, X2,.., Xn, extras din populaia caracterizat de variabila
aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza
seleciei le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei

statistici (o funcie cu datele de selecie) construite pe baza seleciei X1, X2,.., Xn i pe care o

vom nota Tn ( X 1 , X 2 ,.., X n ) .

Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o
populaie caracterizat de o variabil aleatoare X, care admite legea de repartiie dat de
f ( x; ) , aceasta fiind o densitate de repartiie, n cazul n care exist densitate sau, n cazul
unei variabile discrete, fiind P ( X = x; ) . Cu ajutorul funciei de selecie (numit estimator)

Tn ( X 1 , X 2 ,.., X n ) dorim s estimm parametrul . Este clar c dispunem numai de o


informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att
informaia este mai bogat. Deci, Tn ( X 1 , X 2 ,.., X n ) trebuie s se apropie tot mai mult de
valoarea parametrului , fiind vorba aici de un proces de convergen. Aceast convergen
trebuie s aib loc n probabilitate, adic: lim P Tn ( X 1 , X 2 ,.., X n ) < = 1
n

Valoarea luat de Tn ( X 1 , X 2 ,.., X n ) , pentru valori bine determinate ale variabilelor X1,
X2,.., Xn, o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de
estimaie este de natur teoretic, n timp ce estimaia este de natur empiric.
P
spunem c Tn ( X 1 , X 2 ,.., X n ) este o estimaie consistent
Dac Tn ( X 1 , X 2 ,.., X n )
n

a parametrului .
Cum exist o infinitate de funcii Tn ( X 1 , X 2 ,.., X n ) care converg n probabilitate ctre ,
pentru a mri precizia, vom recurge la convergene mai tari, care asigur convergena n
probabilitate. O atare convergen este convergena n medie ptratic, ce prezint avantajul
c este comod n calcul. Funcia de estimaie Tn ( X 1 , X 2 ,.., X n ) este o funcie de variabilele
aleatoare independente X1, X2,.., Xn i, deci, o variabil aleatoare cu funcia ei de repartiie.
Dac presupunem c operm cu convergena n medie ptratic, se admite implicit c
Tn ( X 1 , X 2 ,.., X n ) are momente de ordinul doi cel puin.
Definiia 2.1.1. Spunem c statistica Tn ( X 1 , X 2 ,.., X n ) este un estimator nedeplasat al

parametrului , dac M (Tn ( X 1 , X 2 ,.., X n ) ) = .

Spunem c statistica Tn ( X 1 , X 2 ,.., X n ) este un estimator deplasat al parametrului , dac

M (Tn ( X 1 , X 2 ,.., X n ) ) = + h ( n ) , unde funcia h(n) numit deplasare a estimatorului are

proprietatea c h ( n ) 0 .
n

Este clar c ntre eroarea de estimaie i deplasare exist o net deosebire. n timp ce
eroarea de estimaie este Tn ( X 1 , X 2 ,.., X n ) i este o variabil aleatoare, deplasarea
h ( n ) = M (Tn ( X 1 , X 2 ,.., X n ) ) este o funcie numeric, ce depinde de volumul de selecie

i, eventual, de parametrul de estimat i care reprezint o eroare sistematic n procesul de


estimare.
Dac h ( n ) > 0 spunem c Tn ( X 1 , X 2 ,.., X n ) este pozitiv deplasat, iar dac h ( n ) < 0
spunem c Tn ( X 1 , X 2 ,.., X n ) este negativ deplasat.
Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza
unor rezultate pe care le-am obinut deja.

Aa de exemplu, Tn ( X 1 , X 2 ,.., X n ) = X =

1 n
X j este o estimaie nedeplasat a mediei
n j =1

( )

teoretice m a unei variabile aleatoare, deoarece M X = m .


k
este o estimare nedeplasat a probabilitii, p, de
n
apariie a unui eveniment n cazul unei repartiii binomiale:
n p
k 1
M = M (k ) =
=p
n
n n

De asemenea, frecvena relativ

2
i M ( s 2 ) = 2 .
n
Aceasta dovedete c 2 este o estimaie negativ deplasat pentru dispersia teoretic 2 ,
n timp ce s2 este o estimaie nedeplasat pentru 2 .

( )

Am vzut, de asemenea, c M 2 = 2

Definiia 2.1.2. Spunem c Tn ( X 1 , X 2 ,.., X n ) este o estimaie absolut corect a

parametrului dac: M (Tn ( X 1 , X 2 ,.., X n ) ) = i D 2 (Tn ( X 1 , X 2 ,.., X n ) ) 0 .


n

Spunem c este o estimaie corect pentru dac:


M (Tn ( X 1 , X 2 ,.., X n ) ) = + h ( n ) , h ( n ) 0 i D 2 ( Tn ( X1 , X 2 ,.., X n ) ) 0 .
n

Din rezultatele obinute anterior se deduce c momentul de selecie de ordin r, M r este o


estimaie absolut corect pentru momentul teoretic de acelai ordin, M r ( X ) . ntr-adevr:

( )

( )

M Mr = Mr ( X) , D Mr =

M 2r ( X ) M 2r ( X )

0
n
n
n particular X este o estimaie absolut corect pentru M ( X ) = m , oricare ar fi repartiia
2

variabilei aleatoare X, pentru care exist M ( X ) i D2 ( X ) .


Din faptul c M ( s 2 ) = 2 i D 2 ( s2 ) =

2
2
i
4 0 precum i M 2 = 2
n
n
n 1

( )

2 ( n 1) 4
0 rezult c s2 este o estimaie absolut corect pentru 2 , n timp
2
n
n
ce 2 este numai corect pentru 2 (n selecii dintr-o populaie normal N ( m, ) ).

( )

D2 2 =

Din rezultatele menionate mai sus, este clar c vom prefera totdeauna s avem o
estimaie nedeplasat pentru un parametru .
Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i, deci, este
natural s o preferm pe aceea care are dispersia cea mai mic, ntruct valorile statisticii
Tn ( X 1 , X 2 ,.., X n ) se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema
existenei unei estimaii nedeplasate, care s aib cea mai mic dispersie i ct de mic poate
s fie dispersia unei estimaii.
n acest sens, avem binecunoscuta teorem a minimului dispersiei, cunoscut sub numele
de teorema Rao-Cramer.
Teorema 2.1.1. (Rao-Cramer)
Dac Tn ( X 1 , X 2 ,.., X n ) este o estimaie absolut corect pentru parametrul din repartiia
dat

de

f(x;)

variabilei

aleatoare

(discret

sau

continu),

atunci:

1
, unde I ( ) este cantitatea de informaie pe o observaie i
n I ( )

D 2 (Tn ( X 1 , X 2 ,.., X n ) )

ln f ( X , ) 2
2 ln f ( X , )

are expresia: I ( ) = M
M
=

Definiia 2.1.3. Spunem c estimaia Tn ( X 1 , X 2 ,.., X n ) este eficient pentru parametrul

dac D 2 (Tn ( X 1 , X 2 ,.., X n ) ) =

1
.
n I ( )

Dac Tn ( X 1 , X 2 ,.., X n ) este o estimaie absolut corect oarecare, vom nota:


e (Tn ( X 1 , X 2 ,.., X n ) ) =

1
n I ( )

D 2 (Tn ( X 1 , X 2 ,.., X n ) )

i vom numi e (Tn ( X 1 , X 2 ,.., X n ) ) eficiena estimaiei Tn ( X 1 , X 2 ,.., X n ) pentru parametrul .

Din teorema Rao-Cramer se obine imediat c: 0 e (Tn ( X 1 , X 2 ,.., X n ) ) 1 i c

Tn ( X 1 , X 2 ,.., X n ) este eficient dac e (Tn ( X 1 , X 2 ,.., X n ) ) = 1 .

Cum eficiena este o funcie de volumul n al seleciei i cum la limit trebuie s obinem
cea mai mare informaie posibil rezult c lim e (Tn ( X 1 , X 2 ,.., X n ) ) = 1 i n acest caz vom
n

spune c Tn ( X 1 , X 2 ,.., X n ) este o estimaie asimptotic eficient.


3.2.2. Metode de estimare a parametrilor
Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de
proprietile pe care le au i, deci, s clasificm estimaiile.
Vom cuta acum s punem n eviden modaliti (metode) de obinere a unor estimaii.
n cele ce urmeaz ne vom opri asupra a dou metode de obinere a estimaiilor, pe care le
vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime.
3.2.2.1. Metoda momentelor
Am vzut c momentele de selecie de ordinul r, sunt estimaii absolut corecte ale
momentelor teoretice de acelai ordin, adic:
M ( X ) M r2 ( X )
M M r = M r ( X ) i D 2 M r = 2r
0.
n
n
Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic,
momentul empiric de acelai ordin.
S presupunem c am efectuat o selecie de volum n: X1,X2,..,Xn, dintr-o populaie
caracterizat de variabila aleatoare X, care are legea de repartiie dat de f ( x; 1 , 2 ,.., k ) ,

( )

unde

f ( x; 1 , 2 ,.., k )

( )

este

densitatea

de

repartiie,

dac

aceasta

exist,

sau

P ( X = x; 1 , 2 ,.., k ) dac variabila X este de tip discret.


Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de
k parametri.

Admitem c variabila aleatoare X are momente cel puin pn la ordinul k inclusiv. Atunci
M S ( X 1 , 2 ,.., k ) sunt funcii de parametrii necunoscui 1 , 2 ,.., k , s 1 .
Alctuim sistemul de ecuaii: M S ( X 1 , 2 ,.., k ) = M S , 1 s k , unde M S =

1 n s
X j .
n j =1

Presupunnd c sistemul de ecuaii considerat admite soluii reale, se obin:


s = s M 1 , M 2 ,.., M k , 1 s k i acestea vor fi estimaiile parametrilor 1 , 2 ,.., k

prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k


momente, ci din contr, putem lua alte momente, inclusiv momente centrate, care s constituie
ns un sistem de k ecuaii cu necunoscutele 1 , 2 ,.., k i din care s se obin ct mai uor
posibil soluia cutat.
3.2.2.2. Metoda verosimilitii maxime
Metoda momentelor, pe care am prezentat-o, este simpl i uor de aplicat. Prezint totui
o serie de neajunsuri n ceea ce privete calitile estimaiilor obinute pe aceast cale. De
aceea statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este
metoda verosimilitii maxime elaborat de R.A. Fisher ea prezentnd avantajul unui plus de
eficacitate.
S considerm, pentru nceput, cazul unui singur parametru i c legea de repartiie a
variabilei X, ce caracterizeaz populaia din care s-a efectuat selecia de volum n: X1, X2,..,
Xn este dat de f ( x; ) .
Atunci, repartiia vectorului aleator ( X1 , X 2 ,.., X n ) este P ( x1 , x 2 ,.., x n ; ) = f ( x j ; ) , pe
n

j=1

care o considerm ca funcie de .


Valorile X1, X2,.., Xn, fiind considerate date, ele fiind rezultatul experienei, vom
considera ca valoarea cea mai verosimil a parametrului , valoarea pentru care probabilitatea
P ( X1 , X 2 ,.., X n , ) devine maxim, ceea ce conduce la faptul c estimaia de verosimilitate
maxim , este obinut ca soluie a ecuaiei:
P ( X1 , X 2 ,.., X n ; )

=0

Funcia P ( X1 , X 2 ,.., X n ; ) poart numele de funcie de verosimilitate.


ntruct P ( X1 , X 2 ,.., X n ; ) i ln P ( X1 , X 2 ,.., X n ; ) sunt n acelai timp cresctoare sau

descresctoare, estimaia de verosimilitate maxim se poate obine ca soluie a ecuaiei


ln P ( X1 , X 2 ,.., X n ; )
= 0.

Funcia L ( X1 , X 2 ,.., X n ; ) = ln P ( X1 , X 2 ,.., X n ; ) = ln f ( X j ; ) o vom numi tot funcie


n

j=1

de verosimilitate. Se demonstreaz c soluia obinut este un punct de maxim pentru P i deci


i pentru ln P .
n cazul cnd repartiia unidimensional depinde de mai muli parametrii,
f ( x; 1 , 2 ,.., k ) , funcia de verosimilitate devine :
L ( X1 , X 2 ,.., X n ; 1 , 2 ,.., k ) = ln f ( X j ; 1 , 2 ,.., k )
n

j=1

iar estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii:

L ( X1 , X 2 ,.., X n ; 1 , 2 ,.., k )
r

= 0, 1 r k

Rezolvnd acest sistem de ecuaii se obin r = r ( X1 , X 2 ,.., X n ) , 1 r k , ce vor fi


estimaiile de verosimilitate maxim ale parametrilor 1 , 2 ,.., k .
L
Ecuaiile
= 0, 1 r k le vom numi ecuaii de verosimilitate.
r
2L
i n acest caz se poate arta c matricea hessian
este matricea unei

r s 1 r ,s k
funcionale ptratice negativ definite.
Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate
maxim, proprieti ce le recomand pentru aplicaii. n cazul unui singur parametru ,
estimaia de verosimilitate maxim este consistent n probabilitate, iar pentru valori mari ale
lui n, repartiia ei este aproximativ normal cu media M = i cu dispersia

()

()

D 2 =

.
ln f ( X; ) 2
n M


Altfel spus, estimaia obinut prin metoda verosimilitii maxime este asimptotic
eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic.
Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic,
rezolvnd ecuaia de verosimilitate.
3.2.2.3. Intervale de ncredere
S considerm variabila aleatoare X, caracterizat de familia de repartiii f ( x; ) , ce
depinde de parametrul a crui valoarea bine determinat nu o cunoatem i pe care dorim s
o estimm, pe baza unei selecii de volum n: X1,X2,..,Xn.
Metoda punctual de estimare caut o funcie de selecie Tn ( X 1 , X 2 ,.., X n ) , care s
P

ndeplineasc condiia Tn ( X 1 , X 2 ,.., X n ) , i pe care am numit-o funcie de estimaie


n

pentru parametrul .
ntruct Tn ( X 1 , X 2 ,.., X n ) variaz ca precizie, este de dorit s dispunem de o indicaie
asupra preciziei sale, iar metoda intervalelor de ncredere, pe care o punem n eviden n cele
ce urmeaz, are astfel de virtui.
S presupunem c pe baza seleciei menionate, se pot determina dou funcii de selecie
1 ( X1 , X 2 ,.., X n ) i 2 ( X1 , X 2 ,.., X n ) astfel nct :
P ( 1 ( X1 , X 2 ,.., X n ) 2 ( X1 , X 2 ,.., X n ) ) =

cu ( 0,1) independent de . Numrul ( 0,1) se alege ct mai apropiat de valoarea 1, ceea


ce nseamn c inegalitatea 1 2 este ndeplinit n majoritatea cazurilor.

Pentru o selecie efectuat, 1 ( X1 , X 2 ,.., X n ) i 2 ( X1 , X 2 ,.., X n ) iau valori bine

determinate i, prin urmare, am gsit un interval 1 ( X1 , X 2 ,.., X n ) ; 2 ( X1 , X 2 ,.., X n ) care

acoper adevrata valoare a parametrului cu probabilitate apropiat de 1. Cu ct lungimea


acestui interval este mai mic i probabilitatea este mai apropiat de 1, cu att vom avea o
indicaie mai precis asupra valorii parametrului .
Intervalul
1 ( X1 , X 2 ,.., X n ) ; 2 ( X1 , X 2 ,.., X n ) l vom numi interval de ncredere, iar
numrul ( 0,1) nivel de ncredere. Numrul = 1 va fi numit nivel de semnificaie.

Subliniem faptul c afirmaia intervalul [ 1; 2 ] acoper valoarea parametrului cu


probabilitatea este cea corect, deoarece este fixat (dei necunoscut), iar 1 , 2 capetele
intervalului sunt aleatoare, ele depinznd de variabilele de selecie X1,X2,..,Xn.
S vedem acum care ar fi modalitatea obinerii unui interval de ncredere. Exist mai
multe metode de determinare a intervalelor de ncredere, ns noi ne vom opri asupra unui
mod simplu i uor de aplicat, mai ales n seleciile din populaii normale.
Presupunem c putem determina o funcie de datele de selecie X1,X2,..,Xn i de
parametrul , notat U ( X 1 , X 2 ,.., X n ; ) (U poate s depind i explicit de n) cu proprietile:
a) U ( X 1 , X 2 ,.., X n ; ) este continu i strict monoton n raport cu ;
b) Funcia de repartiie a variabilei aleatoare U ( X 1 , X 2 ,.., X n ; ) nu depinde de sau ali

parametrii necunoscui FU ( x ) = P (U ( X 1 , X 2 ,.., X n ; ) < x ) , x

este independent de .

n aceast situaie, pentru orice ( 0,1) fixat, putem determina dou numerele reale

1 ( ) i 2 ( ) astfel nct: P ( 1 ( ) U ( X 1 , X 2 ,.., X n ; ) 2 ( ) ) =

S folosim acum faptul c U ( X 1 , X 2 ,.., X n ; ) este continu i strict monoton n raport


cu . Pentru a ne fixa ideile, s presupunem c este strict cresctoare n raport cu . n acest
caz evenimentul ( 1 ( ) U ( X 1 , X 2 ,.., X n ; ) 2 ( ) ) este echivalent cu evenimentul

( ( X , X ,.., X ; ) ( X , X ,.., X ; ) ) i, ca evenimente echivalente,


probabilitate, adic: P ( ( X , X ,.., X , ) ( X , X ,.., X , ) ) =
1

au aceeai

Am determinat astfel un interval 1 ( X1 , X 2 ,.., X n ; ) ; 2 ( X1 , X 2 ,.., X n ; ) cu capete


aleatoare, care acoper adevrata valoare a parametrului cu o probabilitate fixat.
3.2.4. Intervale de ncredere pentru parametrii m i 2 , dintr-o repartiie normal
N(m,)
Presupunem c s-a efectuat o selecie de volum n: X1,X2,..,Xn dintr-o populaie normal
N(m,).
Pe baza seleciei efectuate s construim, mai nti, un interval de ncredere pentru
parametrul m. Vom avea de luat n considerare dou cazuri, n funcie de parametrul , care
poate fi cunoscut sau necunoscut.
3.2.4.1. Interval de ncredere pentru parametrul m cnd este cunoscut
Considerm funcia de selecie U ( X 1 , X 2 ,.., X n ; m ) =

X m
.

X m
am

n
vzut c are o repartiie normal N(0;1), adic funcia ei de repartiie nu depinde de
parametrul m.
X m
Pe de alt parte
este continu i strict descresctoare n raport cu variabila m.

n
X m
Din faptul c
are o repartiie normal N(0;1) rezult c, pentru orice ( 0,1)

n
fixat i apropiat de 1, putem determina numerele z1 i z2 astfel nct:
Selecia fiind efectuat dintr-o populaie normal N(m, ), variabila aleatoare

z2

2
X m
1
x
P z1
z2 =
e 2 dx = ( z2 ) z1 =

2 z1

( )

X m

z2 este echivalent cu: X z2


m X z1
Dar evenimentul z1

n
n

i deci au aceeai probabilitate: P X z 2


m X z1
=
n
n

Am determinat aadar intervalul X z2


; X z1
care, cu probabilitatea ,
n
n

acoper adevrata valoarea a parametrului m.


Pentru ( 0,1) fixat, se pot determina o infinitate de numere z1, z2, care s satisfac

condiia ( z 2 ) ( z1 ) = .

Cum pe noi ne intereseaz s obinem o precizie ct mai bun, pentru un volum al


seleciei n dat, aceasta se obine cnd lungimea intervalului este minim. Urmeaz s

( z2 z1 ) (lungimea intervalului de ncredere) cu


determinm minimul funciei L ( z1 , z2 ) =
n
2

x
z2

1
legtura
e 2 dx = .
2 z1
Aplicnd metoda multiplicatorilor lui Lagrange, vom cuta minimul funciei:
x2
z2
1

( z2 z1 ) +
e 2 dx
H ( z1 , z2 , ) =
2 z

n
1

H
H
H
Din sistemul
=0;
= 0;
= 0 se obine:
z2
z1

z
z
1
2

e 2 = 0 ;
+
e 2 = 0 i de aici:
n
2
n
2
2

z2

z2

1
2
2 z21
2 z22
=
e =
e ; e 2 = e 2 adic z12 = z22 sau z1 = z2 .
n
n
Cum > 0 , soluia z1 = z 2 nu convine i, deci z1 = z 2 ; z 2 = z .

n acest caz intervalul devine X z


; X + z
, iar z se determin din ecuaia
n
n

( z ) ( z ) = , de unde obinem:
+1 1+1


=
= 1 , z = 1 1 = z , care se afl din
2
2
2
2 1 2
tabelele pentru repartiia normal N(0;1).
n final, intervalul de ncredere pentru parametrul m, cnd este cunoscut, cu nivelul de


; X +z
ncredere = 1 este: X z
.
1
1
n
n
2
2

3.2.4.2. Interval de ncredere pentru parametrul m cnd este necunoscut

2 ( z ) 1 = , ( z ) =

n acest caz se consider funcia de selecie

n
n


t2
2

s
x
2
H ( t1 , t2 , ) =
( t2 t1 ) +
1 +
dx

n
n 1 n 1 t1 n 1

n
2
1
s2 =
X j X .
n 1 j =1

unde

Dup cum s-a vzut, variabila

X m
urmeaz o lege de repartiie Student cu n 1 grade
s
n

de libertate.

X m
este funcie continu
s
n
i strict descresctoare n raport cu m, pentru orice ( 0,1) fixat, putem determina numerele
reale t1 i t2 astfel nct:
Cum funcia de repartiie Student nu depinde de m i n plus

X m
t2 =
P t1
s

n

2

x2 2
1 +
dx =
n 1 t1 n 1
( n 1)

2
t2

X m
s
s

t2 este echivalent cu X t2
m X t1
Cum evenimentul t1
,
s
n
n

s
s

m X t1
nseamn c au aceeai probabilitate, adic: P X t2
= i deci am
n
n

s
s

; X t1
determinat intervalul de ncredere X t2
care, cu probabilitatea ,
n
n

acoper parametrul m.
Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu
n
n


t2
2

x 2
2
1 +
restricia:
dx = .
n 1 t1 n 1
( n 1)

2
Aplicnd metoda multiplicatorilor lui Lagrange se obine din

n
n


t2
2

s
x
H
2

H ( t1 , t2 , ) =
dx
( t2 t1 ) +
1 +

i
= 0,

t1
n
n 1 n 1 t1 n 1

2
H
= 0 c t1 = t2 , t2 = t , iar intervalul de ncredere devine:
1
t2
2

s
s
; X +t
X t1
.
1
n
n
2
2

3.2.4.3. Interval de ncredere pentru parametrul 2

Se consider statistica U ( X 1 , X 2 ,.., X n ;


lege de repartiie (2n 1)

n 1) s 2
(
=

2
2
( cu n 1 grade de libertate).

care, dup cum s-a vzut, are o

Atunci, pentru = 1 ( 0,1) fixat, se pot determina dou numere 12 i 22 astfel nct:

2 n 1
x
2 ( n 1) s 2

1
2
2
2
2 = n 1
x
e dx =
P 1
2

2 2 n 1 12

2
n 1) s 2
(
Cum funcia de repartiie a variabilei
este independent de 2 i n plus
2
( n 1) s 2 este continu i strict descresctoare n raport cu 2 , nseamn c statistica aleas
2
ndeplinete condiiile pentru a putea construi un interval de ncredere pentru 2 .

( n 1) s 2 2 i ( n 1) s 2 2 ( n 1) s 2 fiind echivalente,
Evenimentele 12

2
2
22
12

au aceeai probabilitate i deci:


2

( n 1) s 2
n 1) s 2
(
2

P
=
22
12

2
2
( n 1) s ( n 1) s
adic am determinat intervalul
;
care, cu o probabilitate fixat,
22
12

2
acoper parametrul .
Numerele 12 i 22 depind de i, ca atare, s le stabilim valoarea cnd este dat.

Densitatea de repartiie a unei variabile (2k ) , nemaifiind simetric i lund numai valori
pozitive, nu vom mai putea adopta ca metod minimizarea lungimii intervalului, cu restricii.

Vom adopta n acest caz regula: P ( 2 < 12 ) = ; P ( 2 > 22 ) = , numit regula cozilor
2
2
egale.
f(x)

Avnd n vedere modul cum sunt construite tabelele pentru funcia de repartiie a unei
i cu acestea intervalul
variabile (2k ) , obinem: 12 = 2 ; 22 = 2

( n 1),

( n 1),1

( n 1) s 2 ( n 1) s 2
2
, 2
care, cu o probabilitate , acoper parametrul .
2


( n 1),1
( n 1),
2
2

Uneori ne intereseaz interval de ncredere pentru (nu pentru 2 ).


n 1 s
Atunci folosim faptul c funcia de selecie
are densitate de repartiie:

0, x 0

x2

1
n2
f ( x ) = n 3
x e 2 , x > 0
2 2 n 1

2
Pentru = 1 fixat, se pot determina dou numere U1 i U2 astfel nct:
x
U2

n 1 s
1
P U1
U 2 = n 3
x n 2 e 2 dx =

2 2 n 1 U1

2
2

n 1 s n 1 s
Se obine astfel intervalul:
,
care, cu o probabilitate , acoper
U1
U2
parametrul .

Valorile numerice se pot determina fie folosind cuantilele repartiiei (2k ) , fie prin
integrare numeric pe calculator.
3.2.4.4. Selecii din dou populaii normale N(m1,1) i N(m2, 2)

S presupunem c s-au efectuat dou selecii, una de volum n1 din populaia N(m1, 1) i

una de volum n2 din populaia N(m2, 2).

n1 : X11 , X12 ,..., X1n1 i n2 : X 21 , X 22 ,..., X 2 n2


Pe baza acestor dou selecii se obin funciile de selecie:

X1 =

1 n1
X1 j ;
n1 j =1

2
2
1 n1
1 n2
1 n2
2
s =
X 1 j X 1 ; X 2 = X 2 j ; s2 =
X2 j X 2 .
n2 1 j =1
n2 j =1
n1 1 j =1
Construim un interval de ncredere pentru m 1 m2 n cazul n care 1 i 2 sunt
cunoscute.
Pentru aceasta considerm statistica:
X 1 X 2 ( m1 m2 )
U X 11 , X 12 ,.., X 1n 1 , X 21 , X 22 ,.., X 2 n 2 ; m1 m2 =
12 22
+
n1 n2
care este repartizat normal N(0;1),de unde urmeaz, parcurgnd punct cu punct calea
parcurs n cazul unei singure selecii, intervalul de ncredere de nivel = 1 :

2 2
2 2
X1 X 2 z 1 + 2 ; X1 X 2 + z 1 + 2
1
1
n1 n2
n1 n2

2
2
Intervalul de ncredere pentru m1 m 2 n cazul n care 1 i 2 sunt necunoscute, dar
2
1 = 22 = 2 .
n acest scop se consider statistica:
X 1 X 2 ( m1 m2 )
2
1

U X 11 , X 12 ,.., X 1n1 , X 21 , X 22 ,.., X 2 n2 ; m1 m2 =

1 1
+
n1 n2

( n1 1) s12 + ( n2 1) s22

n1 + n2 2
care are o repartiie Student cu n1 + n2 2 grade de libertate.
Atunci, procednd ca n cazul unei singure selecii dintr-o populaie normal N(m,),
obinem, pentru = 1 fixat, intervalul de ncredere:
2
2

n1 + n2 ( n1 1) s1 + ( n2 1) s2
X1 X 2 t

;
1 ; n 1+ n2 2
n1 n2
n1 + n2 2

2
2
2
n + n ( n 1) s1 + ( n2 1) s2

X1 X 2 +t
1 2 1
1 ; n 1+ n2 2
n1 n2
n1 + n2 2

2
Acest interval acoper, cu probabilitatea , valoarea m1 m 2 .

Interval de ncredere pentru raportul

12
.
22

Se consider funcia de selecie:


s22
2 2 s 2
U X 11 , X 12 ,.., X 1n 1 , X 21 , X 22 ,.., X 2 n2 , 12 , 22 = 22 = 12 22
s1
2 s1
2
1
Aceast funcie de selecie are o repartiie Snedecor cu n 2 1 i n1 1 grade de libertate.

Notm, ca de obicei, Fn2 1;n1 1 =

12 s22
.
22 s12

Variabila aleatoare Fn 2 1;n1 1 are o funcie de repartiie independent de


de

12
, iar ca funcie
22

12
este continu i strict cresctoare.
22

Pentru = 1 fixat, putem determina numerele reale F(1) i F( 2 ) astfel nct


P F(1) Fn2 1;n1 1 F( 2) = .

n ipoteza c adoptm cozi egale, se obine:

P F
Fn2 1; n1 1 F
=
n2 1; n1 1,1
2
n2 1;n 11, 2
Cum evenimentele:

s12

12 s22
12 s12

2 F
F
F
F
,
n 1;n 1,
2


2
2
2
n 2 1; n1 1,1
s n2 1;n1 1, 2 2 s2 n2 1;n1 1,1 2
2 2
2 1 2 2 s1
sunt echivalente, au aceeai probabilitate i am obinut intervalul:
s12

s12
F
;

F
2 n 1;n 1,

2
2
1
s2 n2 1;n 11,1 2
2
s2
2
care acoper valoarea parametrului 12 , cu probabilitatea .
2
3.2.4.5. Intervale de ncredere pentru parametri n cazul seleciilor de volum mare

Dup cum s-a vzut, determinarea unui interval de ncredere pentru parametrul , care
apare n legea de repartiie f ( x; ) , se baza pe construirea unei funcii de selecie, care s
depind de datele de selecie X1,X2,..,Xn, de volumul de selecie n i de parametrul estimat .
De asemenea, se presupunea c funcia de repartiie a statisticii nu depinde de parametrul
estimat. ns, n multe situaii, aflarea funciei de repartiie a statisticii este o problem
dificil, dar se poate determina repartiia asimptotic a statisticii care conine parametrul
necunoscut i se poate utiliza repartiia asimptotic, dac n este suficient de mare, caz n care
erorile comise sunt neglijabile.
Fie variabila aleatoare X cu densitatea de repartiie f ( x; ) ce caracterizeaz o populaie
C, din care se efectueaz selecia de volum n: X1,X2,..,Xn. n ipoteza c valorile de selecie

sunt independente, se obine funcia de verosimilitate: P ( X 1 , X 2 ,.., X n ; ) = f ( X j ; ) .


n

ln f ( X j ; )
ln P n ln f ( X j ; )
=
Yj =
. Notnd
, 1 j n

j =1
ln f ( X ; ) ln f ( x; )
M (Y j ) = M
f ( x; ) dx = 0
=

Presupunem c:

Rezult:

j =1

obinem:

ln f ( x; )
0 < M 2 (Y j ) =
f ( x; ) dx <

ln f ( X ; )
Atunci D 2 (Y j ) = M 2 (Y j ) = M 2
, iar variabila:

ln P
ln P
M

=
ln P
D

ln f ( X j ; )

ln f ( X j ; )
n
n

M
Yi

j =1

=
i =1
este asimptotic
2
n ln f ( X j ; )
n
D
Y

( j)

D 2

j =1

j =1

N(0;1), conform teoremei limit central.

Deci lim P a <


n

i =1
< b =
n D (Y j )

Yi

b x
1
e 2 dx i, prin urmare, pentru n suficient de
2 a

mare, statistica:

Yi
i =1

n D (Y j )

1
ln P
urmeaz aproximativ o lege de repartiie

n D (Y j )

N(0;1).
ln P
este strict monoton n raport cu , atunci se poate construi un

interval de ncredere pentru q, oricare ar fi nivelul de semnificaie ( 0,1) .

Dac, n plus,

Aplicaii
Pe baza seleciei X 1 , X 2 , , X n s se estimeze parametrul al repartiiei Poisson:
e k
, k = 0,1, 2, i s se analizeze estimatorul obinut.
P( X = k ) =

1.

k!

Rezolvare: Utiliznd metoda momentelor avem ecuaia M ( X ) = X . Cum M ( X ) = se

obine estimatorul n ( X1 , X 2 ,, X n ) = X =
avem

1 n
X i . Utiliznd metoda verosimilitii maxime
n i =1

funciile

de

i =1

i =1

P ( X1 , X 2 ,, X n ; ) = P ( X = X i ; ) =

verosimilitate

= e n
,
( X i )!
i =1 ( X i )!
Xi

Xi

L ( X 1 , X 2 ,, X n ; ) = ln P ( X 1 , X 2 ,, X n ; ) = n + ( X i ln ln ( X i )!)
L ( X 1 , X 2 , , X n ; )

verosimilitate

n ( X 1 , X 2 ,, X n ) =

ecuaia

de

i =1

= 0,

n +

deci

i =1

Xi = 0

se

obine

estimatorul

1 n
X i = X (acelai ca i la metoda momentelor, totui nu este obligatoriu
n i =1

ca ambele metode s dea acelai estimator). Pentru analiza estimatorului vom folosi faptul c
M ( X ) = i D ( X ) = .
Avem
1 n
1 n
1
1 n
1 n
M ( n ( X 1 , X 2 , , X n ) ) = M X = M X i = M ( X i ) = M ( X ) = = n = ,
n
n
n
n
n
i =1
i =1
i =1
i =1

( )

deci este nedeplasat;


cum i D ( n ( X1 , X 2 ,, X n ) ) =

1
n2

D( Xi ) =
i =1

n
=
0 rezult c este estimator
n n
n2

absolut corect;

e X
ln f ( X ; )
X
ln f ( X ; ) = ln
= 1 + ,
= + X ln ln X ! ,

X!
2 ln f ( X ; )
2 ln f ( X ; )
X
X 1
,
=

M
=

(
)

= M 2 =
2
2
2

1
se verific faptul c D ( n ( X 1 , X 2 ,, X n ) ) = =
, deci este estimator eficient, are
n n I ( )

cum

eficiena e ( n ( X 1 , X 2 , , X n ) ) =

1 ( n I ( ))

D ( n ( X 1 , X 2 , , X n ) )

=1.

2. Pe baza seleciei X 1 , X 2 , , X n , s se determine estimatorul de maxim verosimilitate


din
distribuia
(densitatea)
de
probabilitate
pentru
parametrul
>0
x

f ( x; ) =
, x = 0,1, 2, , i s se arate c este absolut corect.
(1 + ) x +1
Rezolvare: Avem ecuaia de verosimilitate

n
ln f ( X i ; ) = 0 ,
i =1

n
n
Xi
ln
=

( X i ln (1 + X i ) ln (1 + ) ) =
i =1 (1 + ) X i +1 i =1

Xi 1+ Xi

1+
i =1
n

X i n = 0 , se obine estimatorul

(1 + ) i =1

n ( X 1 , X 2 ,, X n ) =

M (X ) = x

Avem

x =0

x
1
1
=
x tx =
S1 ,

x +1
1 + x =1
1+
(1 + )
k

S1 = x t = lim x t = t lim x t
x =1

t lim

k x =1

k t k +1 ( k + 1) t k + 1

( t 1)

1 n
Xi = X
n i =1

k x =1

( t 1)

'

'

x 1

t=

unde

t k +1 t
k
= t lim t x = t lim
=
k x =1
k

t 1

(1 + )

1
+

= + 2 ,

rezult

1+

( 0,1)

M (X ) =

pentru
S1'

1
+ 2 = . Pentru a calcula M X 2
1+

aceasta

( )

procedm

astfel:

trebuie calculat suma S2 = x 2 t x ;

derivm

x =1

S1

raport

cu

'

= x t
2

x 1

x =1

deci

= 2 2 + ( + 1) ,

x
1
=
S 2 = 2 2 + ,
x +1
1+
(1 + )

( )

2
t
t 1) 2t ( t 1)
(
t2 + t

t
= t
=

=
( t 1)2
( t 1)3
( t 1)4

S2 = t S1'

t,

M X 2 = x2
x =0

( )

D ( X ) = M X 2 M 2 ( X ) = 2 + . Aadar,

1 n
1 n
1 n
M ( n ( X 1 , X 2 , , X n ) ) = M X = M X i = M ( X i ) = M ( X )
n i =1
n i =1 n i =1

( )

deci

estimatorul

D ( n ( X 1 , X 2 , , X n ) ) =

1
n2

este
1

D ( X i ) = n2 n D ( X ) =

nedeplasat,
+
2

0
n

i =1

1 n
1
= n = ,

n i =1
n

cum

rezult c estimatorul

este absolut corect.


3. Pe baza seleciei X 1 , X 2 , , X n s se estimeze parametrul , > 0, din densitatea de

repartiie: f ( x; ) =

Rezolvare:

Folosind

e , x > 0 i s se analizeze estimatorul obinut. Precizai estimaia n


2
cazul seleciei de volum 15 i de valori: 4, 5, 5, 2, 3, 4, 5, 3, 4, 2, 3, 2, 5, 4, 3.

metoda

momentelor

M ( X ) = x f ( x ) dx =

avem:

2 e dx = y
0

e y dy = ( 3) = 2 ,
1
2

n ( X1 , X 2 ,, X n ) = X =

Folosind

deci ecuaia

M (X ) = X

ne d estimatorul

ln 2i e
i =1

1 n
Xi .
2 n i =1

metoda
Xi

verosimilitii

ln X i 2 ln
i =1

maxime

Xi
2 Xi
= + 2
i =1
n

avem:
2n 1

+
=
2

Avem M ( n ( X 1 , X 2 ,, X n ) ) =
este nedeplasat. Cum M ( X

)=x
0

ln f ( X i ; ) = 0,
i =1

Xi = 0 ,

se obine

i =1

ecuaia 2 n + X i = 0 , de unde rezult estimatorul n ( X1 , X 2 ,, X n ) =


i =1

1 n
X
Xi = .

2 n i =1
2

1
1
1 n
M ( X i ) = M ( X ) = 2 = , deci estimatorul

2
2
2 n i =1

f ( x ) dx =

x3

e dx =

2 y 3 e y dy = 2 ( 4 ) = 2 3! = 6 2 obinem D ( X ) = M ( X 2 ) M 2 ( X ) =
0

6 2 4 2 = 2 2 i D ( n ( X 1 , X 2 ,, X n ) ) =

1
4n2

D ( X i ) = 4n2 n D ( X ) =
i =1

2 2 =

0 , deci estimatorul este absolut corect. Pentru a calcula eficiena


4n
2 n n
2

estimatorului, e ( n ( X 1 , X 2 , , X n ) ) =

1 ( n I ( ) )

D ( n ( X 1 , X 2 , , X n ) )

, procedm astfel:


2 X 2 2X
X
2
2 X

=
ln f ( X ; ) =
ln
X
2ln

ln f ( X ; ) =

+
,
,

+ =
2
2


2 2 3

2 ln f ( X , )
2
2
2
2
2
2 2X
I ( ) = M
= M 2 3 = 2 + 3 M ( X ) = 2 + 3 2 = 2 ,
2

2 ( 2n )
= 1, aadar, estimatorul este eficient. Pentru selecia dat
e ( n ( X 1 , X 2 , , X n ) ) = 2
( 2n )

estimaia este n ( X 1 , X 2 ,, X n ) =

1 n
54
Xi =
= 1,8

2 n i =1
30

4. Se consider c greutatea unor saci cu cafea are o repartiie normal cu dispersia 12.
Cntrind la ntmplare 64 saci se obin greutile (n kg):
Nr. saci 5
10 10 11 8 10 6
4
Greutatea 82 80 81 77 78 79 80,5 78,5

S se construiasc intervalul de ncredere cu o probabilitate de 0,98 pentru greutatea medie.


Cum este corect s se scrie pe sac: 80 kg 2% sau 80 kg 3% ?
Rezolvare:
Fie X greutatea unui sac i m greutatea medie. Avem
n = 64, = D ( X ) = 12, Z =

X m
~ N ( 0,1) i P ( < Z < ) = 0,98 .
n

Cum P ( < Z < ) = F ( ) F ( ) = 2 F ( ) 1 = 0,98 rezult


1,98
1
= F ( 0,99 ) = 2,33
2
X m
2,33 < Z =
< 2,33
obinem
n

= F 1

Din
X 2,33

inegalitatea

< m < X + 2,33

n
I = ( 78,3348; 80,35267 ) .

Cum

X = 79,34375

se

intervalul
obine

cutat
intervalul

dat
de
inscripionarea
este
80 2%
J = ( 80 0,02 80; 80 + 0,02 80 ) = ( 78, 4; 81,6 ) , iar cel dat de inscripionarea 80 3% este
H = ( 80 0,03 80; 80 + 0,03 80 ) = ( 77,6; 82, 4 ) , cum
IH
i I J
corect este
inscripionarea 80 kg 3%
Intervalul

You might also like