UNIVERSITATEA “AUREL VLACIU” ARAD

FACULTATEA DE ŞTIINŢE ECONOMICE
SPECIALIZAREA: FINANŢE BĂNCI
E C O N O M E T R I E
Titular curs:
Lector univ. Drd. Săbău Florentina Simona
1
Cuprins
Capitolul 1 Introducere în econometrie
1.1 Obiective 3
1.2 Prezentare sintetică 3
1.2.1 Scurt istoric privind apariţia şi dezvoltarea econometriei 3
1.2.2 Definiţiile econometriei 4
1.2.3 Locul şi rolul econometriei în sistemul ştiinţelor
economice
6
1.2.4 Noţiuni şi concepte fundamentale ale econometriei 8
1.3 Întrebări 15
1.4 Probleme rezolvate 16
1.5. Probleme propuse 37
1.6. Bibiliografie 40
Capitolul 2 Testarea ipotezelor statistice
2.1 Obiective 41
2.2 Prezentare sintetică 41
2.2.1 Concepte şi erori în testarea ipotezelor statistice 41
2.2.2. Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum mare
45
2.2.3 Testarea ipotezei privind diferenţa dintre două medii
pentru eşantioane de volum mare
49
2.2.4.Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus
51
2.2.5.Testarea ipotezei privind proporţia populaţiei pentru
eşantioane mari
52
2.2.6. Testarea ipotezei privind diferenţa dintre două medii
pentru eşantioane de volum redus
53
2.2.7. Testarea ipotezei privind dispersia unei populaţii 55
2.2.8.Testarea ipotezei privind raportul dintre două dispersii 56
2.3 Întrebări 58
2.4.Probleme rezolvate 60
2.5.Bibiliografie 66
Capitolul 3 Modelul de regresie
3.1 Obiective 67
3.2 Prezentare sintetică 67
3.2.1 Specificarea unui model de regresie 67
2
3.2.2 Modelul de regresie clasic 67
3.3 Întrebări 74
3.4 Probleme rezolvate 79
3.5.Bibiliografie 80
3
Capitolul 1
Introducere în econometrie
1.1 OBIECTIVE: introducerea studenţilor în sfera şi noţiunile
specifice econometriei
1.2 PREZENTARE SINTETICĂ:
1.2. 1 Scurt istoric privind apariţia şi dezvoltarea
econometriei
Un moment important în constituirea şi dezvoltarea Econometriei ca
disciplină economică de frontieră, apărută în domeniile de interferenţă ale
teoriei economice, statisticii şi matematicii, se consideră anul 1930
(29 decembrie), când s-a înfiinţat la Cleveland Societatea de Econometrie
(Econometric Society), avându-i ca iniţiatori pe: Irving Fischer -
preşedinte, L. V. Bortkiewicz, R. Frisch, H. Hotelling, L. Schumpeter,
N. Wiener şi alţii.
Un rol deosebit în dezvoltarea şi popularizarea econometriei l-a avut
revista acestei societăţi, „Econometrica", care apare trimestrial,
începând din ianuarie 1933.
Etimologic, termenul de econometrie provine din cuvintele greceşti:
eikonomia (economie) şi metren (măsură). El a fost introdus (1926) de
către Ragnar Frisch, economist şi statistician norvegian, prin analogie cu
termenul „biometrie", folosit de Fr. Galton şi K. Pearson la sfârşitul
4
secolului XIX, care desemna cercetările biologice ce utilizau
metodele statisticii matematice.
Dar nu cei care au introdus termenul şi au înfiinţat Societatea de
Econometrie au şi „inventat" această disciplină.
Sub aspect istoric, studierea cantitativă a fenomenelor economice
este mult mai veche. Printre precursorii econometriei moderne pot fi
citaţi: F. Quesnay, W. Petty, Gregory King, A. Cournot, Leon Walras, E.
Engel, A. Marshall, R. A. Fisher, K. Pearson şi alţii.
În perioada contemporană, contribuţii importante la dezvoltarea
econometriei au fost aduse de:
- în domeniul analizei economice a cererii: M.
Friedman,T. Haavelmo, R. Stone, H. Wald, ş.a.;
- în domeniul funcţiilor de producţie: C. W. Cobb, P. H. Douglas,
K. J. Arrow, G. Tintner;
- în domeniul modelelor macroeconomice: A. S. Goldberger,
O. Onicescu, V. Kantarevici, L. R. Klein, J. Tinbergen, H. Theil
1
;
- în domeniul metodelor de analiză a datelor sau al econometriei
„fără modele": T. W. Anderson, J. P. Benzécri, H. Hotelling, R. A. Fisher
şi alţii.
În momentul actual, impulsionată puternic de revoluţia
tehnico-ştiinţifică - cu realizări de vârf în domeniul calculatoarelor
electronice - econometria a devenit un instrument metodologic de bază,
indispensabil teoriei şi practicii economice pentru investigarea riguroasă a
fenomenelor şi proceselor economice.
1
Numele scrise cu italice îi desemnează pe laureaţii Premiului Nobel în econometrie
5
1.2. 2 Definiţiile econometriei
Dezvoltarea rapidă a econometriei a generat formularea mai
multor definiţii cu privire la domeniul acestei discipline economice.
Totuşi, marea majoritate a acestora poate fi încadrată în următoarele
trei grupe:
a) definiţia istorică;
b) definiţia restrictivă;
c) definiţia extinsă.
a) Definiţia istorică a econometriei a fost formulată de R.
Frisch în primul număr al revistei „Econometrica", în ianuarie
1933: „experienţa a arătat că fiecare din următoarele trei puncte
de vedere, al statisticii, al teoriei economice şi al matematicii, este
o condiţie necesară, dar nu şi suficientă, pentru o înţelegere efectivă
a realităţilor cantitative din economia modernă; unificarea lor este
aceea care asigură eficienţa. Econometria este tocmai această
unificare".
Conform acestei definiţii, susţinătorii ei consideră că prin
econometrie se înţelege studierea fenomenelor economice pe baza
datelor statistice cu ajutorul modelelor matematicii.
b) Definiţia restrictivă propusă de Cowles Commission
for Research in Economics (Chicago, 1940-1950), consideră că nu
există econometrie dacă investigarea fenomenelor economice nu
se face cu ajutorul modelelor aleatoare (stochastice).
6
Susţinătorii acestei definiţii, L. R. Klein, E. Malinvaud, G.
Rottier, includ în domeniul econometriei numai cercetările
economice care utilizează metodele inducţiei statistice - teoria
estimaţiei, verificarea ipotezelor statistice - la verificarea relaţiilor
cantitative formulate în teoria economică cu privire la fenomenele
sau procesele economice cercetate.
Conform acestor definiţii, un studiu econometric presupune:
- existenţa prealabilă a unei teorii economice privind
fenomenul, procesul sau sistemul economic cercetat, pe baza
căreia se construieşte modelul economic, care reprezintă
formalizarea ipotezelor teoriei economice cu privire la
fenomenul, procesul sau sistemul investigat;
- posibilitatea aplicării metodelor inducţiei statistice la
verificarea ipotezelor teoriei economice; construirea modelului
econometric şi rezolvarea acestuia.
Această definiţie restrictivă exclude din domeniul
econometriei cercetările economice care nu se fundamentează pe:
- o teorie economică - implicită sau explicită privind
modelul econometric al fenomenului, procesului sau sistemului
studiat;
-o interpretare aleatoare a modelului respectiv.
Astfel, analiza seriilor cronologice, modelul lui Leontief
(B.L.R.) ca şi statistica economică (care se fundamentează pe
metoda balanţelor) nu intră în sfera de cuprindere a econometriei:
7
prima, deoarece existenţa unei teorii economice nu este necesară,
iar ultimele două, fiindcă nu permit aplicarea metodelor inducţiei
statistice.
c) Definiţia extinsă a econometriei, promovată de
economiştii din ţările anglo-saxone, ţine seama de puternica
dezvoltare, apărută după 1950, a metodelor cercetării operaţionale:
teoria optimului, teoria stocurilor, teoria grafelor, teoria deciziilor,
teoria jocurilor, etc.
Prin econometrie, în sensul larg al termenului, se înţelege
econometria, definită în mod restrictiv, adică, include domeniile
menţionate atunci când ea este înţeleasă în sens restrictiv, la care se
adaugă metodele cercetării operaţionale. În prezent, în domeniul
econometriei se includ şi tehnicile moderne de analiză a datelor sau
analiza marilor tabele.
Deoarece încă nu s-a cristalizat o concepţie unitară privind
„frontierele" econometriei, în manualele sau tratatele de
econometrie, autorii, de regulă, îşi menţionează concepţia pe baza
căreia şi-au structurat lucrările.
În ţara noastră, atât în literatura de specialitate, deşi rareori se
fac precizări exprese, cât şi prin structura planurilor de învăţământ
de la facultăţile economice, econometria este concepută şi aplicată
ca metodă generală de investigare cantitativă a fenomenelor şi
proceselor economice -adică, în accepţiunea largă a termenului.
8
Un domeniu mai puţin abordat, atât teoretic, cât şi practic, îl
constituie metodele econometriei, în sensul restrictiv al
termenului, respectiv modelele aleatoare (stochastice).
Modelele deterministe, utilizate în mod curent şi de multă
vreme în teoria şi practica economică din ţara noastră, sunt de multe
ori inadecvate pentru a explica şi, mai ales, pentru a prognoza
pertinent evoluţia fenomenelor, proceselor sau sistemelor
economice, elemente dinamice prin natura lor.
De asemenea, în studiile mult mai recente, se insistă asupra
faptului că studiul seriilor de timp privind evoluţia fenomenelor
economice nu poate fi independent de teoria economică. Se au în
vedere, în acest sens, nu atât determinarea şi extragerea
econometrică a tendinţei, cât şi aspectele legate de efectul întârziat
în timp, propagarea impulsului unor variabile exogene asupra
variabilei prognozate, natura oscilaţiilor de diferite frecvenţe etc.
Acestea sunt motivele care au determinat ca modelele dinamice -
bazate pe analiza evoluţiei în timp a fenomenelor economice - să-şi
găsească locul în arsenalul modelelor econometrice prezentate în
acest curs.
1.2. 3 Locul şi rolul econometriei în sistemul ştiinţelor
economice
Apariţia şi rapida afirmare a econometriei trebuie înţeleasă şi
explicată prin prisma raportului dialectic dintre teorie şi practică, a
9
conexiunii inverse pozitive ce se manifestă între elementele acestui
raport.
Dezvoltarea continuă şi dinamică a forţelor de producţie sub
impactul progresului ştiinţific şi tehnic modifică condiţiile şi
interdependenţele din producţie, repartiţie, circulaţie şi consum, ceea ce,
pe plan teoretic şi practic, creează probleme dificile privind explicarea
şi dirijarea evoluţiei fenomenelor economico-sociale către anumiţi
indicatori ţintă, formulaţi şi urmăriţi de o anumită politică economică.
Necesitatea elaborării unor instrumente de investigare şi de
sporire a eficienţei metodelor de organizare, dirijare şi conducere a
economiei, pe de o parte, şi succesele metodelor statistico-matematice în
alte domenii ale ştiinţei - fizică, chimie, astronomie etc. - pe de altă
parte, au determinat adoptarea de către ştiinţele economice a acestor
metode.
Econometria s-a format şi se dezvoltă nu în urma unui proces de
diversificare a ştiinţei economice, ci prin integrarea dintre teoria
economică, matematică şi statistică.
În cadrul aceastei triade, teorie economică - matematică - statistică,
locul central îl ocupă teoria economică. Deşi penetrarea ştiinţei
economice de către metodele statistico-matematice reprezintă un progres
calitativ, nu trebuie uitat faptul că fenomenele economice, pe lângă
componenta lor cuantificabilă, conţin aspecte care nu pot fi
reprezentate prin cantitate. Aceste particularităţi ale fenomenelor
10
economice constituie, în general, limitele econometriei în sistemul
ştiinţelor economice.
De remarcat că raporturile econometriei cu ştiinţele economice nu
sunt numai de dependenţă.
Într-adevăr, un model econometric nu se poate elabora dacă nu s-a
constituit o teorie economică a obiectului cercetat. Similitudinea sa
formală cu obiectul economic investigat depinde de nivelul de
abstractizare a teoriei, de definirea univocă şi operaţională a noţiunilor şi
categoriilor economice, de scopurile urmărite de teoria economică -
scopuri euristice sau de dirijare privind obiectul studiat.
Modelul astfel construit reprezintă o verigă intermediară între
teorie şi realitate. El reprezintă o cale de confruntare a teoriei cu
practica, singurul mod de experimentare pe baza căruia ştiinţa
economică îşi poate fundamenta ipotezele, din moment ce obiectul său
de cercetare poate fi numai observat, nu şi izolat şi cercetat în
laborator.
Prin această experimentare, mijlocită de modelul econometric,
ştiinţele economice validează, renunţă sau elaborează metode noi, îşi
confruntă problemele de semantică şi semiotică economică,
îmbogăţindu-şi în felul acesta sistemul de informaţii privind structura şi
evoluţia obiectului economic.
În prezent, tipologia metodelor econometrice utilizate de ştiinţele
economice este extrem de vastă. Folosirea din ce în ce mai amplă a
acestor modele la investigarea fenomenelor economice se datorează
11
progreselor însemnate făcute în domeniul metodelor de estimare a
parametrilor modelelor şi al testelor de verificare pe care se
fundamentează acestea şi, nu în ultimul rând, al utilizării
calculatoarelor electronice care permit rezolvarea operativă a celor
mai complexe modele econometrice.
Particularizând legăturile econometriei cu unele dintre disciplinele
economice, este necesar să subliniem corespondenţa dintre modelarea
econometrică şi previziune. Previziunea macro sau microeconomică
reprezintă un domeniu care utilizează în mare măsură rezultatele
simulării şi, mai ales, ale predicţiei econometrice. Activitatea de
previziune a economiei este aceea care „oferă" o serie de elemente
utile elaborării modelului privind, îndeosebi, etapa de specificare a
acestuia. În această etapă, previziunea defineşte variabilele endogene
(rezultative) şi pachetul variabilelor exogene corespunzătoare
obiectivelor urmărite în funcţie de informaţiile statistice existente.
Econometria, la rândul ei, contribuie la obţinerea variantelor
economice, oferind informaţii cu privire la comportamentul
variabilelor endogene în diverse alternative de acţionare a pârghiilor
economice. În acest fel, previziunii economice i se oferă o perspectivă
în legătură cu ceea ce s-ar putea întâmpla în viitor, fie şi în linii mari, în
raport cu diferitele variante ale politicii economice care ar putea fi
aplicate.
Menţionăm, de asemenea, legătura econometriei cu sistemul
financiar-contabil, domeniu în care modelarea pătrunde tot mai mult -
12
vezi modelele ARCH. De asemenea, trebuie remarcat faptul că, la
elaborarea modelelor econometrice, se recomandă, cu o tot mai mare
insistenţă, introducerea relaţiilor financiar-bancare, ca fiind deosebit de
semnificative pentru descrierea mecanismelor economice.
Domeniul cooperării economice internaţionale, ca, de altfel, şi cel
privind comerţul interior, domeniu în care previziunile sunt greu de
realizat, altfel decât cu ajutorul metodelor statistice, reprezintă, de
asemenea, sectoare ale economiei ce pot beneficia de rezultatele
econometriei în ceea ce priveşte planificarea şi eficientizarea
activităţilor desfăşurate. Este totodată necesar să subliniem frecvenţa
tot mai mare a aplicării metodelor econometrice în lucrări din domeniul
biologiei, medicinei, demografiei şi, în special, în domeniul
marketingului, managementului sau viitorologiei.
În concluzie, se poate reţine ideea că metoda econometriei este
metoda modelării sau metoda modelelor. Modelul econometric - expresie
formală, inductivă a unei legităţi economice - reprezintă un mijloc de
cunoaştere a unui obiect economic, iar modelarea econometrică este o
metodă care conduce la obţinerea de cunoştiinţe sau informaţii noi
privind starea, structura (conexiunile dintre elemente) şi evoluţia unui
proces sau sistem economic.
1.2. 4 Noţiuni şi concepte fundamentale ale econometriei
Metoda modelelor sau metoda modelării reprezintă principalul
instrument de investigare econometrică a fenomenelor econometrice.
13
Dar, modelarea sau metoda modelelor nu constituie o noutate în
ştiinţa economică. Tabloul economic al economistului fiziocrat F.
Quesnay (1738), legile lui Engel (1857), coeficientul de elasticitate
formulat de Marshall (1890) reprezintă momente istorice de la care
cercetarea economică trece de la etapa descriptivă la etapa de
explicare formală a cauzelor şi formelor de manifestare ale fenomenelor
economice.
În general, MODELUL reprezintă un instrument de cercetare
ştiinţifică, o imagine convenţională, homomorfă, simplificată a
obiectului supus cercetării.
Fiind o construcţie abstractă, în care se neglijează proprietăţile
neesenţiale, modelul este mai accesibil investigaţiei întreprinse de
subiect, aceasta fiind una din explicaţiile multiplelor utilizări pe care
modelul le are în epoca contemporană.
Utilizat în economie, modelul - imagine abstractă, formală a unui
fenomen, proces sau sistem economic - se construieşte în concordanţă
cu teoria economică, rezultând modelul economic.
Modelul economic, reproducând în mod simbolic teoria economică
a obiectivului investigat, prin transformarea sa în model econometric,
devine un obiect supus cercetării şi experimentării (verificării), de la
care se obţin informaţii noi privind comportamentul fenomenului
respectiv.
În acest mod, reprezentările econometrice, spre deosebire de
modelele economice care explică structura fenomenului sau procesului
14
economic de pe poziţia teoriei economice, au întotdeauna o finalitate
practică, operaţională, ele devenind instrumente de control şi dirijare,
de simulare şi de previziune a fenomenelor economice.
VARIABILELE care formează structura unui sistem
econometric, după natura lor, pot fi:
a) variabile economice;
b) variabila eroare (aleatoare), u;
c) c) variabila timp, t.
a) Variabilele economice, de regulă, se împart în variabile
explicate, rezultative sau ENDOGENE, Y
i
, i = 1,n , şi variabile
explicative, factoriale sau EXOGENE, Xj, j = 1, k, independente de
variabilele endogene Y
i
; (n = numărul variabilelor rezultative; k =
numărul variabilelor factoriale). În cazul modelelor de simulare sau de
prognoză, variabilele Xj se mai împart în variabile exogene
predeterminate (variabile de stare a sistemului -ca pa ci t a t e a de
pr oduc ţ i e a unei î nt r epr i nde r i , s a u cu lag - x
t-
1, y
t
-1) şi
variabile instrumentale sau de comandă economică (dobânda,
impozitul pe profit etc.)
b) Variabila ALEATOARE, u, sintetizează ansamblul
variabilelor, cu excepţia variabilelor Xj, care influenţează variabila
endogenă Y
i
, dar care nu sunt specificate în modelul econometric.
Aceste variabile (factori), pe baza ipotezelor teoriei economice, sunt
considerate factori întâmplători (neesenţiali), spre deosebire de
15
variabilele Xj, care reprezintă factorii determinanţi (esenţiali) ai
variabilei Y
i
.
De asemenea, variabila eroare reprezintă eventualele erori de
măsură - erori întâmplătoare şi nu sistematice - conţinute de datele
statistice privind variabilele economice.
Pe baza acestor premise economice se acceptă că variabila
aleatoare „U" urmează o lege de probabilitate L(u), în acest scop
formulându-se o serie de ipoteze statistice cu privire la natura
distribuţiei acestei variabile, ipoteze statistice care vor trebui testate cu
teste statistice adecvate fiecărei ipoteze.
c) Variabila TIMP, t, se introduce în anumite modele econometrice
ca variabilă explicativă a fenomenului endogen Y
i
, imprimându-se
acestora un atribut dinamic, spre deosebire de modelele statice.
Deşi timpul nu poate fi interpretat ca variabilă concretă
(economică), se recurge la această variabilă explicativă (fictivă) din două
motive:
- în primul rând, timpul, ca variabilă econometrică,
permite identificarea unor regularităţi într-un proces evolutiv, ceea ce
constituie un prim pas spre specificarea precisă a unor variabile care
acţionează în timp;
- în al doilea rând, el reprezintă măsura artificială a acelor
variabile care acţionează asupra variabilei Y care, fiind de natură
calitativă, nu pot fi cuantificate şi, ca atare, nici specificate în
modelul econometric.
16
Un exemplu cunoscut în acest sens îl constituie funcţia de
producţie Cobb -Douglas cu progres tehnic autonom:
Q = A · K
α
· L
ß
· e
ct
· u (1.3.1)
unde:
Q = volumul fizic al producţiei;
K = capitalul;
L = forţa de muncă;
e = numărul natural;
t = timpul;
u = variabilă aleatoare;
A, α, β şi c = parametrii funcţiei,
c estemăsura econometrică a influenţei progresului tehnic asupra
volumului producţiei.
Sursa de date - Variabilele economice se introduc într-un
model econometric cu valorile lor reale sau empirice (yi = y1, y
2
, — ,y
n;
xi
= x1, x
2
,..., x
n
; n = numărul unităţilor observate). Aceste valori ale
variabilelor unui model se pot obţine pe două căi: fie pe baza
sistemului informaţional statistic (banca de date), fie prin efectuarea de
observări statistice special organizate - de tipul anchetelor statistice.
O problemă fundamentală care se ridică în această etapă o
reprezintă calitatea datelor statistice, respectiv autenticitatea şi
veridicitatea acestora. Dacă un model economic se construieşte cu date
17
false sau afectate de erori de măsură, el va căpăta aceste deficienţe,
fiind compromis sub aspect operaţional.
Deoarece problema autenticităţii datelor economice ţine de
domeniul statisticii economice, ne vom rezuma numai a aminti că datele
statistice care privesc variabilele economice specificate în model trebuie
să fie culese fără erori sistematice de observare şi de prelucrare,
îndeplinind condiţiile de omogenitate. Omogenitatea datelor presupune:
- colectarea lor de la unităţi statistice omogene;
- reprezentarea aceloraşi definiţii şi metodologii de calcul cu
privire la sfera de cuprindere ale acestora în timp sau în spaţiu;
- descrierea evoluţiei fenomenelor într-un interval de timp în care
nu s-au produs modificări fundamentale privind condiţiile de
desfăşurare a procesului analizat;
- exprimarea variabilelor în aceleaşi unităţi de măsură, condiţie
care se referă, în mod special, la evaluarea indicatorilor economici în
preţuri comparabile sau preţuri reale.
„Materia primă" pentru calcule economice o constituie seriile
cronologice (serii de timp sau serii dinamice), mai rar seriile teritoriale,
ale variabilelor economice respective, preluate sau construite pe baza
băncii de date statistice existente.
O serie cronologică se construieşte prin observarea variabilelor Y
şi X pe perioade egale de timp (t = 1,2,.., T, t reprezentând luni,
trimestre, ani) la aceeaşi unitate economică:
18
T 1 2 ... T
Xt x1 x2 ...
xT
y t y1 y2
... yT
În comparaţie cu aceasta, o serie de spaţiu rezultă prin observarea
variabilelor Y şi X într-o anumită perioadă de timp - lună, trimestru,
semestru, an - la un anumit număr de unităţi socio-economice
omogene, i = 1,n, unde n = numărul unităţilor de acelaşi profil, ce
aparţin aceluiaşi sector economic etc. O astfel de serie se prezintă, de
regulă, sub următoarea formă:
Xi x1 x2
... xn
Yi y1
y2 ...
yn
Într-un model econometric, un fenomen economic X={xi},i = 1,n
poate fi introdus cu următoarele valori:
1) Valori reale sau empirice, x
i
= (x
1
, x
2
,.., xn), valori exprimate în
unităţi de măsură specifice naturii fenomenului X, ele fiind mărimi
concrete şi pozitive, deci aparţin sistemului numerelor raţionale.
Vectorul valorilor lui X, x
i
= (x1, x2,.., xn), poate fi definit prin doi
parametri:
19
- media aritmetică a variabilei X

·

· ·
n
i
i
x x
n
x M
1
1
) (
(1.3.2)
- abaterea medie patratica a variabilei X

·
− · · ·
n
i
i x x
x x x
n
M
1
2 2
2
(
1
) (
) σ σ
(1.3.3)
) (
2 2
x
M
x
·
σ
fiind dispersia variabilei.
De obicei, se considera ca variabila X urmeaza o distributie
normala de medie
x
si de abatere medie patratica σx : L(x) = N(
x
, σx).
2) Valorile centrate :
x x x
i i

− ·
*

Aceste valori sunt tot mărimi concrete, dar ele aparţin sistemului
numerelor reale având atât valori pozitive cât şi negative.
Se poate demonstra uşor că aceste valori centrate au media egală
cu zero, iar dispersia lor este egală cu dispersia valorilor reale:
0 ) (
1
) (
*
· − ·


x x x i
n
M (1.3.4)
20
) ( ) (
1
) (
1
] ) [(
2
2 2
*
2
*
x x x x x
M
n n
M
i
· − · ·

∑ ∑
(1.3.5)
3) Valori centrate şi normate sau abateri standard:
σ
x
i
i
x x
x


·
* *
Media si dispersia acestor valori este:
0
1
) (
* *
·

·


σ
x
i
x x
x
n
M
(1.3.6)
1
1
] ) [(
2
2
2
2
* *
· ·

,
`

.
|

·


σ
σ
σ
x
x
x
i x x
x
n
M (1.3.7)
În plus faţă de aceste două proprietăţi L(x**) = N(0;1)
2
, abaterile
standard sunt mărimi abstracte (adimensionale). Aceste calităţi conduc,
atât la diminuarea calculelor statistice cu aceste valori, cât şi la
2
Relaţia L(x**) = N(0;1) se citeşte: variabila
( ) x
i
x
x x
− ·
σ
1
* *
urmează legea de probabilitate
normală având media egală cu zero iar abaterea medie pătratică este egală cu unu (legea normală, centrată şi
redusă).
21
efectuarea de comparaţii între distribuţiile mai multor fenomene
economice de naturi diferite.
Un model econometric poate fi format dintr-o singură relaţie sau
dintr-un sistem de relaţii statistice. Aceste relaţii pot fi: relaţii de
identitate sau deterministe, relaţii de comportament, relaţii tehnologice
şi relaţii instituţionale.
Relaţiile de identitate sunt de tipul ecuaţiilor de balanţă folosite în
„Sistemul de balanţe ale economiei naţionale"
Relaţiile de comportament sunt acele ecuaţii stochastice care
reflectă şi modelează un proces de luare a deciziei, care încearcă să
descrie răspunsul variabilei endogene Y, sub forma deciziei, la un set de
valori ale variabilelor exogene. De exemplu, într-un model
macroeconomic, relaţiile de comportament se referă la dependenţe
privind consumul, investiţiile, importul şi exportul, sistemul de preţuri,
cererea monetară, etc.
Relaţiile tehnologice descriu atât imperativele de ordin tehnologic
privind producţia cât şi relaţiile tehnico-economice existente în
producţie, forţa de muncă şi fondurile de producţie ale unei unităţi, ale
unei ramuri sau ale economiei naţionale. Aceste relaţii tehnologice sunt
reprezentate de cunoscutele funcţii de producţie de diferite tipuri.
Relaţiile instituţionale sunt folosite pentru a explica în mod
determinist sau stochastic fenomenele care sunt determinate fie de lege,
fie de tradiţie sau fie de obiceiuri. Din rândul acestora fac parte, de
22
exemplu, ecuaţiile care explică stabilirea impozitelor sau a cotizaţiilor
în funcţie de venit.
Tipologia modelelor econometrice este extrem de vastă. Totuşi, un
model econometric poate fi construit prin intermediul unei singure
ecuaţii de comportament, tehnologice sau instituţionale, sau cu ajutorul
unui sistem de ecuaţii de genul celor patru relaţii, menţionate mai sus,
denumite modele cu ecuaţii multiple.
Testele statistice
3
sunt instrumente de lucru indispensabile
investigaţiei econometrice. Necesitatea utilizării acestora este
determinată de faptul că demersul econometric constă într-o înşiruire
logică de ipoteze privind semnificaţia variabilelor exogene, a calităţii
estimaţiilor obţinute, a gradului de performanţă a modelelor
construite. Acceptarea sau respiungerea ipotezelor formulate în
econometrie se poate face cu ajutorul mai multor teste, cele mai uzuale
fiind: testul χ
2
, testul t, testul F etc.
Pe lângă aceste teste statistice, în practica curentă, în diverse
domenii, se foloseşte frecvent un test denumit „testul erorii". În general,
aplicarea acestui test presupune compararea a două valori:
0 = valoarea observată sau estimată;
T = valoarea teoretică, aşteptată sau prognozată.
Pe baza celor două valori se definesc:
- eroarea absolută,
T
ea
− · 0
;
3
Vezi- ipoteză statistică, test, eroare de gradul 1 şi gradul 2, preg de semnificaţie, nivel de semnificaţie- Dicţionar
statistic economic, D.C.S., Bucureşti, 1969
23
- eroarea relativă, 100 *
0
T
T
er

·
Se construiesc cele două ipoteze:
H0: 0 ≈ T ;
H1: 0 ≠ T.
Stabilindu-se arbitrar o valoare absoluta (Ea) sau relativa (Er)
4
de
echivalare a celor doua valori, (0) si (T), regula de (alegere) decizie a
celor doua ipoteze este urmatoarea:
24 este acceptată ipoteza H0 dacă Ea ≤ e
a
sau Er ≤ e
r
. → cele două
valori, (0) şi (T), sunt echivalente, adică diferenţele dintre ele sunt
întâmplatoare şi nu sistematice;
24 este acceptată ipoteza H1 dacă Ea > e
a
sau Er > e
r
. → cele doua
valori, (0) si (T), diferă semnificativ si nu pot fi considerate ca
echivalente, respectiv extrase din aceeaşi urnă sau dintr-o colectivitate
omogenă.
Acest test al erorii este utilizat în mod curent în domeniul analizei
statistico-economice a variatiei în timp şi/sau în spaţiu a unui fenomen
economic, dar poate fi aplicat şi în domeniul econometriei, dar cu
discernamânt şi nu în mod excesiv.
4
Un astfel de test şi criteriu de decizie se utilizează în comerţul cu produse îmbuteliate sau ambalate pentru care, de
regulă, criteriul de decizie este de t 5% din volumul sau greutatea , T, a ambalajului
24
1.3. Întrebări
1. Care este definiţia istorică a econometriei formulată
de catre R. Frisch?
2. Care este definiţia extinsă a econometriei promovată
de economiştii din ţările anglo-saxone?
3. Definiţi modelul economic.
4. Definiţi variabilele economice.
5. Definiţi variabilele aleatoare.
25
6. Care sunt cele două motive pentru care se recurge la
variabila timp?
7. Ce presupune omogenitatea datelor?
8. Care sunt relaţiile statistice ce formează un model
econometric? Definiţi-le.
9. Cu ce valori poate fi introdus un fenomen economic
într-un model econometric?
10. Ce presupune testul erorii?
1.4. Probleme rezolvate
A. Caz privind asocierea a două variabile alternative (binare)
O societate comercială se aprovizionează de la 2 furnizori A şi B.
După primirea ultimelor două loturi de piese se ştie că:
-furnizorul A a trimis 400 de piese din care 60 au fost rebuturi;
26
- furnizorul B a trimis 600 de piese din care 70 au fost rebuturi.
Conducerea societăţii ar dori să renunţe la furnizorul A pe
motivul unei calităţi inferioare a produselor sale în raport cu cele ale
furnizorului B. Este corectă această decizie?
Rezolvare:
Fundamentarea statistică a deciziilor corecte se poate realiza
prin sistematizarea datelor într-un tabel de forma:
Tabelul 1.
Denumirea
furnizorul
ui (x )
Calitatea pieselor
(y )
Total
(Ni )
Rebuturi bune
A 60 340 400
B 70 530 (n
ij
) 600
Total ( N
j
) 130 870 1000 (N)
unde:
X = { x i }, i =
k , 1
variabila independentă,
x1 = furnizorul A,
x
2
= furnizorul B,
Y = {y
j
} , j =
m , 1
variabila dependentă,
y1 = piese rebut,
y 2 = piese bune,
27
n
ij
= frecvenţele condiţionate ale variabilei Y, de exemplu:
n11 = piesele rebut trimise de furnizorul A,
n 22 = piesele bune trimise de furnizorul B.
În urma acestei sistematizări a rezultat o serie statistică
bidimensională, cu două variabile binare X şi Y, rezultând două
distribuţii marginale:

şi două distribuţii condiţionate ale variabilei Y (calitatea pieselor) în
funcţie de furnizori:
N . i = frecvenţele marginale ale variabilei X,
N
j .
= frecvenţele marginale ale variabilei Y,
N =

i
N . i =

j
N j . =

i

j
nij = numărul total al observaţiilor.
În cazul unei distribuţii bidimensionale, în funcţie de modul de
distribuire al frecvenţelor n
ij
, se poate constata:
a) independenţă totală între cele două variabile dacă
n
ij
=
k
N
i.
= ct sau n
ij
=
m
N
j .
=ct ;
28

,
`

.
| · ·
600 400
0 1
:
2 1
x x
X

,
`

.
| · ·
340 60
0 1
:
2 1
y y
y
A

,
`

.
| · ·
530 70
0 1
:
2 1
y y
y
B

,
`

.
| · ·
870 130
0 1
:
2 1
y y
Y
b)o dependenţă strictă între cele două variabile dacă frecvenţele
condiţionate n
ij
se distribuie numai pe diagonala principală a tabelului
(corelare pozitivă, x1 cu y1 şi x
2
cu y 2 ) sau numai pe diagonala
secundară a tabelului (corelare negativă, x1 cu y 2 şi x
2
cu y1 ), pentru
celelalte rubrici ale tabelului aceste frecvenţe fiind egale cu zero;
c) o dependenţă statistică dacă frecvenţele condiţionate n
ij
se
distribuie într-un mod diferit de cele două cazuri a) şi b); în această
situaţie, analiza statică va conduce fie la acceptarea cazului a)
(independenţă), fie la acceptarea cazului c) (dependenţă slabă, medie,
puternică etc).
Analizând datele din tabelul 1.1.1. se observă că
distribuţia frecvenţelor condiţionate n
ij
se încadrează în cazul c).
Deci, în cadrul acestei probleme, decizia corectă poate fi luată pe baza
a cel puţin trei procedee statistice.
a) Testul diferenţei două medii
Se ştie că dacă:
t c =
1 1
2
2
1
2
2 1
2 1

+


n n
x x
x x
σ σ

t α,
cele două medii 1
x
şi 2
x
sunt semnificativ diferite de zero şi, invers, 1
x
= 2
x
dacă:
29
t c =
1 1
2
2
1
2
2 1
2 1

+


n n
x x
x x
σ σ < t α
unde:
t
a
= argumentul distribuţiei normale, dacă n

30, sau
argumentul distribuţiei Student, dacă n < 30;
α
= pragul de semnificaţie (riscul) cu ajutorul căruia se alege
decizia corectă; de regulă, în economie se lucrează cu un prag de
semnificaţie de 0,05 (5%) sau, cel mult, de 0,01 (1%).
În cazul de faţă, aplicarea acestui test constă în
efectuarea următoarelor calcule:
- calculul procentului mediu al rebuturilor pe fiecare furnizor:
f A =
. 1
11
N
n
=
400
60
= 0,15 sau 15% f B =
. 2
21
N
n
=
600
70
= 0,1167 sau
11,67%
- calculul dispersiilor:
2
A
σ
= f A (1 - f A ) = 0,15∗ 0,85 = 0,1275
2
B
σ
= f B (1 - f B ) = 0,1167 ∗ 0,8833 = 0,1031
- alegerea pragului de semnificaţie
α
şi preluarea valorii acestuia
din tabelul distribuţiei respective; pentru
α
= 0,05,din tabela
distribuţiei normale se preia valoarea t
05 , 0
= 1,96 .
- compararea valorii empirice a variabilei t
c
cu valoarea sa teoretică
t
05 , 0
:
30
t c =
599
1031 , 0
399
1275 , 0
1167 , 0 15 , 0
+

1 1
2
2
1
2

+


N N
f f
B A
B A
σ σ =1 , 5
- interpretarea testului:
Deoarece t c = 1,5 < t
05 , 0
= 1,96 rezultă că între calitatea
pieselor livrate de cei doi furnizori, cu o probabilitate de 0,95 (95%), nu
se poate accepta o diferenţă semnificativă şi, ca atare, nu este corectă
decizia de a se renunţa la furnizorul A pe motivul unei mai slabe calităţi
a pieselor.
b) Testul
2
χ
Aplicarea testului
2
χ
constă în compararea unei valori
empirice

cu o valoare teoretică
2
;v a
χ
, unde:
α
= pragul de semnificaţie;
v= (k-1)(m - 1) = numărul gradelor de libertate, m fiind numărul
de grupe în funcţie de variabila Y (y
j
,
,j =
m , 1
), iar k este numărul de
grupe în funcţie de variabila X (x i ,i =
k , 1
), preluat din tabela
distribuţiei
2
χ
în funcţie de un prag de semnificaţie
α
şi de numărul
gradelor de libertate
ν
. În acest caz, pentru
α
= 0,05 şi
ν
= (2 - 1)
(2 - 1) =1, din tabel rezultă
2
1 ; 05 , 0
χ
=3,84,iar pentru
α
= 0,01 rezultă
2
1 ; 01 , 0
χ
=
6,63 .
Valoarea empirică a variabilei aleatoare
2
c
χ
se calculează cu relaţia:
2
c
χ
=

i

j
( )
2



ij
ij ij
n
n n
31
2
c
χ
unde:
n
ij
= frecvenţele reale, i = 1,2
,
j =1,2;
n* = frecvenţele teoretice în cazul independenţei totale a celor două
variabile x i şi y
j
;
n

ij =
N
N N
j i . .
- calculul acestor frecvenţe teoretice rezultă din următoarele relaţii:
n

11
=
N
N N
1 . . 1
=
52
1000
130 400
·

n

12
=
N
N N
2 . . 1
=
348
1000
870 400
·

n

21
=
78
1000
130 600
1 . 2
·

·
N
N N
n

22
=
522
1000
870 600 .
2 . 2
·

·
N
N N
-calculul valorii empirice:
2
c
χ
=
( )
2
2
1
2
1


· ·

∑ ∑
ij
ij ij
j i
n
n n
2
c
χ
=
( ) ( ) ( ) ( )
36 , 2 35779 , 2
522
522 530
78
78 70
348
348 340
52
52 60
2 2 2 2
≈ ·

+

+

+

Utilizarea testului
2
χ
se bazează pe următoarele reguli de decizie:
- dacă
2
c
χ
<
2
;v a
χ
, rezultă că cele două variabile X şi Y sunt
independente;
32
- dacă
2
c
χ

2
;v a
χ
, rezultă că cele două variabile X şi Y nu sunt
independente.
Deoarece
2
c
χ
=
2,36 <
2
1 ; 05 , 0
χ
=3,84, rezultă că cele două variabile
sunt independente, deci calitatea pieselor nu depinde de tipul furnizorilor
şi, ca atare, nici decizia de a rezilia contractul cu furnizorul A nu este
justificată.
c) În cazul unei grupări combinate de 2x2, adică 2 variabile care
au 2 variante, analiza statistică a legăturii dintre acestea se poate
face şi cu ajutorul coeficientului de asociere al lui Yulle, definit prin
relaţia:

·
c
θ
cu abaterea medie pătratică:
Acest coeficient este definit în intervalul
[ ] 1 ; 1 − ∈ θ
, având
semnificaţia:
θ
= -1

corelaţie strict negativă între variabile;
θ
= 0

independenţă între variabile;
θ
= 1

corelaţie strict pozitivă între variabile.
33
21 12 22 11
21 12 22 11
n n n n
n n n n
+

22 21 12 11
2
0
1 1 1 1
2
1
n n n n
+ + +

·
θ
σ
Pentru cazul analizat, valorile acestor indicatori sunt:
Ştiind că variabila
θ
este o variabilă aleatoare ce urmează o
distribuţie normală N(0, θ
σ
), valoarea empirică c
θ
se acceptă
că este semnificativ diferită de zero daca, rezulta ca intre cele
doua variabilesemnificativ diferită de zero dacă
rezultă că între cele doua variabile există o legătură, iar dacă
θ
σ
θ
c
<
α
t
rezultă că valoarea lui c
θ
nu este semnificativ diferită de zero, ceea
ce presupune că cele două variabile sunt independente.
Ştiind că t
05 , 0
= 1,96 iar valoarea
θ
σ
θ
c
=
0926 , 0
1439 , 0
=1,55< t
05 , 0
=1,96 ,
rezultă că cele două variabile sunt independente, situaţie care conduce la
aceeaşi concluzie ca
şi în cazul punctelor a) şi b): rezilierea contractului cu furnizorul A nu
poate fi justificată de aprecierea unei calităţi mai slabe a produselor
acestuia.
B. Caz privind asocierea a două variabile calitative nealternative
34
1437 , 0
23800 31800
23800 31800
70 340 530 60
70 340 530 60
·
+

·
∗ + ∗
∗ − ∗
·
c
θ
0926 , 0
70
1
530
1
60
1
340
1
2
0207 , 0 1
· + + +

·
θ
σ
α
θ
σ
θ
t
c

În urma efectuării unui sondaj statistic s-au obţinut următoarele date
privind distribuţia pe ramuri ale economiei naţionale a şomerilor, grupaţi
pe trepte de calificare:
Tabelul 1
Ramur
i ale
econo
Trepte de calificare a
şomerilor
Total
persoan
e
necalific
aţi
calificare
medie şi
calificare
superioa
Industrie
400
500
257
200
143
100
800
Construcţ
ii
100
100
64
50
36
50
200
Alte
ramu
ri
200
100
129
200
71
100
( )
ij
n
400
Total
persoan
700 450 250 1400 (N)
Analizaţi datele din tabel şi precizaţi dacă se poate admite o asociere
între profilul ramurilor economice şi calificarea şomerilor.
Rezolvare:
Datele problemei se referă la dependenţa dintre două variabile
nominale
k i x X
i
, 1 , ( ·
- ramurile economiei naţionale) şi
m j y Y
j
, 1 , ( ·
-
trepte de calificare ale şomerilor) ale căror variante sunt în număr mai
mare de două (k=3>2, m= 3>2)- cazul unui tabel de k
×
m rubrici.
35
Deoarece frecvenţele condiţionate
ij
n
nu sunt nici constante pe liniile
tabelului şi nici distribuite numai pe rubricile diagonalei principale sau
secundare, distribuţia acestora arată că poate fi acceptată ipoteza unei
dependenţe statistice între cele două variabile. În acest caz, acceptarea
sau respingerea ipotezei de dependenţă statistică dintre cele două
variabile se poate face cu ajutorul testului
2
χ
. Utilizarea acestui test
presupune următoarele operaţii:
- preluarea valorii teoretice a variabilei
2
χ
din tabel în funcţie de
un prag de semnificaţie
α
şi de numărul gradelor de libertate
), 1 )( 1 ( − − · m k ν
respectiv pentru
α
= 0,05 şi
ν
= (3-1)(3-1)=4 din
tabelă rezultând
94 , 9
2
4 ; 05 , 0
· χ
, iar pentru
α
= 0,01,
3 , 13
2
4 ; 01 , 0
· χ
.
- calculul valorii empirice a variabilei aleatoare
2
c
χ
cu ajutorul
relaţiei:

2
c
χ

=
( )
2



∑ ∑
ij
ij ij
j i
n
n n
unde: n
ij
= frecvenţele reale, i =
, 3 , 1
j=
; 3 , 1

ij
n
= frecvenţele teoretice în cazul independenţei totale a celor
două variabile X şi Y;
Pe baza datelor din tabel, aceste frecvenţe teoretice sunt egale cu:
36
N
N N
n
j i
ij
. .
·

400
1400
700 800 .
1 . 1
11
·

· ·

N
N N
n 257
1400
450 800
2 . . 1
12
·

· ·

N
N N
n
143
1400
250 800
3 . . 1
13
·

· ·

N
N N
n 100
1400
700 200
1 . . 2
21
·

· ·

N
N N
n
64
1400
450 200
2 . . 2
22
·

· ·

N
N N
n 36
1400
250 200
3 . . 2
23

· ·

N
N N
n
200
1400
700 400
1 . . 3
31
·

· ·

N
N N
n 129
1400
450 400
2 . . 3
32
·

· ·

N
N N
n
71
1400
250 400
3 . . 3
33
·

· ·

N
N N
n
( ) ( ) ( ) ( )
+

+

+

+

·
2 2 2 2
2
100
100 100
143
143 100
257
257 200
400
400 500
c
χ
( ) ( ) ( ) ( )
+

+

+

+

+
2 2 2 2
129
129 200
200
200 200
36
36 50
64
64 50 ( )
160
2
71
71 100
·

-compararea valorii empirice
2
c
χ
cu valoarea sa teoretică:
Deoarece
2
c
χ
= 160 >
94 , 9
2
4 ; 05 , 0
· χ
rezultă că ipoteza de
independenţă dintre variabile nu poate fi acceptată şi, deci, distribuţia
şomerilor pe trepte de calificare este influenţată de structura pe ramuri
ale economiei naţionale. Cu alte cuvinte, trecerea în şomaj a salariaţilor
nu s-a făcut întâmplător, predominând şomerii necalificaţi, urmând cei cu
pregătire medie şi, pe ultimul loc, şomerii cu pregătire superioară
37
C. Caz privind asocierea dintre o variabilă calitativă
independentă şi o variabilă numerică dependentă
O întreprindere de automobile poate să-şi echipeze vehiculele
cu două tipuri de pneuri A şi B. În urma încercării a două loturi de
100 de pneuri din fiecare tip au rezultat următoarele date:
Tabelul.3.
Tipuri
de
pneuri
Rezistenţa la uzură (1000 km
parcurşi)
( ) m j y
j
, 1 , ·
Total
( )
. i
N
sub
25
25-30 30-35 35-
40
40-
45
peste
45
A 2 8 20 40 20 10 100
B 17 13 40 20 8 ( )
ij
n
2
100
Total 19 21 60 60 28 12 200 (N)
Recomandaţi întreprinderii ce tip de pneu va trebui să
folosească, ştiind că preţul de vânzare a celor două tipuri de pneuri este
acelaşi.
Rezolvare:
Această problemă abordează cazul dependenţei dintre două variabile
de natură diferită. Variabila cauzală X -
tipurile de pneuri, este o caracteristică nominală, în timp ce variabila
efect Y - rezistenţa la uzură, este o variabilă numerică.
Rezolvarea acestei probleme presupune parcurgerea a două etape:
- prima etapă se referă la acceptarea sau respingerea ipotezei
38
de dependenţă dintre cele două variabile;
- a doua etapă urmează numai în cazul acceptării ipotezei de
dependenţă între variabile şi necesită alegerea tipului de pneu cu cea
mai mare rezistenţă la uzură; se deduce uşor că în cazul
independenţei dintre cele două variabile, rezistenţa la uzură nu
depinde de tipul pneului, întreprinderea putând utiliza oricare dintre
ele.
O astfel de problemă poate fi rezolvată cu ajutorul mai
multor procedee statistice - testul
2
χ
, testul diferenţei dintre două
medii şi metoda analizei variaţiei.
Deoarece primele două procedee au fost deja expuse (vezi
problemele A şi B) şi, în plus, acestea necesită calcule suplimentare,
pentru etapa a doua recomandăm abordarea unor probleme de acest tip cu
ajutorul metodei analizei variaţiei.
Metoda analizei variaţiei se fundamentează pe discuţia următoarelor
distribuţii:
-distribuţia marginală a variabilei
; , 1 , :
.
m j
N
y
Y
j
j
·

,
`

.
|
- distribuţiile condiţionate ale variabilei Y în funcţie de variantele
variabilei factoriale
Pe baza acestor distribuţii se calculează trei mărimi:
39
. , 1 , , 1 , : : m j k i
n
y
Y X
ij
j
x
i
· ·

,
`

.
|
- varianţa totală
2
0
V
(sau dispersia totală ) calculată
pe baza distribuţiei marginale a lui Y cu ajutorul relaţiei:
( ) ( )
j j
j
ij j
m
j
k
i
N y y n y y V
.
2
0
2
0
1 1
2
0
− · − ·
∑ ∑ ∑
· ·
unde:

N
N y
N
N y
n
n y
y
i
i
i
j
j j
j
ij
i
j
ij j
i
.
.
0


∑ ∑
∑ ∑
· · ·
reprezintă media distribuţiei marginale,iar
i
x i
y y ·
sunt mediile
condoţionate ale variabilei Y in funcţie de variantele variabilei factoriale
X.

. i
j
ij j
j
ij
ij
j
j
i
N
n y
n
n y
y



· ·
Această mărime,
2
0
V
, măsoară variaţia totală a variabilei Y generată
de influenţa întregului complex de factori ce o determină.
- varianţa dintre grupe
2
x
V
este măsura variaţiei variabilei Y generată
de variaţia caracteristicii factoriale X. Această mărime se calculează cu
relaţia:
- varianţa reziduală
2
u
V
este o mărime care exprimă variaţia
caracteristicii Y generată de factorii consideraţi aleatori, exceptând
influenţa factorului X. Relaţia de calcul a acestei mărimi este:
( )
ij
j
i i
i
u
n y y V
2
2
∑ ∑
− ·
40
N
V
2
0 2
0
· σ
( ) ( )
.
2
0
2
0
2
i
i
i ij
j
i
i
x
N y y n y y V
∑ ∑ ∑
− · − ·
¹
¹
¹
¹
¹
¹
¹
'
¹

↓⇒
↑⇒

·
dependente strict variabile 1
puternic ă corelatie
0,5
slabă corelatie
te independen variabile 0
R Dac ă
Se poate demonstra că între cele trei mărimi există relaţia:
2
0
V
=
2
x
V
+
2
u
V
Raportând relaţia de mai sus la
2
0
V
se obţine contribuţia relativă a
factorului esenţial

,
`

.
|
%
2
0
2
V
V
X
x
şi a factorilor întâmplători

,
`

.
|
%
2
0
2
V
V
u
u
la explicarea variaţiei totale.
100=
100 100
2
0
2
2
0
2
⋅ + ⋅
V
V
V
V
u x
Indicatorul
2
0
2
2
0
2
1
V
V
V
V
R
u x
− · ·
poartă numele de raport de
corelaţie empirică şi exprimă intensitatea legăturii dintre cele două
variabile. Se deduce uşor că acest indicator este definit în
intervalul
[ ]. 1 , 0
Interpretarea valorilor raportului de corelaţie empirică se face pe
baza următoarelor reguli:
41
Dacă datele provin dintr-o cercetare selectivă, înainte de a explica
variaţia lui Y şi a interpreta valoarea raportului de corelaţie empirică
va trebui să se verifice semnificaţia rezultatelor. Testarea
semnificaţiei rezultatelor se face cu ajutorul testului

F

- testul Fisher-
Snedecor.
Rezultatele se consideră semnificative (R este semnificativ diferit
de zero) dacă există inegalitatea:
2 1
; ; v v c
F F
α

unde:
k N
V
k
V
F
u
x
c


·
2
2
1
, reprezintă valoarea empirică a variabilei
Fisher-Snedecor;
2 1
; ; v v
F
α ,
k N k − · − ·
2 1
, 1ν ν
este valoarea teoretică preluată din tabela
distribuţiei Fisher-Snedecor în funcţie de un prag de
semnificaţie
α
şi de numărul gradelor de libertate 1
ν
şi 2
ν
.
Pe baza datelor din tabelul 4 se vor calcula indicatorii necesari
aplicării metodei analizei variaţiei:
- calculul rezistenţei medii la uzură
( )
A
y
şi a dispersiei
( )
2
A
σ
pentru
pneurile de tip A.
Fie: k = mărimea intervalului de grupare, k=5;
a= mărimea centrului de interval cu frecvenţa maximă, a=37,5.
42
k = 5, a = 37,5
Tabelul. 4
20-25 22,5 2 -3 -6 18
25-30 27,5 8 -2 -16 32
30-35 32,5 20 -1 -20 20
35-40 37,5 40 0 0 0
40-45 42,5 20 1 20 20
45-50 47,5 10 2 20 40
Total - 100 - -2 130
43
4 , 37 5 , 37 5
100
2
1
1
· + ⋅

· +

,
`

.
| −
·


a k
n
n
k
a y
y
j
j
j
A
( ) ( )
2
2
2
1
1
2
2
5 , 37 4 , 37 25
100
130
− − ⋅ · − − ⋅

,
`

.
| −
·


a y k
n
n
k
a y
A
j
j
j
A
σ
49 , 32 01 , 0 5 , 32
2
· − ·
A
σ
- calculul rezistenţei medii la uzură
( )
B
y
şi al dispersiei
( )
2
B
σ
) pentru
pneurile de tip B.
k = 5, a= 32,5 Tabelul 5
Rezistenţa la
uzură (1000
km parcurşi)

j
y
j
n
2
k
a y
j

j
j
n
k
a y
2

,
`

.
| −
j
j
n
k
a y
2
2

,
`

.
| −
20-25 22,5 17 -2 -34 68
25-30 27,5 13 -1 -13 13
30-35 32,5 40 0 0 0
35-40 37,5 20 1 20 20
40-45 42,5 8 2 16 32
45-50 47,5 2 3 6 18
Total - 100 - -5 151
25 , 32 5 , 32 5
100
5
· + ⋅

·
B
y
( ) 69 , 37 06 , 0 75 , 37 5 , 32 25 , 32 25
100
151
2 2
· − · − − ⋅ ·
B
σ
- calculul rezistenţei medii la uzură
) (
0
y
şi al dispersiei
( )
2
0
σ
pe
ansamblul celor două tipuri de pneuri (distribuţia marginală a variabilei
Y).
Tabelul 6
Rezistenţa la
uzură
(1000 km
parcurşi)
j
y
j
N
.
k
a y
j

j
j
N
k
a y
.

,
`

.
| −
j
j
N
k
a y
.
2

,
`

.
| −
20-25 22,5 19 -2 -38 76
25-30 27,5 21 -1 -21 21
30-35 32,5 60 0 0 0
35-40 37,5 60 1 60 60
40-45 42,5 28 2 56 112
45-50 47,5 12 3 36 108
Total - 200 - 93 377

- calculul varianţelor:
• Varianţa totală
( ) ( )
∑ ∑ ∑
· − · − ·
j j
j j ij j
i
N N y y n y y V
2
0 .
2
0
2
0
2
0
σ

8 , 8343 719 , 41 200
2
0
· ⋅ · V
825 , 34 5 , 32 5
200
93
.
.
.
.
0
· + ⋅ · +

,
`

.
| −
· ·




a k
N
N
k
a y
N
N y
y
j
j
j
j
j j
( )
( )
2
0
2
.
.
2
.
2
0 2
0
a y k
N
N
k
a y
N
N y y
j
j
j
j j
− −

,
`

.
| −
·

·



σ
( ) 719 , 41 406 , 5 125 , 47
2
5 , 32 825 , 34 25
200
377
2
0
· − · − − ⋅ · σ
• Varianţa dintre grupe:
( ) ( ) ( )

· ⋅ − + ⋅ − · − ·
i
i i x
N y y V 13 , 1326 100 825 , 34 25 , 32 100 825 , 34 4 , 37
2 2
.
2
0
2
• Varianţa reziduală:
( ) 7018 100 69 , 37 100 49 , 32
2
1 1
2
2
2
· ⋅ + ⋅ · · − ·
∑ ∑ ∑
· j
i i ij i j
i
u
N n y y V σ
- interpretarea rezultatelor se realizează utilizând tabelul analizei
variaţiei:
Tabelul 7
Sursa
de
Măsura
variaţiei
Nr.
grade
Dispersi
a
Valoarea testului
c
F
2 ; 1
; ; v v
F
α
Varian
ţa
dintre
grupe
( )
13 , 1326
.
2
0
2
·
− ·
∑ i x
N y y V
i
k-1=1 13 , 1326
1
2
2
/
·

·
k
V
s
x
x y
F
0,05;1;198
=3,8
9
F
0,01;1;198
=6,7
6
Varian
ţa
rezidu
ală
( )
7018
2
2
·
− ·
∑ ∑
j
ij i j
i
u
n y y V
N-
k=198
44 , 35
2
2
·

·
k N
V
s
u
u
- -
42 , 37
2
2
/
·
·
u
x y
c
s
s
F
Varian
ţa
totală
( )
8 , 8343
2
0
2
0
·
− ·
∑∑
i j
ij j
n y y V
N-
1=199
- - -
Deoarece testul Fisher-Snedecor arată că rezultatele obţinute nu
sunt întâmplătoare, cu un prag de semnificaţie de 1%
, 76 , 6 42 , 37
198 ; 1 ; 01 , 0
· > · F F
C
ci sistematice, se vor calcula contribuţia
relativă a factorului X - marca pneurilor, la explicarea variaţiei variabilei
Y

,
`

.
|
%
2
0
2
V
V
x
şi raportul de corelaţie empirica (R):
% 89 , 15 100
8 , 8343
13 , 1326
100
2
0
2
· ⋅ · ⋅
V
V
x
399 , 0
8 , 8343
13 , 1326
2
0
2
· · ·
V
V
R
x
Întrucât marca pneurilor explică în mică măsură variaţia totală
a uzurii pneurilor, respectiv numai 15,89%, iar raportul de corelaţie are
o valoare de asemenea mică, 0,399, rezultă faptul că tipul de pneuri nu
reprezintă un factor important al uzurii şi, prin urmare, ierarhizarea
pneurilor nu se poate face în funcţie de acest factor. Din acest punct de
vedere, întreprinderea de automobile îşi poate echipa vehiculele cu orice
tip de pneu, eventual alegerea putându-se realiza după alţi factori:
facilităţi de aprovizionare, renumele mărcii etc.
D Caz privind corelaţia dintre două variabile numerice
În urma unui studiu statistic efectuat asupra unui eşantion de 110
societăţi comerciale cu acelaşi profil a rezultat următoarea distribuţie
a acestora în funcţie de capitalul social şi de profitul brut realizat:
Tabelul 8
Grupe de
societăţi după
mărimea
Grupe de societăţi după profitul
brut (mii.lei)
Total
sub
30
30-
50
50-
70
70-
90
90-
11
110
-
130
-
pes
te sub 50 7 2 1 - - - - - 10
50 - 100 2 10 9 4 - - - - 25
100 - 150 1 4 15 10 6 4 - - 40
150 - 200 - - - 5 9 4 2 - 20
peste 200 - - -
) (
ij
n
- 3 7 5 15
Total
( )
j
N
. 10 16 25 19 15 11 9 5 110
(N)
Pe baza acestor rezultate se poate considera că mărimea profitului
brut depinde în mod hotărâtor de capitalul social al societăţilor de acest
profil?
Rezolvare:
Tabelul 8 poartă numele de tabel de corelaţie deoarece în cadrul
acestuia, a fost sistematizată distribuţia celor 110 societăţi în funcţie de
două variabile numerice:
X - capitalul social al societăţilor comerciale - variabilă
factorială;
Y - profitul brut al societăţilor comerciale - variabilă
rezultativă.
Un astfel de tabel se foloseşte în scopul acceptării sau respingerii
ipotezei de lucru, respectiv din ansamblul factorilor de influenţă ai
variabilei Y, factorul X este factorul hotărâtor, determinant al variabilei
Y.
Fiind o serie bidimensională analiza acesteia se efectuează după
aceleaşi principii prezentate în aplicaţia A. Deoarece frecvenţele
ij
n
se
distribuie cu cele mai mari valori de-a lungul diagonalei principale, dar
înregistrând valori şi la stânga şi la dreapta faţă de această diagonală,
rezultă că între cele două variabile se manifestă o legătură statistică în
sens direct.
În acest caz, discuţia legăturii statistice se poate face cu ajutorul mai
multor procedee cum ar fi:
a) metoda analizei variaţiei ;
b) şi metoda regresiei.
Întrucât metoda regresiei necesită precizări suplimentare, care vor fi
făcute în capitolul următor, caracterizarea statistică a dependenţei dintre
capitalul social şi profitul brut al societăţilor se va face numai cu ajutorul
metodei analizei variaţiei. Utilizarea sa în acest scop va decurge în mod
analog cu aplicarea sa din problema precedentă:
- calculul mediilor parţiale
, 5 , 1 , ( · i y
i 5 - numărul grupelor de societăţi
după mărimea capitalului) şi al dispersiilor parţiale
( ) : 5 , 1 ,
2
· i
i
σ
• profitul mediu brut
( )
1
y
şi dispersia
( )
2
1
σ
societăţilor
comerciale al căror capital este mai mic de 50 mii lei (a=20; K=20).
Tabelul
9
Profitul
brut
(mii. lei)
j
n
1 j
y
k
a y
j

j
j
n
k
a y
1

,
`

.
| −
j
j
n
k
a y
1
2

,
`

.
| −
10-30 7 20 0 0 0
30-50 2 40 1 2 2
50-70 1 60 2 2 4
Total 10 - - 4 6
• pentru celelalte grupe de societăţi comerciale în funcţie de capital,
profiturile medii brute şi dispersiile corespunzătoare s-au
calculat pe baza distribuţiilor condiţionate respective, rezultând
următoarele valori:
( )
52
2 199 50
· ·

y y
mii. lei/s.c.;
288
2
2
· σ
( )
74
3 150 100
· ·

y y
mii. lei/s.c.;
584
2
3
· σ
( )
103
4 200 150
· ·

y y
mii. lei/s.c.;
331
2
4
· σ
c s lei mii a k
j
j
n
j
j
n
k
a
j
y
y . / . 28 20 20
20
4
1
1
1
· + ⋅ · +

,
`

.
| −
·


( ) ( ) 176 64 240 20 28 400
10
6
2
2
1
2
1
1
2
2
1
· − · − − ⋅ · − −

,
`

.
| −
·


a y k
n
n
k
a y
j
j
j
j
σ
( )
67 , 142
5 250 200
· ·

y y
mii. lei/s.c.;
2 , 206
2
5
· σ
• profitul mediu brut pe ansamblul celor 110 societăţi
comerciale şi dispersia aferentă au fost calculate pe baza
distribuţiei marginale a variabilei rezultative, obţinându-se
următoarele valori:
0
y
= 79,45 mii. lei/s.c.;
2
0
σ
= 14508,
-calculul varianţelor:
• varianţa totală:
• varianţa dintre grupe:
( ) ( ) ( ) ( )
( ) ( ) 27 , 117540 15 45 , 79 67 , 142 20 45 , 79 103
40 45 , 79 74 25 45 , 79 52 10 45 , 79 28
2 2
2 2 2
.
2
0 2
· ⋅ − + ⋅ − +
+ ∗ − + ⋅ − + ⋅ − · −
·∑
i
i i
x
N y y
V

• varianţa reziduală:
( ) ( )
∑∑ ∑
· ∗ · − · − ·
i j j
j j ij j
N N y y n y y V 159588 8 , 1450 110
2
0 .
2
0
2
0
2
0
σ
( )
42033 15 2 , 206
20 331 40 584 25 288 10 176
.
2
2
2
· ⋅ +
+ ⋅ + ⋅ + ⋅ + ⋅ · · − ·
∑ ∑∑
i
i i
i j
ij i j u
N n y y V σ
- interpretarea rezultatelor se realizează utilizând tabelul
analizei variaţiei:
Tabelul 10
Sursa
de
variaţ
Măsura
variaţiei
Nr.
grade
de
Dispersi
a
corectat
Valoarea testului F
c
F
2 1
; ; v v
F
α
Varian
ţa
dintre
grupe
( )
27 , 117540
.
2
0
2
·
− ·

i
i i x
N y y V
k-
1=1
27 , 117540
1
2
2
/
·

·
k
V
s
x
X Y
01 , 302
2
2
/
·
·
u
X Y
c
s
s
F
92 , 3
198 ; 1 ; 05 , 0
· F
84 , 6
198 ; 1 ; 01 , 0
· F
Varian
ţa
rezidu
( )
42033
2
2
·
− ·
∑∑
i j
ij i j u
n y y V
N-
k=108
- -
Varian
ţa
totală
N-
1=10
- - -
Deoarece testul Fisher-Snedecor indică faptul că rezultatele
sunt semnificative cu un prag de semnificaţie de 1%
( ) 84 , 6 01 , 302
108 ; 1 ; 01 , 0
· > · F F
c , se vor calcula contribuţia relativă a
factorului X - capitalul social, la explicarea variaţiei variabilei Y

,
`

.
|
%
2
0
2
V
V
x
şi raportul de corelaţie empirică (R):
% 65 , 73 100
159588
27 , 117540
100
2
0
2
· ⋅ · ∗
V
V
x
( )
159588
2
0
2
0
·
− ·
∑∑
i j
ij i
n y y V
19 , 389
2
2
·

·
k N
V
s
u
u
858 , 0
159588
27 , 117540
2
0
2
· ·
V
V
R
x
Deoarece mărimea capitalului social al societăţilor comerciale
explică 73,65% din variaţia profitului brut al acestora, iar raportul de
corelaţie are o valoare de 0,858 (apropiată de limita maximă 1) rezultă
că acest factor determină în mare măsură profitul brut al societăţilor de
acest profil.
1.5. Probleme propuse
A. Într-o secţie de prelucrare a unei întreprinderi există două
prese (A şi B), pe fiecare din ele prelucrându-se câte un lot de piese de
acelaşi tip.
Datorită diminuării cererii acestui produs întreprinderea trebuie să
renunţe la una din prese. Să se menţioneze la care presă trebuie să se
renunţe cunoscând următoarele rezultate obţinute în urma unei selecţii:
- dintr-un lot de 1000 de piese executate la presa A, 2,5% au fost
rebuturi;
- dintr-un lot de 800 de piese executate la presa B, 4,5% au fost
rebuturi.
B. O fabrică de frigidere primeşte motoare de la trei furnizori
diferiţi. În ultimii 5 ani s-au efectuat o serie de înregistrări referitoare la
gravitatea problemelor constatate la motoarele returnate de clienţi pentru
service în timpul perioadei de garanţie. Aceste defecţiuni au fost
clasificate în trei categorii: minore, majore şi "înlocuit".
În tabelul următor sunt prezentate datele culese aleator referitoare la
tipurile de defecţiuni constatate la motoarele returnate, grupate pe
furnizori:
Furnizo
ri
Tipul defecţiunii: Total
motoare
minoră majoră înlocuit
A 15 25 18 58
B 8 16 10 34
C 18 26 20 64
Apreciaţi dacă se poate admite că există o diferenţă calitativă
semnificativă între motoarele livrate de cei trei furnizori.
C. În urma prelucrării datelor unui sondaj statistic s-au obţinut
următoarele rezultate:
Dimensiu Rata profitului (%) Numărul
sub 5 5-10 10-
15
15-
20
peste
20 mici - 13 17 40 15 85
mijlocii 4 16 30 20 15 65
mari 2 8 15 12 8 45
Pe baza acestor date, se poate accepta ipoteza că
rentabilitatea societăţilor comerciale este invers proporţională cu
mărimea lor?
D Rezultatele obţinute în urma unui sondaj efectuat în vederea
stabilirii dacă între vârsta unui şofer şi numărul abaterilor de
circulaţie efectuate de către acesta există vreo legătură sunt
ilustrate în tabelul următor:
Vârst
a
Numărul de abateri
0 1-2 3-4 5 şi
18-25 6 24 20 10
26-50 12 18 6 4
51-75 4 16 8 3
Poate fi considerată ca semnificativă vârsta persoanelor în
explicarea numărului de abateri de circulaţie efectuate?
E. O societate comercială care desface zilnic un produs
(lapte) trebuie să încheie un contract cu furnizorul privind
aprovizionarea zilnică. La fiecare litru vândut în ziua respectivă
firma câştigă 2000 lei şi pierde 500 lei dacă nu-l desface în ziua
respectivă. O statistică a desfacerilor din anul trecut se
prezintă astfel:
Cerere
(litri
Num
ăr de
90 80
100 120
130 60
150 50
160 30
200 20
Total 360
Acceptând că distribuţia cererii pe zilele anului este relativ stabilă,
recomandaţi cantitatea cu care trebuie să se aprovizioneze zilnic firma
pentru a obţine profit maxim.
BIBLIOGRAFIE
1. Andrei, T. - Statistică şi econometrie Editura
Economică, Bucureşti, 2004.
2. Bourbonnais R , Econometrie , Ed. Dunod ,
Paris , 1998
3. Dormont B , Introduction a l’econometrie ,
Ed. Montchrestien , Paris , 1999
4. Florea I.(coordonator), Culegere de modele
econometrice, Ed. Muntele Sion,2000.
5. Iacob, A.I., Tănăsoiu, O. Econometrie, Studii de
caz, Ed. ASE, Bucureşti, 2005.
Capitolul 2
Testarea ipotezelor statistice
2.1.OBIECTIVE: introducerea studenţilor în sfera şi noţiunile
specifice testării ipotezelor statistice
2.2.PREZENTARE SINTETICĂ:
2.2.1. Concepte şi erori în testarea ipotezelor statistice
În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă şi
ipoteza alternativă. Ipoteza statistică ce urmează a fi testată se numeşte
ipoteză nulă şi este notată, uzual, H
0
. Ea constă întotdeauna în admiterea
caracterului întâmplător al deosebirilor, adică în presupunerea că nu
există deosebiri esenţiale. Respingerea ipotezei nule care este testată
implică acceptarea unei alte ipoteze. Această altă ipoteză este numită
ipoteză alternativă, notată H
1
. Cele două ipoteze reprezintă teorii,
mutual exclusive şi exhaustive, asupra valorii parametrului populaţiei
sau legii de repartiţie. Spunem că ele sunt mutual exclusive deoarece
este imposibil ca ambele ipoteze să fie adevărate. Spunem că ele sunt
exhaustive, deoarece acoperă toate posibilităţile, adică ori ipoteza nulă,
ori ipoteza alternativă trebuie să fie adevărată.
Procedeul de verificare a unei ipoteze statistice se numeşte test sau
criteriu de semnificaţie. O secvenţă generală de paşi se aplică la toate
situaţiile de testare a ipotezelor statistice. Ipotezele se vor schimba,
tehnicile statistice aplicate se vor schimba, dar procesul rămâne acelaşi şi
anume:
1). Se identifică ipoteza statistică specială despre parametrul
populaţiei sau legea de repartiţie (H
0
). Ipoteza statistică – numită şi
ipoteză nulă – reprezintă status quo-ul, ceea ce este acceptat până se
dovedeşte a fi fals.
2). Întotdeauna ipoteza nulă este însoţită de ipoteza alternativă (de
cercetat), H
1
, ce reprezintă o teorie care contrazice ipoteza nulă. Ea va fi
acceptată doar când există suficiente dovezi, evidenţe, pentru a se
stabili că este adevărată.
După natura posibilităţilor de construire a ipotezelor nule şi
alternative, deosebim ipoteze alternative simple sau compuse. Astfel,
dacă ipoteza nulă constă în afirmaţia că parametrul θ al unei distribuţii
este egal cu o anumită valoare θ
0
, iar ipoteza alternativă constă în
afirmaţia că parametrul este egal cu θ
1
, avem o ipoteză alternativă
simplă, iar dacă ipoteza alternativă constă în afirmaţia că parametrul θ ia
una din mai multe valori,
} ,..., , {
2 1 k
θ θ θ θ∈
, atunci avem o ipoteză
alternativă compusă.
3). Se calculează indicatorii statistici în eşantion, utilizaţi pentru a
accepta sau a respinge ipoteza nulă şi se stabileşte testul statistic ce va fi
utilizat drept criteriu de acceptare sau de respingere a ipotezei nule.
4). Se stabileşte regiunea critică, R
c
. Regiunea critică reprezintă
valorile numerice ale testului statistic pentru care ipoteza nulă va fi
respinsă. Regiunea critică este astfel aleasă încât probabilitatea ca ea să
conţină testul statistic, când ipoteza nulă este adevărată să fie α, cu α mic
(α=0.01 etc). Verificarea ipotezei nule se face pe baza unui eşantion de
volum n, extras din populaţia X, care este o variabilă aleatoare. Dacă
punctul definit de vectorul de sondaj x
1
,x
2,…,
x
n
cade în regiunea critică R
c
,
ipoteza H
0
se respinge, iar dacă punctul cade în afara regiunii critice R
c
,
ipoteza H
0
se acceptă. Regiunea critică este delimitată de valoarea
critică, C – punctul de tăietură în stabilirea acesteia.
În baza legii numerelor mari, numai într-un număr foarte mic de
cazuri punctul rezultat din sondaj va cădea în R
c
, majoritatea vor cădea în
afara regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în
regiunea critică, cu toate că ipoteza nulă despre parametrul populaţiei
este adevărată. Cu alte cuvinte, atunci când respingem ipoteza nulă,
trebuie să ne gândim de două ori, deoarece există două posibilităţi: ea
este falsă într-adevăr şi ea este totuşi adevărată, deşi pe baza datelor din
sondaj o respingem.
La fel şi pentru situaţia în care acceptăm ipoteza nulă H
0
. Când
ipoteza nulă nu poate fi respinsă (nu există suficiente dovezi pentru a fi
respinsă), sunt două posibilităţi: ipoteza nulă este adevărată şi ipoteza
nulă este totuşi falsă, greşită deşi nu am respins-o. De aceea, este mai
corect să spunem că pe baza datelor din eşantionul studiat, nu putem
respinge ipoteza nulă, decât să spunem că ipoteza nulă este
adevărată.
Eroarea pe care o facem eliminând o ipoteză nulă, deşi este
adevărată, se numeşte eroare de genul întâi. Probabilitatea comiterii
unei astfel de erori reprezintă riscul de genul întâi (α) şi se numeşte
nivel sau prag de semnificaţie.
Nivelul de încredere al unui test statistic este (1-α) iar în expresie
procentuală, (1-α)100 reprezintă probabilitatea de garantare a
rezultatelor.
Eroarea pe cere o facem acceptând o ipoteză nulă, deşi este falsă, se
numeşte eroare de genul al doilea, iar probabilitatea (riscul) comiterii
unei astfel de erori se notează cu β. Puterea testului statistic este (1-β).
Tabelul de mai jos ilustrează legătura dintre decizia pe care o luăm
referitor la ipoteza nulă şi adevărul sau falsitatea acestei ipoteze.
Erorile în testarea ipotezelor statistice
Decizia de
acceptare
Ipoteza adevărată
H
0
H
1
0 1 2
H
0
Decizie corectă
(probabilitate 1-
α)
Eroare de gen II
(risc β)
H
1
Eroare de gen I
(risc α)
Decizie corectă
(probabilitate 1-β)
Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al
doilea sunt mai mici, cu atât testul este mai bun. Acest lucru se poate
realiza prin mărirea volumului eşantionului, n. Nivelurile riscurilor se
stabilesc în funcţie de considerente economice şi de natura testului.
Am văzut că:
α= P(respingere H
0
׀ H
0
este corectă)=P(eroare de gen I)
β= P(acceptare H
0
׀ H
0
este falsă)=P(eroare de gen II)
Alegerea nivelului (pragului) de semnificaţie depinde şi de costurile
asociate cu producerea unei erori de genul I.
Spre exemplu, pragul de semnificaţie ales de o firmă ce fabrică
îngheţată, interesată în greutatea medie a cutiilor de îngheţată va putea fi
diferit de pragul de semnificaţie ales de o companie farmaceutică,
interesată de cantitatea medie a unui ingredient activ dintr-un tip de
medicament. Evident, costul în prima situaţie prezentată este mult mai
mic, comparativ cu costul asociat în cazul producerii unei erori de genul
I pentru compania farmaceutică: o cantitate prea mică de ingredient activ
poate face medicamentul ineficient; o cantitate prea mare de ingredient
activ poate cauza efecte secundare, dăunătoare sau poate avea, chiar,
efecte letale.
Similar, există costuri asociate cu producerea unei erori de genul al
II-lea. Între eroarea de genul I şi eroarea de genul al II-lea există o
legătură, o condiţionare. O modalitate de a vizualiza această legătură este
să presupunem că există doar două distribuţii care ne interesează. O
distribuţie corespunde ipotezei nule H
0
, iar cealaltă corespunde ipotezei
alternativei H
1
. În acest caz, presupunem că şi ipoteza nulă şi cea
alternativă sunt ipoteze simple. Într-o manieră uşor de înţeles, să
considerăm că ipoteza nulă este de forma H
0
: μ=μ
0
, iar ipoteza alternativă
este de forma H
1
:μ=μ
1
(vezi fig):
Legătura dintre probabilităţile α şi β
Pe grafic se observă că cele două distribuţii se suprapun şi, din
procesul de testare a ipotezei nule, pot rezulta două tipuri de erori.
Eroarea de genul I apare atunci când respingem ipoteza nulă H
0
, în
situaţia în care, de fapt, aceasta este adevărată. Adică, deşi distribuţia lui
x este cea corespunzătoare ipotezei H
0
, respingem H
0
, deoarece media
de sondaj este mai mare decât valoarea critică, C şi se situează în
regiunea critică. Probabilitatea comiterii unei astfel de erori (α ) este aria
de sub curba de distribuţie H
0
care se situează la dreapta valorii critice C.
Eroarea de genul al doilea apare atunci când nu respingem (adică
acceptăm) H
0
, deşi H
1
în loc de H
0
este corectă. În acest caz, deşi
distribuţia lui
x
este cea corespunzătoare ipotezei H
1
, acceptăm H
0
deoarece media de sondaj este mai mică decât valoarea critică, C (nu se
află în regiunea critică). Probabilitatea comiterii unei astfel de erori (β)
este aria de sub curba de distribuţie H
1
care se situează la stânga valorii
critice, C.
Dacă alegem un prag de semnificaţie, α, mai mic (adică reducem
riscul comiterii unei erori de genul întâi), va creşte β ( riscul comiterii
unei erori de genul al doilea). Cu toate acestea, prin creşterea volumului
n al eşantionului, este posibil să reducem riscul β, fără a creşte riscul α.
Cum
n
s
s
x
x
·
, o dată cu creşterea volumului n al eşantionului, aba-
terile medii pătratice ale distribuţiilor pentru H
0
şi H
1
devin mai mici şi,
evident, atât α, cât şi β descresc (vezi fig.).
α şi β când volumul eşantionului n' > n
5) După ce am stabilit pragul de semnificaţie şi regiunea critică,
trecem la pasul următor, în care vom face principalele presupuneri
despre populaţia sau populaţiile ce sunt eşantionate (normalitate etc.).
6) Se calculează apoi testul statistic şi se determină valoarea sa
numerică, pe baza datelor din eşantion.
7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie
acceptată, fie respinsă, astfel:
a) dacă valoarea numerică a testului statistic cade în
regiunea critică (Rc), respingem ipoteza nulă şi
concluzionăm că ipoteza alternativă este adevărată. Vom şti
că această decizie este incorectă doar în 100 α % din cazuri;
b) dacă valoarea numerică a testului nu cade în regiunea
critică (Rc), se acceptă ipoteza nulă H
0
.
Ipoteza alternativă poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalităţii parametrului „media colectivităţii
generale“, μ cu valoarea μ
0
):
i) să testăm dacă parametrul din colectivitatea generală (media μ)
este egal cu o anumită valoare (inclusiv zero, μ
0
), cu alternativa media
diferită de valoarea μ
0
. Atunci:
H
0
: μ = μ
0
H
1
: μ ≠ μ
0
(μ < μ
0
sau μ > μ
0
);
şi acest test este un test bilateral;
ii) să testăm ipoteza nulă μ = μ
0
, cu alternativa media μ este mai
mare decât μ
0.
H
0
: μ = μ
0
H
1
: μ > μ
0
care este un test unilateral dreapta;
iii) să testăm ipoteza nulă μ = μ
0
, cu alternativa media μ este mai
mică decât μ
0.
H
0
: μ = μ
0
H
1
: μ < μ
0
care este un test unilateral stânga.
Regiunea critică pentru testul bilateral diferă de cea pentru testul
unilateral. Când încercăm să detectăm o diferenţă faţă de ipoteza nulă, în
ambele direcţii, trebuie să stabilim o regiune critică Rc în ambele cozi
ale distribuţiei de eşantionare pentru testul statistic. Când efectuăm un
test unilateral, vom stabili o regiune critică într-o singură parte a
distribuţiei de eşantionare, astfel (vezi fig.):
μ μ μ
a) b) c)
Regiunea critică pentru a) test bilateral; b) test
unilateral stânga; c) test unilateral dreapta
2.2.2. Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum mare
Utilizarea eşantioanelor de volum mare (n > 30) face posibilă
aplicarea teoremei limită centrală. Putem întâlni teste unilaterale sau
bilaterale, astfel:
i) în cazul testului bilateral, ipotezele sunt:
H
0
: μ = μ
0
(μ - μ
0
=0)
H
1
: μ ≠ μ
0
(μ - μ
0
≠0) (adică μ < μ
0
sau μ > μ
0
);
Testarea se face pe baza mediei eşantionului
x
şi, pentru a o
efectua, este nevoie să construim un test cu un nivel de semnificaţie α
prestabilit. Utilizând teorema limită centrală am văzut că dacă volumul
eşantionului este mare, media eşantionului
x
este aproximativ normal
distribuită. De aceea, variabila aleatoare z urmează o distribuţie normală
standard.
n s
x
n
x x
z
x
0
x
0
x
0
µ
σ
µ
σ
µ −


·

·
Dacă pragul de semnificaţie (α) este stabilit, putem determina
valoarea z
α/2
, pentru care P(z> z
α/2
)= α/2. Aceasta înseamnă că regiunea
critică Rc este dată de:
Rc: z< - z
α/2
sau z> z
α/2
Regula de decizie este, deci:
Respingem H
0
dacă 2 /
0
α
σ
µ
z
n
x
x
− <

sau 2 /
0
α
σ
µ
z
n
x
x
>

ii) pentru testul unilateral dreapta, ipotezele sunt:
H
0
: μ = μ
0
(μ - μ
0
=0)
H
1
: μ > μ
0
(μ - μ
0
>0);
Testul statistic calculat este:
n s
x
n
x x
z
0 0
x
0
µ
σ
µ
σ
µ −


·

·
Regiunea critică este dată de:
Rc: z > z
α
Regula de decizie este:
Respingem ipoteza H
0
dacă α
σ
µ
z
n
x
0
>

iii) Pentru testul unilateral stânga, ipotezele sunt:
H
0
: μ = μ
0
(μ - μ
0
=0)
H
1
: μ < μ
0
(μ - μ
0
<0);
Testul statistic calculat este:
n s
x
n
x x
z
0 0
x
0
µ
σ
µ
σ
µ −


·

·
Regiunea critică este dată de:
Rc: z < –z
α
Regula de decizie este:
Respingem ipoteza H
0
dacă : α
σ
µ
z
n
x
0
− <

Să remarcăm că în nici una dintre aceste situaţii nu trebuie făcută o
presupunere specială, deoarece teorema limită centrală ne asigură că
testul statistic va fi aproximativ normal distribuit, indiferent de forma
distribuţiei din colectivitate.
2.2.3.Testarea ipotezei privind diferenţa dintre două
medii pentru eşantioane de volum mare
Multe cazuri de analiză statistică implică o comparaţie între mediile
a două colectivităţi generale. Spre exemplu, un patron al unui restaurant
doreşte să vadă dacă există diferenţe între vânzările realizate înainte şi
după o campanie de publicitate, un grup de consumatori doreşte să vadă
dacă există o diferenţă semnificativă între consumul electric pentru două
tipuri de cuptoare cu microunde etc.
În aceste situaţii, un estimator al diferenţei (μ
1
- μ
2
) este diferenţa
dintre mediile eşantioanelor ( 2 1 x x − ).
Proprietăţile distribuţiei de eşantionare a diferenţei ( 2 1 x x − ) sunt:
a) distribuţia de eşantionare pentru ( 2 1 x x − ) este aproximativ
normală pentru eşantioane de volum mare (n
1
> 30 şi n
2
> 30);
b) media distribuţiei de eşantionare a lui ( 2 1 x x − ) este (μ
1 –
μ
2
);
c) dacă cele două eşantioane sunt independente, abaterea medie
pătratică a distribuţiei de eşantionare este:
( )
2
2
2
1
2
1
x x
n n
2 1
σ σ
σ + ·

unde
2
1
σ
şi
2
2
σ
sunt dispersiile celor două populaţii eşantionate, iar
n
1
şi n
2
sunt volumele eşantioanelor respective.
Mărimea lui ( )
2 1
x x −
σ
indică variabilitatea în valorile 2 1 x x − , aşteptată
în distribuţia de eşantionare, datorită întâmplării.
În cazul în care dispersiile celor două populaţii eşantionate sunt
egale,
2
1
σ
=
2
2
σ
=
2
σ , abaterea medie pătratică a distribuţiei de eşantionare
va avea forma:
( )
2 1
x x
n
1
n
1
2 1
+ ·

σ σ
În aceste condiţii, ipotezele statistice ce urmează a fi testate vor fi:
i) test bilateral
H
0
: (μ
1
- μ
2
) = D
H
1
: (μ
1
- μ
2
) ≠ D
[(μ
1
- μ
2
)>D sau (μ
1
- μ
2
)<D]
ii) test unilateral dreapta
H
0
: (μ
1
- μ
2
) = D
H
1
: (μ
1
- μ
2
) > D
iii) test unilateral stânga
H
0
: (μ
1
- μ
2
) = D
H
1
: (μ
1
- μ
2
) < D
unde D reprezintă diferenţa ipotetică dintre mediile populaţiilor,
deseori egală cu 0.
Testul statistic utilizat are forma:
( )
( )
2
1
1
x x
2 D x x
z

− −
·
σ
Regiunea critică este dată de:
i) z< - z
α/2
sau z> z
α/2
ii) z> z
α
iii) z< - z
α
2.2.4.Testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus
În afaceri, multe decizii trebuie luate pe baza unor in-formaţii foarte
limitate, adică pe baza datelor provenite din eşantioane mici (de volum
redus, n≤30). În aceste situaţii, efectul imediat este acela că forma
distribuţiei de eşantionare a mediei
x
depinde, acum, de forma
populaţiei generale din care a fost extras eşantionul. În cazul eşantionului
de volum redus se utilizează testul statistic t. Distribuţia de eşantionare a
lui
x
va fi normală (sau aproximativ normală), în cazul eşantioanelor de
volum redus, doar dacă colectivitatea generală este distribuită normal
(sau aproximativ normal).
Pe de altă parte, dacă nu se cunoaşte dispersia din colectivitatea
generală (
2
x
σ
), atunci dispersia eşantionului (
2
x
s
), poate să nu ofere o
aproximare foarte bună a lui
2
x
σ
(în cazul eşantioanelor mici). Ca atare, în
locul statisticii z care necesită cunoaşterea (sau o bună aproximare) a lui
x
σ
, vom folosi statistica:
n s
x
s
x
t
x
0
x
0
µ µ −
·

·
,
unde:
( )
1 n
x x
s
2
i 2
x


·

.
Elementele procesului de testare a ipotezelor statistice privind media
colectivităţii generale (μ) pe baza datelor din eşantioane de volum
redus, devin atunci:
- pentru test bilateral;
H
0
: μ = μ
0
,
H
1
: μ ≠ μ
0
(μ < μ
0
sau μ > μ
0
);
- pentru test unilateral dreapta;
H
0
: μ = μ
0
,
H
1
: μ > μ
0
,
- pentru test unilateral stânga;
H
0
: μ = μ
0
,
H
1
: μ < μ
0
.
Testul statistic utilizat:
n s
x
s
x
t
x
0
x
0
µ µ −
·

·
.
Presupunerea specială ce trebuie făcută este aceea că po-pulaţia
generală este normal sau aproximativ normal distribuită.
Regiunea critică este dată de:
i) t > t
α/2,n-1
sau t < - t
α/2,n-1
,
ii) t > t
α,n-1
,
iii) t < - t
α,n-1
.
2.2.5.Testarea ipotezei privind proporţia populaţiei
pentru eşantioane mari
Ne amintim că, pentru variabile alternative, media în eşantion era
notată cu f (proporţia succeselor), dispersia f(1-f), iar abaterea medie
pătratică
) 1 ( f f −
. De asemenea, despre distribuţia de eşantionare a
proporţiei ştim că proporţia eşan-tionului (f) este aproximativ normal
distribuită, de medie p şi eroare standard
n p p / ) 1 ( −
, pentru n mare (
5 ≥ np

şi
5 ) 1 ( ≥ −p n
):
p
f
· µ
şi
n
f f
n
p p
s
f
) 1 ( ) 1 ( −


· .
Pentru testarea ipotezelor statistice privind proporţia este necesar să
lucrăm cu eşantioane mari(n>100).
Cum proporţia f este aproximativ normal distribuită, rezultă că variabila
standardizată
n f f
p f
z
/ ) 1 ( −

·
este aproximativ normal standardizat
distribuită. (Atenţie! Dacă volumul eşantionului este mic, distribuţia de
Exemplu
eşantionare a proporţiei nu este o distribuţie t şi orice inferenţă asupra lui p
trebuie să se bazeze pe distribuţia lui f, care este o distribuţie binomială!)
Ipotezele nule şi alternative pentru testarea proporţiei se construiesc
în aceeaşi manieră cu ipotezele pentru testarea mediei
µ
. Adică, ipoteza
nulă indică faptul că p este egală cu o valoare specificată:
0 0
: p p H ·
,
în timp ce ipoteza alternativă răspunde la una dintre cele trei
întrebări:
- dacă proporţia este diferită de valoarea specificată (test bilateral):
0 1
: p p H ≠
;
- dacă proporţia este mai mare decât valoarea specificată (test
unilateral dreapta): 0 1
: p p H >
;
- dacă proporţia este mai mică decât valoarea specificată (test
unilateral stânga): 0 1
: p p H <
.
Testul statistic pentru proporţia p este:
n / ) f 1 ( f
p f
) n / p 1 ( p
p f
z
0 0





·
.
Regiunea critică (R
c
) este dată de:
2 / α
z z − <
sau 2 / α
z z >
pentru testul bilateral;
α
z z >
pentru testul unilateral dreapta;
α
z z − <
pentru testul unilateral stânga.
Aşadar, regula de decizie este: se respinge ipoteza nulă şi se acceptă
ipoteza alternativă, dacă z se situează în regiunea critică (R
c
)

stabilită în
funcţie de probabilitatea dorită de garantare a rezultatelor
)% 1 ( 100 α −
.
2.2.6. Testarea ipotezei privind diferenţa dintre două medii
pentru eşantioane de volum redus
În cazul în care dorim să testăm semnificaţia diferenţei dintre mediile
a două eşantioane de volum redus, va trebui să construim, ca şi în cazul
anterior, o statistică t, Student. Pentru aceasta vom presupune că:
- ambele colectivităţi generale din care s-au extras eşan-tioanele sunt
normal sau aproximativ normal distribuite;
- dispersiile în cele două colectivităţi generale sunt egale;
- eşantioanele aleatoare sunt selectate independent unul de celălalt.
În condiţiile în care presupunem că cele două colectivităţi generale au
dispersii egale (
2
1 x
σ
=
2
2 x
σ
=
2
x
σ
), un estimator al dispersiei (variabilităţii)
totale din cele două populaţii combinate este:
( ) ( )
2
2 1
1
2
2
1
2
1
2
2 1
− +
− + −
·
∑ ∑
· ·
n n
x x x x
s
n
i
i
n
i
i
c
sau
( ) ( )
( ) ( )
( ) ( )
2 n n
s 1 n s 1 n
1 n 1 n
s 1 n s 1 n
s
2 1
2
2 x 2
2
1 x 1
2 1
2
2 x 2
2
1 x 1 2
c
− +
− + −
·
− + −
− + −
·
.
Aşadar, dispersia combinată
2
c
s
este media aritmetică pon-derată a
dispersiilor celor două eşantioane,
2
1 x
s
şi
2
2 x
s
.
Dacă dispersiile nu sunt egale (σ
2
x1
≠σ
2
x2
), atunci testul statistic are
forma:
2
2
2
1
2
1
2 1
n
s
n
s
D ) x x (
t
+
− −
·
cu gradele de libertate:
( )
1 n
) /n (s
1 n
) /n (s
/n s /n s
2
2
2
2
2
1
2
1
2
1
2
2
2
2 1
2
1

+

+
Ipotezele statistice vor fi, în aceste condiţii:
- pentru test bilateral;
H
0
: μ
1
= μ
2

1
- μ
2
= D),
H
1
: μ
1
≠ μ
2

1
- μ
2
≠ D),
- pentru test unilateral dreapta;
H
0
: μ
1
= μ
2

1
- μ
2
= D),
H
1
: μ
1
> μ
2

1
- μ
2
> D),
- pentru test unilateral stânga;
H
0
: μ
1
= μ
2

1
- μ
2
= D),
H
1
: μ
1
< μ
2

1
- μ
2
< D).
Testul statistic t va avea forma:
( ) ( )
( ) ( )
( )
2 1
2 1 2 1
2
2
2 x 1
2
1 x
2
2 1
2
c
2
n n
2 n n n n
1 n s 1 n s
D x x
n
1
n
1
s
D x x
t
1 1
+
− +

− + −
− −
·

,
`

.
|
+
− −
·
.
Regiunea critică este dată de:
- pentru test bilateral: t< –t
2 n n , 2 /
2 1
− + α
sau t> t
2 n n , 2 /
2 1
− + α
;
- pentru test bilateral dreapta: t> t
2 n n ,
2 1
− + α
;
- pentru test bilateral stânga: t< – t
2 n n ,
2 1
− + α
.
Trebuie să facem o remarcă asupra presupunerilor privind
normalitatea distribuţiei în colectivitatea generală: teoria statistică a
dezvoltat teste pentru verificarea normalităţii distribuţiilor, teste prin
care se verifică ipoteza nulă conform căreia legea de repartiţie este cea
normală N(μ, σ
2
), cu μ şi
2
σ parametrii necunoscuţi ce urmează a fi
estimaţi pe baza datelor eşantionului considerat. Cele mai cunoscute teste
pentru verificarea normalităţii sunt testul χ
2
de concordanţă cu legea
normală, testul Kolmogorov - Smirnov, testul de normalitate al lui
Lilliefors (vezi Trebici, V. (coord.) — Mică enciclopedie de statistică,
Editura Ştiinţifică şi Enciclopedică, Bucureşti, 1985).
Dacă ipoteza nulă nu este acceptată, vom putea apela la teste sta-
tistice neparametrice, în cadrul cărora nu se fac presu-puneri speciale
asupra formei distribuţiei.
2.2.7. Testarea ipotezei privind dispersia unei populaţii
Aşa cum am văzut în capitolul anterior, suma pătratelor diferenţelor


2
) ( x x
i (care este, de fapt, egală cu
2
s n⋅
sau
2
) 1 ( s n ⋅ −
pentru
eşantioane mici), împărţită la dispersia colectivităţii generale, are o
distribuţie hi-pătrat (
2
χ
) (dacă populaţia eşantionată este normal
distribuită).
Aşadar, testul statistic utilizat în testarea ipotezei privind
2
σ
este:
2
2
2
) 1 (
σ
χ
s n −
·
,
care are o distribuţie
2
χ
cu (n-1) grade de libertate, când populaţia
eşantionată este normal distribuită, cu dispersia
2
σ
.
Valoarea lui
2
χ
pentru care aria de sub curbă (situată la dreapta ei)
este egală cu α, se noteaza
2
α
χ
. Nu putem folosi notaţia
2
α
χ −
pentru a
reprezenta punctul la care aria din stânga este α, deoarece statistica
2
χ

este întotdeauna mai mare decât zero. Dar
α
χ
2
1
reprezintă punctul pentru
care aria de sub curbă situată la stânga lui este α.
Spre exemplu:

92 , 16
2
9 ; 05 , 0
· χ


33 , 3
2
9 ; 95 , 0
· χ

Ipoteza nulă este:
2
0
2
0
: σ σ · H
cu ipoteze alternative:
- pentru test bilateral
2
0
2
0
: σ σ ≠ H
,
- pentru test unilateral drept
2
0
2
0
: σ σ > H
,
- pentru test unilateral stâng
2
0
2
0
: σ σ < H
.
Regiunea critică este dată de:
2
1 , 2 / 1
2
− −
<
n α
χ χ
sau
2
1 , 2 /
2

>
n α
χ χ
pentru test bilateral,
2
1 ,
2

>
n α
χ χ
pentru test unilateral dreapta,
2
1 , 1
2
− −
<
n α
χ χ
pentru test unilateral stânga.
Factorii ce identifică testul
2
χ
privind dispersia unei populaţii:
• Obiectiv: caracterizarea unei colectivităţi;
• Aspectul vital: variabilitatea;
• Tipul datelor: cantitative.
2.2.8.Testarea ipotezei privind raportul dintre două dispersii
Am văzut că testarea ipotezei privind dispersia poate fi utilizată
pentru a trage concluzii privitoare la consistenţa unor procese economice
ori privitoare la riscurile asociate. În acest subcapitol vom compara două
dispersii, ceea ce ne va permite să comparăm consistenţa a două procese
sau riscurile a două portofolii de investiţii etc.
Statisticienii testează, adesea, egalitatea dintre două dispersii înainte
de a decide ce procedeu să folosească în verificarea ipotezei privind
diferenţa dintre două medii.
Vom compara dispersiile a două populaţii, determinând raportul
dintre ele. În consecinţă, parametrul ce ne interesează este
2
2
2
1
/σ σ
. Dacă
dispersia eşantionului este (aşa cum am văzut) un estimator nedeplasat şi
consistent al dispersiei colectivităţii generale, să notăm că raportul
2
2
2
1
s / s

este estimator punctual al raportului de dispersii
2
2
2
1
/ σ σ
.
Distribuţia de eşantionare a raportului
2
2
2
1
s / s
este o distribuţie F, dacă
eşantioanele au fost extrase independent din populaţii normal distribuite.
Valoarea lui F pentru care aria de sub curbă (situată la dreapta ei) este
α, se notează cu F
α
(cu gradele de libertate gl1 şi gl2).
Din matematică ştim că raportul dintre două variabile hi-pătrat
independente împărţite la gradele lor de libertate are o distribuţie F.
Gradele de libertate ale distribuţiei F sunt identice cu gradele de libertate
ale celor două distribuţii hi-pătrat. Atunci:
2
2
2
2
2
1
2
1
2
2
2
2
2 2
1
2
1
2
1 1
/
/
) 1 (
/ ) 1 (
:
) 1 (
/ ) 1 (
σ
σ σ σ
s
s
n
s n
n
s n
F ·




·
,
cu
) 1 (
1
− n
şi
) 1 (
2
− n
grade de libertate.
În cele ce urmează, ipoteza nulă este întotdeauna specificată ca
egalitatea între două dispersii, adică sub forma egalităţii raportului cu
unitatea.
1 / :
2
2
2
1 0
· σ σ H
.

Ipoteza alternativă poate fi construită astfel: fie că raportul este diferit
de 1, fie mai mare, fie mai mic decât 1.
Tehnic, testul statistic este 2
2
2
2
2
1
2
1
/
/
σ
σ
s
s
F ·
, dar în condiţiile ipotezei nule,
adică
1 /
2
2
2
1
· σ σ
, testul statistic devine: 2
2
2
1
s
s
F ·
, care urmează o distribuţie F
cu
) 1 (
1
− n
şi
) 1 (
2
− n
grade de libertate.
Regiunea critică este dată de:
1 , 1 , 2 /
2 1
− −
>
n n
F F
α sau 1 , 1 , 2 / 1
2 1
− − −
<
n n
F F
α pentru test bilateral,
1 , 1 ,
2 1
− −
>
n n
F F
α pentru test unilateral dreapta,
1 , 1 , 1
2 1
− − −
<
n n
F F
α pentru test unilateral stânga.
gl2 gl1, α,
gl2 gl1, α, 1
F
1
F ·

gl1 = n1 –1
gl2 = n2 –1
2.3. Întrebări
1. Cum apar în statistică ipotezele?
2. Cum se stabileşte regiunea critică, R
c
pentru
testul bilateral?
3. Cum se stabileşte regiunea critică, R
c
pentru
testul unilateral ?
4. În testarea ipotezei privind media populaţiei
generale (μ) pentru eşantioane de volum mare , în
cazul testului bilateral, care sunt ipotezele ?
5. În testarea ipotezei privind diferenţa dintre
două medii pentru eşantioane de volum mare, care
sunt proprietăţile distribuţiei de eşantionare a
diferenţei ( 2 1 x x − ) ?
2.4.Probleme rezolvate
Exemplu 1 - Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum mare
Presupunem că un fabricant de materiale de construcţii
comercializează ciment în pungi, care trebuie să conţină 12 kg/pungă.
Pentru a detecta eventuale abateri în ambele sensuri de la această
cantitate, selectează 100 de pungi, pentru care calculează
85 , 11 · x
kg, s
x
=
0,5 kg. Pentru α = 0,01 (grad de încredere (1- α)100=99%) să se
determine dacă se acceptă ipoteza nulă, aceea că greutatea pungilor este
în medie de 12 kg.
H
0
: μ = 12
H
1
: μ ≠ 12 ( μ < 12 sau μ > 12);
z
α/2
=z
0,005
=2,575
0 , 3
10 5 , 0
12 85 , 11
n s
12 x
n
12 x 12 x
z
x
− ·

·



·

·
σ
σ
Regiunea critică: z< - z
α/2
sau z> z
α/2
Cum z = - 3,0 < - 2,575 rezultă că sunt suficiente evidenţe pentru a
respinge ipoteza nulă H
0
şi a accepta ipoteza alternativă, aceea că
greutatea pungilor diferă, în medie, de 12 kg.
Exemplu 2 : Testarea ipotezei privind diferenţa dintre două medii
pentru eşantioane de volum mare
Managerul unui restaurant doreşte să determine dacă o campanie de
publicitate a dus la creşterea veniturilor medii zilnice. Au fost
înregistrate veniturile pentru 50 de zile înainte de desfăşurarea campa-
niei. După desfăşurarea campaniei şi trecerea unei perioade de 20 de zile
pentru ca această campanie să îşi facă efectul, se înregistrează veniturile
pentru 30 de zile. Aceste două eşantioane vor permite testarea ipotezei
privind efectul campaniei asupra veniturilor. Din prelucrarea datelor
pentru cele două eşantioane, rezultă:
Înainte de campanie După campanie
n
1
=50 n
2
=30
55 , 12 x1 ·
mil. lei
30 , 13 x2 ·
mil. lei
s
1
=2,15 mil. lei s
2
=2,38 mil. lei
Dorim să vedem dacă veniturile au crescut (μ
2
> μ
1
), aşadar, vom
efectua un test unilateral stânga:
H
0
: μ
1
= μ
2

1
- μ
2
= 0)
H
1
: μ
1
< μ
2

1
- μ
2
< 0)
Pentru un prag de semnificaţie α = 0,05 (probabilitate de garantare a
rezultatelor (1- α)100=95%, z
α
=z
0,05
=1,645. Să notăm că regiunile critice,
pentru cele mai comune valori ale lui α sunt date de (vezi tab.):
Regiumile critice pentru diferite valori α
α Test
unilateral
stânga
Test
unilateral
dreapta
Test bilateral
0 1 2 3
0,10 z < - 1,28 z > 1,28 z < - 1,645 sau z >
1,645
0,05 z < - 1,645 z > 1,645 z < - 1,96 sau z >
1,96
0,01 z < - 2,33 z > 2,33 z < - 2,575 sau z >
2,575
Presupunând că cele două eşantioane (înainte şi după campanie)
sunt independente, vom calcula testul z:
( )
( )
41 , 1
5305 , 0
75 , 0
n
s
n
s
x x
n n
x x 0 x x
z
2
2
2
1
2
1
2 1
2
2
2
1
2
1
2 1
x x
2 1
2 1
− ·

·
+


+

·
− −
·

σ σ
σ
Cum valoarea calculată nu este mai mică decât –z
0,05
= –1,645,
rezultă că nu ne aflăm în regiunea critică. Eşantioanele nu oferă aşadar,
suficiente dovezi (la α = 0,05) pentru ca managerul restaurantului să
concluzioneze că veniturile au crescut în urma campaniei de publicitate.
Exemplu 3 - testarea ipotezei privind media populaţiei generale (μ)
pentru eşantioane de volum redus
Conducerea unei companii apelează la 5 experţi pentru a previziona
profitul companiei în anul curent. Valorile previzionate sunt: 2,60; 3,32;
1,80; 3,43; 2,00 (miliarde lei, preţurile anului anterior).
Ştiind că profitul companiei în anul anterior a fost de 2,01 mld. lei,
sunt suficiente dovezi pentru a concluziona că media previziunilor
experţilor este semnificativ mai mare decât cifra anului anterior (pentru α
= 0,05)?
Media previziunilor experţilor este
63 , 2 x ·
mld. lei, cu dispersia:
( )
5507 , 0
4
203 , 2
1 n
x x
s
2
i 2
x
· ·


·


şi abaterea medie pătratică:
74 , 0 s s
2
x x
· ·
mld. lei.
Elementele procesului de testare a ipotezei statistice sunt:
H
0
: μ = 2,01,
H
1
: μ > 2,01 (test unilateral dreapta).
874 , 1
5 / 74 , 0
01 , 2 63 , 2
n s
x
s
x
t
x x
·

·

·

·
µ µ
.
În scopul folosirii statisticii t, vom face presupunerea că populaţia
generală din care s-a extras eşantionul este normal distribuită.
Cum t
α,n-1
=

t
0,05;4
=

2,132, regiunea critică este dată de t>t
α,n-1
. Cum
t=1,874< t
0,05;4
=2,132, nu putem trage concluzia că media profitului previ-
zionată de cei 5 experţi pentru anul curent este semnificativ mai mare decât
profitul anului trecut, de 2,01 mld. lei.
Exemplu 4 : testarea ipotezei privind proporţia populaţiei pentru
eşantioane mari
Managerul unui laţ de magazine consideră în urma unei analize
financiare că - pentru un nou produs - comercializarea este profitabilă,
dacă procentul cumpărătorilor care ar dori să achiziţioneze produsul este
mai mare de 12%. El selectează 400 de cumpărători potenţiali şi află că
52 dintre aceştia vor achiziţiona produsul. Pentru o probabilitate de 99%
sunt suficiente dovezi care să convingă managerul să comercializeze
produsul?
Ipotezele sunt:
12 , 0 p : H
0
·
,
12 , 0 p : H
1
>
(test unilateral dreapta).
Testul statistic este:
15 , 1
017 , 0
02 , 0
400 / 86 , 0 14 , 0
12 , 0 14 , 0
n / ) f 1 ( f
12 , 0 f
z · ·


·


·
.
Cum
33 , 2 z z
01 . 0
· ·
α şi ε
z z <
, rezultă că nu ne aflăm în regiunea critică
(R
c
), nu avem suficiente dovezi să respingem ipoteza nulă, deci procentul
nu este mai mare de 12%.
Exemplu 5 : testarea ipotezei privind diferenţa dintre două medii
pentru eşantioane de volum redus
Presupunem că dorim să testăm ipoteza conform căreia între două
mărci de autoturisme nu există diferenţe semni-ficative privind
cheltuielile de funcţionare. Pentru aceasta 20 de posesori de autoturisme
(8 posesori ai primei mărci şi 12 po-sesori ai celei de-a doua) sunt rugaţi
să ţină, cu acurateţe, evidenţa cheltuielilor de funcţionare pe o perioadă
de un an de zile. Pentru α=0,1 (probabilitate de garantare a rezultatelor
(1-α)100 = 90%) să se testeze această ipoteză, dacă rezultatele prelucrării
datelor în eşantioane sunt:
Marca 1 Marca 2
n
1
=8 n
2
=12
696 , 5 1 · x
mil. lei
273 , 5 2 · x
mil. lei
s
x1
=0,485 mil. lei s
x2
=0,635 mil. lei
( ) ( )
3379 , 0
2 12 8
635 , 0 1 12 485 , 0 1 8
s
2 2
2
c
·
− +
− + −
·
Ipotezele statistice sunt:
H
0
: μ
1
= μ
2

1
- μ
2
= 0),
H
1
: μ
1
≠ μ
2

1
- μ
2
≠ 0) [μ
1
> μ
2
sau μ
1
< μ
2
].
Testul statistic este:
( )
5943 , 1
2653 , 0
423 , 0
12
1
8
1
3379 , 0
0 273 , 5 696 , 5
t · ·

,
`

.
|
+
− −
·
Cum t
α/2,n1+n2-2
= t
0,05;18
= 1,734, se observă că t < t
α/2,n1+n2-2
, aşadar nu ne
aflăm în regiunea critică.
Rezultă, deci, că nu există suficiente dovezi pentru a concluziona că
sunt diferenţe semnificative între cheltuielile de funcţionare ale celor
două mărci de autoturisme.
Exemplu 6 : testarea ipotezei privind dispersia unei populaţii
Pentru următoarele date privind cererea unui produs (selectate
dintr-o colectivitate normal distribuită), să se testeze (pentru o
probabilitate de 95%), ipotezele:
100 :
2
0
· σ H
,
100 :
2
1
> σ H
.
Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
În eşantion:
85 , 13 · s
,
8 , 191
2
· s
.
8 , 191
9
1726
1
) (
2
2
· ·


·

n
x x
s
i
.
Testul statistic este:
26 , 17
100
1726 ) 1 (
2
2
2
· ·

·
σ
χ
s n
.
Cum
92 , 16
2
9 , 05 . 0
2
1 ,
· ·

χ χ
α n , şi
2
1 ,
2

>
n α
χ χ
vom respinge ipoteza nulă şi
vom accepta ipoteza alternativă,
100
2
> σ
.
Exemplu 7 : testarea ipotezei privind raportul dintre două
dispersii
Un analist doreşte să compare împrăştierea veniturilor pe familie,
pentru colectivitatea turiştilor ce preferă turismul litoral, cu împrăştierea
veniturilor, pentru colectivitatea turiştilor ce preferă turismul balnear.
Presupunând că distribuţiile veniturilor (mil. lei), în cele două colectivităţi
sunt aproximativ normale au fost selectate două eşantioane, de volum 60 şi
50 de persoane, iar abaterile medii pătratice (mil. lei) sunt:
84 , 2
1
· s
şi
86 , 1
2
· s
. Se utilizează o probabilitate de garantare a rezultatelor de 95%.
Ipotezele statistice sunt:
1 / :
2
2
2
1 0
· σ σ H
,
1 / :
2
2
2
1 1
> σ σ H
.
Testul statistic are valoarea:
3314 , 2
4596 , 3
0686 , 8
86 , 1
84 , 2
2
2
2
2
2
1
· · · ·
s
s
F
.
Regiunea critică (pentru
05 , 0 · α
) este dată de:
64 , 1
49 ; 59 ; 05 . 0
≈ >F F
.
Cum
49 ; 59 ; 05 . 0
F F >
ipoteza nulă se respinge (aceea că raportul dintre
dispersii este 1) şi se acceptă ipoteza alternativă. Acest lucru înseamnă că
se acceptă ipoteza conform căreia împrăştierea veniturilor pentru turiştii
din zona litorală este semnificativ mai mare decât cea a turiştilor din
zona balneară.
În general - dacă la numărător se trece dispersia cea mai mare - testul
F este un test unilateral dreapta.
2.5. BIBLIOGRAFIE
1. Andrei, T. - Statistică şi econometrie
Editura Economică, Bucureşti, 2004.
2. Bourbonnais R , Econometrie , Ed.
Dunod , Paris , 1998
3. Dormont B , Introduction a
l’econometrie , Ed. Montchrestien , Paris ,
1999
4. Florea I.(coordonator), Culegere de
modele econometrice, Ed. Muntele
Sion,2000.
5. Iacob, A.I., Tănăsoiu, O. Econometrie,
Studii de caz, Ed. ASE, Bucureşti, 2005.
6. Pecican, E.... Econometrie pentru
economişti, Ed. Economică, Bucureşti, 2004.
Capitolul 3
3.1.OBIECTIVE: introducerea studenţilor în sfera şi noţiunile
specifice
modelului de regresie,
3.2.PREZENTARE SINTETICĂ:
3.2.1 Specificarea unui model de regresie
Un studiu econometric începe cu o serie de presupuneri teoretice
despre anumite aspecte ale economiei.
Investigaţiile empirice furnizează estimatori pentru parametri
necunoscuţi ai modelului.
Keynes: C=f(x)
Suma cheltuită pentru consum depinde de:
• mărimea venitului pe de o parte
• alte obiective în funcţie de circumstanţe (de exemplu investiţiile)
• alte nevoi subiective
Legea psihologică fundamentală: „o persoană este dispusă de
regulă şi în medie să îşi crească consumul pe măsura creşterii venitului
dar nu în aceeaşi măsură”
1 0 < <
dX
dC
un nivel absolut mai mare al venitului va tinde de regulă să
mărească diferenţa între venit şi consum:
0
) / (
<
dX
X C d
Presupunerea cea mai simplă: C=α +β X, 0<β <1 este o relaţie
deterministă neadecvată.
În model trebuie inclus şi factorul aleator:
C=f(X,ε )
Modelul cel mai simplu:
C=α +β X+ε
Modelul general ce trebuie estimat are forma:
y
i
=α + β x
i
+ ε
i
, i=1,n
unde: - x
i
este nestochastic (situaţie experimentală)
- analistul alege valorile regresiei x
i
şi apoi observă y
i
Valoarea parametrului β arată modificarea proporţională a
variabilei efect (Y) la modificarea cu o unitate a variabilei cauză (X).
Valoarea parametrului α arată punctul în care linia interceptează
(taie) axa OY
ε
i
reprezintă componenta reziduală (eroarea aleatoare) pentru
fiecare unitate, adică partea din valoarea variabilei Y care nu poate fi
măsurată prin relaţia sistematică existentă cu variabila X.
Modelul liniar unifactorial y=1+0,5x
Modelul probabilistic conţine:
a) componenta deterministică, adică partea din valoarea lui Y
i
care
poate fi determinată cunoscând valoarea X
i
(α + β X
i
= Y
i
')
b) componenta reziduală care nu poate fi determinată cunoscând
valoarea individuală Xi (ε i)
Atunci,
Y
i
= α + β X
i
+ ε
i

Y
i
= componenta predictibilă (detrministică) + eroarea aleatoare
Y
i
= Y
i
' + ε
i
Dacă datele disponibile provin dintr-un eşantion avem la dispoziţie n
perechi de observaţii (x
1
, y
1
), (x
2
,y
2
), ... (x
n
, y
n
), pe care le vom folosi
pentru estimarea parametrilor ecuaţiei de regresie liniară simplă, α şi
β .
Modelul de regresie liniară în eşantion este y
i
= a + bx
i
+ e
i
cu componenta predictibilă: i i
bx a yˆ + ·
a şi b sunt estimatorii punctului de intercepţie (α ) şi pantei liniei drepte
(β ), obţinuţi pe eşantion
e
i
este valoarea reziduală (pentru unitatea i) în eşantion:
e
i
= y
i
– (a + bx
i
)
Abaterea e
i
de la linia de regresie
Ipotezele modelului de regresie liniară
Pentru a obţine proprietăţile dorite ale estimatorilor regresiei, se fac, de
obicei, cinci presupuneri (ipoteze) standard pentru modelul din populaţia
generală:
Ipotezele ce trebuie verificate:
1. Forma funcţională: y
i
=α + β x
i
+ ε
i
, i=1,n
2. Normalitatea erorilor: ε
i
∼ N(0,σ
2
)
3. Media zero a erorilor: μ(ε
i
)=0 ∀i
4. Homoscedasticitatea: σ
2
ε
i
)=σ
2
constantă ∀i
5. Non autocorelarea erorilor: Cov(ε
i

j
)=0 ∀i≠ j
6. Necorelarea între regresor şi erori: Cov(x
i

j
)=0 ∀i şi j
Ipoteza 1: Forma funcţională
a. y=a+bx
a. y=a+bz, z=e
x
b. y=a+br, r=1/x
c. y=a+bq, q=ln(x)
-400
-200
0
200
400
600
800
1000
-1 0.003 0.008 0.013 0.018 0.023 0.028 0.033 0.038 0.043 0.048 0.053 0.058 0.063 0.068
X
Y

,
`

.
|
+
x
b a
1
x
be a +
bx a +
( ) x b a ln +
Fig. - Modele ce pot fi linearizate
Sau y=Ax
β
⇒ ln(y)=α +β ln(x)
Forma generală: f(y
i
)= α +β g(x
i
)+ε
i
Contra exemplu:
x
y
+
+ ·
β
α
1
nu poate fi transformat în model
liniar.
Erorile
Ipoteza de linearitate a modelului include şi aditivitatea erorilor.
Forma modelului:
y = α + β x

+ ε ,
De exemplu modelul
ε β
e Ax y ·
se transformă prin logaritmare în
modelul liniar: ln(y)=ln(A)+β ln(x)+ε .
Însă modelul
ε
β
+ ·Ax y
nu mai poate fi transformat în model liniar.
Dacă ipoteza de linearitate este verificată, variabila dependentă
observată este suma a două elemente:
- un termen nestochastic: α +β x
- o variabilă aleatoare
Ipoteza 2: normalitatea erorilor
Se presupune că variabila aleatoare ε
i
este normal distribuită :
Distribuţia de probabilitate pentru ε
i
Ipoteza 3: media erorilor este zero: μ( ε
i
)=0 ∀ i
Este naturală atâta timp cât ε este văzută ca suma efectelor
individuale, cu semne diferite.
Dacă media erorilor este diferită de zero, ea poate fi considerată ca
o parte sistematică a regresiei:
μ(ε )=µ ⇒ α + β x

+ ε = (α +µ ) + β x

+ (ε -µ )
media erorilor este acum nulă.
Această presupunere indică faptul că media valorilor Y, condiţionat
de X, µ (Y/X = X
i
) = α + β X
i
, adică nu există variabile omise asociate
cu regresia în populaţie.
Ipoteza 4 (de homoscedasticitate): Var( ε
i
)= σ
2
constantă ∀ i
Dispersia reziduurilor în populaţie este constantă peste toate
valorile X
i
Functia de consum
0
200
400
600
800
1000
1200
200 300 400 500 600 700 800 900 1000
venit
c
o
n
s
u
m
a) constantă b) constantă
Dispersia reziduurilor a) constantă; b) constantă
Discuţie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile
firmelor mici.
variaţia cheltuielilor gospodăriilor în funcţie de venit sau de
mărimea lor poate fi diferită.
Ipoteza 5: Non autocorelarea erorilor: μ( ε
i
ε
j
)=0 ∀ i≠ j
Această ipoteză nu implică faptul că y
i
şi y
j
sunt necorelate, ci
faptul că deviaţiile observaţiilor de la valorile lor aşteptate sunt
necorelate.
Variabilele aleatoare ε
i
sunt statistic independente una de alta, adică
j i
ε ε
µ
= 0, pentru i ≠ j. Acest lucru înseamnă că eroarea asociată cu o
valoare a variabilei Y nu are nici un efect asupra erorilor asociate cu alte
valori ale lui Y;
nu există deci corelaţie între reziduuri;
OBSERVAŢIE: De asemenea este convenabil a considera că
erorile sunt independente şi normal distribuite cu medie zero şi
variaţie constantă pentru obţinerea de rezultate statistice exacte.
Estimarea parametrilor modelului de regresie clasic
Parametrii necunoscuţi ai reacţiei stochastice sunt cei ce trebuie
estimaţi:
y
i
=α + β x
i
+ ε
i
, i=1,n
Modelul estimat va fi scris:
n i bx a y
i i
, 1 , · + ·

Eroarea asociată unui punct i este:
ε
i
= y
i
- α - β x
i
Pentru orice valori estimate a şi b, erorile estimate vor fi:
e
i
= y
i
- a - bx
i
Pentru estimarea parametrilor α şi β pe baza datelor
observate, un criteriu natural este cel de maximizare a potrivirii
modelului cu datele observate, deci de minimizare a erorilor
observate:
∑ ∑ − − ·
i
i i
i
i
bx a y e
2 2
) ( min min
Condiţiile de ordin 1 de minimizare a funcţiei sunt:
¹
¹
¹
¹
¹
¹
¹
'
¹
·


·




0
) (
0
) (
2
2
b
e
a
e
i
i
i
i

¹
¹
¹
'
¹
+ ·
+ ·
∑ ∑ ∑
∑ ∑
b x a x y x
b x n a y
i
i
i
i
i
i i
i
i
i
i
) ( ) (
) (
2
¹
¹
¹
¹
¹
¹
¹
¹
¹
'
¹


· ·
− ·


∑ ∑

∑ ∑

2
2
2
x n x
y x n y x
x x
x n
y x x
y n
b
x b y a
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i
Rămâne de verificat dacă este verificată condiţia de ordin 2, adică
soluţia găsită este un punct de minim. Matricea derivatelor parţiale de
ordin doi trebuie să fie pozitiv definită:
]
]
]
]
]

·
]
]
]
]
]
]
]
]



∂ ∂

∂ ∂



∑ ∑

∑ ∑
∑ ∑
i
i
i
i
i
i
i
i
i
i
i
i
i
i
x x
x n
b
e
a b
e
b a
e
a
e
2
2 2
2 2 2 2
2 2
2 2
2 2
2 2
2 2
) ( ) (
) ( ) (
¹
¹
¹
¹
¹
¹
¹
'
¹
> − · −
>
>
∑ ∑ ∑

0 ) ( 4 ) ( 4 4
0 2
0 2
2 2 2
2
i
i
i
i
i
i
i
i
x x n x x n
x
n
Deci matricea este pozitiv definită.
3.2.2 Modelul de regresie clasic
Evaluarea validităţii modelului de regresie clasic
Estimatorii a (intercepţia) şi b (panta) ai parametrilor α şi β sunt
daţi de :
2
n
1 i
i
n
1 i
2
i
n
1 i
i i
n
1 i
i
n
1 i
2
i
n
1 i
i
x x n
y x x x y
a

,
`

.
|
∑ − ∑

,
`

.
|

,
`

.
|
∑ − ∑ ∑
·
· ·
· · · ·
∑ −
∑ ⋅ −
·

,
`

.
|
∑ −

,
`

.
|

,
`

.
|
∑ − ∑
·
·
·
· ·
· · ·
n
1 i
2 2
i
n
1 i
i i
n
1 i
2
n
1 i
i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
x n x
y x n y x
x x n
y x y x n
b
Se observă că obţinem din ecuaţia: ∑ · ∑ +
· ·
n
1 i
i
n
1 i
i
y x b na
împărţind prin n :
n
x b y
x b y a
n
1 i
i
n
1 i
i

,
`

.
|
∑ − ∑
· − ·
· ·
şi, înlocuind în ecuaţia : ∑ · ∑ + ∑
· · ·
n
1 i
i i
n
1 i
2
i
n
1 i
i
y x x b x a
pe x
i
cu deviaţia
( ) x x
i

obţinem:
( ) ( ) ( )
i
n
1 i
i
n
1 i
2
i
n
1 i
i
y x x x x b x x a ∑ − · ∑ − + ∑ −
· · ·
Cum primul termen situat în partea stângă a ecuaţiei este egal cu
zero, rezultă:
( )
( )
( ) ( )
( )
( )( )
( )
∑ −
∑ − −
·
∑ −
∑ ∑ − − −
·
∑ −
∑ −
·
·
·
·
·
·
·
n
1 i
2
i
n
1 i
i i
n
1 i
2
i
n
1 i
i i i
n
1 i
2
i
n
1 i
i i
x x
y y x x
x x
x x y y x x
x x
y x x
b
şi în final:
( )( )
( )
2
x
xy
n
1 i
2
i
i
n
1 i
i
s
s
n
x x
n
y y x x
b ·
∑ −
− ∑ −
·
·
·
Estimatorul a (intercepţia) poate lua valori negative sau pozitive.
Estimatorul b (panta liniei drepte) numit şi coeficient de regresie
are întotdeauna semnul indicatorului s
xy
,
s
xy
este covarianţa între x şi y.
Linii de regresie cu a) pantă pozitivă b) pantă negativă
c) pantă egală cu zero
∑ · ∑
· ·
n
1 i
i
n
1 i
i
yˆ y
În evaluarea validităţii modelului se verifică dacă variaţia lui x este
un bun predictor pentru variaţia lui y.
Doi indicatori alternativi pot fi utilizaţi pentru a măsura calitatea
ajustării pentru regresia statistică :
Abaterea medie pătratică (eroarea standard) a reziduurilor
(măsură absolută a calităţii ajustării pe baza regresiei în eşantion)
Coeficientul de determinaţie (indicator relativ).
Este necesar să analizăm componentele indicatorilor de variaţie a lui y.
În aplicarea metodei regresiei, sunt asociate variabilei dependente y
două medii:
media totală (
y
) şi
media condiţionată ( i i
bx a yˆ + ·
).
variaţia (abaterea) totală (
y y
i

) poate fi împărţită în :
abaterea neexplicată de model ( i i
yˆ y −
) şi
abaterea explicată (
y yˆ
i

), astfel:
) y yˆ ( ) yˆ y ( y y
i i i i
− + − · −
Abaterea ( i i
yˆ y −
) nu poate fi explicată de linia de regresie, deoarece
atunci când x
i
se modifică, ambele valori y
i
şi i

se modifică;
abaterea (
y yˆ
i

) poate fi explicată, deoarece când x
i
se schimbă,
y
rămâne constant
Abaterea valorilor individuale y
i
de la medie
Prin ridicarea la pătrat a fiecărei abateri şi însumarea pentru toate
observaţiile, obţinem:
∑ ∑ − + − · ∑ −
· · ·
n
1 i
n
1 i
2
i
2
i i
n
1 i
2
i
) y yˆ ( ) yˆ y ( ) y y (
Putem nota:
∑ ∆ · −
·
n
1 i
2
y
2
i
) y y (
= varianţa totală, suma pătratelor abaterilor totale.
∑ ∆ · −
·
n
1 i
2
e
2
i i
) yˆ y (
= varianţa neexplicată, suma pătratelor erorilor.
∑ ∆ · −
·
n
1 i
2
x / y
2
i
) y yˆ (
= varianţa explicată, suma pătratelor abaterilor dato-
rate regresiei.
Vom avea, atunci:
2
e
2
x / y
2
y
∆ + ∆ · ∆
se mai notează:
Variaţia variabilei dependente y este definită în termeni de deviaţie
de la valoarea ei medie:
∑ − ·
i
i
y y SST
2
) (
⇒ + + − · + + · + ·

i i i i i i i
e bx x b y e bx a e y y
⇒ + − · −
i i i
e x x b y y ) (
∑ ∑ ∑ ∑ − + + − · −
i
i i
i
i
i
i
i
i
x x e b e x x b y y ) ( 2 ) ( ) (
2 2 2 2
Deci: SST = SSR + SSE
Variaţia totală = Variaţia de regresie + Variaţia reziduală
Putem calcula şi discuta cei doi indicatori ai calităţii ajustării
astfel :
tabelul ANOVA este pentru testarea calităţii ajustării
Tabelul ANOVA

Sursa
variaţiei
Suma pătratelor Grade de
libertate
Media pătratelor
(dispersia
corectată)
0 1 2 3
Datorată
regresiei
Reziduală
( ) ∑ − · ∆
·
n
1 i
2
i
2
x / y
y yˆ
( ) ∑ − · ∆
·
n
1 i
2
i i
2
e
yˆ y
k
n – k – 1
k
s
2
x / y
2
x / y

·
1 k n
s
2
e 2
e
− −

·
Totală
( ) ∑ − · ∆
·
n
1 i
2
i
2
y
y y
n – 1
1 n
s
2
y
2
y


·
Unde:
k reprezintă numărul variabilelor independente luate în consideraţie
(pentru regresia liniară simplă, k = 1).
Dacă se împart varianţele la (n – 1), avem:
( ) ( ) ( )
1 n
y yˆ
1 n
yˆ y
1 n
y y
n
1 i
2
i
n
1 i
2
i
n
1 i
2
i

∑ −
+

∑ −
·

∑ −
· · ·
relaţie care poate fi scrisă ca
( ) ( )
( )
1 1
ˆ
1
2
2 1
2
1
2


+


·



∑ ∑
· ·
n
x x
b
n
y y
n
y y
i
n
i
i i
n
i
i
deoarece:
( ) ( ) ( )
∑ ∑ ∑
· · ·
− · − − + · −
n
i
n
i
i i
n
i
i
x x b x b a bx a y y
1 1
2
2
2
1
2
ˆ
abaterea medie pătratică a erorilor în eşantion este:
( )
2 n
yˆ y
2 n
s
n
1 i
2
i i
2
e
e

∑ −
·


·
·
unde
2
e
s
este un estimator nedeplasat al dispersiei reziduurilor
2
ε
σ
.
o mărime relativă a calităţii ajustării, prin exprimarea ponderilor
dispersiilor (explicată şi reziduală) în dispersia totală este:
2
y
2
e
2
y
2
x / y
2
y
2
y
00 , 1


+


· ·


Coeficientul de determinaţie este:
( )
( )
∑ −
∑ −
·


− ·


·
·
·
n
1 i
2
i
n
1 i
2
i
2
y
2
e
2
y
2
x / y
2
y y
y yˆ
1 R
Raportul
2
y
2
x / y
/ ∆ ∆
reprezintă proporţia variaţiei totală care este
explicată de linia de regresie.
Sau se poate scrie
Coeficientul de determinare ca proporţia variaţiei explicată de
modelul de regresie în variaţia totală:
[ ] 1 , 0
2
∈ ·
SST
SSR
R
R
2
= 0 dacă b=0,
y y ·

, deci dacă ecuaţia de regresie este o dreaptă
orizontală. În acest caz variabila x nu are putere explicativă.
R
2
= 1 dacă punctele determinate de observaţiile făcute asupra
variabilelor x şi y se află toate pe o dreaptă, caz în care erorile vor fi
zero.
În cazul în care toate valorile lui y se află pe o dreaptă verticală, R
2
nu are nici o semnificaţie şi nu poate fi calculat.
Aşadar, R
2
reprezintă măsura în care variabila independentă, X,
explică variaţia variabilei rezultative Y.
Coeficientul de determinaţie nu este ajustat cu gradele de libertate.
Dacă utilizăm estimatorii nedeplasaţi
2
y
s
şi
2
e
s
, obţinem valoarea
ajustată a coeficientului de determinaţie

,
`

.
|
2
R
.
1 n /
1 k n /
1 R
2
y
2
e
2
− ∆
− − ∆
− ·
Valoarea lui
2
R este întotdeauna mai mică decât valoarea lui R
2
.
Observaţii:
1. R
2
poate fi interpretat ca procentul variaţiei lui y explicată de
variaţia veriabilei x doar pentru cazul în care metoda celor mai mici
pătrate este aplicată modelului liniar de regresie.
2. Pentru orice model coeficientul R
2
poate fi calculat ca:
yy
i
i
S
e
R

− ·
2
2
1
unde
∑ − ·
i
i yy
y y S
2
) (
3.3. Probleme rezolvate
Exemplu : Modelul de regresie clasic
I. Estimarea parametrilor
Ecuaţiile normale pentru exemplul din primul paragraf privind
consumul şi veniturile sunt:
¹
'
¹
·
− ·

¹
'
¹
+ ·
+ ·
9 7 9 2 6 7 , 0
5 8 0 6 , 6 7
2 2 , 7 7 9 7 8 2 2 4 , 8 7 9 2 2 7 , 7 0 4 1 9 5 3
4 , 8 7 9 2 1 0 3 , 7 9 3 4
b
a
b a
b a
Deci:
C = -67,58 + 0,98 V
Interpretare:
1. La o variaţie a venitului cu o unitate monetară, consumul va
varia în aceeaşi direcţie cu 0,98 unităţi monetare.
2. Termenul liber se interpretează în general ca nivelul variabilei
dependente pentru cazul în care variabila independentă este zero. În
cazul exemplificat, valoarea termenului liber este negativă, iar consumul
nu poate fi negativ, deci singura interpretare ce poate fi dată este că va
avea loc a consumul de la un nivel al venitului de: 67,58/0,98=69.
II. Determinarea coeficientului de determinare
Pentru exemplul anterior se mai cunosc:
24 , 879 x ; 43 , 793 · · C
S
cc
=64972,12; S
xx
=67192,44; S
xc
=65799,34
SST = S
cc
= 64972,12
SSR = b
2
S
xx
= 0,979267*67192,44 = 64435,12
SSE = SST-SSR = 64972,12 - 64435,12 = 537
Deci: R
2
= SSR/SST = 64435,13/64972,12 = 0,99173
Interpretare:
1. 99,17% din variaţia consumului este datorată variaţiei venitului.
2. 99,17% din variaţia consumului este explicată de modelul de
regresie.
III. Testarea coeficientului de determinare
Tabelul ANOVA
Sursa
variaţiei
Măsura
variaţiei
Numărul
gradelor de
libertate
Suma
pătratelor
Variaţia de
regresie
64435,12 1 64435,12
Variaţia
reziduală
537 8 67,124
Variaţia
totală
64972,12 9 7219,12
F
calc
= 64435,12/67,124 = 959,94
F
0,95;1,8
= 5,32
F
calc
> F
0,95;1,8
deci R
2
este reprezentativ.
Bibliografie generală
1. Andrei, T. - Statistică şi econometrie Editura
Economică, Bucureşti, 2004.
2. Bourbonnais R , Econometrie , Ed. Dunod , Paris ,
1998
3. Dormont B , Introduction a l’econometrie , Ed.
Montchrestien , Paris , 1999
4. Florea I.(coordonator), Culegere de modele
econometrice, Ed. Muntele Sion,2000.
5. Green W H , Econometric Analysis , Ed. Pretince
Hall , Londra , 1997
6. Giraud R , Chaix N , Econometrie , Ed. P.U.F. ,
Paris , 1989
7. Gourieroux C , Monfort J , Statistique et modeles
econometriques , Ed. Economica , Paris , 1989
8. Iacob, A.I., Tănăsoiu, O. - Modele econometrice
Volumul I, Ed. II rev., Ed. ASE, Bucureşti, 2005.
9. Iacob, A.I., Tănăsoiu, O. Econometrie, Studii de
caz, Ed. ASE, Bucureşti, 2005.
10. Pecican E., Econometrie, Ed. Intercredo, Deva,
1997.
11. Pecican, E.... Econometrie pentru economişti, Ed.
Economică, Bucureşti, 2004.

Cuprins Capitolul 1 Introducere în econometrie 1.1 Obiective 1.2 Prezentare sintetică 1.2.1 Scurt istoric privind apariţia şi dezvoltarea econometriei 1.2.2 Definiţiile econometriei 1.2.3 Locul şi rolul econometriei în sistemul ştiinţelor economice 1.2.4 Noţiuni şi concepte fundamentale ale econometriei 1.3 Întrebări 1.4 Probleme rezolvate 1.5. Probleme propuse 1.6. Bibiliografie Capitolul 2 Testarea ipotezelor statistice 2.1 Obiective 2.2 Prezentare sintetică 2.2.1 Concepte şi erori în testarea ipotezelor statistice 2.2.2. Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum mare 2.2.3 Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum mare 2.2.4.Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum redus 2.2.5.Testarea ipotezei privind proporţia populaţiei pentru eşantioane mari 2.2.6. Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum redus 2.2.7. Testarea ipotezei privind dispersia unei populaţii 2.2.8.Testarea ipotezei privind raportul dintre două dispersii 2.3 Întrebări 2.4.Probleme rezolvate 2.5.Bibiliografie Capitolul 3 Modelul de regresie 3.1 Obiective 3.2 Prezentare sintetică 3.2.1 Specificarea unui model de regresie 3 3 3 4 6 8 15 16 37 40 41 41 41 45 49 51 52 53 55 56 58 60 66 67 67 67
2

3.2.2 Modelul de regresie clasic 3.3 Întrebări 3.4 Probleme rezolvate 3.5.Bibiliografie

67 74 79 80

3

Galton şi K. L. H. apărută în domeniile de interferenţă ale teoriei economice. termenul de econometrie provine din cuvintele greceşti: eikonomia (economie) şi metren (măsură). Pearson la sfârşitul 4 . Frisch. Un rol deosebit în dezvoltarea şi popularizarea econometriei l-a avut revista acestei societăţi. Bortkiewicz. care apare trimestrial.1 1. avându-i ca iniţiatori pe: Irving Fischer preşedinte. N. R. începând din ianuarie 1933. V. folosit de Fr. prin analogie cu termenul „biometrie". se consideră anul 1930 (29 decembrie). „Econometrica".2. L.2 PREZENTARE SINTETICĂ: 1. Schumpeter. Etimologic. Hotelling. când s-a înfiinţat la Cleveland Societatea de Econometrie (Econometric Society).Capitolul 1 Introducere în econometrie OBIECTIVE: introducerea studenţilor în sfera şi noţiunile specifice econometriei 1. statisticii şi matematicii. economist şi statistician norvegian. El a fost introdus (1926) de către Ragnar Frisch. Wiener şi alţii. 1 Scurt istoric privind apariţia şi dezvoltarea econometriei Un moment important în constituirea şi dezvoltarea Econometriei ca disciplină economică de frontieră.

J. - în domeniul funcţiilor de producţie: C. indispensabil teoriei şi practicii economice pentru investigarea riguroasă a fenomenelor şi proceselor economice. P.T. Stone. care desemna cercetările biologice ce utilizau metodele statisticii matematice. Hotelling. Cobb. Kantarevici.a. În momentul actual. Dar nu cei care au introdus termenul şi au înfiinţat Societatea de Econometrie au şi „inventat" această disciplină. W. Gregory King. 1 Numele scrise cu italice îi desemnează pe laureaţii Premiului Nobel în econometrie 5 . H. R. G. ş. V. R. Engel. S. Goldberger. Haavelmo. impulsionată puternic de revoluţia tehnico-ştiinţifică . contribuţii importante la dezvoltarea econometriei au fost aduse de: - în domeniul analizei economice a cererii: M. R. Theil1. H. Klein. K. Tintner. L. Fisher. E.cu realizări de vârf în domeniul calculatoarelor electronice . A. W. R. - „fără modele": T. studierea cantitativă a fenomenelor economice este mult mai veche. Printre precursorii econometriei moderne pot fi citaţi: F. H. Arrow. Friedman.econometria a devenit un instrument metodologic de bază. H. Quesnay. în domeniul metodelor de analiză a datelor sau al econometriei K. Wald. A. A. J. Tinbergen. Leon Walras. P. W. Sub aspect istoric. Fisher şi alţii. Cournot. În perioada contemporană. Douglas. A. în domeniul modelelor macroeconomice: A. J.. - O.secolului XIX. Petty. Marshall. Pearson şi alţii. Onicescu. Anderson. Benzécri.

unificarea lor este aceea care asigură eficienţa. Frisch în primul număr al revistei „Econometrica". 1940-1950). definiţia extinsă. este o condiţie necesară. definiţia restrictivă.2. 6 . Totuşi. al statisticii. în ianuarie 1933: „experienţa a arătat că fiecare din următoarele trei puncte de vedere. marea majoritate a acestora poate fi încadrată în următoarele trei grupe: a) b) c) definiţia istorică. a) Definiţia istorică a econometriei a fost formulată de R. 2 Definiţiile econometriei Dezvoltarea rapidă a econometriei a generat formularea mai multor definiţii cu privire la domeniul acestei discipline economice. susţinătorii ei consideră că prin econometrie se înţelege studierea fenomenelor economice pe baza datelor statistice cu ajutorul modelelor matematicii. Conform acestei definiţii.1. dar nu şi suficientă. consideră că nu există econometrie dacă investigarea fenomenelor economice nu se face cu ajutorul modelelor aleatoare (stochastice). Econometria este tocmai această unificare". pentru o înţelegere efectivă a realităţilor cantitative din economia modernă. al teoriei economice şi al matematicii. b) Definiţia restrictivă propusă de Cowles Commission for Research in Economics (Chicago.

Susţinătorii acestei definiţii. Rottier. Klein. analiza seriilor cronologice. L. G. includ în domeniul econometriei numai cercetările economice care utilizează metodele inducţiei statistice . -o interpretare aleatoare a modelului respectiv. procesul sau sistemul investigat. modelul lui Leontief (B. un studiu econometric presupune: . Această -o definiţie restrictivă exclude sau din domeniul econometriei cercetările economice care nu se fundamentează pe: teorie economică . care reprezintă fenomenul. pe baza căreia se construieşte modelul formalizarea ipotezelor teoriei economice cu privire la fenomenul. construirea modelului econometric şi rezolvarea acestuia. Malinvaud. verificarea ipotezelor statistice . procesul sau sistemul economic cercetat. E.teoria estimaţiei. procesului sau sistemului studiat.) ca şi statistica economică (care se fundamentează pe metoda balanţelor) nu intră în sfera de cuprindere a econometriei: 7 .existenţa prealabilă a unei teorii economice privind economic. Conform acestor definiţii.R. Astfel.la verificarea relaţiilor cantitative formulate în teoria economică cu privire la fenomenele sau procesele economice cercetate.implicită explicită privind modelul econometric al fenomenului.posibilitatea aplicării metodelor inducţiei statistice la verificarea ipotezelor teoriei economice. R.L. .

prima. cât şi prin structura planurilor de învăţământ de la facultăţile economice. se înţelege econometria. c) Definiţia extinsă a econometriei. În prezent. teoria deciziilor. teoria grafelor. îşi menţionează concepţia pe baza căreia şi-au structurat lucrările. include domeniile menţionate atunci când ea este înţeleasă în sens restrictiv. 8 . iar ultimele două. în sensul larg al termenului. deşi rareori se fac precizări exprese. definită în mod restrictiv. promovată de economiştii din ţările anglo-saxone. Deoarece încă nu s-a cristalizat o concepţie unitară privind „frontierele" econometriei. atât în literatura de specialitate. în domeniul econometriei se includ şi tehnicile moderne de analiză a datelor sau analiza marilor tabele. a metodelor cercetării operaţionale: teoria optimului. etc. fiindcă nu permit aplicarea metodelor inducţiei statistice. de regulă. Prin econometrie. ţine seama de puternica dezvoltare. adică. apărută după 1950. în accepţiunea largă a termenului. teoria jocurilor. În ţara noastră. econometria este concepută şi aplicată ca metodă generală de investigare cantitativă a fenomenelor şi proceselor economice -adică. la care se adaugă metodele cercetării operaţionale. în manualele sau tratatele de econometrie. autorii. teoria stocurilor. deoarece existenţa unei teorii economice nu este necesară.

cât şi aspectele legate de efectul întârziat în timp. 3 Locul şi rolul econometriei în sistemul ştiinţelor economice Apariţia şi rapida afirmare a econometriei trebuie înţeleasă şi explicată prin prisma raportului dialectic dintre teorie şi practică.Un domeniu mai puţin abordat. Modelele deterministe. propagarea impulsului unor variabile exogene asupra variabilei prognozate. îl constituie metodele econometriei. elemente dinamice prin natura lor. pentru a prognoza pertinent evoluţia fenomenelor. în acest sens. Acestea sunt motivele care au determinat ca modelele dinamice bazate pe analiza evoluţiei în timp a fenomenelor economice . atât teoretic. natura oscilaţiilor de diferite frecvenţe etc. în sensul restrictiv al termenului. proceselor sau sistemelor economice. se insistă asupra faptului că studiul seriilor de timp privind evoluţia fenomenelor economice nu poate fi independent de teoria economică. nu atât determinarea şi extragerea econometrică a tendinţei. 1. în studiile mult mai recente. mai ales. respectiv modelele aleatoare (stochastice).2.să-şi găsească locul în arsenalul modelelor econometrice prezentate în acest curs. Se au în vedere. a 9 . De asemenea. sunt de multe ori inadecvate pentru a explica şi. cât şi practic. utilizate în mod curent şi de multă vreme în teoria şi practica economică din ţara noastră.

statistică.conexiunii inverse pozitive ce se manifestă între elementele acestui raport. creează probleme dificile privind explicarea şi dirijarea evoluţiei fenomenelor economico-sociale către anumiţi indicatori ţintă. Deşi penetrarea ştiinţei economice de către metodele statistico-matematice reprezintă un progres calitativ. pe lângă componenta lor cuantificabilă. Dezvoltarea continuă şi dinamică a forţelor de producţie sub impactul progresului ştiinţific şi tehnic modifică condiţiile şi interdependenţele din producţie. nu trebuie uitat faptul că fenomenele economice. repartiţie. au determinat adoptarea de către ştiinţele economice a acestor metode. pe plan teoretic şi practic.matematică . şi succesele metodelor statistico-matematice în alte domenii ale ştiinţei . circulaţie şi consum. astronomie etc. matematică şi statistică. dirijare şi conducere a economiei. . conţin aspecte care nu pot fi reprezentate prin cantitate. teorie economică . În cadrul aceastei triade.pe de altă parte. locul central îl ocupă teoria economică. ci prin integrarea dintre teoria economică. Aceste particularităţi ale fenomenelor 10 . Necesitatea elaborării unor instrumente de investigare şi de sporire a eficienţei metodelor de organizare. pe de o parte.fizică. ceea ce. Econometria s-a format şi se dezvoltă nu în urma unui proces de diversificare a ştiinţei economice. formulaţi şi urmăriţi de o anumită politică economică. chimie.

singurul mod de experimentare pe baza căruia ştiinţa economică îşi poate fundamenta ipotezele. limitele econometriei în sistemul ştiinţelor economice. Prin această experimentare. În prezent. de scopurile urmărite de teoria economică scopuri euristice sau de dirijare privind obiectul studiat. îmbogăţindu-şi în felul acesta sistemul de informaţii privind structura şi evoluţia obiectului economic. tipologia metodelor econometrice utilizate de ştiinţele economice este extrem de vastă. renunţă sau elaborează metode noi. în general. El reprezintă o cale de confruntare a teoriei cu practica. Modelul astfel construit reprezintă o verigă intermediară între teorie şi realitate. mijlocită de modelul econometric. Similitudinea sa formală cu obiectul economic investigat depinde de nivelul de abstractizare a teoriei. De remarcat că raporturile econometriei cu ştiinţele economice nu sunt numai de dependenţă. îşi confruntă problemele de semantică şi semiotică economică. din moment ce obiectul său de cercetare poate fi numai observat. de definirea univocă şi operaţională a noţiunilor şi categoriilor economice.economice constituie. nu şi izolat şi cercetat în laborator. un model econometric nu se poate elabora dacă nu s-a constituit o teorie economică a obiectului cercetat. ştiinţele economice validează. Folosirea din ce în ce mai amplă a acestor modele la investigarea fenomenelor economice se datorează 11 . Într-adevăr.

mai ales. de asemenea. oferind informaţii cu privire la comportamentul variabilelor endogene în diverse alternative de acţionare a pârghiilor economice. Particularizând legăturile econometriei cu unele dintre disciplinele economice. legătura econometriei cu sistemul financiar-contabil. Previziunea macro sau microeconomică reprezintă un domeniu care utilizează în mare măsură rezultatele simulării şi. În acest fel. nu în mai complexe modele econometrice. contribuie la obţinerea variantelor economice. Menţionăm. al utilizării calculatoarelor electronice care permit rezolvarea operativă a celor .progreselor însemnate făcute în domeniul metodelor de estimare a parametrilor modelelor şi al testelor de verificare pe care se fundamentează acestea şi. previziunii economice i se oferă o perspectivă în legătură cu ceea ce s-ar putea întâmpla în viitor. previziunea defineşte variabilele endogene (rezultative) şi pachetul variabilelor exogene corespunzătoare obiectivelor urmărite în funcţie de informaţiile statistice existente. domeniu în care modelarea pătrunde tot mai mult 12 ultimul rând. etapa de specificare a acestuia. ale predicţiei econometrice. În această etapă. fie şi în linii mari. Econometria. este necesar să subliniem corespondenţa dintre modelarea econometrică şi previziune. în raport cu diferitele variante ale politicii economice care ar putea fi aplicate. îndeosebi. la rândul ei. Activitatea de previziune a economiei este aceea care „oferă" o serie de elemente utile elaborării modelului privind.

şi cel privind comerţul interior. reprezintă. iar modelarea econometrică este o metodă care conduce la obţinerea de cunoştiinţe sau informaţii noi privind starea. de asemenea. În concluzie. managementului sau viitorologiei. trebuie remarcat faptul că. Este totodată necesar să subliniem frecvenţa tot mai mare a aplicării metodelor econometrice în lucrări din domeniul biologiei. de altfel. se recomandă. altfel decât cu ajutorul metodelor statistice.reprezintă un mijloc de cunoaştere a unui obiect economic. în special. 13 . la elaborarea modelelor econometrice. Modelul econometric . domeniu în care previziunile sunt greu de realizat.vezi modelele ARCH. 4 Noţiuni şi concepte fundamentale ale econometriei Metoda modelelor sau metoda modelării reprezintă principalul instrument de investigare econometrică a fenomenelor econometrice. medicinei. în domeniul marketingului. Domeniul cooperării economice internaţionale. inductivă a unei legităţi economice . ca fiind deosebit de semnificative pentru descrierea mecanismelor economice. se poate reţine ideea că metoda econometriei este metoda modelării sau metoda modelelor. 1. demografiei şi.expresie formală. sectoare ale economiei ce pot beneficia de rezultatele econometriei în ceea ce priveşte planificarea şi eficientizarea activităţilor desfăşurate. De asemenea. structura (conexiunile dintre elemente) şi evoluţia unui proces sau sistem economic. ca. cu o tot mai mare insistenţă.2. introducerea relaţiilor financiar-bancare.

reprezentările econometrice.se construieşte în concordanţă cu teoria economică. modelul . o imagine convenţională. Quesnay (1738). modelul este mai accesibil investigaţiei întreprinse de subiect.imagine abstractă. devine un obiect supus cercetării şi experimentării (verificării). coeficientul de elasticitate formulat de Marshall (1890) reprezintă momente istorice de la care cercetarea economică trece de la etapa descriptivă la etapa de explicare formală a cauzelor şi formelor de manifestare ale fenomenelor economice. Utilizat în economie. homomorfă. Fiind o construcţie abstractă. MODELUL reprezintă un instrument de cercetare ştiinţifică. reproducând în mod simbolic teoria economică a obiectivului investigat. formală a unui fenomen. În acest mod. Modelul economic. rezultând modelul economic. În general. spre deosebire de modelele economice care explică structura fenomenului sau procesului 14 .Dar. Tabloul economic al economistului fiziocrat F. modelarea sau metoda modelelor nu constituie o noutate în ştiinţa economică. în care se neglijează proprietăţile neesenţiale. prin transformarea sa în model econometric. legile lui Engel (1857). aceasta fiind una din explicaţiile multiplelor utilizări pe care modelul le are în epoca contemporană. de la care se obţin informaţii noi privind comportamentul fenomenului respectiv. proces sau sistem economic . simplificată a obiectului supus cercetării.

n . c) c) variabila timp. i = 1. sunt considerate factori întâmplători (neesenţiali). Xj. variabilele Xj se mai împart în variabile exogene predeterminate (variabile de stare a sistemului -c a p a c i t a t e a d e p r o d u c ţ i e a u n e i î n t r e p r i n d e r i . Yi.) b) Variabila ALEATOARE. În cazul modelelor de simulare sau de prognoză.k. rezultative sau ENDOGENE. VARIABILELE care formează structura unui sistem econometric. s a u c u lag . care influenţează variabila endogenă Yi. impozitul pe profit etc. Aceste variabile (factori). se împart în variabile explicate. spre deosebire de 15 . pe baza ipotezelor teoriei economice. u. j = 1. sintetizează ansamblul variabilelor. t. şi variabile explicative. dar care nu sunt specificate în modelul econometric.economic de pe poziţia teoriei economice. după natura lor. operaţională. (n = numărul variabilelor rezultative. de simulare şi de previziune a fenomenelor economice. a) Variabilele economice. yt-1) şi variabile instrumentale sau de comandă economică (dobânda. cu excepţia variabilelor Xj. ele devenind instrumente de control şi dirijare.xt-1. pot fi: a) variabile economice. au întotdeauna o finalitate practică. factoriale sau EXOGENE. u. de regulă. b) variabila eroare (aleatoare). independente de variabilele endogene Yi . k = numărul variabilelor factoriale).

variabilei Yi. 16 . spre deosebire de modelele statice. ceea ce constituie un prim pas spre specificarea precisă a unor variabile care acţionează în timp. timpul. care reprezintă factorii determinanţi (esenţiali) ai De asemenea. Deşi timpul nu poate fi interpretat ca variabilă concretă (economică). fiind de natură calitativă.erori întâmplătoare şi nu sistematice . în acest scop formulându-se o serie de ipoteze statistice cu privire la natura distribuţiei acestei variabile. c) Variabila TIMP.conţinute de datele statistice privind variabilele economice. ca variabilă econometrică. . nu pot fi cuantificate şi.în primul rând. t. Pe baza acestor premise economice se acceptă că variabila aleatoare „U" urmează o lege de probabilitate L(u).variabilele Xj. permite identificarea unor regularităţi într-un proces evolutiv. imprimându-se acestora un atribut dinamic. se recurge la această variabilă explicativă (fictivă) din două motive: . ipoteze statistice care vor trebui testate cu teste statistice adecvate fiecărei ipoteze.în al doilea rând. se introduce în anumite modele econometrice ca variabilă explicativă a fenomenului endogen Yi. ca atare. variabila eroare reprezintă eventualele erori de măsură . el reprezintă măsura artificială a acelor variabile care acţionează asupra variabilei Y care. nici specificate în modelul econometric.

u = variabilă aleatoare. O problemă fundamentală care se ridică în această etapă o reprezintă calitatea datelor statistice. xn. — .3. n = numărul unităţilor observate). β şi c = c parametrii funcţiei. y2. e = numărul natural. fie prin efectuarea de observări statistice special organizate .1) 17 . x2.. Aceste valori ale variabilelor unui model se pot obţine pe două căi: fie pe baza sistemului informaţional statistic (banca de date)...de tipul anchetelor statistice. t = timpul.. L = forţa de muncă. xi = x1.yn. Sursa de date . A. respectiv autenticitatea şi veridicitatea acestora. Dacă un model economic se construieşte cu date (1. α.Variabilele economice se introduc într-un model econometric cu valorile lor reale sau empirice (yi = y1. K = capitalul. estemăsura econometrică a influenţei progresului tehnic asupra volumului producţiei.Un exemplu cunoscut în acest sens îl constituie funcţia de producţie Cobb -Douglas cu progres tehnic autonom: Q = A · Kα · Lß · ect · u unde: Q = volumul fizic al producţiei.

ani) la aceeaşi unitate economică: 18 .. în mod special. condiţie care se referă. - nu s-au produs modificări fundamentale privind condiţiile de desfăşurare a procesului analizat. - reprezentarea aceloraşi definiţii şi metodologii de calcul cu descrierea evoluţiei fenomenelor într-un interval de timp în care privire la sfera de cuprindere ale acestora în timp sau în spaţiu. ne vom rezuma numai a aminti că datele statistice care privesc variabilele economice specificate în model trebuie să fie culese fără erori sistematice de observare şi de prelucrare... - exprimarea variabilelor în aceleaşi unităţi de măsură. t reprezentând luni. ale variabilelor economice respective. la evaluarea indicatorilor economici în preţuri comparabile sau preţuri reale. el va căpăta aceste deficienţe.colectarea lor de la unităţi statistice omogene.false sau afectate de erori de măsură.2. mai rar seriile teritoriale. trimestre. „Materia primă" pentru calcule economice o constituie seriile cronologice (serii de timp sau serii dinamice). O serie cronologică se construieşte prin observarea variabilelor Y şi X pe perioade egale de timp (t = 1. T. Deoarece problema autenticităţii datelor economice ţine de domeniul statisticii economice. Omogenitatea datelor presupune: . preluate sau construite pe baza băncii de date statistice existente. îndeplinind condiţiile de omogenitate. fiind compromis sub aspect operaţional.

x2 T . poate fi definit prin doi parametri: 19 x2 xn .n. xn). un fenomen economic X={xi}.. sub următoarea formă: Xi Yi x1 ... Vectorul valorilor lui X. xi = (x1.. deci aparţin sistemului numerelor raţionale.. yT În comparaţie cu aceasta. xn).lună.la un anumit număr de unităţi socio-economice omogene. xi= (x1. o serie de spaţiu rezultă prin observarea variabilelor Y şi X într-o anumită perioadă de timp .i = 1.. trimestru... unde n = numărul unităţilor de acelaşi profil. ce aparţin aceluiaşi sector economic etc...T Xt yt 1 x1 xT 2 .. de regulă. .n poate fi introdus cu următoarele valori: 1) Valori reale sau empirice. y2 y1 . x2. O astfel de serie se prezintă.. semestru. y1 y2 yn Într-un model econometric.. x2. valori exprimate în unităţi de măsură specifice naturii fenomenului X.. ele fiind mărimi concrete şi pozitive. i = 1.. an ..

3. Se poate demonstra uşor că aceste valori centrate au media egală cu zero. 2 2 De obicei.3.4) 20 .3) σ x = M ( x ) fiind dispersia variabilei.3. iar dispersia lor este egală cu dispersia valorilor reale: − 1 ( xi − x ) = 0 ∑ n M (x ) = * (1. − 2) Valorile centrate : x =x −x i i * Aceste valori sunt tot mărimi concrete.media aritmetică a variabilei X 1 n x = M ( x) = n ∑1 xi i= − (1. se considera ca variabila X urmeaza o distributie normala de medie x si de abatere medie patratica σx : L(x) = N( x .2) - abaterea medie patratica a variabilei X σ x = σ 2 x = M (x 2 1 n )= ∑1 ( xi − x ) 2 n i= (1. dar ele aparţin sistemului numerelor reale având atât valori pozitive cât şi negative.. σx).

3.1) .6) − 2    xi − x  σ x 1 ** 2 M [( x ) ] = ∑  =1  = n  σx  σ2 x   (1.1) se citeşte: variabila x ** = 1 normală având media egală cu zero iar abaterea medie pătratică este egală cu unu (legea normală.5) 3) Valori − centrate şi normate sau abateri standard: x−x x = σ ** i i x Media si dispersia acestor valori este: − M (x ) = ** 1 ∑ n x−x=0 σ i x 2 (1. centrată şi redusă).3.− 1 1 * 2 2 M [(x ) ] = ∑ ( x ) = ∑ ( xi − x) 2 = M ( x ) n n * 2 (1. σx ( xi − x) urmează legea de probabilitate 21 .3. cât şi la 2 Relaţia L(x**) = N(0. abaterile standard sunt mărimi abstracte (adimensionale).7) 2 În plus faţă de aceste două proprietăţi L(x**) = N(0. Aceste calităţi conduc. atât la diminuarea calculelor statistice cu aceste valori.

fie de tradiţie sau fie de obiceiuri.efectuarea de comparaţii între distribuţiile mai multor fenomene economice de naturi diferite. Din rândul acestora fac parte. sub forma deciziei. Relaţiile tehnologice descriu atât imperativele de ordin tehnologic privind producţia cât şi relaţiile tehnico-economice existente în producţie. de 22 . sistemul de preţuri. cererea monetară. care încearcă să descrie răspunsul variabilei endogene Y. investiţiile. Aceste relaţii tehnologice sunt reprezentate de cunoscutele funcţii de producţie de diferite tipuri. etc. relaţii de comportament. la un set de valori ale variabilelor exogene. importul şi exportul. relaţii tehnologice şi relaţii instituţionale. forţa de muncă şi fondurile de producţie ale unei unităţi. într-un model macroeconomic. relaţiile de comportament se referă la dependenţe privind consumul. Relaţiile de identitate sunt de tipul ecuaţiilor de balanţă folosite în „Sistemul de balanţe ale economiei naţionale" Relaţiile de comportament sunt acele ecuaţii stochastice care reflectă şi modelează un proces de luare a deciziei. Relaţiile instituţionale sunt folosite pentru a explica în mod determinist sau stochastic fenomenele care sunt determinate fie de lege. Aceste relaţii pot fi: relaţii de identitate sau deterministe. ale unei ramuri sau ale economiei naţionale. Un model econometric poate fi format dintr-o singură relaţie sau dintr-un sistem de relaţii statistice. De exemplu.

în diverse domenii. T = valoarea teoretică. se foloseşte frecvent un test denumit „testul erorii". Acceptarea sau respiungerea ipotezelor formulate în econometrie se poate face cu ajutorul mai multor teste. Pe baza celor două valori se definesc: . Vezi. Necesitatea utilizării acestora este determinată de faptul că demersul econometric constă într-o înşiruire logică de ipoteze privind semnificaţia variabilelor exogene. aplicarea acestui test presupune compararea a două valori: 0 = valoarea observată sau estimată. Pe lângă aceste teste statistice. În general. testul t. D. test.C. eroare de gradul 1 şi gradul 2. a gradului de performanţă a modelelor construite. Testele statistice3 sunt instrumente de lucru indispensabile investigaţiei econometrice.S. nivel de semnificaţie. 3 e a = 0 −T . denumite modele cu ecuaţii multiple.eroarea absolută.ipoteză statistică. ecuaţiile care explică stabilirea impozitelor sau a cotizaţiilor în funcţie de venit. Tipologia modelelor econometrice este extrem de vastă. cele mai uzuale fiind: testul χ2. Totuşi. tehnologice sau instituţionale.exemplu. Bucureşti. aşteptată sau prognozată.Dicţionar statistic economic. testul F etc. preg de semnificaţie.. în practica curentă. 1969 23 . un model econometric poate fi construit prin intermediul unei singure ecuaţii de comportament. sau cu ajutorul unui sistem de ecuaţii de genul celor patru relaţii. a calităţii estimaţiilor obţinute. menţionate mai sus.

H1: 0 ≠ T. T. (0) si (T). 24 este acceptată ipoteza H1 dacă Ea > ea sau Er > er . (0) si (T). de regulă. (0) şi (T). er = 0 −T T * 100 Se construiesc cele două ipoteze: H0: 0 ≈ T .. Acest test al erorii este utilizat în mod curent în domeniul analizei statistico-economice a variatiei în timp şi/sau în spaţiu a unui fenomen economic. 4 de echivalare a celor doua valori. regula de (alegere) decizie a 4 Un astfel de test şi criteriu de decizie se utilizează în comerţul cu produse îmbuteliate sau ambalate pentru care. diferă semnificativ si nu pot fi considerate ca echivalente. dar poate fi aplicat şi în domeniul econometriei. sunt echivalente. → cele două valori. → cele doua valori. dar cu discernamânt şi nu în mod excesiv. respectiv extrase din aceeaşi urnă sau dintr-o colectivitate omogenă. criteriul de decizie este de ± 5% din volumul sau greutatea . a ambalajului 24 . Stabilindu-se arbitrar o valoare absoluta (Ea) sau relativa (Er) celor doua ipoteze este urmatoarea: 24 este acceptată ipoteza H0 dacă Ea ≤ ea sau Er ≤ er .eroarea relativă. adică diferenţele dintre ele sunt întâmplatoare şi nu sistematice.

4. 5.1. Întrebări 1. 25 . Care este definiţia istorică a econometriei formulată de catre R. Definiţi modelul economic.3. Care este definiţia extinsă a econometriei promovată de economiştii din ţările anglo-saxone? 3. Frisch? 2. Definiţi variabilele economice. Definiţi variabilele aleatoare.

9. 26 . După primirea ultimelor două loturi de piese se ştie că: -furnizorul A a trimis 400 de piese din care 60 au fost rebuturi. Ce presupune testul erorii? 1. 8. Probleme rezolvate A.6.4. Caz privind asocierea a două variabile alternative (binare) O societate comercială se aprovizionează de la 2 furnizori A şi B. Care sunt cele două motive pentru care se recurge la variabila timp? 7. Ce presupune omogenitatea datelor? Care sunt relaţiile statistice ce formează un model econometric? Definiţi-le. Cu ce valori poate fi introdus un fenomen economic într-un model econometric? 10.

- furnizorul B a trimis 600 de piese din care 70 au fost rebuturi. i x 1 = furnizorul A. m variabila dependentă. x2 = furnizorul B. j = 1. 2 27 . k variabila independentă. Conducerea societăţii ar dori să renunţe la furnizorul A pe motivul unei calităţi inferioare a produselor sale în raport cu cele ale furnizorului B. Denumirea furnizorul A ui (x ) B Total ( N ) j Calitatea pieselor Rebuturi bune (y ) 60 70 130 340 530 (n ) 870 i j Total (N ) 400 600 1000 (N) i unde: X = { x }. Y = {y } . Este corectă această decizie? Rezolvare: Fundamentarea statistică a deciziilor corecte se poate realiza prin sistematizarea datelor într-un tabel de forma: Tabelul 1. j y 1 = piese rebut. y = piese bune. i = 1.

n = frecvenţele condiţionate ale variabilei Y. = frecvenţele marginale ale variabilei X. se poate constata: i j a) i j independenţă totală între cele două variabile dacă n = N i. de exemplu: i j n 11 = piesele rebut trimise de furnizorul A.j j i j În cazul unei distribuţii bidimensionale. i i j . . = frecvenţele marginale ale variabilei Y. rezultând două distribuţii marginale:  x = 1 x2 = 0   X : 1  400 600     y =1 Y : 1  130  y2 = 0   870   şi două distribuţii condiţionate ale variabilei Y (calitatea pieselor) în funcţie de furnizori:  y =1 yA :  1  60  y2 = 0   340    y =1 yB :  1  70  y2 = 0   530   N N i. i. j m =ct . n 22 = piesele bune trimise de furnizorul B. k = ct sau n = i j N. 28 . În urma acestei sistematizări a rezultat o serie statistică bidimensională. în funcţie de modul de distribuire al frecvenţelor n . cu două variabile binare X şi Y.j N = ∑ N = ∑ N = ∑ ∑ n = numărul total al observaţiilor.

în cadrul acestei probleme. puternică etc).1. decizia corectă poate fi luată pe baza x1 − x 2 t = c 2 σx 1 n1 −1 + 2 σx 2 ≥ t α. x1 =x 2 29 . Analizând datele din tabelul i j 1. se observă că distribuţia frecvenţelor condiţionate n a cel puţin trei procedee statistice. invers. fie la acceptarea cazului c) (dependenţă slabă.1. analiza statică va conduce fie la acceptarea cazului a) (independenţă). Deci. a) Testul diferenţei două medii Se ştie că dacă: se încadrează în cazul c). n 2 −1 cele două medii dacă: x1 şi x2 sunt semnificativ diferite de zero şi. pentru se celelalte rubrici ale tabelului aceste frecvenţe fiind egale cu zero. c) o dependenţă statistică dacă frecvenţele condiţionate n i j distribuie într-un mod diferit de cele două cazuri a) şi b). în această situaţie. x 1 cu y 2 şi x2 cu y 1 ).b)o dependenţă strictă între cele două variabile dacă frecvenţele condiţionate n i j se distribuie numai pe diagonala principală a tabelului 2 (corelare pozitivă. medie. x 1 cu y 1 şi x2 cu y ) sau numai pe diagonala secundară a tabelului (corelare negativă.

f B ) = 0.15 sau 15% 1.05 (5%) sau. 0 5 valorii empirice a variabilei tc cu valoarea sa teoretică t 0.f A ) = 0.calculul dispersiilor: 2 σA 2 σB = f A (1 .calculul procentului mediu al rebuturilor pe fiecare furnizor: n 60 f A = N11 = 400 = 0. În cazul de faţă.alegerea din tabelul distribuţiei respective.05.x1 − x 2 t = c 2 σx 1 n1 −1 + 2 σx 2 < tα n 2 −1 unde: ta = argumentul distribuţiei normale.96 .15 ∗ 0. .1031 pragului de semnificaţie α şi preluarea valorii acestuia = 0. de regulă. sau argumentul distribuţiei Student. 0 5 : 30 .1167 ∗ 0.1167 sau 2. α = pragul de semnificaţie (riscul) cu ajutorul căruia se alege decizia corectă.01 (1%). în economie se lucrează cu un prag de semnificaţie de 0. dacă n ≥3 0 . de 0. dacă n < 30.8833 = 0. cel mult.67% .1275 = f B (1 . aplicarea acestui test constă în efectuarea următoarelor calcule: .85 = 0. f B = N21 = 600 = 0. n 70 11.compararea 0. pentru α distribuţiei normale se preia valoarea t .din tabela = 1.

1) =1. m ).i = 1. unde: a α = pragul de semnificaţie. ca atare.0.interpretarea testului: Deoarece t = 1.j = 1.1 =3. cu o probabilitate de 0. b) Testul χ2 χ2 constă Aplicarea testului în compararea unei χc2 valori empirice cu o valoare teoretică χ2.1031 + 399 599 N1 −1 + 2 σB =1 . k ).iar 0 gradelor de libertate ν .5 < t c 0. v= (k-1)(m ..63 .v .1) (2 . În acest caz. iar k este numărul de j grupe în funcţie de variabila X (x .96 rezultă că între calitatea pieselor livrate de cei doi furnizori.1 = 0 pentru α = 0. m fiind numărul de grupe în funcţie de variabila Y (y . nu se poate accepta o diferenţă semnificativă şi. χc2 Valoarea empirică a variabilei aleatoare χc2 se calculează cu relaţia: = ∑ ∑ i j (n ij ∗ − nij ∗ nij ) 2 31 .01 rezultă 6. pentru α = 0.1275 0. preluat din tabela i distribuţiei χ2 în funcţie de un prag de semnificaţie α şi de numărul χ2. nu este corectă decizia de a se renunţa la furnizorul A pe motivul unei mai slabe calităţi a pieselor.95 (95%). din tabel rezultă χ2. 01 .1) = numărul gradelor de libertate. 05 . 5 N 2 −1 .1167 fA − fB 2 σA t = c 0.05 şi ν = (2 .84.15 − 0. 0 5 = 1.

j =1. i = 1.35779 ≈ 2.calculul acestor frecvenţe teoretice rezultă din următoarele relaţii: ∗ n 11 = N 1. a rezultă că cele două variabile X şi Y sunt independente.1 N N 1. n* = frecvenţele teoretice în cazul independenţei totale a celor două variabile x şi y . N . N 1 600 ∗130 = = 78 N 1000 N 2.unde: nij = frecvenţele reale.v . N . N . j N .2 600 ∗ 870 = = 522 N 1000 -calculul valorii empirice: χc2 ∑∑ = i =1 j =1 2 2 (n ij ∗ − nij ∗ nij ) 2 χ 2 c ( 60 − 52 ) 2 + ( 340 − 348) 2 + ( 70 − 78) 2 + ( 530 − 522 ) 2 = 52 348 78 522 = 2.2.36 Utilizarea testului - χ2 se bazează pe următoarele reguli de decizie: dacă χc2 < χ2. N . 32 . i j n = ∗ ij N i.2 N = = 400 ∗130 = 52 1000 400 ∗ 870 = 348 1000 ∗ n 12 = n ∗1 = 2 n ∗2 = 2 N 2.2.

analiza statistică a legăturii dintre acestea se poate face şi cu ajutorul coeficientului de asociere al lui Yulle. θ= θ 33 . nici decizia de a rezilia contractul cu furnizorul A nu este justificată.36 < 2 χ0.1] . adică 2 variabile care au 2 variante. c) În cazul unei grupări combinate de 2x2. ca atare. = 1 ⇒ corelaţie strict pozitivă între variabile. 05 .v . 0 ⇒ independenţă între variabile.84.1 =3.- dacă χc2 ≥ χ2. deci calitatea pieselor nu depinde de tipul furnizorilor şi. având = -1 ⇒ corelaţie strict negativă între variabile. Deoarece χc2 = 2. definit prin relaţia: n11 n22 − n12 n21 n11 n22 +n12 n21 θc = cu abaterea medie pătratică: σ0 = 1 −θ 2 2 1 1 1 1 + + + n11 n12 n21 n22 Acest coeficient este definit în intervalul semnificaţia: θ θ ∈[−1. rezultă că cele două variabile sunt independente. a rezultă că cele două variabile X şi Y nu sunt independente.

rezulta ca intre θ c acceptă ≥ tα σθ cele θc σθ < rezultă că valoarea lui θ c nu este semnificativ diferită de zero. ceea θc σθ ce presupune că cele două variabile sunt independente.0 5 =1.Pentru cazul analizat. rezultă că cele două variabile sunt independente.0926 340 60 530 70 Ştiind că variabila θ este o variabilă aleatoare ce urmează o distribuţie normală N(0.0926 =1. Caz privind asocierea a două variabile calitative nealternative 34 .96 iar valoarea = 0. iar dacă tα θ c se că este semnificativ diferită de zero daca.1439 0. B.0207 2 1 1 1 1 + + + = 0. valoarea empirică doua variabilesemnificativ diferită de zero dacă rezultă că între cele doua variabile există o legătură. Ştiind că t 0.55< t 0.1437 60 ∗ 530 + 340 ∗ 70 31800 + 23800 σθ = 1 − 0. situaţie care conduce la aceeaşi concluzie ca şi în cazul punctelor a) şi b): rezilierea contractului cu furnizorul A nu poate fi justificată de aprecierea unei calităţi mai slabe a produselor acestuia. σθ ).96 . valorile acestor indicatori sunt: θc = 60 ∗ 530 − 340 ∗ 70 31800 − 23800 = = 0. 0 5 = 1.

În urma efectuării unui sondaj statistic s-au obţinut următoarele date privind distribuţia pe ramuri ale economiei naţionale a şomerilor.ramurile economiei naţionale) şi Y ( y j . i =1. m= 3>2). Rezolvare: Datele problemei se referă la dependenţa dintre două variabile nominale X ( xi .cazul unui tabel de k × m rubrici. k . 35 . grupaţi pe trepte de calificare: Tabelul 1 Trepte de calificare a Total necalific calificare calificare persoan i ale şomerilor aţi medie şi superioa econo e 400 257 143 Industrie 800 500 200 100 64 36 Construcţ 100 200 ii 100 50 50 Alte ramu ri Total persoan 200 100 700 129 200 450 71 100 400 1400 (N) Ramur (n ) ij 250 Analizaţi datele din tabel şi precizaţi dacă se poate admite o asociere între profilul ramurilor economice şi calificarea şomerilor. m - trepte de calificare ale şomerilor) ale căror variante sunt în număr mai mare de două (k=3>2. j =1.

preluarea χ2 .Deoarece frecvenţele condiţionate nij nu sunt nici constante pe liniile tabelului şi nici distribuite numai pe rubricile diagonalei principale sau secundare. 01 . j N Pe baza datelor din tabel.94 . În acest caz. 05 .01. j= 1. ∗ nij = frecvenţele teoretice în cazul independenţei totale a celor două variabile X şi Y. 4 ν = ( k −1)( m −1). ∗ nij = N i.05 şi ν = (3-1)(3-1)=4 din 2 0 . distribuţia acestora arată că poate fi acceptată ipoteza unei dependenţe statistice între cele două variabile. 4 =13 . tabelă rezultând χ - = 9. Utilizarea acestui test valorii teoretice a variabilei χ2 din tabel în funcţie de un prag de semnificaţie α şi de numărul gradelor de libertate respectiv pentru α = 0. iar pentru α = 0. acceptarea sau respingerea ipotezei de dependenţă statistică dintre cele două variabile se poate face cu ajutorul testului presupune următoarele operaţii: . i = i j 1.3 .3.3. aceste frecvenţe teoretice sunt egale cu: 36 . N. 2 χ0. calculul valorii empirice a variabilei aleatoare χc2 cu ajutorul relaţiei: χ 2 c =∑ ∑ i j (n ij ∗ − nij ∗ nij ) 2 unde: n = frecvenţele reale.

N .3 800 ⋅ 250 = = 143 N 1400 N 2. trecerea în şomaj a salariaţilor nu s-a făcut întâmplător. N . 05 . N . N . deci.3 200 ⋅ 250 = 36 N 1400 N 3.1 200 ⋅ 700 = = 100 N 1400 ∗ n22 = ∗ n 23 = N 2.2 400 ⋅ 450 = = 129 N 1400 ∗ n31 = ∗ n 32 = ∗ n33 = χ c2 = ( 500 − 400 ) 2 + ( 200 − 257 ) 2 + (100 − 143) 2 + (100 − 100 ) 2 + 400 257 143 100 + ( 50 − 64) 2 + ( 50 − 36 ) 2 + ( 200 − 200 ) 2 + ( 200 − 129 ) 2 + (100 − 71) 2 64 36 200 129 71 = 160 -compararea valorii empirice Deoarece χc2 χc2 cu valoarea sa teoretică: = 9. urmând cei cu pregătire medie şi. N . pe ultimul loc. şomerii cu pregătire superioară 37 . N . 4 rezultă că ipoteza de independenţă dintre variabile nu poate fi acceptată şi.94 = 160 > χ 2 0 .3 400 ⋅ 250 = = 71 N 1400 ∗ n12 = N 1. N .1 400 ⋅ 700 = = 200 N 1400 N 3. Cu alte cuvinte.2 800 ⋅ 450 = = 257 N 1400 ∗ n13 = ∗ n 21 = N 2. predominând şomerii necalificaţi. distribuţia şomerilor pe trepte de calificare este influenţată de structura pe ramuri ale economiei naţionale.1 800 ⋅ 700 = = 400 N 1400 N 1. N .2 200 ⋅ 450 = = 64 N 1400 N 3. N .∗ n11 = N 1.

în timp ce variabila efect Y . j =1. Tipuri de pneuri A B Total Rezistenţa la uzură (1000 km parcurşi) ( y . este o variabilă numerică. este o caracteristică nominală. Caz privind asocierea dintre o variabilă calitativă independentă şi o variabilă numerică dependentă O întreprindere de automobile poate să-şi echipeze vehiculele cu două tipuri de pneuri A şi B. m ) sub 25-30 30-35 35.3.C.40. Variabila cauzală X tipurile de pneuri. ştiind că preţul de vânzare a celor două tipuri de pneuri este acelaşi. ) 100 100 200 (N) Recomandaţi întreprinderii ce tip de pneu va trebui să folosească. Rezolvare: Această problemă abordează cazul dependenţei dintre două variabile de natură diferită. Rezolvarea acestei probleme presupune parcurgerea a două etape: - prima etapă se referă la acceptarea sau respingerea ipotezei 38 .peste 2 8 20 40 20 45 10 25 40 45 2 (n 17 13 40 20 8 19 21 60 60 28 12 j Total ) ij ( N i.rezistenţa la uzură. În urma încercării a două loturi de 100 de pneuri din fiecare tip au rezultat următoarele date: Tabelul.

j = 1. rezistenţa la uzură nu depinde de tipul pneului. Deoarece primele două procedee au fost deja expuse (vezi problemele A şi B) şi.testul medii şi metoda analizei variaţiei. k . acestea necesită calcule suplimentare. se deduce uşor că în cazul independenţei dintre cele două variabile. j = 1. întreprinderea putând utiliza oricare dintre testul diferenţei dintre două marginală a variabilei - distribuţiile condiţionate ale variabilei Y în funcţie de variantele variabilei factoriale yj  X : Yxi :  . .de dependenţă dintre cele două variabile. pentru etapa a doua recomandăm abordarea unor probleme de acest tip cu ajutorul metodei analizei variaţiei. ele. m. n   ij  Pe baza acestor distribuţii se calculează trei mărimi: 39 .j   χ2 . - a doua etapă urmează numai în cazul acceptării ipotezei de dependenţă între variabile şi necesită alegerea tipului de pneu cu cea mai mare rezistenţă la uzură. în plus. i = 1. m. O astfel de problemă poate fi rezolvată cu ajutorul mai multor procedee statistice . Metoda analizei variaţiei se fundamentează pe discuţia următoarelor distribuţii: -distribuţia  yj   Y :  N .

2 2 i ) ( ) . exceptând influenţa factorului X. j = ∑y N i i i.varianţa dintre grupe relaţia: Vx2 = ∑ i este măsura variaţiei variabilei Y generată de variaţia caracteristicii factoriale X.iar X. j 2 2 j ) ( ) unde: y0 = ∑ ∑y i j i j j nij = ij ∑y j j N.- varianţa totală V02 (sau pe baza distribuţiei marginale a V02 = ∑ i =1 k V02 σ = N 2 0 dispersia totală ) calculată lui Y cu ajutorul relaţiei: ∑ (y m j =1 j − y 0 nij = ∑ y j − y 0 N . Această mărime. yi = sunt mediile condoţionate ale variabilei Y in funcţie de variantele variabilei factoriale ∑y j j j nij = ij ∑y j j nij ∑n V02 . măsoară variaţia totală a variabilei Y generată V x2 de influenţa întregului complex de factori ce o determină. Relaţia de calcul a acestei mărimi este: Vu2 = ∑ i ∑( y j i − y i nij ) 2 40 . Această mărime se calculează cu ∑( y j i − y0 nij = ∑ yi − y0 N i . N i. ∑ ∑n N N y i = y xi reprezintă media distribuţiei marginale. .varianţa reziduală Vu2 este o mărime care exprimă variaţia caracteristicii Y generată de factorii consideraţi aleatori.

1].Se poate demonstra că între cele trei mărimi există relaţia: V02 = V x2 + Vu2 Raportând relaţia de mai sus la factorului esenţial V02 se obţine contribuţia relativă a  V x2  X  2 % V   0  şi a factorilor întâmplători  Vu2  u 2 %  V   0  la explicarea variaţiei totale. Se deduce uşor că acest indicator este definit în intervalul [0. Interpretarea valorilor raportului de corelaţie empirică se face pe baza următoarelor reguli: 0 ⇒ variabile ↑ corelatie ⇒  Dac ă R = 0.5 ↓ corelatie ⇒   1  ⇒ variabile independen te slab ă puternic ă strict dependente 41 . V x2 Vu2 100= V 2 ⋅ 100 + V 2 ⋅ 100 0 0 Indicatorul R= V x2 V2 = 1 − u2 V02 V0 poartă numele de raport de corelaţie empirică şi exprimă intensitatea legăturii dintre cele două variabile.

înainte de a explica variaţia lui Y şi a interpreta valoarea raportului de corelaţie empirică va trebui să se verifice semnificaţia rezultatelor. 42 . Rezultatele se consideră semnificative (R este semnificativ diferit de zero) dacă există inegalitatea: unde: V2 x k −1 Fc = Vu2 N −k Fc ≥ Fα. ν 1 = k − 1.Dacă datele provin dintr-o cercetare selectivă.v2 .testul FisherSnedecor. reprezintă valoarea empirică a variabilei Fisher-Snedecor.v1 . k=5. a= mărimea centrului de interval cu frecvenţa maximă.v1 .v2 .calculul rezistenţei medii la uzură ( y ) şi a dispersiei (σ A ) pentru A pneurile de tip A.ν 2 = N − k este valoarea teoretică preluată din tabela în funcţie de un prag de distribuţiei Fisher-Snedecor semnificaţie α şi de numărul gradelor de libertate ν şi ν2 . Fα.5. 1 Pe baza datelor din tabelul 4 se vor calcula indicatorii necesari aplicării metodei analizei variaţiei: 2 . Fie: k = mărimea intervalului de grupare. a=37. Testarea semnificaţiei rezultatelor se face cu ajutorul testului “F” .

5 2 27. 4 20-25 25-30 30-35 35-40 40-45 45-50 Total 22.5 8 32.5 10 100 -3 -2 -1 0 1 2 - = 5.5 -6 -16 -20 0 20 20 -2 18 32 20 0 20 40 130 43 .5 20 47.5 20 37.5 40 42. a = 37.k Tabelul.

yA = ∑   yj −a n1 j   k  ∑ n1 j k +a = −2 ⋅ 5 + 37.06 = 37 .5 Tabelul 5 Rezistenţa la uzură (1000 km parcurşi) 20-25 25-30 30-35 35-40 40-45 45-50 Total yj n2 j yj −a k  yj −a   k n 2 j     yj −a   k  n2 j    2 22.69 100 .5 37.5 − 0.25 100 2 σB = 151 2 ⋅ 25 − ( 32 .5) 100 2 σ A = 32.5 27.01 = 32.5 = 32 .4 − 37.4 100  yj −a ∑  k  n1 j    2 σA =  ⋅k2 − yA −a n1 j ∑ 2 ( ) 2 = 130 2 ⋅ 25 − ( 37. k = 5.25 − 32 .75 − 0.calculul rezistenţei medii la uzură ( y ) şi al dispersiei (σ B ) ) pentru B pneurile de tip B.5 42.5 47.5 32.5 = 37.49 2 .5 - 17 13 40 20 8 2 100 -2 -1 0 1 2 3 - -34 -13 0 20 16 6 -5 68 13 0 20 32 18 151 yB = −5 ⋅ 5 + 32 .5) = 37 . a= 32.

j   y − y 0 N.8 . j 2 2   σ0 = ∑ j = k 2 − y0 − a N ∑ N.719 = 8343 . j     y j −a    k  N. j N.5) 2 = 47 .calculul varianţelor: • V02 = ∑ i Varianţa totală ∑( y j j − y 0 nij = ∑ y j − y 0 2 j ) ( ) 2 2 N .719 σ0 ∑  ( ) ( ) 200 . Tabelul 6 Rezistenţa la uzură (1000 km parcurşi) 20-25 25-30 30-35 35-40 40-45 45-50 Total 22.406 = 41.- calculul rezistenţei medii la uzură (y0 ) şi al dispersiei (σ 02 ) pe ansamblul celor două tipuri de pneuri (distribuţia marginală a variabilei Y).125 − 5. j ∑ ∑  y − a 2 200 2 ∑  j k  N. j yj −a k  y j −a    k N .5 = 34.825  y0 = N. j k + a = 93 ⋅ 5 + 32. j    2  yj −a  N ∑ y j N .5 19 21 60 60 28 12 200 -2 -1 0 1 2 3 -38 -21 0 60 56 36 93 76 21 0 60 112 108 377 yj N.5 37.5 47. j = Nσ 0 V02 = 200 ⋅ 41. j 2 = 377 ⋅ 25 − ( 34. j =  k  .825 − 32.5 32.5 42.5 27.

7 =∑ i ∑( y j j − yi ) 6 2 nij = 7018 Nk=198 V N −k = 35.825 ) ⋅100 = 1326 .1. .49 ⋅ 100 + 37.8 9 F0.01. k-1=1 Fc = 2 su V x2 s = k −1 = 37 .44 2 su = 2 u - - .13 2 2 • Varianţa reziduală: Vu2 = ∑ i ∑(y j j − y i nij = ∑ σ i2 N i = 32.13 Fα.69 ⋅ 100 = 7018 2 1=1 ) 2 .1.4 − 34 .• Varianţa dintre grupe: V 2= ∑ y i − y 0 x i ( ) 2 N i.42 = 1326 . = ( 37 .interpretarea rezultatelor se realizează utilizând tabelul analizei variaţiei: Tabelul 7 Sursa de Varian ţa dintre grupe Varian ţa rezidu ală V 2 u Măsura V x2 = ∑ y i − y 0 = 1326 .v2 F0.825 ) ⋅100 + ( 32 .v1.198=3.05.198=6.25 − 34 . Dispersi 2 y/x Valoarea testului Fs 2 c y/x variaţiei ( ) 2 grade a N i.13 Nr.

cu un prag de semnificaţie de 1% FC = 37 . 0.399. prin urmare.8 V0 Întrucât marca pneurilor explică în mică măsură variaţia totală a uzurii pneurilor.8 V0 R= V x2 1326.13 ⋅ 100 = ⋅ 100 = 15.42 > F0 .89%.1.marca pneurilor.8 N- - - - totală 1=199 Deoarece testul Fisher-Snedecor arată că rezultatele obţinute nu sunt întâmplătoare. întreprinderea de automobile îşi poate echipa vehiculele cu orice tip de pneu. eventual alegerea putându-se realiza după alţi factori: facilităţi de aprovizionare.Varian ţa V02 = ∑∑ y j − y 0 i j ( ) 2 nij = 8343 . se vor calcula contribuţia relativă a factorului X .89% 2 8343.198 = 6. D Caz privind corelaţia dintre două variabile numerice . Din acest punct de vedere. ci sistematice. la explicarea variaţiei variabilei Y  V x2   2 % V   0  şi raportul de corelaţie empirica (R): V x2 1326. rezultă faptul că tipul de pneuri nu reprezintă un factor important al uzurii şi. ierarhizarea pneurilor nu se poate face în funcţie de acest factor. renumele mărcii etc.399 2 8343.76 .13 = = 0. respectiv numai 15. iar raportul de corelaţie are o valoare de asemenea mică. 01 .

Y . respectiv din ansamblul factorilor de influenţă ai .capitalul social al societăţilor comerciale . Un astfel de tabel se foloseşte în scopul acceptării sau respingerii ipotezei de lucru. j ) 10 16 25 2 7 9 te 5 5 10 25 40 20 15 110 (N) Pe baza acestor rezultate se poate considera că mărimea profitului brut depinde în mod hotărâtor de capitalul social al societăţilor de acest profil? Rezolvare: Tabelul 8 poartă numele de tabel de corelaţie deoarece în cadrul acestuia.peste 200 .200 .În urma unui studiu statistic efectuat asupra unui eşantion de 110 societăţi comerciale cu acelaşi profil a rezultat următoarea distribuţie a acestora în funcţie de capitalul social şi de profitul brut realizat: Tabelul 8 Grupe de Grupe de societăţi după profitul 70.variabilă factorială.100 2 10 9 100 .lei) sub 30.50mărimea 30 50 70 sub 50 7 2 1 50 .10 6 4 5 9 4 (n ) 3 19 15 11 ij Total societăţi după brut (mii.4 .110 130 pes 90 11 .profitul brut al societăţilor comerciale .150 1 4 15 150 .Total ( N .90.variabilă rezultativă. a fost sistematizată distribuţia celor 110 societăţi în funcţie de două variabile numerice: X .

Tabelul 9 . Deoarece frecvenţele nij se distribuie cu cele mai mari valori de-a lungul diagonalei principale. dar înregistrând valori şi la stânga şi la dreapta faţă de această diagonală. b) şi metoda regresiei. i =1. i = 1. În acest caz. caracterizarea statistică a dependenţei dintre capitalul social şi profitul brut al societăţilor se va face numai cu ajutorul metodei analizei variaţiei.5 : ) profitul mediu brut ( y ) şi dispersia (σ 12 ) societăţilor 1 comerciale al căror capital este mai mic de 50 mii lei (a=20. factorul X este factorul hotărâtor.numărul grupelor de societăţi după mărimea capitalului) şi al dispersiilor parţiale • (σ 2 i . rezultă că între cele două variabile se manifestă o legătură statistică în sens direct.variabilei Y. Fiind o serie bidimensională analiza acesteia se efectuează după aceleaşi principii prezentate în aplicaţia A. care vor fi făcute în capitolul următor. discuţia legăturii statistice se poate face cu ajutorul mai multor procedee cum ar fi: a) metoda analizei variaţiei . K=20).5. Întrucât metoda regresiei necesită precizări suplimentare.calculul mediilor parţiale ( y i . Utilizarea sa în acest scop va decurge în mod analog cu aplicarea sa din problema precedentă: . 5 . determinant al variabilei Y.

lei) 10-30 30-50 50-70 Total n1 j yj yj −a k  yj −a    k n1 j     yj −a   k  n1 j    2 7 2 1 10 ∑  20 40 60 - 0 1 2 - 0 2 2 4 0 2 4 6  y j −a  n1 j  k  j  4 y1 = k +a = ⋅ 20 + 20 = 28 mii . lei/s.lei / s. lei/s. lei/s. profiturile medii brute şi dispersiile corespunzătoare s-au calculat pe baza distribuţiilor condiţionate respective. rezultând următoarele valori: y ( 50 −199 ) = y 2 = 52 mii..c.c.c.Profitul brut (mii. mii. mii... 2 σ 2 = 288 y (100 −150 ) = y 3 = 74 σ 32 = 584 2 σ 4 = 331 y (150 −200 ) = y 4 =103 .c 20 ∑n1 j j  y −a ∑  j k  n1 j   2 6 2  σ 12 =  k 2 − y1 − a = ⋅ 400 − ( 28 − 20 ) = 240 − 64 = 176 10 ∑ n1 j 2 ( ) j • pentru celelalte grupe de societăţi comerciale în funcţie de capital.

8 = 159588 • 2 Vx varianţa dintre grupe: yi − y0 = ∑ i ( ) 2 N i.y ( 200 −250 ) = y 5 =142 .2 ⋅15 = 42033 .2 • profitul mediu brut pe ansamblul celor 110 societăţi comerciale şi dispersia aferentă au fost calculate pe baza distribuţiei marginale a variabilei rezultative. -calculul varianţelor: • varianţa totală: V02 = ∑∑ y j − y 0 nij = ∑ y j − y 0 2 i j j ( ) ( ) 2 2 N . = (8 2 + (2 1 4 − . j = Nσ0 110 ∗1450 ..4 7 9 5 2 ) ⋅ 2 5 + (4 7 − .67 mii. 2 σ 5 = 206 . = 176 ⋅10 + 288 ⋅ 25 + 584 ⋅ 40 + 331 ⋅ 20 + i + 206 .2 7 • varianţa reziduală: Vu2 = ∑∑ y j − y i i j ( ) 2 nij = ∑σi2 N i .c.6 7 − .4 7 9 5 ⋅ 1 5 =0 15 14 7 .4 7 9 5 2 ) ⋅ 2 0 . lei/s. 2 σ0 = 14508. obţinându-se următoarele valori: y0 = 79.4 7 9 5 2 ) ∗ 4 0 + + (3 1 0 − .. lei/s.4 7 9 5 2 ) ⋅ 1 0 2 ) + (2 5 − .45 mii.c.

84 ) .108 = 6. la explicarea variaţiei variabilei Y  V x2   2 %  şi V   0  raportul de corelaţie empirică (R): V x2 117540. factorului X .198 =3.8 4 ( ) 2 N i.198 = 6.01 > F0. 01.9 2 F0.19 2 su = = 42033 V02 = ∑∑ yi − y 0 i j ( ) 2 Nk=108 N- - - =159588 1=10 Deoarece testul Fisher-Snedecor indică faptul că rezultatele cu un se prag vor de semnificaţie contribuţia de relativă 1% a calcula semnificative (F c = 302 . 01 .65% 2 159588 V0 .interpretarea rezultatelor se realizează utilizând tabelul analizei variaţiei: Tabelul 10 Sursa de variaţ Varian ţa dintre grupe Varian ţa Varian rezidu ţa totală sunt Vu2 = ∑∑ y j − y i i j Măsura variaţiei V x2 = ∑ y i − y 0 i Nr.capitalul social..27 k −1 = 117540 .27 ∗ 100 = ⋅ 100 = 73.1.v1 .01 Fc = 2 sY / X 2 su k- ( ) 1=1 2 nij nij Vu2 N −k = 389 . de corectat2 Vx = 117540 .27 = 302 .1. 05 .1.v2 F0 . grade Dispersi a 2 sY / X = Valoarea testului F Fc Fα.

V x2 117540.27 R = = 0.858 2 159588 V0 Deoarece mărimea capitalului social al societăţilor comerciale explică 73.65% din variaţia profitului brut al acestora.858 (apropiată de limita maximă 1) rezultă că acest factor determină în mare măsură profitul brut al societăţilor de acest profil. iar raportul de corelaţie are o valoare de 0. .

Să se menţioneze la care presă trebuie să se renunţe cunoscând următoarele rezultate obţinute în urma unei selecţii: - dintr-un lot de 1000 de piese executate la presa A. B. Probleme propuse A.5% au fost dintr-un lot de 800 de piese executate la presa B. 2. Datorită diminuării cererii acestui produs întreprinderea trebuie să renunţe la una din prese. pe fiecare din ele prelucrându-se câte un lot de piese de acelaşi tip. În ultimii 5 ani s-au efectuat o serie de înregistrări referitoare la . Într-o secţie de prelucrare a unei întreprinderi există două prese (A şi B).5. O fabrică de frigidere primeşte motoare de la trei furnizori diferiţi.1. 4.5% au fost rebuturi. - rebuturi.

se poate accepta ipoteza că rentabilitatea societăţilor comerciale este invers proporţională cu mărimea lor? . majore şi "înlocuit". În urma prelucrării datelor unui sondaj statistic s-au obţinut următoarele rezultate: Dimensiu mici mijlocii mari Rata profitului (%) sub 5 5-10 10.15. În tabelul următor sunt prezentate datele culese aleator referitoare la tipurile de defecţiuni constatate la motoarele returnate.peste 4 2 13 16 8 17 15 30 15 40 20 20 12 15 20 15 8 Numărul 85 65 45 Pe baza acestor date.gravitatea problemelor constatate la motoarele returnate de clienţi pentru service în timpul perioadei de garanţie. C. Aceste defecţiuni au fost clasificate în trei categorii: minore. grupate pe furnizori: Furnizo ri A B C Tipul defecţiunii: minoră majoră înlocuit 15 25 18 8 16 10 18 26 20 Total motoare 58 34 64 Apreciaţi dacă se poate admite că există o diferenţă calitativă semnificativă între motoarele livrate de cei trei furnizori.

O societate comercială care desface zilnic un produs (lapte) trebuie să încheie un contract cu furnizorul privind aprovizionarea zilnică. prezintă astfel: O statistică a desfacerilor din anul trecut se Cerere (litri 90 100 130 150 160 200 Total Num ăr de 80 120 60 50 30 20 360 . La fiecare litru vândut în ziua respectivă firma câştigă 2000 lei şi pierde 500 lei dacă nu-l desface în ziua respectivă.D Rezultatele obţinute în urma unui sondaj efectuat în vederea stabilirii dacă între vârsta unui şofer şi numărul abaterilor de circulaţie efectuate de către acesta există vreo legătură sunt ilustrate în tabelul următor: Vârst a 18-25 26-50 51-75 0 6 12 4 Numărul de abateri 1-2 3-4 5 şi 24 20 10 18 6 4 16 8 3 Poate fi considerată ca semnificativă vârsta persoanelor în explicarea numărului de abateri de circulaţie efectuate? E.

Econometrie . Paris . Paris . 2. Dormont B . T. 2004. 1999 . Ed. Andrei. BIBLIOGRAFIE 1. 1998 3. Introduction a l’econometrie . Bucureşti. Dunod . Economică.Acceptând că distribuţia cererii pe zilele anului este relativ stabilă. Ed.Statistică şi econometrie Editura Bourbonnais R . Montchrestien . . recomandaţi cantitatea cu care trebuie să se aprovizioneze zilnic firma pentru a obţine profit maxim.

caz. 5. Florea I. Ed.2000.(coordonator). Muntele Sion. ASE. Capitolul 2 Testarea ipotezelor statistice 2.2.I. A. Studii de econometrice. 2005.. O. Tănăsoiu. Bucureşti.PREZENTARE SINTETICĂ: .4.1.OBIECTIVE: introducerea studenţilor în sfera şi noţiunile specifice testării ipotezelor statistice 2. Ed. Econometrie. Culegere de modele Iacob.

Spunem că ele sunt exhaustive. Această altă ipoteză este numită ipoteză alternativă. Ea constă întotdeauna în admiterea caracterului întâmplător al deosebirilor. Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea de repartiţie (H0).1. Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de semnificaţie. uzual. adică în presupunerea că nu există deosebiri esenţiale. Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată. Respingerea ipotezei nule care este testată implică acceptarea unei alte ipoteze. mutual exclusive şi exhaustive. adică ori ipoteza nulă. asupra valorii parametrului populaţiei sau legii de repartiţie. deoarece acoperă toate posibilităţile. Ipoteza statistică – numită şi . H0. notată H1. dar procesul rămâne acelaşi şi anume: 1).2. ori ipoteza alternativă trebuie să fie adevărată. tehnicile statistice aplicate se vor schimba. Ipotezele se vor schimba. Concepte şi erori în testarea ipotezelor statistice În statistică.2. ipotezele apar întotdeauna în perechi: ipoteza nulă şi ipoteza alternativă. Cele două ipoteze reprezintă teorii. Spunem că ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să fie adevărate. O secvenţă generală de paşi se aplică la toate situaţiile de testare a ipotezelor statistice.

Se calculează indicatorii statistici în eşantion. cu α mic θ ∈{θ1 .. H1. evidenţe.. ce reprezintă o teorie care contrazice ipoteza nulă.ipoteză nulă – reprezintă status quo-ul. θk } . iar dacă ipoteza alternativă constă în afirmaţia că parametrul θ ia una din mai multe valori. 2).θ2 .. Ea va fi acceptată doar când există suficiente dovezi. Se stabileşte regiunea critică. pentru a se stabili că este adevărată. deosebim ipoteze alternative simple sau compuse. iar ipoteza alternativă constă în afirmaţia că parametrul este egal cu θ1. 4). avem o ipoteză alternativă simplă. dacă ipoteza nulă constă în afirmaţia că parametrul θ al unei distribuţii este egal cu o anumită valoare θ0. Întotdeauna ipoteza nulă este însoţită de ipoteza alternativă (de cercetat). După natura posibilităţilor de construire a ipotezelor nule şi alternative. când ipoteza nulă este adevărată să fie α.. Regiunea critică reprezintă valorile numerice ale testului statistic pentru care ipoteza nulă va fi respinsă. alternativă compusă. ceea ce este acceptat până se dovedeşte a fi fals. Astfel. 3). atunci avem o ipoteză . utilizaţi pentru a accepta sau a respinge ipoteza nulă şi se stabileşte testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei nule. Rc. Regiunea critică este astfel aleasă încât probabilitatea ca ea să conţină testul statistic.

sunt două posibilităţi: ipoteza nulă este adevărată şi ipoteza nulă este totuşi falsă. Când ipoteza nulă nu poate fi respinsă (nu există suficiente dovezi pentru a fi respinsă). trebuie să ne gândim de două ori. este mai corect să spunem că pe baza datelor din eşantionul studiat.…. nu putem respinge ipoteza nulă. Regiunea critică este delimitată de valoarea critică. cu toate că ipoteza nulă despre parametrul populaţiei este adevărată. deşi pe baza datelor din sondaj o respingem. atunci când respingem ipoteza nulă. În baza legii numerelor mari. Cu alte cuvinte. C – punctul de tăietură în stabilirea acesteia. majoritatea vor cădea în afara regiunii critice. se numeşte eroare de genul întâi.xn cade în regiunea critică Rc. De aceea. extras din populaţia X. Dacă punctul definit de vectorul de sondaj x1. deşi este adevărată. decât să spunem că ipoteza nulă este adevărată. care este o variabilă aleatoare. deoarece există două posibilităţi: ea este falsă într-adevăr şi ea este totuşi adevărată. ipoteza H0 se respinge.(α=0. greşită deşi nu am respins-o. numai într-un număr foarte mic de cazuri punctul rezultat din sondaj va cădea în Rc. Eroarea pe care o facem eliminând o ipoteză nulă. La fel şi pentru situaţia în care acceptăm ipoteza nulă H0. Verificarea ipotezei nule se face pe baza unui eşantion de volum n. Nu este însă exclus ca punctul din sondaj să cadă în regiunea critică. ipoteza H0 se acceptă. Probabilitatea comiterii . iar dacă punctul cade în afara regiunii critice Rc.x2.01 etc).

se numeşte eroare de genul al doilea. Acest lucru se poate . deşi este falsă.unei astfel de erori reprezintă riscul de genul întâi (α) şi se numeşte nivel sau prag de semnificaţie. Erorile în testarea ipotezelor statistice Decizia de acceptare 0 H0 Ipoteza adevărată H0 H1 1 Decizie corectă (probabilitate 1H1 α) Eroare de gen I (risc α) 2 Eroare de gen II (risc β) Decizie corectă (probabilitate 1-β) (1-α)100 reprezintă probabilitatea de garantare a Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al doilea sunt mai mici. iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu β. rezultatelor. Puterea testului statistic este (1-β). Eroarea pe cere o facem acceptând o ipoteză nulă. Tabelul de mai jos ilustrează legătura dintre decizia pe care o luăm referitor la ipoteza nulă şi adevărul sau falsitatea acestei ipoteze. cu atât testul este mai bun. Nivelul de încredere al unui test statistic este (1-α) iar în expresie procentuală.

realiza prin mărirea volumului eşantionului. Similar. efecte letale. n. există costuri asociate cu producerea unei erori de genul al II-lea. pragul de semnificaţie ales de o firmă ce fabrică îngheţată. interesată în greutatea medie a cutiilor de îngheţată va putea fi diferit de pragul de semnificaţie ales de o companie farmaceutică. costul în prima situaţie prezentată este mult mai mic. O modalitate de a vizualiza această legătură este să presupunem că există doar două distribuţii care ne interesează. comparativ cu costul asociat în cazul producerii unei erori de genul I pentru compania farmaceutică: o cantitate prea mică de ingredient activ poate face medicamentul ineficient. Nivelurile riscurilor se stabilesc în funcţie de considerente economice şi de natura testului. O distribuţie corespunde ipotezei nule H0. o cantitate prea mare de ingredient activ poate cauza efecte secundare. interesată de cantitatea medie a unui ingredient activ dintr-un tip de medicament. Evident. Spre exemplu. Am văzut că: α= P(respingere H0 ‫ ׀‬H0 este corectă)=P(eroare de gen I) β= P(acceptare H0 ‫ ׀‬H0 este falsă)=P(eroare de gen II) Alegerea nivelului (pragului) de semnificaţie depinde şi de costurile asociate cu producerea unei erori de genul I. Între eroarea de genul I şi eroarea de genul al II-lea există o legătură. o condiţionare. dăunătoare sau poate avea. chiar. iar cealaltă corespunde ipotezei alternativei H1. presupunem că şi ipoteza nulă şi cea . În acest caz.

Într-o manieră uşor de înţeles. respingem H0. aceasta este adevărată. deoarece media de sondaj este mai mare decât valoarea critică. în situaţia în care. Probabilitatea comiterii unei astfel de erori (β) . Eroarea de genul al doilea apare atunci când nu respingem (adică acceptăm) H0. Eroarea de genul I apare atunci când respingem ipoteza nulă H0. Adică. C (nu se află în regiunea critică). Probabilitatea comiterii unei astfel de erori (α ) este aria de sub curba de distribuţie H0 care se situează la dreapta valorii critice C. de fapt. deşi H1 în loc de H0 este corectă. deşi distribuţia lui x este cea corespunzătoare ipotezei H1. să considerăm că ipoteza nulă este de forma H0: μ=μ0. deşi distribuţia lui x este cea corespunzătoare ipotezei H0. iar ipoteza alternativă este de forma H1:μ=μ1 (vezi fig): Legătura dintre probabilităţile α şi β Pe grafic se observă că cele două distribuţii se suprapun şi. pot rezulta două tipuri de erori. acceptăm H0 deoarece media de sondaj este mai mică decât valoarea critică.alternativă sunt ipoteze simple. În acest caz. C şi se situează în regiunea critică. din procesul de testare a ipotezei nule.

).este aria de sub curba de distribuţie H1 care se situează la stânga valorii critice. atât α. α şi β când volumul eşantionului n' > n 5) După ce am stabilit pragul de semnificaţie şi regiunea critică. este posibil să reducem riscul β. aba- terile medii pătratice ale distribuţiilor pentru H0 şi H1 devin mai mici şi. cât şi β descresc (vezi fig.). Cu toate acestea. s Cum s x = x n . α. . o dată cu creşterea volumului n al eşantionului. va creşte β ( riscul comiterii unei erori de genul al doilea). în care vom face principalele presupuneri despre populaţia sau populaţiile ce sunt eşantionate (normalitate etc. mai mic (adică reducem riscul comiterii unei erori de genul întâi). evident. fără a creşte riscul α. C. prin creşterea volumului n al eşantionului. Dacă alegem un prag de semnificaţie. trecem la pasul următor.

se desprind concluziile: ipoteza nulă este fie acceptată. cu alternativa media diferită de valoarea μ0. astfel: a) dacă valoarea numerică a testului statistic cade în regiunea critică (Rc). Atunci: H0: μ = μ0 H1: μ ≠ μ0 (μ < μ0 sau μ > μ0). ii) să testăm ipoteza nulă μ = μ0. cu alternativa media μ este mai mare decât μ0. respingem ipoteza nulă şi concluzionăm că ipoteza alternativă este adevărată.6) Se calculează apoi testul statistic şi se determină valoarea sa numerică. şi acest test este un test bilateral. 7) La ultimul pas. fie respinsă. se acceptă ipoteza nulă H0. μ0). b) dacă valoarea numerică a testului nu cade în regiunea critică (Rc). pe baza datelor din eşantion. μ cu valoarea μ0): i) să testăm dacă parametrul din colectivitatea generală (media μ) este egal cu o anumită valoare (inclusiv zero. Vom şti că această decizie este incorectă doar în 100 α % din cazuri. . Ipoteza alternativă poate avea una din trei forme (pe care le vom exemplifica pentru testarea egalităţii parametrului „media colectivităţii generale“.

cu alternativa media μ este mai mică decât μ0.H0: μ = μ0 H1: μ > μ0 care este un test unilateral dreapta. în ambele direcţii. unilateral stânga. Regiunea critică pentru testul bilateral diferă de cea pentru testul unilateral. Când efectuăm un test unilateral. c) test unilateral dreapta .): μ a) μ b) μ c) b) test Regiunea critică pentru a) test bilateral. trebuie să stabilim o regiune critică Rc în ambele cozi ale distribuţiei de eşantionare pentru testul statistic. astfel (vezi fig. iii) să testăm ipoteza nulă μ = μ0. vom stabili o regiune critică într-o singură parte a distribuţiei de eşantionare. H0: μ = μ0 H1: μ < μ0 care este un test unilateral stânga. Când încercăm să detectăm o diferenţă faţă de ipoteza nulă.

x − µ0 x − µ0 x − µ0 = ≈ σx σ x n sx n x este aproximativ normal distribuită. putem determina valoarea zα/2.2. este nevoie să construim un test cu un nivel de semnificaţie α prestabilit.μ0=0) H1: μ ≠ μ0 (μ .2. pentru care P(z> z critică Rc este dată de: α/2 )= α/2. media eşantionului standard. variabila aleatoare z urmează o distribuţie normală z= Dacă pragul de semnificaţie (α) este stabilit. Aceasta înseamnă că regiunea . pentru a o x efectua. Utilizând teorema limită centrală am văzut că dacă volumul eşantionului este mare. Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum mare Utilizarea eşantioanelor de volum mare (n > 30) face posibilă aplicarea teoremei limită centrală. ipotezele sunt: H0: μ = μ0 (μ . astfel: i) în cazul testului bilateral. Putem întâlni teste unilaterale sau bilaterale.μ0≠0) (adică μ < μ0 sau μ > μ0). De aceea.2. Testarea se face pe baza mediei eşantionului şi.

.z α/2 sau z> z α/2 x − µ0 Regula de decizie este. ipotezele sunt: H0: μ = μ0 (μ . Testul statistic calculat este: x − µ0 x − µ0 x − µ0 = ≈ σx σ n s n z= Regiunea critică este dată de: Rc: z > zα Regula de decizie este: x − µ0 Respingem ipoteza H0 dacă σ n > zα iii) Pentru testul unilateral stânga. deci: Respingem H0 dacă sau x − µ0 σx n < − zα / 2 σx n > zα / 2 ii) pentru testul unilateral dreapta.μ0<0). ipotezele sunt: H0: μ = μ0 (μ .Rc: z< .μ0=0) H1: μ > μ0 (μ .μ0>0).μ0=0) H1: μ < μ0 (μ .

un patron al unui restaurant doreşte să vadă dacă există diferenţe între vânzările realizate înainte şi după o campanie de publicitate. 2. deoarece teorema limită centrală ne asigură că testul statistic va fi aproximativ normal distribuit. Spre exemplu.3.2. indiferent de forma distribuţiei din colectivitate. un grup de consumatori doreşte să vadă .Testul statistic calculat este: x − µ0 x − µ0 x − µ0 = ≈ σx σ n s n z= Regiunea critică este dată de: Rc: z < –zα Regula de decizie este: x − µ0 n Respingem ipoteza H0 dacă : σ < −z α Să remarcăm că în nici una dintre aceste situaţii nu trebuie făcută o presupunere specială.Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum mare Multe cazuri de analiză statistică implică o comparaţie între mediile a două colectivităţi generale.

În aceste situaţii. c) dacă cele două eşantioane sunt independente. aşteptată abaterea medie pătratică a distribuţiei de eşantionare va avea forma: σ (x 1 −x 2 ) =σ n + n 1 2 1 1 . Mărimea lui σ ( x 1 −x 2 ) indică variabilitatea în valorile în distribuţia de eşantionare. n1 şi n2 sunt volumele eşantioanelor respective. abaterea medie pătratică a distribuţiei de eşantionare este: σ (x 1 −x 2 ) = 2 σ 12 σ 2 + n1 n 2 unde 2 2 σ1 şi σ 2 sunt dispersiile celor două populaţii eşantionate. un estimator al diferenţei (μ1. Proprietăţile distribuţiei de eşantionare a diferenţei ( x 1 − x 2 ) sunt: a) distribuţia de eşantionare pentru ( x1 − x 2 ) este aproximativ normală pentru eşantioane de volum mare (n1 > 30 şi n2 > 30). În cazul în care dispersiile celor două populaţii eşantionate sunt egale.dacă există o diferenţă semnificativă între consumul electric pentru două tipuri de cuptoare cu microunde etc. b) media distribuţiei de eşantionare a lui ( x1 − x 2 ) este (μ1 – μ2). 2 2 σ1 = σ 2 = σ 2 . iar x1 − x 2 .μ2) este diferenţa dintre mediile eşantioanelor ( x 1 − x 2 ). datorită întâmplării.

ipotezele statistice ce urmează a fi testate vor fi: i) test bilateral H0: (μ1.μ2)>D sau (μ1.μ2) ≠ D [(μ1.μ2) < D unde D reprezintă diferenţa ipotetică dintre mediile populaţiilor.În aceste condiţii.μ2) > D iii) test unilateral stânga H0: (μ1.μ2) = D H1: (μ1.μ2)<D] ii) test unilateral dreapta H0: (μ1.μ2) = D H1: (μ1. Testul statistic utilizat are forma: z= (x 1 − x2 − D σ ( x − x2 ) 1 ) Regiunea critică este dată de: i) z< .μ2) = D H1: (μ1.z α/2 sau ii) z> z α iii) z< .z α z> z α/2 . deseori egală cu 0.

4. în locul statisticii z care necesită cunoaşterea (sau o bună aproximare) a lui . acum. poate să nu ofere o 2 x 2 x aproximare foarte bună a lui σx σ2 x (în cazul eşantioanelor mici). Pe de altă parte. doar dacă colectivitatea generală este distribuită normal (sau aproximativ normal). adică pe baza datelor provenite din eşantioane mici (de volum redus. În cazul eşantionului de volum redus se utilizează testul statistic t. în cazul eşantioanelor de volum redus. efectul imediat este acela că forma distribuţiei de eşantionare a mediei x depinde. Distribuţia de eşantionare a lui x va fi normală (sau aproximativ normală). de forma populaţiei generale din care a fost extras eşantionul. vom folosi statistica: . multe decizii trebuie luate pe baza unor in-formaţii foarte limitate.Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum redus În afaceri. n≤30). Ca atare.2. atunci dispersia eşantionului ( s ). dacă nu se cunoaşte dispersia din colectivitatea generală ( σ ).2. În aceste situaţii.

pentru test bilateral. H1: μ < μ0. Presupunerea specială ce trebuie făcută este aceea că po-pulaţia generală este normal sau aproximativ normal distribuită.pentru test unilateral dreapta. Testul statistic utilizat: t= x − µ0 x − µ0 = sx sx n . . . H0: μ = μ0.t= x − µ0 x − µ0 = sx sx n . Regiunea critică este dată de: . . devin atunci: .pentru test unilateral stânga. H0: μ = μ0. H1: μ > μ0. unde: s 2 x ∑( x = i −x n −1 ) 2 Elementele procesului de testare a ipotezelor statistice privind media colectivităţii generale (μ) pe baza datelor din eşantioane de volum redus. H0: μ = μ0. H1: μ ≠ μ0 (μ < μ0 sau μ > μ0).

n-1 sau t < .n-1. de medie p şi eroare standard şi n(1 − p ) ≥5 p (1 −p ) / n ): µf = p şi s f = p(1 − p) f (1 − f ) . media în eşantion era notată cu f (proporţia succeselor).n-1. (Atenţie! Dacă volumul eşantionului este mic. rezultă că variabila standardizată z= f −p f (1 − f ) / n este aproximativ normal standardizat distribuită. despre distribuţia de eşantionare a . ≈ n n Pentru testarea ipotezelor statistice privind proporţia este necesar să lucrăm cu eşantioane mari(n>100). ii) t > t α. iar abaterea medie pătratică f (1 − f ) . Cum proporţia f este aproximativ normal distribuită.2.n-1.t α. pentru variabile alternative.5. distribuţia de . pentru n mare ( np ≥5 proporţiei ştim că proporţia eşan-tionului (f) este aproximativ normal distribuită.i) t > t α/2.t α/2. iii) t < . De asemenea.Testarea ipotezei privind proporţia populaţiei pentru eşantioane mari Ne amintim că. Exemplu 2. dispersia f(1-f).

ipoteza nulă indică faptul că p este egală cu o valoare specificată: H 0 : p = p0 . z < −zα .dacă proporţia este mai mică decât valoarea specificată (test unilateral stânga): H 1 : p < p0 . . Regiunea critică (Rc) este dată de: z < −zα / 2 z > zα sau z > zα / 2 pentru testul bilateral. .eşantionare a proporţiei nu este o distribuţie t şi orice inferenţă asupra lui p trebuie să se bazeze pe distribuţia lui f. care este o distribuţie binomială!) Ipotezele nule şi alternative pentru testarea proporţiei se construiesc în aceeaşi manieră cu ipotezele pentru testarea mediei µ. pentru testul unilateral stânga. Adică.dacă proporţia este mai mare decât valoarea specificată (test unilateral dreapta): H 1 : p > p0 .dacă proporţia este diferită de valoarea specificată (test bilateral): H 1 : p ≠ p0 . Testul statistic pentru proporţia p este: z= f −p0 p(1 − p / n ) ≈ f −p0 f (1 − f ) / n . în timp ce ipoteza alternativă răspunde la una dintre cele trei întrebări: . pentru testul unilateral dreapta.

dispersiile în cele două colectivităţi generale sunt egale. 2. . ca şi în cazul anterior. un estimator al dispersiei (variabilităţii) totale din cele două populaţii combinate este: s c2 = ∑ (x n1 i =1 i − x 1 + ∑ xi − x 2 2 i =1 ) n2 ( ) 2 n1 + n 2 − 2 sau s = 2 c (n 1 − 1) s 21 + ( n 2 − 1) s 2 2 ( n 1 − 1) s 21 + ( n 2 − 1) s 2 2 x x x x = ( n 1 − 1) + ( n 2 − 1) n1 + n 2 − 2 .2. o statistică t.6. regula de decizie este: se respinge ipoteza nulă şi se acceptă ipoteza alternativă.Aşadar. . Pentru aceasta vom presupune că: . va trebui să construim. . Student. dacă z se situează în regiunea critică (Rc) stabilită în funcţie de probabilitatea dorită de garantare a rezultatelor 100 (1 −α)% .ambele colectivităţi generale din care s-au extras eşan-tioanele sunt normal sau aproximativ normal distribuite.eşantioanele aleatoare sunt selectate independent unul de celălalt. În condiţiile în care presupunem că cele două colectivităţi generale au dispersii egale ( σ = 2 x1 2 2 σx 2 = σx ). Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum redus În cazul în care dorim să testăm semnificaţia diferenţei dintre mediile a două eşantioane de volum redus.

s 21 x . dispersia combinată 2 sc este media aritmetică pon-derată a şi s2 2 x dispersiilor celor două eşantioane. H1: μ1 > μ2 (μ1. Dacă dispersiile nu sunt egale (σ2x1≠σ2x2).μ2 ≠ D).μ2 > D).μ2 < D). H1: μ1 ≠ μ2 (μ1. H0: μ1 = μ2 (μ1.pentru test unilateral dreapta. H0: μ1 = μ2 (μ1.Aşadar. .μ2 = D).pentru test unilateral stânga. H0: μ1 = μ2 (μ1. atunci testul statistic are forma: t= ( x1 − x 2 ) − D 2 s12 s 2 + n1 n 2 cu gradele de libertate: /n1 + s 22 /n2 ) (s12 /n1 ) 2 (s22 /n2 ) 2 + n1 − 1 n2 − 1 2 1 2 (s Ipotezele statistice vor fi. H1: μ1 < μ2 (μ1.μ2 = D). în aceste condiţii: .pentru test bilateral. . Testul statistic t va avea forma: .μ2 = D).

n1 +n 2 −2 .Smirnov. .pentru test bilateral: t< –t α / 2. Dacă ipoteza nulă nu este acceptată. σ2). Editura Ştiinţifică şi Enciclopedică. teste prin care se verifică ipoteza nulă conform căreia legea de repartiţie este cea normală N(μ. n1 +n 2 −2 . .t= (x 1 − x2 − D ) 1 1  2 sc  +  n   1 n2  = s 21 ( n 1 − 1) + s 2 2 ( n 2 − 1) x x (x 1 − x2 − D ) ⋅ n 1n 2 ( n 1 + n 2 − 2) n1 + n 2 .pentru test bilateral stânga: t< – t α. (coord. 1985). n1 +n 2 −2 sau t> t α / 2.) — Mică enciclopedie de statistică. Cele mai cunoscute teste pentru verificarea normalităţii sunt testul χ2 de concordanţă cu legea normală. Regiunea critică este dată de: . testul de normalitate al lui Lilliefors (vezi Trebici. cu μ şi σ2 parametrii necunoscuţi ce urmează a fi estimaţi pe baza datelor eşantionului considerat.pentru test bilateral dreapta: t> t α. testul Kolmogorov . V. . Bucureşti. în cadrul cărora nu se fac presu-puneri speciale asupra formei distribuţiei. Trebuie să facem o remarcă asupra presupunerilor privind normalitatea distribuţiei în colectivitatea generală: teoria statistică a dezvoltat teste pentru verificarea normalităţii distribuţiilor. n1 +n 2 −2 . vom putea apela la teste statistice neparametrice.

testul statistic utilizat în testarea ipotezei privind χ2 = (n − 1) s 2 σ2 σ2 este: . egală cu n ⋅s2 sau ( n −1) ⋅ s 2 pentru eşantioane mici). împărţită la dispersia colectivităţii generale. este egală cu α. are o distribuţie hi-pătrat ( χ ) (dacă populaţia eşantionată este normal 2 distribuită). Spre exemplu: 2 χ0.2. eşantionată este normal distribuită. suma pătratelor diferenţelor ∑( x i − x)2 (care este.7.9 =16 . Testarea ipotezei privind dispersia unei populaţii Aşa cum am văzut în capitolul anterior.33 Ipoteza nulă este: H 0 : σ 2 = σ 02 cu ipoteze alternative: . 95 . se noteaza Nu putem folosi notaţia 2 − χα pentru a χ2 reprezenta punctul la care aria din stânga este α.9 = 3. când populaţia σ2 .92 2 χ0. de fapt. cu dispersia Valoarea lui χ2 pentru care aria de sub curbă (situată la dreapta ei) 2 χα .2. Dar χ 12α reprezintă punctul pentru care aria de sub curbă situată la stânga lui este α. 05 . deoarece statistica este întotdeauna mai mare decât zero. Aşadar. χ2 care are o distribuţie cu (n-1) grade de libertate.

În acest subcapitol vom compara două dispersii. 2.2. • Aspectul vital: variabilitatea.n −1 sau 2 χ2 > χα / 2 . H 0 : σ 2 < σ 02 . .8.n −1 2 χ2 > χα.n −1 1 Factorii ce identifică testul privind dispersia unei populaţii: • Obiectiv: caracterizarea unei colectivităţi. . n −1 pentru test bilateral.pentru test unilateral stâng Regiunea critică este dată de: χ 2 < χ12−α / 2. ceea ce ne va permite să comparăm consistenţa a două procese sau riscurile a două portofolii de investiţii etc. egalitatea dintre două dispersii înainte de a decide ce procedeu să folosească în verificarea ipotezei privind diferenţa dintre două medii. Statisticienii testează. pentru test unilateral stânga.. χ2 χ2 < χ2−α. • Tipul datelor: cantitative. adesea.pentru test unilateral drept .Testarea ipotezei privind raportul dintre două dispersii Am văzut că testarea ipotezei privind dispersia poate fi utilizată pentru a trage concluzii privitoare la consistenţa unor procese economice ori privitoare la riscurile asociate. H 0 : σ 2 > σ 02 .pentru test bilateral H 0 : σ 2 ≠ σ 02 . pentru test unilateral dreapta.

parametrul ce ne interesează este σ 12 / σ 22 . Din matematică ştim că raportul dintre două variabile hi-pătrat independente împărţite la gradele lor de libertate are o distribuţie F. În cele ce urmează. . este o distribuţie F.Vom compara dispersiile a două populaţii. ipoteza nulă este întotdeauna specificată ca egalitatea între două dispersii. Atunci: F= ( n1 − 1) s12 / σ 12 (n 2 − 1) s 22 / σ 22 s12 / σ 12 : = 2 2 (n1 − 1) ( n 2 − 1) s2 / σ 2 . În consecinţă. Dacă 2 s1 / s 2 2 dispersia eşantionului este (aşa cum am văzut) un estimator nedeplasat şi consistent al dispersiei colectivităţii generale. adică sub forma egalităţii raportului cu unitatea. se notează cu Fα (cu gradele de libertate gl1 şi gl2). cu ( n1 − ) 1 şi ( n2 −1) grade de libertate. H 0 : σ 12 / σ 22 = 1 . să notăm că raportul este estimator punctual al raportului de dispersii Distribuţia de eşantionare a raportului 2 s1 / s 2 2 2 σ 12 / σ 2 . Gradele de libertate ale distribuţiei F sunt identice cu gradele de libertate ale celor două distribuţii hi-pătrat. Valoarea lui F pentru care aria de sub curbă (situată la dreapta ei) este α. dacă eşantioanele au fost extrase independent din populaţii normal distribuite. determinând raportul dintre ele.

Regiunea critică este dată de: F > Fα / 2 . F > Fα. Tehnic. care urmează o distribuţie F testul statistic devine: s12 F= 2 s2 ( n1 − ) 1 şi ( n2 −1) grade de libertate. g l2 gl1 = n1 –1 gl2 = n2 –1 . testul statistic este adică cu σ /σ =1 . n α 1 1 − . gl1. n α F1− . gl1. .n 1 1 2− sau F <F1− / 2 .Ipoteza alternativă poate fi construită astfel: fie că raportul este diferit de 1. n2 pentru test unilateral stânga. α 1 1 − . fie mai mare. g l2 = 1 Fα. n −1.n −1. 2 1 2 2 s12 / σ 12 F= 2 2 s2 / σ 2 . − 1 F <F1− . dar în condiţiile ipotezei nule. n2 − 1 pentru test bilateral. n 1 1 2− pentru test unilateral dreapta. fie mai mic decât 1.

2.3. Întrebări

1.

Cum apar în statistică ipotezele? Cum se stabileşte regiunea critică, Rc pentru

2.

testul bilateral?

3.

Cum se stabileşte regiunea critică, Rc pentru

testul unilateral ?

4.

În testarea ipotezei privind media populaţiei

generale (μ) pentru eşantioane de volum mare , în cazul testului bilateral, care sunt ipotezele ?

5.

În testarea ipotezei privind diferenţa dintre

două medii pentru eşantioane de volum mare, care sunt proprietăţile distribuţiei de eşantionare a diferenţei ( x 1 − x 2 ) ?

2.4.Probleme rezolvate Exemplu 1 - Testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum mare Presupunem că un fabricant de materiale de construcţii comercializează ciment în pungi, care trebuie să conţină 12 kg/pungă. Pentru a detecta eventuale abateri în ambele sensuri de la această cantitate, selectează 100 de pungi, pentru care calculează
x = 1 ,8 1 5

kg, sx=

0,5 kg. Pentru α = 0,01 (grad de încredere (1- α)100=99%) să se

determine dacă se acceptă ipoteza nulă, aceea că greutatea pungilor este în medie de 12 kg. H0: μ = 12 H1: μ ≠ 12 ( μ < 12 sau μ > 12); z α/2=z0,005=2,575
x −12 x −12 x −12 s n 11,85 −12 = − ,0 3 0,5 10

z=

σx

=

σ

n

=

Regiunea critică: z< - z α/2 sau

z> z α/2

Cum z = - 3,0 < - 2,575 rezultă că sunt suficiente evidenţe pentru a respinge ipoteza nulă H0 şi a accepta ipoteza alternativă, aceea că greutatea pungilor diferă, în medie, de 12 kg. Exemplu 2 : Testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum mare Managerul unui restaurant doreşte să determine dacă o campanie de publicitate a dus la creşterea veniturilor medii zilnice. Au fost înregistrate veniturile pentru 50 de zile înainte de desfăşurarea campaniei. După desfăşurarea campaniei şi trecerea unei perioade de 20 de zile pentru ca această campanie să îşi facă efectul, se înregistrează veniturile pentru 30 de zile. Aceste două eşantioane vor permite testarea ipotezei

Din prelucrarea datelor pentru cele două eşantioane. lei mil. zα=z0.28 Test unilateral dreapta 2 z > 1. lei s1=2. vom efectua un test unilateral stânga: H0: μ1 = μ2 (μ1 .15 mil.645 Test bilateral .05=1.μ2 < 0) Pentru un prag de semnificaţie α = 0.28 3 z < .05 (probabilitate de garantare a rezultatelor (1. lei s2=2.645. pentru cele mai comune valori ale lui α sunt date de (vezi tab.1.α)100=95%.10 stânga 1 z < .38 mil.30 mil. rezultă: Înainte de campanie n1=50 x 1 =12 .1.privind efectul campaniei asupra veniturilor.645 sau z > 1.μ2 = 0) H1: μ1 < μ2 (μ1 . lei Dorim să vedem dacă veniturile au crescut (μ2> μ1).): Regiumile critice pentru diferite valori α α Test unilateral 0 0. Să notăm că regiunile critice.55 După campanie n2=30 x 2 =13 . aşadar.

0. 3.575 Presupunând că cele două eşantioane (înainte şi după campanie) sunt independente.645. 2. rezultă că nu ne aflăm în regiunea critică.80.43.575 sau z > 2.60.645 z < . vom calcula testul z: z= (x 1 − x2 − 0 1 −x 2 σ (x ) ) = x1 − x 2 2 σ 12 σ 2 + n1 n 2 ≈ x1 − x 2 2 s1 s 2 + 2 n1 n 2 = − 0. Eşantioanele nu oferă aşadar.05 0.01 mld.05) pentru ca managerul restaurantului să concluzioneze că veniturile au crescut în urma campaniei de publicitate.1.96 sau z > 1.05= –1.645 z > 2.75 = −1.01 z < . Ştiind că profitul companiei în anul anterior a fost de 2.41 0.testarea ipotezei privind media populaţiei generale (μ) pentru eşantioane de volum redus Conducerea unei companii apelează la 5 experţi pentru a previziona profitul companiei în anul curent.32. suficiente dovezi (la α = 0. lei.33 z < .1.2. sunt suficiente dovezi pentru a concluziona că media previziunilor . Valorile previzionate sunt: 2.33 z > 1.5305 Cum valoarea calculată nu este mai mică decât –z0. 1.00 (miliarde lei. 3. preţurile anului anterior).2.96 z < . Exemplu 3 .

.874< t0.203 = 0. H1: μ > 2. de 2.5507 4 şi abaterea medie pătratică: s x = s 2 = 0. lei. Cum tα.74 x mld.63 − 2.05.01 (test unilateral dreapta). regiunea critică este dată de t>tα. t= x −µ x −µ 2.01. vom face presupunerea că populaţia generală din care s-a extras eşantionul este normal distribuită.n-1.01 mld.74 / 5 .05)? Media previziunilor experţilor este s 2 x x =2. cu dispersia: ∑( x = i −x ) 2 n −1 = 2.n-1 = t0.01 = = =1. nu putem trage concluzia că media profitului previzionată de cei 5 experţi pentru anul curent este semnificativ mai mare decât profitul anului trecut. lei.6 3 mld. Elementele procesului de testare a ipotezei statistice sunt: H0: μ = 2.4 = 2.experţilor este semnificativ mai mare decât cifra anului anterior (pentru α = 0.132.4=2.132.874 sx sx n 0. Cum t=1.05. lei. În scopul folosirii statisticii t.

12 H 1 : p > 0. El selectează 400 de cumpărători potenţiali şi află că 52 dintre aceştia vor achiziţiona produsul.14 ⋅ 0.Exemplu 4 : testarea ipotezei privind proporţia populaţiei pentru eşantioane mari Managerul unui laţ de magazine consideră în urma unei analize financiare că .pentru un nou produs .12 0. Testul statistic este: z= f − 0. Pentru o probabilitate de 99% sunt suficiente dovezi care să convingă managerul să comercializeze produsul? Ipotezele sunt: H 0 : p = 0. rezultă că nu ne aflăm în regiunea critică (Rc).01 = 2.33 şi z < zε . deci procentul nu este mai mare de 12%.86 / 400 = 0.14 − 0.comercializarea este profitabilă.02 =1. Exemplu 5 : testarea ipotezei privind diferenţa dintre două medii pentru eşantioane de volum redus Presupunem că dorim să testăm ipoteza conform căreia între două mărci de autoturisme nu există diferenţe semni-ficative privind .12 . nu avem suficiente dovezi să respingem ipoteza nulă. Cum z α = z 0. dacă procentul cumpărătorilor care ar dori să achiziţioneze produsul este mai mare de 12%.12 f (1 − f ) / n = 0. (test unilateral dreapta).15 0.017 .

dacă rezultatele prelucrării datelor în eşantioane sunt: Marca 1 n1=8 x 1 = 5.273 mil.273) − 0 = 1 1  0. H1: μ1 ≠ μ2 (μ1.5943 0.696 − 5.635 2 8 + 12 − 2 = 0. lei sx2=0.3379 Ipotezele statistice sunt: H0: μ1 = μ2 (μ1. lei x 2 = 5.n1+n2-2. .734. lei 2 sc = ( 8 − 1) 0.05.423 = 1.18 = 1. Testul statistic este: t= ( 5. cu acurateţe.1 (probabilitate de garantare a rezultatelor (1-α)100 = 90%) să se testeze această ipoteză. Pentru α=0.635 mil.μ2 ≠ 0) [μ1> μ2 sau μ1< μ2].μ2 = 0).485 mil.485 2 + (12 − 1) 0.3379 +   8 12  0.n1+n2-2= t0. evidenţa cheltuielilor de funcţionare pe o perioadă de un an de zile. se observă că t < tα/2.2653 Cum tα/2. Pentru aceasta 20 de posesori de autoturisme (8 posesori ai primei mărci şi 12 po-sesori ai celei de-a doua) sunt rugaţi să ţină. aşadar nu ne aflăm în regiunea critică.696 Marca 2 n2=12 mil.cheltuielile de funcţionare. lei sx1=0.

n −1 = χ02. 66. σ 2 > 100 . s 2 =191 . 59. ipotezele: H 0 : σ 2 = 100 . 35.Rezultă.05 . 57. că nu există suficiente dovezi pentru a concluziona că sunt diferenţe semnificative între cheltuielile de funcţionare ale celor două mărci de autoturisme. 63.92 . 63. 81.26 .8 . Exemplu 7 : testarea ipotezei privind raportul dintre două dispersii . σ2 100 Cum 2 χα.n −1 vom respinge ipoteza nulă şi vom accepta ipoteza alternativă.85 . 66. Exemplu 6 : testarea ipotezei privind dispersia unei populaţii Pentru următoarele date privind cererea unui produs (selectate dintr-o colectivitate normal distribuită). 9 =16 . Datele sunt: 85. ∑(x = i − x) 2 n −1 = 1726 = 191. deci. H 1 : σ 2 > 100 . să se testeze (pentru o probabilitate de 95%). şi 2 χ2 > χα. În eşantion: s 2 s =13 . 55.8 . 9 Testul statistic este: χ2 = (n − 1) s 2 1726 = = 17.

59 .05 . În general .dacă la numărător se trece dispersia cea mai mare . lei). cu împrăştierea veniturilor. s 22 1. Se utilizează o probabilitate de garantare a rezultatelor de 95%.testul F este un test unilateral dreapta.84 2 8. Acest lucru înseamnă că se acceptă ipoteza conform căreia împrăştierea veniturilor pentru turiştii din zona litorală este semnificativ mai mare decât cea a turiştilor din zona balneară.0686 = = = 2.84 şi . pentru colectivitatea turiştilor ce preferă turismul litoral.Un analist doreşte să compare împrăştierea veniturilor pe familie.6 4 este dată de: . lei) sunt: s 2 = 1.3314 .86 2 3. ipoteza nulă se respinge (aceea că raportul dintre Cum F >F0.86 s1 = 2. în cele două colectivităţi sunt aproximativ normale au fost selectate două eşantioane. pentru colectivitatea turiştilor ce preferă turismul balnear. H 1 : σ 12 / σ 22 > 1 .05 .4596 α = 0. Testul statistic are valoarea: F= s12 2. 49 dispersii este 1) şi se acceptă ipoteza alternativă.05 ) Regiunea critică (pentru F > F0. . 59 . Presupunând că distribuţiile veniturilor (mil. de volum 60 şi 50 de persoane. iar abaterile medii pătratice (mil. Ipotezele statistice sunt: H 0 : σ 12 / σ 22 = 1 . 49 ≈1.

Ed. Bucureşti. Dormont B . BIBLIOGRAFIE Andrei. Ed.2.. Paris ... Pecican. Florea I. Iacob. Econometrie . Bourbonnais R . Bucureşti. 2004. E. Paris . A. Dunod .2000. 5. 4. 1998 2. 6. Econometrie.I. Ed. 2004. 2005. Tănăsoiu. Introduction a l’econometrie . T. Ed. Economică. Muntele Sion. ASE. Econometrie pentru economişti.. 1999 3.5. 1. Montchrestien . Ed. Culegere de modele econometrice. Bucureşti. . O.Statistică şi econometrie Editura Economică. .(coordonator). Studii de caz.

3.OBIECTIVE: introducerea studenţilor în sfera şi noţiunile specifice modelului de regresie.Capitolul 3 3.1.2.2.1 Specificarea unui model de regresie .PREZENTARE SINTETICĂ: 3.

Un studiu econometric începe cu o serie de presupuneri teoretice despre anumite aspecte ale economiei.ε ) Modelul cel mai simplu: C=α +β X+ε Modelul general ce trebuie estimat are forma: . Keynes: C=f(x) Suma cheltuită pentru consum depinde de: • mărimea venitului pe de o parte • alte obiective în funcţie de circumstanţe (de exemplu investiţiile) • alte nevoi subiective Legea psihologică fundamentală: „o persoană este dispusă de regulă şi în medie să îşi crească consumul pe măsura creşterii venitului dar nu în aceeaşi măsură” 0< dC <1 dX un nivel absolut mai mare al venitului va tinde de regulă să mărească diferenţa între venit şi consum: d (C / X ) <0 dX Presupunerea cea mai simplă: C=α +β X. Investigaţiile empirice furnizează estimatori pentru parametri necunoscuţi ai modelului. În model trebuie inclus şi factorul aleator: C=f(X. 0<β <1 este o relaţie deterministă neadecvată.

analistul alege valorile regresiei xi şi apoi observă yi Valoarea parametrului β arată modificarea proporţională a variabilei efect (Y) la modificarea cu o unitate a variabilei cauză (X).n unde: .yi =α + β xi + ε i.xi este nestochastic (situaţie experimentală) . Modelul liniar unifactorial y=1+0. . Valoarea parametrului α arată punctul în care linia interceptează (taie) axa OY ε i reprezintă componenta reziduală (eroarea aleatoare) pentru fiecare unitate. i=1. adică partea din valoarea lui Yi care poate fi determinată cunoscând valoarea Xi (α + β Xi = Yi') b) componenta reziduală care nu poate fi determinată cunoscând valoarea individuală Xi (ε i) Atunci. adică partea din valoarea variabilei Y care nu poate fi măsurată prin relaţia sistematică existentă cu variabila X.5x Modelul probabilistic conţine: a) componenta deterministică.

(x2.Yi = Yi = Yi = α + β Xi + ε i componenta predictibilă (detrministică) + eroarea aleatoare Yi' + ε i Dacă datele disponibile provin dintr-un eşantion avem la dispoziţie n perechi de observaţii (x1. yn). α şi β . y1).y2). obţinuţi pe eşantion ei este valoarea reziduală (pentru unitatea i) în eşantion: ei = yi – (a + bxi) Abaterea ei de la linia de regresie Ipotezele modelului de regresie liniară . (xn.. Modelul de regresie liniară în eşantion este cu componenta predictibilă: ˆ y i = a + bx i yi = a + bxi + ei a şi b sunt estimatorii punctului de intercepţie (α ) şi pantei liniei drepte (β ).. . pe care le vom folosi pentru estimarea parametrilor ecuaţiei de regresie liniară simplă.

Pentru a obţine proprietăţile dorite ale estimatorilor regresiei. 4. i=1. cinci presupuneri (ipoteze) standard pentru modelul din populaţia generală: Ipotezele ce trebuie verificate: 1. y=a+bq. 3. y=a+bx a. Forma funcţională: yi =α + β xi + ε i. de obicei. r=1/x c. 6. 2. q=ln(x) .ε j)=0 ∀i≠ j Necorelarea între regresor şi erori: Cov(xi. se fac. y=a+br.n Normalitatea erorilor: ε i ∼ N(0. z=ex b. y=a+bz.ε j)=0 ∀i şi j Ipoteza 1: Forma funcţională a. 5.σ 2) Media zero a erorilor: μ(ε i)=0 ∀i Homoscedasticitatea: σ2ε i)=σ 2 constantă ∀i Non autocorelarea erorilor: Cov(ε i.

033 0.018 0.Modele ce pot fi linearizate Sau y=Ax ⇒ ln(y)=α +β ln(x) Forma generală: f(yi)= α +β g(xi)+ε Contra exemplu: liniar.028 0.008 0. Însă modelul y = A β +ε x nu mai poate fi transformat în model liniar. Dacă ipoteza de linearitate este verificată.043 0.048 0.003 0. variabila dependentă observată este suma a două elemente: .058 0. De exemplu modelul y = A βeε x β i y =α + 1 β +x nu poate fi transformat în model se transformă prin logaritmare în modelul liniar: ln(y)=ln(A)+β ln(x)+ε .038 0. Erorile Ipoteza de linearitate a modelului include şi aditivitatea erorilor. Forma modelului: y = α + β x+ ε .053 0.063 0.068 X -200 -400 Fig.023 0.1000 Y 1 a + b  x 800 a + be x 600 a + bx 400 200 a + b ln ( x ) 0 -1 0. .013 0.

este văzută ca suma efectelor . condiţionat de X. Această presupunere indică faptul că media valorilor Y. µ (Y/X = Xi) = α + β Xi.o variabilă aleatoare Ipoteza 2: normalitatea erorilor Se presupune că variabila aleatoare ε i este normal distribuită : Distribuţia de probabilitate pentru ε i Ipoteza 3: media erorilor este zero: μ(ε i)=0 ∀ i Este naturală atâta timp cât ε individuale. adică nu există variabile omise asociate cu regresia în populaţie.un termen nestochastic: α +β x . ea poate fi considerată ca o parte sistematică a regresiei: μ(ε )=µ ⇒ α + β x + ε = (α +µ ) + β x + (ε -µ ) media erorilor este acum nulă.. cu semne diferite. Dacă media erorilor este diferită de zero.

.Ipoteza 4 (de homoscedasticitate): Var(ε i)=σ valorile Xi 2 constantă ∀ i Dispersia reziduurilor în populaţie este constantă peste toate Functia de consum 1200 1000 800 consum 600 400 200 0 200 300 400 500 600 venit 700 800 900 1000 a) constantă b) constantă Dispersia reziduurilor a) constantă. b) constantă Discuţie: Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor mici.

Variabilele aleatoare ε µεiεj i sunt statistic independente una de alta. erorile estimate vor fi: . ci faptul că deviaţiile observaţiilor de la valorile lor aşteptate sunt necorelate.β xi Pentru orice valori estimate a şi b. i =1.α . i=1. Ipoteza 5: Non autocorelarea erorilor: μ(ε iε j)=0 ∀ i≠ j Această ipoteză nu implică faptul că yi şi yj sunt necorelate.variaţia cheltuielilor gospodăriilor în funcţie de venit sau de mărimea lor poate fi diferită.n Modelul estimat va fi scris: ∧ y i = a + bx i . Acest lucru înseamnă că eroarea asociată cu o valoare a variabilei Y nu are nici un efect asupra erorilor asociate cu alte valori ale lui Y. n Eroarea asociată unui punct i este: ε i = yi . adică = 0. nu există deci corelaţie între reziduuri. pentru i ≠ j. OBSERVAŢIE: De asemenea este convenabil a considera că erorile sunt independente şi normal distribuite cu medie zero şi variaţie constantă pentru obţinerea de rezultate statistice exacte. Estimarea parametrilor modelului de regresie clasic Parametrii necunoscuţi ai reacţiei stochastice sunt cei ce trebuie estimaţi: yi =α + β xi + ε i.

ei = yi . un criteriu natural este cel de maximizare a potrivirii modelului cu datele observate.bxi Pentru estimarea parametrilor α şi β pe baza datelor observate. deci de minimizare a erorilor observate: m ∑ei2 = m ∑( yi −a −bx i ) 2 in in i i Condiţiile de ordin 1 de minimizare a funcţiei sunt:  ∂ (∑ ei2 )  i  ∑ yi = n a+ (∑ xi )b =0  i i  ∂a ⇒   2  ∂ (∑ ei2 )  ∑ xi yi = (∑ xi )a + (∑ xi )b  i i i i =0  ∂b  a =      b =     y − bx n i ∑ yi i i ∑ xi ∑ xi yi n i ∑ xi i i = i ∑ xi yi − n x y 2 ∑ xi − n x i 2 2 ∑ xi ∑ xi Rămâne de verificat dacă este verificată condiţia de ordin 2. Matricea derivatelor parţiale de ordin doi trebuie să fie pozitiv definită: . adică soluţia găsită este un punct de minim.a .

3. ∂ 2 (∑ ei2 )  i  2 2  ∂ a  ∂ 2 (∑ ei2 )  i  ∂b∂a  ∂ 2 (∑ ei2 )   i   2n ∂a∂b   = ∂ 2 (∑ ei2 )  2∑ xi   i  i 2 2  ∂ b  2∑ xi  i  2 2∑ xi  i    2 n > 0  2 2∑ xi > 0  i  2 2 2 4n∑ xi − 4(∑ xi ) = 4n ∑ ( xi − x) > 0 i i  i Deci matricea este pozitiv definită.2 Modelul de regresie clasic Evaluarea validităţii modelului de regresie clasic Estimatorii a (intercepţia) şi b (panta) ai parametrilor α şi β sunt daţi de : n  n  n  y i ∑ x i2 −  ∑ x i  ∑ x i y i  ∑ i =1 i =1  i =1  i =1  a= 2 n n  n ∑ x i2 −  ∑ x i  i =1  i =1  n n n n n n ∑ x i y i −  ∑ x i  ∑ y i  ∑ x i y i − n x ⋅ y    i =1  i =1  i =1  = i =1 b= 2 n n n 2 2  2  ∑ xi − nx n∑ xi −  ∑ xi  i =1 i =1  i =1  .2.

înlocuind în ecuaţia : a ∑ x i + b ∑ x i2 = ∑ x i y i i =1 i =1 i =1 n n n a ∑ x i − x + b∑ x i − x i =1 i =1 n ( pe xi cu deviaţia ) n ( ) (x n i 2 = ∑ x i − x yi i =1 ( −x ) obţinem: ) Cum primul termen situat în partea stângă a ecuaţiei este egal cu zero. rezultă: ∑ x i − x yi i =1 n b= i =1 n ( ) ∑ xi − x n ( ) 2 = ∑ x i − x yi − y∑ x i − x i =1 ( ) n ∑ xi − x n ( i =1 ( ) ) 2 = i =1 ∑ x i − x yi − y i =1 n ( )( ) ∑ xi − x n ( ) 2 şi în final: i =1 ∑ x i − x yi − y ∑ xi − x n n ( )( ) = s xy s2 x b= i =1 ( n ) 2 Estimatorul a (intercepţia) poate lua valori negative sau pozitive.Se observă că obţinem din ecuaţia: n na + b ∑ x i = ∑ y i i =1 i =1 n n n împărţind prin n :   ∑ y i − b ∑ x i  i =1  i =1  a = y − bx = n şi. sxy este covarianţa între x şi y. . Estimatorul b (panta liniei drepte) numit şi coeficient de regresie are întotdeauna semnul indicatorului sxy.

Doi indicatori alternativi pot fi utilizaţi pentru a măsura calitatea ajustării pentru regresia statistică : Abaterea medie pătratică (eroarea standard) a reziduurilor (măsură absolută a calităţii ajustării pe baza regresiei în eşantion) Coeficientul de determinaţie (indicator relativ). variaţia (abaterea) totală ( y i − y ) poate fi împărţită în : ˆ abaterea neexplicată de model ( y i − y i ) şi ˆ abaterea explicată ( y i − y ). sunt asociate variabilei dependente y două medii: media totală ( y ) şi ˆ media condiţionată ( y i = a + bx i ). Este necesar să analizăm componentele indicatorilor de variaţie a lui y. astfel: .Linii de regresie cu a) pantă pozitivă c) pantă egală cu zero ˆ ∑ yi = ∑ yi i =1 n n b) pantă negativă i =1 În evaluarea validităţii modelului se verifică dacă variaţia lui x este un bun predictor pentru variaţia lui y. În aplicarea metodei regresiei.

ˆ ˆ y i − y = ( y i − y i ) + ( y i − y) ˆ Abaterea ( y i − y i ) nu poate fi explicată de linia de regresie. suma pătratelor abaterilor dato- rate regresiei. ambele valori yi şi rămâne constant ˆ yi se modifică. . y ˆ abaterea ( y i − y ) poate fi explicată. 2 ˆ 2 ∑ (yi − yi ) = ∆ e = 2 2 ˆ ∑ ( y i − y) = ∆ y / x i =1 = varianţa explicată. Abaterea valorilor individuale yi de la medie Prin ridicarea la pătrat a fiecărei abateri şi însumarea pentru toate observaţiile. deoarece când xi se schimbă. varianţa neexplicată. suma pătratelor abaterilor totale. obţinem: 2 2 ˆ 2 ˆ ∑ ( y i − y) = ∑ ( y i − y i ) + ∑ ( y i − y ) i =1 i =1 n n n i =1 Putem nota: 2 2 ∑ ( y i − y) = ∆ y n i =1 n i =1 n = varianţa totală. deoarece atunci când xi se modifică. suma pătratelor erorilor.

k = 1). atunci: se mai notează: ∆2 = ∆2 / x + ∆2 y y e Variaţia variabilei dependente y este definită în termeni de deviaţie de la valoarea ei medie: SST = ∑( yi − y ) 2 i yi = y i + ei = a + bx i + ei = y − b x + bx i + ei ⇒ yi − y = b( x − xi ) + ei ⇒ 2 2 2 2 ∑( yi − y ) = b ∑( xi − x ) +∑ei +2b ∑ei ( xi − x ) i i i i ∧ Deci: SST Variaţia totală = SSR + SSE = Variaţia de regresie + Variaţia reziduală Putem calcula şi discuta cei doi indicatori ai calităţii ajustării astfel : tabelul ANOVA este pentru testarea calităţii ajustării Tabelul ANOVA Suma pătratelor Grade de Media pătratelor Sursa libertate (dispersia variaţiei corectată) 0 1 2 3 n 2 ∆2y / x Datorată 2 k 2 ˆ i − y) ∆ y/x = ∑ (y sy/x = k i =1 regresiei 2 n ∆e 2 Reziduală n–k–1 se = ˆ ∆ 2e = ∑ ( y i − y i ) 2 Totală Unde: k reprezintă numărul variabilelor independente luate în consideraţie (pentru regresia liniară simplă.Vom avea. ∆2y = ∑ y i − y i =1 i =1 n ( ) n − k −1 ∆2 y n −1 2 n–1 s2 = y .

avem: i =1 ∑ yi − y n −1 n ( ) 2 = i =1 ˆ 2 ∑ ( y i − y) n −1 n + i =1 ˆ ∑ yi − y n −1 n ( ) 2 relaţie care poate fi scrisă ca n n ˆ ( y i − y ) 2 ∑ ( yi − yi ) 2 ∑ i =1 deoarece: n i =1 n −1 2 n = i =1 n −1 2 +b 2 ∑ (x n i −x n −1 ) ) 2 ˆ ∑ ( y − y ) = ∑ ( a + bx − a − b x ) i i =1 i = b 2 ∑ xi − x i =1 ( 2 abaterea medie pătratică a erorilor în eşantion este: ∆ 2e se = = n−2 i =1 ˆ ∑ ( yi − yi ) n−2 n 2 unde s2 e este un estimator nedeplasat al dispersiei reziduurilor 2 σε . prin exprimarea ponderilor dispersiilor (explicată şi reziduală) în dispersia totală este: ∆2 y ∆2 y = 1.Dacă se împart varianţele la (n – 1).00 = ∆2 / x y ∆2 y + ∆2 e ∆2 y Coeficientul de determinaţie este: R2 = ∆ 2y / x ∆ 2y = 1− ∆ 2e ∆ 2y ( ) = ∑ ( y − y) i =1 n i =1 ˆ ∑ yi − y i n 2 2 Raportul ∆2y / x / ∆2y reprezintă proporţia variaţiei totală care este explicată de linia de regresie. o mărime relativă a calităţii ajustării. Sau se poate scrie Coeficientul de determinare ca proporţia variaţiei explicată de modelul de regresie în variaţia totală: .

R2 = SSR ∈[ 0. Observaţii: 1. Coeficientul de determinaţie nu este ajustat cu gradele de libertate. 2. Aşadar. R 2 nu are nici o semnificaţie şi nu poate fi calculat. R2 poate fi interpretat ca procentul variaţiei lui y explicată de variaţia veriabilei x doar pentru cazul în care metoda celor mai mici pătrate este aplicată modelului liniar de regresie. obţinem valoarea . R2 reprezintă măsura în care variabila independentă. y =y . X. Pentru orice model coeficientul R2 poate fi calculat ca: . explică variaţia variabilei rezultative Y.1] SST ∧ R2 = 0 dacă b=0. caz în care erorile vor fi zero. În acest caz variabila x nu are putere explicativă. R2 = 1 dacă punctele determinate de observaţiile făcute asupra variabilelor x şi y se află toate pe o dreaptă. ajustată a coeficientului de determinaţie R =1− 2 R 2      ∆2 / n − k − 1 e ∆2 / n − 1 y Valoarea lui R 2 este întotdeauna mai mică decât valoarea lui R2. deci dacă ecuaţia de regresie este o dreaptă orizontală. În cazul în care toate valorile lui y se află pe o dreaptă verticală. Dacă utilizăm estimatorii nedeplasaţi s2 y şi 2 se .

R 2 =1 − i S yy ∑ei 2 unde S yy = ∑( yi − y ) 2 i .

Probleme rezolvate Exemplu : Modelul de regresie clasic I.3.58/0. Determinarea coeficientului de determinare .2 4= 87 1.3. La o variaţie a venitului cu o unitate monetară. II.58 + 0. Estimarea parametrilor Ecuaţiile normale pentru exemplul din primul paragraf privind consumul şi veniturile sunt:  7 .5 7 8 0 6 ⇒   7 0 .98 72 92 2 6 7 Deci: C = -67.47a + 97 9 57 2. consumul va varia în aceeaşi direcţie cu 0. În cazul exemplificat. deci singura interpretare ce poate fi dată este că va avea loc a consumul de la un nivel al venitului de: 67.39= 1 a3+ 80 4.98=69.98 V Interpretare: 1. valoarea termenului liber este negativă.47b 9 2  a −= 6 .2 3b9 2 b7= 0. iar consumul nu poate fi negativ. 2.98 unităţi monetare. Termenul liber se interpretează în general ca nivelul variabilei dependente pentru cazul în care variabila independentă este zero.

Pentru exemplul anterior se mai cunosc:
C = 9 ,4 ; 73 3 x = 7 ,2 89 4

Scc=64972,12; Sxx=67192,44; Sxc=65799,34 SST = Scc = 64972,12 SSR = b2Sxx = 0,979267*67192,44 = 64435,12 SSE = SST-SSR = 64972,12 - 64435,12 = 537 Deci: R2 = SSR/SST = 64435,13/64972,12 = 0,99173 Interpretare: 1. 99,17% din variaţia consumului este datorată variaţiei venitului. 2. 99,17% din variaţia consumului este explicată de modelul de regresie. III. Testarea coeficientului de determinare Tabelul ANOVA Sursa variaţiei Variaţia de regresie Variaţia reziduală Variaţia totală Măsura variaţiei 64435,12 537 64972,12 Numărul gradelor de libertate 1 8 9 Suma pătratelor 64435,12 67,124 7219,12

Fcalc = 64435,12/67,124 = 959,94 F0,95;1,8 = 5,32 Fcalc > F0,95;1,8 deci R2 este reprezentativ.

Bibliografie generală

1.

Andrei, T. - Statistică şi econometrie Editura Economică, Bucureşti, 2004.

2.

Bourbonnais R , Econometrie , Ed. Dunod , Paris , 1998

3.

Dormont B , Introduction a l’econometrie , Ed. Montchrestien , Paris , 1999

4.

Florea

I.(coordonator),

Culegere

de

modele

econometrice, Ed. Muntele Sion,2000.
5.

Green W H , Econometric Analysis , Ed. Pretince Hall , Londra , 1997

6.

Giraud R , Chaix N , Econometrie , Ed. P.U.F. , Paris , 1989

7.

Gourieroux C , Monfort J , Statistique et modeles econometriques , Ed. Economica , Paris , 1989

8.

Iacob, A.I., Tănăsoiu, O. - Modele econometrice Volumul I, Ed. II rev., Ed. ASE, Bucureşti, 2005.

9.

Iacob, A.I., Tănăsoiu, O. Econometrie, Studii de caz, Ed. ASE, Bucureşti, 2005.

Economică. Deva. 1997.. Bucureşti. Ed. Econometrie pentru economişti. 11. Ed. Pecican E.. Econometrie. Intercredo. Pecican..10. 2004.. . E.

Sign up to vote on this title
UsefulNot useful