Professional Documents
Culture Documents
ECONOMETRIE
Titular curs:
1
Cuprins
Capitolul 1 Introducere în econometrie
1.1 Obiective 3
1.2 Prezentare sintetică 3
1.2.1 Scurt istoric privind apariţia şi dezvoltarea econometriei 3
1.2.2 Definiţiile econometriei 4
1.2.3 Locul şi rolul econometriei în sistemul ştiinţelor 6
economice
1.2.4 Noţiuni şi concepte fundamentale ale econometriei 8
1.3 Întrebări 15
1.4 Probleme rezolvate 16
1.5. Probleme propuse 37
1.6. Bibiliografie 40
Capitolul 2 Testarea ipotezelor statistice
2.1 Obiective 41
2.2 Prezentare sintetică 41
2.2.1 Concepte şi erori în testarea ipotezelor statistice 41
2.2.2. Testarea ipotezei privind media populaţiei generale (μ) 45
pentru eşantioane de volum mare
2.2.3 Testarea ipotezei privind diferenţa dintre două medii 49
pentru eşantioane de volum mare
2.2.4.Testarea ipotezei privind media populaţiei generale (μ) 51
pentru eşantioane de volum redus
2.2.5.Testarea ipotezei privind proporţia populaţiei pentru 52
eşantioane mari
2.2.6. Testarea ipotezei privind diferenţa dintre două medii 53
pentru eşantioane de volum redus
2.2.7. Testarea ipotezei privind dispersia unei populaţii 55
2.2.8.Testarea ipotezei privind raportul dintre două dispersii 56
2.3 Întrebări 58
2.4.Probleme rezolvate 60
2.5.Bibiliografie 66
Capitolul 3 Modelul de regresie
3.1 Obiective 67
3.2 Prezentare sintetică 67
3.2.1 Specificarea unui model de regresie 67
2
3.2.2 Modelul de regresie clasic 67
3.3 Întrebări 74
3.4 Probleme rezolvate 79
3.5.Bibiliografie 80
3
Capitolul 1
Introducere în econometrie
4
secolului XIX, care desemna cercetările biologice ce utilizau
metodele statisticii matematice.
Dar nu cei care au introdus termenul şi au înfiinţat Societatea de
Econometrie au şi „inventat" această disciplină.
Sub aspect istoric, studierea cantitativă a fenomenelor economice
este mult mai veche. Printre precursorii econometriei moderne pot fi
citaţi: F. Quesnay, W. Petty, Gregory King, A. Cournot, Leon Walras, E.
Engel, A. Marshall, R. A. Fisher, K. Pearson şi alţii.
În perioada contemporană, contribuţii importante la dezvoltarea
econometriei au fost aduse de:
- în domeniul analizei economice a cererii: M.
Friedman,T. Haavelmo, R. Stone, H. Wald, ş.a.;
- în domeniul funcţiilor de producţie: C. W. Cobb, P. H. Douglas,
K. J. Arrow, G. Tintner;
- în domeniul modelelor macroeconomice: A. S. Goldberger,
O. Onicescu, V. Kantarevici, L. R. Klein, J. Tinbergen, H. Theil1;
- în domeniul metodelor de analiză a datelor sau al econometriei
„fără modele": T. W. Anderson, J. P. Benzécri, H. Hotelling, R. A. Fisher
şi alţii.
În momentul actual, impulsionată puternic de revoluţia
tehnico-ştiinţifică - cu realizări de vârf în domeniul calculatoarelor
electronice - econometria a devenit un instrument metodologic de bază,
indispensabil teoriei şi practicii economice pentru investigarea riguroasă a
fenomenelor şi proceselor economice.
1
Numele scrise cu italice îi desemnează pe laureaţii Premiului Nobel în econometrie
5
1.2. 2 Definiţiile econometriei
7
prima, deoarece existenţa unei teorii economice nu este necesară,
iar ultimele două, fiindcă nu permit aplicarea metodelor inducţiei
statistice.
c) Definiţia extinsă a econometriei, promovată de
economiştii din ţările anglo-saxone, ţine seama de puternica
dezvoltare, apărută după 1950, a metodelor cercetării operaţionale:
teoria optimului, teoria stocurilor, teoria grafelor, teoria deciziilor,
teoria jocurilor, etc.
Prin econometrie, în sensul larg al termenului, se înţelege
econometria, definită în mod restrictiv, adică, include domeniile
menţionate atunci când ea este înţeleasă în sens restrictiv, la care se
adaugă metodele cercetării operaţionale. În prezent, în domeniul
econometriei se includ şi tehnicile moderne de analiză a datelor sau
analiza marilor tabele.
Deoarece încă nu s-a cristalizat o concepţie unitară privind
„frontierele" econometriei, în manualele sau tratatele de
econometrie, autorii, de regulă, îşi menţionează concepţia pe baza
căreia şi-au structurat lucrările.
În ţara noastră, atât în literatura de specialitate, deşi rareori se
fac precizări exprese, cât şi prin structura planurilor de învăţământ
de la facultăţile economice, econometria este concepută şi aplicată
ca metodă generală de investigare cantitativă a fenomenelor şi
proceselor economice -adică, în accepţiunea largă a termenului.
8
Un domeniu mai puţin abordat, atât teoretic, cât şi practic, îl
constituie metodele econometriei, în sensul restrictiv al
termenului, respectiv modelele aleatoare (stochastice).
Modelele deterministe, utilizate în mod curent şi de multă
vreme în teoria şi practica economică din ţara noastră, sunt de multe
ori inadecvate pentru a explica şi, mai ales, pentru a prognoza
pertinent evoluţia fenomenelor, proceselor sau sistemelor
economice, elemente dinamice prin natura lor.
De asemenea, în studiile mult mai recente, se insistă asupra
faptului că studiul seriilor de timp privind evoluţia fenomenelor
economice nu poate fi independent de teoria economică. Se au în
vedere, în acest sens, nu atât determinarea şi extragerea
econometrică a tendinţei, cât şi aspectele legate de efectul întârziat
în timp, propagarea impulsului unor variabile exogene asupra
variabilei prognozate, natura oscilaţiilor de diferite frecvenţe etc.
Acestea sunt motivele care au determinat ca modelele dinamice -
bazate pe analiza evoluţiei în timp a fenomenelor economice - să-şi
găsească locul în arsenalul modelelor econometrice prezentate în
acest curs.
10
economice constituie, în general, limitele econometriei în sistemul
ştiinţelor economice.
De remarcat că raporturile econometriei cu ştiinţele economice nu
sunt numai de dependenţă.
Într-adevăr, un model econometric nu se poate elabora dacă nu s-a
constituit o teorie economică a obiectului cercetat. Similitudinea sa
formală cu obiectul economic investigat depinde de nivelul de
abstractizare a teoriei, de definirea univocă şi operaţională a noţiunilor şi
categoriilor economice, de scopurile urmărite de teoria economică -
scopuri euristice sau de dirijare privind obiectul studiat.
Modelul astfel construit reprezintă o verigă intermediară între
teorie şi realitate. El reprezintă o cale de confruntare a teoriei cu
practica, singurul mod de experimentare pe baza căruia ştiinţa
economică îşi poate fundamenta ipotezele, din moment ce obiectul său
de cercetare poate fi numai observat, nu şi izolat şi cercetat în
laborator.
Prin această experimentare, mijlocită de modelul econometric,
ştiinţele economice validează, renunţă sau elaborează metode noi, îşi
confruntă problemele de semantică şi semiotică economică,
îmbogăţindu-şi în felul acesta sistemul de informaţii privind structura şi
evoluţia obiectului economic.
În prezent, tipologia metodelor econometrice utilizate de ştiinţele
economice este extrem de vastă. Folosirea din ce în ce mai amplă a
acestor modele la investigarea fenomenelor economice se datorează
11
progreselor însemnate făcute în domeniul metodelor de estimare a
parametrilor modelelor şi al testelor de verificare pe care se
fundamentează acestea şi, nu în ultimul rând, al utilizării
calculatoarelor electronice care permit rezolvarea operativă a celor
mai complexe modele econometrice.
Particularizând legăturile econometriei cu unele dintre disciplinele
economice, este necesar să subliniem corespondenţa dintre modelarea
econometrică şi previziune. Previziunea macro sau microeconomică
reprezintă un domeniu care utilizează în mare măsură rezultatele
simulării şi, mai ales, ale predicţiei econometrice. Activitatea de
previziune a economiei este aceea care „oferă" o serie de elemente
utile elaborării modelului privind, îndeosebi, etapa de specificare a
acestuia. În această etapă, previziunea defineşte variabilele endogene
(rezultative) şi pachetul variabilelor exogene corespunzătoare
obiectivelor urmărite în funcţie de informaţiile statistice existente.
Econometria, la rândul ei, contribuie la obţinerea variantelor
economice, oferind informaţii cu privire la comportamentul
variabilelor endogene în diverse alternative de acţionare a pârghiilor
economice. În acest fel, previziunii economice i se oferă o perspectivă
în legătură cu ceea ce s-ar putea întâmpla în viitor, fie şi în linii mari, în
raport cu diferitele variante ale politicii economice care ar putea fi
aplicate.
Menţionăm, de asemenea, legătura econometriei cu sistemul
financiar-contabil, domeniu în care modelarea pătrunde tot mai mult -
12
vezi modelele ARCH. De asemenea, trebuie remarcat faptul că, la
elaborarea modelelor econometrice, se recomandă, cu o tot mai mare
insistenţă, introducerea relaţiilor financiar-bancare, ca fiind deosebit de
semnificative pentru descrierea mecanismelor economice.
Domeniul cooperării economice internaţionale, ca, de altfel, şi cel
privind comerţul interior, domeniu în care previziunile sunt greu de
realizat, altfel decât cu ajutorul metodelor statistice, reprezintă, de
asemenea, sectoare ale economiei ce pot beneficia de rezultatele
econometriei în ceea ce priveşte planificarea şi eficientizarea
activităţilor desfăşurate. Este totodată necesar să subliniem frecvenţa
tot mai mare a aplicării metodelor econometrice în lucrări din domeniul
biologiei, medicinei, demografiei şi, în special, în domeniul
marketingului, managementului sau viitorologiei.
În concluzie, se poate reţine ideea că metoda econometriei este
metoda modelării sau metoda modelelor. Modelul econometric - expresie
formală, inductivă a unei legităţi economice - reprezintă un mijloc de
cunoaştere a unui obiect economic, iar modelarea econometrică este o
metodă care conduce la obţinerea de cunoştiinţe sau informaţii noi
privind starea, structura (conexiunile dintre elemente) şi evoluţia unui
proces sau sistem economic.
14
economic de pe poziţia teoriei economice, au întotdeauna o finalitate
practică, operaţională, ele devenind instrumente de control şi dirijare,
de simulare şi de previziune a fenomenelor economice.
VARIABILELE care formează structura unui sistem
econometric, după natura lor, pot fi:
a) variabile economice;
b) variabila eroare (aleatoare), u;
c) c) variabila timp, t.
a) Variabilele economice, de regulă, se împart în variabile
explicate, rezultative sau ENDOGENE, Yi, i = 1,n , şi variabile
explicative, factoriale sau EXOGENE, Xj, j = 1,k, independente de
variabilele endogene Yi ; (n = numărul variabilelor rezultative; k =
numărul variabilelor factoriale). În cazul modelelor de simulare sau de
prognoză, variabilele Xj se mai împart în variabile exogene
predeterminate (variabile de stare a sistemului -c a p a c i t a t e a d e
p r o d u c ţ i e a u n e i î n t r e p r i n d e r i , s a u c u lag - xt-1, yt-1) şi
variabile instrumentale sau de comandă economică (dobânda,
impozitul pe profit etc.)
b) Variabila ALEATOARE, u, sintetizează ansamblul
variabilelor, cu excepţia variabilelor Xj, care influenţează variabila
endogenă Yi, dar care nu sunt specificate în modelul econometric.
Aceste variabile (factori), pe baza ipotezelor teoriei economice, sunt
considerate factori întâmplători (neesenţiali), spre deosebire de
15
variabilele Xj, care reprezintă factorii determinanţi (esenţiali) ai
variabilei Yi.
De asemenea, variabila eroare reprezintă eventualele erori de
măsură - erori întâmplătoare şi nu sistematice - conţinute de datele
statistice privind variabilele economice.
Pe baza acestor premise economice se acceptă că variabila
aleatoare „U" urmează o lege de probabilitate L(u), în acest scop
formulându-se o serie de ipoteze statistice cu privire la natura
distribuţiei acestei variabile, ipoteze statistice care vor trebui testate cu
teste statistice adecvate fiecărei ipoteze.
c) Variabila TIMP, t, se introduce în anumite modele econometrice
ca variabilă explicativă a fenomenului endogen Yi, imprimându-se
acestora un atribut dinamic, spre deosebire de modelele statice.
Deşi timpul nu poate fi interpretat ca variabilă concretă
(economică), se recurge la această variabilă explicativă (fictivă) din două
motive:
- în primul rând, timpul, ca variabilă econometrică,
permite identificarea unor regularităţi într-un proces evolutiv, ceea ce
constituie un prim pas spre specificarea precisă a unor variabile care
acţionează în timp;
- în al doilea rând, el reprezintă măsura artificială a acelor
variabile care acţionează asupra variabilei Y care, fiind de natură
calitativă, nu pot fi cuantificate şi, ca atare, nici specificate în
modelul econometric.
16
Un exemplu cunoscut în acest sens îl constituie funcţia de
producţie Cobb -Douglas cu progres tehnic autonom:
Q = A · Kα · Lß · ect · u (1.3.1)
unde:
Q = volumul fizic al producţiei;
K = capitalul;
L = forţa de muncă;
e = numărul natural;
t = timpul;
u = variabilă aleatoare;
A, α, β şi c = parametrii funcţiei,
c estemăsura econometrică a influenţei progresului tehnic asupra
volumului producţiei.
17
false sau afectate de erori de măsură, el va căpăta aceste deficienţe,
fiind compromis sub aspect operaţional.
Deoarece problema autenticităţii datelor economice ţine de
domeniul statisticii economice, ne vom rezuma numai a aminti că datele
statistice care privesc variabilele economice specificate în model trebuie
să fie culese fără erori sistematice de observare şi de prelucrare,
îndeplinind condiţiile de omogenitate. Omogenitatea datelor presupune:
- colectarea lor de la unităţi statistice omogene;
- reprezentarea aceloraşi definiţii şi metodologii de calcul cu
privire la sfera de cuprindere ale acestora în timp sau în spaţiu;
- descrierea evoluţiei fenomenelor într-un interval de timp în care
nu s-au produs modificări fundamentale privind condiţiile de
desfăşurare a procesului analizat;
- exprimarea variabilelor în aceleaşi unităţi de măsură, condiţie
care se referă, în mod special, la evaluarea indicatorilor economici în
preţuri comparabile sau preţuri reale.
„Materia primă" pentru calcule economice o constituie seriile
cronologice (serii de timp sau serii dinamice), mai rar seriile teritoriale,
ale variabilelor economice respective, preluate sau construite pe baza
băncii de date statistice existente.
O serie cronologică se construieşte prin observarea variabilelor Y
şi X pe perioade egale de timp (t = 1,2,.., T, t reprezentând luni,
trimestre, ani) la aceeaşi unitate economică:
18
T 1 2 ... T
Xt x1 x2 ...
xT
yt y1 y2
... yT
Xi x1 x2
... xn
Yi y1
y2 ...
yn
19
- media aritmetică a variabilei X
−
1 n
x = M ( x) = n ∑i=1 xi (1.3.2)
1 n
σ σ ∑ ( xi − x ) 2
2 2
x
= x
= M (x )= (1.3.3)
n i =1
−
*
2) Valorile centrate : x =x −x
i i
Aceste valori sunt tot mărimi concrete, dar ele aparţin sistemului
numerelor reale având atât valori pozitive cât şi negative.
Se poate demonstra uşor că aceste valori centrate au media egală
cu zero, iar dispersia lor este egală cu dispersia valorilor reale:
−
1
∑ xi x ) = 0
*
M (x ) = ( − (1.3.4)
n
20
−
1 1
M [(x ) ] = ∑ ( x ) = ∑ ( xi − x) 2 = M ( x )
* 2 * 2 2
(1.3.5)
n n
** x −x
x = i
i
σ x
**
M (x ) =
1
∑ x−x=0
i (1.3.6)
n σ x
2
−
σ
2
1 x
M [( x ) ] = ∑ i
** 2 − x
= 2 =1
x
(1.3.7)
n σx σ
x
2
În plus faţă de aceste două proprietăţi L(x**) = N(0;1) , abaterile
standard sunt mărimi abstracte (adimensionale). Aceste calităţi conduc,
atât la diminuarea calculelor statistice cu aceste valori, cât şi la
x
** = 1 ( xi − x)
σx
2
Relaţia L(x**) = N(0;1) se citeşte: variabila urmează legea de probabilitate
normală având media egală cu zero iar abaterea medie pătratică este egală cu unu (legea normală, centrată şi
redusă).
21
efectuarea de comparaţii între distribuţiile mai multor fenomene
economice de naturi diferite.
Un model econometric poate fi format dintr-o singură relaţie sau
dintr-un sistem de relaţii statistice. Aceste relaţii pot fi: relaţii de
identitate sau deterministe, relaţii de comportament, relaţii tehnologice
şi relaţii instituţionale.
Relaţiile de identitate sunt de tipul ecuaţiilor de balanţă folosite în
„Sistemul de balanţe ale economiei naţionale"
Relaţiile de comportament sunt acele ecuaţii stochastice care
reflectă şi modelează un proces de luare a deciziei, care încearcă să
descrie răspunsul variabilei endogene Y, sub forma deciziei, la un set de
valori ale variabilelor exogene. De exemplu, într-un model
macroeconomic, relaţiile de comportament se referă la dependenţe
privind consumul, investiţiile, importul şi exportul, sistemul de preţuri,
cererea monetară, etc.
22
exemplu, ecuaţiile care explică stabilirea impozitelor sau a cotizaţiilor
în funcţie de venit.
Tipologia modelelor econometrice este extrem de vastă. Totuşi, un
model econometric poate fi construit prin intermediul unei singure
ecuaţii de comportament, tehnologice sau instituţionale, sau cu ajutorul
unui sistem de ecuaţii de genul celor patru relaţii, menţionate mai sus,
denumite modele cu ecuaţii multiple.
Testele statistice3 sunt instrumente de lucru indispensabile
investigaţiei econometrice. Necesitatea utilizării acestora este
determinată de faptul că demersul econometric constă într-o înşiruire
logică de ipoteze privind semnificaţia variabilelor exogene, a calităţii
estimaţiilor obţinute, a gradului de performanţă a modelelor
construite. Acceptarea sau respiungerea ipotezelor formulate în
econometrie se poate face cu ajutorul mai multor teste, cele mai uzuale
fiind: testul χ2, testul t, testul F etc.
Pe lângă aceste teste statistice, în practica curentă, în diverse
domenii, se foloseşte frecvent un test denumit „testul erorii". În general,
aplicarea acestui test presupune compararea a două valori:
0 = valoarea observată sau estimată;
T = valoarea teoretică, aşteptată sau prognozată.
3
Vezi- ipoteză statistică, test, eroare de gradul 1 şi gradul 2, preg de semnificaţie, nivel de semnificaţie- Dicţionar
statistic economic, D.C.S., Bucureşti, 1969
23
0 −T
- eroarea relativă, er =
T
* 100
4
Stabilindu-se arbitrar o valoare absoluta (Ea) sau relativa (Er) de
echivalare a celor doua valori, (0) si (T), regula de (alegere) decizie a
celor doua ipoteze este urmatoarea:
24 este acceptată ipoteza H0 dacă Ea ≤ ea sau Er ≤ er . → cele două
valori, (0) şi (T), sunt echivalente, adică diferenţele dintre ele sunt
întâmplatoare şi nu sistematice;
24 este acceptată ipoteza H1 dacă Ea > ea sau Er > er . → cele doua
valori, (0) si (T), diferă semnificativ si nu pot fi considerate ca
echivalente, respectiv extrase din aceeaşi urnă sau dintr-o colectivitate
omogenă.
Acest test al erorii este utilizat în mod curent în domeniul analizei
statistico-economice a variatiei în timp şi/sau în spaţiu a unui fenomen
economic, dar poate fi aplicat şi în domeniul econometriei, dar cu
discernamânt şi nu în mod excesiv.
4
Un astfel de test şi criteriu de decizie se utilizează în comerţul cu produse îmbuteliate sau ambalate pentru care, de
regulă, criteriul de decizie este de ± 5% din volumul sau greutatea , T, a ambalajului
24
1.3. Întrebări
25
6. Care sunt cele două motive pentru care se recurge la
variabila timp?
26
- furnizorul B a trimis 600 de piese din care 70 au fost rebuturi.
Conducerea societăţii ar dori să renunţe la furnizorul A pe
motivul unei calităţi inferioare a produselor sale în raport cu cele ale
furnizorului B. Este corectă această decizie?
Rezolvare:
Tabelul 1.
A 60 340 400
ui (x )
B 70 530 (n )ij 600
Total ( N )j 130 870 1000 (N)
unde:
X = { x }, i = 1, k variabila independentă,
i
x 1 = furnizorul A,
x2 = furnizorul B,
Y = {y } , j = 1, m variabila dependentă,
j
y 1 = piese rebut,
y = piese bune,
2
27
n = frecvenţele condiţionate ale variabilei Y, de exemplu:
ij
x = 1 x2 = 0 y =1 y2 = 0
X : 1 Y : 1
400 600 130 870
y =1 y2 = 0 y =1 y2 = 0
y A : 1 y B : 1
340 70 530
60
N= ∑
i
N =∑ N =∑
i
∑ n = numărul total al observaţiilor.
i.
j
.j
j
ij
N i. N. j
n =
ij
k
= ct sau n = ij
m
=ct ;
28
b)o dependenţă strictă între cele două variabile dacă frecvenţele
condiţionate n ij se distribuie numai pe diagonala principală a tabelului
(corelare pozitivă, x 1 cu y 1 şi x2 cu y ) sau numai pe diagonala 2
x1 − x 2
t =
c σ x2 σ x2 ≥ t α,
1
+ 2
n1 −1 n 2 −1
dacă:
29
x1 − x 2
t =
c σ x2 σ x2 < tα
1
+ 2
n1 −1 n 2 −1
unde:
ta = argumentul distribuţiei normale, dacă n ≥3 0 , sau
argumentul distribuţiei Student, dacă n < 30;
α = pragul de semnificaţie (riscul) cu ajutorul căruia se alege
decizia corectă; de regulă, în economie se lucrează cu un prag de
semnificaţie de 0,05 (5%) sau, cel mult, de 0,01 (1%).
În cazul de faţă, aplicarea acestui test constă în
efectuarea următoarelor calcule:
- calculul procentului mediu al rebuturilor pe fiecare furnizor:
n 60 n 70
f A = N11 = 400 = 0,15 sau 15% f B = N21 = 600 = 0,1167 sau
1. 2.
11,67%
- calculul dispersiilor:
σ A2 = f A (1 - f A ) = 0,15 ∗ 0,85 = 0,1275
σ B2 = f B (1 - f B ) = 0,1167 ∗ 0,8833 = 0,1031
- alegerea pragului de semnificaţie α şi preluarea valorii acestuia
din tabelul distribuţiei respective; pentru α = 0,05,din tabela
distribuţiei normale se preia valoarea t 0 , 05 = 1,96 .
- interpretarea testului:
Deoarece t = 1,5 < t
c 0 , 05 = 1,96 rezultă că între calitatea
pieselor livrate de cei doi furnizori, cu o probabilitate de 0,95 (95%), nu
se poate accepta o diferenţă semnificativă şi, ca atare, nu este corectă
decizia de a se renunţa la furnizorul A pe motivul unei mai slabe calităţi
a pieselor.
b) Testul χ2
α = pragul de semnificaţie;
(n ij − nij∗ ) 2
χc2 ∑ ∑
i j
nij∗
=
31
unde:
nij = frecvenţele reale, i = 1,2, j =1,2;
N i. N . j
n = ∗
ij
N
N 1. N .1 400 ∗130
n 1∗1 = N
= 1000
= 52
N 1. N .2 400 ∗ 870
n 1∗2 = N
= 1000
= 348
N 2. N 1 600 ∗130
n ∗21 = N
=
1000
= 78
N 2. N .2 600 ∗ 870
n ∗22 = N
=
1000
= 522
2 2 (n − nij∗ ) 2
∑∑
ij
χc2 i =1 j =1 nij∗
=
32
- dacă χc2 ≥ χa2;v , rezultă că cele două variabile X şi Y nu sunt
independente.
Deoarece χc2 2,36 < χ02, 05 ;1 =3,84, rezultă că cele două variabile
=
1 −θ 2 1 1 1 1
σ0 = + + +
2 n11 n12 n21 n22
33
Pentru cazul analizat, valorile acestor indicatori sunt:
60 ∗ 530 − 340 ∗ 70 31800 − 23800
θc = = = 0,1437
60 ∗ 530 + 340 ∗ 70 31800 + 23800
1 − 0,0207 1 1 1 1
σθ = + + + = 0,0926
2 340 60 530 70
34
În urma efectuării unui sondaj statistic s-au obţinut următoarele date
privind distribuţia pe ramuri ale economiei naţionale a şomerilor, grupaţi
pe trepte de calificare:
Tabelul 1
Rezolvare:
35
Deoarece frecvenţele condiţionate nij nu sunt nici constante pe liniile
tabelului şi nici distribuite numai pe rubricile diagonalei principale sau
secundare, distribuţia acestora arată că poate fi acceptată ipoteza unei
dependenţe statistice între cele două variabile. În acest caz, acceptarea
sau respingerea ipotezei de dependenţă statistică dintre cele două
variabile se poate face cu ajutorul testului χ2 . Utilizarea acestui test
presupune următoarele operaţii:
- preluarea valorii teoretice a variabilei χ2 din tabel în funcţie de
un prag de semnificaţie α şi de numărul gradelor de libertate
ν = ( k −1)( m −1), respectiv pentru α = 0,05 şi ν = (3-1)(3-1)=4 din
tabelă rezultând χ 2
0 , 05 ; 4 = 9,94 , iar pentru α = 0,01, χ02, 01 ; 4 =13 ,3 .
χ =∑ ∑
2 ij
c
i j nij∗
N i. N. j
nij∗ =
N
Pe baza datelor din tabel, aceste frecvenţe teoretice sunt egale cu:
36
∗ N 1. N .1 800 ⋅ 700 ∗ N 1. N .2 800 ⋅ 450
n11 = = = 400 n12 = = = 257
N 1400 N 1400
∗ N 3. N .3 400 ⋅ 250
n33 = = = 71
N 1400
χ c2 =
( 500 − 400 ) 2 + ( 200 − 257 ) 2 + (100 − 143) 2 + (100 − 100 ) 2 +
400 257 143 100
+
( 50 − 64) 2 + ( 50 − 36 ) 2 + ( 200 − 200 ) 2 + ( 200 − 129 ) 2 + (100 − 71) 2
= 160
64 36 200 129 71
37
C. Caz privind asocierea dintre o variabilă calitativă
independentă şi o variabilă numerică dependentă
Tabelul.3.
Rezolvare:
38
de dependenţă dintre cele două variabile;
- a doua etapă urmează numai în cazul acceptării ipotezei de
dependenţă între variabile şi necesită alegerea tipului de pneu cu cea
mai mare rezistenţă la uzură; se deduce uşor că în cazul
independenţei dintre cele două variabile, rezistenţa la uzură nu
depinde de tipul pneului, întreprinderea putând utiliza oricare dintre
ele.
O astfel de problemă poate fi rezolvată cu ajutorul mai
multor procedee statistice - testul χ2 , testul diferenţei dintre două
medii şi metoda analizei variaţiei.
Deoarece primele două procedee au fost deja expuse (vezi
problemele A şi B) şi, în plus, acestea necesită calcule suplimentare,
pentru etapa a doua recomandăm abordarea unor probleme de acest tip cu
ajutorul metodei analizei variaţiei.
Metoda analizei variaţiei se fundamentează pe discuţia următoarelor
distribuţii:
yj
-distribuţia marginală a variabilei Y : , j = 1, m;
N . j
yj
X : Yxi :
n , i = 1, k , j = 1, m.
ij
∑ (y ) ( )
k m
V02 = ∑ − y 0 nij = ∑ y j − y 0 N . j
2 2
j
i =1 j =1 j
unde:
∑ ∑yi j
j nij ∑y j
j N. j ∑y N i i.
y0 = = = i
∑ ∑ni j
ij N N
40
Se poate demonstra că între cele trei mărimi există relaţia:
V02 = V x2 + Vu2
V x2 Vu2
X 2 % şi a factorilor întâmplători u 2 % la explicarea variaţiei totale.
V0 V0
V x2 Vu2
100= V 2 ⋅ 100 + V 2 ⋅ 100
0 0
V x2 Vu2
Indicatorul R=
V02
= 1 −
V02
poartă numele de raport de
0 ⇒ variabile independen te
↑⇒ corelatie slab ă
Dac ă R = 0,5
↓⇒ corelatie puternic ă
1 ⇒ variabile
strict dependente
41
Dacă datele provin dintr-o cercetare selectivă, înainte de a explica
variaţia lui Y şi a interpreta valoarea raportului de corelaţie empirică
va trebui să se verifice semnificaţia rezultatelor. Testarea
semnificaţiei rezultatelor se face cu ajutorul testului “F” - testul Fisher-
Snedecor.
Rezultatele se consideră semnificative (R este semnificativ diferit
de zero) dacă există inegalitatea: Fc ≥ Fα;v1 ;v2
V 2x
Fisher-Snedecor;
pneurile de tip A.
Fie: k = mărimea intervalului de grupare, k=5;
a= mărimea centrului de interval cu frecvenţa maximă, a=37,5.
42
k = 5, a = 37,5
Tabelul. 4
20-25 22,5 2 -3 -6 18
25-30 27,5 8 -2 -16 32
30-35 32,5 20 -1 -20 20
35-40 37,5 40 0 0 0
40-45 42,5 20 1 20 20
45-50 47,5 10 2 20 40
Total - 100 - -2 130
43
yj −a
∑ n1 j
yA = k k +a =
−2
⋅ 5 + 37,5 = 37,4
∑ n1 j 100
2
yj −a
∑ k n1 j
σ A2 = ⋅k2 − yA −a( ) 2
=
130
⋅ 25 − ( 37,4 − 37,5)
2
∑ 1j
n 100
pneurile de tip B.
k = 5, a= 32,5 Tabelul 5
km parcurşi)
20-25 22,5 17 -2 -34 68
25-30 27,5 13 -1 -13 13
30-35 32,5 40 0 0 0
35-40 37,5 20 1 20 20
40-45 42,5 8 2 16 32
45-50 47,5 2 3 6 18
Total - 100 - -5 151
−5
yB = ⋅ 5 + 32 ,5 = 32 ,25
100
151
σ B2 = ⋅ 25 − ( 32 ,25 − 32 ,5) = 37 ,75 − 0,06 = 37 ,69
2
100
- calculul rezistenţei medii la uzură (y0 ) şi al dispersiei (σ 02 ) pe
ansamblul celor două tipuri de pneuri (distribuţia marginală a variabilei
Y).
Tabelul 6
y j −a
2
y j −a
k N . j
k N. j
Rezistenţa la yj N. j yj −a
k
uzură
(1000 km
parcurşi)
20-25 22,5 19 -2 -38 76
25-30 27,5 21 -1 -21 21
30-35 32,5 60 0 0 0
35-40 37,5 60 1 60 60
40-45 42,5 28 2 56 112
45-50 47,5 12 3 36 108
Total - 200 - 93 377
yj −a
∑ y j N. j ∑
k
N. j
93
y0 = = k +a = ⋅ 5 + 32,5 = 34,825
∑ N. j ∑ N.j y − a 2 200
∑ ( 2
y j − y 0 N. j ) ∑ j
k
N. j
σ0 =
2
= k 2 − y0 − a
2
( )
2 377
N ∑ N. j
σ0 = ⋅ 25 − ( 34,825 − 32,5) 2 = 47 ,125 − 5,406 = 41,719
200
- calculul varianţelor:
• Varianţa totală
V02 = ∑ ∑( y ) (
− y 0 nij = ∑ y j − y 0 )
2 2
j N . j = Nσ 02
i j j
(
V 2x= ∑ y i − y 0 ) 2
N i. = ( 37 ,4 − 34 ,825 ) ⋅100 + ( 32 ,25 − 34 ,825 ) ⋅100 = 1326 ,13
2 2
• Varianţa reziduală:
∑(y )
2
Vu2 = ∑ − y i nij = ∑ σ i2 N i = 32,49 ⋅ 100 + 37,69 ⋅ 100 = 7018
2
j
i j 1=1
Tabelul 7
Sursa Măsura Nr. Dispersi Valoarea testului
Fsc 2 Fα;v1; ;v2
de variaţiei grade a Fc = 2
y/x
Varian V x2 = ∑ y i − y 0 ( ) 2
N i. s2
=
V x2 su
F0,05;1;198=3,8
k −1 = 37 ,42
y/x
= 1326 ,13
ţa k-1=1 = 1326 ,13 9
dintre
grupe F0,01;1;198=6,7
6
Varian ∑( y ) 2
=∑
2
V 2
− yi nij V
u j s u2 = u
i j
N −k
ţa = 7018 N- = 35,44
rezidu k=198 - -
ală
Varian (
V02 = ∑∑ y j − y 0 ) 2
nij
i j
= 8343 ,8
ţa N- - - -
totală 1=199
Deoarece testul Fisher-Snedecor arată că rezultatele obţinute nu
sunt întâmplătoare, cu un prag de semnificaţie de 1%
FC = 37 ,42 > F0 , 01 ;1;198 = 6,76 , ci sistematice, se vor calcula contribuţia
relativă a factorului X - marca pneurilor, la explicarea variaţiei variabilei
V x2
Y 2 % şi raportul de corelaţie empirica (R):
V0
V x2 1326,13
2
⋅ 100 = ⋅ 100 = 15,89%
V0 8343,8
V x2 1326,13
R= 2
= = 0,399
V0 8343,8
Tabelul 8
Grupe de Grupe de societăţi după profitul Total
societăţi după brut (mii.lei)
sub 30- 50- 70- 90- 110 130 pes
mărimea
sub 50 30
7 50
2 701 90- 11
- - - te
- 10
50 - 100 2 10 9 4 - - - - 25
100 - 150 1 4 15 10 6 4 - - 40
150 - 200 - - - 5 9 4 2 - 20
peste 200 - - - (n ) -
ij 3 7 5 15
Total ( N . j ) 10 16 25 19 15 11 9 5 110
(N)
Pe baza acestor rezultate se poate considera că mărimea profitului
brut depinde în mod hotărâtor de capitalul social al societăţilor de acest
profil?
Rezolvare:
Tabelul 8 poartă numele de tabel de corelaţie deoarece în cadrul
acestuia, a fost sistematizată distribuţia celor 110 societăţi în funcţie de
două variabile numerice:
X - capitalul social al societăţilor comerciale - variabilă
factorială;
Y - profitul brut al societăţilor comerciale - variabilă
rezultativă.
Un astfel de tabel se foloseşte în scopul acceptării sau respingerii
ipotezei de lucru, respectiv din ansamblul factorilor de influenţă ai
variabilei Y, factorul X este factorul hotărâtor, determinant al variabilei
Y.
Fiind o serie bidimensională analiza acesteia se efectuează după
aceleaşi principii prezentate în aplicaţia A. Deoarece frecvenţele nij se
distribuie cu cele mai mari valori de-a lungul diagonalei principale, dar
înregistrând valori şi la stânga şi la dreapta faţă de această diagonală,
rezultă că între cele două variabile se manifestă o legătură statistică în
sens direct.
În acest caz, discuţia legăturii statistice se poate face cu ajutorul mai
multor procedee cum ar fi:
a) metoda analizei variaţiei ;
b) şi metoda regresiei.
Întrucât metoda regresiei necesită precizări suplimentare, care vor fi
făcute în capitolul următor, caracterizarea statistică a dependenţei dintre
capitalul social şi profitul brut al societăţilor se va face numai cu ajutorul
metodei analizei variaţiei. Utilizarea sa în acest scop va decurge în mod
analog cu aplicarea sa din problema precedentă:
- calculul mediilor parţiale ( y i , i =1,5, 5 - numărul grupelor de societăţi
după mărimea capitalului) şi al dispersiilor parţiale (σ i
2
)
, i = 1,5 :
comerciale al căror capital este mai mic de 50 mii lei (a=20; K=20).
Tabelul
9
Profitul yj −a yj −a yj −a
2
n1 j n1 j
k k k
brut n1 j yj
(mii. lei)
10-30 7 20 0 0 0
30-50 2 40 1 2 2
50-70 1 60 2 2 4
Total 10 - - 4 6
y j −a
∑ k
n1 j
j 4
y1 = k +a = ⋅ 20 + 20 = 28 mii .lei / s.c
∑n1 j 20
j
2
y −a
∑ j k n1 j
σ 12 = ( 6
)
k 2 − y1 − a = ⋅ 400 − ( 28 − 20 ) = 240 − 64 = 176
2 2
∑ n1 j
j
10
-calculul varianţelor:
• varianţa totală:
(
V02 = ∑∑ y j − y 0 nij = ∑ y j − y 0 ) 2
( ) 2
N . j = Nσ02110 ∗1450 ,8 = 159588
i j j
+(
103 −
79 ,4
5 )2 ⋅2
0 (
+1
42 ,6
7 −
79 ,4
5 )2 ⋅
15 =
11
754
0 ,2
7
• varianţa reziduală:
Vu2 = ∑∑ y j − y i ( ) 2
nij = ∑σi2 N i . = 176 ⋅10 + 288 ⋅ 25 + 584 ⋅ 40 + 331 ⋅ 20 +
i j i
Tabelul 10
Sursa Măsura Nr. Dispersi Valoarea testului F
Fc Fα;v1 ;v2
de variaţiei grade a
variaţ
Varian (
V x2 = ∑ y i − y 0 ) 2
N i.
de corectat
V x2 sY2 / X F0 , 05 ;1;198 =3,92
sY2 / X = Fc =
i
k −1 su2
= 117540 ,27 F0, 01 ;1;198 = 6,84
ţa = 117540 ,27 = 302 ,01
dintre k-
grupe 1=1 Vu2
su2 =
N −k
Varian Vu2 = ∑∑ y j − y i ( ) 2
nij
= 389 ,19
i j
ţa = 42033
V02 = ∑∑ yi − y 0 ( ) 2
nij N- - -
i j
Varian
rezidu =159588 k=108
ţa N- - - -
totală 1=10
Deoarece testul Fisher-Snedecor indică faptul că rezultatele
sunt semnificative cu un prag de semnificaţie de 1%
(F c = 302 ,01 > F0, 01;1;108 = 6,84 ) , se vor calcula contribuţia relativă a
factorului X - capitalul social, la explicarea variaţiei variabilei Y
V x2
2 % şi raportul de corelaţie empirică (R):
V0
V x2 117540,27
2
∗ 100 = ⋅ 100 = 73,65%
V0 159588
V x2 117540,27
R 2
= = 0,858
V0 159588
Cerere Num
(litri
90 ăr80de
100 120
130 60
150 50
160 30
200 20
Total 360
Acceptând că distribuţia cererii pe zilele anului este relativ stabilă,
recomandaţi cantitatea cu care trebuie să se aprovizioneze zilnic firma
pentru a obţine profit maxim.
BIBLIOGRAFIE
Capitolul 2
Testarea ipotezelor statistice
2.2.PREZENTARE SINTETICĂ:
2.2.1. Concepte şi erori în testarea ipotezelor statistice
Am văzut că:
α= P(respingere H0 ׀H0 este corectă)=P(eroare de gen I)
β= P(acceptare H0 ׀H0 este falsă)=P(eroare de gen II)
Alegerea nivelului (pragului) de semnificaţie depinde şi de costurile
asociate cu producerea unei erori de genul I.
Spre exemplu, pragul de semnificaţie ales de o firmă ce fabrică
îngheţată, interesată în greutatea medie a cutiilor de îngheţată va putea fi
diferit de pragul de semnificaţie ales de o companie farmaceutică,
interesată de cantitatea medie a unui ingredient activ dintr-un tip de
medicament. Evident, costul în prima situaţie prezentată este mult mai
mic, comparativ cu costul asociat în cazul producerii unei erori de genul
I pentru compania farmaceutică: o cantitate prea mică de ingredient activ
poate face medicamentul ineficient; o cantitate prea mare de ingredient
activ poate cauza efecte secundare, dăunătoare sau poate avea, chiar,
efecte letale.
Similar, există costuri asociate cu producerea unei erori de genul al
II-lea. Între eroarea de genul I şi eroarea de genul al II-lea există o
legătură, o condiţionare. O modalitate de a vizualiza această legătură este
să presupunem că există doar două distribuţii care ne interesează. O
distribuţie corespunde ipotezei nule H0, iar cealaltă corespunde ipotezei
alternativei H1. În acest caz, presupunem că şi ipoteza nulă şi cea
alternativă sunt ipoteze simple. Într-o manieră uşor de înţeles, să
considerăm că ipoteza nulă este de forma H0: μ=μ0, iar ipoteza alternativă
este de forma H1:μ=μ1 (vezi fig):
terile medii pătratice ale distribuţiilor pentru H0 şi H1 devin mai mici şi,
evident, atât α, cât şi β descresc (vezi fig.).
Ipoteza alternativă poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalităţii parametrului „media colectivităţii
generale“, μ cu valoarea μ0):
i) să testăm dacă parametrul din colectivitatea generală (media μ)
este egal cu o anumită valoare (inclusiv zero, μ0), cu alternativa media
diferită de valoarea μ0. Atunci:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0);
şi acest test este un test bilateral;
ii) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai
mare decât μ0.
H0: μ = μ0
H1: μ > μ0
care este un test unilateral dreapta;
iii) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai
mică decât μ0.
H0: μ = μ0
H1: μ < μ0
care este un test unilateral stânga.
Regiunea critică pentru testul bilateral diferă de cea pentru testul
unilateral. Când încercăm să detectăm o diferenţă faţă de ipoteza nulă, în
ambele direcţii, trebuie să stabilim o regiune critică Rc în ambele cozi
ale distribuţiei de eşantionare pentru testul statistic. Când efectuăm un
test unilateral, vom stabili o regiune critică într-o singură parte a
distribuţiei de eşantionare, astfel (vezi fig.):
μ μ μ
a) b) c)
Regiunea critică pentru a) test bilateral; b) test
unilateral stânga; c) test unilateral dreapta
2.2.2. Testarea ipotezei privind media populaţiei generale
(μ) pentru eşantioane de volum mare
x − µ0 x − µ0 x − µ0
z= = ≈
σx σ x n sx n
x − µ0
sau σx n
> zα / 2
x − µ0 x − µ0 x − µ0
z= = ≈
σx σ n s n
Rc: z > zα
Regula de decizie este:
x − µ0
Respingem ipoteza H0 dacă σ n
> zα
x − µ0 x − µ0 x − µ0
z= = ≈
σx σ n s n
x − µ0
Respingem ipoteza H0 dacă : σ n
< −z α
σ 12 σ 22
σ (x ) = +
1 −x 2 n1 n 2
1 1
σ (x ) =σ n + n
1 −x 2
1 2
În aceste condiţii, ipotezele statistice ce urmează a fi testate vor fi:
i) test bilateral
H0: (μ1- μ2) = D
H1: (μ1- μ2) ≠ D
[(μ1- μ2)>D sau (μ1- μ2)<D]
z=
(x 1 )
− x2 − D
σ ( x − x2 )
1
aproximare foarte bună a lui σ2x (în cazul eşantioanelor mici). Ca atare, în
locul statisticii z care necesită cunoaşterea (sau o bună aproximare) a lui
σx , vom folosi statistica:
x − µ0 x − µ0
t=
sx
=
sx n
,
∑( x ) 2
−x
unde: s 2
=
i
.
n −1
x
H0: μ = μ0,
H0: μ = μ0,
H0: μ = μ0,
Exemplu
2.2.5.Testarea ipotezei privind proporţia populaţiei
pentru eşantioane mari
Ne amintim că, pentru variabile alternative, media în eşantion era
notată cu f (proporţia succeselor), dispersia f(1-f), iar abaterea medie
pătratică f (1 − f ) . De asemenea, despre distribuţia de eşantionare a
proporţiei ştim că proporţia eşan-tionului (f) este aproximativ normal
distribuită, de medie p şi eroare standard p (1 −p ) / n , pentru n mare ( np ≥5
şi n(1 − p ) ≥5 ):
p(1 − p) f (1 − f )
µf = p şi s f = ≈ .
n n
∑ (x ) ( )
n1 n2
− x 1 + ∑ xi − x 2
2 2
s c2 = i =1 i =1
n1 + n 2 − 2
sau
(n − 1) s 2x1 + ( n 2 − 1) s 2x 2 ( n 1 − 1) s 2x1 + ( n 2 − 1) s 2x 2
s =
2 1
= .
c
( n 1 − 1) + ( n 2 − 1) n1 + n 2 − 2
Aşadar, dispersia combinată s c2 este media aritmetică pon-derată a
dispersiilor celor două eşantioane, s 2x1 şi s 2x 2 .
( x1 − x 2 ) − D
t=
s12 s 22
+
n1 n 2
cu gradele de libertate:
(s /n1 + s 22 /n2 )
2
1
2
Dacă ipoteza nulă nu este acceptată, vom putea apela la teste sta-
tistice neparametrice, în cadrul cărora nu se fac presu-puneri speciale
asupra formei distribuţiei.
2.2.7. Testarea ipotezei privind dispersia unei populaţii
Aşa cum am văzut în capitolul anterior, suma pătratelor diferenţelor
∑( x i
− x)2 (care este, de fapt, egală cu n ⋅s2 sau ( n −1) ⋅ s 2 pentru
eşantioane mici), împărţită la dispersia colectivităţii generale, are o
distribuţie hi-pătrat ( χ ) (dacă populaţia eşantionată este normal
2
distribuită).
(n − 1) s 2
χ2 = ,
σ2
Valoarea lui χ2 pentru care aria de sub curbă (situată la dreapta ei)
este egală cu α, se noteaza χα2 . Nu putem folosi notaţia − χα2 pentru a
reprezenta punctul la care aria din stânga este α, deoarece statistica χ2
este întotdeauna mai mare decât zero. Dar χ 12α reprezintă punctul pentru
care aria de sub curbă situată la stânga lui este α.
Spre exemplu:
χ02, 05 ;9 =16 ,92
χ02, 95 ;9 = 3,33
cu ipoteze alternative:
- pentru test bilateral H 0 : σ 2 ≠ σ 02 ,
Valoarea lui F pentru care aria de sub curbă (situată la dreapta ei) este
α, se notează cu Fα (cu gradele de libertate gl1 şi gl2).
( n1 − 1) s12 / σ 12 (n 2 − 1) s 22 / σ 22 s12 / σ 12
F=
(n1 − 1)
:
( n 2 − 1)
= 2 2
s2 / σ 2
,
s12
adică σ /σ =1 ,
2 2
testul statistic devine: F= 2 , care urmează o distribuţie F
1 2
s2
1
F1−α, gl1, gl2 =
Fα, gl1, gl2
gl1 = n1 –1
gl2 = n2 –1
2.3. Întrebări
2.4.Probleme rezolvate
H0: μ = 12
H1: μ ≠ 12 ( μ < 12 sau μ > 12);
z α/2=z0,005=2,575
H0: μ1 = μ2 (μ1 - μ2 = 0)
H1: μ1 < μ2 (μ1 - μ2 < 0)
z=
(x 1 )
− x2 − 0
=
x1 − x 2
≈
x1 − x 2
=
− 0,75
= −1,41
σ (x ) σ 12 σ 22 s12 s 22 0,5305
1 −x 2
+ +
n1 n 2 n1 n 2
∑( x ) 2
−x 2,203
= = = 0,5507
i
s 2
n −1
x
4
H0: μ = 2,01,
Cum tα,n-1 = t0,05;4 = 2,132, regiunea critică este dată de t>tα,n-1. Cum
t=1,874< t0,05;4=2,132, nu putem trage concluzia că media profitului previ-
zionată de cei 5 experţi pentru anul curent este semnificativ mai mare decât
profitul anului trecut, de 2,01 mld. lei.
Exemplu 4 : testarea ipotezei privind proporţia populaţiei pentru
eşantioane mari
Ipotezele sunt:
H 0 : p = 0,12 ,
H 1 : p > 0,12 (test unilateral dreapta).
Marca 1 Marca 2
n1=8 n2=12
x 1 = 5,696 mil. lei x 2 = 5,273 mil. lei
s c2 =
( 8 − 1) 0,485 2 + (12 − 1) 0,635 2 = 0,3379
8 + 12 − 2
H 1 : σ 2 > 100 .
Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
s 2
=
∑(x i − x) 2
=
1726
= 191,8 .
n −1 9
Cum χα2 , n −1 = χ02.05 , 9 =16 ,92 , şi χ2 > χα2 ,n −1 vom respinge ipoteza nulă şi
vom accepta ipoteza alternativă, σ 2 > 100 .
H 1 : σ 12 / σ 22 > 1 .
3. Dormont B , Introduction a
l’econometrie , Ed. Montchrestien , Paris ,
1999
modelului de regresie,
3.2.PREZENTARE SINTETICĂ:
Atunci,
Yi = α + β Xi + ε i
1
a + b a + be x
x
800
600
a + bx
400
200
a + b ln ( x )
0
-1 0.003 0.008 0.013 0.018 0.023 0.028 0.033 0.038 0.043 0.048 0.053 0.058 0.063 0.068
X
-200
-400
β
Sau y=Ax ⇒ ln(y)=α +β ln(x)
Forma generală: f(yi)= α +β g(xi)+ε i
1
Contra exemplu: y =α + nu poate fi transformat în model
β +x
liniar.
Erorile
Ipoteza de linearitate a modelului include şi aditivitatea erorilor.
Forma modelului:
y = α + β x+ ε ,
De exemplu modelul y = Ax βeε se transformă prin logaritmare în
modelul liniar: ln(y)=ln(A)+β ln(x)+ε .
Însă modelul y = Ax β +ε nu mai poate fi transformat în model liniar.
Dacă ipoteza de linearitate este verificată, variabila dependentă
observată este suma a două elemente:
- un termen nestochastic: α +β x
- o variabilă aleatoare
Functia de consum
1200
1000
800
consum
600
400
200
0
200 300 400 500 600 700 800 900 1000
venit
a) constantă b) constantă
Dispersia reziduurilor a) constantă; b) constantă
Discuţie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile
firmelor mici.
variaţia cheltuielilor gospodăriilor în funcţie de venit sau de
mărimea lor poate fi diferită.
Ipoteza 5: Non autocorelarea erorilor: μ(ε iε j)=0 ∀ i≠ j
Această ipoteză nu implică faptul că yi şi yj sunt necorelate, ci
faptul că deviaţiile observaţiilor de la valorile lor aşteptate sunt
necorelate.
Variabilele aleatoare ε i sunt statistic independente una de alta, adică
µεiεj = 0, pentru i ≠ j. Acest lucru înseamnă că eroarea asociată cu o
valoare a variabilei Y nu are nici un efect asupra erorilor asociate cu alte
valori ale lui Y;
a = y − bx
n ∑ yi
i
∑ xi ∑ xi yi ∑ xi yi − n x y
i i
b = = i
n ∑ xi 2
∑ xi − n x
2
i
2 i
∑ xi ∑ xi
i i
2 n > 0
2
2∑ xi > 0
i
2 2 2
4n∑ xi − 4(∑ xi ) = 4n ∑ ( xi − x) > 0
i i i
2 n
n n n
y x −
∑ i ∑ i ∑ i ∑ x i y i
x
a=
i =1 i =1 i =1 i =1
2
n n
n ∑ x i2 − ∑ x i
i =1 i =1
n ∑ x i y i − ∑ x i ∑ y i ∑ x i y i − n x ⋅ y
n n n n
b=
i =1 i =1 i =1 = i =1
2 n
2
n n
n∑ xi − ∑ xi ∑ x i2 − n x 2
i =1
i =1 i =1
n n
Se observă că obţinem din ecuaţia: na + b ∑ x i = ∑ y i
i =1 i =1
n n
∑ y i − b ∑ x i
împărţind prin n : a = y − bx =
i =1 i =1
n
n n n
şi, înlocuind în ecuaţia : a ∑ x i + b ∑ x i2 = ∑ x i y i
i =1 i =1 i =1
pe xi cu deviaţia (x i −x ) obţinem:
n
i =1
( ) n
a ∑ x i − x + b∑ x i − x
i =1
( ) 2 n
= ∑ x i − x yi
i =1
( )
n
(
∑ x i − x yi ) ( )
∑ x i − x yi − y∑ x i − x
n
i =1
( ) n
(
∑ x i − x yi − y )( )
i =1 i =1
b= = =
n
∑ xi − x
i =1
( ) 2 n
(
∑ xi − x
i =1
) 2 n
(
∑ xi − x
i =1
) 2
şi în final:
n
(
∑ x i − x yi − y
i =1
)( )
n s xy
b= =
n
∑ xi − x
i =1
( ) 2 s 2x
rămâne constant
n n n
2 2 2
∑ ( y i − y) = ∑ ( y i − ŷ i ) + ∑ ( ŷ i − y)
i =1 i =1 i =1
Putem nota:
n
2 2
∑ ( y i − y) = ∆ y = varianţa totală, suma pătratelor abaterilor totale.
i =1
n
2 2
∑ ( y i − ŷ i ) = ∆ e = varianţa neexplicată, suma pătratelor erorilor.
i =1
n
2 2
∑ ( ŷ i − y) = ∆ y / x = varianţa explicată, suma pătratelor abaterilor dato-
i =1
rate regresiei.
Vom avea, atunci: ∆2y = ∆2y / x + ∆2e
se mai notează:
= + i =1
n −1 n −1 n −1
relaţie care poate fi scrisă ca
( )
n n
∑ i ∑ ( yi − yˆ i ) 2
2
∑ (x )
y − y 2
−x
i =1
= i =1
+b 2 i
n −1 n −1 n −1
deoarece:
∑ ( yˆ − y ) = ∑ ( a + bx − a − b x ) ( )
n n n
= b 2 ∑ xi − x
2 2 2
i i
i =1 i =1 i =1
R2 = = 1− =
∆ 2y ∆ 2y ∑ ( y − y)
n 2
i
i =1
Raportul ∆2y / x / ∆2y reprezintă proporţia variaţiei totală care este
explicată de linia de regresie.
2 ∆2e / n − k − 1
R =1−
∆2y / n − 1
Valoarea lui R
2
este întotdeauna mai mică decât valoarea lui R2.
Observaţii:
1. R2 poate fi interpretat ca procentul variaţiei lui y explicată de
variaţia veriabilei x doar pentru cazul în care metoda celor mai mici
pătrate este aplicată modelului liniar de regresie.
2. Pentru orice model coeficientul R2 poate fi calculat ca:
2
∑ei
S yy = ∑( yi − y ) 2
R 2 =1 − i unde i
S yy
3.3. Probleme rezolvate
Interpretare:
1. La o variaţie a venitului cu o unitate monetară, consumul va
varia în aceeaşi direcţie cu 0,98 unităţi monetare.
2. Termenul liber se interpretează în general ca nivelul variabilei
dependente pentru cazul în care variabila independentă este zero. În
cazul exemplificat, valoarea termenului liber este negativă, iar consumul
nu poate fi negativ, deci singura interpretare ce poate fi dată este că va
avea loc a consumul de la un nivel al venitului de: 67,58/0,98=69.
Interpretare:
1. 99,17% din variaţia consumului este datorată variaţiei venitului.
2. 99,17% din variaţia consumului este explicată de modelul de
regresie.
Bibliografie generală
1. Andrei, T. - Statistică şi econometrie Editura
1998
Paris , 1989
1997.