Professional Documents
Culture Documents
PROIECT ECONOMETRIE
Variatia produsului intern brut (PIB) n functie de
veniturile populatiei si nivelul preturilor
STUDENT:
sTEFANACHE CRISTINA-MARIA
ANUL III SPE GRUPA
031
2007
CUPRINS
1. Scopul studiului
2. Modelul liniar unifactorial: PIB in functie de venituri
2.1. Analiza regresiei
2.2. Variabilele folosite
2.3. Testarea parametrilor
2.4. Corelarea
2.5. Autocorelarea
2.6. Analiza reziduurilor si predictiilor
2.6.1. Media reziduurilor
2.6.2. Distributia erorilor fata de model
2.6.3. Testarea normalitatii reziduurilor
2.7. Variante constante (homoscedasticitatea)
3. Modelul liniar unifactorial: PIB in functie de nivelul preturilor
3.1. Analiza regresiei
3.2. Variabilele folosite
3.3. Testarea parametrilor
3.4. Corelarea
3.5. Autocorelarea
3.6. Analiza reziduurilor si predictiilor
3.6.1. Media reziduurilor
3.6.2. Distributia erorilor fata de model
3.6.3. Testarea normalitatii reziduurilor
3.7. Variante constante (homoscedasticitatea)
4. Modelul liniar multifactorial: PIB in functie de nivelul veniturilor si al preturilor
4.1. Analiza regresiei
4.2. Corelarea
4.2.1. Eliminarea fenomenului de corelare a factorilor
4.2.2. Regresia in functie de factorii F1 si F2
4.3. Corelatia partiala
4.4. Autocorelarea erorilor
4.4.1. Eliminarea fenomenului de autocorelare
4.5. Testarea parametrilor
4.6. Legatura intre reziduuri si variabilele factor
4.7. Analiza reziduurilor si predictiilor
4.7.1. Media reziduurilor
4.7.2. Distributia erorilor fata de model
4.7.3. Testarea normalitatii reziduurilor
1. Scopul studiului
Acest proiect isi propune sa gaseasca corelatia dintre nivelul produsului intern brut (PIB) in functie de nivelul
veniturilor personale si al preturilor. Se va urmari influenta veniturilor, precum si a preturilor asupra produsului intern
brut. Modelul econometric se va construi pe baza datelor obtinute de pe site-ul guvernului SUA (site-ul de unde au
fost preluate datele este: http://www.bea.gov/bea/dn/nipaweb/NIPATableIndex.asp). Aceste date sunt structurate pe
ani, incepand cu anul 1929 pana in 2006.
Se va studia influenta celor 2 factori separat: influenta veniturilor asupra nivelului produsului intern brut, apoi
influenta indicelui preturilor asupra aceluiasi produs intern brut, urmand ca mai apoi sa se testeze modelele astfel
obtinute, testari prelucrate cu ajutorul programului STATA9.
Variabila endogena considerata este produsul intern brut(PIB) si variabilele exogene sunt veniturile
populatiei si indicele preturilor.
Modelul econometric are urmatoarea forma:
Yt = + 1 * X1 + 2 * X2 + ut
SS
df
MS
Number of obs =
-------------+------------------------------
F( 1,
Model | 1.2210e+10
1 1.2210e+10
Residual | 3782509.88
76 49769.8668
Prob > F
.
= 0.0000
R-squared
-------------+-----------------------------Total | 1.2210e+10
76) =
78
= 0.9997
77 158616055
Root MSE
= 223.09
-----------------------------------------------------------------------------PIB |
P>|t|
1.180916
1.190452
_cons |
106.9188
241.1832
174.051 33.70646
5.16 0.000
-----------------------------------------------------------------------------Se observa ca varianta explicata de model, ESS=1.2210e+10, este mult mai mare deat cea reziduala,
RSS=3782509.88, ceea ce ne ofera o prima informatie asupra faptului ca modelul este reprezentativ si ca o mare
parte din informatia produsului intern brut este data de catre factorul ales,
nivelul veniturilor. Impartind ESS/TSS, adica 1.2210e+10/1.2210e+10 se obtine R-sqared = 0.9997, care arata ca
informatia explicata de factor este in proportie de 99.97, ceea ce inseamna ca factorul este reprezentativ.
De asemenea tesul F, care testeaza eficienta modelului, raspunde la intrebarea "variabila independenta
prezice bine variabila dependenta?". Avand in vedere ca valoarea obtinuta pentru F este 0, se poate aprecia ca
modelul este reprezentativ si poate fi folosit pentru estimatii viitoare.
Avand aceste informatii in vedere se poate determina forma modelului. Astfel:
Asadar, atunci cand venitul creste cu 1 miliard dolari, PIB-ul la nivelul SUA creste cu 1.18 miliarde dolari. Insa,
pentruca nivelul produsului intern brut sa fie mai mare de 0 este nevoie de un nivel al veniturilor de peste 146.79
miliarde dolari (174.051/1.185684).
O prima analiza a parametrilor estimati ne arata ca acestia sunt viabili. Este testata egalitatea parametrilor cu
0, iar avand in vedere ca intervalul de incredere nu cuprinde valoarea 0 inseamna ca parametrii nu iau niciodata
valoarea 0.
Norul de puncte care analizeaza legatura dintre PIB si nivelul veniturilor este prezentat in graficul urmator:
(unlabeled)
units: 1
missing .: 0/78
percentiles:
10%
703
1792
25%
50%
4361
75%
19517
90%
33181
-----------------------------------------------------------------------------------------------------------------------venit
(unlabeled)
units: 1
unique values: 78
missing .: 0/78
mean: 9322.58
std. dev: 10620.3
percentiles:
10%
556
1388
25%
50%
3404.5
75%
16255
90%
27933
Studiul variabilelor ne arata ca acestea sunt cantitative si ca nu exista date lipsa. Acest lucru arata ca variabilele pot fi
folosite in regresie, deoarece la o prima vedere nu prezinta erori.
76) = 2.5e+05
Prob > F =
0.0000
Intrucat valoarea F este 0, ipoteza nula "parametrul variabilei venit este 0" este respinsa, asadar parametrul este
diferit de 0.
2.4. Corelarea
. correlate PIB venit
(obs=78)
|
PIB
venit
-------------+-----------------PIB | 1.0000
2.5. Autocorelarea
Prin aplicarea testului Breusch-Godfrey putem determina existenta unei autocorelari la nivelul modelului:
. estat bgodfrey
Breusch-Godfrey LM test for autocorrelation
--------------------------------------------------------------------------lags(p) |
chi2
df
-------------+------------------------------------------------------------1
37.453
0.0000
78) = 0 .5973365
Testul Durbin-Watson arata existenta unei autocorelari la nivelul modelului, intrucat valoarea coeficientului este
destul de apropiata de 0, ceea ce arata o corelare directa intre erori.
Obs
Mean
---------+-------------------------------------------------------------------r|
78 -2.41e-07
25.09559
221.6382
-49.9717
------------------------------------------------------------------------------
49.9717
mean = mean(r)
Ho: mean = 0
t = -0.0000
degrees of freedom =
Ha: mean != 0
77
Prob>chi2
-------------+------------------------------------------------------r|
0.000
0.000
23.93
0.0000
. swilk r
Shapiro-Wilk W test for normal data
Variable |
Obs
Prob>z
-------------+------------------------------------------------r
78
0.89337
7.169
4.310 0.00001
. sfrancia r
Shapiro-Francia W' test for normal data
Variable |
Obs
W'
V'
Prob>z
-------------+------------------------------------------------r
78
0.88143
8.755
4.105 0.00002
26.20
0.0000
chi2
df
---------------------+---------------------------Heteroskedasticity |
26.20
0.0000
Skewness |
8.35
0.0038
Kurtosis
2.52
0.1126
---------------------+-----------------------------
Total
37.07
0.0000
SS
df
MS
Number of obs =
-------------+------------------------------
F( 1,
Model | 1.1899e+10
1 1.1899e+10
Residual | 314856781
76 4142852.38
Total | 1.2213e+10
76) = 2872.07
Prob > F
R-squared
-------------+------------------------------
= 0.0000
= 0.9742
77 158616055
Root MSE
= 2035.4
-----------------------------------------------------------------------------PIB |
P>|t|
78
53.59 0.000
348.5793
375.4884
-5117.986
-3638.71
------------------------------------------------------------------------------
Se observa ca varianta explicata de model, ESS=1.1899e+10, este mult mai mare deat cea reziduala,
RSS=314856781, ceea ce ne ofera o prima informatie asupra faptului ca modelul este reprezentativ si ca o mare
parte din informatia produsului intern brut este data de catre factorul ales,
indicele preturilor. Impartind ESS/TSS, adica 1.1899e+10/1.2213e+10 se obtine R-sqared = 0.9742, care arata ca
informatia explicata de factor este in proportie de 97.42, ceea ce inseamna ca factorul este reprezentativ.
De asemenea tesul F, care testeaza eficienta modelului, raspunde la intrebarea "variabila independenta
prezice bine variabila dependenta?". Avand in vedere ca valoarea obtinuta pentru F este 0, se poate aprecia ca
modelul este reprezentativ si poate fi folosit pentru estimatii viitoare.
Avand aceste informatii in vedere se poate determina forma modelului. Astfel:
PIB =
-4378.348
Asadar, atunci cand pretul creste cu 1 miliard dolari, PIB-ul la nivelul SUA creste cu 362.0339 miliarde dolari.
O prima analiza a parametrilor estimati ne arata ca acestia sunt viabili. Este testata egalitatea parametrilor cu
0, iar avand in vedere ca intervalul de incredere nu cuprinde valoarea 0 inseamna ca parametrii nu iau niciodata
valoarea 0.
Norul de puncte care analizeaza legatura dintre PIB si nivelul preturilor este prezentat in graficul urmator:
PIB
(unlabeled)
units: 1
unique values: 78
missing .: 0/78
mean: 11227.7
std. dev: 12594.3
percentiles:
10%
703
25%
1792
50%
4361
75%
19517
90%
33181
-----------------------------------------------------------------------------------------------------------------------indicepret
(unlabeled)
units: .001
missing .: 0/78
mean: 43.1065
std. dev: 34.3363
percentiles:
10%
9.81
25%
50%
16.364 24.4065
75%
73.204
90%
97.868
Studiul variabilelor ne arata ca acestea sunt cantitative si ca nu exista date lipsa. Acest lucru arata ca variabilele pot fi
folosite in regresie, deoarece la o prima vedere nu prezinta erori.
76) = 2872.07
Prob > F =
0.0000
Intrucat valoarea F este 0, ipoteza nula "parametrul variabilei indicepret este 0" este respinsa, asadar parametrul este
diferit de 0.
3.4. Corelarea
. correlate PIB indicepret
(obs=78)
|
PIB indice~t
-------------+-----------------PIB | 1.0000
indicepret | 0.9870 1.0000
Inca o data se demonstreaza corelarea dintre PIB si indicele preturilor. Aceasta corelatie este foarte mare 0.9870,
deci factorul considerat poate explica in mare masura variatia variabilei dependente.
3.5. Autocorelarea
Prin aplicarea testului Breusch-Godfrey putem determina existenta unei autocorelari la nivelul modelului:
. estat bgodfrey
Breusch-Godfrey LM test for autocorrelation
--------------------------------------------------------------------------lags(p) |
chi2
df
-------------+------------------------------------------------------------1
76.050
0.0000
78) = .0368163
Testul Durbin-Watson arata existenta unei autocorelari la nivelul modelului, intrucat valoarea coeficientului este
destul de apropiata de 0, ceea ce arata o corelare directa intre erori.
One-sample t test
-----------------------------------------------------------------------------Variable |
Obs
Mean
---------+-------------------------------------------------------------------rpret |
78 -7.60e-06
228.9622
2022.14 -455.9221
455.9221
-----------------------------------------------------------------------------mean = mean(rpret)
t = -0.0000
Ho: mean = 0
degrees of freedom =
Ha: mean != 0
77
Prob>chi2
-------------+------------------------------------------------------rpret
0.182
0.188
3.64
0.1620
. swilk rpret
Shapiro-Wilk W test for normal data
Variable |
Obs
Prob>z
-------------+------------------------------------------------rpret |
78
0.97213
1.874
1.374 0.08477
. sfrancia rpret
Shapiro-Francia W' test for normal data
Variable |
Obs
W'
V'
Prob>z
-------------+------------------------------------------------rpret |
78
0.97054
2.175
1.530 0.06305
Testul White
. estat imtest,white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(2)
34.21
0.0000
chi2
df
---------------------+----------------------------Heteroskedasticity |
Skewness
Kurtosis
|
|
34.21
0.0000
18.18
0.0000
1.06
0.3037
---------------------+----------------------------Total
53.44
0.0000
SS
df
MS
Number of obs =
-------------+------------------------------
F( 2,
Model | 1.2210e+10
2 6.1049e+09
Residual | 3594817.54
75 47930.9005
Prob > F
.
= 0.0000
R-squared
-------------+-----------------------------Total | 1.2213e+10
75) =
78
= 0.9997
77 158616055
Root MSE
= 218.93
-----------------------------------------------------------------------------PIB |
P>|t|
80.59 0.000
1.129022
1.186257
1.98 0.052
-.0588302
17.64406
0.83 0.409
-78.98703
191.9443
-----------------------------------------------------------------------------La fel ca in cazul modelelor unifactoriale, si aici se observa o puternica informatie detinuta de cei 2 factori. Asadar
variatia modelului este 1.2210e+10 , net mai mare decat cea reziduala, ceea ce conduce la un R patrat foarte mare
de 0.9997. Aceasta inseamna ca informatia explicata de factori este in proportie de 99.97%.
De asemenea, o prima analiza a modelului il anunta valid, astfel ca valoarea F este 0, ceea ce inseamna ca modelul
este reprezentativ si poate conduce la viitoare prognoze.
Forma modelului este data de coeficientii parametrilor:
PIB = 56.47864
Asadar, la o modificare cu 1 miliard dolari a veniturilor, PIB-ul va creste cu 1.15 miliarde dolari, iar la o
modificare a preturilor cu 1 miliard dolari, PIB-ul va creste cu 8.79 miliarde dolari.
P>|t| arata ca parametrii coeficientilor sunt valizi, ca factorii alesi sun valabili, in sensul ca coeficientii
corespunzatori acestora nu pot lua valoarea 0. Acest lucru ne arata si intervalul de incredere, care nu il
cuprinde pe 0.
4.2. Corelarea
. correlate PIB venit indicepret
(obs=78)
|
PIB
venit indice~t
-------------+--------------------------PIB | 1.0000
venit
| 0.9998 1.0000
Din analiza tabelului de corelatii se observa puternica corelatie dintre variabila dependenta si fiecare factor, dar si
puternica corelatie dintre factori, ceea ce slabeste din validitatea modelului regresional.
Number of obs
78
Number of comp. =
Trace
Rotation: (unrotated = principal)
Rho
Proportion Cumulative
-------------+-----------------------------------------------------------Comp1
1.98654
1.97308
Comp2
.0134622
0.9933
0.0067
0.9933
1.0000
Comp1
Comp2 | Unexplained
-------------+--------------------+------------venit | 0.7071
0.7071 |
0
0
=
=
2
2
1.0000
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F( 2,
Model | 1.2210e+10
2 6.1049e+09
Residual | 3594812.52
75 47930.8336
Prob > F
.
= 0.0000
R-squared
-------------+-----------------------------Total | 1.2213e+10
75) =
78
= 0.9997
77 158616055
Root MSE
= 218.93
-----------------------------------------------------------------------------PIB |
P>|t|
2.25 0.028
.7970917
13.27521
f2 | -5.398985 3.151939
-1.71 0.091
-11.67797
.8799989
0.83 0.409
-78.99139
191.9414
-----------------------------------------------------------------------------Se observa ca si in acest caz se mentin valorile ridicate ale variantei explicite cat si a R. Asadar si acest model este
reprezentativ si trece de primele teste.
Forma modelului este:
PIB = 56.47501 + 7.036149*f1 -5.398985*f2
Inlocuind cu valorile initiale ale factorilor vom avea:
PIB = 56.47501 + 1.1576378 * venit + 1.1576378 * indicepret
Variable |
Corr.
Sig.
-------------+-----------------venit | 0.9943
0.000
indicepret | 0.2228
0.052
78) = .6110033
Testul Durbin-Watson arata existenta unei autocorelari la nivelul modelului, intrucat valoarea coeficientului este
destul de apropiata de 0, ceea ce arata o corelare directa intre erori.
. estat bgodfrey
Breusch-Godfrey LM test for autocorrelation
--------------------------------------------------------------------------lags(p) |
chi2
df
-------------+------------------------------------------------------------1
36.481
0.0000
SS
df
MS
Number of obs =
-------------+-----------------------------Model | 1.1755e+09
Residual | 1903471.11
F( 2,
2 587761035
= 0.0000
R-squared
-------------+-----------------------------Total | 1.1774e+09
74) =22850.00
Prob > F
74 25722.5825
77
= 0.9984
76 15492441.3
Root MSE
= 160.38
-----------------------------------------------------------------------------PIB |
P>|t|
1.40 0.164
-3.999012
23.09038
f2 | -7.921125 6.839497
-1.16 0.251
-21.54912
5.706871
0.04 0.967
-320.6093
334.048
-------------+---------------------------------------------------------------rho | .7183342
-----------------------------------------------------------------------------Durbin-Watson statistic (original)
0.611004
. testparm f1 f2
( 1) f1 = 0
( 2) f2 = 0
F( 2,
75) = 1.3e+05
Prob > F =
-------------+--------------------------venit | 1.0000
indicepret | 0.9865 1.0000
rmodel | 0.0000 -0.0000 1.0000
Din tabelul de mai sus se observa ca variabilele factor (venitul si indicele preturilor) nu se coreleaza cu
reziduurile.
Obs
Mean
---------+-------------------------------------------------------------------rmodel |
78
3.89e-07
24.46501
216.0691 -48.71606
-----------------------------------------------------------------------------mean = mean(rmodel)
Ho: mean = 0
t = 0.0000
degrees of freedom =
77
48.71607
Ha: mean != 0
Prob>chi2
-------------+------------------------------------------------------rmodel |
0.007
0.000
17.20
0.0002
. estat ovtest
Ramsey RESET test using powers of the fitted values of PIB
Ho: model has no omitted variables
F(3, 72) =
10.67
Prob > F =
0.0000
se respinge
Source |
SS
df
MS
Number of obs =
-------------+------------------------------
F( 2,
Model | 3.4100e+09
2 1.7050e+09
Residual | 802265.002
62 12939.7581
-------------+-----------------------------Total | 3.4108e+09
Prob > F
R-squared
64 53293550.8
.
= 0.0000
= 0.9998
-----------------------------------------------------------------------------PIB |
62) =
65
P>|t|
-------------+----------------------------------------------------------------
= 113.75
51.91 0.000
4.69 0.000
-1.61 0.112
1.047414
1.131319
14.46024
-214.3388
35.91722
23.00978
SS
df
MS
Number of obs =
-------------+------------------------------
F( 2,
75) =
Model | 1.2210e+10
2 6.1049e+09
Prob > F
Residual | 3594817.54
75 47930.9005
R-squared
-------------+-----------------------------Total | 1.2213e+10
77 158616055
Root MSE
P>|t|
80.59 0.000
1.129022
1.186257
1.98 0.052
-.0588302
17.64406
0.83 0.409
-78.98703
191.9443
------------------------------------------------------------------------------
'
(e* * e* - e1 * e1 ) / n2
F=
'
e1 * e1 / (n1 - k)
= F(n2 , n1 - k) = F(13,65 - 2) = F(13,63) = 1.87
Fcalc = mare
.
= 0.0000
= 0.9997
-----------------------------------------------------------------------------PIB |
78
= 218.93
Ftab = 3.13
13.37
27.05
0.0001
chi2
df
---------------------+----------------------------Heteroskedasticity |
Skewness
Kurtosis
|
|
27.05
0.0001
7.08
0.0290
1.22
0.2686
---------------------+----------------------------Total
35.35
0.0000
78
Source | Partial SS
0
df
R-squared
= 1.0000
Adj R-squared =
MS
Prob > F
-----------+---------------------------------------------------Model | 1.2213e+10
77 158616055
|
venit | 1.2213e+10
indicepret |
77 158616055
|
Residual |
-----------+---------------------------------------------------Total | 1.2213e+10
77 158616055
Facand testul ANOVA acesta ne arata ca varianta totala este data de varianta explicta a modelului, iar varianta
reziduala este 0. aceasta inseamna ca modelul este vaid si poate fi folosit in previziune.
In continuare voi prezenta graficele suprapuse ale valorilor PIB-ului, asa cum au fost ele preluate din tabele si
asa cum au fost prezise de model. Astfel:
PIB-ul in functie de variatia veniturilor:
PIB-ul prezis de modelul multifactorial, luand in considerare atat variatia veniturilor cat si variatia preturilor:
Comparand variantele celor doua variabile : PIB-ul in valori reale si PIB-ul in valori prezise se observa ca acestea au
variantele egale:
. sdtest PIB==pmodel
Variance ratio test
-----------------------------------------------------------------------------Variable |
Obs
Mean
---------+-------------------------------------------------------------------PIB |
78
pmodel |
11227.68
78
1426.022
11227.68
12594.29
1425.812
8388.107
12592.43
14067.25
8388.525
14066.83
---------+-------------------------------------------------------------------combined |
156
11227.68
1005.018
12552.67
9242.38
f = 1.0003
degrees of freedom = 77, 77
Ha: ratio != 1
13212.98
5. Concluzii
Analizand validitatea modelelor se observa ca acestea nu trec toate testele necesitand astfel diferite ajustari. Este
clar insa ca intr-o economie, variatia PIB-ului este determinata de variatia nivelului veniturilor si de variatia nivelului
preturilor. Asadar, variabila independenta, dupa cum ne arata si testele si modelele depinde in mare masura de cei
doi factori analizati.
Modelul PIB-ului in functie de venit si pret poate arata astfel: