Professional Documents
Culture Documents
1.Specificarea modelului
Cu ajutorul regresiei liniare, se poate determina impactul pe care il au mai multe
variabile independente asupra unei variabile dependente.
Am ales sa analizam prin intermediul unui model multifactorial in ce raport cheltuielile cu
sanatatea,respectiv cheltuielile cu educatia influenteaza cheltuielile bugetare din Irlanda,intre
anii 1990-2007.
Tabel centralizator
An PIB(mil.) Ch.bugetare(%) Ch cu sanatatea(%)Ch.cu educatia(%)
1990 43,94 5,2 5,31
1991 45,58 5,6 5,51
1992 46,44 5,92 5,94
1993 43,97 5,72 5,66
1994 43,61 5,68 5,69
1995 39,74 5,4 5,11
1996 38,83 5,42 5,11
1997 38,63 5,75 5,17
1998 34,55 5,18 4,57
1999 34,1 5,28 4,41
2000 31,32 5,21 4,28
2001 33,23 5,82 4,49
2002 33,46 6,15 4,47
2003 33,21 6,41 4,57
2004 33,52 6,65 4,58
2005 33,94 6,72 4,61
2006 34,43 6,67 4,66
2007 35,55 6,93 4,89
Sursa:Eurostat
*-pondere in PIB
2
Forma ecuatiei de regresie: ChBugetaie
*ChEuucatie
*ChSanatate
unde:
t=1,2..,n sunt observatiile din esantion (n=18)
ChBugetaie
- variabila dependenta(endogena)
ChEuucatie
,ChSanatate
- variabilele independente(exogene)
- termenul de eroare al ecuatiei
Pentru ca inferena bazat pe rezultatele regresiei liniare multiple sa fie valida, trebuie
indeplinit un set de sase ipoteze, regresia bazat pe acest set de ipoteze fiind
cunoscut ca modelul clasic normal de regresie multipla.
Ipoteze:
1.Legatura dintre variabila dependenta si variabilele independente este liniara.
2. Variabilele independente sunt aleatoare. De asemenea intre variabilele independente incluse
ntr-o regresie nu exist nici o relaie liniar. Daca variabilele independente sunt corelate atunci
exist multicoliniaritate.
3. Media termenului de eroare este egala cu zero : E(
)=0.
4. Variana termenului de eroare,
)=
.Aceste
erori se numesc homoskedastice.Daca , in schimb , varianta termenului de eroare este variabila
erorile sunt heteroskedastice, si trebuie utilizate metode diferite de estimare a parametrilor.
5.Termenul de eroare,
)=0, tk.
6.Termenul de eroare este normal de distribuit.
3
2.Estimarea parametrilor
Rezultatul in Eviews pentru estimare parametrilor prin metoda celor mai mici patrate este
urmatorul:
Ch.Bugetare=-1,11-1,23*Ch.Sanatate+9.3Ch.Educatie
3.Testarea parametrilor
Testarea parametrilor se realizeaza prin intermediul testului Student.
Pentru
.
Pentru
)=0.01<0.05Se respinge
.
Pentru
obtinem ca Prob(
)=0.78>0.05 Se accepta
si
:()
Prob(F)=0.00<0.05 Se respinge ipoteza nula ceea ce inseamna ca modelul este valid.
Un alt indicator care arata dac modelul de regresie este bine specificat este
. Acesta
arata ca 96%din variana total a Ch.Bugetare este datorat Ch.Sanatatea si
Ch.Educatia.Intrucat are o valoare foarte apropiata de 1,exista o legatura puternica intre
variabila endogene si cele doua variabile exogene.
De fiecare dat cnd este introdus n regresie o nou variabil independent care este
ct de puin corelat cu variabila dependent,
este
ajustat are valoare 95%.
5
ANOVA
Suma patratelor Grade liberatate
Regresie (SPR) 22.58 2 (p-1)
Reziduu (SPE) 1.11 15 ( n-p)
Total (SPT) 23.69 17 (n-1)
1.Marimea SPT=
cuantifica dispersia acestei serii sub actiunea tuturor factorilor ,atat
prin a celor inregistrati prin intermediul variabilelor explicative(Ch.Sanatate si Ch.Educatie) din
cadrul modelului liniar de regresie,cat si a celor neinregistrati.
2.Marimea SPR= cuantifica influenta factorilor de regresie in marimea variantei totale a
seriei caracteristicii endogene.Astfel Ch.Sanatate si Ch.Educatie influenteaza Ch.Bugetare intr-
o proportie egala cu 22.58%.
3.Marimea SPE=
Pentru a determina SPE calculam
cu 3 grade de libertate.
Matricea de covarianta :
=
unde,
Ch.Sanatate
Ch.Educatie
y=Ch.Bugetare
6
6.Coeficientul liniar de corelatie
Coeficientul de corelatie este un indicator eficient pentru masurarea intensitatii dependentei
dintre variabile numai in masura in care aceasta este de tip liniar.
r(Ch.Bugetare,Ch.Educatie)=0.97 ceea ce sugereaza ca intre cele doua variabile exista o
legatura puternica.
r(Ch.Bugetare,Ch.Sanatate)=-0.31 ceea ce indica o legatura slaba intre cele doua variabile.
7.Testarea coeficientului de corelatie
Notam cu
Definim statistica
16.16
=1.96
Se observa ca
>
* =>
=>
=-1.37
=1.96
Se observa ca
>
)>0.05 => Se accepta ipoteza nula conform careia erorile nu sunt corelate.
Prob(F)>0.05 => Se accepta ipoteza nula conform careia erorile nu sunt correlate.
9.Heteroskedasticitate
y Testul White
Acest test are la baza explicitarea seriei (
Ipoteze test
-homoskedasticitate
-heteroskedasticitate
Statistica testului LM=n*
Prob(F)=0.18>0.05 => Se accepta
ipoteza nula conform careia modelul este
homoskedastic.
Prob(n*
Se observa ca probabilitatea testului este 0.2 >0,05 Se accepta ipoteza nula
ceea ce
inseamna ca erorile sunt distribuite normal.