You are on page 1of 33

Heteroskedasticiteti

Një prej supozimeve të MKRL thotë se gabimet


(disturbancat) janë sferike, d.m.th.kanë variancë
uniforme dhe nuk janë të korreluar me njëri-tjetrin.

Këto karakteristika pasqyrohen në matricën e variancë-


kovariancës të vektorit të disturbancave. Matrica e
variancë-kovariancës së vektorit të disturbancës është një
matricë me N rreshta dhe N shtylla, ku mbi diagonale
gjenden variancat dhe jashtë diagonales gjenden
kovariancat.
Çdo term i diagonales jep variancën e disturbancës të shoqëruar me
një nga vrojtimet e zgjedhjes. Nëqoftëse të gjitha këto terma të
diagonales janë të njëjta, thuhet që disturbancat kanë variancë të
njëjtë, ose janë homoskedastike (homo = e njëjtë, skedastike = e
shpërndarë). Nëqoftëse të gjitha variancat nuk janë të njëjta, quhen
heteroskedastike. Në këtë rast thuhet se, termi i gabimit ka ardhur
nga një shpërndarje e ndryshme, për çdo vrojtim.

Simbolikisht homoskedasticiteti shkruhet:


 
kurse heteroskedasticiteti shkruhet:
Paraqitje grafike e homoskedasticitetit dhe
heteroskedasticitetit

Figura 1. Homoskedasticiteti dhe heteroskedasticiteti


Disa prej shkaqeve kryesore të ndryshimit të variancës së gabimit
sipas Gujaratit janë:

 Duke ndjekur modelin e të mësuarit nga gabimet, individë të


 
ndryshëm mësojnë prej gabimeve, kështu që gabimet në sjelljet e tyre
zvogëlohen me kalimin e kohës, pra dhe zvogëlohet në shtrirje kohore.
 Rritja e të ardhurave të individëve rrit dhe gamën e zgjedhjeve të bëra
me të ardhurat në dispozicion. P.sh. nëqoftëse shikojmë lidhjen midis
kosumit (Y) dhe të ardhurave (X), mund të hamendësojmë që rritja e
të ardhurave do të rriste dhe gamën e zgjedhjeve që mund të bënin
individët lidhur me kursimet e tyre. Pra, rritja e të ardhurave do të
sillte dhe rritjen e për kursimet.
 Përmirësimi i teknikave të grumbullimit të të dhënave sjell zvogëlimin
e . Kështu ato banka, që zotërojnë pajisje të sofistikuara të përpunimit
të të dhënave, do të bëjnë më pak gabime me gjëndjen monetare të
klientëve, krahasuar me banka të tjera që nuk i kanë këto pajisje
lehtësuese.
Disa prej shkaqeve kryesore të ndryshimit të variancës së gabimit
sipas Gujaratit (vazhdim)
 Heteroskedasticiteti mund të rritet dhe si pasojë e vlerave ekstreme.
Sidomos kur volumi i zgjedhjes është i vogël, përfshirja apo jo e vlerave
ekstreme në studim mund të ndryshojë në mënyrë thelbësore rezultatet e
tij.
 Heteroskedasticiteti mund të vijë dhe nga specifikimi i gabuar i modelit.
Variabla shpjegues të rëndësishëm, të larguar nga modeli, mund të krijojnë
përshtypjen se varianca e gabimeve të përftuara nga regresioni nuk është
konstante. Përfshirja e këtyre variablave shpjegues të rëndësishëm në
model mund ta zhdukë këtë përshtypje.
 Burim tjetër i heteroskedasticitetit është shpërndarja jonormale e disa
regresorëve të përfshirë në model, siç mund të jenë të ardhurat e
individëve, pasuria e tyre, niveli i edukimit etj. Dimë që niveli më i lartë i të
ardhurave dhe pasurisë është përqëndruar në një grup të vogël individësh.
 Burim heteroskedasticiteti mund të jetë dhe kryerja e transformimeve të
gabuara (diferenca të rendeve të ndryshme) apo e formës funksionale të
gabuar (modele lineare kundrejt atyre log-log).
Ndikimi i heteroskedasticitetit tek vlerësuesit e modelit të regresionit
të thjeshtë

 
Kur termat e gabimeve kanë shpërndarje homoskedastike,
varianca e koefiçientit MZKV është:

(1)

Kur termat e gabimeve kanë shpërndarje heteroskedastike,


varianca e koefiçientit MZKV është:

(2)
Tani jemi në gjendje që të shpjegojmë anshmërinë që pëson vlerësuesi
MZKV, në prani të heteroskedasticitetit.
Nëqoftëse heteroskedasticiteti është i pranishëm dhe ne llogaritim
variancën e b sipas ekuacionit 1 dhe jo sipas ekuacionit 2, do të
nënvlerësonim variancën e vërtetë dhe gabimin standart të b. Kjo do
të sillte rritje artificiale të statistikës t, duke bërë që regresorë të
modelit të duket sikur kanë ndikim statistikisht të rëndësishëm tek
variabli i varur, kur në të vërtetë mund të mos jetë kështu.
Gjithashtu, dhe kufijtë e intervaleve të besimit do të ngushtohen
artificialisht, duke na bërë të mendojmë se është rritur preçizioni i
vlerësimit.
Ndikimi i heteroskedasticitetit tek matrica e variancë-kovariancës të termave të gabimit

 
Matrica në mungesë të heteroskedasticitetit ka
trajtën:
E( = = (3)
ku, është një matricë identiteti (unitare) me
përmasa n x n.
Në prani të heteroskedasticitetit matrica do të
ndryshojë nga forma klasike dhe do të marrë trajtën:
E( = (4)
Matricën e ekuacionit 4 mund ta shkruajmë edhe në formën:
E( =  (5)

 
Në prani të heteroskedasticitetit, matrica e variancë kovariancës të vektorit të
disturbancave shkruhet si matricë e përgjithshme G dhe MKRL shndërohet në MPRL
(Model i Përgjithshëm i Regresionit Linear). Matrica G, siç duket nga ekuacioni 5
normalizohet duke u paraqitur në trajtën , ku zgjidhet në mënyrë të tillë që të
“shtrihet” përgjatë N elementëve të diagonales së

Për llogaritjen e nevojitet informacion nga por jo nga , rrjedhimisht llogaritja e


kërkon njohuri në një përpjestim të caktuar të
Metoda e përgjithshme e katrorëve më të vegjël

(MPKV)

Kjo metodë në thelb është transformim i variablave

origjinalë në mënyrë të tillë që variablat e

transformuar të kënaqin supozimet e MKRL, që

pastaj të mund të përdoret MZKV.


Mekanizmi i vlerësimit të dhe është si vijon:

 
Le të kemi funksionin e regresionit për zgjedhjen:

(6)  
Pjestojmë të dy anët e ekuacionit 6 me , duke supozuar që vlerat janë
të njohura.
(7)
ose
(8)
Për modelin e modifikuar kemi:
(9)
Për këtë arsye, vlerësimet e përftuara me MZKV nga regresioni i në do
të jenë VMLP.
Për të përftuar vlerësuesin MPKV duhet të minimizojmë

(10)  
d.m.th.
(11)
Mekanizmi i minimizimit ndjek teknikat standarte llogaritëse, prej nga
vlerësuesi llogaritet sipas formulës:
(12)
kurse varianca e tij jepet sipas formulës
(13)
ku,
Duhet theksuar se, ndërsa në MKRL minimizonim
shumën e katrorëve të mbetjeve të papeshuar, në MPRL
minimizojmë shumën e katrorëve të mbetjeve të pëshuar
me peshat Në MPKV peshat që i korrespondojnë çdo
vrojtimi janë proporcionalisht të kundërta me . Kjo
 
nënkupton që, vrojtime të ardhura nga popullatë me të
madhe, do të marrin pesha relativisht të vogla dhe
vrojtime të ardhura nga popullatë me të vogla, do të
marrin pesha relativisht të mëdha.
Pasoja të heteroskedasticitetit në vlerësuesit MZKV

Le të marrim në konsideratë MKRL 

Nëqoftëse dihet se termi i gabimit do të jetë heteroskedastik, atëherë


pasojat në vlerësuesit do të jenë si më poshtë:
1. Vlerësuesit do të jenë përsëri të paanshëm dhe konsistentë. Kjo
ndodh sepse asnjë prej variablave shpjegues nuk korrelon me
termin e gabimit. Rrjedhimisht, një model i specifikuar në mënyrë të
saktë, megjithëse vuan nga heteroskedasticiteti, do të japë vlera
relativisht të mira të
2. Heteroskedasticiteti ndikon shpërndarjen e duke rritur variancën e
saj dhe duke bërë vlerësuesit MZKV joefiçientë, sepse cënon vetinë e
variancës minimale.
Figura 2. Ndikimi i heteroskedasticitetit në parametrin e vlerësuar

Me heteroskedasticitet

Pa heteroskedasticitet

 𝜷
Si pasojë e pranisë së heteroskedasticitetit nuk është vlerësuesi më
efiçient ndër gjithë vlerësuesit e paanshëm. Një vlerësues tjetër i
 
quajtur vlerësuesi i metodës së përgjithshme të katrorëve më të vegjël
mund të jetë VLMP.

Prania e heteroskedasticitetit bën që MZKV të nënvlerësojë

variancat e koefiçientëve të regresionit, pra dhe gabimet standarte,

duke rritur artificialisht vlerat e pritura të statistikave t dhe F.

Rrjedhimisht, heteroskedasticiteti ndikon ndjeshëm krijimin e

intervaleve të besimit, pra dhe testimin e hipotezave.


Në MPRL, me supozimin shtesë se disturbancat kanë shpërndarje të
përbashkët normale, nuk është më vlerësues i përgjasisë maksimale (ML), siç
ishte ne MKRL. Vlerësues ML në këtë kontekst është . Por, në këtë rast ka një
dilemë, sespe matrica G, ku mbështetet MPKV, rrallë herë njihet. Këtu
ekonometristët zakonisht përdorin të dhënat që kanë në dispozicion për të
vlerësuar G-në si dhe këtë e përdorin në formulën e . Ky vlerësues i ri, që

 
përdor G-në e vlerësuar quhet vlerësuesi i metodës së katrorëve më të vegjël të
vlerësuar dhe shkruhet . Ai nuk është më linear dhe i paanshëm por, nëqoftëse
është vlerësues konsistent i G, mund të tregohet që ka veti asimptotike të
dëshiruara, krahasuar me vetitë e , për zgjedhje të vogla. Studime Monte-
Karlo kanë treguar se, në shumë raste, është superior dhe ndaj në kritere ku
tregohet matematikisht se është superior ndaj . Si pasojë, ekonometristët
shpesh, në kontekstin vlerësues të MPRL, adoptojnë vlerësuesin .
Nëqoftëse do të shpreheshim në gjuhën matricore për të qartësuar pasojat e
heteroskedasticitetit tek vlerësuesit MZKV dhe MPKV do të kishim:

 
ose

Matrica e variancë-kovariancës së është më e vogël se ajo e , formula e së cilës


është:

Aplikimi i formulës së zakonshme për vlerësimin e matricës së variancë-


kovariancës të jep vlerësues të anshëm, sepse vlera e pritur e në MPRL nuk
është më e barabartë me dhe nuk është e barabartë me.
Diktimi i heteroskedasticitetit
 
Shumica e metodave joformale dhe formale për diktimin e

heteroskedasticitetit mbështeten në egzaminimin e

mbetjeve nga MZKV, si të vetmet që kemi mundësi të

vrojtojmë (disturbancat nuk kemi mundësi t’i vrojtojmë).


Mënyra informale e diktimit të heteroskedasticitetit

 
 Në rastin e modelit të regresionit të thjeshtë mund të

diktojmë heteroskedasticitetin, duke u nisur nga grafiku i

shpërndarjes së vlerave.

 Në rastin e modelit të regresionit të shumfishtë, për

diktimin e heteroskedasticitetit bazohemi tek shpërndarja

grafike e vlerave të mbetjeve në katror, , kundrejt vlerave

të variablit të varur Y dhe/ose të variablave të pavarur X.


Nga format e ndryshme grafike, mund të marrim informacion të vlefshëm lidhur me
heteroskedasticitetin.
Figura 3. Shpërndarje homoskedastike e mbetjeve në katror

Në figurën 4 shikojmë disa forma të qarta heteroskedasticiteti, lineare apo jolineare.

Figura 4. Disa forma heteroskedasticiteti

Njohja e marrëdhënieve midis variablave me ndihmën e këtyre formave është e vlefshme,


sepse na jep mundësinë që të dhënat t’i transformojmë në mënyrë të tillë, që të eleminojmë
heteroskedasticitetin.
Metoda formale të diktimit të heteroskedasticitetit

Testi LM Breusch-Pagan  

Breusch dhe Pagan (1979) zhvilluan një test LM (Lagrange Multiplier)


për heteroskedasticitetin.

Supozojmë se kemi modelin:

(1)

ku, .
Testi Breusch-Pagan përmban hapat e mëposhtëm:
 Kryejmë regresionin e ekuacioni 1 dhe përftojmë mbetjet nga modeli i vlerësuar.
 Kryejmë regresionin ndihmës (auxiliary):  
(2)

ku, është një bashkësi variablash që mendojmë se përcakton variancën e termit të


gabimit. (Zakonisht për përdorim variablat shpjegues origjinalë të modelit)
 Formulojmë hipotezën bazë dhe atë alternative.

=0

Hipoteza alternative do të jetë se të paktën një prej koeficientëve do të jetë e ndryshme nga
zero. Kjo nënkupton që të paktën një prej variablave shpjegues ndikon në mënyrë të
rëndësishme statistikore varinacën e mbetjeve (e cila ndryshon sipas i).
 Llogarisim statistikën , ku është numri i vrojtimeve të përdorura në hapin 2 për
ekuacionin ndihmës dhe , koeficienti i përcaktueshmërisë për këtë regresion. Statistika
ndjek shpërndarje me shkallë lirie.
 Rregulli i vendimit: Nëqoftëse për një nivel të caktuar rëndësie, , hidhet poshtë hipoteza
bazë, duke evidentuar praninë e heteroskedasticitetit.
Testi LM i Glesjer
Testi i Glesjer (1969) ndjek këto hapa:

1. Kryej regresionin:
 
(1)
dhe përftojmë mbetjet
2. Kryej regresionin ndihmës:
(2)
3. Formulojmë hipotezën bazë dhe atë alternative.
=0
të paktën një prej
4. Llogarisim statistikën ku, është numri i vrojtimeve të përdorura në hapin 2, për
ekuacionin ndihmës dhe , koeficienti i përcaktueshmërisë për këtë regresion. Statistika
ndjek shpërndarje me shkallë lirie.
5. Rregulli i vendimit: Nëqoftëse për një nivel të caktuar rëndësie, , hidhet poshtë
hipoteza bazë, duke evidentuar praninë e heteroskedasticitetit (zakonisht ).
Testi LM Harvey-Godfrey
Harvey (1976) dhe Godfrey (1978) krijuan testin si më poshtë:

1. Kryejmë regresionin:
 
(1)

dhe përftojmë mbetjet e ekuacionit të vlerësuar.

2. Kryejmë regresionin ndihmës:

(2)

3. Formulojmë hipotezën bazë dhe atë alternative.

=0

të paktën një prej

4. Llogarisim statistikën ku, është numri i vrojtimeve të përdorura në hapin 2, për ekuacionin
ndihmës dhe , koeficienti i përcaktueshmërisë për këtë regresion. Statistika ndjek shpërndarje me
shkallë lirie.
5. Rregulli i vendimit: Nëqoftëse për një nivel të caktuar rëndësie, , hidhet poshtë hipoteza bazë,
duke evidentuar praninë e heteroskedasticitetit (zakonisht ).
Testi LM i Parkut
Parku (1966) zhvilloi një test alternativLM, i cili ndjek hapat e mëposhtëm:

1. Kryejmë regresionin:
 
(1)

dhe përftojmë mbetjet e ekuacionit të vlerësuar.

2. Kryejmë regresionin ndihmës:

(2)

3. Formulojmë hipotezën bazë dhe atë alternative.

=0

të paktën një prej

4. Llogarisim statistikën ku, është numri i vrojtimeve të përdorura në hapin 2, për ekuacionin
ndihmës dhe , koeficienti i përcaktueshmërisë për këtë regresion. Statistika ndjek shpërndarje
me shkallë lirie.
5. Rregulli i vendimit: Nëqoftëse për një nivel të caktuar rëndësie, , hidhet poshtë hipoteza bazë,
duke evidentuar praninë e heteroskedasticitetit (zakonisht ).
Testi Goldfeld-Quandt
Goldfeld dhe Quandt propozuan një test alternativ, bazuar tek idea se, nëqoftëse
variancat e mbetjeve janë të njëjta për të gjitha vrojtimet (janë homoskedastike),
atëherë varianca e një pjese të zgjedhjes do të ishte e njëjtë me variancën e pjesës
tjetër të zgjedhjes. Për këtë test nevojitet identifikimi i një variabli, i cili të ketë
lidhje sa më të madhe me variancën e mbetjeve. Kjo mund të shikohet nga
shpërndarja grafike e vlerave të mbetjeve kundrejt variablave shpjegues. Testi
Goldfeld-Quandt ndjek këto hapa:

 
1. Identifikojmë një variabël që ka lidhje të ngushtë me variancën e termit të gabimit.
2. Renditim vrojtimet e këtij variabli në shkallën zbritëse (nga vlera më e lartë në më të
ultën).
3. Ndajmë zgjedhjen në dy pjesë të barabarta (dy nënzgjedhje) duke larguar c vrojtime të
qëndrës. Secila nënzgjedhje do të ketë vrojtime. Nënzgjedhja e parë do të përmbajë
vlerat më të larta dhe e dyta vlerat më të ulta.
4. Kryejmë regresionin e variablit të interesit Y, kundrejt dy nënzgjedhjeve të variablit
shpjegues të zgjedhur X dhe përftojmë SKG për çdo ekuacion.
5. Llogarisim statistikën F sipas formulës:
ku, është ajo me vlerë më të madhe. Statistika F ka shpërndarje të Fisherit me shkallë lirie , për
numëruesin dhe , për emëruesin, ku, k është numri total i parametrave.

6.  
Rregulli i vendimit. Refuzojmë hipotezën bazë që favorizon homoskedasticitetin, nëqoftëse , për
një nivel të caktuar rëndësie.

Ideja prapa formulës së statistikës F është se, nëqoftëse termat e gabimit janë homoskedastikë,

atëherë varianca e mbetjeve për çdo nënzgjedhje do të jetë e njëjtë, si rrjedhojë raporti midis tyre

do të jetë unitar. Nëqoftëse raporti midis variancave do të jetë në mënyrë të rëndësishme më i madh

se 1, do të rëzojmë hipotezën bazë. Në këtë rast mund të themi që heteroskedasticiteti është i

pranishëm.

Vlera për c, zgjidhet në mënyrë arbitrare dhe zakonisht është diku midis 1/6 dhe 1/3 të vrojtimeve.

Testi Goldfeld-Quandt është shumë popullor për regresionin e thjeshtë, por ka një mangësi. Ai nuk

merr parasysh rastin kur heteroskedasticiteti shkaktohet nga më tepër se një variabël shpjegues.
Testi White

White (1980) zhvilloi një test më të përgjithshëm për heteroskedasticiteti, që

eleminon problemet e hasura në testet e mësipërme. Edhe testi White është një

test LM por, ai ka disa avantazhe:

1. Për kryerjen e testit, nuk nevojiten njohje paraprake.


2. Testi nuk ndikohet nga supozimi i shpërndarjes normale, siç ndodh p.sh. me
testin Breusch-Pagan
3. Propozohet një zgjedhje e veçantë, për variablat shpjegues të regresionit
ndihmës
Marrim në konsideratë një model me dy variabla shpjegues:
(1)
Hapat që ndjek testi janë si vijon:  
1. Kryejmë regresionin e ekuacionit 1 dhe përftojmë mbetjet e ekuacionit të vlerësuar.
 
2. Kryejmë regresionin ndihmës të mbetjeve në katror, në të gjithë variablat shpjegues, në katrorët e
tyre dhe në efektin e tyre bashkëveprues:

(2)

3. Formulojmë hipotezën bazë dhe atë alternative.


=0

të paktën një prej

3. Llogarisim statistikën ku, është numri i vrojtimeve të përdorura në hapin 2, për ekuacionin
ndihmës dhe , koeficienti i përcaktueshmërisë për këtë regresion. Statistika ndjek shpërndarje me
shkallë lirie.
4. Rregulli i vendimit: Nëqoftëse për një nivel të caktuar rëndësie, , hidhet poshtë hipoteza bazë, duke
evidentuar praninë e heteroskedasticitetit (zakonisht ).
Testi White, si test më i plotë dhe me disa avantazhe kundrejt testeve të tjera rekomandohet,
pavarësisht se, për shkak të përfshirjes në regresion të efekteve bashkëvepruese, mund të rritë së
tepërmi numrin e regresorëve.
Zgjidhja e problemit me praninë e heteroskedasticitetit

Nëqoftëse gjejmë që heteroskedasticiteti është i pranishëm, mund të proçedojmë në dy mënyra:

 
1. Mund të rivlerësojmë modelin në një mënyrë që njeh plotësisht problemin. Kjo
realizohet nëpërmjet metodës së përgjithshme të katrorëve më të vegjël (MPKV). Sipas
kësaj metode prodhohet një bashkësi e re vlerësimesh parametrike, e cila do të jetë më
efiçiente se bashkësia e vlerësimeve parametrike të prodhuara me MZKV. Rrjedhimisht,
do të kemi dhe një bashkësi më të saktë kovariancash dhe statistikash t.
2. Mund të njohim që, megjithëse nuk është vlerësuesi më i mirë, ai vazhdon të jetë
konsistent dhe problem mbeten vetëm kovariancat dhe statistikat t, të cilat janë të
gabuara. Si pasojë, mund të korrigjojmë vetëm kovariancat dhe statistikat t, duke u
mbështetur tek formula:
Metoda konsistente vlerësimi në prani të heteroskedasticitetit
White (1980) propozoi një metodë përftimi të vlerësuesve konsistentë të variancave
dhe kovariancave të vlerësuesve MZKV. Metoda robuste e korrigjimit të
heteroskedasticitetit nëpërmjet gabimeve standarte konsiston si më poshtë:
Marrim në konsideratë një model regresioni të thjeshtë:

(1)
 
ku,
Dimë që (2)
Përderisa nuk mund të vrojtohet në mënyrë të drejtpërdrejtë, White propozoi
përdorimin e në vend të dhe vlerësimin e variancës së vlerësuesit MZKV si më
poshtë:
(3)
White tregoi se, kur madhësia e zgjedhjes rritet pambarimisht, vlerësuesi i formulës 3
konvergon drejt atij të formulës 2, pra është konsistent.

You might also like