You are on page 1of 21

Vilniaus universitetas

Matematikos ir informatikos fakultetas

Kursinis darbas

Namų ūkių biudžetų ekonometrinė analizė

Simona Levickaitė ir Justina Sasnauskaitė


Vadovas: Prof., Habil. Dr. Vydas Čekanavičius

VILNIUS 2017

1
TURINYS

1. TIKSLAI ................................................................................................................................................3
2. ĮVADAS ................................................................................................................................................3
3.DUOMENŲ APŽVALGA...............................................................................................................................3
3.1 NAUDOJAMI KINTAMIEJI ...............................................................................................................................3
3.2 GEOGRAFINIS IŠLAIDŲ PASISKIRSTYMAS LITAIS ...................................................................................................4
3.3 GEOGRAFINIS IŠLAIDŲ PASISKIRSTYMAS PROCENTAIS ..........................................................................................5
3.4 IŠLAIDŲ PASISKIRSTYMAS PAGAL NAMŲ ŪKIO GALVOS IŠSILAVINIMĄ PROCENTAIS ....................................................7
3.5 GEOGRAFINIS IŠSILAVINIMO PASISKIRSTYMAS PROCENTAIS ..................................................................................9
3.6 STATISTINIŲ KRITERIJŲ TIKRINIMAS .............................................................................................................. 11
4. KINTAMŲJŲ PRIKLAUSOMYBĖS .......................................................................................................... 13
4.1 GRAFINIS KORELIACIJŲ VAIZDAVIMAS ................................................................................................................... 13
5. REGRESINIAI MODELIAI ...................................................................................................................... 14
5.1 REGRESIJOS FORMULĖS ..................................................................................................................................... 14
5.2 REGRESIJOS PRIELAIDOS ............................................................................................................................. 17
5.3 LOGISTINĖ REGRESIJA................................................................................................................................. 20
6. LITERATŪROS SĄRAŠAS ...................................................................................................................... 21

2
1. TIKSLAI
1) analizuoti namų ūkių biudžetų skirtumus atsižvelgiant į jų gyvenamą ją vietą : kuriame
mieste/regione žmonė s disponuoja didžiausiu (mažiausiu) biudžetu? Kokios gali būti to
priežastys? Ar tai daro į taką socialinei atskirčiai Lietuvoje?

2) analizuoti sąryšį tarp namų ūkio biudžeto, skirto kultūros ir švietimo reikmė ms, bei jo
išsilavinimo ir gyvenamosios vietos: ar labiau išsilavinę gyventojai turi tendenciją daugiau lė šų
skirti kultūrai ir švietimui? Ar galime teigti, kad tokių namų ūkių koncentracija geografiškai
reikšmingai skiriasi?
3) analizuoti, ar egzistuoja skirtingos namų ūkių biudžeto tendencijos atsižvelgiant į kitus
socialinius faktorius (pavyzdžiui, profesiją ) sudaryti regresinį modelį turimiems duomenims.

2. ĮVADAS
Namų ūkis – tai atskirai gyvenantis vienas asmuo arba asmenų grupė, gyvenanti viename bute ar name
bei disponuojanti bendru biudžetu. Plačiąja prasme, namų ūkį galime traktuoti kaip asmenį ar asmenų
grupę, kuri priima bendrus sprendimus dėl lėšų paskirstymo – maisto ir kitų pragyvenimui reikalingų
priemonių įsigyjimo. Pabrėžiame, kad tiriame privataus namų ūkio biudžetą, instituciniai namų ūkiai
nėra apžvelgiami (tai gali būti senelių namų, įkalinimo įstaigų ir panašių institucijų duomenys).
Namų ūkio biudžeto statistinio tyrimo tikslas yra įvertinti namų ūkio vartojimo išlaidas ir jų struktūrą,
būsto sąlygas įvairiose namų ūkių grupėse pagal gyvenamąją vietą, pagrindinį pajamų šaltinį, pajamų
dydį, namų ūkio sudėtį, jo galvos išsilavinimą ir amžių. Namų ūkio galva laikomas asmuo, turintis
didžiausias pajamas arba paties namų ūkio nurodytas asmuo. Namų ūkių statistinis tyrimas reikalingas
skaičiuoti makroekonominiams rodikliams, tarp jų ir gyvenimo lygiui nustatyti.
Turimus duomenis galime suskirstyti pagal tipą į kiekybinius (tolydžius kintamuosius – amžius, pajamos
ir kt. ir diskrečius kintamuosius – šeimos dydis ir vaikų skaičius ir kt.) ir kokybinius (lytis, išsilavinimas,
šeimyninė ir socialinė padėtis, gyvenamoji vieta ir kt.).
Šiame pirmajame kursinio darbo juodraštyje apžvelgsime turimus duomenis, jų koreliacijas, sudarysime
namų ūkių profilius pagal gyvenamą ją vietą .

3.DUOMENŲ APŽVALGA
3.1 NAUDOJAMI KINTAMIEJI

Šaltinyje [1] pateikiami metinio namų ūkių statistinio tyrimo duomenys. Kursiniam darbui naudojame
Lietuvos statistikos departamento pateiktą 2012 metų namų ūkių biudžetų tyrimo viešą ją rinkmeną .
Lentelėse apžvelgiame turimus duomenis apie namų ūkių vartojimo išlaidas – pinigines ir natūrines
išlaidas vartojimo prekėms ir paslaugoms įsigyti, t.y., išlaidas maistui, drabužiams, avalynei, būstui
išlaikyti, transportui, sveikatos priežiūrai, kultūros, poilsio ir kitoms reikmėms.

3
1 lentelė: Namų ūkių vartojimo išlaidų duomenys iš „kintamieji2012.csv“ failo „Vart_isl12“

Pradiniai duomenų Tyrime naudoti Duomenų aprašymai


pavadinimai duomenų pavadinimai

hh_ident ID Namų ūkio ID


CHE00 viskam Visos namų ūkio vartojimo išlaidos
CHE01:CHE0122 maistui Maisto produktai ir nealkoholiniai gėrimai
CHE02:CHE023 svaigalams Alkoholiniai gėrimai ir tabako gaminiai
CHE03:CHE0322 aprangai Apranga ir avalynė
CHE04:CHE0455 bustui Būstas, vanduo, elektra, dujos ir kitas kuras
CHE05:CHE0562 apyvokai Būsto apstatymas, namų apyvokos įranga
CHE06:CHE063 sveikatai Sveikatos priežiūra
CHE07:CHE0736 transportui Transportas ir degalai
CHE08:CHE0831 komunikacijai Ryšiai ir pašto paslaugos
CHE09:CHE096 kulturai Laisvalaikis ir kultūra, atostogų išvykos
CHE10:CHE1051 svietimui Švietimas ir švietimo paslaugos
CHE11:CHE1121 viesbuciams Restoranai ir viešbučiai
CHE12:CHE1271 kitoms Kitos, niekur nepriskirtos, prekės ir paslaugos
2 lentelė: Namų ūkių socialiniai duomenys iš „kintamieji2012.csv“ failo „Household12“

Pradiniai duomenų Tyrime naudoti Duomenų aprašymai


pavadinimai duomenų pavadinimai

hh_ident ID Namų ūkio ID


hh_educ2 issilavinimas Namų ūkio galvos išsilavinimas
strata2 miestai Gyvenamoji vieta
x5 tyrimas5 Namų ūkio turėjimo vaikų statusas
3 lentelė: Namų ūkių socialiniai duomenys iš „kintamieji2012.csv“ failo „Individ12“

Pradiniai duomenų Tyrime naudoti Duomenų aprašymai


pavadinimai duomenų pavadinimai

y4 individ Namų ūkio ekonominio aktyvumo statusas

3.2 GEOGRAFINIS IŠLAIDŲ PASISKIRSTYMAS LITAIS

Atlikome namų ūkių biudžetų analizę atsižvelgiant į jų gyvenamąją vietą. Duomenis apie namų ūkių
lokaciją suskirstėme į septynis regionus – Vilnių, Kauną, Klaipėdą, Šiaulius, Panevėžį, kitus miestus ir
kaimus. Tikriname Lietuvos namų ūkių biudžetų segmentaciją litais pagal gyvenamąją vietą bendroms
išlaidoms, taip pat maisto produktų, alkoholinių gėri

mų ir tabako gaminių, transporto ir degalų, laisvalaikio ir kultūros, restoranų ir viešbučių bei švietimo
4
prekėms ir paslaugoms įsigyti. Darome hipotezę, kad didžiųjų miestų gyventojai disponuoja vidutiniškai
didesniu biudžetu nei kaimo ar kitų miestų namų ūkiai.

4 lentelė: Vidutinis išlaidų pasiskirstymas litais pagal regionus


Produktas Viskam Maistui Svaigalams Transportui Kultūrai Švietimui Viešbučiams
Regionas

Vilnius 6448 2072 160.74 676.7 341.41 69.77 254.5

Kaunas 6839 1933.8 211.68 803.5 347.7 44.27 286.3

Klaipėda 6018 1968.2 170.52 468.24 337.55 56.58 122.4

Šiauliai 6512.6 1952.6 197.96 693.6 334.81 66.96 156.7

Panevėžys 6487 2142.1 267.2 740 334.4 41.79 219.6

Kiti miestai 5594.2 1929.6 185.82 533.9 243.47 47.39 114.5

Kaimai 5307.2 2088 206.9 584.9 196.62 33.79 103.3

Iš 4 lentelės duomenų pastebime, kad didžiausiu bendru biudžetu disponuoja Kauno regiono namų ūkiai,
o mažiausiu – namų ūkiai iš kaimo regiono. Galime teigti, kad priimame pirminę hipotezę apie tai, kad
didesnių miestų namų ūkiai yra vidutiniškai turtingesni nei mažesnių miestų ar kaimų namų ūkiai. Tai
galime paaiškinti tuo, kad didesnių miestų gyventojai turi didesnį prieinamumą prie geriau apmokamų
darbo vietų, taip pat didesniuose miestuose yra daugiau užimtumo galimybių.
Skirtumai tarp biudžetų, prekių ir paslaugų prieinamumo, gyvenimo būdo ir turimų patogumų daro įtaką
socialinei atskirčiai tarp didžiųjų miestų ir mažesnių miestų bei kaimų gyventojų. Socialinė atskirtis gali
būti suprantama kaip tam tikrų gyventojų grupių atskyrimas nuo bendro visuomeninio gyvenimo. Šiuo
atveju galime teigti, kad mažesnių miestų bei kaimų gyventojai dėl ne taip plačiai išvystytos
infrastruktūros savo gyvenamojoje vietoje bei mažesnio biudžeto turi blogesnes sąlygas socializuotis ir
įsilieti į bendrą visuomeninį gyvenimą palyginus su didžiųjų miestų gyventojais.
Galime pastebėti, kad dėl didesnio biudžeto didžiųjų miestų namų ūkiai gali sau leisti išleisti daugiau
neprioritetinėms prekėms ir paslaugoms įsigyti – kultūros ir laisvalaikio bei švietimo reikmėms, taip pat
maitinimuisi restoranuose ir gyvenimui viešbučiuose. Tačiau, nors ir turėdami mažesnį biudžetą
palyginus su didžiųjų miestų namų ūkiais, mažesnių miestų bei kaimų namų ūkiai išleidžia panašią
piniginę sumą prioritetinėms maisto ir transporto prekėms bei paslaugoms.

3.3 GEOGRAFINIS IŠLAIDŲ PASISKIRSTYMAS PROCENTAIS

Atlikome procentinę kintamųjų sklaidos analizę pagal geografinius duomenis. Tikriname Lietuvos namų
ūkių biudžetų segmentaciją procentais pagal gyvenamąją vietą maisto produktų, alkoholinių gėrimų ir
tabako gaminių, transporto ir degalų, laisvalaikio ir kultūros, restoranų ir viešbučių bei švietimo prekėms
ir paslaugoms įsigyti. Darome hipotezę, kad didžiųjų miestų gyventojai didesnę savo išlaidų dalį skiria
gyvenimui viešbučiuose ir maitinimuisi restoranuose bei kultūros ir švietimo reikmėms.

5
1 pav: Lietuvos namų ūkių išlaidų pasiskirstymas

Iš 1 paveikslo pastebime, kad visi namų ūkiai didžiausią savo biudžeto dalį skiria prioritetinėms prekėms
ir paslaugoms įsigyti – maisto produktams, būsto išlaikymui, transportui bei degalams. Švietimo
reikmėms, alkoholiniams gėrimams ir maitinimuisi restoranuose bei gyvenimui viešbučiuose namų ūkiai
skiria mažiausią savo biudžeto dalį – 1-3%.

5 lentelė: Išlaidų pasiskirstymas procentais pagal regionus


Produktas Maistui Svaigalams Transportui Kultūrai Švietimui Viešbučiams
Regionas

Vilnius 58% 4% 19% 10% 2% 7%

Kaunas 53% 6% 22% 10% 1% 8%

Klaipėda 63% 5% 15% 11% 2% 4%

Šiauliai 57% 6% 20% 10% 2% 5%

Panevėžys 57% 7% 20% 9% 1% 6%

Kiti miestai 63% 6% 17% 8% 2% 4%

Kaimai 65% 6% 18% 6% 1% 3%

Iš 5 lentelės duomenų pastebime, kad maisto produktams didžiausią savo biudžeto dalį skiria kaimo
namų ūkiai, mažiausią – Kauno. Alkoholiniams gėrimams įsigyti daugiausiai biudžeto išleidžia
Panevėžio, mažiausiai – Vilniaus namų ūkiai, transporto ir degalų išlaidoms daugiausiai skiria Kauno,
mažiausiai – Klaipėdos namų ūkiai. Didžiausią savo biudžeto dalį laisvalaikiui ir kultūrai išleidžia
Klaipėdos namų ūkiai, mažiausią – namų ūkiai, gyvenantys kaimo vietovėse. Procentinėse išlaidose
švietimo prekėms ir paslaugoms įsigyti pastebime nedidelį skirtumą, visų regionų namų ūkiai skiria
panašią savo biudžeto dalį šioms reikmėms, tačiau Kauno, Panevėžio ir kaimų regionų namų ūkiai
6
linkę išleisti mažesnę biudžeto dalį švietimui, nei likę regionai. Maitinimuisi restoranuose ir gyvenimui
viešbučiuose daugiausiai biudžeto skiria Kauno, mažiausiai – kaimo regiono namų ūkiai.
Galime teigti, kad priimame hipotezę, kad didžiųjų miestų gyventojai didesnę procentinę savo biudžeto
dalį skiria gyvenimui viešbučiuose ir maitinimuisi restoranuose bei kultūros ir švietimo reikmėms nei
kaimo ir kitų miestų namų ūkiai. Tai galime paaiškinti tuo, kad didžiųjų miestų namų ūkiai yra
vidutiniškai turtingesni nei mažesnių miestų bei kaimų namų ūkiai, todėl gali didesnę dalį savo lėšų skirti
neprioritetinėms prekėms ir paslaugoms įsigyti. Verta pastebėti, kad, nors ir disponuodami mažesniu
biudžetu, mažesnių miestų bei kaimų namų ūkiai skiria didesnį ar tokį pat procentą savo biudžeto
neprioritetinėms alkoholinių gėrimų prekėms įsigyti palyginus su didžiųjų miestų namų ūkiais.

3.4 IŠLAIDŲ PASISKIRSTYMAS PAGAL NAMŲ ŪKIO GALVOS IŠSILAVINIMĄ


PROCENTAIS

Atlikome procentinę namų ūkių biudžetų analizę atsižvelgiant į jų galvos išsilavinimo lygį. Duomenis
apie namų ūkių išsilavinimą suskirstėme į penkias grupes – namų ūkius su pradiniu arba žemesniu,
pagrindiniu, viduriniu, aukštesniojo ar aukštojo nesuteikiančiu poviduriniu bei aukštesniuoju ir aukštuoju
išsilavinimu. Tikriname Lietuvos namų ūkių biudžetų segmentaciją procentais pagal išsilavinimą maisto
produktų, alkoholinių gėrimų ir tabako gaminių, transporto ir degalų, laisvalaikio ir kultūros, restoranų
ir viešbučių bei švietimo prekėms ir paslaugoms įsigyti. Darome hipotezę, kad namų ūkiai su jų galvos
aukštesniu išsilavinimu didesnę savo biudžeto dalį skiria neprioritetinėms prekėms ir paslaugoms įsigyti
– kultūrai ir laisvalaikiui, švietimo reikmėms bei maistui restoranuose ir gyvenimui viešbučiuose
palyginus su namų ūkiais, kurių galva turi žemesnį išsilavinimą.

2 pav: Respondentų su pradiniu ar žemesniu 3 pav: Respondentų su pagrindiniu


išsilavinimu išlaidų pasiskirstymas išsilavinimu išlaidų pasiskirstymas

Iš 2 paveikslo matome, kad namų ūkiai su jų galvos pradiniu ar žemesniu išsilavinimu didžiają
dalį biudžeto skiria būtinosioms maisto produktų reikmėms patenkinti, o visai neskiria arba skiria
nedidelę dalį lėšų švietimo bei kultūros prekėms ir paslaugoms įsigyti, taip pat maistui
restoranuose ir gyvenimui viešbučiuose. Iš 3 paveikslo pastebime, kad namų ūkiai su jų galvos
pagrindiniu išsilavimu taip pat didžiąją dalį biudžeto išleidžia būtinosioms maisto produktų
reikmėms, tačiau procentaliai didesnę dalį lėšų skiria kultūros ir laisvalaikio, transporto ir degalų
7
bei maisto restoranuose ir gyvenimo viešbučiuose prekėms ir paslaugoms įsigyti.

4 pav: Respondentų su viduriniu 5 pav: Respondentų su aukštesniojo ar


išsilavinimu išlaidų pasiskirstymas aukštojo nesuteikiančiu poviduriniu
išsilavinimu išlaidų pasiskirstymas

6 pav: Respondentų su aukštesniuoju ar


aukštuoju išsilavinimu išlaidų
pasiskirstymas

Iš 4 ir 5 paveikslo pastebime, kad namų ūkiai su jų galvos viduriniu ir aukštesniojo ar aukštojo
nesuteikiančiu poviduriniu išsilavimu taip pat didžiąją dalį biudžeto išleidžia būtinosioms maisto
produktų reikmėms, tačiau procentaliai didesnę dalį biudžeto skiria kultūros ir laisvalaikio,
transporto ir degalų bei maisto restoranuose ir gyvenimo viešbučiuose prekėms ir paslaugoms
įsigyti nei namų ūkiai su jų galvos žemesniu išsilavinimu. Iš 6 paveikslo matome, kad namų ūkiai
su jų galvos aukštesniuoju ar aukštuoju išsilavinimu skiria didesnę biudžeto dalį kultūros ir
laisvalaikio prekėms ir paslaugoms įsigyti bei maisto restoranuose ir gyvenimo viešbučiuose
reikmėms patenkinti palyginus su namų ūkiais, kurių galva turi žemesnį išsilavinimą.
Galime teigti, kad priimame hipotezę, jog namų ūkiai su jų galvos aukštesniu išsilavinimu didesnę
savo biudžeto dalį skiria neprioritetinėms prekėms ir paslaugoms įsigyti – kultūrai ir laisvalaikiui,
švietimo reikmėms bei maistui restoranuose ir gyvenimui viešbučiuose palyginus su namų ūkiais,
kurių galva turi žemesnį išsilavinimą. Galima konstatuoti, kad labiau išsilavinę namų ūkiai turi
tendenciją didesnę savo biudžeto dalį skirti kultūros ir švietimo reikmėms patenkinti. Taip pat
verta pastebėti, kad namų ūkiai su jų galvos aukštesniu išsilavinimu skiria tendencingai mažesnį

8
procentą savo biudžeto maisto produktams įsigyti. Taip gali būti dėl to, kad namų ūkiai su jų galvos
aukštesniu išsilavinimu yra galimai turtingesni, dėl to gali sau leisti didesnę dalį lėšų skirti
neprioritetinėms prekėms ir paslaugoms įsigyti, o prioritetiniai maisto produktų poreikiai nesudaro
tokios didelės bendrų išlaidų dalies.

3.5 GEOGRAFINIS IŠSILAVINIMO PASISKIRSTYMAS PROCENTAIS

Atlikome procentinę namų ūkių galvos išsilavinimo analizę pagal gyvenamąją vietą. Tikriname
Lietuvos namų ūkių galvos išsilavinimo lygio segmentaciją procentais atsižvelgiant į namų ūkių
gyvenamąją vietą. Darome hipotezę, kad namų ūkiai iš didžiųjų miestų dažniau turi aukštesnį
išsilavinimo laipsnį nei namų ūkiai iš kitų miestų ir kaimų regionų.

7 pav: Vilniaus namų ūkių galvos 8 pav: Kauno namų ūkių galvos
išsilavinimo lygio pasiskirstymas išsilavinimo lygio pasiskirstymas

Iš 7 paveikslo pastebime, kad Vilniaus namų ūkių galva dažniausiai turi aukštesnįjį ar aukštąjį
išsilavinimą, rečiausiai – pradinį ar žemesnį. Tokią pat tendenciją pastebime ir 8 paveiksle – Kauno
regiono duomenyse.

9 pav: Klaipėdos namų ūkių galvos 10 pav: Šiaulių namų ūkių galvos
išsilavinimo lygio pasiskirstymas išsilavinimo lygio pasiskirstymas

9
9 ir 10 paveiksluose taip pat matome, kad didžiąją dalį namų ūkių sudaro namų ūkiai su jų galvų
aukštesniuoju ir aukštuoju išsilavinimu. Tačiau pastebime, kad Klaipėdos ir Šiaulių duomenyse
namų ūkių su jų galvų pradiniu arba žemesniu išsilavinimu yra 3-5% daugiau nei Vilniaus ir
Kauno regionų namų ūkių duomenyse.

11 pav: Panevėžio namų ūkių galvos 12 pav: Kitų miestų namų ūkių galvos
išsilavinimo lygio pasiskirstymas išsilavinimo lygio pasiskirstymas

13 pav: Kaimų namų ūkių galvos


išsilavinimo lygio pasiskirstymas

11 paveiksle pastebime, kad Panevėžio namų ūkių galvos daugiausia turi aukštesniojo ar aukštojo
nesuteikiantį povidurinį išsilavinimą, o ne aukštesnįjį ar aukštąjį, kaip pastebėjome 7-10
paveiksluose. 12 paveiksle matome, kad kitų miestų namų ūkių galvos dažniausiai turi vidurinį ar
aukštesniojo ir aukštojo nesuteikiantį povidurinį išsilavinimą, nustumdami aukštąjį išsilavinimą
turinčias namų ūkių galvas į trečią vietą pagal procentalų pasiskirstymą. 13 paveiksle stebime
kaimų duomenis, kuriuose namų ūkių galvos taip pat dažniausiai turi vidurinį ar aukštesniojo ir
aukštojo nesuteikiantį povidurinį išsilavinimą. Galime pastebėti, kad čia yra didžiausias procentas
namų ūkių, kurių galvos turi pradinį ar žemesnį išsilavinimą, tokių yra 1% mažiau nei turinčių
aukštesnįjį ar aukštąjį išsilavinimą.
Galime teigti, jog priimame hipotezę, kad namų ūkiai iš didžiųjų miestų dažniau turi aukštesnį
išsilavinimo laipsnį nei namų ūkiai iš kitų miestų ir kaimų regionų, nes didžiuosiuose miestuose
egzistuoja reikšmingai didesnė koncentracija namų ūkių, kurių galvos turi aukštesnįjį ar aukštąjį

10
išsilavinimo laipsnį palyginus su namų ūkiais iš kitų miestų bei kaimų. Toks pasiskirstymas gali
egzistuoti dėl to, kad mažesnių miestų bei kaimų gyventojai turi prastesnę prieigą prie aukštesniojo
ar aukštojo išsilavinimo, nes institucijos, galinčios suteikti tokio lygio išsilavinimą, dažniausiai
yra didesniuose miestuose. Įtaką gali daryti ir tai, kad didžiuosiuose miestuose namų ūkiai yra
turtingesni nei mažesniuose miestuose ir kaimuose, taip pat didesniame mieste lengviau galima
rasti darbo vietą pagal turimą kvalifikaciją ir išsilavinimo lygį, yra didesnės galimybės
socializacijai bei įsiliejimui į bendrą visuomeninį gyvenimą.

3.6 STATISTINIŲ KRITERIJŲ TIKRINIMAS

Atlikome turimų duomenų analizę naudodami statistinius kriterijus – Stjudento t-testą, ANOVA,
dažnių lenteles.

Suskirstėme duomenis į grupes:

1. Pagal gyvenamąją vietą: 2. Pagal išsilavinimą:


1.1. Penki didieji miestai; 2.1. Aukštasis išsilavinimas;
1.2. Kiti miestai bei kaimai. 2.2. Kitas išsilavinimas.

Atlikome analizę naudodami dažnių lenteles. 6 lentelėje matosi skirtumas tarp gyvenamosios
vietos ir namų ūkio turimo išsilavinimo – galime teigti, kad penkiuose didžiuosiuose miestuose
namų ūkių, kurių galva turi aukštąjį išsilavinimą, yra daugiau nei kituose miestuose bei kaimuose.

6 lentelė: santykinių dažnių lentelė

Gyvenamoji Kiti miestai bei Penki didieji


vieta
Išsilavinimas kaimai miestai
Aukštasis
išsilavinimas 0.17 0.83
Kitas
išsilavinimas 0.39 0.61

Atlikome Stjudento t-testą dviems nepriklausomoms imtims, kad atsakytume į klausimą, ar namų
ūkių vidutinės išlaidos kultūros ir laisvalaikio reikmėms priklauso nuo gyvenamosios vietos.

𝐻0 : 𝜇𝑚𝑖𝑒𝑠𝑡ų = 𝜇𝑘𝑎𝑖𝑚ų
𝐻1 : 𝜇𝑚𝑖𝑒𝑠𝑡ų > 𝜇𝑘𝑎𝑖𝑚ų

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Vidurkiai
statistiškai reikšmingai skiriasi. Taigi, galime teigti, kad egzistuoja statistiškai reikšmingas
skirtumas tarp didžiųjų miestų namų ūkių ir kitų miestų bei kaimų namų ūkių vidutinių išlaidų
kultūros ir laisvalaikio reikmėms. Didžiųjų miestų namų ūkiai kultūrai išleidžia daugiau nei kaimų
namų ūkiai.

Atlikome Stjudento t-testą dviems nepriklausomoms imtims, kad atsakytume į klausimą, ar

11
didžiųjų miestų namų ūkių vidutinės išlaidos kultūros ir laisvalaikio reikmėms priklauso nuo
turimo išsilavinimo.

𝐻0 : 𝜇𝑎𝑢𝑘š𝑡𝑎𝑠𝑖𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 = 𝜇𝑘𝑖𝑡𝑎𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠


𝐻1 : 𝜇𝑎𝑢𝑘š𝑡𝑎𝑠𝑖𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 > 𝜇𝑘𝑖𝑡𝑎𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Vidurkiai
statistiškai reikšmingai skiriasi. Taigi, galime teigti, kad egzistuoja statistiškai reikšmingas
skirtumas tarp didžiųjų miestų namų ūkių su jų galvos aukštuoju išsilavinimu ir didžiųjų miestų
namų ūkių su jų galvos kitu išsilavinimu vidutinių išlaidų kultūros ir laisvalaikio reikmėms.
Didžiųjų miestų namų ūkiai su jų galvos aukštuoju išsilavinimu kultūros reikmėms vidutiniškai
išleidžia daugiau nei namų ūkiai su jų galvos kitu išsilavinimu.

Atlikome Stjudento t-testą dviems nepriklausomoms imtims, kad atsakytume į klausimą, ar kitų
miestų bei kaimų namų ūkių vidutinės išlaidos kultūros ir laisvalaikio reikmėms priklauso nuo
turimo išsilavinimo.

𝐻0 : 𝜇𝑎𝑢𝑘š𝑡𝑎𝑠𝑖𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 = 𝜇𝑘𝑖𝑡𝑎𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠


𝐻1 : 𝜇𝑎𝑢𝑘š𝑡𝑎𝑠𝑖𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 > 𝜇𝑘𝑖𝑡𝑎𝑠 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Vidurkiai
statistiškai reikšmingai skiriasi. Taigi, galime teigti, kad egzistuoja statistiškai reikšmingas
skirtumas tarp kitų miestų bei kaimų namų ūkių su jų galvos aukštuoju išsilavinimu ir kitų miestų
bei kaimų namų ūkių su jų galvos kitu išsilavinimu vidutinių išlaidų kultūros ir laisvalaikio
reikmėms. Kitų miestų ir kaimų namų ūkiai su jų galvos aukštuoju išsilavinimu kultūros reikmėms
vidutiniškai išleidžia daugiau nei namų ūkiai su jų galvos kitu išsilavinimu.

Atlikome ANOVA testą, kad atsakytume į klausimą, ar vidutinės išlaidos kultūros ir laisvalaikio
reikmėms skiriasi tarp penkių didžiųjų miestų. Populiacijos tiriamasis kintamasis yra išlaidos
kultūrai, o požymis – išsilavinimas.

𝐻0 : 𝑣𝑖𝑠𝑖 𝑝𝑒𝑛𝑘𝑖 𝑣𝑖𝑑𝑢𝑟𝑘𝑖𝑎𝑖 𝑙𝑦𝑔ū𝑠


𝐻1 : 𝑏𝑒𝑛𝑡 𝑑𝑢 𝑣𝑖𝑑𝑢𝑟𝑘𝑖𝑎𝑖 𝑛𝑒𝑙𝑦𝑔ū𝑠

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Bent du vidurkiai
statistiškai reikšmingai skiriasi. Atlikome Post-hoc kriterijų analizę, naudojome Tukey HSD
kriterijų. Gavome, kad visi 𝑝 − 𝑎𝑑𝑗 < 0.05 =  . Visi vidurkiai statistiškai reikšmingai skirasi.
Galime teigti, kad išlaidos kultūrai ir laisvalaikio reikmėms priklauso nuo išsilavinimo.

Atlikome ANOVA testą, kad atsakytume į klausimą, ar vidutinės išlaidos kultūros ir laisvalaikio
reikmėms skiriasi tarp visų miestų, ne tik penkių didžiųjų.

𝐻0 : 𝑣𝑖𝑠𝑖 𝑣𝑖𝑑𝑢𝑟𝑘𝑖𝑎𝑖 𝑙𝑦𝑔ū𝑠


𝐻1 : 𝑏𝑒𝑛𝑡 𝑑𝑢 𝑣𝑖𝑑𝑢𝑟𝑘𝑖𝑎𝑖 𝑛𝑒𝑙𝑦𝑔ū𝑠

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Bent du vidurkiai
statistiškai reikšmingai skiriasi. Atlikome Post-hoc kriterijų analizę, naudojome Tukey HSD

12
kriterijų. Pagal gautas 𝑝 − 𝑎𝑑𝑗 reikšmes gavome, kad vidutinės išlaidos kultūros ir laisvalaikio
reikmėms statistiškai reikšmingai skiriasi tiek tarpusavyje tarp penkių didžiųjų miestų namų ūkių,
tiek tarp penkių didžiųjų miestų kartu bei kaimų namų ūkių, tiek tarp penkių didžiųjų miestų kartu
bei kitų miestų namų ūkių. Pagal geografinius namų ūkių duomenis išlaidos kultūrai ir laisvalaikio
reikmėms yra nevienodos statistiškai reikšmingai.

Suskirstėme duomenis į šešias dalis pagal namų ūkių galvos ekonominio aktyvumo statusą –
dirbantis asmuo, bedarbis, pensininkas, moksleivis / studentas, ekonomiškai neaktyvus asmuo
(namų šeimininkas), neįgalus asmuo.

Atlikome ANOVA testą, kad atsakytume į klausimą, ar vidutinės išlaidos kultūros ir laisvalaikio
reikmėms skiriasi pagal jų galvos ekonominio aktyvumo statusą.

𝐻0 : 𝑣𝑖𝑠𝑖 š𝑒š𝑖 𝑣𝑖𝑑𝑢𝑟𝑘𝑖𝑎𝑖 𝑙𝑦𝑔ū𝑠


𝐻1 : 𝑏𝑒𝑛𝑡 𝑑𝑢 𝑣𝑖𝑑𝑢𝑟𝑘𝑖𝑎𝑖 𝑛𝑒𝑙𝑦𝑔ū𝑠

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Bent du vidurkiai
statistiškai reikšmingai skiriasi. Atlikome Post-hoc kriterijų analizę, naudojome Tukey HSD
kriterijų. Pagal 𝑝 − 𝑎𝑑𝑗 reikšmes gavome, kad namų ūkiai, kurių galva yra pensininkai, kultūros
ir laisvalaikio reikmėms išleidžia statistiškai vienodą biudžetą kaip ir namų ūkiai, kurių galva yra
ekonomiškai neaktyvūs asmenys (namų šeimininkai), moksleiviai bei neįgalieji. Vidutiniai
biudžetai kultūros ir laisvalaikio reikmėms statistiškai reikšmingai skiriasi tarp namų ūkių, kurių
galva yra dirbantis asmuo bei kitoms kategorijoms priklausančių namų ūkių.

Atlikome Stjudento t-testą dviems nepriklausomoms imtims, kad atsakytume į klausimą, ar namų
ūkių vidutinės išlaidos kultūros ir laisvalaikio reikmėms priklauso nuo to, ar namų ūkis turi vaikų.

𝐻0 : 𝜇𝑡𝑢𝑟𝑖 𝑣𝑎𝑖𝑘ų = 𝜇𝑛𝑒𝑡𝑢𝑟𝑖 𝑣𝑎𝑖𝑘ų


𝐻1 : 𝜇𝑡𝑢𝑟𝑖 𝑣𝑎𝑖𝑘ų > 𝜇𝑛𝑒𝑡𝑢𝑟𝑖 𝑣𝑎𝑖𝑘ų

Atlikę tyrimą, gavome, kad p-reikšmė < 0.05 =   atmetame nulinę hipotezę. Vidurkiai
statistiškai reikšmingai skiriasi. Taigi, galime teigti, kad namų ūkiai, turintys vaikų, kultūrai ir
laisvalaikio reikmėms vidutiniškai išleidžia statistiškai reikšmingai daugiau nei bevaikiai namų
ūkiai.

4. KINTAMŲJŲ PRIKLAUSOMYBĖS
4.1 GRAFINIS KORELIACIJŲ VAIZDAVIMAS

Atlikome koreliacinę kintamųjų analizę, kurioje tikrinome koreliaciją tarp lėšų, skirtų maisto
produktų, alkoholinių gėrimų ir tabako gaminių, transporto ir degalų, laisvalaikio ir kultūros,
švietimo bei restoranų ir viešbučių prekėms ir paslaugoms įsigyti.

14 paveiksle matome tendenciją, kad namų ūkiai, daugiau išleidžiantys laisvalaikio ir kultūros
reikmėms, daugiau išleidžia ir gyvenimui viešbučiuose bei maitinimuisi restoranuose. Galima
sakyti, kad šie namų ūkiai turi daugiau laisvų lėšų skirti neprioritetinėms prekėms ir paslaugoms

13
įsigyti. Taip pat pastebime, kad namų ūkiai, daugiau išleidžiantys transporto ir degalų prekėms ir
paslaugoms įsigyti, daugiau išleidžia ir kultūros bei laisvalaikio reikmėms.

14 pav: Koreliacinė kintamųjų analizė

5. REGRESINIAI MODELIAI
5.1 REGRESIJOS FORMULĖS

Sukūrėme tris regresinius modelius kultūros ir laisvalaikio prekių ir paslaugų biudžetui – kaimo
regionų, didžiųjų miestų ir kitų miestų.

Turime regresinį modelį:

išlaidos kultūrai = log(visos išlaidos + 1) + log(išlaidos švietimui + 1) + išsilavinimas +


ekonominis aktyvumas

14
Kaimo modelis:

𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 𝑘𝑢𝑙𝑡ū𝑟𝑎𝑖
= −14.7248 + 2.166 ∙ 𝑙𝑜𝑔(𝑣𝑖𝑠𝑜𝑠 𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 + 1) + 0.0629
∙ 𝑙𝑜𝑔(𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 š𝑣𝑖𝑒𝑡𝑖𝑚𝑢𝑖 + 1) + 0.189𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 + 0.2502
∙ 𝑒𝑘𝑜𝑛𝑜𝑚𝑖𝑛𝑖𝑠 𝑎𝑘𝑡𝑦𝑣𝑢𝑚𝑎𝑠

Gavome koeficientų lentelę:

Estimate Std.Error t value Pr (>|t|)


Intercept -14.72 0.61 -23.95 <2e-16
log(visos išlaidos + 1) 2.17 0.08 28.33 <2e-16
log(išlaidos švietimui + 1) 0.06 0.03 2.05 0.04
išsilavinimas 0.19 0.1 1.98 0.05
ekonominis aktyvumas 0.25 0.1 2.58 0.01

Modelio R kvadratas yra 0.3524, pakoreguotas R kvadratas - 0.3512. Visi regresoriai reikšmingi.

Didžiųjų miestų modelis:

𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 𝑘𝑢𝑙𝑡ū𝑟𝑎𝑖
= −8.09892 + 1.47496 ∙ 𝑙𝑜𝑔(𝑣𝑖𝑠𝑜𝑠 𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 + 1) + 0.02089
∙ 𝑙𝑜𝑔(𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 š𝑣𝑖𝑒𝑡𝑖𝑚𝑢𝑖 + 1) + 0.28341 ∙ 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 + 0.34281
∙ 𝑒𝑘𝑜𝑛𝑜𝑚𝑖𝑛𝑖𝑠 𝑎𝑘𝑡𝑦𝑣𝑢𝑚𝑎𝑠

Gavome koeficientų lentelę:

Estimate Std.Error t value Pr (>|t|)


Intercept -8.1 0.48 -16.86 <2e-16
log(visos išlaidos + 1) 1.48 0.06 25.1 <2e-16
log(išlaidos švietimui + 1) 0.02 0.02 1.26 0.21
išsilavinimas 0.28 0.6 4.81 1.62e-06
ekonominis aktyvumas 0.34 0.7 5.08 3.96e-07

Modelio R kvadratas yra 0.3223, pakoreguotas R kvadratas - 0.3213. Visi regresoriai reikšmingi,
išskyrus išlaidas švietimui (p-value = 0.209, bet regresorius neturi nė vienos reikšmingumo
žvaigždės (significance star)).

15
Kitų miestų modelis:

𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 𝑘𝑢𝑙𝑡ū𝑟𝑎𝑖
= −11.21131 + 1.83364 ∙ 𝑙𝑜𝑔(𝑣𝑖𝑠𝑜𝑠 𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 + 1) + 0.02749
∙ 𝑙𝑜𝑔(𝑖š𝑙𝑎𝑖𝑑𝑜𝑠 š𝑣𝑖𝑒𝑡𝑖𝑚𝑢𝑖 + 1) – 0.02196 ∙ 𝑖š𝑠𝑖𝑙𝑎𝑣𝑖𝑛𝑖𝑚𝑎𝑠 + 0.22833
∙ 𝑒𝑘𝑜𝑛𝑜𝑚𝑖𝑛𝑖𝑠 𝑎𝑘𝑡𝑦𝑣𝑢𝑚𝑎𝑠

Gavome koeficientų lentelę:

Estimate Std.Error t value Pr (>|t|)


Intercept -11.21 0.62 -18.14 <2e-16
log(visos išlaidos + 1) 1.43 0.08 24.11 <2e-16
log(išlaidos švietimui + 1) 0.03 0.02 1.19 0.23
išsilavinimas – 0.02 0.8 -0.28 0.79
ekonominis aktyvumas 0.23 0.9 2.64 0.01

Modelio R kvadratas yra 0.3012, pakoreguotas R kvadratas - 0.2998. Ne visi regresoriai reikšmingi
– švietimo išlaidų kintamojo p-value = 0.23289, bet nėra nei vienos reikšmingumo žvaigždės
(significance star), o išsilavinimo kintamojo p-value = 0.78618, bet taip pat nėra nei vienos
reikšmingumo žvaigždės (significance star).

Išvada: R-kvadratai pakankamai neblogi. Visų modelių ne mažiau nei 30 % reikšmių paaiškinta
regresorių.

Atlikus Stjudento kriterijų atskiriems regresoriems, visur gavome, kad p-value < . Visų modelių
abu išlaidų regresoriai statistiškai reikšmingi.

16
5.2 REGRESIJOS PRIELAIDOS

Atlikome regresijos prielaidų tikrinimą:

1. Dispersijos mažėjimo daugiklis (VIF) – tikriname, ar nėra multikolinearumo.

Nė vienas VIF nėra didesnis už 4, todėl multikolinearumo nėra.

2. DFBETA – tikriname įtakingiausius regresorius.

Kaimo modelis:

Intercept 0.00
log(visos išlaidos + 1) 0.56
log(išlaidos švietimui + 1) 0.04
išsilavinimas 0.04
ekonominis aktyvumas 0.05

Šiame modelyje įtakingiausias regresorius yra bendros išlaidos, tada išlaidos švietimui, po jų –
išsilavinimas.

Didžiųjų miestų modelis:

Intercept 0.00
log(visos išlaidos + 1) 0.48
log(išlaidos švietimui + 1) 0.02
išsilavinimas 0.08
ekonominis aktyvumas 0.1

Didžiųjų miestų modelyje įtakingiausias regresorius taip pat yra bendros išlaidos, tada ekonominis
aktyvumas, po jo – išsilavinimas ir galiausiai – išlaidos švietimo reikmėms.

Kitų miestų modelis:

17
Intercept 0.00
log(visos išlaidos + 1) 0.52
log(išlaidos švietimui + 1) 0.02
išsilavinimas -0.01
ekonominis aktyvumas 0.6

Kitų miestų modelyje įtakingiausias regresorius taip pat yra bendros išlaidos, po to eina
ekonominis aktyvumas ir išlaidos švietimui, paskutinėje vietoje – išsilavinimas.

3. Kuko matas

Kai Kuko matas > 1, laikoma, kad atitinkamas stebinys yra išskirtis. Patikrome hipotezę, kad
modeliuose yra išskirčių. Visiems modeliams atmetame nulinę hipotezę, kuri teigia, kad išskirčių
nėra.

4. Durbino – Vatsono statistika dėl autokoreliacijos

18
Jeigu Durbino – Vatsono statistikos reikšmė yra tarp 1.5 ir 2.5, tai laikoma, kad autokoreliacijos
nėra. Darome išvadą, kad nė viename modelyje autokoreliacijos neaptikome.

5. Liekamosios paklaidos, standartizuotos liekamosios paklaidos

Iš grafikų matome, kad modelių paklaidos nėra idealiai normalios. Labiausiai normaliomis
galėtume vadinti kaimo modelio paklaidas.

6. Sapiro – Vilko kriterijus

Visų modelių Sapiro – Vilko kriterijaus p-reikšmė < 0.05, todėl atmetame nulinę hipotezę, kuri
teigia, kad paklaidos yra normalios.

7. Liekamųjų paklaidų grafikai kiekvienam regresoriui

Visuose trijuose modeliuose aiškesnė tiesinė priklausomybė įžvelgiama su bendrų išlaidų


regresoriumi. Kažkas panašaus į priklausomybę matoma ir tarp išlaidų kultūros reikmėms ir
ekonominio aktyvumo.

8. Standartizuotųjų prognozuojamų reikšmių – liekamųjų paklaidų grafikas

19
5.3 LOGISTINĖ REGRESIJA

Logistinės regresijos modelio tikslumas – 0.87.

20
6. LITERATŪROS SĄRAŠAS
[1] Duomenys, pateikti Lietuvos statistikos departamento puslapyje
[2] Namų ūkių biudžetų rodiklių aprašymas, pateiktas Lietuvos statistikos departamento
puslapyje
[3] Hadley Wickham, Garrett Grolemund knyga „R for Data Science“
[4] Vydas Čekanavičius ir Gediminas Murauskas „Taikomoji regresinė analizė socialiniuose
tyrimuose“

21

You might also like