You are on page 1of 20

Idősorok elemzése

dr. Jeney László


egyetemi docens
jeney@elte.hu

Gazdasági folyamatok térbeli elemzése


Pesti karok I. alapszakjai (BSc/BA)
2017/2018, I. félév
BCE GGF Intézet Gazdaságföldrajz és Jövőkutatás Központ
Idősorok típusai: állapot és tartam idősorok

 Tartam idősorok:
– Pl. csapadék, vándorlás, természetes szaporodás, külföldi működő-tőke beáramlása,
turista-érkezések
– Adatsor tagjai összegezhetők (pl. napi csapadékok  havi csapadék)
– Adatsor tagjai csoportosíthatók (pl. minden év januári vendégforgalma)
 Állapot idősorok:
– Pl. népességszám, GDP, munkanélküliek, személygépkocsik
– Adatsor tagjai nem összegezhetők (max átlagolhatók)
 Mindkét idősortípusra igaz:
– Tagok sorrendje kötött, fel nem cserélhető, időrend (területi adatsor esetén ilyen nincs)

2
Idősorok elemzésénél használt indexek

 Bázisindex: idősor elemeinek kifejezése a bázisidőpont %-ában


 Láncindex: idősor elemeinek kifejezése az előző időpont %-ában
 Növekedés mérési lehetőségei
1. mennyivel nőtt a népességszám?
Ptn  Pt 0
2. hányszorosára nőtt a népességszám? Ptn
Pt 0
3. hány százalékára nőtt a népességszám? Ptn
 100
Pt 0
4. hány százalékkal nőtt a népességszám? Ptn
100  100
Pt 0
5. Évente átlagosan hány százalékkal nőtt a népességszám? Ptn
n  100  100
3  évi átlagos növekedési ráta Pt 0
Idősorok ábrázolása: vonaldiagram
(grafikon)

4
Grafikon azonos időközű idősoroknál

 Excel: „Grafikon” Pest megye gazdasági fejlődése (1994-2000)


diagramtípus Forrás: KSH
1200
 2 dimenziós
összehasonlítás 1000 1025

– Független 911
dimenzió: idő 800

GDP/fő (ezer Ft/fő)


773
– Időpontok: x
helyett t tengely 600
653

– Évszámok 493
egyszerű 400 399
tengelyfeliratok 324
 Feltételezzük, 200
hogy a pontok
5 között egyenletes 0
a változás 1994 1995 1996 1997 1998 1999 2000
Grafikon eltérő időközű idősooknél

 Excel: Délkelet-Anglia gazdasági fejlődése az egy főre jutó GDP


„Pontdiagram” alapján (1950-1996)
diagramtípus 124
Forrás: EUROSTAT
 2 dimenziós
összehasonlítás 122

– Független

százalék (ország=100)
dimenzió: idő 120

– Időpontok: x
helyett t tengely 118

– Évszámok is
116
adatsorok
 Feltételezzük, 114
hogy a pontok
6 között egyenletes 112
a változás 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000
Grafikus ábrázolási módszerek

 Grafikus ábrázolási módszerek 2 típusa


1. Általános statisztikai grafikus módszerek (diagramok)
2. Térképészeti, térinformatikai eljárások (GIS)
 Funkciói: eszköz és cél
– Kutatási munka: elemzési eszköz
– Szöveg, prezentáció: illusztrációs cél
 Diagram és szöveg viszonya
– Jó, ha szöveg nélkül is megállja a helyét (főleg PowerPoint-ban)
– De: nem helyettesítheti az elemzést: (minden ábrához legyen szöveg)

7
Minden lényeges információ rajta legyen
(ismétlődés nélkül)
 Diagramcím kell, de ritkán szerepel a diagramon
– Word: ábra alá külön sorba (így utólag is könnyebben módosítható a cím)
 Inkább az ábra alatti címben szerepel
– Vizsgált terület: pl. Magyarország (területi szint: pl. NUTS2-es régiók)
– Vizsgált jelenség: pl. regionális gazdasági fejlettségi különbségek
– Mutató: pl. egy főre jutó GDP
– Vizsgált idő (vagy időszak): pl. 2004 (vagy 2004–2012)
 Inkább a kategóriatengely feliratainál szerepel
– Mértékegység, pl. amerikai dollár/fő
 Egyik infó se szerepeljen egyszerre két helyen (vagy a címben vagy a
kategóriatengelyen)
 Mindig legyen forrásmegjelölés (PowerPoint-ban is)
8
Analitikus trendelemzés

9
Regressziószámítás a regionális elemzésekben

 Regresszió alkalmas becslésre, előre- vagy visszajelzésre


 Változókapcsolatokat valószínűségi (sztochasztikus) függvénykapcsolatként
értelmezi
 Függő és független (vagy magyarázó) változók
– Független: x tengely, fajlagos mutató nevezője, bal oszlop
– Függő: y tengely, fajlagos mutató számlálója, jobb oszlop
 Típusai:
– Lineáris vagy nem lineáris
– Két- vagy többváltozós

10
Regressziós diagram: pontdiagram speciális
típusa
 2 dimenziós
Értéktermelő-képesség és az újonann épített lakások
összehasonlítás csatornával való ellátottságának összefüggése a magyar
 Ha van a pontoknak megyékben (2000)
irányultsága
(vonalban vannak: 120

új, közcsatornával ellátott lakások


van összefüggés a
100
két adatsor között)
 regresszió:

lakások aránya (%)


80
alkalmas az
összefüggés 60
elemzésére y = 0.0181x + 50.145
R2 = 0.3873
 Fehér háttér 40

 Legyen tengelyfelirat
20
 Jelmagyarázat csak
több adatsornál 0
11 0 500 1000 1500 2000 2500 3000

Forrás: KSH T-STAR GDP/fő (ezer Ft/fő)


Kétváltozós lineáris regresszió

 Determinációs együttható (R2) itt a Értéktermelő-képesség és az újonann épített lakások csatornával való ellátottságának
összefüggése a magyar megyékben (2000)

Pearson-féle lineáris korrelációs 120

együttható négyzete

új, közcsatornával ellátott lakások lakások aránya (%)


100

 y = a + bx 80

– x: magyarázó (független) változó 60

– b: regressziós együttható (regressziós 40

koefficiens): az egyenes meredekségét vagy


dőlését jelöli (az x értékének egységnyi
y = 0.0181x + 50.145
20 2
R = 0.3873

növekedése y értékének mekkora mértékű és 0

milyen irányú változását vonja maga után 0 500 1000 1500


GDP (ezer Ft/fő)
2000 2500 3000

– a: regressziós állandó (konstans): értéke


megegyezik az egyenes y tengelyen
tapasztalt metszéspontjával (a értéke
egyenlő y értékével x = 0 helyen)
12 – y: a függő változó regressziós egyenlet
alapján becsült értéke
Nem lineáris összefüggések

 Nem lineáris regressziós egyenletek alaptípusai


A nyugat-kelet pozíció és az 1 főre jutó jövedelem összefüggése a magyar megyékben (2000)

600

– Logaritmikus: y = a + (b * lnx) 500

y = -0.3278x + 326.59

– Polinomiális: y = a + (b1 * x) + (b2 * x2) + … + (bn * xn)

egy főre eső jövedelem (ezer Ft/fő)


400 2
R = 0.2786

-0.0011x
y = 319.67e
R2 = 0.3502

Exponenciális y = a * bx
300

– 200

– Hiperbolikus y = a + b / x 100
y = -6E-07x3 - 0.0011x2 - 0.2748x + 340.93
2
R = 0.3226

– Hatványkitevős y = a * xb -200 -150 -100 -50


0
0 50
NY-K koordináta (km)
100 150 200 250

 Determináció együttható (R2)dönti el, melyik írja le legjobban az adott


lineáris polinomiális exponenciális

összefüggést
– Azt a trendvonaltípust érdemes választani, amelynél magasabb az R2 értéke
 Elemzésük és értelmezésük nehézkesebb, mint a lineáris egyenleteké
 Idősorok elemzésénél, trendszámításban gyakrabban használják mint a
területi adatok keresztmetszeti vizsgálatában
13
Kétváltozós lineáris regresszó számítása
Excelben
1. A két adatsor egymás mellé rendezése úgy, hogy a bal oldalon az x
tengelyre kerülő változó legyen.
2. Szórásdiagram készítése (pontdiagram)
3. Formázási műveletek
4. Jobb klikk valamely pontra: trendvonal felvétele
5. Egyenlet és R2 látszik
6. Számítás

14
Analitikus trendelemzés

 Idősorok összetevői: trend, ingadozások, törések


 Trendelemzés regresszió segítségével
– Független változó: vízszintes (x) tengely  t tengely
– Függő változó: függőleges y tengely
1. Trendvonal mutatja az idősor fő tendenciáját
2. Regresszió alkalmas becslésre, előre- vagy visszajelzésre: adott t időpontban
mekkora y érték valószínűsíthető a trend alapján
– Trendvonal meghosszabbítása előre: előrejelzés (prognózis)
– Trendvonal meghosszabbítása hátra: visszajelzés a múltra
– Az idősor ismert időtartalmán belüli, „közbülső” t időpontban becslés y értékére
 Annyival lehet előre- vagy visszajelezni, amilyen hosszú ismert idősorunk van
15
 Képletben kerekítés, függvénnyel pontosabb: Excel  fx= ELŐREJELZÉS ()
Példa egy idősor analitikus trendelemzésére

 Pontosabb a A halálozási ráta alakulása Magyaországon, 1975–1995

becslés ha 15

tényezőkre
bontunk 14.5

– Fajlagos mutatót
14
számlálóra és
nevezőre ezrelék 13.5

– Részterületekre y = 0.0929x - 170.7


R2 = 0.7836

 Trendvonal 13

kiválasztásánál
szempont 12.5

– R2 12
16
– „Értelmes” érték 1970 1975 1980 1985 1990 1995 2000

halálozási ráta Lineáris (halálozási ráta)


Feladat

 Becsüljük meg Nógrád megye telefonellátottságát 2005-re!


– A lineáris trendvonal alapján mekkora lenne a telefonellátottág (ezer lakosra jutó
telefonvonalak száma) 2005-ben?
– Mennyivel változna a becslés, ha külön-külön előrejeleznénk a népességszámot és a
telefonvonalak számát, és a 2005-re becsült 2 értékből számítanánk ki az ezer lakosra
jutó telefonvonalak számát?
– A lineáris vagy az exponenciális trendvonal alapján érdemes becsülni?

17
Időbeli mozgóátlag

 Idősor tagjainak eredeti értéke helyett az idősorban szomszédjaival közös


tagjainak átlagértékét vesszük figyelembe
– Átlagolásba 3, 5, 7 vagy több tag is bevonható (minél több annál inkább rövidül az
adatsor)
– A mozgóátlagolás többször is megismételhető: az átlagértékeket is lehet tovább átlagolni
(minél többször, annál inkább rövidül az adatsor)
 Előnye:
– Egyszerűbb matematikai háttér (csak átlagolni kell)
 Hátránya:
– Rövidül az idősor  csak hosszú idősorok esetén érdemes alkalmazni
– Nem lehet vele előrejelzést készíteni

18
Időbeli mozgóátlag

év y 1. 2. 3. 100
95

2006 41 90
90

2007 45 42
2008 40 42 43 80

76 78
77
2009 41 45 48 50 70 68
71

2010 54 57 59 60
60
60
2011 76 75 73 71
58
54
2012 95 87 81 78 50
50

45

2013 90 81 80 77 41
45
40
2014 58 72 70 40
41

19
2015 68 57 30
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

2016 45 eredeti értékek mozgóátlag (1.) mozgóátlag (2.) mozgóátlag (3.)


Példa egy idősor analitikus mozgóátlagolására

A túristák számának havi alakulása Kubában, 1994. január – 2000. december

200

180

160

140

120
ezer fő

100

80

60

40

20

20
1994. január 1995. január 1996. január 1997. január 1998. január 1999. január 2000. január

túristák száma mozgóátlag (1.) mozgóátlag (5.) mozgóátlag (10.)

You might also like