You are on page 1of 265

Általános statisztika I

Havasy, György
Molnár, Máténé
Szunyogh, Zsuzsanna
Tóth, Mártonné
Korpás, Attiláné
Csernyák, László
Általános statisztika I
Havasy, György
Molnár, Máténé
Szunyogh, Zsuzsanna
Tóth, Mártonné
Korpás, Attiláné
Csernyák, László

Publication date 1996


Szerzői jog © 1996 Havasy György, Korpás Attiláné, Molnár Máténé, Szunyogh Zsuzsanna, Tóth Mártonné, Nemzeti Tankönyvkiadó Rt.
Szerkesztette:

Dr. Korpás Attiláné- főiskolai docens

Szerzők:

Dr. Havasy György - főiskolai docens (4. fejezet)

Dr. Molnár Máténé - főiskolai docens (3. fejezet)

Dr. Szunyogh Zsuzsanna - főiskolai docens (5. fejezet)

Dr. Tóth Mártonné - főiskolai adjunktus (1. és 2. fejezet)

A gyakorlófeladatokat:

Dr. Korpás Attiláné állította össze.

Szakmai lektor:

Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa

A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!
Tartalom
1. A statisztika alapfogalmai .......................................................................................................................................................................... 1
1.1. A statisztika tárgya és szerepe ....................................................................................................................................................... 1
1.2. A statisztikai sokaság és ismérv ...................................................................................................................................................... 2
1.3. Statisztikai adat .............................................................................................................................................................................. 6
1.4. Statisztikai csoportosítás és összehasonlítás ................................................................................................................................. 10
1.5. Viszonyszámok ............................................................................................................................................................................. 15
1.6. Átlagok ......................................................................................................................................................................................... 18
1.7. Gyakorlófeladatok ......................................................................................................................................................................... 25
2. Egy ismérv szerinti elemzés .................................................................................................................................................................... 30
2.1. A mennyiségi ismérv szerinti elemzés ........................................................................................................................................... 30
2.1.1. A mennyiségi ismérv .......................................................................................................................................................... 30
2.1.2. Gyakorisági sorok .............................................................................................................................................................. 32
2.1.3. Értékösszegsor .................................................................................................................................................................. 41
2.1.4. A gyakorisági sorok grafikus ábrázolása ............................................................................................................................. 47
2.1.5. Helyzetmutatók .................................................................................................................................................................. 54
2.1.6. Szóródási mutatók ............................................................................................................................................................. 71
2.1.7. Az aszimmetria mérőszámai .............................................................................................................................................. 81
2.1.8. A koncentráció elemzése ................................................................................................................................................... 83
2.2. Az időbeli ismérv szerinti elemzés ................................................................................................................................................ 87
2.2.1. Idősorok ............................................................................................................................................................................ 87
2.2.2. Dinamikus viszonyszámok .................................................................................................................................................. 89
2.2.3. Az idősorok grafikus ábrázolása ......................................................................................................................................... 93
2.2.4. Az idősorok elemzése átlagokkal ........................................................................................................................................ 94
2.3. Gyakorlófeladatok ....................................................................................................................................................................... 100
3. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése .............................................................................................. 107
3.1. A statisztikai táblákról általában ................................................................................................................................................... 107
3.2. Az egyszerű táblák elemzése ...................................................................................................................................................... 110
3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása ................................................................... 111
3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása ......................................................................................................... 117
3.3. A csoportosító táblák elemzése ................................................................................................................................................... 123
3.3.1. Rész- és összetett viszonyszámok ................................................................................................................................... 124
3.3.2. Szerkezet- és dinamikai változás vizsgálata ...................................................................................................................... 127
3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése .................................................................................................... 133
3.4.1. Függvényszerű kapcsolat. Függetlenség ........................................................................................................................... 139
3.4.2. Az asszociáció szorosságának mérése ............................................................................................................................. 141

iii
Általános statisztika I

3.4.3. A vegyes kapcsolat elemzése ........................................................................................................................................... 149


3.4.4. A korreláció elemzése csoportosított adatokból kiindulva ................................................................................................... 165
3.5. Gyakorlófeladatok ....................................................................................................................................................................... 172
4. Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása ........................................................................................................... 180
4.1. A standardizálás módszere ......................................................................................................................................................... 180
4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire ............................................................ 184
4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása ........................................................................................... 186
4.2.2. Az összetétel különbözőségének hatása ........................................................................................................................... 188
4.3. Indexszámítás standardizálás alapján (hányadosfelbontás) ........................................................................................................... 189
4.3.1. A főátlagindex .................................................................................................................................................................. 190
4.3.2. A részátlagindex .............................................................................................................................................................. 192
4.3.3. Az összetételhatás indexe ................................................................................................................................................ 194
4.4. Alkalmazási területek .................................................................................................................................................................. 195
4.4.1. Az átlagbérek időbeli változásának vizsgálata ................................................................................................................... 196
4.4.2. Az átlagárak időbeli változásának vizsgálata ..................................................................................................................... 198
4.5. Gyakorlófeladatok ....................................................................................................................................................................... 202
5. Érték-, ár- és volumenindexek ............................................................................................................................................................... 209
5.1. Az indexszám fogalma ................................................................................................................................................................ 209
5.2. Érték-, ár- és volumenindex-számítás .......................................................................................................................................... 209
5.2.1. Indexszám számítása aggregát formában ......................................................................................................................... 211
5.2.2. Az indexek átlagformái ..................................................................................................................................................... 213
5.3. Az indexek súlyozása ................................................................................................................................................................. 218
5.4. Összefüggések az indexszámításban .......................................................................................................................................... 221
5.4.1. Az indexszámok közötti összefüggések ............................................................................................................................ 221
5.4.2. Az aggregátumok közötti összefüggések .......................................................................................................................... 222
5.4.3. Csoportosított sokaságra számított indexek ...................................................................................................................... 224
5.5. Az indexszámok gyakorlati alkalmazása ...................................................................................................................................... 227
5.6. Indexsorok .................................................................................................................................................................................. 229
5.6.1. Az indexsorok közötti összefüggések ................................................................................................................................ 234
5.7. Területi indexek .......................................................................................................................................................................... 235
5.8. Gyakorlófeladatok ....................................................................................................................................................................... 238
A. Irodalom ............................................................................................................................................................................................... 247
6. Tárgymutató .......................................................................................................................................................................................... 248

iv
Az ábrák listája
2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája ...................................................................................................................... 48
2.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja ................................................................................................................ 49
2.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok ............................................................................. 50
2.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja .......................................................................................................... 52
2.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja ................................................................................................... 53
2.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja .............................................................................................. 54
2.7. ............................................................................................................................................................................................................. 55
2.8. ............................................................................................................................................................................................................. 56
2.9. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 58
2.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése ...................................................................... 69
2.11. ........................................................................................................................................................................................................... 71
2.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe) ................................................................................................. 86
2.13. A takarékbetét-állomány alakulása ...................................................................................................................................................... 93
2.14. A Magyarországra érkező turisták számának alakulása ........................................................................................................................ 94
2.15. Az épített lakások számának alakulása ............................................................................................................................................... 98
3.1. A statisztikai táblák típusai .................................................................................................................................................................. 110
3.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva ................................................................................................. 121
3.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva ................................................. 121
3.4. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 132
3.5. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 133
3.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat ................................................................................... 168
5.1. ........................................................................................................................................................................................................... 224

v
A táblázatok listája
1.1. Példák a sokaságokra ............................................................................................................................................................................ 3
1.2. Csoportosító sor általános sémája ........................................................................................................................................................ 10
1.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban ............................................................................... 11
1.4. A népesség megyék szerinti megoszlása 1994. január 1-jén .................................................................................................................. 12
1.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál ............................................................................................................. 14
1.6. Az 1 főre jutó GDP néhány európai országban 1993-ban ....................................................................................................................... 14
1.7. A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén .......................................................................................... 16
1.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál ................................................................................................ 17
1.9. Magyarország 1993. évi idegenforgalmát jellemző adatok ...................................................................................................................... 17
3
2.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m -ben) .................................................. 30
3
2.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben) ........................................................................................................ 31
2.3. A gyakorisági sorok általános sémája ................................................................................................................................................... 33
2.4. A lakások szobaszám szerinti eloszlása ................................................................................................................................................ 35
2.5. A társasház lakásainak megoszlása a vízfogyasztás szerint ................................................................................................................... 36
2.6. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 37
2.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában .............................................................................................. 38
2.8. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 39
2.9. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 40
2.10. Az értékösszegsor általános sémája .................................................................................................................................................... 41
2.11. A település háztartásainak taglétszám szerinti eloszlása ...................................................................................................................... 42
2.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint .......................................................................................... 42
2.13. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 43
2.14. Munkatábla az osztályközép meghatározásához .................................................................................................................................. 44
2.15. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 45
2.16. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 46
2.17. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................. 47
2.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint ......................................................... 50
2.19. Munkatábla a medián becsléséhez ...................................................................................................................................................... 61
2.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok ....................................................................................... 63
2.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok ......................................................................................... 65
2.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás) .................................................................................... 70
2.23. Munkatábla az átlagos eltérés és a szórás számításához ..................................................................................................................... 75
2.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői ......................................................................................................................... 81
2.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén ........................................... 84
2.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva) ..................................................................................... 85

vi
Általános statisztika I

2.28. Magyarország személygépkocsi-állományának alakulása (az évek december 31-én) ............................................................................. 88


2.29. Magyarországra érkező külföldi turisták számának alakulása ................................................................................................................ 88
2.30. A bázis- és láncviszonyszámok számítása ........................................................................................................................................... 90
2.31. A lakosság takarékbetét-állományának alakulása (az évek december 31-én) ......................................................................................... 90
2.32. Valamely utazási iroda valutakészletének és valutaértékesítésének adatai ............................................................................................ 95
2.33. Az épített lakások számának alakulása Magyarországon ...................................................................................................................... 97
3.1. A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok) ................................................. 107
3.2. A magyarországi népesség életkor szerinti megoszlásának alakulása ................................................................................................... 108
3.3. A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.) .................................. 109
3.4. Az orvosi ellátás néhány adata (december 31-i adatok) ....................................................................................................................... 111
3.5. Orvosi ellátásra vonatkozó adatok ....................................................................................................................................................... 114
3.6. Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok) ................................................................................................... 118
3.7. Az egészségügyi ellátásra vonatkozó adatok ....................................................................................................................................... 118
3.8. A csoportosító tábla általános sémája ................................................................................................................................................. 123
3.9. Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.) .............................................................. 125
3.10. A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.) .................................................................. 126
3.11. A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok) .................................................................... 127
3.12. A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása ............................................................ 128
3.13. Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok) .......................................... 129
3.14. A magyarországi lakásállományra vonatkozó adatok .......................................................................................................................... 131
3.15. A kontingenciatábla sémája ............................................................................................................................................................... 135
3.16. A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint
(1990. január 1.) ....................................................................................................................................................................................... 136
3.17. A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal) ............................................................................ 137
3.18. A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint ............................................................................................... 138
3.19. A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint ................................................................................................. 138
3.20. Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok ..................................................................................................... 139
3.21. Kontingenciatáblázat alternatív ismérvek esetén ................................................................................................................................. 141
3.22. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 143
3.23. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) ............................................................ 144
3.24. A függetlenség feltételezésével számított gyakoriságok ( ) ............................................................................................................... 146
3.25. A számítása ................................................................................................................................................................................ 147
3.26. A vegyes kapcsolat adatbázisa ......................................................................................................................................................... 149
3.27. Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben) ................................................ 150
3.28. A kontingenciatábla sémája vegyes kapcsolat esetén ......................................................................................................................... 152
3.29. Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint ................................. 153

vii
Általános statisztika I

3.30. A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok ................................................................................................................ 156


3.31. A vizsgált ipari szervezetekre vonatkozó adatok ................................................................................................................................. 160
3.32. A korrelációs tábla sémája ................................................................................................................................................................ 165
3.33. Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint ........................................... 166
3.34. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 167
3.35. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye ................................. 171
4.1. Jövedelem- és létszámadatok két vállalkozásnál .................................................................................................................................. 180
4.2. Két összetett intenzitási viszonyszám meghatározása és összehasonlítása ........................................................................................... 182
4.3. Két ország halandósági viszonyainak alakulása (fiktív adatok) .............................................................................................................. 184
4.4. Egy megye forgalmi és népességadatai az 1994. és 1995. évben ........................................................................................................ 190
4.5. A lakosság összetételének változása ................................................................................................................................................... 195
4.6. Egy vállalkozás munkaügyi adatai ....................................................................................................................................................... 196
4.7. 4.7. táblázat ....................................................................................................................................................................................... 196
4.8. Egy homogén árucsoportba tartozó három cikk értékesítési adatai ....................................................................................................... 200
5.1. Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 1993–1994-es években ........................ 210
5.2. Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek ................................................................................ 211
5.3. Az indexek kiszámítási képleteinek áttekintő táblázata ......................................................................................................................... 217
5.4. A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket forgalmazó üzletben .............................. 225
5.5. Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években ......................................................................................... 229
5.6. Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva ............................................................................................ 230
5.7. Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában ........................................................................... 236

viii
1. fejezet - A statisztika alapfogalmai
1.1. A statisztika tárgya és szerepe
A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információra
van szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek és
egyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának.

A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység.

A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenység
úgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, a
termények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vette
kezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak az
egyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve – amihez nagy lendületet
adott a valószínűség-számítás kialakulása és tételeinek elterjedése – önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellett
széles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntések
előkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is.

A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása,
elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése.

A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana.

A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatával
foglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, az
energiatermelés, a lakosság fogyasztása stb.

A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikai-statisztikai módszerek. A statisztikai
módszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést.

A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Ide
sorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredmények
áttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait
(tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majd
csoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb.
A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük.

1
A statisztika alapfogalmai

A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körű
megfigyelés túl költséges – így gazdaságtalan – és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylag
kis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire,
tulajdonságaira.

Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségének
ellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggések
vizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagy
azok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét.

Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabban
használt elemzési eszközöket tárgyalja.

A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát.

Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkel
általánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja.
Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb.

1.2. A statisztikai sokaság és ismérv


A statisztika – mint már említettük – mindig tömegesen előforduló jelenségek és az azokat alkotó egységek vizsgálatával foglalkozik.

A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket – a halmaz elemeit – a
sokaság egységeinek nevezzük.

Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya;
tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzett
egységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb.

Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrét
sokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaság
egy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb.

A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatva
1 2
értelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás) és a vándorlási különbözet miatt állandóan változhat. Ezért e
1
Az élveszületések és halálozások különbsége.

2
A statisztika alapfogalmai

3
sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor) értelmezhető, „ragadható meg”. Ugyanakkor a Videoton-gyár termelése –
mivel a termelés egy folyamat – időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Az
időpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknak
nevezzük.

A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesen
sokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számú
egyed megfigyelésével végezzük.

A sokaságok fajtáit szemlélteti az 1.1. táblázat:

1.1. táblázat - Példák a sokaságokra


A sokaság
megnevezése egysége fajtája
Zala megye egy személygépkocsi diszkrét, álló, véges
személygépkocsi-állománya
1995. december 31-én
A lakosság takarékbetét- egymilliárd (millió folytonos, álló, véges
állománya 1995. július 31-én stb.) Ft betétállomány
1995-ben Nógrád megyében egy gyermek diszkrét, mozgó, véges

született gyermekek
Magyarország 1995. évi egy liter (hektoliter, folytonos, mozgó,
üveg stb.) véges
sörfogyasztása sörfogyasztás

A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető.

Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok.

Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területi
elhelyezkedés, a vállalkozás profilja.
2
A megyébe letelepülő és elköltöző népesség különbsége.
3
Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni.

3
A statisztika alapfogalmai

Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb.,
a gépkocsi fogyasztása esetén pedig számadatok.

Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattal
rendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyi
változata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők.

Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységei
egyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznek
egymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük.

Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I.
évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozás
időpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elért
pontszáma stb.

Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg.
Az ismérvek fajtái:

– időbeli ismérvek: az egységek időbeli elhelyezésére szolgáló rendező elvek.

Ismérvváltozatai: időpontok, időszakok.

(Pl. a főiskolai hallgatók születési ideje, a gépkocsik gyártási ideje.)

– területi ismérvek: az egységek térbeli elhelyezésére szolgáló rendező elvek.

Ismérvváltozatai: földrajzi egységek.

(Pl. a főiskolai hallgatók lakhelye, a gépkocsik gyártási helye.)

– minőségi ismérvek: az egyedek számszerűen nem mérhető tulajdonságai.

(Pl. a főiskolai hallgatók neme, a gépkocsik típusa.)

– mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük.

(Pl. a főiskolai hallgatók felvételi pontszáma, a gépkocsik fogyasztása.)

4
A statisztika alapfogalmai

Mérési szintek

A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetséges
változatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1;
nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azaz
mérésének tekinthető.

A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezek
bizonyos tulajdonságaihoz.

A hozzárendelési szabályok alapján négy mérési skálát (szintet) különböztetünk meg:

– névleges skála,

– sorrendi skála,

– intervallumskála,

– arányskála.

A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségi
ismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyen
nominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják,
közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelme
nincs.

A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatók
osztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán – bár a sorszámok
közötti különbség azonos (egy-egy) – az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyre
sorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésből
származó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendisége
kerül kihasználásra.

Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valós
információt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározása
önkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsius-fok
(pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak.
A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 °C-os és a + 5 °C-os hőmérséklet összege + 25 °C, vagy
hogy a 20 °C-os hőmérséklet kétszerese a 10 °C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető.

5
A statisztika alapfogalmai

Pl. az 5 °C és a 10 °C közötti különbség azonos a 15 °C és 20 °C közötti különbséggel. A 20 °C és 30 °C közötti különbség kétszerese az előbbi
bármelyik különbségnek.

Az arányskálán történő mérés – a legmagasabb mérési szint – nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont a
tulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhez
szükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb.

1.3. Statisztikai adat


A statisztikatudomány fontos alapfogalmai közé tartozik a statisztikai adat fogalma.

A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérési
eredmény.

A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adat
tehát nem pusztán a számérték maga.

Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt;
1992-ről 1993-ra az

1 főre jutó reáljövedelem 5%-kal csökkent.

Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma).

Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992.
december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat:

A személygépkocsi-állomány 1 év alatt 1,016-szeresére, vagyis 101,6%-ra, azaz 1,6%-kal nőtt.

Statisztikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő
(pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk.

Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órára
jutó termelés stb.

A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk.

6
A statisztika alapfogalmai

– Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntéseket
hozhatunk.

– Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatok
alakításában.

– A szükséges adatokhoz a lehető legkisebb ráfordítással (költséggel) jussunk hozzá.

E követelményeknek – az elfogadható pontosság, a gyorsaság és a gazdaságosság – egy időben általában tökéletesen megfelelni nem lehet
(például a gyorsaság a pontosság ellen hat).

Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások,
nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásai
stb.)

A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetben
megelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtása
előtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennek
elmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseket
eredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát az
adatgyűjtéstől kezdve az adatközlésig.

Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaság
megfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges.

A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani.
A teljes körű megfigyelések jellegzetes példái a népszámlálások.

A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellel
lehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaság
teljes körű megfigyelése jelentős költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabb
a teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is.

A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek.

Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaság
kiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot.
A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintából
származó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk.
E mintából való következtetés – éppen a felvétel részlegessége miatt – csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk.

7
A statisztika alapfogalmai

Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várható
termésmennyiség becsléséhez, a közvélemény-kutatásoknál stb.

A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyon
rossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése.

Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, és
az önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók az
alapsokaságra.

A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatív
megfigyelés.

Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak.
A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyát
képező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat)
gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén a
megfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók.

A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat.

A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alapos
szakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nem
eléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást.

Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket,
fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák.

Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibák
szinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat és
a hibákkal torzított mért adat egymástól eltér.

A valóságos adat (A) és a mért adat különbségét a statisztikai adat abszolút hibájának nevezzük és a-val jelöljük:

A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynél
az abszolút hiba biztosan nem nagyobb.

8
A statisztika alapfogalmai

Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának nevezzük. Így minden statisztikai adat megadható az módon. Ez a
megadási mód arra utal, hogy a valóságos adat (A) valahol az és határok között helyezkedik el.

A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyos
nagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikáns
számjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el.

Ha a legutolsó kiírt számjegy helyi értéke akkor az abszolút hibakorlát:

Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban a
legutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke . (Ez a közlési mód azt sugallja, hogy az utolsó három – százas, tízes, egyes
helyi értékű – számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.)

A statisztikai adat (népességszám) abszolút hibakorlátja:

Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani.

Az abszolút hiba (a) és a valóságos adat (A)

hányadosát relatív hibának, az abszolút hibakorlát és a mért adat

hányadosát a statisztikai adat relatív hibakorlátjának nevezzük.

A relatív hibát és a relatív hibakorlátot általában százalékos formában szokták megadni.

9
A statisztika alapfogalmai

A népességszám relatív hibakorlátja:

Megállapíthatjuk, hogy a fenti példában a statisztikai adat hibája rendkívül kicsi.

A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan)
lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Így
elkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk.

1.4. Statisztikai csoportosítás és összehasonlítás


Csoportosítás

A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körű
információt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerint
osztályoznunk, csoportosítanunk kell.

A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint.

A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. E
két követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik – de csak egy – kialakított osztályba.

Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzése
nem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nem
egyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozások
tevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú „listát” kapnánk, ami
nehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt.

A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat – szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozási
rendszereket – alkalmazzák.

Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat):

1.2. táblázat - Csoportosító sor általános sémája


Osztály Egységek száma

10
A statisztika alapfogalmai

Összesen N

ahol a csoportképző ismérv alapján képzett i-edik osztály azonosítója,

a sokaság osztályba sorolt egységeinek száma, ún. gyakorisága,

k : a kialakított osztályok száma,

N : a sokaság egységeinek száma.

A sémából is látható, hogy a gyakoriságok összege egyenlő a sokaság elemszámával (N).

Tehát

A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorok
képzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával.

Minőségi sor (1.3 táblázat):

1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban
Utazás jellege Külföldiek száma

(E fő)
Turista 22 804

Kiránduló 11 719

11
A statisztika alapfogalmai

Átutazó 6 076
Összesen 40 599

Területi sor (1.4. táblázat):

1.4. táblázat - A népesség megyék szerinti megoszlása 1994. január 1-jén


Megye Népesség száma (fő)
Budapest egyik megyéhez
Budapest 1 955 696
sem tartozik közigazgatásilag, ezért a
statisztikai kiadványokban külön sorban 416 405
tüntetik fel.
538 560
Baranya
401 323
Bács-Kiskun
743 835
Békés
436 639
Borsod-Abaúj-Zemplén
422 448
Csongrád
426 738
Fejér
548 942
Győr-Moson-Sopron
328 754
Hajdú-Bihar
418 858
Heves
312 295
Jász-Nagykun-Szolnok
221 032
Komárom-Esztergom
964 939
Nógrád
338 245
Pest
560 888

12
A statisztika alapfogalmai

Somogy 249 938

Szabolcs-Szatmár-Bereg 272 835

Tolna 377 531

Vas 301 067

Veszprém

Zala
Összesen 10 276 968

Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Ennek
lényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjuk
területi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.).

K: komfortos,

FK: félkomfortos,

KN: komfort nélküli.

A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó.

13
A statisztika alapfogalmai

Összehasonlítás

A mindennapi életben és a statisztikai elemző munkában is gyakran találkozunk az összehasonlítás mozzanatával.

Az összehasonlítás két vagy több statisztikai adat egymáshoz való viszonyítása.

Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamata
az IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy a
devizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosát
számítjuk ki.

A két szám különbsége:

A két szám hányadosa:

A devizaszámla kamata 0,062 százalékponttal, illetve 1,8 százalékkal csökkent.

Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (A
kamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.)

Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket – a
csoportosító sorokhoz hasonlóan – az ismérvek fajtája szerint is megkülönböztethetünk.

A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat).

1.5. táblázat - Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál


Időpont Kamat (%)
1995. június 23. 3,437

július 23. 3,375

Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sort
szemléltet.

1.6. táblázat - Az 1 főre jutó GDP néhány európai országban 1993-ban


Ország 1 főre jutó GDP (USD)

14
A statisztika alapfogalmai

Albánia 340

Ausztria 23 120

Hollandia 20 710

Lengyelország 2 020

Magyarország 3 300

Németország 23 560

Portugália 7 890

Románia 1 120

Spanyolország 13 650

Svájc 36 410

Szlovákia 1 900

1.5. Viszonyszámok
A csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám.

A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa.

Képlettel:

ahol V: a viszonyszám,

A: a viszonyítás tárgyát képező adat, amit viszonyítunk,

B: a viszonyítás alapját képező adat, amihez viszonyítunk.

A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból.

15
A statisztika alapfogalmai

Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, a
koordinációs és a dinamikus viszonyszámok.

A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki.

1.7. táblázat - A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén
Nem Népesség száma (fő)
Férfi 372 425

Nő 354 289
Összesen 726 714

Az 1.7. táblázat szerinti minőségi sorból számítható megoszlási viszonyszámok:

– a férfiak aránya:

– a nők aránya:

A 20–24 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén.

A koordinációs viszonyszám a sokaság két részadatának hányadosa.

A 1.7. táblázat adataiból számítható koordinációs viszonyszámok:

– 1000 férfira jutó nők száma:

– 1000 nőre jutó férfiak száma:

A dinamikus viszonyszám két időszak (időpont) adatának hányadosa.

16
A statisztika alapfogalmai

1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál
Időpont Árfolyam (Ft/DEM)
1994. július 10. 66,12

1995. július 10. 90,76

Dinamikus viszonyszám: (az 1.8. táblázat adataival számolva).

A német márka eladási árfolyama 1 év alatt 37,3%-kal nőtt.

A különböző fajta, általában különböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük.

Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. E
viszonyszámok általában két – egymással valamilyen kapcsolatban álló – sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1-
jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt.

Az intenzitási viszonyszám az 1000 lakásra jutó távbeszélő-állomások száma:

A különböző fajta, különböző mértékegységű – de egymással kapcsolatban álló – adatokat is statisztikai sorba rendezhetjük. Az így képzett sort
leíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egy
vállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példával
szemléltetjük (1.9. táblázat).

1.9. táblázat - Magyarország 1993. évi idegenforgalmát jellemző adatok


Megnevezés Adat
Külföldre utazó magyarok száma (E fő) 12 115

Magyarországra érkező külföldiek száma (E fő) 40 599

– ebből turisták (E fő) 22 804

Idegenforgalom bevétele (M Ft) 110 312

17
A statisztika alapfogalmai

Idegenforgalom kiadása (M Ft) 68 961

1.6. Átlagok
A viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni.

Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségi
ismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetes
átlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg.

Az átlagszámítás során az átlagolandó értékeket a következő módon jelöljük:

ahol: N : a megfigyelt átlagolandó értékek száma,

az i-edik átlagolandó érték.

A különböző átlagok kiszámítását az alábbi, adatból álló számpéldával is szemléltetjük:

2 , 6 , 4 , 2 , 6 , 4 , 6 , 2 , 5 , 6.

Számtani átlag

A számtani átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad.

Tehát

Ebből a számtani átlag:

Adataink alapján:

18
A statisztika alapfogalmai

Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot:

Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó
értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás -ig terjed. (Továbbra is 10 átlagolandó
értékkel dolgozunk, de ezeket csoportba soroltuk be.)

Átlagolandó értékek száma

(gyakorisága)
2 3

4 2

5 1

6 4
Összesen 10

A csoportosító sor sémájában bevezetett jelölések szerint:

ahol: k : az egymástól különböző átlagolandó értékek száma,

a gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.

Ezt a számítási formát súlyozott formának nevezzük.

19
A statisztika alapfogalmai

A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a
gyakoriságokat elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket -vel jelölünk:

Jellemző, hogy

Példánkban:

2 0,3

4 0,2

5 0,1

6 0,4
Összesen 1,0

Könnyű belátni, hogy az átlagot e megoszlási viszonyszámok alapján is számíthatjuk.

Számszerűen:

Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja:

a) az átlagolandó értékek abszolút nagysága.

20
A statisztika alapfogalmai

Az átlag mindig a legkisebb és legnagyobb érték közé esik:

b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az intervallumban hol helyezkedik el.

Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb a
súlyaránya, akkor az átlag az intervallum felső határához esik közelebb.

A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak.

A számtani átlag tulajdonságai:

1. Az átlagolandó értékek és a számtani átlag különbségeinek algebrai összege nulla.

Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák
(különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható:

mert az átlag definíciója szerint

2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagy
ahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos.

Tehát

Az átlag e tulajdonságát négyzetes minimum tulajdonságnak nevezzük.

21
A statisztika alapfogalmai

A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla:

Ebből:

Mivel pozitív, az valóban minimális.

3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg.

Tehát, ha ( ), akkor .

Ugyanis

4. Ha az átlagolandó értékeket egy B állandóval megszorozzuk, a számtani átlag is B-szeresére változik.

Tehát, ha ( ), akkor

Ugyanis

Harmonikus átlag

Aharmonikus átlag (jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad.

22
A statisztika alapfogalmai

Tehát

Ebből a harmonikus átlag :

Példánkban:

Súlyozott formában:

Adataink alapján:

Mértani átlag

Amértani átlag(jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok szorzata változatlan marad.

Tehát:

23
A statisztika alapfogalmai

Ebből a mértani átlag :

(Itt feltételezzük, hogy )

Példánkban:

Súlyozott formában:

Adataink alapján:

Négyzetes átlag

A négyzetes átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad.

Tehát:

Ebből a négyzetes átlag:

Példánkban:

24
A statisztika alapfogalmai

Súlyozott formában:

Adataink alapján:

Két nemnegatív szám számtani és mértani közepének összehasonlításáról már középiskolában is volt szó, itt bizonyítás nélkül közöljük a különböző
átlagok közötti összefüggéseket.

Ha ugyanazokból az átlagolandó értékekből, azonos súlyarányokkal számítunk különböző átlagokat, közöttük az alábbi nagyságrendi viszony áll fenn:

Példánkban:

(Az átlagok között egyenlőség csak akkor fordulhat elő, ha minden átlagolandó érték egyforma.)

1.7. Gyakorlófeladatok
1. A főiskolai hallgatók anyagi és szociális helyzetét kívánjuk felmérni.

Feladat:

a) Definiáljuk a felméréshez szükséges sokaságot!

b) Fogalmazzunk meg olyan kérdéseket, amelyeket feltennénk egy elképzelt kérdőívben!

25
A statisztika alapfogalmai

c) Milyen ismérvek vannak az egyes kérdések mögött? Nevezzük meg ezeket, és adjuk meg ezek néhány lehetséges változatát!

d) Rendezzük a választott ismérveket aszerint, hogy hány változatuk van!

e) Képezzünk sorokat egy 30 fős csoportra vonatkozóan tetszőleges adatokkal!

2. Néhány sokaság:

– Az 1994-ben Magyarországon kiadott könyvek összessége.

– Az iskolai könyvtárak összes könyvállománya 1994. január 5-én.

– Színházlátogatások száma egy adott napon Budapesten.

– Egy áruház cipőosztályának forgalma a téli kiárusítás hetében.

– Üzembe helyezett beruházások nagysága 1994-ben.

– A lakosság villamosenergia-fogyasztása 1994 decemberében.

– Békés megye állatállományának nagysága 1994. március 31-én.

– Budapest népessége 1995. január 1-jén.

Feladat:

a) Nevezzük meg a fenti sokaságok típusait!

b) Mondjunk megkülönböztető ismérveket az egyes sokaságokra vonatkozóan!

c) Megfelelő módon bővítsük vagy szűkítsük az egyes sokaságokat!

d) Milyen mérési skálákon mérhetők az egyes ismérvek?

3. A közgazdaság-tudományi ághoz tartozó nappali tagozatos hallgatók adatai 1992-ben:

Nem Hallgatók száma (fő)


Férfi 3731

Nő 5069

26
A statisztika alapfogalmai

Összesen 8800

Feladat:

Nevezzük meg a statisztikai sor típusát!

4. A gazdaságilag aktív népesség számának alakulása Magyarországon:

Év, január 1. Népesség (ezer fő)


1985 5591

1986 5580

1987 5595

1988 5559

1989 5519

1990 5496

1991 5404

1992 5202

Feladat:

a) Nevezzük meg a statisztikai sor típusát!

b) Számítsuk ki, hogy mennyi egy-egy adat abszolút, illetve relatív hibakorlátja!

5. A hazánkba érkező turisták közül a legtöbben Romániából (5498 ezer fő), Németországból (2838 ezer fő) és Jugoszlávia utódállamaiból (2585
ezer fő) érkeztek 1992-ben.

Ismerjük továbbá, hogy Európából összesen 16 688 ezer fő, Ázsiából 151 ezer fő, Afrikából 20 ezer fő, Amerikából 304 ezer fő, Ausztráliából és
Óceánia országaiból pedig 25 ezer turista érkezett.

Feladat:

Rendezzük az adatokat statisztikai sorokba!

27
A statisztika alapfogalmai

6. Statisztikai kiadványokból származnak az alábbi információk:

– 1991-ben a GDP 29,1%-a az ipari ágazatból származott.

– Az 1000 lakosra jutó élveszületések száma Magyarországon 1992-ben 11,8‰ volt.

– Az 1 főre jutó évi átlagos sertéshúsfogyasztás 1990-ben 38,8 kg volt.

– 1992-ben 25 807 lakás épült Magyarországon. A lakásépítések kedvezőtlen alakulását jellemzi, hogy 1970-hez képest 67,85%-kal épült kevesebb
lakás. Hány lakás épült 1970-ben?

– Az orvosellátottság jellemzésére kiszámított mutató számszerű értéke 1980-ban 28,8; 1992-ben 39,6 orvos/tízezer lakos.

– Az ipari ágazatban a maximum 500 főt foglalkoztató vállalkozások átlagos árbevétele 137 millió Ft volt 1992-ben.

– Svédországban a házasságkötési arányszám 1992-ben 4,3 ‰ volt.

– 100 aktív háztartásra 1991-ben 103 hűtőszekrény jutott.

Feladat:

Nevezzük meg az itt szereplő viszonyszámok fajtáját, adjuk meg kiszámítási módját!

7.

Átlagolandó értékek Súlyok


6 6

16 3

20 1

Feladat:

a) Számítsuk ki a megadott értékek súlyozott: számtani, harmonikus, mértani és négyzetes átlagát!

b) Állapítsuk meg az átlagok nagyságrendjét!

c) Határozzuk meg a kifejezés értékeit a következő A értékek mellett: 5, 6, 8 és az esetén!

28
A statisztika alapfogalmai

8. Valamely ismérv két változata 10 és 15.

Feladat:

a) Rendeljünk ezen átlagolandó értékek mellé súlyokat többféleképpen úgy, hogy a súlyok összege először 20, majd 50, 10 és 7 legyen, továbbá
a kapott átlagok mindig kisebbek legyenek a megelőzőnél!

b) Milyen súlyarányok mellett lesz az átlag éppen 12?

29
2. fejezet - Egy ismérv szerinti elemzés
2.1. A mennyiségi ismérv szerinti elemzés
2.1.1. A mennyiségi ismérv
A mennyiségi ismérvek rendkívül nagy szerepet töltenek be a statisztikai elemző munkában. A mennyiségi ismérveket változóknak,
lehetséges kimeneteleiket (ismérvváltozataikat) ismérvértékeknek nevezzük. Az ismérvértékek intervallum- vagy arányskálán mért, valamilyen
mértékegységgel bíró számértékek.

A mennyiségi ismérv lehet: diszkrét és folytonos.

A diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan végtelen, egymástól jól elkülönülő értéket vehet fel.

A folytonos mennyiségi ismérv egy adott intervallumon belül bármilyen, tehát kontinuumszámosságú értéket felvehet.

A lakásokat például (a megfigyelés időpontjában) jellemezhetjük szobaszámuk és alapterületük szerint. A lakások szobaszáma csak pozitív egész
2
szám lehet, tehát diszkrét mennyiségi ismérv. A lakások alapterülete egy adott intervallumban (pl. 50 és 55 m között) bármilyen értéket felvehet,
tehát folytonos mennyiségi ismérv.

A diszkrét mennyiségi ismérv értékei – elvileg, de általában gyakorlatilag is – pontosan, a folytonos mennyiségi ismérv értékei mindig csak bizonyos
pontosságra kerekítve adhatók meg.
2 2
Például a lakások alapterülete megadható két tizedes pontossággal: 53,78 m , ugyanez egy tizedes pontossággal: 53,8 m , egész számra kerekítve:
2 2
54 m . Ezért két háromszobás lakás szobaszáma biztosan azonos, de két 54 m -es lakás alapterülete már nem biztos, hogy „pontosan” azonos (az
2 2 2
egyik lehet 53,78 m , a másik 54,11 m , de a mérési – kerekítési – pontosság miatt mindkettőt 54 m -nek tekintjük).

Ha egy sokaságot valamilyen mennyiségi ismérv szerint vizsgálunk, akkor első lépésként általában az ismérvértékeket sorba rendezzük, ún. rangsort
készítünk.

A rangsor a mennyiségi ismérv értékeinek monoton sorozata.

Szemléltető példánk a következő (2.1. és 2.2. táblázat):


3
2.1. táblázat - Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m -ben)
36 14 21 23 23

30
Egy ismérv szerinti elemzés

10 34 22 26 20

20 40 18 16 22

23 26 25 17 21

16 16 31 19 15

31 17 30 21 23

24 28 22 33 18

22 29 19 24 27

20 21 17 32 17

18 12 19 11 36

Az adatok (ismérvértékek) rendezésének legegyszerűbb módja a rangsor készítése.

3
2.2. táblázat - A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben)

10 17 20 23 29

11 17 21 23 30

12 18 21 23 31

14 18 21 24 31

15 18 21 24 32

16 19 22 25 33

16 19 22 26 34

16 19 22 26 36

17 20 22 27 36

31
Egy ismérv szerinti elemzés

17 20 23 28 40
3
A lakások vízfogyasztása folytonos mennyiségi ismérv, a rangsorban található azonos értékek (pl. négy lakásnál 21 m a fogyasztás) 1
valószínűséggel csak a mérési pontosság miatt nem különböznek egymástól.

2.1.2. Gyakorisági sorok


A rangsor segít a vizsgált jelenség természetének vizsgálatában, azonban ha a megfigyelt sokaság elemszáma nagy – a statisztikai vizsgálatoknál
általában ez jellemző –, a rangsor már nehezen áttekinthető, és nem teszi lehetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozó
szabályszerűség felismerését.

Ahhoz, hogy a sokaság összetételéről, szerkezetéről, belső arányairól áttekinthető képet kapjunk, az adatokat (ismérvértékeket) tömörítenünk kell.
Az adatokban rejlő információk tömörítésének, sűrítésének legelterjedtebb módja a sokaság egységeinek mennyiségi ismérv szerinti osztályozása
(csoportosítása). A rangsort általában éppen abból a célból készítjük, hogy megkönnyítse a sokaság egységeinek mennyiségi ismérv szerinti
osztályozását.

Az osztályozás eredménye egy csoportosító sor, melynek általános sémáját az 1.4. alfejezetben már megismertük (1.2. táblázat). Ebben az esetben
a ( ) osztályok a mennyiségi ismérv lehetséges értékeinek részhalmazai. Ha az ismérvnek kevés változata van (pl. a lakások szobaszáma),
akkor általában egy-egy ismérvváltozat képez egy-egy osztályt. Ha az ismérvváltozatok száma nagy (pl. ha a lakásokat alapterületük szerint, vagy
2
az aktív keresőket havi keresetük szerint csoportosítjuk), akkor az osztályok egynél több ismérvértéket magukba foglaló intervallumok (pl. 50–55 m
közötti alapterület, 20 000–25 000 Ft közötti kereset stb.), melyeket osztályközöknek nevezünk.

Az 1.2. táblázatból látható, hogy a csoportosító sor tartalmazza a osztályok mellett a gyakoriságokat is.

A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik.

A gyakoriságok helyett a csoportosító sorban szerepeltethetjük a

relatív gyakoriságokat is, melyek nem mások, mint a gyakoriságokból számított megoszlási viszonyszámok. A relatív gyakoriságokat általában

százalékos formában (az hányadosok 100-zal szorzott értékei) fejezzük ki.

A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányad
része (hány százaléka) tartozik.

32
Egy ismérv szerinti elemzés

A mennyiségi ismérv szerinti osztályozás eredményeként kapott speciális csoportosító sort gyakorisági sornak nevezzük. Ha az osztályok egyetlen
ismérvértékből állnak, a gyakorisági sort gyakorisági eloszlásnak, röviden eloszlásnak nevezzük, más esetekben gyakorisági megoszlásnak,
1
röviden megoszlásnak nevezzük .

Az eloszlás, illetve a megoszlás, mint a neve is jelzi, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között.
Mint látni fogjuk, az általános az, hogy az osztályok közül némelyikben sok ismérvérték van (nagy a gyakoriság), másutt viszont kevés, és általában
minél távolabb vagyunk a nagy gyakoriságú osztályoktól, annál kevesebb.

2.3. táblázat - A gyakorisági sorok általános sémája

a) változat (eloszlás) b) változat (megoszlás)


Ismérvérték Gyakoriság Az osztályközök Gyakoriság
alsó
felső határa
határa

Összesen N Összesen N
c) változat (eloszlás) d) változat (megoszlás)
Relatív Relatív
Ismérvérték Az osztályközök
gyakoriság gyakoriság
alsó
felső határa
határa

11
Megjegyezzük, hogy a statisztikai gyakorlatban az eloszlást és a megoszlást egymás szinonimáiként is használjuk, noha a fent leírtak elméletileg mindenképpen indokoltak. Bizonyos elméleti
tételek ugyanis csak az egyik esetben érvényesek.

33
Egy ismérv szerinti elemzés

Összesen 1 Összesen 1

ahol

az i-edik ismérvérték,

az i-edik osztályköz alsó határa,

az i-edik osztályköz felső határa,

az i-edik osztályhoz (osztályközhöz) rendelt gyakoriság,

az i-edik osztályhoz (osztályközhöz) rendelt relatív gyakoriság,

k : a kialakított osztályok (osztályközök) száma,

N : a sokaság elemszáma.

A gyakoriságok összege mindig egyenlő a sokaság elemszámával, azaz

A relatív gyakoriságok összege mindig egyenlő 1-gyel, tehát

és jellemző, hogy

34
Egy ismérv szerinti elemzés

A 2.3. táblázat c) és d) változatban felírt gyakorisági sorát relatív gyakorisági sornak nevezzük. (Az gyakoriságokat abszolút gyakoriságoknak
is szokás nevezni, a relatív gyakoriságoktól való megkülönböztetés érdekében.)

A gyakorisági (relatív gyakorisági) sorok képzésének – mint azt a 2.3. táblázat is mutatja – a mennyiségi ismérv fajtájától és az ismérvváltozatok
számától függően alapvetően két módja van:

a) Ha a mennyiségi ismérv diszkrét és kevés változattal rendelkezik, akkor a gyakorisági sorban minden ismérvértéket felsorolunk. Pl. a társasház
50 lakását csoportosítjuk a lakások szobaszáma szerint (2.4. táblázat).

2.4. táblázat - A lakások szobaszám szerinti eloszlása


Szobák száma Lakások száma Szobák száma Lakások %-os
megoszlása

1 5 1 10

2 22 2 44

3 17 3 34

4 6 4 12
Összesen 50 Összesen 100

b) Ha a mennyiségi ismérv sokféle értéket vesz fel, akkor az ismérvértékek tartományát egymást át nem fedő intervallumokra, ún. osztályközökre
bontjuk. Az így képzett sort osztályközös gyakorisági (relatív gyakorisági) sornak (megoszlásnak) nevezzük. Az osztályközös gyakorisági sor
képzésénél a következő követelményeknek kell eleget tenni:

– Az osztályközhatárokat úgy kell meghatározni, hogy az ismérvértékek egyértelműen besorolhatók legyenek valamelyik – de csak egy –
osztályközbe.

– Annyi és olyan hosszúságú osztályközöket képezzünk, hogy a kapott gyakorisági sor jól tükrözze a sokaság mennyiségi ismérv szerinti összetételét.
Mutassa meg a sokaság egységeinek az X ismérv (változó) nagysága szerinti megoszlásában mutatkozó szabályszerűséget.

Az első követelmény azt jelenti, hogy az osztályközhatárok megadásánál

kifejezésre kell juttatni, hogy egy adott, éppen az osztályközhatárra eső érték melyik osztályközbe tartozik. Ez elsősorban akkor okoz gondot,
ha a mennyiségi ismérv folytonos. Például ha a lakásokat alapterületük szerint csoportosítjuk, az ismérv folytonos jellege azt kívánná, hogy az

35
Egy ismérv szerinti elemzés

2 2 2
intervallumok hézagmentesen illeszkedjenek egymáshoz, azaz az osztályközöket a következő módon jelöljük ki: 45–50 m ; 50–55 m ; 55–60 m
stb. A hézagmentesen illeszkedő osztályközhatárokat valódi határoknak nevezzük. Ebben az esetben azonban gondot jelenthet, hogy az éppen
2
osztályközhatárra eső 50, illetve 55 m -es alapterület melyik osztályközbe tartozik.

Az egyértelmű besorolhatóságot a statisztikában kétféleképpen biztosíthatjuk. Az osztályközhatárokat a mérési pontosságnál nagyobb pontossággal
adjuk meg (1. változat), vagy az osztályközök alsó határát a mérési pontosság egy egységével megnöveljük (2. változat). Az egyértelmű besorolás
érdekében megkülönböztetett osztályközhatárokat közölt határoknak szokás nevezni.
3
A kétféle változatot az alábbi gyakorisági sorok szemléltetik (2.5. táblázat). Mindkét esetben 10 m -es hosszúságú osztályközöket képezünk, és
3
figyelembe vesszük, hogy az adatok 1 m pontosságúak .

2.5. táblázat - A társasház lakásainak megoszlása a vízfogyasztás szerint


1. változat 2. változat
Vízfogyasztás Lakások száma Vízfogyasztás Lakások száma
3 3
(m ) (m )
– 20,0 21 – 20 21

20,1 – 30,0 21 21 – 30 21

30,1 – 8 31 – 8
Összesen 50 Összesen 50

Az osztályközök számának, illetve hosszának meghatározása már bonyolultabb feladat. Minden csoportosítás mindig bizonyos
információveszteséggel: az egységek egyedi tulajdonságaira vonatkozó ismereteink elvesztésével jár. Ugyanakkor egy jó csoportosítás segíti a
vizsgált sokaság egészének megismerését, ami az alapadatokhoz képest többletinformációt eredményez. Ezért olyan osztályközök kialakítására kell
törekedni, amelyek jól tömörítik a vizsgált jelenség törvényszerűségeit, de még nem eredményeznek számottevő információveszteséget.

Az utóbbi feltétel az osztályközök számának növelését, míg az előbbi a csökkentését indokolja. Ezért minden osztályozás esetén törekedni kell a
tömörítés és részletezés közötti ésszerű kompromisszumra. Az osztályközök számának és hosszának meghatározásához a szakmai ismereteken túl
jó támpontot adnak a 2.1.4. alpontban ismertetendő grafikus ábrák és az alábbiakban közölt információelméleti eredményeken alapuló becslések is.

Az osztályközök száma megbecsülhető a következő módon. Az osztályközök száma azon legkisebb k, melyre már teljesül:

ahol k : az osztályközök száma,

36
Egy ismérv szerinti elemzés

N: a sokaság elemszáma.

Az osztályközök számának ismeretében az osztályközök hosszát – egyenlő hosszúságú osztályközök esetén – az alábbi módon határozhatjuk meg:

ahol h: az osztályköz hossza,

a legnagyobb ismérvérték,

a legkisebb ismérvérték.

Az osztályközök számának és hosszának meghatározásához megismert módszerek nem minden esetben alkalmazható és követendő szabályok.
Ezek csak támpontot adnak, és alkalmazásuk olyan esetben célszerű, amikor az különbség nem túl nagy, és az ismérvértékek zöme nem
az intervallum egy szűkebb szakaszán sűrűsödik.

A lakások vízfogyasztásának rangsorából (2.2. táblázat) látható, hogy e feltételek teljesülnek, így a fenti módszereket alkalmazva az osztályközök
száma meghatározható. Mivel

elegendő az ismérvértékeket 6 osztályközbe sorolni.

Az osztályközök hossza:

Így a gyakorisági (relatív gyakorisági) sor a 2.6. táblázatban látható:

2.6. táblázat - A lakások vízfogyasztás szerinti megoszlása


Vízfogyasztás Lakások Vízfogyasztás Lakások %-os
3 3
(m ) száma (m ) megoszlása
– 15 5 – 15 10

37
Egy ismérv szerinti elemzés

16 – 20 16 16 – 20 32

21 – 25 15 21 – 25 30

26 – 30 6 26 – 30 12

31 – 35 5 31 – 35 10

36 – 3 36 – 6
Összesen 50 Összesen 100

A gyakorisági sorok készítésénél azonban nem törvényszerű az egyenlő hosszúságú osztályközök képzése. A gyakorlatban sokszor különböző
(egyenlőtlen) hosszúságú osztályközöket képezünk, hogy a megoszlásban mutatkozó szabályszerűség felismerhető legyen. Erre általában akkor
kerül sor, ha az különbség igen nagy és az ismérvértékek nem egyenletesen helyezkednek el az intervallumon belül, hanem zömmel
az intervallum egy vagy néhány szűkebb szakaszán sűrűsödnek. Ilyen esetben kevésbé hosszú osztályközöket képezünk az intervallum azon
szakaszán, ahol az ismérvértékek zöme található, és hosszabbakat az intervallum más szakaszain. Különböző hosszúságú osztályközöket képezünk
például, ha a lakossági devizaszámlákat vagy betétkönyveket csoportosítjuk a betétösszeg nagysága szerint. A legnagyobb és legkisebb betétösszeg
közötti különbség igen nagy, és jellemző, hogy a kisebb betétösszegek nagyobb gyakorisággal, a nagyobb betétek kisebb gyakorisággal fordulnak
elő. Így az intervallum alsó szakaszán kisebb hosszúságú, a felső szakaszán nagyobb hosszúságú osztályközöket képezünk.

Ezt a megoldást választjuk a népesség 1 főre jutó jövedelem szerinti, illetve a nyugdíjasok nyugdíjnagyság szerinti csoportosításánál is.

A 2.7. táblázat szerinti – és az előző gyakorisági sorokban is – az első és utolsó (alsó és felső) osztályköz ún. nyitott osztályköz. A további
számítások, elemzések során ezeket úgy kezeljük, mintha zártak lennének. Az első intervallumot ugyanolyan hosszúságúnak tételezzük fel, mint az
őt követőt az utolsót pedig, mint az őt megelőzőt

Kumulált gyakorisági sorok

A gyakorisági (relatív gyakorisági) sorokban rejlő információk tovább bővíthetők a gyakoriságok (relatív gyakoriságok) halmozott összeadásával,
azaz kumulálásával.

2.7. táblázat - A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában

Nyugdíj Nyugdíjas nők Osztályközök hossza

(Ft) száma (fő)

38
Egy ismérv szerinti elemzés

– 5 999 478 ?

6 000 – 6 999 998 1000

7 000 – 7 999 46 162 1000

8 000 – 8 999 87 555 1000

9 000 – 9 999 201 385 1000

10 000 – 11 999 258 245 2000

12 000 – 14 999 522 029 3000

15 000 – 19 999 112 483 5000

20 000 – 24 999 23 027 5000

25 000 – 7 388 ?
Összesen 1 259 750 –

A kumulált gyakoriságok (jele: ), ill. kumulált relatív gyakoriságok (jele: ) adatai azt mutatják, hogy az adott osztályköz felső határának
megfelelő és annál kisebb ismérvértékek hányszor , ill. milyen arányban fordulnak elő. A kumulált gyakorisági, ill. kumulált relatív gyakorisági
sort úgy képezzük, hogy a gyakoriságokat , ill. relatív gyakoriságokat rendre halmozva összeadjuk.

A kumulált gyakoriságok (relatív gyakoriságok) számítását a lakások vízfogyasztására vonatkozó példa alapján mutatjuk be (2.8. táblázat).

2.8. táblázat - A társasház vízfogyasztására vonatkozó adatok

Lakások száma Lakások megoszlása (%)


Vízfogyasztás tényleges kumulált
3 tényleges kumulált
(m ) ( ) ( )
– 15 5 5 10 10

16 – 20 16 21 32 42

39
Egy ismérv szerinti elemzés

21 – 25 15 36 30 72

26 – 30 6 42 12 84

31 – 35 5 47 10 94

36 – 3 50 6 100
Összesen 50 – 100 –

Például:

A lakások 72%-ában – összesen 36 lakásban – a vízfogyasztás 25 m3 vagy annál kevesebb.

A gyakorisági (relatív gyakorisági) sorokból lefelé kumulált gyakorisági (relatív gyakorisági) sor is képezhető. E sorok adatai azt mutatják, hogy
az adott osztályköz alsó határánál nagyobb ismérvértékek hányszor , ill. milyen arányban fordulnak elő (2.9. táblázat).

2.9. táblázat - A társasház vízfogyasztására vonatkozó adatok


Lakások száma Lakások megoszlása (%)
Vízfogyasztás tényleges lefelé kumulált tényleges lefelé kumulált

(m3) ( ) ( )
– 15 5 50 10 100

16 – 20 16 45 32 90

21 – 25 15 29 30 58

26 – 30 6 14 12 28

31 – 35 5 8 10 16

36 – 3 3 6 6

40
Egy ismérv szerinti elemzés

Összesen 50 – 100 –

Például:

A lakások 58%-ának – összesen 29 lakásnak – a vízfogyasztása 20 m3-nél nagyobb.

2.1.3. Értékösszegsor
Az előző alfejezetben a sokaság egységeit mennyiségi ismérv szerint osztályoztuk. Az osztályozás eredménye a gyakorisági sor, ami a mennyiségi
sorok egyik típusa. A másik típus az értékösszegsor.

Az értékösszegsor (2.10. táblázat) a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységek
ismérvértékeinek összegét rendeli.

A vizsgált mennyiségi ismérv értékeinek egyes osztályokon (osztályközökön) belüli összegeit értékösszegeknek (jele: ) nevezzük.

2.10. táblázat - Az értékösszegsor általános sémája


a) változat (eloszlás) b) változat (megoszlás)
Ismérvérték Értékösszeg Az osztályközök Értékösszeg
alsó határa felső határa

Összesen S Összesen S

ahol az i-edik osztályhoz (osztályközhöz) rendelt értékösszeg,

41
Egy ismérv szerinti elemzés

S : a sokaság teljes értékösszege.

Eloszlás esetén az egyes osztályokhoz tartozó értékösszegeket az ismérvértékek és a gyakoriságok szorzataként kapjuk:

A sokaság teljes értékösszege:

A következő gyakorisági sor valamely település háztartásainak taglétszám szerinti megoszlását mutatja (a megfigyelés időpontjában) (2.11. táblázat).

2.11. táblázat - A település háztartásainak taglétszám szerinti eloszlása


Taglétszám (fő) Háztartások száma

1 51

2 89

3 145

4 85

5 34

6 21
Összesen 425

A gyakorisági sor alapján képzett értékösszegsort pedig a 2.12. táblázatban látjuk.

2.12. táblázat - A település lakosainak eloszlása az egyes háztartások taglétszáma szerint


Taglétszám (fő) Lakosok száma (fő)

42
Egy ismérv szerinti elemzés

1 51

2 178

3 435

4 340

5 170

6 126
Összesen 1300

Például:

fő. Összesen 435 fő él 3 fős háztartásban.

fő. A település lakosainak száma 1300 fő.

Osztályközös gyakorisági sor esetén az egyes osztályközök tényleges értékösszegei csak akkor határozhatók meg, ha ismerjük az eloszlást.

A vízfogyasztás rangsora (adatok a 2.2. táblázatban) alapján a tényleges értékösszegsort a 2.13. táblázat mutatja.

2.13. táblázat - Az összes vízfogyasztás megoszlása


3
Vízfogyasztás Összes vízfogyasztás (m )
3
(m )
– 15 62

16 – 20 287

21 – 25 337

26 – 30 166

31 – 35 161

43
Egy ismérv szerinti elemzés

36 – 112
Összesen 1125

Például: (a rangsorból az ötödik osztályközbe sorolt ismérvértékek összege).

A sokaság teljes értékösszege:

. A társasház összes vízfogyasztása 1125 m3.

Ha csak az osztályközös gyakorisági sor (a megoszlás) áll rendelkezésre, akkor az értékösszegeket a gyakoriságok és az osztályközepek
szorzataként becsüljük.

Az i-edik osztályközépső:

Az értékösszegek becslését a lakások vízfogyasztás szerinti megoszlását mutató osztályközös gyakorisági sorból (2.6. táblázat) végezzük.

2.14. táblázat - Munkatábla az osztályközép meghatározásához

Vízfogyasztás Lakások száma Osztályközök Osztályközép


3
(m ) hossza
– 15 5 5 12,5

16 – 20 16 5 17,5

21 – 25 15 5 22,5

26 – 30 6 5 27,5

31 – 35 5 5 32,5

36 – 3 5 37,5
Összesen 50 – –

44
Egy ismérv szerinti elemzés

A gyakorisági sor első és utolsó osztályköze nyitott, de a gyakorisági sor alapján végzett számítások során azokat úgy kezeljük, mintha zártak
lennének:

Az osztályközepek meghatározásánál nem vesszük figyelembe az egyértelmű besorolás érdekében megkülönböztetett felső és alsó
osztályközhatárokat, hanem a hézagmentesen illeszkedő, ún. valódi osztályközhatárok alapján számítjuk ki őket. Pl.

2.15. táblázat - Az összes vízfogyasztás megoszlása


3
Vízfogyasztás Összes vízfogyasztás (m )
3
(m )
– 15 62,5

16 – 20 280,0

21 – 25 337,5

26 – 30 165,0

31 – 35 162,5

36 – 112,5
Összesen 1120,0

Például:

A 2.14. és 2.15. táblázat adataiból látható, hogy a tényleges és becsült értékösszegek eltérnek egymástól. Az eltérés abból adódik, hogy a becslés
során az ötödik osztályközben feltételezzük pl., hogy az ide besorolt lakások mindegyike 32,5 m3 (az osztályközépnek megfelelő) vizet fogyaszt.

Az osztályközös gyakorisági sor alapján történő becslés annál jobban közelíti meg a tényleges értékösszegeket, minél egyenletesebb az
ismérvértékek eloszlása az osztályközökön belül.

45
Egy ismérv szerinti elemzés

Ha az értékösszegek – ismérvértékek szerinti – megoszlásáról is képet akarunk kapni, akkor relatív értékösszegsort képezünk.

Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét ( ) a teljes
értékösszeghez (S) viszonyítja.

Az i-edik osztály relatív értékösszege (jele: ):

A relatív értékösszegekre is igaz, hogy

A 2.15. táblázat alapján a relatív értékösszegsor (2.16. táblázat):

2.16. táblázat - Az összes vízfogyasztás megoszlása


Vízfogyasztás Összes vízfogyasztás
3
(m ) megoszlása (%)
– 15 5,6

16 – 20 25,0

21 – 25 30,1

26 – 30 14,7

31 – 35 14,5

36 – 10,1
Összesen 100,0

A gyakorisági sorokhoz hasonlóan az értékösszegsorból és a relatív értékösszegsorból is képezhetünk kumulált, ill. lefelé kumulált sorokat (2.17.
táblázat).

46
Egy ismérv szerinti elemzés

2.17. táblázat - A társasház vízfogyasztására vonatkozó adatok

Összes vízfogyasztás
Összes vízfogyasztás (m3)
megoszlása (%)
Lefelé Lefelé
Vízfogyasztás Kumulált Kumulált
kumulált kumulált
3
(m ) ( ) ( )
( ) ( )
– 15 62,5 62,5 1120,0 5,6 5,6 100,0

16 – 20 280,0 342,5 1057,5 25,0 30,6 94,4

21 – 25 337,5 680,0 777,5 30,1 60,7 69,4

26 – 30 165,0 845,0 440,0 14,7 75,4 39,3

31 – 35 162,5 1007,5 275,0 14,5 89,9 24,6

36 – 112,5 1120,0 112,5 10,1 100,0 10,1


Összesen 1120,0 – – 100,0 – –

Például:

A társasházban elfogyasztott vízmennyiség 60,7%-át – összesen 680 m3-t – azokban a lakásokban használták fel, amelyekben a vízfogyasztás
25 m3 és annál kisebb volt.

2.1.4. A gyakorisági sorok grafikus ábrázolása


A statisztikai adatok szemléltetésének, a statisztikai adatok közötti arányok bemutatásának fontos eszköze a grafikus ábrázolás. A helyesen
készített ábrákkal áttekinthetőbbé válik a sokaság szerkezete, felismerhetővé a sokaság mennyiségi ismérv szerinti megoszlásában mutatkozó
szabályszerűség.

A gyakorisági (relatív gyakorisági) sorok ábrázolása derékszögű koordináta-rendszerben történik. A vízszintes tengelyen a mennyiségi ismérv
értékeit, a függőleges tengelyen pedig a gyakoriságokat (relatív gyakoriságokat) vagy azok kumulált értékeit tüntetjük fel.

47
Egy ismérv szerinti elemzés

A kevés értéket felvevő diszkrét mennyiségi ismérvek esetén csak az ábrázolni kívánt gyakoriságokkal (relatív gyakoriságokkal) arányos hosszúságú,
valamilyen feltűnő módon megjelölt végpontú egyenes szakaszokkal történhet az ábrázolás. Az ilyen típusú ábrát az eloszlás bot-ábrájának
nevezzük.

A 2.11. táblázat adatai alapján készített bot-ábra a 2.1. ábrán látható:

2.1. ábra - A háztartások taglétszám szerinti eloszlásának bot-ábrája

A 2.1. ábra jellege nem változna meg, ha a függőleges tengelyen az abszolút gyakoriságok helyett a relatív gyakoriságok szerepelnének.

Az osztályközös gyakorisági sorokat, amelyeket leggyakrabban folytonos mennyiségi ismérv szerinti csoportosítással képezünk, hisztogrammal és
gyakorisági poligonnal ábrázoljuk.

A hisztogram hézagmentesen egymás mellé illesztett téglalapokkal szemlélteti a gyakorisági (relatív gyakorisági) sort. (Mi a relatív gyakoriságok
alapján készítettük a 2.2. ábrát.)

48
Egy ismérv szerinti elemzés

2.2. ábra - A lakások vízfogyasztás szerinti megoszlásának hisztogramja

A kumulált gyakorisági (relatív gyakorisági) sorok is szemléltethetők (2.3. ábra).

49
Egy ismérv szerinti elemzés

2.3. ábra - A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok

A hisztogram téglalapjainak területe arányos a relatív gyakoriságokkal, így a gyakoriságokkal is. A különböző osztályközhosszúságokkal képzett
gyakorisági (relatív gyakorisági) sor ábrázolásánál az arányosság csak úgy biztosítható, ha az eredeti gyakoriságok (relatív gyakoriságok) helyett

az egységnyi osztályközhosszúságra jutó gyakoriságokat relatív gyakoriságokat vagy azok valamilyen többszörösét ábrázoljuk. Az eredeti
gyakoriságok (relatív gyakoriságok) alapján történő ábrázolás ugyanis torzítana, mivel a hosszabb osztályköz nagyobb súlyt kapna, a téglalap területe
az arányosnál nagyobb lenne. Ennek bemutatására szolgál a következő példa. Az adatokat a 2.18. táblázat tartalmazza.

2.18. táblázat - Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint
Biztosítás Biztosítások Osztályközök 1000 osztályközhosszúságra
díja (Ft) hossza jutó gyakoriság
száma (db)
– 2000 15 1000 15,0

2001 – 3000 50 1000 50,0

50
Egy ismérv szerinti elemzés

3001 – 4000 60 1000 60,0

4001 – 6000 80 2000 40,0

6001 – 8000 25 2000 12,5

8001 – 10 000 15 2000 7,5

10 001 – 5 2000 2,5


Összesen 250 – –

Az 1000 osztályközhosszúságra jutó gyakoriság: Pl. a negyedik osztályközben: (A hisztogramot a 2.4. ábra mutatja.)

Ha a relatív gyakoriságokat úgy ábrázoljuk, hogy az osztályköz az egység vagy a téglalapok magassága ( ), akkor a téglalapok összterülete
1. Ebben az esetben sűrűséghisztogramról beszélünk.

A kumulált relatív gyakoriságok ábrázolásánál monoton növekvő függvényt kapunk, amelynek legkisebb értéke 0 és a legnagyobb 1 (százalékos
formánál 100). Ilyen függvényt közvetlenül az eloszlásból is készíthetünk, ekkor eloszlásfüggvénynek nevezzük.

A gyakorisági poligon az osztályközepeknél felmért gyakoriságok (a különböző hosszúságú osztályközöknél az egységnyi osztályközhosszúságra
jutó gyakoriságok) pontjait összekötő, egyenes szakaszokból álló vonaldiagram. Az első és utolsó pontot összekötjük az X tengelyen az első
osztályközt megelőző (azzal azonos hosszúságú) osztályköz, ill. az utolsó osztályközt követő (azzal azonos hosszúságú) osztályköz középpontjával.

51
Egy ismérv szerinti elemzés

2.4. ábra - A biztosítások biztosítási díj szerinti megoszlásának hisztogramja

52
Egy ismérv szerinti elemzés

2.5. ábra - A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja

53
Egy ismérv szerinti elemzés

2.6. ábra - A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja

A 2.5 és 2.6. grafikus ábrák szemléletesen mutatják a gyakorisági eloszlás jellegzetességeit.

A következő alfejezetekben megismerkedünk azokkal a mutatószámokkal, amelyek további és egyben valamilyen számszerű információt nyújtanak
a gyakorisági sorok jellegzetességeiről, az eloszlás helyzetéről, szóródásáról és alakjáról. E mutatószámok alapján, majd később látni fogjuk,
akkor is képet kapunk az eloszlásról, ha nem állnak rendelkezésre az alapadatok és/vagy a grafikus ábrák.

Az eloszlás helyzete: a jellemzőnek tartott értékek – a középértékek (módusz, medián, átlag) és a kvantilisek – helye az X tengelyen. E mutatókat
ezért helyzetmutatóknak is szokás nevezni.

Az eloszlás szóródása: az ismérvértékek különbözősége, változékonysága, melyet a szóródás mérőszámaival vizsgálunk.

Az eloszlás alakja: szimmetrikus vagy aszimmetrikus, melyről az aszimmetriamérőszámai (alakmutatók) adnak számszerű információt.

2.1.5. Helyzetmutatók
Módusz

A módusz (jele: Mo) azt az értéket jelöli, amelyik a szó hétköznapi értelmében a legáltalánosabb, amelyik a tipikus a sokaságban. Ezért tipikus
értéknek is szokásnevezni .

54
Egy ismérv szerinti elemzés

Az eloszlás módusza a leggyakrabban előforduló ismérvérték, ha van ilyen érték.

A 2.11. táblázat (a háztartások taglétszám szerinti megoszlása) adataiból :

Mo = 3

A háztartások tipikus (leggyakoribb) taglétszáma 3 fő.

A gyakorisági megoszlás ún. nyers módusza a gyakorisági poligon maximumhelye, az az ismérvérték, amely körül az előforduló ismérvértékek
legjobban sűrűsödnek.

2.7. ábra -

A 2.7. ábrán látható gyakorisági poligonnak egy maximumhelye van. Az ilyen megoszlást (illetve eloszlást) egymóduszú megoszlásnak, illetve
eloszlásnak nevezzük, és a móduszt mint helyzetmutatót elsősorban ilyen megoszlások, illetve eloszlások jellemzésére használjuk.

Ha a gyakorisági poligonnak több helyi maximuma van, a megoszlást, illetve az eloszlást többmóduszú megoszlásnak, illetve eloszlásnak
nevezzük. Ilyen eloszlást szemléltet a 2.8. ábra.

55
Egy ismérv szerinti elemzés

2.8. ábra -

A többmóduszú eloszlások gyakran heterogén (nem egynemű) sokaságra utalnak, azaz az eloszlás több (a 2.8. ábrán kettő) egymóduszú eloszlást
mutató részsokaságból tevődik össze. Ilyen esetben a teljes sokaság vizsgálata mellett – ha a heterogenitást okozó ismérv ismert – a sokaságot
részsokaságokra bonthatjuk, és az elemzést a részekre bontott sokaságokra is elvégezhetjük. Ennek részleteiről a 3. fejezetben lesz szó.

A folytonos (és a sok változattal rendelkező diszkrét) mennyiségi ismérv móduszát osztályközös gyakorisági sor alapján becsüljük.

A móduszt az az osztályköz tartalmazza, amelyben az egységnyi osztályközhosszúságra jutó gyakoriság (relatív gyakoriság) a legnagyobb. (Az
ismérvértékek sűrűsége, tömörülése ebben az osztályközben a legnagyobb.) A móduszt tartalmazó osztályközt modális osztályköznek nevezzük.

Azonos hosszúságú osztályközök esetén ez a legnagyobb gyakoriságú (relatív gyakoriságú) osztályköz. Különböző hosszúságú osztályközök esetén
az egységnyi osztályközhosszúságra jutó gyakoriságok (relatív gyakoriságok) alapján keressük meg a modális osztályközt.

A modális osztályköz közepét nyers módusznak nevezzük. Ha szimmetrikus a megoszlás, akkor a nyers módusz maga a módusz.

Ha nem szimmetrikus a megoszlás, akkor a módusz becsléséhez a modális osztályközzel szomszédos osztályközök gyakoriságát is figyelembe
vesszük. Ebben az esetben ugyanis a módusz közelebb van valamelyik osztályközhatárhoz. Feltételezhető, hogy a sűrűsödési hely közelebb esik
a modális osztályköz azon (alsó vagy felső) határához, amelynek nagyobb a gyakorisága.

A módusz becsült értéke:

ahol: a modális osztályköz alsó határa,

56
Egy ismérv szerinti elemzés

a modális és az azt megelőző osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,

a modális és az azt követő osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,

h : a modális osztályköz hossza.

A módusz becslését a lakások vízfogyasztásának gyakorisági sora alapján mutatjuk be (adatok a 2.6. táblázatban):

– modális osztályköz: 15–20 m3,

– osztályközök azonos hosszúságúak,

(mivel ezért a módusz az osztályköz felső határához esik közelebb),

A lakások tipikus vízfelhasználása 19,6 m3.

A tipikus vízfelhasználás becslése a relatív gyakorisági sor alapján (adatok a 2.6. táblázatban):

57
Egy ismérv szerinti elemzés

2.9. ábra - A lakások vízfogyasztás szerinti megoszlása

A módusz grafikus úton is becsülhető. A gyakorisági (relatív gyakorisági) sor jól szerkesztett hisztogramjának segítségével a módusz becsült értéke
szerkeszthető. A 2.9. ábrán két hasonló háromszöget látunk:

Ebből:

A módusz becslését különböző hosszúságú osztályközös gyakorisági sor alapján is bemutatjuk.

A lakások tipikus biztosítási díjának becslése (adatok a 2.18. táblázatban):

Az egységnyi (1000) osztályközhosszúságra jutó gyakoriságok alapján a modális osztályköz: 3000 – 4000 Ft;

58
Egy ismérv szerinti elemzés

Medián

A medián (jele: Me) a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint nagyobb érték fordul elő. A grafikus ábrákra gondolva,
az X tengelyen az a pont, melyben az X tengelyre állított merőleges a hisztogram területét, illetve a gyakorisági poligon alatti területet felezi (két
egyenlő részre osztja).

A mediánnak van egy érdekes tulajdonsága. Ha minden ismérvértéket a mediánnal helyettesítenénk, akkor ezzel összességében a lehető legkisebb
hibát követnénk el, ha ezt a hibát az módon mérjük. Igaz ugyanis, hogy a

A mediánt az ismérvértékek rangsorából a következő módon határozzuk meg:

– Ha a megfigyelt sokaság elemszáma (N) páratlan, akkor a medián a rangsor

(azaz a középső) ismérvértékével azonos.

– Ha a sokaság elemszáma páros, akkor a a medián a két középső, azaz az

ismérvérték számtani átlaga.

A társasház vízfogyasztásának rangsora (2.2. táblázat) alapján a medián a következő módon számítható.

A megfigyelt lakások száma:

59
Egy ismérv szerinti elemzés

Tehát a medián a rangsor 25. és 26. ismérvértékének átlaga. A rangsor 25. ismérvértéke: 21 m3, a 26. ismérvértéke: 22 m3.

A lakások felében (50%-ában) a vízfogyasztás 21,5 m3-nél kevesebb, másik felében (50%-ában) ennél több.

Az osztályközös gyakorisági (relatív gyakorisági) sor esetén a mediánt csak becsléssel tudjuk meghatározni.

A mediánt az az i-edik osztályköz tartalmazza, amelynél

teljesül, ahol: az i-edik osztályköz kumulált gyakorisága,

az i-edik osztályköz kumulált relatív gyakorisága,

az i-edik osztályközt megelőző osztályköz kumulált gyakorisága,

az i-edik osztályközt megelőző osztályköz kumulált relatív gyakorisága.

Feltételezve, hogy a mediánt tartalmazó osztályközön belül az ismérvértékek egyenletesen helyezkednek el, az osztályköz arányos részét az
osztályköz alsó határához hozzáadva, a mediánra megfelelő becslést kapunk.

ahol: a mediánt magába foglaló osztályköz alsó határa,

a mediánt megelőző osztályköz kumulált gyakorisága,

a mediánt megelőző osztályköz kumulált relatív gyakorisága,

60
Egy ismérv szerinti elemzés

a mediánt magába foglaló osztályköz gyakorisága,

a mediánt magába foglaló osztályköz relatív gyakorisága,

h: a mediánt magába foglaló osztályköz hossza.

A medián becslését a vízfogyasztás gyakorisági sora alapján mutatjuk be (2.19. táblázat).

2.19. táblázat - Munkatábla a medián becsléséhez


Vízfogyasztás
3
(m )
– 15 5 5 0,10 0,10

16 – 20 16 21 0,32 0,42

21 – 25 15 36 0,30 0,72

26 – 30 6 42 0,12 0,84

31 – 35 5 47 0,10 0,94

36 – 3 50 0,06 1,00
Összesen 50 – 1,00 –

A harmadik osztályköz kumulált gyakorisága az első, amely már meghaladja a 25-öt, így a medián a közötti intervallumban van.

A medián becsült értéke:

illetve a relatív gyakoriságok alapján:

61
Egy ismérv szerinti elemzés

A gyakorisági sor alapján becsült érték (21,33 m3) jól közelíti a medián rangsor alapján meghatározott értékét (21,5 m3).

Az átlag

Az eloszlás helyzetének jellemzésére leggyakrabban az átlagot(jele: ) használjuk.

Az ismérvértékek átlaga egyenlő az ismérvértékek összegének és a sokaság elemszámának hányadosával, mely hányados az
ismérvértékek számtani átlaga.

A számtani átlag definíciója alapján könnyen belátható, hogy ha minden ismérvértéket az átlaggal helyettesítünk, akkor ezek összege egyenlő az
eredeti értékek összegével:

A vízfogyasztás rangsora (2.2. táblázat) alapján a lakások átlagos vízfogyasztása:

Az ismérvértékek átlagát nemcsak az alapadatokból kiindulva, hanem

– a sokasághoz tartozó értékösszegből,

– egy gyakorisági sor adataiból, vagy

– egy értékösszegsor adataiból is számíthatjuk.

Az első esetben az átlag:

62
Egy ismérv szerinti elemzés

ahol S: a sokaság teljes értékösszege.

Példánkban a társasház összes vízfogyasztása: így az átlagos vízfogyasztás:

Gyakorisági sor alapján az ismérvértékek átlagát súlyozott számtani átlagformában számítjuk.

ahol az átlagolni kívánt ismérvértékek (osztályközös gyakorisági sor esetén az osztályközepek),

az egyes osztályokhoz (osztályközökhöz) tartozó gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.

A megoszlásból az osztályközepekkel történő számítás esetén az eloszlás átlagára becsült értéket kapunk.

2.20. táblázat - Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok
Biztosítási díj Biztosítások
(Ft) száma (db)
– 2000 15 1 500 0,06

2001 – 3000 50 2 500 0,20

3001 – 4000 60 3 500 0,24

4001 – 6000 80 5 000 0,32

6001 – 8000 25 7 000 0,10

8001 – 10 000 15 9 000 0,06

10 001 – 5 11 000 0,02

63
Egy ismérv szerinti elemzés

Összesen 250 – 1,00

Az átlagos biztosítási díj (átlagdíj):

Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem az aránya befolyásolja, ezért súlyként a gyakoriságok helyett használhatók
a relatív gyakoriságok is.

Az átlagos biztosítási díj:

A számításokat a 2.20. táblázat adatainak felhasználásával végeztük.

Az ismérvértékek átlagát az értékösszegsorból súlyozott harmonikusátlag formában számítjuk. Mivel

ahol az i-edik osztály (osztályköz) értékösszege, ezért az átlag a következő formában is számítható:

mely nem más, mint az értékek (osztályközepek) súlyokkal számított harmonikus átlaga. Mivel az átlag nagyságát a súlyarányok befolyásolják,

ezért súlyként az értékösszegek helyett az hányadosok, azaz a relatív értékösszegek is használhatók:

64
Egy ismérv szerinti elemzés

A lakásbiztosításokra vonatkozó példa alapján (2.21. táblázat):

2.21. táblázat - Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok
Biztosítási Összes bevétel
díj (Ft) (Ft) megoszlása (%)
– 2000 1500 22 500 2,00

2001 – 3000 2500 125 000 11,14

3001 – 4000 3500 210 000 18,71

4001 – 6000 5000 400 000 35,63

6001 – 8000 7000 175 000 15,59

8001 – 10 000 9000 135 000 12,03

10 001 – 11 000 55 000 4,90


Összesen – 1 122 500 100,00

Az átlagos biztosítási díj:

65
Egy ismérv szerinti elemzés

Kvantilisek

A középértékek mellett fontos helyzetmutatók a kvantilisek.

Legyen 0 < q < 1. Ha a rangsorba rendezett sokaságot egy X ismérvérték arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy
q-adik kvantilisnek nevezzük (jele: ).

Kumulált gyakoriságokkal, illetve kumulált relatív gyakoriságokkal felírva:

Ha a feltételnek két ismérvérték is eleget tesz, akkor ezen intervallumot arányban osztó pont lesz.

A gyakran előforduló kvantiliseket külön névvel és jelöléssel is illetjük.

Tercilisek: (alsó tercilis), (felső tercilis),

Kvartilisek: (alsó kvartilis), (medián), (felső kvartilis),

Kvintilisek:

Decilisek: ...,

Percentilisek: ...,

A kvartilisek – és egyben az összes kvantilis – rangsorból való meghatározásának és osztályközös gyakorisági (relatív gyakorisági) sorból történő
becslésének menete azonos a mediánnál ismertetett eljárással.

Ha a kvantilist a rangsorból kiindulva határozzuk meg, akkor legyen

ahol: az egész részt, a törtrészt jelöli.

66
Egy ismérv szerinti elemzés

Ekkor:

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a kvartilisek meghatározása a következő.

Az alsó kvartilis számítása:

A szám egész része: törtrésze: Az alsó kvartilis tehát a rangsor 12. és 13. értéke között van; úgy határozzuk meg, hogy a rangsor 12.
ismérvértékéhez, az hozzáadjuk a 13. és 12. ismérvérték közötti különbség 0,75-szeresét:

A lakások 25%-ában a vízfogyasztás 17,75 m3-nél kevesebb, 75%-ában ennél több.

A felső kvartilis:

így és

A rangsor 38. ismérvértékéhez hozzáadjuk a 39. és 38. ismérvérték közötti különbség 0,25-szeresét:

A lakások 75%-ának a vízfogyasztása 26,25 m3-nél kevesebb, 25%-ának ennél nagyobb.

Osztályközös gyakorisági (relatív gyakorisági) sorból történő becslés esetén a kvantilist az az i-edik osztályköz tartalmazza, amelyre

illetve relatív gyakorisági sor esetén a

67
Egy ismérv szerinti elemzés

teljesül. Ekkor

ahol az i-edik osztályköz alsó határa,

az i-edik osztályköz hossza.

A kvartilisek becslését a vízfogyasztás gyakorisági sora (adatok a 2.19. táblázatban) alapján mutatjuk be.

Az alsó kvartilis becslése:

Az és a második osztályközben a kumulált gyakoriság már nagyobb, mint 12,5. Így az alsó kvartilis 15–20 m3 között van.

A felső kvartilis becslése:

A kumulált gyakoriság először a negyedik osztályközben nagyobb, mint 37,5. Ezért a felső kvartilis m3 között van.

(A gyakorisági sorból történő becslés – már a mediánnál is láttuk – elfogadható pontosságú.)

A kvantilisek jól szerkesztett ábra – a kumulált gyakoriságok (relatív gyakoriságok) hisztogramja – alapján is becsülhetők (2.10. ábra).

68
Egy ismérv szerinti elemzés

2.10. ábra - A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése

A lakossági jövedelmek vizsgálatánál gyakran a deciliseket számítjuk ki. A 2.7. táblázat a nyugdíjas nők nyugdíjnagyság szerinti megoszlását mutatja.
A gyakorisági sorból a kvartilisek becslésénél megismert módon becsülhetjük a deciliseket is.

Az első decilis becslése:

A negyedik osztályközben a kumulált gyakoriság ennél nagyobb, így Ebből:

A nyugdíjas nők 10%-ának nyugdíja 8894 Ft-nál kisebb, 90%-ának ennél nagyobb volt 1994 áprilisában.

69
Egy ismérv szerinti elemzés

Az ötödik decilis (medián) becslése:

A nyugdíjas nők 50%-ának a nyugdíja 12 200 Ft-nál kevesebb, 50%-ának pedig több volt 1994 áprilisában. (A tehát valóban a mediánnal azonos.)

A többi decilist is hasonló módon kiszámítva (becsülve), az eredményeket sorba rendezve egy speciális gyakorisági (relatív gyakorisági) sort, ún.
deciliseloszlást képezhetünk, melyet a 2.22. táblázat tartalmaz.

2.22. táblázat - A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás)
Nyugdíj Nyugdíjas nők Nyugdíj Nyugdíjas nők
(Ft) száma (fő) (Ft) megoszlása (%)
– 8894 125 975 – 8894 10

8894 – 9579 125 975 8894 – 9579 10

9579 – 10 319 125 975 9579 – 10 319 10

10 319 – 11 295 125 975 10 319 – 11 295 10

11 295 – 12 200 125 975 11 295 – 12 200 10

12 200 – 12 924 125 975 12 200 – 12 924 10

12 924 – 13 648 125 975 12 924 – 13 648 10

13 648 – 14 372 125 975 13 648 – 14 372 10

14 372 – 15 751 125 975 14 372 – 15 751 10

15 751 – 125 975 15 751 – 10


Összesen 1 259 750 Összesen 100

70
Egy ismérv szerinti elemzés

A fenti osztályközös gyakorisági sorokban az osztályközök határai a decilisek, az osztályközök gyakorisága (relatív gyakorisága) pedig azonos.
Például a hetedik osztályköz alsó határa: a felső határa: 125 975 főnek, a nyugdíjas nők 10%-ának a nyugdíja 12 924 és
13 648 Ft között volt, 70%-ának a nyugdíja pedig 13 648 Ft-nál kevesebb volt 1994 áprilisában.

Az olyan – nem egyenlő hosszúságú osztályközös gyakorisági (relatív gyakorisági) – sorokat, melyekben minden osztályköz gyakorisága (relatív
gyakorisága) azonos és az osztályközhatárok a kvantilisek (kvartilis, kvintilis, decilis stb.), a gyakorlatban kvantilis eloszlásnak nevezzük. (Az eddig
használt terminológiák szerint indokoltabb lenne a kvantilis megoszlás elnevezés.)

2.1.6. Szóródási mutatók


A középértékek és a kvantilisek csak egyetlen tulajdonságát rögzítik az eloszlásnak, az elhelyezkedését (a vízszintes tengelyen elfoglalt helyét).
Ettől azonban a sokaság eloszlása még nagyon sokféle lehet.

2.11. ábra -

A 2.11. ábrán három eloszlás gyakorisági poligonját mutatjuk be. Mivel szimmetrikusak, az átlaguk, móduszuk és a mediánjuk ugyanakkora, mégis
lényegesen különböznek egymástól. Mi okozza az eltérést? Az, hogy az adatok szétszórtsága, ún. szóródása erősen különbözik az eloszlásokban.
Az egyiknél az átlag körül tömörül az ismérvértékek zöme, a másiknál kevésbé, a harmadiknál teljesen szétszórtan helyezkednek el.

71
Egy ismérv szerinti elemzés

Ahhoz, hogy a középérték jellemző erejét értékelni tudjuk, szükséges, hogy az ismérvértékek szóródásáról is legyen ismeretünk. Az olyan középérték,
amely körül kicsi az ismérvértékek szóródása, jobb jellemzője a sokaságnak, mint az olyan, amelytől az egyes ismérvértékek nagymértékben
különböznek.

Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékeinek) különbözőségét értjük. Önmagában tehát azt a
tényt jelenti, hogy pl. a megfigyelt társasház lakásainak vízfogyasztása különböző nagyságú.

Az ismérvértékek szóródásáról a gyakorisági sor és a grafikus ábrák is adnak információt, emellett azonban szükség van a szóródás mérésére, a
szóródás jelenségének egyetlen számértékben való tömörítésére.

A szóródás mérése az ismérvértékek valamely középértéktől (általában a számtani átlagtól) vett eltérései vagy egymás közötti különbségei
alapján történik. Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezik
a megfigyelt ismérv mértékegységével.

A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől (általában %-os formában fejezzük ki őket), a
szóródás térbeli vagy időbeli összehasonlítására szolgálnak.

Valamennyi mérőszám közös tulajdonsága, hogy a szóródás hiányát (ha minden ismérvérték egyenlő) nullával, meglétét pedig valamilyen nullától
különböző pozitív értékkel jelzi.

A leggyakrabban használt szóródási mérőszámok:

– a szóródás terjedelme,

– az átlagos eltérés,

– a szórás,

– az átlagos különbség és

– a relatív szórás.

A szóródás terjedelme

A szóródás terjedelme (jele: R) az előforduló legnagyobb és legkisebbismérvérték különbsége:

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):

72
Egy ismérv szerinti elemzés

A terjedelem a szóródásnak igen szemléletes kifejezője (pl. egy adott termék legkisebb és legnagyobb fogyasztói árának különbsége, vagy egy adott
évben befizetett legkisebb és legnagyobb személyi jövedelemadó különbsége), a gyakorlatban mégis kevésbé használatos a szóródás mérésére.
Ennek az az oka, hogy értékét a véletlen szerepe számottevően befolyásolhatja, mivel nagysága csak a két legszélsőségesebb ismérvértéktől függ.
Ezért gyakran használják a terjedelem helyett az ún. interkvantilis terjedelemmutatókat is, amelyek két szélső kvantilis különbségével azonosak
(pl. az első és kilencedik decilis vagy az alsó és felső kvartilis különbsége).

Átlagos eltérés

Az átlagos eltérés (jele: δ) az ismérvértékek számtani átlagtól vett eltérésein alapul, ezen eltérések átlaga. Mivel az átlagtól vett

eltérések algebrai összege nulla – a számtani átlag első tulajdonsága, lásd 1.6. pont –, ezért az eltérések abszolút értékeit átlagoljuk.

Az átlagos eltérésaz egyes értékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga:

Az átlagos eltérés azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól.

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban):

Az egyes lakások vízfogyasztása átlagosan 5,26 m3-rel tér el az átlagos fogyasztástól.

A gyakorisági sor adataiból az átlagos eltérést súlyozott formában számítjuk (osztályközös gyakorisági sor esetén becsüljük).

73
Egy ismérv szerinti elemzés

Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja, az átlagos eltérés számításánál súlyként a relatív
gyakoriságok itt is használhatók.

A lakások vízfogyasztását vizsgáló példánkban (a részeredményeket a 2.23. táblázat tartalmazza):

illetve:

E mérőszámot a gyakorlatban viszonylag ritkán használjuk, mert az abszolút érték matematikailag elég nehézkesen kezelhető.

Szórás

A szórás (jele: ) a legfontosabb és egyben a leggyakrabban használt szóródási mérőszám. Számítása szintén az ismérvértékek átlagtól vett
eltérésein alapul. Az eltérések pozitív és negatív előjele okozta problémától úgy is „megszabadulhatunk”, hogy a eltéréseket négyzetre emeljük.
A értékekből tehát négyzetes átlagot számítunk.

A szórás az egyes értékek számtani átlagtól vett eltéréseinek négyzetes átlaga:

A vízfogyasztás rangsora alapján (adatok a 2.2. táblázatban) a szórás:

74
Egy ismérv szerinti elemzés

Gyakorisági sor alapján a szórást súlyozott formában számítjuk (osztályközös gyakorisági sor alapján becsüljük). Súlyként a gyakoriságokat
vagy a relatív gyakoriságokat használjuk.

vagy

A szórás azt mutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól. Jelentése tehát ugyanaz, mint az átlagos eltérésé, mivel
mindkettő a eltérések átlaga. Az átlagos eltérés (δ) a értékek számtani, a szórás pedig a értékek négyzetes átlaga. Ugyanazon
értékek különféle átlagainak az 1.6. alfejezetben megismert nagyságrendi viszonya miatt az átlagos eltérés mindig kisebb értékkel méri a szóródást,
mint a szórás .

A szórás súlyozott formában történő számítását a vízfogyasztás gyakorisági sora alapján mutatjuk be. (A fejrovatokba csak a már korábban megismert
jelöléseket írjuk.) (2.23. táblázat.)

2.23. táblázat - Munkatábla az átlagos eltérés és a szórás számításához


Vízfogyasztás
3
(m )
– 15 5 0,10 12,5 62,5 – 9,9 49,5 98,01 490,05 9,8010

16 – 20 16 0,32 17,5 280,5 – 4,9 78,4 24,01 384,16 7,6832

21 – 25 15 0,30 22,5 337,5 – 0,1 1,5 0,01 0,15 0,0030

26 – 30 6 0,12 27,5 165,0 5,1 30,6 26,01 156,06 3,1212

31 – 35 5 0,10 32,5 162,5 10,1 50,5 102,01 510,05 10,2010

36 – 3 0,06 37,5 112,5 15,1 45,3 228,01 684,03 13,6806

75
Egy ismérv szerinti elemzés

Összesen 50 1,00 – 1120,0 – 255,8 – 2224,50 44,4900

A szórás rangsor alapján számított (6,685 m3) és az osztályközös gyakorisági sor alapján becsült (6,67 m3) értéke közel esik egymáshoz.

Az egyes lakások vízfogyasztása átlagosan 6,7 m3-rel tér el az átlagos vízfogyasztástól.

A statisztikai elemző munkában – a következő fejezetben majd látni fogjuk – fontos szerepe van a szórás négyzetének is, amit szórásnégyzetnek
vagy varianciának nevezünk és -tel jelölünk.

A variancia számlálója az eltérés-négyzetösszeg (jele: SS):

A szórás tulajdonságai

1. Ha az ismérvértékekhez hozzáadunk egy állandót (A), a szórás nem változik.

Tehát:
22
Mivel ilyenkor a számtani átlag is lesz , ezért

2. Ha az ismérvértékeket megszorozzuk egy állandóval (B), a szórás


2
Lásd az 1.6. pontbeli bizonyításokat.

76
Egy ismérv szerinti elemzés

-szeresére változik.

Tehát:
2
Mivel ilyenkor a számtani átlag lesz , ezért

3. A szórás az eredeti értékek négyzetes és számtani átlaga alapján is meghatározható.

Átlagos különbség

Az átlagos eltérés és a szórás a számtani átlag alapján méri az ismérvértékek különbözőségét. A szóródás az ismérvértékek egymás
közötti különbségei alapján is vizsgálható, illetve mérhető. E mutató bevezetését Corrado Gini olasz statisztikus javasolta, ezért szokás Gini-féle
mérőszámnak is nevezni.

77
Egy ismérv szerinti elemzés

Az átlagos különbség (jele: G) az ismérvértékek egymástól számított különbségei abszolút értékeinek számtani átlaga.

Mivel N db ismérvérték mindegyikének – önmagát is beleértve – N db ismérvértékkel vehetjük a különbségét, összesen különbség képezhető.
Ezek abszolút értékeinek átlaga:

Gyakorisági sor alapján a mutatót súlyozott formában számítjuk (osztályközös gyakorisági sorból becsüljük).

Az átlagos különbség azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól. Számítását a vízfogyasztás gyakorisági
sora alapján mutatjuk be. (A 2.24. táblázatban kiszámított különbségek, illetve szorzatok az átlóra szimmetrikusak, ezért elegendő az átló alatti vagy
fölötti különbségeket és szorzatokat kiszámítani és 2-vel szorozni.)

a) Az ismérvértékek különbségei:

3
Adatok: m
12,5 17,5 22,5 27,5 32,5 37,5
12,5 0 5 10 15 20 25

17,5 0 5 10 15 20

22,5 0 5 10 15

27,5 0 5 10

32,5 0 5

37,5 0

78
Egy ismérv szerinti elemzés

b) Az ismérvértékekhez tartozó súlyok szorzatai:

5 16 15 6 5 3
5 * 80 75 30 25 15

16 * 240 96 80 48

15 * 90 75 45

6 * 30 18

5 * 15

3 *
c) Az előző táblák megfelelő rovatainak szorzatai:

Adatok: m3
12,5 17,5 22,5 27,5 32,5 37,5 Összesen
12,5 0 400 750 450 500 375 2475

17,5 0 1200 960 1200 960 4320

22,5 0 450 750 675 1875

27,5 0 150 180 330

32,5 0 75 75

37,5 0 0
Összesen 0 400 1950 1860 2600 2265 9075

Az ismérvértékek különbségeinek összege a táblázat c) részében kapott szorzatösszeg kétszeresével azonos: 2 · 9075 = 18 150 m3.

79
Egy ismérv szerinti elemzés

Az egyes lakások vízfogyasztása átlagosan 7,26 m3-rel tér el egymástól.

Relatív szórás

A szóródás eddig megismert mérőszámai a megfigyelt mennyiségi ismérv mértékegységében mérik a szóródást. Sok esetben szükség lehet arra,
hogy az értékek nagyságrendjétől és mértékegységétől elvonatkoztatott mérőszámmal mérjük és tegyük összehasonlíthatóvá a szóródást. Ilyen
mérőszám a relatív szórás (jele: V):

Megmutatja, hogy a szórás az átlagnak hányad része. A relatív szórást százalékban szoktuk kifejezni és viszonyszámként értelmezzük.

A képlet átalakításával belátható az is, hogy a relatív szórás az egyedi eltérések viszonylagos nagyságának, a hányadosoknak a négyzetes
átlaga.

Ezért úgy is értelmezhető, hogy az egyes ismérvértékek átlagosan hány %-kal térnek el az átlagtól.

A lakások vízfogyasztására vonatkozó példánkban az átlagos vízfogyasztás 22,4 m3, a szórás pedig 6,67 m3 volt. A szóródás relatív mértéke :

A relatív szórást viszonyszámként értelmezve megállapíthatjuk, hogy a szórás az átlagnak közel 30%-a. Másként fogalmazva az egyes lakások

vízfogyasztása átlagosan 29,8%-kal tér el a 22,4 m3-es átlagtól. A értékek – %-ban kifejezve – rendre: 44,2; 21,9; 0,4; 22,8; 45,1 és 67,4.
A relatív szórás ezen értékek közé esik.

80
Egy ismérv szerinti elemzés

2.1.7. Az aszimmetria mérőszámai


Az előző alfejezetekben megismerkedtünk azokkal a grafikus ábrákkal, melyekkel a gyakorisági sorok (gyakorisági eloszlások, illetve megoszlások)
szemléltethetők, illetve azokkal a mutatószámokkal (középértékek, kvantilisek, szóródási mutatók), amelyek a gyakorisági sorok helyzetéről és
szóródásáról számszerű információt nyújtanak.

A gyakorisági sorokat ábrázolva megállapítható, hogy a görbék (poligonok) igen változatosak lehetnek, de nagy többségük bizonyos
szabályszerűséget mutat, így besorolható néhány jellegzetes típusba.

Az eloszlások következő típusaival foglalkozunk:

– egymóduszú eloszlás

– szimmetrikus,

– aszimmetrikus (vagy ferde);

– többmóduszú eloszlás.

Az egymóduszú gyakorisági sorok poligonjának egy helyi maximuma (csúcsa) van. A helyzetmutatók elhelyezkedésétől függően az eloszlás
szimmetrikus és aszimmetrikus lehet. Az egymóduszú eloszlások jellegzetességeit a 2.25. táblázat tartalmazza.

2.25. táblázat - A szimmetrikus és aszimmetrikus eloszlások jellemzői


Szimmetrikus Aszimmetrikus eloszlás
eloszlás bal oldali jobb oldali

A társadalmi-gazdasági jelenségek körében a bal oldali aszimmetria a leggyakoribb. Például a lakossági megtakarítások nagyságának, a
vállalkozások nyereségének, a családok egy főre jutó jövedelmének eloszlása tipikusan bal oldali aszimmetriát mutat.

81
Egy ismérv szerinti elemzés

A 2.25. táblázatból látható, hogy a már megismert grafikus ábrák (a hisztogram és a gyakorisági poligon), a középértékek és kvantilisek alapján az
eloszlás típusát, az aszimmetria irányát meg tudjuk állapítani.

A továbbiakban olyan mutatókkal (mérőszámokkal) ismerkedünk meg, amelyek egy számba sűrítve kifejezésre juttatják az aszimmetria fennállását,
irányát és fokát is. Arra a kérdésre kapunk választ, hogy milyen mértékűnek ítélhető a szimmetrikushoz képest a megoszlás aszimmetriája, más
szóval ferdesége.

Az aszimmetria leggyakrabban használt mérőszámai a Pearson-féle mutatószám és az F mutató.

Az aszimmetria Pearson-féle mutatószáma (jele: A) a számtani átlag és a módusz egyes eloszlástípusok esetén jellemző nagyságrendi viszonyán
alapul:

Az különbség nagysága a ferdeség fokán kívül a szóródás nagyságától is függ. Nagymértékű szóródás esetén ugyanis a különbség akkor
is viszonylag nagy lehet, ha az aszimmetria viszonylag kisfokú. Ezért, ha a két középérték különbségét elosztjuk a szórással, olyan mérőszámot
kapunk, melynek értékéből következtetni tudunk az aszimmetria mértékére. A mérőszám (önmagában a számláló) előjele az aszimmetria irányát
mutatja. Bal oldali aszimmetria esetén , jobb oldali aszimmetria esetén Szimmetrikus eloszlás esetén A mérőszám abszolút értékének
nincs határozott felső korlátja, azonban már 1-nél nagyobb abszolút érték meglehetősen erős aszimmetriára utal.

A lakások vízfogyasztására vonatkozó példa alapján:

A lakások vízfogyasztás szerinti eloszlása mérsékelten bal oldali aszimmetriát mutat.

Az aszimmetria másik mérőszáma,az F mutató (jele: F) az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán
alapul. Bal oldali aszimmetria esetén a medián az alsó , jobb oldali aszimmetria esetén a felső kvartilishez esik közelebb.

Ha a eltérések különbségét elosztjuk azok összegével, olyan mérőszámot kapunk, amely abszolút értékének határozott felső korlátja
van: . Az F mutató lényegesen kisebb értékkel jelzi a már nagyfokúnak tekinthető aszimmetriát, mint az A:

82
Egy ismérv szerinti elemzés

E mutatószám ugyanolyan feltételek mellett ad nulla, pozitív és negatív eredményt, mint az A mutató.

Az F mutatót nemcsak a kvartilisek, hanem a többi kvantilis, például a decilisek alapján is számíthatjuk.

vagy a illetve helyett akár a illetve is behelyettesíthető.

A lakások vízfogyasztására vonatkozó példánkban (a kvartiliseket felhasználva):

E mutató is enyhe bal oldali aszimmetriát jelez.

Az F mutató – szemben az A-val – többmóduszú eloszlásoknál is használható a ferdeség fokának vizsgálatára.

Több gyakorisági sor ferdeségének összehasonlításakor, valamint ugyanazon jelenség eloszlásának időbeli vizsgálatára mindig ugyanazt a
mérőszámot kell használni.

2.1.8. A koncentráció elemzése


Valamely sokaságnak egy mennyiségi ismérv szerinti vizsgálata arra is irányulhat, hogy az értékösszeg mennyire koncentrálódik a sokaság bizonyos
egységeire. Pl. vizsgálhatjuk a termelés, a jövedelem, a vagyon, a betétösszeg, a népesség stb. koncentrációját.

A koncentráción általában tömörülést, összpontosulást értünk. Pl. a népesség nagy része a nagyobb településeken, a városokban összpontosul,
a magánvagyon egyre nagyobb része tömörül (koncentrálódik) a lakosság egy szűkebb körénél stb.

Koncentrációnak nevezzük azt a jelenséget, hogy a sokasághoz tartozó teljes értékössszeg jelentős része a sokaság kevés egységére
összpontosul.

Ha a sokaság elemszáma (N) kicsi, akkor az már önmagában is koncentrációt jelent, hiszen a teljes értékösszeg (S) a szó szoros értelmében kevés
egységre összpontosul.

Ha a sokaság elemszáma nagy, akkor a definícióban szereplő „kevés egységet” relatív módon értelmezzük. Ilyen esetben a koncentráció abban
nyilvánul meg, hogy a sokaság teljes értékösszege egyenlőtlenül oszlik meg a sokaság egységei között.

83
Egy ismérv szerinti elemzés

A koncentráció a relatív gyakoriságok és a relatív értékösszegek összehasonlításával mutatható ki. Ha az egyes osztályokhoz
(osztályközökhöz) tartozó értékek azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi.

2.26. táblázat - Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január
1-jén
Települések Települések
Népesség- számának össznépességének
össznépessége
száma
nagyság (fő)

(fő) (tényleges) %-os megoszlása

– 499 150 35 570 58,4 11,8

500 – 999 65 48 021 25,3 16,0

1000 – 1999 31 42 506 12,0 14,1

2000 – 4999 6 20 119 2,3 6,7

5000 – 9999 2 16 620 0,8 5,5

10 000 – 49 999 1 22 263 0,4 7,4

50 000 – 99 999 2 115 968 0,8 38,5


Összesen 257 301 067 100,0 100,0

A 2.26. táblázatból látható, hogy a megye népességének 11,8%-a él a települések 58,4%-át kitevő kistelepüléseken, ugyanakkor a népesség nagy
hányada (38,5%-a) a települések mindössze 0,8%-át kitevő nagytelepüléseken (városokban) koncentrálódik.

A koncentráció vizsgálatának egyik legfontosabb és egyben legelterjedtebb eszköze a Lorenz-görbe, amely a koncentráció meglétén kívül annak
mértékét is szemléletesen mutatja. A Lorenz-görbe egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, mely a kumulált relatív gyakoriságok
függvényében ábrázolja a kumulált relatív értékösszegeket .

A görbét úgy készítjük, hogy a

84
Egy ismérv szerinti elemzés

pontokat egyenes szakaszokkal összekötjük. (A görbe végpontja a pont.) Általában a illetve adatokat ábrázoljuk, mint ahogyan a
2.12. ábrán is.

A koncentráció hiánya esetén a görbe egybeesik az átlóval. Ebben az esetben az egyes osztályokhoz (osztályközökhöz) tartozó és értékek
azonosak (a teljes értékösszeg egyenletesen oszlik meg a sokaság egységei között).

Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció, így az ábra alkalmas a koncentráció időbeli vagy térbeli összehasonlítására
is.

A 2.26. és 2.27. táblázat adatait felhasználva összehasonlítjuk Nógrád és Zala megye népességének koncentrációját (az 1994. január 1-jei adatok
alapján).

2.27. táblázat - Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva)

Népesség- Nógrád megye Zala megye

nagyság (fő)
–499 22,4 4,0 22,4 4,0 58,4 11,8

500 –999 35,2 14,7 57,6 18,7 83,7 27,8

1000 –1999 25,6 19,.9 83,2 38,6 95,7 41,9

2000 – 4999 12,8 17,7 96,0 56,3 98,0 48,6

5000 – 9999 0,8 2,9 96,8 59,2 98,8 54,1

10 000 – 49 999 3,2 40,8 100,0 100,0 99,2 61,5

50 000 – 99 999 – – – – 100,0 100,0


Összesen 100,0 100,0 – – – –

85
Egy ismérv szerinti elemzés

2.12. ábra - A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe)

A 2.12. ábráról leolvasható, hogy Zala megyében a népesség koncentrációja nagyobb fokú, mint Nógrád megyében.

A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha a koncentrációs területet a háromszög területéhez
viszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció fokára. A koncentrációs terület arányát a koncentrációs együtthatóval
(jele: K) mérjük.

86
Egy ismérv szerinti elemzés

A koncentrációs együtthatót – a bizonyítást nem részletezzük – számíthatjuk a következő módon is:

ahol G: az átlagos különbség (Gini-féle szóródási mérőszám),

az ismérvértékek átlaga.

Koncentráció hiánya esetén: ( a görbe egybeesik az átlóval); minél közelebb van K értéke az 1-hez, annál nagyobb fokú a koncentráció.

Zala megyében (a 2.26. táblázat adataiból számítva):

átlagos különbség:

átlagos népességszám:

Zala megyében a népesség koncentrációja viszonylag nagy fokú, a Lorenz-görbe is ezt jelzi (2.12. ábra).

2.2. Az időbeli ismérv szerinti elemzés


2.2.1. Idősorok
A statisztikai elemzések során fontos szerepük van az időbeli összehasonlításoknak, az időbeli változások vizsgálatának. Segítik az elmúlt időszak
tendenciáinak, összefüggéseinek feltárását és egyben támpontot is adnak a jövő várható folyamatainak előrejelzéséhez.

A társadalmi-gazdasági jelenségek egymástól egyenlő távolságra levő időpontokban, illetve időszakokban megfigyelt értékei
idősorokat alkotnak, melyek a vizsgált jelenség természetétől függően állapot- és tartamidősorok lehetnek.

Az állapotidősorok az álló sokaságok időbeli változását mutatják, az egyes időpontokra vonatkozó állapotfelvételek eredményeit rögzítik. E sorok
sohasem csoportosítás eredményeként jönnek létre, így a bennük szereplő adatok összegezésének nincs tárgyi értelme.

A tartamidősorok mozgó sokaságok időbeli alakulását mutatják. A sor elemei egy-egy időtartam folyamán bekövetkező események adatait tükrözik.

87
Egy ismérv szerinti elemzés

Mindkét típusú idősornál – éppen az időbeliség lényegéből következően – az ismérvváltozatok (időpontok, időszakok) sorrendje szigorúan kötött,
a sor elemei nem cserélhetők fel tetszés szerint.

Az idősorokat a következő példák szemléltetik:

Állapotidősor (2.28. táblázat):

2.28. táblázat - Magyarország személygépkocsi-állományának alakulása (az évek december 31-én)


Év Személygépkocsi (db)
1985 1 435 937

1986 1 538 877

1987 1 660 258

1988 1 789 562

1989 1 732 385

1990 1 944 553

1991 2 015 455

1992 2 058 334

1993 2 091 623

Tartamidősor (2.29. táblázat):

2.29. táblázat - Magyarországra érkező külföldi turisták számának alakulása


Év Turisták száma (E fő)
1985 9 724

1986 10 613

1987 12 087

1988 10 766

88
Egy ismérv szerinti elemzés

1989 14 490

1990 20 510

1991 21 860

1992 20 188

1993 22 804

A továbbiakban azokkal az egyszerű elemzési eszközökkel foglalkozunk, amelyek alkalmasak az idősorban rejlő információk szemléltetésére,
a tendenciák, törvényszerűségek feltárására. Az idősorok vizsgálatának általánosan alkalmazott eszközei a dinamikus viszonyszámok, a
grafikusábrázolás és az átlagok.

2.2.2. Dinamikus viszonyszámok


A dinamikus viszonyszám (az 1.5. alfejezetben már szóltunk róla) az összehasonlítás tárgyát képező tárgyidőszak (időpont) és az összehasonlítás
alapjául szolgáló bázisidőszak (időpont) adatának hányadosa.

A kettőnél több adatból álló idősor esetén kétfajta dinamikus viszonyszám számítható: bázis- és láncviszonyszám.

A bázisviszonyszámok (jele: ) az idősor egyes adatainak a bázisul választott időszak (időpont) adatához viszonyított arányát fejezik ki:

ahol az idősor egymást követő adatai, az pedig a bázisul választott időszak (időpont) adata.

Bázisul az idősor bármelyik időszaka (időpontja) választható, sőt az idősoron kívüli időszak (időpont) is. A bázis megválasztásánál alapelvként
rögzíthetjük, hogy bázisként olyan időszak (időpont) adatát helyes választani, melynek nagyságát kivételes, véletlen körülmények nem befolyásolják,
így reálisan lemérhető a vizsgált jelenség változása. A statisztikai elemzések során leggyakrabban az első időszakot (időpontot) választjuk bázisul.

A láncviszonyszámok (jele: ) az idősor egyes adatainak a közvetlenül megelőző időszak (időpont) adatához viszonyított arányát fejezik ki:

A bázis- és láncviszonyszámok számítását szemlélteti a 2.30. táblázat:

89
Egy ismérv szerinti elemzés

2.30. táblázat - A bázis- és láncviszonyszámok számítása

Időszak, Idősor adata Bázisviszonyszám Láncviszonyszám

időpont

1. –

2.

3.

. . . .

. . . .

. . . .

t.

. . . .

. . . .

. . . .

n.

Vizsgáljuk meg bázis- és láncviszonyszámokkal a lakossági megtakarítások alakulását. Az alapadatokat és a megfelelő viszonyszámokat a 2.31.
táblázatbanközöljük.

2.31. táblázat - A lakosság takarékbetét-állományának alakulása (az évek december 31-én)


Év Betétállomány
(milliárd Ft) 1980 = 100,0% Előző év = 100,0%
1980 145,3 100,0 –

90
Egy ismérv szerinti elemzés

1981 160,1 110,2 110,2

1982 175,7 120,9 109,7

1983 197,1 135,6 112,2

1984 219,4 160,0 111,3

1985 244,1 168,0 111,3

1986 274,9 189,2 112,6

1987 287,5 197,9 104,6

1988 312,7 215,2 108,8

1989 309,5 213,0 199,0

1990 368,6 253,7 119,1

1991 466,0 320,7 126,2

1992 634,7 436,8 136,2

1993 732,9 504,4 115,5

Az 1986. évi bázisviszonyszám:

Az 1986. évi betétállomány az 1980. évinek (a megfigyelés időpontja mindkét évben december 31.) 1,892-szerese, azaz 189,2%-a. Tehát a
betétállomány 1980-ról 1986-ra 89,2%-kal nőtt.

Az 1986. évi láncviszonyszám:

1985-ről 1986-ra a betétállomány 12,6%-kal nőtt.

91
Egy ismérv szerinti elemzés

1980. évre nem tudunk láncviszonyszámot számítani, mert a példánkban nem ismert az 1979. évi betétállomány.

Az 1981. évi bázis- és láncviszonyszám (általában is igaz, hogy a bázisul választott időszak (időpont) utáni időszak (időpont) bázis- és
láncviszonyszáma) azonos, mindkettő az 1980-ról 1981-re bekövetkező változást mutatja. A betétállomány 1980-ról 1981-re 10,2%-kal nőtt.

A bázis- és láncviszonyszámok közötti összefüggés

A bázis- és láncviszonyszámok az idősor eredeti adatainak ismerete nélkül is közvetlenül kölcsönösen kiszámíthatók egymásból.

Bázisviszonyszámokból láncviszonyszámokat ugyanúgy számítunk, mint az idősor eredeti adataiból. Az összehasonlítani kívánt időszak (időpont)
bázisviszonyszámát elosztjuk az őt közvetlenül megelőző időszak (időpont) bázisviszonyszámával.

A t-edik láncviszonyszám

Ugyanis a bázisviszonyszámokat úgy képezzük, hogy az idősor adatait rendre egy konstanssal (a bázisidőszak adatával) osztjuk, ezért a
bázisviszonyszámok egymás közötti aránya megegyezik az eredeti adatok egymás közötti arányával.

Példánkban az 1986. évi láncviszonyszám a bázisviszonyszámokból számítva:

Láncviszonyszámokból bázisviszonyszámokat a megfelelő láncviszonyszámok szorzataként kapunk. Az első számú láncviszonyszám


szorzata a k-adik időszak (időpont) bázisviszonyszámával egyenlő.

A k-adik bázisviszonyszám:

ugyanis:

92
Egy ismérv szerinti elemzés

Példánkban az 1986. évi bázisviszonyszám a láncviszonyszámokból számítva:

2.2.3. Az idősorok grafikus ábrázolása


Az idősorok tendenciáinak tömör, áttekinthető jellemzésére gyakran használjuk a grafikus ábrákat. Az idősorokat – mivel általában az ábrákkal
a társadalmi-gazdasági jelenségek időbeli változásának tendenciáját szemléltetjük – derékszögű koordináta-rendszerben, vonaldiagrammal
ábrázoljuk. A vízszintes tengelyen az időszakokat (időpontokat), a függőleges tengelyen az idősor adatait mérjük fel. Az idősor egyes értékeit jellemző
pontokat – azért, hogy a változás tendenciája érzékelhető legyen – egyenes szakaszokkal (teljesen önkényesen) összekötjük. Tartamidősorok esetén
az idősor adatait jelölő pontok a megfelelő időintervallum közepén, állapotidősorok esetén pedig az intervallum megfelelő szélén helyezkednek el.

2.13. ábra - A takarékbetét-állomány alakulása

A 2.13. ábra a takarékbetét-állomány alakulását szemlélteti. Ez az idősor állapotidősor, a megfigyelések időpontja minden évben december 31-e
volt. Ezért az idősor adatait jellemző pontok az időintervallumok (évek) végén helyezkednek el.

A 2.29. táblázat a Magyarországra érkező külföldi turisták számának alakulását mutató tartamidősor. Ábrázolásakor (2.14. ábra) az időintervallumok
(évek) közepén felmért pontokat kötjük össze egyenes szakaszokkal. Az idősorban előforduló legkisebb érték 9724 ezer fő (a legnagyobb 22 804
ezer fő), ezért a függőleges tengelyt megszakítva a beosztást 8000 ezer főnél kezdhetjük. (Ha a tengely beosztása ugyanis 0-tól folyamatos lenne,
a vonaldiagram nagyon „magasra” kerülne.)

93
Egy ismérv szerinti elemzés

2.14. ábra - A Magyarországra érkező turisták számának alakulása

A grafikus ábrázolással az ábrázolt adatok közötti arányokat szemléltetjük. Mivel a bázisviszonyszámok között ugyanolyan arányok vannak, mint
az idősor eredeti adatai között, ezért a bázisviszonyszámok alapján is készíthetünk vonaldiagramot. Különösen indokolt a bázisviszonyszámok
ábrázolása akkor, ha több, egymással összefüggő jelenség időbeli alakulását egy koordináta-rendszerben akarjuk szemléltetni.

2.2.4. Az idősorok elemzése átlagokkal


A középérték az azonos fajta adatok halmazának számszerű jellemzője. Az idősorok adatait úgy tekintjük mint ugyanazon jelenség különböző
időszakokban (időpontokban) felvett értékeinek összességét, tehát azonos fajta adatok halmazát. Az átlagolás ezért idősorok esetén is indokolt lehet.

Az átlagolás célja egyrészt az idősor átlagos értékének meghatározása, másrészt az idősorban végbemenő átlagos változások kimutatása lehet.

Az idősorok átlagos értékének meghatározása

Az állapot- és tartamidősor adatait eltérő módon átlagoljuk.

94
Egy ismérv szerinti elemzés

A tartamidősorok adatai összegezhetők, ezért átlagolásukra a számtani átlagot használjuk.

Az így kiszámított átlag a megfigyelt jelenség egy időszakrajutóátlagos értékét mutatja.

Az állapotidősorok adatai egy-egy időpontra vonatkoznak, összegüknek nincs tárgyi értelme. Ebben az esetben az idősor átlaga az átlagos

állomány- (készlet-) nagyságot mutatja. Két időpont esetén ez a nyitó- és záróállomány számtani átlaga ,több időpont esetén pedig a két-
két időpont közötti időszakokra számított átlagos állományok számtani átlaga.

Ezt az átlagot kronologikus átlagnak nevezzük (jele: ), és kizárólag állapotidősorok adatainak átlagolására használjuk. A megfigyelt időpontok
adataiból ( ) közvetlenül az alábbi egyszerűbb alakra hozott formában számítjuk:

A kronologikus átlag tehát olyan súlyozott számtani átlag, melynél az első és utolsó adat súlya a közbeeső adatok súlya pedig 1. A súlyok
összege (a nevezőben szereplő szám) így:

Tekintsük a következő példát (2.32. táblázat).

2.32. táblázat - Valamely utazási iroda valutakészletének és valutaértékesítésének adatai


Valutakészlet
Valutaértékesítés
Hónap (a hónap utolsó napján)
(E USD)
(E USD)

95
Egy ismérv szerinti elemzés

június 18,8 ....

július 19,6 35,8

augusztus 20,2 35,2

szeptember 19,8 34,3

október 21,1 33,5

november 20,3 32,4

december 19,2 35,8

A második félévben a havi átlagos valutaértékesítés (6 hónap átlaga):

Az adatok összegének van értelme (a II. félévben összesen 207 ezer USD valutát adott el az utazási iroda), ezért átlagolásukra a számtani átlagot
használtuk.

A második félévben az átlagos valutakészlet (július 1-je és december 31-e között):

( a július 1-jei készlet a június 30-ival – 18,8 E USD – azonos).

A valutakészlet csak időpontokban értelmezhető (példánkban a hónap utolsó napján záráskor), ezért átlagolásukra a kronologikus átlagot használtuk.

Az idősor átlagos változásának vizsgálata

Az idősor lényeges tulajdonságát kifejező tendenciát az időszakról időszakra (időpontról időpontra) bekövetkező változások átlagolásával ragadhatjuk
meg. A változást kétféleképpen mérhetjük: abszolút és relatív módon. Az abszolútváltozás két egymást követő időszak (időpont) adatának különbsége

a relatív változás pedig valamely időszak (időpont) adatának a megelőző időszak (időpont) adatához viszonyított aránya Az
átlagos változást (növekedést vagy csökkenést) két mutatóval mérhetjük: a fejlődés átlagos mértéke és a fejlődés átlagos ütememutatókkal.

96
Egy ismérv szerinti elemzés

A fejlődés átlagos mértéke (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos abszolút változást mutatja a vizsgált
jelenség mértékegységében.

Számítása úgy történik, hogy az egymást követő időszakokra (időpontokra) kiszámítjuk a növekedés (csökkenés) mértékét , majd azokat számtani
átlaggal átlagoljuk.

Ebből azonnal adódik:

A mutató elsősorban az időszakról időszakra (időpontról időpontra) közel azonos mértékben növekvő (csökkenő), azaz megközelítőleg lineáris
fejlődést leíró idősorok fejlődési tendenciájának jellemzésére használható. Mivel értéke csak az idősor első és utolsó adatától függ, ezért csak akkor
jellemzi jól a változás átlagos mértékét, ha ezek nem kiugróan magas vagy alacsony (esetleg változó előjelű) értékek.

2.33. táblázat - Az épített lakások számának alakulása Magyarországon


Épített lakások
Év
száma (db)
1985 72 507 –

1986 69 428 –3 079

1987 57 200 –12 228

1988 50 566 –6 634

1989 51 487 921

1990 43 771 –7 716

1991 33 164 –10 607

1992 25 807 –7 357

97
Egy ismérv szerinti elemzés

1993 20 925 –4 882

2.15. ábra - Az épített lakások számának alakulása

Az épített lakások számának alakulását mutató vonaldiagram (2.15. ábra) alapján látható, hogy a 2.33. táblázatban egy lineárisnak tekinthető változást
leíró idősor szerepel, ezért a mutató alkalmazása célszerű.

– Az évenkénti változások (növekedések, csökkenések) átlagaként:

– Az 1993-as és az 1985-ös év megfigyelt adata alapján:

98
Egy ismérv szerinti elemzés

Az épített lakások száma 1985 és 1993 között évente átlagosan 6448 db-bal csökkent.

A fejlődés átlagos üteme (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos relatív változást mutatja.

A mutató a láncviszonyszámok mértani átlaga. A mértani átlag alkalmazását az indokolja, hogy a láncviszonyszámok szorzatának van tárgyi értelme.
Valamennyi láncviszonyszám szorzata ugyanis a megfigyelt utolsó időszak (időpont) bázisviszonyszámával azonos.

Mivel

ezért a fejlődés átlagos üteme az n-edik bázisviszonyszámból is kiszámítható.

Mivel

ezért a fejlődés átlagos üteme az idősor első és utolsó adatából az

alakban is számítható.

A mutató számítása olyan idősorok esetén célszerű, melyeknél az idősor adata időszakról időszakra (időpontról időpontra) közel azonos ütemben
nő (csökken), azaz közelítőleg exponenciális fejlődést mutat.

Ilyen idősor a takarékbetét-állomány alakulása (2.31. táblázat), jól szemlélteti az exponenciális növekedésnek tekinthető fejlődést a grafikus ábra
is (2.13. ábra).

A fejlődés átlagos üteme:

99
Egy ismérv szerinti elemzés

– a láncviszonyszámok alapján:

– az utolsó bázisviszonyszámból:

– a megfigyelt adatokból:

A lakosság takarékbetét-állománya 1980 és 1993 között évenként átlagosan 1,133-szeresére, azaz 13,3%-kal nőtt.

Az idősorok fejlődési tendenciáit kifejező, itt ismertetett mutatószámok végeredményben csak az első ( ) és az utolsó ( ) adatra támaszkodnak.
Ezért az ilyen számítások csak akkor adnak jellemző értékeket, ha az idősor alapvető tendenciája az egyenletes fejlődés (növekedés vagy csökkenés;
lineáris vagy exponenciális értelemben). Tankönyvünk II. kötetében megismerkedünk majd az idősorok fejlődési törvényszerűségeinek függvényekkel
történő leírásával, elemzésével. Az ott megismert eljárások pontosabb képet adnak a jelenségek, folyamatok alakulásáról.

2.3. Gyakorlófeladatok
1. Háztartások élelmiszerre fordított egynapi kiadásai (Ft-ban) az alábbiak:

820, 920, 760, 600, 650, 720, 680,

880, 1020, 730, 520, 620, 780, 480,

490, 520, 1010, 1200, 750, 630, 700,

830, 900, 600, 700, 760, 900, 1200.

Feladat:

a) Készítsünk rangsort!

b) A rangsor alapján készítsünk gyakorisági sorokat különböző osztályközökkel!

100
Egy ismérv szerinti elemzés

c) A legjobbnak ítélt gyakorisági sor alapján készítsünk értékösszegsort és kumulált sorokat!

d) Számítsuk ki a napi élelmiszer-kiadás átlagát, móduszát, mediánját és kvartiliseit! Vizsgáljuk az aszimmetriát!

e) Készítsünk hisztogramábrát!

2. Egy budapesti pénzváltó helyen valamely napon 107-en váltottak valutát forintra. Az ügyfelek megoszlása a váltott összeg nagysága szerint az
alábbi:

Összeg (1000 Ft) Fő


– 10 12

10 – 20 20

20 – 30 33

30 – 40 23

40 – 50 12

50 – 60 3

60 felett 4
Összesen 107

Feladat:

a) Ábrázoljuk a váltott összeg nagysága szerinti megoszlást!

b) Készítsük el a mennyiségi sor lehetséges típusait! Értelmezzük egy-egy adatát!

c) Számítsuk ki és értelmezzük az átlagot, móduszt, mediánt és a kvartiliseket! Jelöljük az a) pontbeli ábrán ezeket az értékeket!

d) Vizsgáljuk a szóródást!

e) Számítsuk ki az aszimmetria A és F mérőszámát!

3. A személyi jövedelemadó-bevallások alapján az adóalanyokat az alábbi kategóriákba sorolták:

101
Egy ismérv szerinti elemzés

Az adót fizetők %-
Adóköteles jövedelem
os megoszlása
(ezer Ft) 1991 1992
0 –90 20,3 15,2

90 – 150 26,9 22,5

150 – 240 27,9 27,8

240 – 360 14,7 18,7

360 – 600 7,5 11,2

600 – 1500 2,7 4,6


Összesen 100,0 100,0

Feladat:

a) Ábrázoljuk a jövedelem szerinti megoszlást az egyes években hisztogrammal külön-külön!

b) Készítsünk gyakorisági poligont egy koordináta-rendszerben!

c) Mennyi az adóalanyok átlagos jövedelme az egyes években?

d) Melyik évben volt nagyobb a jövedelmek szóródása?

e) Jellemezzük a jövedelemeloszlás aszimmetriáját F mutatóval!

4. A saját jogú nyugdíjasok adatai 1993 márciusában:

Nyugdíj összege Férfiak Nők Összes nyugdíjas


(1000 Ft) %-os megoszlása
–6 0,4 0,3 0,3

6–8 6,2 16,2 11,7

8 – 10 21,3 31,3 26,8

102
Egy ismérv szerinti elemzés

10 – 12 26,2 39,7 33,6

12 – 15 24,8 8,9 16,1

15 – 20 14,7 2,9 8,3

20 – 25 5,1 0,6 2,6

25 – 1,3 0,1 0,6


Összesen 100,0 100,0 100,0

Kiszámított adatok: Az 1015,2 ezer férfi átlagos nyugdíja 12 679 Ft, a 1218,4 ezer nő átlagos nyugdíja pedig 10 205 Ft volt. A férfiaknál 4149 Ft az
átlagtól való átlagos eltérés, a nőknél pedig 2483 Ft. (Az eltérések négyzetei alapján.)

Feladat:

a) Hasonlítsuk össze a nyugdíjak nagyságát a tanult helyzetmutatókkal!

b) Ábrázoljuk a nyugdíj összege szerinti megoszlást poligonnal, egy grafikonon!

c) Számítsuk ki az aszimmetria A mutatóját a férfiak és a nők csoportjára! Hasonlítsuk össze a kapott eredményeket!

5. Az ipari ágazatban tevékenykedő vállalkozások fontosabb adatai 1992-ben:

Foglalkoztatottak
A foglalkoztatottak Vállalatok Árbevétel
száma
nagyságcsoportjai (fő) száma (milliárd Ft)
(1000 fő)
21 –50 1361 60 57

51 –100 782 73 62

101 –300 850 183 162

301 –500 264 130 102

501 –1000 259 310 185

1001 –2000 124 293 169

103
Egy ismérv szerinti elemzés

2001 –5000 57 413 169

5001 – 10 000 9 106 57

10 000-nél több 2 167 34


Összesen 3708 1735 997

Feladat:

a) Hány főt foglalkoztat átlagosan egy vállalat?

b) A vállalatok hány %-a foglalkoztat maximum 500 főt? Mennyi ezen vállalatok összes foglalkoztatottjainak létszáma ténylegesen, illetve a
nagyságcsoportok alapján becsülve?

c) Számítsuk ki a vállalatok és az összes foglalkoztatottak %-os megoszlását! Hasonlítsuk össze az egyes létszámkategóriákhoz tartozó arányokat!
Nevezzük meg a kiszámított viszonyszámokat!

d) Készítsünk Lorenz-görbét a vállalatok létszám szerinti koncentrációjának bemutatására!

e) Vizsgáljuk meg a létszámnagyság szerinti szóródást!

f) Becsüljük meg a mediánt és a kvartiliseket! Vizsgáljuk a létszám szerinti megoszlás aszimmetriáját!

6. Öt hallgató elért pontszáma egy 50 pontos zárthelyin a következő volt:

36; 40; 28; 48; 16.

Feladat:

a) Számítsuk ki, hogy:

1. egy-egy hallgató pontszáma mennyivel tér el az átlagos pontszámtól!

2. mennyivel térnek el az eredmények egymástól átlagosan!

b) A korábban írt 30 pontos zárthelyit a hallgatók átlagosan 20 pontra írták meg, 9 pontos szórással. Melyik zárthelyin volt nagyobb a pontszámok
ingadozása, szóródása?

7. Használjuk fel az 1.7. Gyakorlófeladatok 4. példájának adatait!

104
Egy ismérv szerinti elemzés

Feladat:

a) Vizsgáljuk meg az aktív népesség számának alakulását bázis- és láncviszonyszámokkal!

b) Értelmezzük a kiszámított viszonyszámokat!

c) Számítsuk ki a csökkenés átlagos mértékét és átlagos ütemét!

8. Nemzetközi idegenforgalmi bevételek és kiadások alakulása Magyarországon:

Milliárd Ft
Év Bevételek Kiadások
1985 25 10

1986 27 10

1987 37 12

1988 39 33

1989 48 59

1990 63 38

1991 78 38

1992 98 53

Feladat:

a) Vizsgáljuk meg a bevételek és a kiadások alakulását 1985-höz képest, valamint évről évre!

b) Ábrázoljuk a két jelenség adatait egy grafikonon!

c) Hány Mrd Ft-tal nőttek évente átlagosan az idegenforgalmi bevételek?

d) Mennyi volt a bevételek, kiadások, illetve az egyenleg növekedési üteme a vizsgált időszakban átlagosan?

9. A takarékbetét-állomány alakulása Magyarországon:

105
Egy ismérv szerinti elemzés

Betétállomány Előző év
Év 1980 = 100% 1985 = 100%
(milliárd Ft) = 100%
1985 244,1 168,0 100,0 –

1986 274,9 189,2 112,6 ...

1987 287,5 ... ... ...

1988 ... ... ... 108,8

1989 ... ... 126,8 ...

1990 ... ... ... 119,1

1991 466,0 ... ... ...

1992 ... 436,8 260,0 ...

Feladat:

a) Számítsuk ki a tábla hiányzó adatait!

b) Ábrázoljuk a betétállomány alakulását!

c) Évente átlagosan hány %-kal nőtt a betétállomány:

– 1985 és 1990 között?

– 1985 és 1992 között?

– 1980 és 1992 között?

d) Hány Mrd Ft volt a betétállomány 1980-ban? Mennyi volt a növekedés évi átlagos mértéke 1980 és 1992 között?

106
3. fejezet - A sokaságok több ismérv szerinti vizsgálata, a
statisztikai táblák elemzése
3.1. A statisztikai táblákról általában
A sokaságok több szempont szerinti megfigyelésének eredménye statisztikai táblák formájában is megadható.

Statisztikai táblának nevezzük a megfelelő külső formával ellátott statisztikai sorok összefüggő rendszerét.

A tábla külső formáján rovatokból álló hálózatot értünk. A rovatok egy része statisztikai adatokat, számokat, más része megnevezéseket, magyarázó
szövegeket tartalmaz. A megnevezéseket tartalmazó rovatok közül azokat, amelyek a tábla bal oldalán helyezkednek el, oldalrovatoknak nevezzük.
Ezek a rovatok a vízszintesen elhelyezkedő sorok elnevezéseit tartalmazzák. A tábla felső részén elhelyezkedő feliratos, szöveges rovatokat
fejrovatoknak nevezzük. A fejrovatokban található megnevezések a függőlegesen elhelyezkedő oszlopokra vonatkoznak. Az egyes sorok és oszlopok
adatainak összegét, illetve a sokaság(ok) egészére jellemző adatokat tartalmazó rovatok az ún. összesen rovatok.

A statisztikai tábla definíciójából – amely szerint: „statisztikai sorok összefüggő rendszere” – következik, hogy a tábla minden egyes adata egyidejűleg
több, de legalább két (egy vízszintesen és egy függőlegesen elhelyezkedő) statisztikai sornak tagja.

Azt a számot, amelyik azt jelzi, hogy a tábla egy-egy adata hány statisztikai sorhoz tartozik, a statisztikai tábla dimenziószámának nevezzük.
Definiálhatnánk a statisztikai táblát oly módon is, hogy a statisztikai sort is táblának
Tehát az előbbi definíció szerint a statisztikai táblák legalább kétdimenziósak
tekintenénk, mégpedig egydimenziós táblának.
. A statisztikai táblákat – a dimenziószám mellett – leggyakrabban a csoportosításnak (az osztályozásnak) a tábla
elkészítésében betöltött szerepe szerint különböztetjük meg.

A csoportosítás szerepe szerint a statisztikai táblák lehetnek egyszerű, csoportosító és kombinációs táblák.

Az egyszerű táblák

A csoportosítást nem tartalmazó adatsorok összefüggő rendszere az egyszerű tábla.

Az egyszerű táblákban általában leíró és összehasonlító sorok szerepelnek. Formai ismertetőjegyük, hogy nincsenek összesen rovataik.

Példaként nézzük a budapesti székhelyű külföldi érdekeltségű vállalkozások néhány fontosabb adatának alakulását tartalmazó táblát (3.1. táblázat).

3.1. táblázat - A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok)
Megnevezés 1989 1991 1993

107
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Vállalkozások száma 886 5111 10 953,1

Összes jegyzett tőke (Mrd Ft) 64,3 270,3 725,1

Ebből külföldi részesedés 15,5 123,7 411,7

A tábla nem tartalmaz csoportosítást, ezért összesen rovatok sem szerepelnek benne. Három – vízszintesen elhelyezkedő – összehasonlító,
állapotidősor és három – függőlegesen elhelyezkedő – leíró sor alkotja a táblát. A tábla minden adata egyidejűleg két statisztikai sornak tagja, tehát
a 3.1. táblázat egy kétdimenziós egyszerű tábla.

A csoportosító táblák

Az egy ismérv szerinti csoportosítást tartalmazó statisztikai sorok összefüggő rendszere a csoportosító tábla.

A csoportosító táblában egy ismérv szerinti csoportosítás eredményeként keletkezett csoportosító sorok összehasonlítással vagy (és) leíró sorokkal
szerepelnek együtt. A csoportosító tábla egy irányban összesen rovatokat is tartalmaz.

A következő táblában az egy ismérv szerinti csoportosítás összehasonlítással társul (3.2. táblázat).

A tábla függőleges irányban tartalmazza a csoportosítást. A csoportosítás alapja – az életkor – mennyiségi ismérv, ezért a táblában függőlegesen
három mennyiségi sor helyezkedik el. Vízszintesen kilenc összehasonlító, állapotidősor található. Ebben a táblában vízszintes irányban helyezkednek
el az összesen rovatok. Az összesen rovatban lévő adatok alkotják azt az idősort, amely az egész népesség számának alakulását mutatja.

3.2. táblázat - A magyarországi népesség életkor szerinti megoszlásának alakulása

Korcsoport Népességszám (E fő)


(év) 1980 1990 1995
(január 1.)
0–5 1 045 738 720

6 – 14 1 296 1 392 1 151

15 – 24 1 465 1 445 1 619

25 – 29 892 620 675

30 – 49 2 814 3 014 2 897

108
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

50 – 59 1 368 1 206 1 198

60 – 69 928 1 116 1 058

70 – 902 844 927


Összesen 10 710 10 375 10 245

A kombinációs táblák

A sokaság több ismérv szerinti kombinatív osztályozásának eredményeként kapott adatokat kombinációs vagy kontingenciatáblába foglalhatjuk.
A kombinációs tábla legalább két ismérv szerinti kombinatív csoportosítást tartalmaz.

Az 1.4. pontban a magyarországi lakott lakások két ismérv szerinti kombinatív csoportosítása eredményeként adódó sémát közöltünk. A kétszeresen
csoportosított adatokból kiindulva és az adatokat függőleges és vízszintes irányban elrendezve, felírhatjuk a statisztikai sorok olyan összefüggő
rendszerét, amely kombinációs táblát alkot (3.3. táblázat).

3.3. táblázat - A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint
(1990. január 1.)

Komfortosság Budapest A többi város Községek Összesen


Komfortos 673 1259 780 2712

Félkomfortos 40 88 159 287

Komfort nélküli 63 193 433 689


Összesen 776 1540 1372 3688

A tábla kétféle minőségi ismérv – a komfortosság és a településtípus – szerinti kombinatív csoportosítást tartalmaz. Függőlegesen a komfortosság
szerinti csoportosításból keletkezett négy minőségi sor helyezkedik el. Ezek a lakások számának komfortosság szerinti megoszlását mutatják
településtípusonkénti bontásban, valamint az összes lakásra vonatkozóan. A vízszintes irányban elhelyezkedő négy – ugyancsak – minőségi sor
a különböző komfortfokozatú lakások és az összes lakás településtípusonkénti megoszlását jellemzi. A kétféle csoportosításnak megfelelően két
irányban találhatók összesen adatok.

A statisztikai táblák három típusát szemlélteti a 3.1. ábra.

109
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

3.1. ábra - A statisztikai táblák típusai

A különböző típusú statisztikai táblák formájában rendelkezésre álló adatok elemzésénél különböző jellegzetes elemzési esetek adódnak, a
vizsgálathoz különböző elemzési eszközöket, módszereket használunk.

A 3. fejezet további részében kétdimenziós statisztikai táblákhoz kapcsolódóan tekintünk át jellegzetes elemzési eseteket, és bemutatjuk, hogy az
egyes esetekben milyen statisztikai elemzési eszközök, módszerek, mutatószámok alkalmazhatók.

3.2. Az egyszerű táblák elemzése


Az egyszerű táblák nem tartalmaznak csoportosítást, az ilyen táblákban általában leíró sorok és összehasonlító sorok – leggyakrabban idősorok
– találhatók.

Az elemzés során intenzitási viszonyszámokat és összehasonlító viszonyszámokat számíthatunk, bizonyos esetekben a tábla információtartalmát
megfelelő grafikus ábrák segítségével is megjeleníthetjük.

110
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása


Az eddigiekben már megismert (például dinamikus vagy megoszlási) viszonyszámok azonos fajta, azonos mértékegységű adatok hányadosai voltak.

Ezzel szemben az intenzitási viszonyszám két különböző fajta és általában különböző mértékegységű statisztikai adat hányadosa.

Az intenzitási viszonyszám azt mutatja meg, hogy az egyik sokaság milyen intenzitással fordul elő a másik sokaság környezetében. Általában
mértékegysége van, amely a viszonyszám számlálójában és nevezőjében szereplő adat – nem feltétlenül azonos – mértékegységéből adódik. Mivel
az egyszerű táblák általában leíró sorokat is tartalmaznak, elemzésük során az ilyen típusú viszonyszámok alkalmazására tág lehetőségek nyílnak.

Az intenzitási viszonyszámok jellegzetes típusai – a viszonyszám tartalma szerint – a következők:

– sűrűségmutatók,

– ellátottságot kifejező mutatók,

– arányszámok,

– átlagjellegű mutatók.

Sűrűségmutató például a népsűrűség mutatószáma, amely a népességnek a számára rendelkezésre álló területen való elhelyezkedésének
sűrűségét, intenzitását mutatja. Az ellátottsági mutatók a szociális, a kulturális stb. ellátás színvonalának mérőszámai. (Például a 10 000
lakosra jutó kórházi ágyak száma, amely az egészségügyi ellátás egyik mutatószáma.) Az arányszám elnevezésű mutatószámokat főleg a
népességstatisztikában használják, ilyenek a születési, halálozási stb. arányszámok. Átlagjellegű mutatók például az 1 főre jutó GDP nagysága, 1
termék előállításához szükséges munkaidő stb.

Tekintsük át a 3.4. táblázat adatait.

3.4. táblázat - Az orvosi ellátás néhány adata (december 31-i adatok)


Megnevezés 1980 1993
Népesség száma (E fő) 10 705 10 278

Orvosok száma (fő) 30 842 41 397

Háziorvosok száma (fő) 5 092 6 381

Az egészségügyi ellátás színvonalát jellemezni lehet például a

111
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

mutatóval, vagy az

mutatóval.

1980-ban:

a 10 000 lakosra jutó orvosok száma: orvos/10 000 lakos,

az 1 orvosra jutó lakosok száma: lakos/orvos.

1993-ban:

a 10 000 lakosra jutó orvosok száma: orvos/10 000 lakos,

az 1 orvosra jutó lakosok száma: lakos/orvos.

Példánk alapján látható, hogy az intenzitási viszonyszámok bizonyos körénél a viszonyítás tárgyát képező adat és a viszonyítás alapját képező adat
felcserélhető, vagyis az intenzitási viszonyszám számítása céljából kijelölhető tört számlálójában és nevezőjében szereplő adatok felcserélhetők.

Ha ugyanazon két sokaság adata alapján ilyen módon kétféle intenzitási viszonyszám képezhető, az egyiket egyenes, a másikat fordított intenzitási
viszonyszámnak szokás nevezni. A két intenzitási viszonyszám közül azt célszerű egyenesnek nevezni, amely értékének növekedése kedvező
irányú változást jelez.

A 10 000 lakosra jutó orvosok számának növekedése az orvosellátottság javulását jelzi, ezért ezt tekintjük egyenes intenzitási viszonyszámnak;
az 1 orvosra jutó lakosok számát pedig fordított intenzitási viszonyszámnak, ugyanis ennek nagysága fordított arányban áll a vizsgált jelenség
színvonalával.
1
Az ugyanazon két adat alapján számított, egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok fordított arányban állnak egymással .
12
Az orvosellátottság két említett mutatószámánál ügyeljünk arra, hogy az egyenes intenzitási viszonyszám 10 000 lakosra vetítve mutatja az orvosok számát.

112
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Ha abból a sokaságból – amelynek a nagyságát jellemző adat (B) az elemzés céljából kiszámítandó intenzitási viszonyszám nevezőjében szerepel
– kiválasztható egy olyan részsokaság (a nagyságát b jellemzi), amely – az egész sokaságnál – közvetlenebb kapcsolatban áll a számlálóban levő
adattal (A-val), akkor kétféle intenzitási viszonyszám számítható.

A viszonyítandó adatot a teljes viszonyítási alappal elosztva nyers intenzitási viszonyszámot a vele szorosabb kapcsolatban álló részsokaság

adatával osztva tisztított intenzitási viszonyszámot kapunk.

A kétféle viszonyszám kiszámításához felhasznált adatok lehetővé teszik még egy megoszlási viszonyszám kiszámítását is, amely a tisztított
intenzitási viszonyszám nevezőjében szereplő részsokaság adatának arányát mutatja a nyers intenzitási viszonyszám nevezőjében szereplő teljes

sokaság adatához viszonyítva Ezt az arányt a „tiszta” rész arányának szokás nevezni.

A két intenzitási viszonyszám és a megoszlási viszonyszám között fennáll a következő összefüggés:

a nyers intenzitási viszonyszám egyenlő a tisztított intenzitási viszonyszám és a tiszta rész arányának szorzatával.

Az összefüggés alapján bármelyik viszonyszám kiszámítható a másik kettő ismeretében. Az összefüggés arra is rámutat, hogy a nyers intenzitási
viszonyszám két tényező hatásának eredménye.

A nyers és tisztított intenzitási viszonyszámok alkalmazásának számos területe van, legjellemzőbb a használatuk a népességstatisztikában
alkalmazott arányszámok esetében. Például a születési arányszám számításánál a születések számát viszonyíthatjuk az egész népesség számához,
illetve viszonyítási alap lehet a szülőképeskorú (15–49 éves) női népesség száma.

A korábbi példánkban az 1 orvosra jutó lakosok száma nyers intenzitási viszonyszámnak tekinthető. Az orvosok sokaságán belül ugyanis van egy
olyan rész – a háziorvosok sokasága –, amely közelebbi kapcsolatban van az ellátandó népességgel. Ezért kiszámítható az 1 háziorvosra jutó
lakosok száma is, amely tisztított intenzitási viszonyszámnak minősül. Az orvosellátottság nyers és tisztított viszonyszámai 1980-ban:

a 1 orvosra jutó lakosok száma: lakos/orvos,

az 1 háziorvosra jutó lakosok száma: lakos/orvos.

113
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A háziorvosok aránya:

Összefüggésük:

1993-ban:

a 1 orvosra jutó lakosok száma: : lakos/orvos,

az 1 háziorvosra jutó lakosok száma: lakos/orvos.

A háziorvosok aránya:

Összefüggésük:

A 3.4. táblázatban megadott adatok nemcsak intenzitási, hanem dinamikus viszonyszámokkal is elemezhetők.

A 3.5. táblázatban megadjuk a kiszámított viszonyszámokat is és az összefüggések általánosításához szükséges jelöléseket.


2
3.5. táblázat

3.5. táblázat - Orvosi ellátásra vonatkozó adatok


Megnevezés 1980 1993 1980=100,0%

(0) (1)

2
Annak érdekében, hogy az eredmények közötti pontos, számszerű összefüggéseket bemutathassuk, a viszonyszámok számításánál 2 tizedes pontossággal számoltunk.

A táblázatban található megoszlási viszonyszámok és dinamikus viszonyszámok százalékos formában kifejezett viszonyszámok. A viszonyszámok számításának képletszerű felírásakor a 100-zal
való szorzás kijelölésétől eltekintettünk.

114
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Népesség A 10 705,11 10 278,11 96,01


száma (E
fő)
Orvosok B 30 842,11 41 397,11 134,22
száma (fő)

Háziorvosok b 5092,11 6381,11 125,31


száma (fő)

10 000 28,81 40,28 139,81


lakosra jutó
orvosok
száma
1 orvosra 347,09 248,28 71,53
jutó lakosok

száma
1 2102,31 1610,72 76,62
háziorvosra
jutó lakosok
száma

Háziorvosok 16,51 15,41 93,33


aránya (%)

A táblázatban, amely ugyancsak egyszerű statisztikai tábla, az abszolút adatok mellett különféle típusú intenzitási viszonyszámok, megoszlási
viszonyszámok, az utolsó oszlopban pedig dinamikus viszonyszámok foglalnak helyet.

Mint látható, nemcsak az abszolút adatok összehasonlításából számíthatunk összehasonlító – jelen esetben dinamikus – viszonyszámokat, hanem
az intenzitási

viszonyszámokból is. Fontos megjegyezni, hogy a különféle típusú intenzitási viszonyszámok közötti összefüggések az azokból számított dinamikus
(és egyéb összehasonlító) viszonyszámok között is fennállnak.

Intenzitási viszonyszámok dinamikus viszonyszámának számítása

Az intenzitási viszonyszámok összehasonlítása esetén a dinamikus viszonyszámot kétféleképpen is kiszámíthatjuk. Például az 1 orvosra jutó lakosok
számának változását jelző dinamikus viszonyszám kiszámítható:

115
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

a) Az 1993-as és az 1980-as év intenzitási viszonyszámainak hányadosaként:

b) A népesség és az orvosok számának változását jelző dinamikus viszonyszámok hányadosaként:

Az 1 orvosra jutó lakosok száma tehát 28,47% -kal csökkent 1980-ról 1993-ra.

Általánosságban is igaz, hogy az intenzitási viszonyszám dinamikus viszonyszáma kétféleképpen számítható:

a) A tárgyidőszaki és a bázisidőszaki intenzitási viszonyszámok hányadosaként:

b) Az intenzitási viszonyszám számlálójában és nevezőjében szereplő adatok dinamikus viszonyszámának hányadosaként:

A kétféle számítás azonos eredményre vezet, mert megfelelő átrendezéssel:

Az ugyanazon két adat alapján számított egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok egymás reciprokai.

Egyenes intenzitási viszonyszám

fordított intenzitási viszonyszám

116
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Összefüggésük:

Példánkban: orvos jutott 10 000 lakosra 1980-ban.

(A 10 000-rel való szorzást az indokolja, hogy az egyik viszonyszámnál a nevező 1 egységéről, a másik viszonyszámnál a nevező 10 000 egységéről
van szó.)

A reciprok viszony fennáll az egyenes és fordított intenzitási viszonyszámok dinamikus viszonyszámai között is:

Például: a 10 000 lakosra jutó orvosok számának 1980-ról 1993-ra bekövetkezett változását jelző dinamikus viszonyszám kiszámítható a
következőképpen is:

3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása


Ha az egyszerű táblában kettőnél több időpontra (időszakra) vonatkozó adatok vannak, akkor lehetőségünk van a vizsgált jelenség változási, fejlődési
tendenciáinak kimutatására is.

Egy sokaság változásának tendenciája kirajzolódik a sokaság nagyságadatait tartalmazó – viszonylag hosszabb – idősorból, illetve szemléletesen
tükrözi ezt az idősor adatai alapján készített vonaldiagram.

Ha két vagy több – egymással valamilyen kapcsolatban lévő – sokaság változásának tendenciáját kívánjuk összehasonlítani, akkor az adatok eltérő
nagyságrendje, eltérő mértékegysége miatt csak a dinamikus viszonyszámok alapján vonhatunk le következtetéseket. Követelmény továbbá, hogy
mindegyik adatsor összehasonlítási bázisa azonos legyen. Ha pedig grafikusan akarjuk szemléltetni a különböző jelenségek fejlődési tendenciáit,
akkor célszerű közös (egyetlen) koordináta-rendszerben ábrázolni azokat.

Bemutató példánkat ismét az egészségügy területéről vesszük. A 3.6. táblázat az 1985 és 1993 közötti időszakra (kettőnél több időbeli adat alapján)
mutatja be az ellátottságot jellemző néhány adatot.

117
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

3.6. táblázat - Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok)


Év Kórházi
Népesség száma Orvosok száma
ágyak száma
(ezer fő) előző év = 100,00%
1980 = 100,00%
1985 10 560 – 107,13

1986 10 509 101,17 108,62

1987 10 464 101,40 109,46

1988 10 421 102,10 109,73

1989 10 375 101,72 109,85

1990 10 355 103,70 110,00

1991 10 337 103,50 108,93

1992 10 310 103,44 106,56

1993 10 278 101,29 105,12

Figyeljük meg, hogy a népességszám ezer főben adott, az orvosok számának a láncviszonyszámai, a kórházi ágyak számának pedig a
bázisviszonyszámai (1980-as bázison) ismertek.

A bekövetkezett változások jellemzése és reális összehasonlítása a három jelenség bázis- vagy láncviszonyszámai alapján lehetséges. Ezek
ismeretében történhet ezután a megfelelő intenzitási viszonyszámok dinamikus viszonyszámainak kiszámítása.

A 3.7. táblázat első három oszlopa az alapadatok bázisviszonyszámait, további oszlopai pedig a kiszámítható intenzitási viszonyszámok (1985-ös
bázison számított) bázisviszonyszámait tartalmazzák.

3.7. táblázat - Az egészségügyi ellátásra vonatkozó adatok


Orvosok 10 000 10 000
Kórházi
Népesség 1 orvosra
ágyak
Év száma száma lakosra jutó lakosra
száma
1985=100% jutó lakosok jutó
1985=100% 1985=100% orvosok kórházi

118
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

ágyak
száma száma
száma
1985=100% 1985=100%
1985=100%
1. 2. 3. 4. 5. 6.
1985 100,00 100,00 100,00 100,00 100,00 100,00

1986 99,52 101,17 101,39 101,66 98,37 101,87

1987 99,09 102,59 102,18 103,53 96,59 103,12

1988 98,68 104,74 102,43 106,14 94,21 103,80

1989 98,25 106,54 102,54 108,44 92,22 104,37

1990 98,06 110,48 102,68 112,67 88,75 104,71

1991 97,89 114,36 101,68 116,83 85,59 103,87

1992 97,63 118,30 99,47 121,18 82,53 101,88

1993 97,33 119,81 98,12 123,10 81,24 100,81

A 3.7. táblázatban található viszonyszámok számításával kapcsolatban a következőket említjük meg.

Mielőtt a táblázat adatait tanulmányoznánk, gondoljuk végig az alábbiakat.

– A Dinamikus viszonyszámok című 2.2.2. alpontban megismerkedtünk a bázis- és a láncviszonyszámok közötti összefüggésekkel.
Láncviszonyszámokból bázisviszonyszámok közvetlenül számíthatók, a megfelelő láncviszonyszámok szorzataként.

Például az 1990. évi viszonyszám számítása (a táblázat 2. oszlopában):

– A kórházi ágyak számának alakulását jellemző viszonyszámok a 3.6. táblázatban 1980-as bázishoz viszonyítva mérik a változást. E
bázisviszonyszámokat az összehasonlíthatóság érdekében átszámítottuk 1985-ös bázisra.

Az átszámítás úgy történt, hogy az 1980. évi bázison számított bázisviszonyszámokat rendre elosztottuk az „új” bázisul választott 1985. év 1980-
as bázison számított viszonyszámával, az 1,0713-del.

Például a kórházi ágyak számának 1990. évi bázisviszonyszáma, 1985-ös bázishoz viszonyítva

119
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A két bázisviszonyszám hányadosa ugyanarra az eredményre vezet, mintha a két alapadatot osztottuk volna el egymással.

Általánosságban is megállapíthatjuk, hogy új bázisra úgy térünk át, hogy a viszonyszámsor minden elemét elosztjuk az új bázisnak választott
időszak (időpont) eredeti bázisviszonyszámával.

– A táblázat 4., 5. és 6. oszlopában szereplő intenzitási viszonyszámok bázisviszonyszámait az ebben a fejezetben megismert összefüggések alapján
számítottuk ki.

Például

– a 10 000 lakosra jutó kórházi ágyak számának bázisviszonyszáma 1990-ben:

(Az eredeti viszonyszámtört számlálójának – a kórházi ágyak számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – a népesség
számának – a viszonyszámával.)

– az 1 orvosra jutó lakosok számának bázisviszonyszáma 1993-ban:

(Az eredeti viszonyszámtört számlálójának – a népesség számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – az orvosok
számának – a viszonyszámával.)

A 3.7. táblázat alapján látható, hogy a népesség számának csökkenő tendenciája mellett az orvosok száma növekedést mutat. A népességszám
és az orvosok számának bázisviszonyszámait összehasonlítva egyértelműen következtethetünk az orvosellátottság javulására, amelyet közvetlenül
jeleznek a 10 000 lakosra jutó orvosok számának, illetve az 1 orvosra jutó lakosok számának bázisviszonyszámai.

A kórházi ágyak számának alakulását 1985 és 1991 között viszonylag egyenletes, de kismértékű növekedés jellemezte. A csökkenő népességszám
mellett ez a 10 000 lakosra jutó kórházi ágyak számának növekedését eredményezte. 1991-től kezdődően azonban a kórházi ágyak száma évről
évre csökkent, nagyobb arányban, mint a népességszám. Ezért 1991-től kezdődően a 10 000 lakosra jutó kórházi ágyak száma is – viszonylagosan
– csökkent.

A változások alapvető tendenciáját – az előzőekben említett módon – vonaldiagramokkal szemléltethetjük.

120
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

3.2. ábra - Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva

A 3.2. ábra alapján is következtethetünk az egészségügyi ellátás – különböző intenzitási viszonyszámokkal jellemzett – színvonalának alakulására.
Az egészségügyi ellátottság változásának tendenciáját – egyértelműbben – a 3.3. ábra szemlélteti.

3.3. ábra - Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva

121
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A változás tendenciájának tömör jellemzésére alkalmazhatjuk az átlagos változás mérőszámait, nevezetesen a fejlődés átlagos mértéke és a
fejlődés átlagos üteme mutatószámokat.

Az ismert adatok alapján a fejlődés átlagos mértékének mutatószámával csak a népesség számának alakulását vizsgálhatjuk. (Az orvosokra és a
kórházi ágyakra ugyanis nem ismertek az abszolút számok.)

A népesség változásának átlagos mértékét a legegyszerűbben a következőképpen számíthatjuk:

Ezt úgy értelmezhetjük, hogy Magyarországon a népesség száma 1985 és 1993 között évenként átlagosan 35 250 fővel csökkent.

A népességszám változásának átlagos üteme pedig:

amely alapján megfogalmazható, hogy a népesség száma 1985 és 1993 között évenként átlagosan 0,34%-kal csökkent.

Nézzük meg, hány %-kal változott a kórházi ágyak száma 1985 és 1993 között:

tehát évenként átlagosan 0,24%-kal csökkent.

A 10 000 lakosra jutó kórházi ágyak számának 1985 és 1993 közötti átlagos relatív változására vonatkozó mutatószám értékét kiszámíthatjuk a
kórházi ágyak számának és a népesség számának mutatószámai alapján is a következőképpen:

Ez természetesen kiszámítható a 10 000 lakosra jutó kórházi ágyak számának adataiból közvetlenül is:

122
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Az orvosok számának, valamint az orvosellátottság 1985 és 1993 közötti alakulásának jellemzésére az előbbiekhez hasonló módon elvégezhetők
a számítások.

3.3. A csoportosító táblák elemzése


A csoportosító táblában a sokaság(ok)nak egy ismérv szerinti csoportosítása (osztályozása) található, amely általában valamilyen leíró sorral vagy
összehasonlítással társul. Ha a sokaság(ok)nak a csoportosítással kialakított részeit külön-külön is fontosnak, vizsgálatra érdemesnek tartjuk,
akkor a csoportokat, az osztályokat részsokaság(ok)nak tekintjük. Ebben az esetben az egész sokaságo(ka)t teljes sokaság(ok)nak vagy
fősokaság(ok)nak nevezzük.

3.8. táblázat - A csoportosító tábla általános sémája


Részsokaságok

(csoportok)

Fősokaság

ahol:

valamely ismérv alapján képzett j-edik részsokaságok (csoportok) megnevezése,

a j-edik részsokaságokra vonatkozó adatok,

123
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

M: a képzett részsokaságok (csoportok) száma.

3.3.1. Rész- és összetett viszonyszámok


Csoportosított sokaság esetén az egyes részsokaságokra számított azonos típusú viszonyszámokat részviszonyszámoknak (jele: ), a
fősokaságra vonatkozó viszonyszámot összetett viszonyszámnak (jele: ) nevezzük.

A részviszonyszám képlete:

Az összetett viszonyszám képlete:

A részviszonyszám képletéből -t illetve -t kifejezve az összetett viszonyszám a következőképpen is felírható:

Ezek az összefüggések arra mutatnak rá, hogy az összetett viszonyszám egyúttal átlag is, a részviszonyszámok súlyozott számtani, illetve
harmonikus átlaga. Ez indokolja a jelölését is. Ebből következően minden összetett viszonyszám a legkisebb és legnagyobb részviszonyszám
között helyezkedik el, vagyis:

Az összetett viszonyszámra vonatkozó képleteket szövegesen megfogalmazva a következők mondhatók el. Az összetett viszonyszám
háromféleképpen számítható ki:

1. a fősokaság(ok)ra vonatkozó adatok hányadosaként;

124
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

2. a részviszonyszámok súlyozott számtani átlagaként, ahol a súlyok szerepét a részviszonyszámok számítása céljából kijelölhető törtek
nevezőiben szereplő adatok töltik be;

3. a részviszonyszámok súlyozott harmonikus átlagaként, ahol a súlyok a részviszonyszámok számítása céljából kijelölhető törtek számlálóiban
szereplő adatok.

Az összetett viszonyszámok súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási

viszonyszámokkal. A adatok helyett a az adatok helyett az megoszlási viszonyszámok használhatók fel.

A következőkben a rész- és összetett viszonyszámoknak különböző elemzési helyzetekben betöltött szerepére mutatunk be példákat.

Az átlagos színvonal vizsgálata csoportosított sokaságok esetén

3.9. táblázat - Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.)
Népességszám Lakások száma
Megnevezés
(ezer fő) (ezer db)

Budapest 1 995,7 810

A többi város 4 561,9 1692

Községek 3 719,4 1453


Összesen 10 277,0 3955

A 3.9. táblázatban szereplő adatok felhasználásával jellemezhető a magyarországi lakásellátottság színvonala. Kiszámítható a lakásellátottság egyik
leggyakrabban használt mutatószáma, a 100 lakásra jutó lakosok száma .

A lakásellátottság színvonalát tehát intenzitási viszonyszámmal fejezzük ki.

125
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Ebben az elemzési helyzetben a településtípusokra vonatkozó intenzitási viszonyszámok részviszonyszámok míg az egész országot jellemző
intenzitási viszonyszám összetett viszonyszámnak tekinthető.

A 3.9. táblázat adataiból – mivel azok részekre bontott sokaságok adatai – megoszlási viszonyszámok is számíthatók. Ezek a viszonyszámok a
népesség, illetve a lakások településtípusonkénti összetételét jellemzik.

A 3.9. táblázatban szereplő adatokat a belőlük számítható viszonyszámokkal kiegészítve állítottuk össze a 3.10. táblázatot.

3.10. táblázat - A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.)


Népesség száma Lakások száma 100 lakásra
%-os %-os jutó
ezer fő ezer db
megoszlás megoszlás népesség (fő)

Megnevezés

Budapest
1 995,7 19,42 810 20,48 246
A többi
4 561,9 44,39 1692 42,78 270
város
3 719,4 36,19 1453 36,74 256
Községek
Összesen 10 277,0 100,00 3955 100,00 260

A 3.10. táblázat utolsó oszlopában található adatok rész- és összetett intenzitási viszonyszámok. Részintenzitási viszonyszám például a Budapestre
vonatkozó 100 lakásra jutó népesség:

Az egész ország lakásellátottságát jellemző összetett viszonyszám kiszámítása a következő:

126
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Az átlagos viszonyszám a megismert összefüggések alapján az alábbiak szerint is kiszámítható:

– a részviszonyszámok súlyozott számtani átlagaként:

a településtípusonkénti lakásszámadatokkal súlyozva

vagy megoszlási viszonyszámokkal súlyozva

– a részviszonyszámok súlyozott harmonikus átlagaként:

a településtípusonkénti népességszámadatokkal súlyozva

vagy megoszlási viszonyszámokkal súlyozva

(Figyeljük meg, hogy az egész országot jellemző mutatószám értéke (260) a legkisebb (246) és a legnagyobb érték (270) közé esik.)

3.3.2. Szerkezet- és dinamikai változás vizsgálata


Ha egy sokaság belső szerkezetében bekövetkezett (összetétel vagy struktúra) változását kívánjuk vizsgálni, akkor is csoportosító táblából indulunk
ki (3.11. táblázat). A szerkezetváltozás mellett módunk van a jelenség dinamikai (időbeli) változásának vizsgálatára is.

3.11. táblázat - A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok)
Ezer db

127
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

1980 1994
Szobák száma

1 973 644

2 1720 1710

3 és több 849 1601


Összesen 3542 3955

A lakásállomány szobaszám szerinti szerkezetét, összetételét a különböző időpontokban megoszlási viszonyszámokkal, az állomány nagyságának
változását pedig dinamikus viszonyszámokkal elemezhetjük. Az egyes csoportokra (részsokaságokra) részviszonyszámok a fősokaságokra
összetett dinamikus viszonyszám számítható. Számításukra és a közöttük levő összefüggésekre a korábbiakban elmondottak érvényesek.

Figyelmünket most elsősorban a szerkezetvizsgálat és a dinamikai változások összefüggéseire fordítjuk. A 3.12. táblázat az előző táblázat adatait
kibővíti a kiszámítható viszonyszámokkal is.

3.12. táblázat - A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása


1980. 1994. 1994. évi
évi állomány állomány az
%-os %-os 1980. évi
Szobák
ezer db ezer db
száma %-ában
megoszlás megoszlás

1 973 27,47 644 16,28 66,2

2 1720 48,56 1710 43,24 99,4

3 és több 849 23,97 1601 40,48 188,6


Összesen 3542 100,00 3955 100,00 111,7

A 3.12. táblázatban található viszonyszámok alapján a következőket fogalmazhatjuk meg.

128
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A lakásállomány szerkezetének 1980 és 1994 közötti változására az 1 szobás lakások arányának jelentős, a 2 szobások arányának kismértékű
csökkenése és a 3 szobás lakások arányának nagyfokú növekedése jellemző. (Lásd a %-os megoszlásokat.) 1980 és 1994 között az egész
lakásállomány 11,7%-kal nőtt, miközben a különböző szobaszámú lakások száma ettől eltérő módon változott. Míg az 1 szobás lakások állománya
számottevően csökkent, a 2 szobásoké alig csökkent, addig a 3 szobás lakások száma nagymértékben megnőtt. E változások eredményezték a
lakásállomány szobaszám szerinti szerkezetének az előzőekben vázolt változását.

Az összetétel-változás viszonyszámokkal történő elemzésére tekintsük még a következő példát is (3.13. táblázat).

3.13. táblázat - Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei


adatok)
1980. 1994. 1994. évi
népességszám
évi népesség
az
%-os %-os 1980. évi
Megnevezés ezer fő ezer fő
megoszlás megoszlás %-ában

Budapest
2 059,3 19,23 1 995,7 19,42 96,9
A többi
4 551,3 42,50 4 561,9 44,39 100,2
város
4 098,9 38,27 3 719,4 36,19 90,7
Községek
Összesen 10 709,5 100,00 10 277,0 100,00 96,0

Magyarország népessége 1980 és 1994 között 4,0%-kal csökkent. A budapesti népességszám ettől alig eltérően – de valamivel kisebb mértékben –,
3,1%-kal csökkent, emiatt a budapesti népesség aránya csekély mértékben (19,23%-ról 19,42%-ra, tehát 0,19 százalékponttal) nőtt. A többi városban
a népességszám igen kis mértékben, 0,2%-kal nőtt, mivel a teljes népességszám viszont csökkent, e településcsoport népességének részaránya
megnőtt. A községekben élő népesség száma 1994-ben 9,3%-kal volt kevesebb, mint 1980-ban (tehát nagyobb mértékű csökkenés tapasztalható,
mint az egész országban), ennek hatására a községekben élő népesség aránya 1994-ben kisebb, mint 1980-ban.

A példák alapján könnyen belátható, hogy összefüggés van a fősokaság és a részsokaságok nagyságának és a fősokaság szerkezetének változása
között.

129
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A részsokaságok nagyságának eltérő mértékű változása mindig a fősokaság összetételének megváltozását eredményezi.

Ha a j-edik részsokaság (csoport) tárgyidőszaki adata,

a j-edik részsokaság (csoport) bázisidőszaki adata,

a j-edik részsokaság (csoport) rész-dinamikus viszonyszáma,

a fősokaság összetett dinamikus viszonyszáma,

M: a képzett részsokaságok (csoportok) száma,

akkor általánosságban megállapíthatók a következő:

a) Ha akkor ebből átrendezéssel következik, ami azt jelenti, hogy ha valamely részsokaság (csoport) dinamikus
viszonyszáma kisebb, mint az összetett dinamikus viszonyszám, akkor a részsokaság aránya a fősokaságon belül csökkent.

Ehhez hasonlóan:

b) ha akkor tehát ha valamely részsokaság (csoport) dinamikus viszonyszáma nagyobb, mint az összetett dinamikus viszonyszám,
akkor a részsokaság aránya a fősokaságon belül nőtt;

c) ha akkor ebből következik, ami azt jelenti, hogy a j-edik részsokaság aránya nem változott.

A dinamikus viszonyszámok ismeretében tehát következtetni tudunk a sokaság összetételében, szerkezetében bekövetkezett változásokra. Minél
jobban eltér valamely részviszonyszám az összetett viszonyszámtól, annál nagyobb mértékű az adott sokaság részarányának változása.

Tekintsük a következő számszerű példát!

130
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Tételezzük fel, hogy ismerjük a lakásépítések területi megoszlását 1980-ban és az 1994-re bekövetkezett dinamikai változást. Az adatok a 3.14.
táblázatban találhatók.

3.14. táblázat - A magyarországi lakásállományra vonatkozó adatok

A lakások
számának változása
A lakások számának
1980-ról 1994-re
%-os megoszlása 1980-ban
(1980=100,0%)

Megnevezés

Budapest 20,53 111,4

A többi város 34,27 139,4

Községek 45,20 90,8


Összesen 100,00 ...

A teljes lakásállomány nagyságának 1980 és 1994 közötti változását jellemző összetett dinamikus viszonyszámot a 3.14. táblázatban szereplő adatok
alapján a településcsoportokra vonatkozó rész-dinamikus viszonyszámok súlyozott számtani átlagaként számíthatjuk ki.

Tehát megállapítható, hogy az egész lakásállomány 1980-ról 1994-re 11,7%-kal nőtt. A budapesti lakások száma ennél valamivel kisebb mértékben
(11,4%-kal) nőtt, emiatt a budapesti lakások aránya a teljes lakásállományon belül 1980-ról 1994-re kissé csökkent. Tehát az 1994. évi részarányt
jelző megoszlási viszonyszám 20,53%-nál (nem számottevően) kisebb. A többi városban a lakásállomány a teljes állomány növekedésénél nagyobb
fokú növekedést mutat, e tényből az is következik, hogy a többi város részesedése az ország lakásállományából megnőtt, 1994-ben a részesedési
arány 34,27%-nál nagyobb. A községi lakások száma a vizsgált időszakban csökkent (míg az egész lakásállomány nőtt), így a községi lakások
aránya csökkent, az arány 1994-ben 45,20%-nál kisebb volt.

A sokaságok nagyságának és szerkezetének változására vonatkozó információkat nemcsak csoportosító táblák formájában jeleníthetjük meg, hanem
megfelelően megválasztott, megszerkesztett grafikon segítségével is.

131
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A sokaságok nagyságának és összetételének változását leggyakrabban osztott oszlopdiagramokkal vagy osztott kördiagramokkal szemléltetjük.

Oszlopdiagrammal történő ábrázolás esetén az adatokat célszerű eltérő szélességű, azonos magasságú oszlopokkal ábrázolni. Az oszlopok
(téglalapok) eltérő szélességében a sokaság(ok) nagyságának időbeli változását juttatjuk kifejezésre, és az azonos magasságokat az adott időszaki
összetételnek megfelelően megosztjuk, így a szerkezetváltozás is érzékelhetővé válik.

3.4. ábra - A lakásállomány szobaszám szerinti összetételének alakulása

A 3.4. ábra elkészítéséhez szükséges viszonyszámok a 3.12. táblázatban találhatók.

A téglalapok szélességeinek arányai 1:1,117.

132
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A kördiagram a sokaság szerkezeti megoszlásának igen kifejező ábrázolási módja. Az összetételt a kör területének körcikkekre történő osztásával
szemléltetjük. A részsokaságok arányát jelző megoszlási viszonyszámoknak megfelelő körcikkeket abból az egyszerű összefüggésből határozzuk
meg, hogy a kör területe, azaz a 360°-os középponti szög megfelel a 100%-nak, így 1%-nak 3,6°-os középponti szög, azaz a hozzátartozó körcikk
területe felel meg. Az összetétel ábrázolása mellett lehetőség van arra is, hogy a sokaságok nagyságának időbeli változását is érzékeltessük. Két
időszak adatának összehasonlítása esetén két különálló (esetleg két koncentrikus), eltérő sugarú körrel ábrázolunk.

Síkidomokkal való ábrázolás esetén azok területe arányos az adatok nagyságával, viszont síkidomok megszerkesztésekor egydimenziós
jellemzőkből indulunk ki, így a köröket a sugaruk segítségével szerkesztjük. Ehhez fontos tisztázni, milyen arányban áll a sugarak nagysága
egymással.

Ha azt akarjuk, hogy a körök területaránya a viszonyszámot fejezze ki – mivel a körök területaránya azonos a sugarak négyzetének arányával
–, a sugarak aránya lesz.

3.5. ábra - A lakásállomány szobaszám szerinti összetételének alakulása

Természetesen a 3.5. ábra elkészítéséhez is szükségesek a 3.12. táblázatból kiolvasható viszonyszámok. Az 1994-es lakásállomány nagyságát
szemléltető kör sugara a az 1980. évi állományt reprezentálóénak -szerese.

3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése


Azok a gazdasági és társadalmi jelenségek, folyamatok, amelyek vizsgálatával a statisztika foglalkozik, összefüggésben állnak egymással. Az elemző
munka során fontos feladat ezeknek az összefüggéseknek a feltárása, a statisztika eszközeivel történő leírása. A jelenségeket, folyamatokat az
ismérveik alapján jellemezhetjük, ezért a közöttük lévő összefüggések az ismérvek közötti kapcsolatként jelennek meg.

133
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Mielőtt a módszerek ismertetésére rátérnénk, ismerkedjünk meg az összefüggések lehetséges eseteivel.

Az ismérvek közötti kapcsolat lehet függvényszerű, lehet sztochasztikus, illetve az ismérvek lehetnek egymástól függetlenek.

Függvényszerű a kapcsolat két ismérv között, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) egyértelműen meghatározza a másik ismérv
szerinti hovatartozást (ismérvváltozatot). Ilyen összefüggés van például a lakosok születési éve és életkora között.

Sztochasztikus kapcsolatról beszélhetünk akkor, ha az ismérvek között tendenciaszerű összefüggést észlelünk, ha az egyed egyik ismérv szerinti
hovatartozásából csupán a másik ismérv szerinti hovatartozásnak a valószínűsége határozható meg. Ilyen összefüggés van például a munkavállalók
képzettsége és szakmai elismertsége között; a vállalkozások árbevétele és jövedelmezősége között stb.

A két ismérvet egymástól függetlennek mondjuk, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) ismerete semmiféle információt nem ad
a másik ismérv szerinti hovatartozásról (ismérvváltozatról). Pontos definícióját a 3.4.1. pontban adjuk meg.

A statisztika a sztochasztikus kapcsolat vizsgálatával foglalkozik. Ezt a kapcsolatot – az elmondottak alapján – úgy tekinthetjük, mint a két szélsőség
(a teljes függvényszerűség, illetve a kapcsolat teljes hiánya) közötti átmenetet. A kapcsolat erősségét (intenzitását) aszerint ítéljük meg, hogy az
melyik szélsőséghez áll közelebb.

A kapcsolatot annál lazábbnak, gyengébbnek nevezzük, minél közelebb van a függetlenséghez és annál szorosabbnak, erősebbnek, minél
közelebb áll a függvényszerű kapcsolathoz.

A sztochasztikus kapcsolatról elmondottak általánosíthatók kettőnél több ismérv esetére is, de ebben a fejezetben csak a két ismérv közötti
(kétváltozós) sztochasztikus kapcsolatok vizsgálatának néhány egyszerű elemzési eszközével foglalkozunk.

A vizsgálatba bevont ismérvek fajtája szerint a sztochasztikus kapcsolatnak háromféle típusát különböztetjük meg:

a) Asszociáció(s)kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (nominális változók, illetve egyikük ordinális
mérési szintű változó).

b) Vegyes kapcsolat: az egyik ismérv minőségi vagy területi ismérv (nominális, illetve ordinális skálán mért változó), a másik ismérv mennyiségi
ismérv (intervallum- vagy arányskálán mért változó).

c) Korreláció(s) kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (intervallum- és (vagy) arányskálán mért változó).

Tekintsük a következő példát: a közalkalmazottakat megfigyeljük az iskolai végzettség, a vezetésben betöltött szerep (beosztás), a közalkalmazotti
munkaviszony hossza és a kereset nagysága szerint. Ha összefüggést tapasztalunk az iskolai végzettség és a beosztás között, ezt a kapcsolatot
asszociációnak nevezzük, mert mindkét jellemző minőségi ismérv. Az iskolai végzettség (minőségi ismérv) és a kereset nagysága (mennyiségi
ismérv) közötti kapcsolat, illetve a beosztás (minőségi ismérv) és a kereset nagysága (mennyiségi ismérv) közötti kapcsolat vegyes kapcsolat. A
munkaviszony hossza és a kereset nagysága közötti kapcsolatot pedig korrelációnak nevezzük, mert mindkét jellemző mennyiségi ismérv.

134
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Abból a szempontból, hogy melyik ismérv hat a másikra, háromféle összefüggés képzelhető el. Közvetlen ok-okozati kapcsolat, amikor az egyik ismérv
az ok, a másik az okozat, vagyis az egyik független, a másik függő változónak tekinthető. A munkaviszony hossza és a kereset nagysága közötti
kapcsolatban például a munkaviszony hossza tekinthető független változónak, a kereset nagysága pedig függő változó. Az ismérvek kölcsönhatásban
lehetnek egymással, mint például az ár és a kereslet nagyságának összefüggésében. Egy termék árának nagysága befolyásolja a termék iránti
keresletet, és viszont, a kereslet visszahat az árra. Közvetett kapcsolat, amikor az ismérvek között kizárólag azért tapasztalható összefüggés, mert
azokat közös tényezők befolyásolják.

Az oksági összefüggések természetét általában a jelenségek szakmai ismerete alapján lehet tisztázni.

A sztochasztikus kapcsolatok statisztikai elemzéséhez a sokaság minden egységét egyidejűleg két (vagy több) ismérv szerint vizsgáljuk. Ebben a
fejezetben csak két ismérv összefüggésének vizsgálatával foglalkozunk.

Az asszociáció és a vegyes kapcsolat elemzése általában a sokaságnak a vizsgált két ismérv szerinti kombinatív csoportosításával (osztályozásával)
kezdődik. A kombinatív csoportosítás során az egyik ismérv szerinti csoportosítással kapott részsokaságokon belül a másik ismérv szerint
is osztályozunk. A kombinatív osztályozás eredményét kombinációs (kontingencia-) tábla formájában szokás megadni, emiatt tárgyaljuk a
sztochasztikus kapcsolatok vizsgálatát – a tananyagunknak ebben a részében – a kombinációs táblák elemzéséhez kapcsolódóan.

A kontingenciatáblák a korreláció bizonyos vizsgálataikor is kiindulópontot jelenthetnek, de a mennyiségi ismérvekben rejlő információk tökéletesebb
3
kihasználása olyan módszerek alkalmazását igényli, amelyek másféle adatbázist kívánnak meg.

Két ismérv közötti kapcsolat vizsgálata a kombinációs tábla alapján történhet. A sokaságoknak két ismérv szerinti kombinatív csoportosítását
(osztályozását) tartalmazó kontingenciatábla sémájaként tekintsük a 3.15. táblázatot.

3.15. táblázat - A kontingenciatábla sémája


D ismérv

E ismérv

3
A korreláció elemzését lásd a tankönyv II. kötetében.

135
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

ahol:

az E ismérv szerint képzett i-edik csoport (osztály) ( ),

a D ismérv szerint képzett j-edik csoport (osztály) ( ),

a sokaság azon egységeinek száma (gyakorisága), amelyek E ismérv szerint az osztályba és ezzel egyidejűleg D ismérv szerint a osztályba
tartoznak ( ),

a sokaság azon egységeinek száma (gyakorisága), amelyek az E ismérv szerint a osztályba tartoznak ( ),

a sokaság azon egységeinek száma (gyakorisága), amelyek a D ismérv szerint a osztályba tartoznak ( ),

s : az E ismérv szerint képzett csoportok (osztályok) száma,

t : a D ismérv szerint képzett csoportok (osztályok) száma .

Az előbbiekből következik, hogy

Az gyakoriságok a sokaságoknak csak az E ismérv szerinti (függőleges irányú), az gyakoriságok a sokaságoknak csak a D ismérv
szerinti (vízszintes irányú) megoszlását mutatják. Ezeket a gyakoriságokat peremgyakoriságoknak, az ( ) gyakoriságokat együttes
gyakoriságoknak nevezzük.

Nézzünk egy példát (területi és minőségi ismérvek esetén) (3.16. táblázat).

3.16. táblázat - A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük
és a tanintézet típusa szerint (1990. január 1.)
Szakmunkás-Szakiskolai Középiskolai Egyetemi,
Megnevezés Összesen
tanuló tanuló tanuló főiskolai

136
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

hallgató
Budapest 28 12 66 22 128

Vidéki város 85 20 128 42 275

Község 84 13 77 16 190
Összesen 197 45 271 80 593

Példánkban peremgyakoriságok, együttes gyakoriság.

A kontingenciatábla sémáját megoszlási viszonyszámokkal (relatív gyakoriságokkal) is felírhatjuk (3.17. táblázat).

3.17. táblázat - A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal)


D ismérv

E ismérv

ahol:

a sokaság azon egységeinek aránya (relatív gyakorisága), amelyek egyidejűleg tartoznak az E ismérv szerint az osztályba és a D ismérv
szerint a osztályba ( ). Ezeket együttes megoszlási viszonyszámoknak(relatív gyakoriságoknak) nevezzük,

137
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

az E ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) ( ),

a D ismérv szerinti megoszlási viszonyszámok (relatív gyakoriságok) ( ).

Ez utóbbiakat perem megoszlási viszonyszámoknak (perem relatív gyakoriságoknak) nevezzük.

A 3.16. táblázat adatai alapján készítsük el a relatív gyakoriságok táblázatát! (3.18. táblázat.)

3.18. táblázat - A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint


Összesen
Egyetemi,
Szakmunkás-
Szakiskolai Középiskolai
Megnevezés (perem-
tanuló tanuló tanuló főiskolai
hallgató megoszlás)
Budapest

Vidéki város

Községek

Összesen 1

(peremmegoszlás)

A statisztikai gyakorlatban általában ezek 100-szorosát adjuk meg, amely százalékos megoszlást jelent (3.19. táblázat).

3.19. táblázat - A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint


Egyetemi,
Szakmunkás-Szakiskolai Középiskolai főiskolai
Megnevezés Összesen
tanuló tanuló tanuló
hallgató

138
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Budapest 4,72 2,03 11,13 3,71 21,59

Vidéki város 14,33 3,37 21,59 7,08 46,37

Község 14,17 2,19 12,98 2,70 32,04


Összesen 33,22 7,59 45,70 13,49 100,00

3.4.1. Függvényszerű kapcsolat. Függetlenség


Az E és D között függvényszerű a kapcsolat és E a független változó, ha abból, hogy a sokaság valamelyik eleme egy adott ismérvváltozathoz
tartozik, egyértelműen következik, hogy a D ismérv szerint melyik ismérvváltozatban van. Ebből azonnal adódik, hogy a 3.15. kombinációs tábla
minden sorában csak egy együttes gyakoriság különbözik nullától (az ). Hasonlóan látható be, ha D ismérv a független változó és függvényszerű
a kapcsolat, akkor minden oszlopban csak egyetlen nullától különböző együttes gyakoriság található. A 3.16. táblázatot tekintve nincs az ismérvek
között függvényszerű kapcsolat.

Ha E és D mindegyike tekinthető független változónak és függvényszerű a kapcsolat, akkor ez csak úgy lehet, hogy valamint az E és D ismérvek
változatai között kölcsönösen egyértelmű leképezés létesíthető. Ez a kontingenciatábla szempontjából azt jelenti, hogy minden sorban és oszlopban
csak egyetlen gyakoriság lehet nullától különböző. Ha nem hangsúlyozzuk, hogy melyik ismérv a független változó, akkor függvényszerű kapcsolaton
ez utóbbit értjük.

Most térjünk át a függetlenségre! Tekintsük a 3.15. táblázatot. Az E és D ismérv akkor független egymástól, ha az E ismérv szerinti megoszlás nem
függ a D ismérv szerintitől és fordítva.

A fősokaság E ismérv szerinti megoszlását jellemző (összetett) megoszlási viszonyszámok az viszonyszámok .

A részsokaságok E ismérv szerinti megoszlását jellemző (rész)megoszlási viszonyszámok az viszonyszámok .

Foglaljuk ezt táblázatba (3.20. táblázat)!

3.20. táblázat - Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok


D ismérv

139
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

E ismérv

Az E ismérvváltozatok szerinti megoszlási viszonyszámok nem függhetnek attól, hogy melyik D szerinti ismérvváltozatról van szó. Ezért ezeknek
minden oszlopban egyenlőknek kell lenni. Írjuk fel ezt például az első sorra:

Általánosan:

Vagy ami ugyanaz:

Könnyű belátni, hogy ezen feltételek teljesülése esetén a D ismérv szerinti rész- és összetett megoszlás sem függ az E ismérvváltozattól. Vagyis azt
mondhatjuk, hogy az E és D ismérv akkor függetlenek egymástól, ha ez az egyenletből álló

140
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

egyenletrendszer teljesül. Olyan megállapításnak tehát, hogy a D ismérv független E-től, nincs helye, mert a függetlenség szimmetrikus reláció.

Azonnal látható, hogy a fenti egyenletrendszer ekvivalens az

egyenletrendszerrel. A fenti definíció így is fogalmazható (lásd a 3.17. táblázatot): az E és D ismérvek akkor függetlenek egymástól, ha a perem
megoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő a megfelelő együttes viszonyszámokkal.

A 3.18. táblázat alapján könnyen ellenőrizhetjük, hogy a tanulók iskolatípus szerinti és település szerinti megoszlása nem független, mert pl.

3.4.2. Az asszociáció szorosságának mérése


A sztochasztikus kapcsolat – mint már tudjuk – átmenetet képez a kapcsolat teljes hiánya (a függetlenség) és a függvényszerű kapcsolat között.
Vizsgálni kell, hogy egy összefüggés mennyire áll közel a függetlenséghez, illetve mennyire közelíti a függvényszerű kapcsolatot. A két szélsőséges
kapcsolathoz való viszonya alapján a sztochasztikus kapcsolatot annál szorosabbnak (erősebbnek) tekintjük, minél jobban közelít a függvényszerű
kapcsolathoz, és annál lazábbnak (gyengébbnek), minél közelebb áll a függetlenséghez.

Az asszociáció szorosságának mérésére többféle mutatószámot szerkesztettek, ezeket asszociációs együtthatóknak nevezzük.

A következőkben a Yule-féle, a Csuprov-féle és a Cramer-féle asszociációs együtthatókat mutatjuk be.

A Yule-féle asszociációs együttható

Olyan esetekben, amikor mindkét ismérv alternatív (két változata van), gyakran alkalmaznak az asszociáció kimutatására koordinációs
viszonyszámokat. A koordinációs viszonyszámok két részsokaság nagyságának egymáshoz viszonyított arányát mutatják. Kombinatív osztályozás
esetén, a kontingenciatáblából kiindulva azonos tartalmú rész- és összetett koordinációs viszonyszámokat képezhetünk (3.21. táblázat).

3.21. táblázat - Kontingenciatáblázat alternatív ismérvek esetén


D

141
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Ha E és D függetlenek, azaz

akkor

Úgy is mondhatjuk, hogy a főátlóban lévő együttes gyakoriságok szorzata egyenlő a mellékátlóban lévő együttes gyakoriságok szorzatával:

Ha ez nem teljesül, vagyis

akkor E és D között sztochasztikus kapcsolat van.

Ha e szorzatok különbségét elosztjuk ugyanezen szorzatok összegével, akkor a Yule-féle asszociációs együtthatóhoz (jele: Y) jutunk:

Általánosságban megállapíthatók a következők:

– a két ismérv függetlensége esetén Y = 0,

142
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

– függvényszerű kapcsolat esetén

– sztochasztikus kapcsolat esetén

Ha az együttható abszolút értéke 0-hoz áll közel, akkor laza kapcsolatról, ha pedig 1-hez áll közel, akkor szoros sztochasztikus kapcsolatról
beszélhetünk.

Hiányossága a mérőszámnak, hogy abszolút értéke akkor is lehet 1, ha a kapcsolat nem függvényszerű. Könnyen belátható, ha a
kontingenciatáblában található egy 0 gyakoriság, akkor az együttható abszolút értéke 1 lesz, annak ellenére, hogy ebben az esetben nem
egyértelműen határozható meg az egyik ismérv szerinti hovatartozás alapján a másik ismérv szerinti hovatartozás.

Az együttható képlete alapján belátható,

ha

ha

Tehát pozitív Y érték akkor adódik, ha az azonos indexszel jelzett gyakoriságok a nagyobbak (ezek adnak nagyobb szorzatot), más szóval, ha az
egyik ismérv 1-es jelű változata a másik ismérvnek ugyancsak 1-gyel jelzett változatát „vonzza”, ugyanígy vonzzák egymást a 0-ás jelű változatok
is, míg az egyik ismérvnél 1-gyel, a másik ismérvnél 0-val jelölt változatok „taszítják” egymást. Fordított esetben negatív értéket kapunk.

Nominális mérési szintű változók esetén általában önkényesen döntjük el, hogy melyik ismérvváltozatot tesszük az első helyre, ez a döntés az
együttható abszolút értékét nem befolyásolja, csak az előjelet. Az előjelnek ilyenkor nem tulajdonítunk különösebb jelentőséget.

Ordinális skálán mérhető változók esetén (lásd később) az előjelnek már lesz értelme, jelentősége.

Nézzünk egy példát!

3.22. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)
Ezer fő
Gazdaságilag Gazdaságilag
Megnevezés Összesen
aktív nem aktív
Férfiak 2583,5 2359,9 4 943,4

Nők 2431,5 2935,3 5 366,8


Összesen 5015,0 5295,2 10 310,2

143
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A 3.22. táblázat alapján a nem és a gazdasági aktivitás nem független ismérvek (pl. ). Ugyanakkor nem függvényszerű a kapcsolat,
hiszen ha választunk egy egyedet és tudjuk, hogy férfi (E első ismérvváltozata), mégsem tudjuk megmondani, hogy gazdaságilag aktív vagy nem.

Csupán azt tudjuk, hogy annak a valószínűsége, hogy gazdaságilag aktív, és annak a valószínűsége, hogy gazdaságilag nem aktív,

Így a kapcsolat közöttük sztochasztikus.

Vizsgáljuk meg a 3.22. táblázat adatai alapján a nem és a gazdasági aktivitás ismérve közötti asszociációs kapcsolat szorosságát a Yule-féle
együtthatóval:

A mérőszám a két ismérv között laza kapcsolatot jelez.

Nézzük meg, hogy hogyan alakul az együttható értéke, ha a 3.22. táblázat sorait megcseréljük, vagyis az új táblázatban a nők adatait írjuk az első
sorba, a férfiakét a második sorba (3.23. táblázat).

3.23. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)
Ezer fő
Gazdaságilag Gazdaságilag
Megnevezés Összesen
aktív nem aktív
Nők 2431,5 2935,3 5 366,8

Férfiak 2583,5 2359,9 4 943,4


Összesen 5015,0 5295,2 10 310,2

A Yule-féle asszociációs együttható a 3.23. táblázatból:

A kapcsolat szorosságára ugyanakkora abszolút értékű számot kaptunk, mint korábban, csak negatív előjellel.

A Csuprov-féle és a Cramer-féle asszociációs együttható

144
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A Yule-féle asszociációs együttható – mint az a számítás módjából egyértelműen látszik – csak alternatív ismérvek szorosságának mérésére
alkalmas. Ha a két ismérv valamelyikének kettőnél több változata van, az eredeti adatokból nem számítható. Ilyen esetben is hasznosíthatjuk ugyan,
de mérsékelt hatásfokkal, ha a nem alternatív ismérvet csoportok összevonásával alternatívvá alakítjuk.

Amennyiben az ismérvek nem alternatívak, az ismérvváltozatok összevonása helyett célszerűbb olyan mutatószámot választani az asszociáció
szorosságának mérésére, amely ebben az esetben is alkalmazható. Ilyenek – többek között – a Csuprov-féle és a Cramer-féle asszociációs
együtthatók.

A Csuprov-féle és a Cramer-féle asszociációs együtthatók alapgondolata a függetlenség feltételezésével számított gyakoriságokhoz ( ) kapcsolódik.

Mint láttuk, az ismérvek függetlenségének feltétele az

(lásd a 3.15. táblázatot) egyenletek teljesülése.

Ez azt jelenti, hogy bevezetve az

jelölést, az E és D ismérvek akkor függetlenek, ha

minden esetben. Ha nem egyenlők, akkor nincs függetlenség, és azt gondolhatjuk, hogy a függetlenség feltételezésével számított
értékek minél jobban eltérnek a tényleges értékektől, annál „messzebb” vagyunk a függetlenségtől, vagyis annál szorosabb a kapcsolat.

Például a 3.16. táblázat alapján meghatározhatjuk a függetlenség feltételezésével számított gyakoriságokat. Ezeket tartalmazza a 3.24. táblázat.

A 3.16. táblázat alapján a budapesti szakmunkástanulók száma függetlenség esetén:

A két ismérv függetlensége esetén a 28 ezer (lásd 3.16. táblázat), budapesti lakosú, szakmunkásképzőbe járó tanulóval szemben jóval több tanuló
tartozna ebbe a csoportba.

145
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

3.24. táblázat - A függetlenség feltételezésével számított gyakoriságok ( )


Ezer fő
Egyetemi,
Szakmunkás-Szakiskolai Középiskolai főiskolai
Megnevezés Összesen
tanuló tanuló tanuló
hallgató
Budapest 42,52 9,71 58,50 17,27 128,00

Vidéki város 91,36 20,87 125,67 37,10 275,00

Községek 63,12 14,42 86,83 25,63 190,00


Összesen 197,00 45,00 271,00 80,00 593,00

A 3.16. és 3.24. táblázat adatait összehasonlítva is megállapíthatjuk, hogy sztochasztikus kapcsolat van a két ismérv között, mert a tényleges
gyakoriságok eltérnek a függetlenség feltételezésével számított gyakoriságoktól. Ha nem lenne kapcsolat a két ismérv között, akkor a tényleges ( )
és a függetlenség feltételezésével számított ( ) gyakoriságok rendre megegyeznének.

4
Az (tényleges) és (feltételezett) gyakoriságok eltérésének mérésére szolgáló nevezetes mennyiség a (Khi négyzet)

amely az eltérések négyzetének relatív nagyságát juttatja kifejezésre. Érvényes rá a következő egyenlőtlenség:

és

A a 0 értéket akkor veszi fel, ha a vizsgált két ismérv független egymástól, azaz ha i és j minden értékére teljesül az egyenlőség.

4
A szerepe a matematikai statisztikában igen széles körű. Az asszociációvizsgálat csupán egyik alkalmazási területe. A legjellegzetesebb alkalmazásával a Tankönyv II. kötetében, a Hipotézisek
ellenőrzése című fejezetben foglalkozunk.

146
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Függvényszerű kapcsolat esetén (ekkor s = t). Más szóval a ezt a maximális értékét akkor éri el, ha a kontingenciatábla minden sorában
csak egy 0-tól különböző gyakoriság található, és e gyakoriságok mind különböző oszlopba tartoznak.

Térjünk vissza bemutató példánkhoz. Az alapadatokat és a számításokat a 3.25. táblázat tartalmazza.

A mérőszám ismeretében képezhető a Csuprov-féle asszociációs együttható (jele: T):

A Csuprov-féle asszociációs együttható értéke 0 és 1 között van. A 0 értéket akkor veszi fel, ha a két ismérv független egymástól. Függetlenség
esetén ugyanis a = 0 (és fordítva, ha = 0, akkor a két ismérv független egymástól). A T = 1 értéket csak az s = t esetben érheti el (csak ilyenkor
képzelhető el az, hogy az egyik ismérv szerinti hovatartozás kölcsönösen egyértelműen meghatározza a másik ismérv szerinti hovatartozást), az
esetekben T < 1. Az esetekben a T által elérhető maximális érték:

3.25. táblázat - A számítása

Megnevezés

28 42,52 –14,52 210,83 4,96

12 9,71 2,29 5,24 0,54


Budapest
66 58,50 7,50 56,25 0,96

22 17,27 4,73 22,37 1,30


85 91,36 –6,36 40,45 0,44

Vidéki 20 20,87 –0,87 0,76 0,04

város 128 125,67 2,33 5,43 0,04

42 37,10 4,90 24,01 0,65

147
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

84 63,12 20,88 435,97 6,91

13 14,42 –1,42 2,02 0,14


Község
77 86,83 –9,83 96,63 1,11

16 25,63 –9,63 92,74 3,62


Összesen 593 593,00 0,00 –

A középfokú és felsőfokú tanintézetekben tanulók településforma szerinti hovatartozása és a tanintézetük típusa közötti kapcsolat szorosságát
jellemző Csuprov-féle asszociációs együttható:

Az asszociációs együttható alapján azt a megállapítást tehetjük, hogy a vizsgált ismérvek között laza kapcsolat van.

Az asszociációs összefüggések térbeli vagy időbeli összehasonlítására szolgál a Cramer-féleasszociációs együttható (jele: C). Ez a mutatószám
kétféleképpen számítható.

1. A értékét viszonyítjuk annak maximális értékéhez:

2. A Csuprov-féle asszociációs együttható korrekciójával a következőképpen:

A Cramer-féle együttható az ismérvváltozatok számától függetlenül mindig 0 és 1 között veszi fel értékét .

Amennyiben s = t, akkor T = C, tehát ha a két ismérv változatainak száma azonos, akkor a Csuprov-féle és a Cramer-féle asszociációs együttható
számszerű értéke megegyezik.

A Cramer-féle asszociációs együttható példánkban:

148
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

illetve a Csuprov-féle együttható értékének módosításával:

A Cramer-féle együttható is gyenge sztochasztikus kapcsolatot jelez.

3.4.3. A vegyes kapcsolat elemzése


Vegyes kapcsolatnak nevezzük a sztochasztikus kapcsolatnak azt a típusát, amelyben az ok (a független változó) szerepét minőségi (vagy
területi ismérv), az okozat (a függő változó) szerepét mennyiségi ismérv tölti be.

Egy minőségi és egy mennyiségi ismérvet tartalmazó vegyes kapcsolat elemzését a következőképpen rendezett adathalmazból kiindulva vizsgáljuk
(3.26. táblázat).

3.26. táblázat - A vegyes kapcsolat adatbázisa


A mennyiségi A minőségi ismérv változatai
ismérv megfigyelt
értékeinek sorszáma

ahol:

a minőségi ismérv j-edik változata (a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),

149
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

a mennyiségi ismérvnek a j-edik részsokaság i-edik eleménél felvett értéke ( ),

a j-edik részsokaság elemszáma (a j-edik részsokasághoz tartozó megfigyelt X értékek száma). Megjegyezzük, hogy az egyes részsokaságok
elemszáma (az egyes részsokaságokhoz tartozó megfigyelések száma) különböző lehet, vagyis pl. nem feltétlenül egyezik meg -mel
( ).

Például egy település ipari szervezeteit vizsgáljuk gazdálkodási forma (minőségi ismérv) és a foglalkoztatott létszám nagysága (mennyiségi ismérv)
szerint. A megfigyelt létszámadatokat gazdálkodási forma szerint rendezve írhatjuk fel (3.27. táblázat).

3.27. táblázat - Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai
(főben)
A megfigyelt Korlátolt
szervezet Vállalat felelősségű Részvénytársaság Szövetkezet
sorszáma társaság
1. 260 10 120 55

2. 290 11 280 70

3. 470 11 295 88

4. 600 12 570 97

5. – 12 800 143

6. – 13 1500 150

7. – 14 – 215

8. – 14 – 244

9. – 15 – 260

10. – 15 – 305

11. – 16 – –

12. – 17 – –

150
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

13. – 17 – –

14. – 18 – –

15. – 18 – –

16. – 18 – –

17. – 19 – –

18. – 19 – –

19. – 19 – –

20. – 20 – –

21. – 21 – –

22. – 22 – –

23. – 25 – –

24. – 26 – –

25. – 28 – –

26. – 29 – –

27. – 30 – –

28. – 35 – –

29. – 40 – –

30. – 45 – –

31. – 48 – –

32. – 50 – –

151
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

33. – 55 – –

34. – 58 – –

35. – 60 – –

36. – 65 – –

37. – 90 – –

38. – 150 – –

39. – 200 – –

40. – 302 – –

Mivel általában nagyszámú megfigyelést végzünk, az adatokat célszerű kombinációs (kontingencia-) táblába rendezni (3.28. táblázat).

3.28. táblázat - A kontingenciatábla sémája vegyes kapcsolat esetén

D minőségi

ismérv

X mennyiségi

ismérv

152
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

ahol:

a minőségi ismérv j-edik változata (illetve a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),

az X mennyiségi ismérv alapján képzett i-edik csoport (osztály) azonosítója. Ha X diszkrét, akkor jelentheti az ismérvértéket, de jelölhet
osztályközt is.

k: az X mennyiségi ismérv alapján képzett csoportok (osztályok) száma,

a sokaság azon elemeinek száma – gyakorisága –, amelyek a D minőségi ismérv szerint részsokaságba és ezzel egyidejűleg X mennyiségi
ismérv szerint a csoportba (osztályba) tartoznak ( ),

a sokaság azon elemeinek száma, amelyek az X ismérv szerint csoportba (osztályba) tartoznak ( ),

a sokaság azon elemeinek száma, amelyek a minőségi ismérv szerint a j-edik csoportba, részsokaságba tartoznak ( ), .

Például az ipari szervezeteket a megfigyelésekre támaszkodva csoportosíthatjuk – egyidejűleg – gazdálkodási forma és a létszám nagysága szerint,
a két ismérvet egymással kombinálva. A mennyiségi ismérv szerinti osztályozás különösebb mérlegelést igényel. Látjuk, hogy a legkisebb és
legnagyobb létszámadat között nagy a különbség, és a kis létszámú szervezetek adják a cégek zömét. Ezért egyenlőtlen hosszúságú osztályközöket
jelölünk ki. A kombinatív osztályozás eredményét a 3.29. táblázatban adjuk meg.

3.29. táblázat - Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és
létszám szerint
Gazdálko-
Korlátolt
Részvény-
dási forma Vállalat felelősségű Szövetkezet Összesen
társaság
társaság
Létszám (fő)
– 20 – 20 – – 20

21 – 50 – 12 – – 12

51 – 100 – 5 – 4 9

101 – 300 2 2 3 5 12

153
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

301 – 500 1 1 – 1 3

501 – 1000 1 – 2 – 3

1000 – – – 1 – 1
Összesen 4 40 6 10 60

A vegyes kapcsolat vizsgálatának első mozzanata szintén annak a vizsgálata, hogy van-e sztochasztikus kapcsolat a vizsgálatba bevont ismérvek
között. A feladat ebben az esetben úgy is megfogalmazható, hogy szerepet játszik-e a minőségi ismérv a mennyiségi ismérv szerinti eloszlásban?
Ez vizsgálható a kontingenciatáblából kiindulva a 3.4.1. pontban tárgyalt módszerekkel. Megjegyezzük, hogy ezen vizsgálatok eredményét
befolyásolhatja, hogy milyen módon választjuk az osztályközöket.

Mivel vegyes kapcsolat esetén az egyik vizsgálatba bevont ismérv mennyiségi ismérv, az összefüggés-vizsgálat során felhasználhatjuk az átlag-
– részátlag-, főátlag- – számítást, szórásszámítást, a szórásnégyzet-felbontás módszerét. Ezek segítségével számszerűsíthetjük a minőségi
ismérv alapján képzett részsokaságok mennyiségi ismérv szerinti különbözőségét, a minőségi ismérv szerepét a mennyiségi ismérv értékeinek
különbözőségében.

Rész- és főátlagok

A minőségi ismérv szerint csoportosított sokaságban az egyes részsokaságokra számított átlagot részátlagnak (jele: ), a fősokaságokra vonatkozó
átlagot pedig főátlagnak (jele: ) nevezzük.

A j-edik csoport részátlaga (a 3.26. táblázat alapján)

ahol :

a j-edik részsokaság értékösszege ( ),

[MA :#-#]

A főátlag

154
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Mivel a részátlagok és a főátlag között fennállnak az alábbi összefüggések:

Tehát a főátlag ( ) kiszámítható a részátlagok ( ) súlyozott átlagaként is:

– súlyozott számtani átlag formában, ahol a súly szerepét a részsokaságok elemszámai, az adatok töltik be,

– súlyozott harmonikus átlag formában, ahol súlyként a részsokaságok értékösszegadatai szerepelnek.

A főátlag súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási viszonyszámokkal.

A két ismérv függetlensége esetén (ha a minőségi ismérv szerinti hovatartozás semmiféle hatást nem gyakorol a mennyiségi ismérv nagyságára)
az egyenlőek (minden j-re megegyeznek). Ebből következően (minden j-re). Fontos: az állítás nem fordítható meg. A részátlagok
egyenlőségéből nem következik a függetlenség. Ha arra vagyunk kíváncsiak, hogy az ismérvek függetlenek-e, a 3.4.1. pontban tárgyalt módon

járhatunk el. Ha a 3.28. kontingenciatáblát vizsgáljuk, két ismérv függetlensége esetén a minőségi ismérv szerint képzett részsokaságokban az
relatív gyakoriságok i-t tetszőlegesen rögzítve minden j-re megegyeznek.

Függetlenség esetén tehát a minőségi ismérv szerint képzett részsokaságokban a relatív gyakorisági sorok azonosak. Az egyforma relatív gyakorisági
sorokból pedig a részátlagokra azonos becslések származnak.

A részátlagok és a főátlag számításával, ezek összehasonlításával képet kaphatunk az ismérvek közötti kapcsolatról. Amennyiben a részátlagok
jelentősen eltérnek egymástól és a főátlagtól, ez azt jelzi, hogy van kapcsolat az osztályozás alapját képező minőségi ismérv és mennyiségi ismérv
között.

A 3.27., illetve 3.29. táblázatból meghatározhatjuk a részátlagokat és a főátlagot, illetve azok becsült értékeit. Ha az eredeti adatokat nem ismerjük,
akkor a kontingenciatáblából csak az utóbbiak számíthatók. Ezeket az átlagokat a 3.30. táblázat tartalmazza.

155
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

3.30. táblázat - A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok


Összlétszám 3.29. táblázat
Átlagos
Szervezetek a 3.27. segítségével
száma táblázat létszám
Megnevezés alapján becsült
átlagos
létszám*
Vállalat
4 1620 405,0 387,5
Korlátolt felelősségű
40 1687 42,2 47,4
társaság
6 3565 594,2 558,3
Részvénytársaság
10 1627 162,7 170,0
Szövetkezet
Összesen 60 8499 141,7 141,6

*A számításnál az első osztályközépsőt 15-nek, az utolsót 1250-nek vettük.

Mivel a részátlagok egymástól és a főátlagtól is eltérnek (ez a helyzet a becsült értékeknél is), a két ismérv közötti kapcsolat megléte nyilvánvaló.

A vegyes kapcsolat szorosságának vizsgálata a szóródásszámítás segítségével történik. Ahhoz, hogy a mérőszámig eljuthassunk, meg kell
ismerkednünk néhány új fogalommal.

A rész- és fősokaságok szórása, szórásnégyzete

Amennyiben a sokaságot részsokaságokra bontva vizsgáljuk – a viszonyszámok és az átlagok számításához hasonlóan –, a fősokaságra és
a részsokaságokra vonatkozóan is számítunk szórást. A részsokaságokra vonatkozó szórást részszórásnak vagy részsokaságokon belüli
szórásnak, a fősokaságra vonatkozó szórást teljes szórásnak nevezzük. A közöttük lévő összefüggés kevésbé egyszerű, mint a részviszonyszámok
és az összetett viszonyszám vagy a részátlagok és a főátlag összefüggése. Az összefüggések bemutatásához nézzük a következőket!

Ha a sokaságot részekre bontva vizsgáljuk, akkor a szórásszámításra alkalmas, ún. átlagtól való eltérést háromféleképpen értelmezhetjük.

a) ( )

az ún. teljes eltérés, amely egy adott ismérvérték és a főátlag közötti eltérés.

156
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

b) ( )

az ún. belső eltérés, amely egy adott j-edik részsokasághoz tartozó ismérvérték és j-edik részátlag közötti eltérés.

c) ( )

az ún. külső eltérés, amely a j-edik részátlag és a főátlag eltérése.

Könnyen belátható, hogy a háromféle eltérés között az alábbi összefüggés áll fenn:

Egy 800 fős Rt. esetén pl.

A 658,3 fős eltérés ebben az esetben azzal magyarázható, hogy a kiválasztott Rt. létszáma saját csoportján belül mintegy 206 fővel nagyobb, s az
Rt.-k létszámnagysága a szervezetek összességére jellemző átlagot is meghaladja.

A három eltérés közötti összefüggés alapján megállapíthatjuk, hogy adott érték főátlagtól való eltérését két tényező okozhatja:

– egyrészt a részsokaságokon belül különbözőek lehetnek az ismérvértékek, ezeket a különbségeket a eltérés fejezi ki,

– másrészt a részátlagok eltérhetnek egymástól, ingadozhatnak a főátlag körül. Ezt fejezi ki a eltérés, amelyben a csoportosító (minőségi) ismérv
hatása mutatkozik meg.

Mind a háromféle eltérés alapján számítható valamilyen szórás, illetve szórásnégyzet.

A teljes eltérések felhasználásával adódó

szórás a teljes szórás.

157
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A teljes szórás négyzete a teljes szórásnégyzet.

A belső eltérésekből kiindulva számíthatók az egyes részsokaságokra vonatkozó

részszórások, vagy részsokaságokon belüli szórások.

A részszórások négyzetének az egész sokaságra vonatkozó átlaga a belső szórásnégyzet , tehát a belső szórás:

Ha az ( ) eltérésnégyzetek egész sokaságra vonatkozó átlagát vesszük, akkor a külső szórásnégyzetet kapjuk, és ennek
négyzetgyöke a külső szórás:

A háromféle szórásnégyzet között a

összefüggés áll fenn.

Ennek igazolására (a definíciókat felhasználva) elegendő a megismert szórásnégyzetek számlálói – az ún. eltérés-
négyzetösszegek – közötti összefüggés bizonyítása.

158
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Mivel

valamint minden j-re, ezért írhatjuk, hogy

Az eltérés-négyzetösszegeket a következőképpen is szokás jelölni:

teljes eltérés-négyzetösszeg: SS,

belső eltérés-négyzetösszeg:

külső eltérés-négyzetösszeg:

Az eltérés-négyzetösszegekre vonatkozó azonosság a következő formában is felírható:

A háromféle eltérés-négyzetösszeg, illetve szórásnégyzet összegszerű összefüggése természetesen arra is felhasználható, hogy kettő ismeretében
kiszámítsuk az ismeretlen harmadikat.

Az elmondottak alapján megfogalmazható az is, hogy a fősokaságra vonatkozó teljes szórás kétféleképpen számítható ki:

– az egyes ismérvértékek főátlagtól való eltérései alapján

159
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

– a háromféle szórásnégyzet összefüggése alapján

Ezek után nézzük a példánkat. A 3.27. és 3.30. táblázat alapján meghatározhatók a fenti paraméterek, értékeiket a 3.31. táblázat tartalmazza (a
tényleges és nem a becsült értékekkel számoltunk). A teljesség kedvéért a 3.30. táblázat néhány adatát is feltüntettük.

3.31. táblázat - A vizsgált ipari szervezetekre vonatkozó adatok

Szervezetek Összlét- Átlagos Eltérés-négy- Szórás


szám létszám
száma % zetösszeg (fő)
(fő) (fő)
Megnevezés

Vállalat 4 6,67 1620 405,0 76 500 138,3


Korlátolt
fele-lősségű 40 66,67 1687 42,2 124 204 55,7
társaság
Részvény-
6 10,00 3565 594,2 1 276 521 461,3
társaság
Szövetkezet 10 16,66 1627 162,7 69 700 83,5
Összesen 1 546 925
60 100,00 8499 141,7 = 239,9 =
=

A táblázat adatait a következőképpen kaptuk:

Az eltérés-négyzetösszeg – a fejrovatban kijelölt képlet szerint – például a vállalatoknál a következő (lásd a 3.27. táblázatot is):

160
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A szórás a vállalatoknál:

A teljes szórás:

Az egyes ipari szervezetek létszáma tehát átlagosan mintegy 240 fővel tér el – a négyzetes eltérések alapján számolva – a 60 szervezetre jellemző
141,7 fős átlagtól.

A továbbiakban meghatározzuk a 3.31. táblázat alapján a háromféle eltérés-négyzetösszeget, és bemutatjuk azok összefüggését.

A teljes eltérés-négyzetösszeget (SS) a megfigyelt ipari szervezetek számával osztva kapjuk a teljes szórásnégyzetet:

amely a teljes eltérés-négyzetösszeghez hasonlóan bomlik összetevőkre.

Az összes ipari szervezetre vonatkozó belső eltérés-négyzetösszeg ( ) alapján a belső szórásnégyzet:

161
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A külső eltérés-négyzetösszegből ( ) kiindulva a külső szórásnégyzet:

A teljes szórásnégyzet tehát:

A teljes szórás az összetevők alapján:

Számítsuk ki a 60 megfigyelt ipari szervezet létszámának belső és külső szórását is.

A belső szórás

az előzőekben már bemutatott összefüggés alapján kiszámítható a különböző típusú gazdasági szervezetek létszámának szóródását jellemző
szórások súlyozott négyzetes átlagaként is:

a súly szerepét betöltő részsokasági elemszámadatok helyettesíthetők azok megoszlási viszonyszámaival, így

A belső szórás megmutatja, hogy az egyes ipari szervezetek – mind a 60 ipari szervezetet figyelembe véve – létszáma átlagosan 160,6 fővel tér el
a „saját” gazdálkodási formáját jellemző átlagos létszámtól. (A négyzetes eltérések alapján számolva.)

162
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A külső szórás

A külső szórás megmutatja, hogy a megfigyelt vállalatok, kft.-k, részvénytársaságok, szövetkezetek átlagos létszáma az együttes átlagos létszámuktól
átlagosan 178,2 fővel tér el. (A négyzetes eltérések alapján számolva.)

A vegyes kapcsolat szorosságának mérése

Visszatérve a szórásnégyzetek összefüggésére, a teljes szórásnégyzet összetevői alapján az ismérvek sztochasztikus kapcsolatára a következőket
állapíthatjuk meg.

a) Ha az -k egyenlőek (minden j-re), vagyis az egyes részátlagok megegyeznek egymással és ebből következően a főátlaggal, akkor a két
ismérv között nincs kapcsolat. De ez nem jelenti azt, hogy a két ismérv független. Könnyű olyan példát mondani, amelyben a részátlagok egyenlőek és
a függetlenség 3.4.1.-ben megfogalmazott feltétele nem teljesül. Tehát a függetlenségből következik, hogy az E mennyiségi ismérv és a D minőségi
ismérv között nincs kapcsolat, de fordítva nem.

b) Ha ( ), vagyis a részsokaságokon belül nincs szóródás ( ), akkor Ebben az esetben az ismérvértékek


szóródása teljes egészében a csoportosítás alapját képező minőségi ismérv következménye. A két ismérv között olyan függvényszerű kapcsolat van,
hogy a minőségi ismérv a független változó. Ugyanis ekkor minden D szerinti részsokaságban egyetlen E ismérvváltozat gyakorisága különbözik
nullától. És fordítva, ha a két ismérv között ilyen függvényszerű kapcsolat van, azaz a minőségi ismérv egyértelműen meghatározza a mennyiségi
ismérv nagyságát, akkor:

c) Ha , akkor sztochasztikus kapcsolat van a két ismérv között.

A részekre bontott sokaságból képezhető háromféle szórásnégyzet – a teljes szórásnégyzet és összetevői – alapján következtethetünk a vizsgálatba
bevont két ismérv kapcsolatára, illetve arra, hogy hatást gyakorol-e az osztályozás alapját képező minőségi ismérv a sokaság egységeinek
mennyiségi ismérv szerinti hovatartozására.

Ismert a háromféle szórásnégyzet összefüggése:

163
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Ismert az is, hogy a külső szórásnégyzet ( ) a részátlagoknak a főátlagtól való eltérései alapján számított szórásnégyzet, ami éppen az osztályozás
alapját képező minőségi ismérv hatásának tulajdonítható rész a teljes szórásnégyzeten belül.

A belső szórásnégyzet ( ) az egyéb, nem vizsgált tényezők együttes hatása.

Ezért a vegyes kapcsolat szorosságának vizsgálatakor kiemelt szerepe van a

ún. szórásnégyzet-hányadosnak, amely a mennyiségi ismérv szórásnégyzetének a minőségi ismérv által megmagyarázott hányada.

A szórásnégyzet-hányados kiszámítható a következő formában is:

A , illetve összefüggés következtében belátható, hogy a megismert hányados a intervallumban vehet fel értéket:

Ha , akkor azt mondjuk, hogy a két ismérv között nincs kapcsolat. A eset akkor fordulhat elő, ha a részátlagok mind egyformák, és
ezért

Ha , ez a két ismérv függvényszerű kapcsolatára utal. eset akkor következhet be, ha a részsokaságokban az X értékek nem szóródnak
( ). A minőségi ismérv szerinti hovatartozás egyértelműen meghatározza a mennyiségi ismérvet, a sokaság elemeinek mennyiségi ismérv
szerinti hovatartozását.

Ha , a két ismérv között sztochasztikus kapcsolat van.

A szórásnégyzet-hányadost megoszlási viszonyszám jellege miatt százalékos formában szokás kifejezni.

A vegyes kapcsolat szorosságának mérőszámaként a szórásnégyzet-hányados négyzetgyökét, a szóráshányadost (jele: H) használjuk.

A szóráshányados – a szórásnégyzet-hányadossal ellentétben – nem értelmezhető megoszlási viszonyszámként, ezért nem fejezhető ki %-os
formában.

164
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Az ipari szervezetek gazdálkodási formája és a foglalkoztatott létszám közötti kapcsolatot vizsgálva, a korábbiakban kiszámított adatok alapján

A gazdálkodási forma 55,2%-ban magyarázza meg a létszám szóródását (ingadozását). A fennmaradó 44,8% egyéb nem vizsgált (ebben az
összefüggésben véletlenként kezelt) tényezők hatása. A szóráshányados

meglehetősen szoros kapcsolatot jelez a gazdálkodási forma és a létszám nagysága között.

3.4.4. A korreláció elemzése csoportosított adatokból kiindulva


Ha mindkét vizsgálatba bevont ismérv mennyiségi ismérv, akkor bizonyos egyszerűbb elemzési eszközök alkalmazásánál ugyancsak kiindulópontot
jelenthet a kombinációs (kontingencia-) tábla.

Azt a statisztikai táblát, amely a sokaság egységeinek mennyiségi ismérvek szerinti kombinatív osztályozását tartalmazza, korrelációs táblának
nevezzük (3.32. táblázat).

3.32. táblázat - A korrelációs tábla sémája


Y

A táblázatban X az ok szerepét játszó mennyiségi ismérvet (független változót, tényezőváltozót), Y az okozat szerepét betöltő mennyiségi ismérvet
(függő változót, eredményváltozót) jelenti, amennyiben ilyenek egyáltalán megkülönböztethetők. Ha két ismérv kölcsönhatásban áll egymással, nincs
jelentősége annak, hogy a vizsgált ismérvek közül melyiket jelöljük X-szel, illetve Y-nal.

165
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

az X ismérv alapján képzett i-edik osztály azonosítója, jelenthet ismérvértéket, de jelölhet osztályközt is.

az Y ismérv alapján képzett j-edik osztály azonosítója, jelenthet ismérvértéket, illetve osztályközt.

Az együttes gyakoriságok, peremgyakoriságok jelentése és ezek összefüggései már ismertek.

Mindkét ismérv mennyiségi ismérv, de most is eljárhatunk úgy, hogy az egyik ismérvet (pl: X-et) csak osztályozásra, részsokaságok kialakítására
használjuk, a másikat (az Y-t) pedig átlag- és szórásszámítás segítségével vizsgáljuk, vagyis ugyanúgy járunk el, mint a vegyes kapcsolat
vizsgálatánál.

Tekintsük a következő példát (3.33. táblázat):

3.33. táblázat - Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma
szerint
Személyek

száma (fő) 1 2 3 4 5 6 7 Összesen

Szobák száma
1 1 2 1 1 – – – 5

2 1 2 10 7 1 1 – 22

3 – 1 2 7 2 4 1 17

4 – – – – 3 2 1 6
Összesen 2 5 13 15 6 7 2 50

A társasház lakásait egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint figyeltük meg. Már a táblázat adataiból is kitűnik,
hogy a kisebb szobaszámú lakásokban általában kevesebb személy lakik, a nagyobb szobaszámúakban pedig több.

Esetünkben, mivel mindkét jellemző tulajdonság mennyiségi ismérv, korrelációs kapcsolatról beszélünk. Attól függően, hogy az X ismérv nagyobb
(kisebb) értékeihez az Y ismérv nagyobb (kisebb) értékei tartoznak vagy éppen fordítva, kétféle korrelációról beszélhetünk.

Pozitív korreláció áll fenn két ismérv között, ha az X nagyobb értékeihez általában Y nagyobb értékei, illetve X kisebb értékeihez Y kisebb értékei
tartoznak. Fordított esetben negatív korrelációról beszélünk (X nagyobb értékeihez általában Y kisebb értékei tartoznak, illetve fordítva).

166
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Ha a szobaszámot (X) csoportosító ismérvnek tekintjük és kiszámítjuk a különböző szobaszámú lakásokban élők átlagos számát akkor
tömörebben fejeződik ki a két ismérv sztochasztikus összefüggése.

Az X ismérv szerint képzett ( ) osztályok halmazán értelmezett függvényt, amely -hez az részátlagot rendeli, az Y változó X változóra
vonatkozó (X szerinti) tapasztalati regressziófüggvényének nevezzük.

Példánkban (3.34. táblázat):

3.34. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati
regressziófüggvénye
Szobaszám Átlagos lakószám (fő)

1 2,40

2 3,36

3 4,53

4 5,67

Az egyszobás lakásokban élő személyek átlagos száma például:

A tapasztalati regressziófüggvény a két ismérv közötti kapcsolatra vonatkozó – a jelenlegi elemzési helyzetben a korrelációs táblába foglalt –
információt egyetlen statisztikai sorba ( -hez rendelt részátlagok sorozata) sűríti. Egyértelműen láthatóvá vált, hogy a két ismérv között van
korreláció, mégpedig pozitív irányú korreláció. (A szobaszámok nagyobb értékeihez az átlagos lakószám növekvő értékei tartoznak.)

A tapasztalati regressziófüggvény nemcsak a korreláció létezésének kimutatására alkalmas, hanem a kapcsolat lényegét, természetét is tömören
kifejezi. Grafikusan is ábrázolható a pontokat összekötő vonaldiagram formájában, ahol vagy az ismérvérték, vagy az X
szerint képzett i-edik osztályköz osztályközepe. A pontokat összekötő szakaszoknak mint függvényértékeknek ugyan nincs statisztikai
jelentése, ennek ellenére a statisztikai gyakorlatban e pontokat összekötjük. Így alkothatunk szemléletesebb képet a két mennyiségi ismérv közötti
sztochasztikus kapcsolat jellegéről, tendenciájáról.

167
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A tapasztalati regressziófüggvényt célszerű az egyedi értékadatok alapján (a két mennyiségi ismérvnek a sokaság egyes egységeit jellemző,
összetartozó értékpárjai alapján) készített pontdiagrammal közös koordináta-rendszerben ábrázolni. A vonaldiagram és a ponthalmaz kölcsönös
helyzete tájékoztat a korrelációs kapcsolat szorosságáról is.

Példánkban 50 lakást figyeltünk meg egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint. Minden lakást jellemez egy
szobaszám- és egy lakószám- adat. Az összetartozó értékeket derékszögű koordináta-rendszerben egy-egy pontként ábrázolva
készítjük el a korrelációt szemléltető pontdiagramot és ugyanebben a koordináta-rendszerben ábrázoljuk a tapasztalati regressziófüggvényt (3.6.
ábra).

3.6. ábra - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat

A korreláció szorosságának mérése

A csoportosított adatokból kiinduló korrelációelemzés során a kapcsolat szorosságának mérése a vegyes kapcsolat szorosságának mérésével analóg
módon történik. Ha az osztályozást X ismérv szerint végezzük, úgy az Y értékekre vonatkozó részátlagokhoz ( ) és főátlaghoz ( ) háromféle
szórásnégyzet kapcsolódik. Az Y belső szórásnégyzete az Y külső szórásnégyzete az Y teljes szórásnégyzete (Az Y arra utal, hogy
a függő változó (Y) szórásnégyzetéről van szó.) Közöttük a

168
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

összefüggés áll fenn.

A szórásnégyzet-hányadoshoz hasonlóan képezhetjük a ún. determinációs hányadost. Megkülönböztetésül, a indexében első


helyen a „szóródó”, a második helyen a csoportosító ismérvet tüntettük fel.

A determinációs hányados azt mutatja meg, hogy az X ismérv mekkora hányadát magyarázza meg az Y ismérv szórásnégyzetének. Szokás %-
os formában is kifejezni.

A korreláció szorosságának mérésére használhatjuk a determinációs hányados négyzetgyökét, a

A korrelációs hányados a szórásnégyzet-hányadoshoz hasonlóan a közötti intervallumban vehet fel értéket.

Függvényszerű kapcsolat esetén :

A korreláció hiánya esetén:

Korreláció esetén:

Ha az oksági kapcsolat nem egyirányú, akkor logikailag indokolt lehet, hogy az X ismérvnek az Y ismérv szerinti szorossági mérőszámait számítsuk
ki, vagyis a

Ebben az esetben az X a „szóródó” ismérv, az Y pedig a csoportosító ismérv szerepét tölti be.

Ha az X és az Y közötti kapcsolat sztochasztikus, akkor általában a kétféle megközelítésből számított mutatószámok nem egyeznek meg:

169
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Ha az ismérvek (változók) függetlenek, akkor Ez azt is jelenti, hogy a tapasztalati regressziós függvény állandó. Fordítva nem igaz:
abból, hogy (ekkor is nulla), nem következik a függetlenség.

Ha akkor azt mondjuk, hogy az ismérvek (változók) korrelálatlanok. A korrelálatlanság is szimmetrikus reláció.

Függvényszerű kapcsolat esetén, mint az előző pontban is láttuk,

Vizsgáljuk meg a lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat szorosságát. A kapcsolat szorosságának jellemzésére
kiszámítjuk a determinációs hányadost és a korrelációs hányadost. E mutatószámok meghatározásához szükség van a Y ismérv
főátlagára, a megfigyelt lakásokban élő személyek átlagos számára ( ), a külső szórásnégyzetre, a teljes szórásnégyzetre.

Egy lakás lakóinak átlagos száma (a főátlag):

(Természetesen az kiszámítható az részátlagok súlyozott átlagaként is.)

A külső szórásnégyzet:

Az előző lépésben kiszámított főátlag, valamint a 3.34. táblázatban közölt részátlagok alapján:

A teljes szórásnégyzet:

170
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A 3.33. táblázat adatai és a kiszámított főátlag alapján:

A determinációs hányados:

kifejezhető százalékos formában: = 42,0%.

Ez úgy értelmezhető, hogy a lakásokban levő szobák száma 42%-ban magyarázza meg a lakásokban élő személyek számának szóródását. (A
fennmaradó 58% a szobaszámon kívüli, egyéb, most nem vizsgált tényezők hatása.)

A korrelációs hányados

A szorossági mérőszám alapján megállapítható, hogy a szobák száma és a lakásokban élő személyek száma között közepes erősségű
sztochasztikus kapcsolat van.

A következőkben – a részletes számítás mellőzésével – felírjuk az ismérvek (a változók) felcserélésével értelmezett – X-nek Y-ra vonatkozó –
tapasztalati regressziófüggvényét (3.35. táblázat) és az ehhez rendelhető determinációs hányadost és korrelációs hányadost.

3.35. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati
regressziófüggvénye
Lakószám (fő)
Átlagos szobaszám

171
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

1 1,50

2 1,80

3 2,08

4 2,40

5 3,33

6 3,14

7 3,50

Az X-nek Y-ra vonatkozó tapasztalati regressziófüggvénye is jelzi, hogy pozitív irányú kapcsolat van az ismérvek között. A

pedig közepes erősségű kapcsolatra utalnak.

A számítások ellenőrzését az olvasóra bízzuk.

3.5. Gyakorlófeladatok
1. Szerkesszünk olyan statisztikai táblát (adatok nélkül), amely tartalmazza a Magyarországon bejegyzett fuvarozócégek 1994. I. és II. félévi
teljesítményeit (félévenként, külön-külön) a szállítás módja (közúti, vasúti, légi és egyéb) és cégforma (vállalat, gazdasági társaság, magánfuvarozó)
szerint!

Elemezzük a megszerkesztett táblát! Állapítsuk meg típusát, dimenziószámát, sorait!

2. Szerkesszünk (adatok nélkül) olyan statisztikai táblát, amely a fogyasztói árak alakulását mutatja 1985-höz viszonyítva napjainkig kiadási
főcsoportok (élelmiszerek, élvezeti cikkek, ... egyéb iparcikkek és szolgáltatások) szerint!

3. A népességgel kapcsolatos adatok Magyarországon:

Megnevezés 1990 1993 1990=100%

172
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Népesség (ezer fő)* 10 375 10 310 99,37

Nők száma (ezer fő)* 5 390 5 367 99,57

Élveszületések száma (fő) 125 679 111 033 88,35

*Január 1-jei adatok.

Feladat:

a) Állapítsuk meg a tábla típusát és dimenziószámát!

b) Elemezzük a népesség nemek szerinti összetételét és a dinamikai változást!

c) Számítsuk ki az ezer férfira jutó nők számát! Vizsgáljuk a változást!

d) Számítsunk nyers és tisztított születési arányszámokat! Elemezzük a változást!

4. Két megyében az orvosok és a lakosok számára, valamint az orvosellátottság mutatószámaira vonatkozóan az alábbi adatokat ismerjük:

Adatok: főben
Tízezer
Egy orvosra
Orvosok Lakosok lakosra jutó
Megye jutó lakosok
száma száma orvosok
száma
száma
A 640 ... 312,5 ...

B ... 400 000 ... 35

Feladat:

a) Számítsuk ki a hiányzó adatokat és mutatószámokat!

b) Vonjunk le következtetéseket!

5. Néhány ország jellemző adata 1992-ben:

Megnevezés Magyarország Ausztria Spanyolország

173
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Évközepi népesség (millió fő)


2
Terület (1000 km ) 10,31 7,88 39,08

A főváros népessége (1000 fő) 93,0 83,9 504,8

A születéskor várható átlagos élettartam (év) 2016 1505 3108

a férfiaknál 64,6 72,6 73,1

a nőknél 73,7 79,2 79,6

Aktív keresők (1000 fő) 4242 3536 150073

100 aktív keresőre jutó eltartott és inaktív 143 ... ...

kereső 663 193 2260

A munkanélküliek száma (1000 fő) –4,5 1,5 1,0

A GDP változása (1992/91, %)

Feladat:

a) Elemezzük a tábla adatait a megadott és a még kiszámítható viszonyszámok alapján!

b) Végezzünk területi összehasonlítást!

6. A környezeti feltételeket jellemző néhány adat 1992-ben:


2
Adatok:1000 m
Megnevezés Debrecen Pécs
Erdő 346 8260,0

Park 2935 3210,0


Összes zöldterület 3281 11 470,0
15,1 67,0
Egy lakosra jutó zöldterület
200 255,0

174
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

A játszóterek területe

Feladat:

Hasonlítsuk össze a két várost a környezeti feltételek szempontjából!

7. Magyarország népességére és a villamosenergia-termelés alakulására vonatkozóan az alábbi adatokat ismerjük:

Villamosenergia-termelés
Népesség száma az
Év
év elején (ezer fő) 1988=100%
1988 10 464 100,0

1989 10 421 101,4

1990 10 375 97,2

1991 10 355 102,6

1992 10 337 107,0

1993 10 310 111,8

A széntermelés 1988-ban 20 875 ezer tonna volt, ami 1993-ra 60,3%-ra csökkent.

Feladat:

a) Hogyan alakult évről évre az 1 főre jutó villamosenergia-termelés?

b) Mennyi volt 1993-ban az 1 főre jutó széntermelés?

c) Évente átlagosan hány %-kal változott (nőtt, csökkent)

– az 1 főre jutó villamosenergia-termelés,

– az 1 főre jutó széntermelés?

d) A kiszámított változási tendenciát feltételezve mennyi a várható termelés ezen ipari termékekből 1996-ban? (1993-ban 32 630 millió kWh villamos
energiát állítottak elő.)

175
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

8. A népesség megoszlása gazdasági aktivitás szerint január 1-jén:

Népességcsoportok 1990 1991 1992


Munkavállalási kornál fiatalabb 2 130,5 2 063,7 2 009,8

Munkavállalási korú 5 956,8 5 997,4 6 031,4

Nyugdíjas korú 2 287,5 2 293,7 2 296,0


Összesen 10 374,8 10 354,8 10 337,2

Feladat:

a) Nevezzük meg a tábla típusát és sorait!

b) Számítsuk ki, hogyan változott a munkavállalási korú népesség 1990-hez képest, illetve évről évre!

c) Számítsunk megoszlási viszonyszámokat 1990-ben és 1992-ben! Hasonlítsuk össze a két időszakot!

d) Számítsuk ki, hogy hány %-kal változott a népesség az egyes csoportokban és együttesen!

e) Hasonlítsuk össze a szerkezet- és dinamikai változást!

9. A gazdaságilag aktív népesség adatai Magyarországon:

1993-
Csoportok 1990. január 1. 1993. január 1. as év az
1990. év
Ezer fő % Ezer fő % %-ában
Aktív keresők
4795,2 87,2 3866,9 ... ...
GYES-en, GYED-en lévők
244,7 4,5 262,1 ... ...
Foglalkoztatott
432,0 7,9 223,0 ... ...
nyugdíjasok
Foglalkoztatottak együtt 5471,9 99,6 4352,0 ... ...
Munkanélküliek 24,2 0,4 663,0 ... ...
Összesen 5496,1 100,0 5015,0 100,0 91,25

176
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Feladat:

Számítsuk ki a hiányzó adatokat, és vonjuk le következtetéseket a szerkezet- és dinamikai változásra vonatkozóan!

10. Vállalkozásokat vizsgálunk jövedelmezőségük alapján két egymást követő évben. Az eredményeket az alábbi tábla tartalmazza:

1994-ben
Alacsony Közepes Magas Összesen
1993-ban
Alacsony 100 80 – 180

Közepes 60 90 10 160

Magas – 30 30 60
Összesen 160 200 40 400

Feladat:

a) Töltsük ki a tábla adatait:

1. függvényszerű kapcsolat feltételezésével,

2. függetlenséget feltételezve!

b) Számítsuk ki a Csuprov- és a Cramer-féle együtthatót a tényleges helyzetnek megfelelően! Értelmezzük a kapott eredményt!

11. Valamely városban a kereskedelmi szálláshelyek vendégforgalmát a szállás típusa és a turisták lakhelye szerint vizsgáltuk. A megfigyelt adatok
1994-ben 1000 főben a következők voltak:

Szállás típusa Belföldi Külföldi Együtt


Szálloda 50 150 200

Turistaszállás 30 10 40

Kemping 60 120 180

Fizető-vendéglátás 160 220 380


Együtt 300 500 800

177
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Feladat:

a) Vizsgáljuk a sokaság megoszlását különböző módokon! Vonjunk le következtetéseket!

b) Számítsuk ki a két ismérv kapcsolatát jellemző szorossági mérőszámokat!

12. Főiskolai hallgatók lakáshelyzetét és havi kiadásuk nagyságát vizsgáltuk.

A szüleinél lakó 8 hallgató havi kiadásai Ft-ban:

1300; 1800; 2000; 2000; 2800; 3000; 3100 és 4000 Ft.

A kollégisták adatai:

2500; 3000; 3000; 3100; 3300; 3500; 3800; 4000; 4000; 4400 és 5000 Ft.

Az albérletben lakók havi kiadásai pedig:

4000; 4800; 5000; 5000 és 5200 Ft.

Feladat:

a) Számítsuk ki az átlagos havi kiadást a különböző lakáshelyzetű hallgatói csoportokban! Vonjunk le következtetéseket!

b) Vizsgáljuk a szóródást különböző módokon!

c) Számítsuk ki, hogy:

– a szóródás milyen mértékben magyarázható a lakáshelyzettel,

– milyen szoros kapcsolat van a lakáshelyzet és a havi kiadások nagysága között!

13. Egy tanulócsoport 15 hallgatójánál megvizsgáltuk, hogy van-e összefüggés a matematikafelvételin elért összpontszám és a felkészülés között.
(Járt-e előkészítő tanfolyamra vagy sem.) A vizsgálat eredményéből a következő számítási eredmények ismertek:

Csoport Létszám (fő) Átlagos pontszám Szórás


Előkészítős 15 26 2,61

Nem előkészítős 10 20 4,43


Összesen 15 ... ...

178
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése

Feladat:

a) Számítsuk ki a teljes szórásnégyzetet és a szórást!

b) Vizsgáljuk a felkészülés módja és a pontszám közötti kapcsolat szorosságát!

c) Írjuk le a jelentését!

14. Egy 25 pontos statisztika-zárthelyi eredményei:

Relatív
Feladatsor Hallgatók száma Átlagos pontszám
szórás (%)
A 11 17,00 16,47

B 8 16,25 31,63

C 6 18,30 18,03
Összesen 25 ... ...

Feladat:

a) Számítsuk ki az összes

– belső eltérésnégyzetet,

– külső eltérésnégyzetet,

– teljes eltérésnégyzetet!

b) Határozzuk meg a belső, a külső és a teljes szórást!

c) Számítsuk ki, hogy a feladatsorok „nehézsége” és az elért pontszám között milyen szoros a kapcsolat!

d) A pontszámok ingadozását, szóródását hány %-ban befolyásolja az, hogy melyik feladatsort írta a hallgató?

179
4. fejezet - Összetett intenzitási viszonyszámok (főátlagok)
összehasonlítása
4.1. A standardizálás módszere
Ha valamilyen jelenség színvonalát (pl. termékek önköltségét, lakosok orvosellátottságát, munkavállalók átlagbérét stb.) akarjuk jellemezni, akkor
erre a célra a 3. fejezetben megismert intenzitási viszonyszámokat használhatjuk fel. Ha a sokaság a vizsgált színvonal szempontjából heterogén,
akkor a vizsgálatot a heterogenitást előidéző ismérv megfelelő homogén csoportjaira is el kell végezni. A sokaság egészére számított intenzitási
viszonyszámokat összetett intenzitási viszonyszámoknak neveztük és jelöltük, a csoportokra pedig intenzitási részviszonyszámokat számítottunk
és azokat jelöltük. Ha a vizsgált színvonalat átlaggal fejeztük ki, akkor a sokaság egészére főátlagot ( ), a homogén csoportokra pedig
részátlagokat ( ) számítottunk. Beláttuk, hogy az átlagos színvonalat kifejező mutatókat (összetett intenzitási viszonyszám, illetve főátlag) két
tényező befolyásolja:

1. milyen az egyes csoportokban a vizsgált színvonal nagysága,

2. milyen a sokaság szerkezete, összetétele.

Fejezetünkben azzal foglalkozunk, hogy hogyan történik az átlagos színvonal térbeli különbözőségének vagy időbeli változásának vizsgálata.
Látni fogjuk, hogy a heterogenitás figyelembevétele ebben az esetben még fontosabb. Előfordulhat ugyanis, hogy nemcsak a vizsgált színvonal
(önköltség, orvosellátottság, átlagbér) változik két időszak között, hanem a csoportosító ismérv szerinti összetétel is. (Pl. a különböző önköltséggel
dolgozó üzemek termelésének, eltérő ellátottságú települések lakosainak, különböző átlagkeresetű dolgozók létszámának aránya.) Így előfordulhat,
hogy minden csoportban csökken a részátlag (pl. az átlagbér), a főátlag (a sokaság egészére számított átlagbér) mégis nő. Ha térbeli összehasonlítást
végzünk (pl. két vállalkozást hasonlítunk össze), akkor az eltérésekre (különbségekre) irányítjuk figyelmünket.

Tekintsük a következő példát (4.1. táblázat). Két vállalkozásnál hasonlítjuk össze a dolgozók átlagos havi jövedelmét. A-nál 45 E Ft, B-nél 40 E Ft.
Ebből megállapíthatjuk, hogy B-nél 5 E Ft-tal kevesebb az átlagos jövedelem. E megállapítás fedi a valóságot, de hogy elemzésünk kielégítő legyen,
a különbség okait, tényezőit is vizsgálnunk kell. Valóban rosszabbak-e a kereseti lehetőségek B-nél? Nemek szerint is vizsgálva a jövedelmeket
bővítsük a példát:

4.1. táblázat - Jövedelem- és létszámadatok két vállalkozásnál


A B
Nem Létszám Létszám
Összes jövedelem Összes jövedelem
(fő) (fő)

180
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

(ezer Ft) (ezer Ft)


Férfi 2400 50 1000 20

Nő 300 10 1000 30
Összesen 2700 60 2000 50

Átlagos jövedelem A-nál:

Férfiak:

Nők:

Együtt:

Átlagos jövedelem B-nél:

Férfiak:

Nők:

Együtt:

Megállapíthatjuk, hogy B vállalkozásnál mind a férfiak, mind a nők jobban keresnek, mint A-nál. (A férfiak átlagos jövedelme 2 E Ft-tal, a nőké 3,3 E
Ft-tal magasabb.) Ez a megállapítás látszólag ellentmond annak, hogy B-ben alacsonyabb az átlagos jövedelem.

Két összetett intenzitási viszonyszám (főátlag) eltérése azonban nem magyarázható meg egyedül az intenzitási részviszonyszámok (részátlagok)

eltérésével. Az eltérésben a nemek szerinti eltérő összetétel is szerepet játszik. Példánkban A-nál a magasabb jövedelmű férfiak aránya 83% ,

B-nél pedig csak 40% . Ahhoz, hogy megállapításaink helytállók legyenek, külön kell választanunk e két ok hatását. Ez a standardizálás
módszerével történik.

181
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

A standardizálás módszerével a térben (illetve időben) eltérő összetett intenzitási viszonyszámok (főátlagok) közötti különbséget (vagy
hányadost) összetevőkre (illetve tényezőkre) bontjuk.

A standardizálás módszerét Kőrösy József (1844–1906) magyar származású statisztikus (demográfus) dolgozta ki és alkalmazta először. Különböző
területeken élők korcsoportos halálozási arányszámait (1000 lakosra jutó halálozások száma egy adott területen vagy időszakban) vizsgálta,
hasonlította össze. E tevékenysége során jött rá arra, hogy helytelen következtetések levonásához vezet az, ha csak az átlagos halálozási
arányszámok alapján végzi el az összehasonlítást. Ugyanis az egyes népességcsoportok életkörülményein, egészségügyi ellátásának színvonalán
kívül a halálozások számát nagymértékben befolyásolja a népesség életkor szerinti összetétele is. Tudott dolog, hogy a csecsemőkortól (0–1 éves
kor) eltekintve, minél idősebb korosztályt vizsgálunk, rendszerint annál nagyobb a halálozások előfordulása.

Tehát olyan népességcsoportoknál, ahol kedvezőbb életkörülmények, jobb orvosi ellátás hatására magasabb az átlagos életkor – ennélfogva
nagyobb arányú az idősebb korosztály népességen belüli aránya –, magasabb lehet az átlagos halálozási arányszám, mint egyéb, kedvezőtlenebb
körülmények között élő népességcsoportoknál, annak ellenére, hogy az egyes korosztályoknál valószínűleg ellentétes irányú eltérés tapasztalható.

A felismert probléma megoldására dolgozta ki Kőrösy József a standardizálás módszerét. A különböző területek népességének átlagos
halálozási arányszámát úgy értelmezte, mint az egyes életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyet
a részviszonyszámok nagysága és a népesség kor szerinti összetétele, megoszlása együttesen határoz meg. A két tényező hatását pedig úgy
választotta el egymástól, hogy egy-egy tényező hatásának elemzésekor a másik tényezőt standardnak (állandónak) tételezte fel.

Az összetett intenzitási viszonyszámok (illetve főátlagok) térbeli összehasonlításánál azt vizsgáljuk, hogy azok mennyivel térnek el egy másik, azonos
módon csoportosított statisztikai sokaság összetett intenzitási viszonyszámától (vagy főátlagától), azaz a különbségeket képezzük.

Az időbeli elemzés során azt elemezzük, hogy az összetett intenzitási viszonyszám (vagy főátlag) hány %-kal változott az egyik időszakról a másik
időszakra, azaz a hányadosokat számítjuk ki.

Ismeretes, hogy az intenzitási viszonyszám és a számtani átlag között igen közeli a rokonság. Ugyanazt a színvonalmutatót általában kifejezhetjük
viszonyszámként vagy átlagként, attól függően, hogy milyen adatokból számítottuk. Ebből következik, hogy megállapításaink mindkét mutatószámra
vonatkoznak. Ebben a fejezetben elsősorban olyan problémákat tárgyalunk, amelyek intenzitási viszonyszámokkal jellemezhetők. Ezért a

továbbiakban a módszert az intenzitási viszonyszámokra mutatjuk be, és a alapképletnek megfelelő jelöléseket használjuk. De mindaz, amit
elmondunk, az átlagokra is érvényes.

Tekintsük át az adatbázist és a kiszámítható mutatószámokat a 4.2. táblázat szerinti formában:

4.2. táblázat - Két összetett intenzitási viszonyszám meghatározása és összehasonlítása


Összehasonlítandó területek, illetve időszakok
Vizsgált „0” „1” Különbség Hányados

182
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

csoportok

1
2

M
Vizsgált
K I
sokaság

ahol a táblázat két utolsó oszlopában a részviszonyszámok összehasonlítására szolgáló különbségeket és az hányadosokat

helyeztük el. Az összesen sorban pedig a különbség és az hányados szerepel.

A két szóban forgó ok hatását oly módon fogjuk kimutatni, hogy a két összehasonlítandó összetett viszonyszám közötti (K) tényleges különbséget,
illetve a két mutató tényleges hányadosát (I) úgy bontjuk fel két részre, hogy:

1. a illetve a megfelelő részviszonyszámok közötti különbségeknek, illetve a hányadosaiknak a két összetett viszonyszám különbségére,
illetve hányadosára gyakorolt hatását, a illetve pedig a két sokaság eltérő összetételének a két összetett viszonyszám különbségére, illetve
hányadosára gyakorolt hatását mutassa;

2. teljesüljön továbbá, hogy az egyes hatásokat kifejező különbségek összege a teljes különbséggel egyenlő: A hányadosok szorzata
pedig az összetett viszonyszámok hányadosával egyenlő: .

A különbségfelbontást elsősorban térbeli, a hányadosfelbontást pedig időbeli összehasonlításnál használjuk.

183
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének


felbontása összetevőire
A statisztikai elemzésben gyakran kerül sor valamilyen jelenség átlagos színvonalának térbeli összehasonlítására. Az összehasonlítás korlátozódhat
az eltérés irányának megállapítására, amikor csak azt vizsgáljuk, hogy a két összetett intenzitási viszonyszám közül melyik a nagyobb. Ezzel azonban
rendszerint nem elégszünk meg, hanem amint azt az előző pontban tárgyaltuk, az eltérést előidéző tényezők számszerű hatását a standardizálás
módszerével kimutatjuk.

Tekintsük a következő példát (4.3. táblázat):

4.3. táblázat - Két ország halandósági viszonyainak alakulása (fiktív adatok)


A ország („0”) B ország („1”) Arány-
Meghaltak Halálozási Meghaltak Halálozási számok
Korcso-portok Lakosság Lakosság
száma arányszám száma arányszám különbsége
(év) (millió fő) (millió fő)
(fő) (‰) (fő) (‰) (‰)

0 −14 25 200 1,8 14,0 9 460 1,1 8,6 –5,4

5 − 14 1 900 3,8 0,5 880 2,2 0,4 –0,1

15 − 39 11 200 8,0 1,4 7 280 5,6 1,3 –0,1

40 − 59 26 400 4,0 6,6 24 700 3,8 6,5 –0,1

60 −11 124 800 2,4 52,0 117 990 2,3 51,3 –0,7
Összesen 189 500 20,0 ... 160 310 15,0 ... ...

Halálozási arányszám (1000 lakosra jutó halálozások száma) =

184
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

B ország átlagos halálozási arányszáma:

Egyszerűbben írva:

1
Súlyozott számtani átlag formában :

A ország átlagos halálozási arányszáma:

Egyszerűbben írva:

Súlyozott számtani átlag formában:


1
A „súlyok” szerepét a relatív súlyok (megoszlási viszonyszámok) is betölthetik (lásd itt is a 3.3.1. pontban leírtakat).

185
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Példánkban: K = 10,7‰ – 9,5‰ = 1,2 ‰.

B országban tehát 1,2 ezrelékponttal nagyobb a halálozási arányszám.

Ha csak ezt az arányszámot ismernénk, azt gondolnánk, hogy B országban lényegesen rosszabbak az életkörülmények és az egészségügyi
viszonyok. Ha azonban a korcsoportos halálozási arányszámokat vizsgáljuk (lásd a 4.3. táblázat adatait), egészen más következtetésre jutunk, mert
B országban minden egyes korcsoportban alacsonyabb a halálozási arányszám.

E feltűnő ellentmondás magyarázata abban van, hogy B országban magasabb a viszonylag magas halandóságú idősebb korúak aránya.

A standardizálás módszerével kimutatjuk, hogy a megállapított 1,2 ezrelékpontos különbséget milyen mértékben magyarázhatjuk

a korcsoportonkénti halálozási arányszámok eltéréseivel , illetve

a népesség eltérő korösszetételével .

4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása


Ahhoz, hogy a részviszonyszámok különbözőségének hatását kimutathassuk, az összetétel szempontjából összehasonlíthatóvá tesszük a két
összetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard (azonos, állandó) összetétellel számítjuk ki.

ahol: a j-edik csoport standard súlya, részaránya.


2
Egyszerűbben írva :
2
A továbbiakban az egyszerűbb formát használjuk, tehát nem tüntetjük fel a szummációs határokat.

186
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

A részhatáskülönbség azt fejezi ki, hogy csupán a megfelelő részviszonyszámok eltérése milyen hatást gyakorolt az összetett
intenzitási viszonyszámok eltérésére.

Példánkban a B ország lakossági adatait választjuk standardnak .

B ország összetett viszonyszáma nem változik:

A ország összetett viszonyszáma, ha súlyként a B ország megoszlási gyakoriságait használjuk (ez a standard), pedig:

A két arányszám különbsége:

Megállapíthatjuk, hogy 0,6 ezrelékponttal alacsonyabb az átlagos halálozási arányszám amiatt, hogy minden korcsoportban alacsonyabbak az
arányszámok (lásd a 4.3. táblázat utolsó oszlopát).

A az intenzitási részviszonyszámok különbségeinek átlagaként is értelmezhető és kiszámítható:

Példánkban:

187
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Mivel a átlag, ezért a mindig a és a között helyezkedik el. Példánkban a legkisebb eltérés –5,4 (az első korcsoportban), a legnagyobb
eltérés –0,1 (pl. az 5−14 éves korcsoportnál).

4.2.2. Az összetétel különbözőségének hatása


Ahhoz, hogy az összetétel különbözőségének hatását ( ) kimutathassuk, a vizsgált színvonal szempontjából összehasonlíthatóvá tesszük a két
összetett intenzitási viszonyszámot. Ezt úgy érjük el, hogy mindkettőt standard részviszonyszámok feltételezésével számítjuk ki.

ahol az egyes csoportok standard részviszonyszáma.

A összetételhatás-különbség azt fejezi ki, hogy csupán az összetétel különbözősége milyen hatást gyakorolt az összetett intenzitási
viszonyszámok eltérésére.

Ennek a tényezőnek a hatását példánkban úgy tudjuk kimutatni, ha mindkét ország halálozási arányszámát azonos részviszonyszámok
(korcsoportonkénti halálozási arányszámok) figyelembevételével számítjuk ki és azután megállapítjuk a különbségüket. Megoldásunkat úgy folytatjuk,
hogy az A ország korcsoportonkénti halálozási arányszámait tekintjük standardnak ( ).

B ország együttes viszonyszáma:

A ország együttes arányszáma nem változik:

A kimutatott pozitív előjelű 1,8‰ azt jelenti, hogy B országban, kizárólag abból adódóan, hogy a lakosság nagyobb hányadát teszik ki az idősebbek,
1000 lakosra 1,8 ezrelékponttal több halálozás jutott.

188
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Ha a standard adatsorokat úgy választjuk meg, hogy A ország lakosság-összetételét és B ország korcsoportonkénti halálozási arányszámait
vesszük standardnak (tehát az előzőekkel éppen ellentétesen), az országos halálozási arányszámok különbségének felbontására (a számítások
mellőzésével) az alábbieredményeket kapjuk:

A kétféle standard adatsor választása esetén a és számszerű eredménye ugyan eltér egymástól, de tendenciájukban hasonló módon mutatják
az egyes tényezőknek a különbség kialakításában játszott szerepét.

Ha számításánál B ország a standard, akkor számításánál A országot kell standardnak venni (és fordítva). Ugyanis ekkor

mivel a két középső tag kiesik.

A 4.1. pontban szereplő problémafelvető példánk megoldását ( és kiszámítását) az olvasóra bízzuk.

4.3. Indexszámítás standardizálás alapján (hányadosfelbontás)


Ha a tényleges, illetve (valamelyik tényező kimutatásának céljából) standardizált összetett intenzitási viszonyszámoknak nem a különbségét, hanem
a hányadosát képezzük, összehasonlító dinamikus viszonyszámokat kapunk. Ezeket összetettségük, komplex tartalmuk miatt indexeknek nevezzük.

189
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

A tényleges összetett intenzitási viszonyszámok hányadosát főátlagindexnek, a standard összetétellel számított hányadost ( )
3
részátlagindexnek, a standard részviszonyszámokkal számított hányadost ( ) pedig összetételhatás-indexnek nevezzük.

Az indexek számítását a következő példán mutatjuk be (4.4. táblázat).

4.4. táblázat - Egy megye forgalmi és népességadatai az 1994. és 1995. évben


1994. év 1995. év 1 lakosra jutó
forgalom
Lakosság 1 lakosra 1 lakosra
Forgalom Forgalom Lakosság
Település jutó forg. jutó forg. változása
(1000
(1000 Ft) (1000 Ft) (1000 fő)
fő) (Ft/fő) (Ft/fő) (1994=100%)

Ipari 640 000 160 4000,0 774 000 180 4300,0 107,5
Mezőgaz-dasági 1 440 000 480 3000,0 1 408 000 440 3200,0 106,7
Összesen 2 080 000 640 3250,0 2 182 000 620 3519,4 ...

4.3.1. A főátlagindex
A főátlagindex azt fejezi ki, hogy az intenzitási viszonyszámmal kifejezhető átlagos színvonal hogyan változott egyik (bázis-) időszakról
a másik (tárgy-) időszakra.

Példánkban az 1 lakosra jutó kereskedelmi forgalom változását vizsgáljuk.

A főátlagindexet háromféle módon is kiszámíthatjuk:

1. A viszonyszámtört számlálójának és nevezőjének ismeretében


3
A szakirodalomban és néhány korábbi tankönyvben használatos terminológia szerint: I: változó állományú index; I': változatlan állományú index; I'': arányeltolódási index.

190
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

2. A viszonyszámtört számlálójának és nevezőjének összetett dinamikus viszonyszáma alapján:

A forgalom változása:

A lakosság számának változása:

3. A részviszonyszámok súlyozott számtani átlagai alapján:

Mindhárom számítás ugyanarra az eredményre vezet. Míg az első kettőnek gyakorlati jelentősége van, addig a harmadik számítási forma bizonyítja,
hogy a főátlagindex nagyságát két tényező befolyásolja:

a) az intenzitási részviszonyszámok változása,

b) az eltérő színvonallal jellemzett sokaság szerkezetének, összetételének változása.

A megyei átlagos 1 lakosra jutó forgalom 8,3%-os növekedését két tényező okozta:

191
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

a) a településenkénti 1 lakosra jutó forgalomnak 7,5%-os, illetve 6,7%-os növekedése, valamint

b) a lakosság településforma szerinti összetételének megváltozása.

4.3.2. A részátlagindex
A részátlagindex a részviszonyszámok változásának az összetett viszonyszám változására gyakorolt hatását fejezi ki. Eltekint a sokaság
összetétel-változásától.

Ezért a részátlagindexet változó részviszonyszámokkal és standard összetétellel képzett hányadosként számítjuk ki. Mindig a tárgyidőszak tényleges
összetételét tekintjük standardnak .

Számítása tehát az alábbi módokon történhet:

1. A standardizált összetett intenzitási viszonyszámok hányadosaként:

4
2. Aggregát formában :

Az előző képletet -gyel egyszerűsítve kapjuk az aggregát formát:

Példánkban:

4
Az 5. fejezetben ismertetésre kerülő indexek analógiájára. Jelentését lásd ott.

192
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

3. Az aggregát forma átalakításával:

a) A csoportok színvonalváltozásainak (az egyedi indexeknek, ) súlyozott számtani átlagaként:

Példánkban:

b) A csoportok színvonalváltozásainak súlyozott harmonikus átlagaként:

Példánkban

Megállapíthatjuk, hogy az 1 lakosra jutó forgalom értékének településtípusonkénti növekedése 7,0%-kal növelte a megyei 1 lakosra jutó forgalmat.
A részátlagindex mindenkor a legnagyobb és legkisebb egyedi indexek ( ) között foglal helyet, mivel azok súlyozott átlaga. A főátlagindex, mivel
a részátlagok változásán kívül a sokaság összetétel-változásának hatását is tartalmazza, kerülhet az egyedi indexek közé, de mutathat az egyedi
indexeknél nagyobb vagy kisebb százalékos változást is.

(A képletek jobb megértéséhez tekintsük át ismét a 4.2. táblázatban közölt jelölésrendszert!)

193
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

4.3.3. Az összetételhatás indexe


Az összetételhatás indexe megmutatja, hogy a részsokaság összetételében bekövetkezett változás milyen hatást gyakorolt az összetett
intenzitási viszonyszám változására.

Az összetételhatás indexének számításánál mindig a bázisidőszak részviszonyszámait vesszük standardnak .

Számítási képlete a standardizált összetett intenzitási viszonyszámok hányadosaként:

Példánkban:

Megállapíthatjuk, hogy az összetétel-változás (1,2%-os mértékben) növelte az egy lakosra jutó forgalmat.

Ha a részátlagindex számításánál a tárgyidőszakot vettük standardnak, akkor ebből már következik, hogy itt a bázisidőszaknak kell standardnak
lenni, mert ekkor igaz, hogy

azaz

főátlagindex = részátlagindex · összetételhatás-index

Még egyszer hangsúlyozzuk, hogy az egyenlőség fennállásának feltétele, hogy az -t tárgyidőszaki összetétellel, az -t pedig bázisidőszaki
intenzitási részviszonyszámokkal számoljuk. (Vagy fordítva: -t adatsorral; -t pedig adatsorral.)

194
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Ebből következik, hogy:

Leggyakrabban az össszetétel-változás hatását számítjuk közvetett úton.

Példánkban:

Hogy az összetétel hogyan változott, azt a 4.5. táblázat szemlélteti megoszlási viszonyszámokkal.

4.5. táblázat - A lakosság összetételének változása


A megye népessége
Település 1994-ben 1995-ben
ezer főben %-ban ezer főben %-ban
Ipari 160 25 180 29

Mezőgazdasági 480 75 440 71


Összesen 640 100 620 100

A megoszlási viszonyszámok alátámasztják előbbi megállapításunkat. A megye népességén belül megnőtt az ipari települések népességének
aránya, ahol (érthetően) nagyobb az 1 főre jutó kereskedelmi forgalom.

4.4. Alkalmazási területek


A statisztikai elemzésben a standardizálás módszerét a gazdaságstatisztika és a népességstatisztika számos területén alkalmazzák. Az ismertetett
módszerek segítségével vizsgálhatjuk pl. a munka termelékenységének, a termékek önköltségének, a költségszínvonalnak, a termésátlagoknak,
a születési és halálozási arányszámoknak, az egy főre jutó fogyasztásnak az alakulását. Jelentős alkalmazási terület továbbá az átlagos bérek,
jövedelmek alakulásának vizsgálata is. Az árak statisztikai elemzésének bizonyos területe is e témakörhöz kapcsolódik.

A továbbbiakban e két utóbbi alkalmazást mutatjuk be.

195
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

4.4.1. Az átlagbérek időbeli változásának vizsgálata


Az átlagbérek (pl. az egy főre jutó bruttó vagy nettó bér) időbeli változását általában állománycsoportonként, szakmánként, területi egységenként
vizsgáljuk, ezek együttes, átlagos változását indexmódszerrel elemezhetjük.

Vizsgáljuk meg az átlagbérek alakulását egy vállalkozásnál 1994. és 1995. január hónapjában (4.6. táblázat).

4.6. táblázat - Egy vállalkozás munkaügyi adatai


1994. január 1995. január
Béralap Létszám Béralap Létszám

Állománycsoport (1000 Ft) (fő) (1000 Ft) (fő)

Fizikai 28 800 800 33 660 850

Nem fizikai 6 000 150 4 400 100


Együtt 34 800 950 38 060 950

A bruttó átlagkeresetet a béralap és a létszám hányadosaként ( ) mint intenzitási viszonyszámot értelmezzük. Az egyes állománycsoportokra
és a vállalkozás dolgozóinak összességére kiszámított bruttó átlagkereseteket és azok időbeli változását a 4.7. táblázat tartalmazza:

4.7. táblázat - 4.7. táblázat


Bruttó átlagkereset (Ft)
1994. január 1995. január
Állomány-
csoport (%)

Fizikai 36 000 39 600 110,0

Nem fizikai 40 000 44 000 110,0


Együtt 36 632 40 063 109,4

196
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Megállapíthatjuk, hogy az átlagkereset mind a két állománycsoportban egyaránt 10–10%-kal nőtt. Ugyanakkor az együttes (átlagos) átlagkereset-
növekedés csak 9,4%. Ennek a látszólagos ellentmondásnak az a magyarázata, hogy az egyes állománycsoportok összlétszámon belüli aránya
is megváltozott. Az alacsonyabb átlagkeresettel rendelkező fizikai állománycsoport összlétszámon belüli aránya növekedett (mert az összlétszám
változatlansága mellett létszámuk nőtt), ugyanakkor a magasabb átlagkeresetű, nem fizikai állománycsoportban lévő dolgozók aránya csökkent
(változatlan összlétszám mellett létszámuk csökkent).

A kiszámított 9,4%-os átlagkereset-növekedés az egyes állománycsoportonkénti átlagkereset-változást és az állománycsoportok létszámarány-


változásának a hatását is tükrözi. Ebből következik, hogy a 109,4%-os index az átlagkeresetek elemzésének főátlagindexe.

Az állománycsoportonkénti átlagkeresetek változásának hatását az 1995-ös létszámadatok feltételezésével mutathatjuk ki.

A bruttó átlagkereset részátlagindexe:

Mint azt a 4.3.2. pontban bizonyítottuk, a részátlagindex az egyedi indexek között helyezkedik el. Példánk ebből a szempontból speciálisnak
tekinthető, ugyanis mindkét állománycsoportban egyaránt 10%-kal nőtt az átlagkereset. Így a bruttó átlagkereset növekedésének átlagos nagysága is
éppen 10%. A részátlagindex tehát az átlagkereset vizsgált csoportonkénti változásainak átlagát fejezi ki, rövidebben szólva az átlagkereset átlagos
változását. Mint láttuk, az együttes bruttó átlagkereset ennél kisebb mértékben nőtt (I = 109,4%).

A létszámarányok változásának hatását az összetételhatás indexével mutatjuk ki. A számításnál feltételezzük, hogy 1995-re is az 1994-es kereseti
adatok jellemzőek.

A bruttó átlagkereset összetételhatás-indexe:

A másik két index alapján:

Az átlagkereset változása különbségszámítással is elemezhető, bár azt mondtuk, hogy az időbeli változást általában az indexekkel elemezzük.

197
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

A bruttó átlagkereset összes növekedése:

A növekedés tényezői:

(A számításnál a standardizálás egyes lépéseiben ugyanúgy jártunk el, mint a megfelelő és indexnél.)

A 3431 Ft-os keresetnövekedésben az állománycsoportonkénti átlagkereset-növekedések (fizikaiaknál 600 Ft, nem fizikaiaknál 4000 Ft) együttes
hatása 3643 Ft volt, amit „lerontott” a kedvezőtlen összetétel-változás. (Az alacsony keresetű csoport létszámaránya nőtt meg 84,2%-ról 89,5%-ra.)

4.4.2. Az átlagárak időbeli változásának vizsgálata


Az árakat (pontosabban az egységárakat) általában úgy értelmezzük, mint egy meghatározott egyedi termék (szolgáltatás) egy szokásos
mértékegységben kifejezett mennyiségi egységére jutó forintértéket. A gyakorlatban azonban számtalan esetben előfordul, hogy több termék
(szolgáltatás, cikk) árát egy adattal, egy átlagos árral kívánjuk jellemezni. A számítás szükségessége felmerülhet térben és időben is.

Az árstatisztikai vizsgálatnál megkülönböztetjük az egyedi (elemi) ár és az átlagár fogalmát. Egyedi ár fogalma alatt egy adott minőségű termék vagy
szolgáltatás meghatározott körülmények között történt adásvétele során a termék vagy szolgáltatás egy egységéért fizetett pénzösszeget értjük. Az
átlagár pedig bizonyos okok miatt különböző (pl. a termék minősége, a feljegyzés időpontja vagy helye) elemi árak átlaga.

Az átlagár számításainak két előfeltétele van:

– a vizsgált termékek, cikkek, szolgáltatások homogén csoportba tartozzanak, tehát olyan árucsoportba, amelybe tartozó cikkek, szolgáltatások
azonos szükségleteket elégítenek ki, az egyes cikkek, szolgáltatások eltérő árainak oka a minőségi különbségekben keresendő. (A statisztikai
gyakorlatban meghatározott esetekben heterogén termékek, cikkek, szolgáltatások átlagárát is elemezzük, ezzel tananyagunkban nem foglalkozunk.)

– a termékek, cikkek természetes mértékegységben összesíthetők legyenek (ez ún. technikai előfeltétele az átlagárszámításnak).

Az átlagár tehát csak homogén csoportba tartozó és természetes mértékegységben összesíthető termékek, szolgáltatások körére értelmezhető.
Átlagárat számíthatunk például a különböző minőségű kenyér elemi áraiból.

198
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Vezessük be a következő jelöléseket.

– az értékesített (fogyasztott, felhasznált stb.) mennyiség,

– az értékesített (fogyasztott, felhasznált stb.) termékek egyedi (elemi) ára,

n – a termékcsoporthoz tartozó termékek száma.

Az átlagár számításának lehetséges módozatai:

– intenzitási viszonyszámként, ha a mennyiségek mellett az értékesítési árbevétel ismert:

ahol v megfelel az A típusú adatnak, q pedig a B típusú adatnak. (Az összetett intenzitási viszonyszámra bevezetett jelölésrendszer szerint.)

– az egyedi (elemi) árak súlyozott számtani átlagaként számíthatjuk az alábbiak szerint:

– az egyedi (elemi) árak súlyozott harmonikus átlagaként, ha a mennyiségi adatok mellett a adatok ismertek:

A továbbiakban a képletek felírásakor eltekintünk a szummációs határok kijelölésétől.

199
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Az átlagár nagysága – nyilvánvalóan – függ az elemi árak nagyságától és a különböző nagyságú elemi árakkal jellemzett termékek értékesítési
részarányától.

A termékcsoport átlagárának időbeli változását, a változás okainak feltárását az itt megismert indexek szolgálják. Az alkalmazást a következő példa
segítségével mutatjuk be (4.8. táblázat).

4.8. táblázat - Egy homogén árucsoportba tartozó három cikk értékesítési adatai
Március Április
Árváltozás
Forgalom Értékesített Ár Forgalom Értékesített Ár
Cikk mennyiség mennyiség (Március=
(1000 (Ft/ (1000 (Ft/
Ft) (db) db) Ft) (db) db) =100%)
A 720,0 800 900 940,5 950 990 110

B 660,0 600 1100 1012,0 800 1265 115

C 1000,0 500 2000 1440,0 600 2400 120


Összesen 2380,0 1900 ... 3392,5 2350 ... ...

Márciusi átlagár:

Áprilisi átlagár:

Főátlagindex:

Ha az átlagár 15,2%-os növekedésében csak az árak változásának hatását akarjuk kimutatni, akkor az átlagárat mindkét időszakban az áprilisban
forgalmazott cikkek áprilisi mennyiségi adataival kell súlyoznunk. Így az átlagár részátlagindexéhez jutunk:

200
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Általánosítva

(A részátlagindex képlete azonos a következő fejezetben bemutatásra kerülő árindex képletével, tehát ténylegesen csak az árak változását
tükrözi.)

A részátlagindex súlyozott harmonikus átlag (esetleg súlyozott számtani átlag) formában is kiszámítható:

(A súlyozott számtani átlag formát a gyakorlatban nem használjuk, ezért ennek számszerű bemutatásától eltekintünk.)

A két időszak között megváltozott a forgalmazott mennyiség cikkek szerinti összetétele, ennek az átlagár változására gyakorolt hatását az
összetételhatás-index segítségével mutatjuk ki. Ebben az indexben a márciusi termékenkénti árakat használjuk mindkét időszak átlagárának
kiszámításához:

201
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Általánosítva:

A három index között szintén fennáll a következő összefüggés:

Ennek feltétele, hogy a változatlannak tekintett tényezőt ( -nél a temékösszetételt, -nél az egyedi árakat) ellentétes időszakból válasszuk.

Példánkban:

Az átlagár változását tehát döntően az egyedi árak változása okozta (15,6%-os mértékben), valamelyest csökkentő hatást gyakorolt a
termékösszetétel megváltozása. Megnőtt ugyanis a viszonylag olcsóbb B cikk aránya (31,6%-ról 34%-ra).

Nyomatékosan felhívjuk a figyelmet arra, hogy az itt ismertetett átlagárindexek csak a mennyiségben közvetlenül összesíthető termékek viszonylag
szűkebb körére értelmezhetők. (Mint azt már a bevezetőben is hangsúlyoztuk.)

A következő fejezetben a közvetlenül nem összesíthető, különnemű, általában különböző mértékegységű termékek értékének, árának és
mennyiségének időbeli összehasonlítására szolgáló indexekkel ismerkedünk meg.

4.5. Gyakorlófeladatok
1. Két országban (A és B) vizsgáljuk a születési viszonyokat. A születések számára és a szülőképes korú nők számára vonatkozó adatok az alábbiak:

Életkor A nők száma (millió fő) A születések száma (ezer)


(év) A ország B ország A ország B ország
15 – 19 3,6 8,0 288 400

20 – 29 6,4 14,0 1280 2100

30 – 39 6,0 10,0 260 320

202
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

40 – 49 4,0 8,0 60 40
Összesen 20,0 40,0 1888 2860

Feladat:

a) Hasonlítsuk össze az 1000 nőre jutó születést a szülőképes korú nők egyes korcsoportjaiban és az ország egészében!

b) Standardizálással mutassuk ki, hogy:

1. a születési arányszámok különbözősége miatt mennyivel (hány ezrelékponttal) magasabb az A ország arányszáma? (A ország összetételével
számoljunk.)

2. az eltérő korösszetétel miatt kedvezőbb vagy kedvezőtlenebb-e A ország születési arányszáma? Megállapításainkat támasszuk alá a megoszlási
viszonyszámok kiszámításával is!

2. Az öregségi nyugdíjak adatai a nyugdíjasok életkora és nemek szerint 1994 áprilisában:

Férfiak Nők
száma nyugdíj összege száma nyugdíj összege
Életkor (év)
(1000 fő) (1000 Ft/fő) (1000 fő) (1000 Ft/fő)
11 – 54 7,1 19,8 6,7 12,6

55 – 59 19,5 20,1 171,2 12,0

60 – 64 144,6 16,3 221,3 12,3

65 – 69 168,7 16,4 205,2 12,2

70 – 74 143,7 16,0 170,4 12,3

75 – 79 64,6 16,5 75,2 12,7

80 – 11 91,4 15,4 103,4 12,6


Összesen 639,6 16,3 953,4 12,3

Feladat:

Hasonlítsuk össze a férfiak és a nők átlagos nyugdíját! Mutassuk ki a különbséget kialakító tényezőket!

203
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

3. Két ország halandósági viszonyaira vonatkozó fiktív adatok:

A ország B ország
Népesség Halálozási arány Népesség Halálozási arány
Életkor (év)
(millió fő) (‰) (millió fő) (‰)
10 – 14 6 2,0 3 1,5

15 – 59 12 3,5 15 2,5

60 és felett 2 50,0 12 45,0


Összesen 20 ... 30 ...

Feladat:

a) Hasonlítsuk össze a két országot a halandósági viszonyok szempontjából!

b) Mutassuk ki standardizálás segítségével a befolyásoló tényezőket!

c) Megállapításainkat szövegesen is fogalmazzuk meg!

4. A hozzáadott érték és a létszám alakulása valamely vállalkozásnál az alábbi volt:

Hozzáadott érték Létszám


Üzem
(millió Ft) (fő)
1993 1994 1993 1994
A 100 110 20 20

B 100 110 15 15

C 70 130 9 15
Összesen 270 350 44 50

Feladat:

a) Számítsuk ki az egy főre jutó hozzáadott értéket mindkét évre üzemenként és a vállalkozás egészére! Vizsgáljuk a változást 1993-ról 1994-re!

204
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

b) Mutassuk ki megfelelő indexekkel, hogy milyen szerepet játszott a vállalkozás termelékenységének javulásában (romlásában):

1. a termelékenység üzemenkénti változása,

2. a különböző termelékenységi szinten dolgozó üzemek közötti létszámösszetétel-változás!

c) Írjunk szöveges elemzést!

5. Egy termékről, amelyet három gyáregységben termelnek, az alábbiakat ismerjük:

Gyáregység Önköltség (ezer Ft/db) A termelés megoszlása


1993 1994 1994-ben (%)
I. 8 8,4 20

II. 10 10,6 40

III. 12 13,2 40
Összesen ... ... 100

1993-ról 1994-re a termék átlagos önköltsége 4%-kal nőtt.

Feladat:

a) Számítsuk ki a részátlagindexet!

b) Hogyan hatott a termelés összetételének gyáregységek közötti megváltozása az átlagos önköltségváltozásra?

c) Melyik gyáregység(ek) részaránya nőhetett meg?

6. Magyarország kenyérgabona-termelésének adatai:

Vetésterület (1000 ha) Termésátlag (kg/hektár)


Megnevezés
1991 1993 1991 1993
Búza 1152 986 5190 3050

Rozs 358 429 2370 1660


Kenyérgabona 1510 1415 ... ...

205
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Feladat:

a) Hány %-kal nőtt (csökkent) az összes kenyérgabona-termelés Magyarországon?

b) Bontsuk fel ezt a változást a termésátlag, illetve a vetésterület változásának hatására!

c) Milyen tényezők befolyásolták az együttes termésátlag változását? Mutassuk ki e hatásokat a standardizálás módszerével!

7. Egy vállalatnál 1993-ban a vezető beosztásúak átlagos bruttó bére 60 ezer Ft, a beosztottaké pedig 24 ezer Ft volt. 1994-re a vezetők átlagbére
21%-kal, a beosztottaké pedig 15%-kal nőtt. 1993-ban a vezetők aránya 20%, 1994-ben pedig 10% volt.

Feladat:

a) Rendezzük az adatokat statisztikai táblába!

b) Elemezzük a vállalatnál foglalkoztatottak átlagbérének változását indexekkel! Az eredményeket szövegesen is értékeljük!

8. Egy vállalkozás adatai:

Szakképzettség szerinti A kifizetett bruttó bérek A létszám


csoportok 1994-ben az 1990-es év %-ában
Szakmunkás 140 120

Betanított munkás 130 120

Segédmunkás 150 130


Összesen 132 123

Ismert továbbá, hogy 1994-ben az összes kifizetett bruttó bérek 40%-át a szakmunkásoknak, 30%-át a betanított munkásoknak, a többit a
segédmunkásoknak fizették ki.

Feladat:

Számítsuk ki, hogyan változott az átlagbér:

a) az egyes szakképzettségi csoportokban,

b) a munkások összességére vonatkozóan,

206
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

c) a szakképzettség szerinti csoportoknál átlagosan,

d) a munkások összességére vonatkozóan csupán a létszámarányok megváltozása következtében!

9. Egy terméket három telephelyen gyártanak. A termelékenység alakulását jellemző adatok:

Egy főre jutó A létszám


Telephely
termelés (db/fő) megoszlása
1990 1994 1994-ben (%)
A 20 18 20

B 30 15 40

C 40 36 40

A temelékenység főátlagindexe: 92,3%.

Feladat:

a) Az adatok tanulmányozása alapján (számolás nélkül) válasszuk ki, hogy az alábbi három változat közül melyik felelhet meg a valóságnak?

A létszám 1990-es (bázisidőszaki) megoszlása a telephelyek sorrendjében (%):

Telephely
A B C
Változat
1. 20 40 40

2. 10 40 50

3. 60 20 20

Indokoljuk meg válaszunkat!

b) Számítsuk ki az és indexeket! Ellenőrizzük a létszámösszetétellel kapcsolatos döntésünket!

10. Egy felsőoktatási intézményben valamennyi oktatói csoportban (tanársegéd, adjunktus, docens, főiskolai tanár) 5,6%-kal nőttek az átlagbérek
egyik időszakról a másikra. Az összes oktatóra számított átlagbér növekedése pedig csak 2%-os volt.

207
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása

Feladat:

a) Állapítsuk meg az átlagbérekre számított főátlag-, részátlag- és összetételhatás-indexet!

b) Írjunk szöveges magyarázatot!

11. Egy magánkereskedő háromféle minőségű burgonyát értékesít. Az értékesítéssel kapcsolatos adatok az alábbiak:

Bázisidőszak Beszámolási időszak


Burgonya
Értékesítés Értékesítés
minősége Ár (Ft/kg) Ár (Ft/kg)
árbevétele (Ft) árbevétele (Ft)
I osztályú 9 600 80 10 000 100

II osztályú 2 400 60 1 750 70

III osztályú 2 000 50 1 500 60


Együtt 14 000 ... 13 250 ...

Feladat:

a) Számítsuk ki a burgonya átlagárát mindkét időszakban!

b) Elemezzük az átlagár változására ható tényezőket megfelelő indexekkel!

c) Írjunk szöveges értékelést

208
5. fejezet - Érték-, ár- és volumenindexek
5.1. Az indexszám fogalma
A gazdasági elemzésekben kiemelkedő jelentősége van az összehasonlításnak. Az azonos jellegű, azonos mértékegységű adatoknál ez egyszerű
módon megoldható, pl. viszonyszámokkal. Gyakran van azonban szükség a közvetlenül nem összesíthető adatokra vonatkozó átlagos változás
meghatározására. A gazdasági egységeknél nagyon lényeges információ a termelés vagy a forgalom teljes volumenének alakulása, melynek
megállapítása – hacsak nem egyféle cikket gyárt, forgalmaz a cég – a már ismert számításokkal nem végezhető el. Nemzetgazdasági és nemzetközi
szinten úgyszintén fontos az egyes gazdasági folyamatokban bekövetkezett mennyiségi változás kimutatása, s ez is megfelelő – az eddig tárgyaltaktól
eltérő – módszerek alkalmazását követeli meg. Napjainkban az árváltozás mértékének ismeretére vonatkozó igény is különösen nagy, mikro- és
makro-összehasonlítás vonatkozásában egyaránt. A mértékegységbeli különbözőség vagy a termékek eltérő volta nem teszi lehetővé direkt módon
a viszonyítást. Ezért olyan eljárásra volt szükség, amely az összehasonlíthatóság nehézségét kiküszöböli. Bizonyos termékeknél az átszámított
természetes mértékegységben történő számbavétel kivitelezhető (pl. égetett szeszes italoknál 50°-os szesz, állattenyésztésben számosállat stb.),
többnyire azonban csak nagyon körülményesen vagy egyáltalán nem lehetséges. Olyan közös jellemzőt kell találni, melynek segítségével az
összehasonlítás a termékek széles körében megoldható. Ez a közös jellemző az ár, amellyel az értékben történő számbavétel elvégezhető. Az érték
a mennyiség és az egységár szorzatából határozható meg. Az értékadatok összeadhatóak, tehát ily módon az egyes termékek, termékcsoportok
mennyisége összesíthetővé válik.

Az értékben való összesítést aggregálásnak, az összesített értékadatot pedig aggregátumnak nevezzük.

A közvetlenül nem összesíthető, de valamilyen szempontból összetartozó adatok átlagos változását mutató összetett összehasonlító viszonyszám
az indexszám.

Az indexszám viszonyszámnak is és átlagnak is felfogható. Viszonyszám, mert két adat hányadosa, amely időbeli és területi összehasonlításnál is
alkalmazható. Átlag, mert az egyes termékekre (jelenségekre) vonatkozó viszonyszámok átlagaként is meghatározható.

Indexek számításával már az előző fejezet is foglalkozott az összetett intenzitási viszonyszámok (főátlagok) összehasonlítása során. Ezeket az
indexeket standardizáláson alapuló indexeknek is szokták nevezni.

Azokat az indexeket, amelyekkel ebben a fejezetben fogunk megismerkedni, értéken alapuló indexeknek nevezzük.

5.2. Érték-, ár- és volumenindex-számítás


Az egyes termékek, szolgáltatások érték-, ár- és volumenváltozását dinamikus viszonyszámokkal elemezhetjük. Az indexszámítás keretében
a termékekre számított dinamikus viszonyszámokat egyedi indexeknek hívjuk. A termék egységárát p-vel, a termelt, eladott, fogyasztott stb.

209
Érték-, ár- és volumenindexek

mennyiséget q-val, a kettő szorzatát , az értéket v-vel jelöljük. Az összehasonlítandó két időszak jelölése bázisidőszak esetén 0, tárgyidőszak
(vagy beszámolási időszak) esetén 1 indexszel történik. Így tehát az egyedi indexek meghatározásának módja:

egyedi értékindex

egyedi árindex

egyedi volumenindex

A számítások egy konkrét példa kapcsán (5.1. táblázat) a következőképpen végezhetők el:

5.1. táblázat - Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az
1993–1994-es években
Eladott Ár Eladás értéke (ezer Ft)

Televíziók mennyiség (db) (Ft) (aggregátumok)

típusa 1993 1994 1993 1994 1993 1994

TS 3354
43 39 43 900 49 900 1887,7 1946,1 1712,1 2145,7
TXT
TS 3353
32 29 47 900 52 900 1532,8 1534,1 1389,1 1692,8
TXT
TS 5355
40 37 55 900 62 900 2236,0 2327,3 2068,3 2516,0
TXT

210
Érték-, ár- és volumenindexek

TS 6354
21 16 59 900 74 900 1257,9 1198,4 958,4 1572,9
TXT
Összesen – – – – 6914,4 7005,9 6127,9 7927,4

(Megjegyezzük, hogy a táblázat utolsó két oszlopában szereplő értékadatokra csak a későbbi számításoknál lesz szükség.)

5.2. táblázat - Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek
Egyedi indexek (%)
Televíziók típusa Értékindex Volumenindex Árindex

TS 3354 TXT 103,1 90,7 113,7


TS 3353 TXT 100,1 90,6 110,4
TS 5355 TXT 104,1 92,5 112,5
TS 6354 TXT 95,3 76,2 125,0

A fenti indexek tehát azt jelentik, hogy az egyes televíziótípusok forgalmának értéke, árai s az eladott mennyiségek miként alakultak a vizsgált
időszakban. Pl. a TS 3354 TXT készülékből az eladás értéke 3,1%-kal emelkedett, ára 13,7%-kal nőtt, értékesített mennyisége pedig 9,3%-kal
csökkent 1994-ben 1993-hoz viszonyítva (5.2. táblázat).

Több termékre, termékcsoportra az átlagos érték-, ár- és volumenváltozást az indexszámok mutatják, melyek kiszámítása aggregátumokkal és
átlagolással történhet.

5.2.1. Indexszám számítása aggregát formában


Az értékindex (jele: ) a termékek vagy termékcsoportok meghatározott körére vonatkozó érték átlagos változását fejezi ki. Kiszámítása a
vizsgált termékek két időszakra vonatkozó összesített értékadataiból (aggregátumaiból) képzett hányadossal történhet.
1
Az értékindex aggregát formája:
1
A továbbiakban már csak az „egyszerű” formát használjuk, tehát az összegzés határainak és az összegzési indexeknek a feltüntetését mellőzzük. Az összegzés mindig az egyidejűleg vizsgált n
termékféleségre értendő.

211
Érték-, ár- és volumenindexek

Az előző példa alapján kiszámított értékindex tehát azt mutatja, hogy a négyfajta teletextes televízió forgalmának értéke átlagosan 1,3%-kal
emelkedett a vizsgált időszakban.

A képletből látható, hogy az értékváltozást két tényező befolyásolja:

– a termékek árváltozása és

– a termékek mennyiségváltozása.

Ezen hatások kimutatására szolgál a másik két index, az árindex és a volumenindex, melyek az értékindexből kiindulva is kiszámíthatóak.

Az árindex (jele: ) a különböző termékek, árucikkek, szolgáltatások árainak átlagos változását, az árszínvonal alakulását fejezi ki.

Az árindex is meghatározható két összesített értékadat (aggregátum) hányadosából. Miután azonban csak az árváltozást akarjuk mérni, a
mennyiségváltozás hatását ki kell szűrni. Ez oly módon történhet, hogy a két aggregátum csak az árakban tér el, a mennyiség mindkét időszakra
azonos, tehát az csak a súlyszám szerepét tölti be. Attól függően, hogy a két vizsgált időszak közül melyik mennyiséget tekintjük állandónak (a
bázisidőszaki vagy a tárgyidőszaki adatokat), kétféle árindex számítása lehetséges:

bázisidőszaki súlyozású

tárgyidőszaki súlyozású

A képletekben szereplő , illetve szorzatok összegzéseként kapott értékadatokat (ezek a valóságban nem léteznek) fiktív aggregátumoknak
nevezzük.

212
Érték-, ár- és volumenindexek

A két árindex általában nem ad azonos eredményt az eltérő súlyszámok miatt. (A kétféle súlyozású index különbözőségének magyarázatára
a későbbiekben kerül sor.) Jelen példánkban is bázismennyiségekkel súlyozva 14,6, míg beszámolási súlyokkal számolva 14,3%-os átlagos
áremelkedés mutatható ki a vizsgált időszakban.

A volumenindex (jele: ) különböző termékek volumenének átlagos változását mutatja meg.

Kiszámítása az árindexhez hasonlóan történhet, csak a hányadosban szereplő aggregátumok jelen esetben a mennyiségi adatokban különböznek
egymástól. Az árak mint súlyszámok változatlanok. Attól függően, hogy a bázis- vagy a beszámolási időszak áradatait használjuk fel, a volumenindex
is kétféle lehet:

bázisidőszaki súlyozású

tárgyidőszaki súlyozású

A vizsgált cikkcsoportban tehát bázisárakkal súlyozva 11,4, beszámolási áradatokkal súlyozva pedig 11,6%-os átlagos volumencsökkenés mutatható
ki 1993-ról 1994-re.

A szakirodalom a bázisidőszaki súlyozású ár- és volumenindexet Laspeyres-féle, a tárgyidőszaki súlyozású indexeket pedig Paasche-féle
indexeknek nevezi, az alkotók nevéből kiindulva.

(Elvileg bármely más időszak árait is fel lehet használni a volumenindex kiszámításához, mint ahogy az árindex meghatározásához is többféle
mennyiségi adat jöhet számításba. Közgazdasági megfontolásból és gyakorlati kivitelezhetőségi okokból azonban az előzőekben ismertetett bázis-
és tárgyidőszaki súlyozás terjedt el.)

5.2.2. Az indexek átlagformái


Az előző fejezetben összetett viszonyszámokat súlyozott átlagként már számítottunk. Miután az indexszám összetett viszonyszám is egyben, ezt a
módszert itt is alkalmazhatjuk. Az aggregát formát átalakíthatjuk átlagformára. Átlagolandó értékek a megfelelő egyedi indexek, a súlyok pedig az
aggregát formában felírt törtek megfelelő értékadatai lesznek.

Az átlagformában való számítás a gyakorlatban azért jelentős, mert bizonyos esetekben nem a q és a p adatsorok, hanem értékadatok és egyedi
indexek állnak rendelkezésre.

213
Érték-, ár- és volumenindexek

Az értékindex átlagformái

Az értékindex ilyen formában történő kiszámítására a gyakorlatban ritkán kerül sor, miután a tényleges értékadatok (aggregátumok) többnyire
rendelkezésre állnak, tehát az aggregát formában történő számolás általában megoldható. Esetenként azonban szükség lehet az átlagformában
történő számításra is, melynek formái a következők:

számtani átlagforma

Az 1,3%-os átlagos értékváltozást oly módon számítottuk ki, hogy az egyes televíziótípusok egyedi értékindexeit az 1993-as, bázisforgalmakkal
súlyoztuk.

harmonikus átlagforma

Ez esetben az átlagos értékváltozás meghatározása az egyedi indexek 1994-es, beszámolási forgalmi adatokkal történő súlyozásával került
kiszámításra.

Az árindex átlagformái

Az árindex meghatározása számtani átlaggal:

Laspeyres-féle árindex

214
Érték-, ár- és volumenindexek

Az átlagolandó értékek (egyedi árindexek) súlya a tényleges bázisidőszaki érték, azaz az index nevezőjében szereplő aggregátum .

Paasche-féle árindex

A fentiekben az egyedi árindexek súlya fiktív értékadat (tárgyidőszaki mennyiség bázisárakon).

Az árindex meghatározása harmonikus átlaggal:

Paasche-féle árindex

Ennél a formulánál a tárgyidőszaki tényleges forgalmi adatokkal történik az egyedi árindexek súlyozása.

Laspeyres-féle árindex

215
Érték-, ár- és volumenindexek

Itt a súly szerepét betöltő aggregátum nem valós adat, hanem a bázismennyiség tárgyidőszaki áron számított értéke.

A volumenindex átlagformái

Az árindexhez hasonlóan mindkét típusú volumenindex meghatározható átlagokkal is.

Volumenindex meghatározása számtani átlaggal:

Laspeyres-féle volumenindex

A számtani átlaggal számolt, bázissúlyozású volumenindexnél ez esetben az egyedi volumenindexek súlyszámai a bázisidőszaki, 1993-as forgalmi
adatok.

Paasche-féle volumenindex

Ez esetben az egyedi volumenindexeket fiktív forgalomadatokkal (bázismennyiség beszámolási árakon) súlyozzuk.

216
Érték-, ár- és volumenindexek

Volumenindex meghatározása harmonikus átlaggal:

Paasche-féle volumenindex

Laspeyres-féle volumenindex

Természetesen az indexek értéke nem függ attól, hogy aggregát vagy átlagformában kerültek kiszámításra, tehát mint példánkból is kiderült, azonos
eredményt ad mindkét számítási mód.

Az indexek kiszámításának lehetséges módozatait a következő oldalon, az 5.3. táblázatban foglaljuk össze.

5.3. táblázat - Az indexek kiszámítási képleteinek áttekintő táblázata


Átlagformák
Egyedi indexek súlyozott harmonikus
Index neve Definíciója Egyedi indexek súlyozott számtani átlaga
átlaga
Képlet Súlyok Képlet Súlyok

Értékindex, Bázisidőszak Tárgy-


aggregátuma (beszámolási)
időszak

217
Érték-, ár- és volumenindexek

aggregátuma
Árindex Bázisidőszak Fiktív
aggregátuma
aggregátum
Bázisidőszaki súlyozású,

(Laspeyres-féle)
Árindex Fiktív Tárgy-
(beszámolási)
aggregátum időszak
Tárgyidőszaki súlyozású,

(Paasche-féle) aggregátuma

Volumenindex Bázis- Fiktív

időszaki aggregátum
Bázisidőszaki súlyozású,
aggregátum
(Laspeyres-féle)
Volumenindex Fiktív Tárgyidőszak

aggregátum aggregátuma
Tárgyidőszaki súlyozású,

(Paasche-féle)

5.3. Az indexek súlyozása


Az indexszámításban a súly fogalmát kétféle értelemben használjuk. A szó egyik értelme az aggregát formával, a másik pedig az átlagformákkal
kapcsolatos. Az aggregát formánál attól függően, hogy az árak vagy a mennyiség változását kívántuk kimutatni, az a q, az a p adat vált
súlyszámmá. Az átlagformáknál a súly mindig valamely aggregátum értékadat.

A volumenindexnél, csakúgy, mint az árindexnél valós és fiktív (nem azonos időszakhoz tartozó mennyiség- és áradatok szorzatából számított –
illetve –) értékadatokkal is történhet a súlyozás. (Meg kell jegyezni, hogy a gyakorlatban a tényleges adatokkal történő súlyozásnak van
jelentősége, mert azok közvetlenül rendelkezésre állnak, míg a fiktív értékadatok csak számítással határozhatók meg.)

Már utaltunk rá s a számszaki példa is bizonyította, hogy a bázis- és beszámolási súlyozású indexek értékei nem egyeznek meg egymással.
Az átlagolandó értékek mindkét esetben azonosak, a különbözőség egyértelműen a súlyozás eltéréséből fakad, abból, hogy a súlyarányok

218
Érték-, ár- és volumenindexek

megváltoznak. Ennek oka, hogy az egyedi volumen- és árindexek között sztochasztikus kapcsolat – többnyire negatív korreláció – található. Ez azt
jelenti, hogy általában egy-egy termék áremelkedése az adott termék eladott mennyiségének csökkenését vonja maga után, jelentősebb árnövekedés
pedig erőteljesebb mennyiség-visszaesést eredményez. Tehát nagyobb értékhez kisebb érték tartozik és viszont, s ennek következtében
általában azon termékek mennyiségi aránya nő, melyeknél s azoké csökken, ahol Ez azt vonja maga után, hogy a bázissúlyozású index
számszerű értéke magasabb, mint a tárgyidőszaki súlyozásúé:

(Pozitív korreláció esetén természetesen a nagyságrendi reláció fordított.)

Példánkban is nagyobb értékűek a bázissúlyozású indexek, mint a beszámolási súlyozásúak (114,6% és 114,3%, illetve 88,6% és 88,4%). A kétféle
súlyozású index értékének eltérése azonban kicsi, mert bár a negatív korreláció egyértelműen megfigyelhető, az egyedi indexek szóródása csak
nagyon kis mértékű.

Bortkiewicz mutatta ki, hogy a bázis- és tárgyidőszaki súlyozású indexek számszerű értékének eltérése három tényezővel magyarázható:

– az egyedi árindexek relatív szórásával ( ),

– az egyedi volumenindexek relatív szórásával ( ) és

2
– a kétféle egyedi index közötti sztochasztikus kapcsolatot mérő lineáris korrelációs együtthatóval .

A kétféle súlyozású index hányadosa közötti összefüggés a Bortkiewicz-tétel szerint:

(A kétféle súlyozású index értéke tehát csak akkor egyezik meg, ha az egyedi ár- vagy az egyedi volumenindexek nem szóródnak, illetve az egyedi
ár- és volumenalakulás között nincsen korreláció.)

Már szó volt róla, hogy mindkét index elfogadható, egyaránt jól jellemzi az ár-, illetve a volumenváltozást, bár mindkettő meghatározott feltételezéssel
él. (Tárgyidőszakban is bázisidőszaki árak, vagy bázisidőszakban is tárgyidőszaki árak.) Abban az esetben, ha a két index értéke közötti eltérés
nem nagymértékű, elegendő csak az egyik alkalmazása. Nagyobb különbség esetén azonban célszerű a két alapforma eredményét átlagolni. Az
átlagolással ún. keresztezett indexformulák képezhetők. A gyakorlatban legtöbbször a Fisher-féle keresztezett formula kerül kiszámításra a kétféle
súlyozású index mértani átlagaként:

22
A lineáris korrelációs együttható két mennyiségi ismérv közötti kapcsolat szorosságát jellemzi. Határai: Tankönyvünk második kötetében foglalkozunk vele.

219
Érték-, ár- és volumenindexek

Fisher-féle indexek

Árindex

Volumenindex

Különböző indexformulák használhatók tehát, a közülük való választást az ún. indexpróbákkal lehet megalapozottá tenni. Az indexpróbák az
indexekkel szemben támasztott követelményeket fogalmazzák meg, melyek alapján az egyes mutatószámok értékelhetőek. A legfontosabb
indexpróbák a következők:

Összemérhetőségi próba: az index értéke legyen független a volumenadatok mértékegységétől.

Időpróba: ugyanazon indexformulával számított index értéke az időszakok felcserélése mellett reciproka legyen az index eredeti értékének.

Tényezőpróba: az ugyanazon típusú formulával számított volumen- és árindex szorzata legyen egyenlő az értékindexszel.

Arányossági (átlag-) próba: az index legyen átlaga az egyedi indexeknek.

Láncpróba: a valamely formulával számított láncindexek szorzata legyen egyenlő az ugyanazon formulával számítható bázisindexszel.

(Ez a próba a később tárgyalásra kerülő indexsorok ismeretében válik érthetővé.)

A Fisher-index tekinthető az egyik legjobb formulának, mert az tesz leginkább eleget az indexekkel szemben támasztott követelményeknek (l. a
következő pontot); az első négynek teljes mértékben, az utolsónak, a láncpróbának jó közelítéssel felel meg.

A Fisher-index mellett más keresztezett indexformulák is használatosak, így pl. az ún. Marshall–Edgeworth–Bowley-féle formulák:

220
Érték-, ár- és volumenindexek

Ez esetben nem az indexek eredményeit, hanem a súlyszámokat átlagolják.

5.4. Összefüggések az indexszámításban


5.4.1. Az indexszámok közötti összefüggések
Az alapvető összefüggés következtében, mely szerint az ár (p) és a mennyiség (q) szorzata az értéket adja, megállapítható, hogy az egyedi indexek
között hasonló kapcsolat található. Tehát:

Példánkban a TS 3354 TXT típusú tv-készülék esetében:

Ez az összefüggés nemcsak az egyes termékeknél, hanem a vizsgált termékcsoportok körében is fennáll. Az értékindex egyenlő az ár- és
volumenindex szorzatával, ha azok eltérő súlyozásúak. A Fisher-féle indexnél ez a feltétel nem szerepel, nincs is értelme.

(kerekítésből adódik az eltérés).

A vizsgált termékcsoportban 1993-ról 1994-re az átlagos, hozzávetőleges 14%-os árnövekedés és a kb. 12%-os volumencsökkenés hatására az
árbevétel 1,3%-kal emelkedett.

221
Érték-, ár- és volumenindexek

Az indexszámok közötti összefüggéseknek a gyakorlatban nagy jelentőségük van, mert ezek felhasználásával két index ismeretében a harmadik
előállítható. Általában a volumenindexet számítják ki ilyen közvetett módszerrel. Ennek oka, hogy az értékindex meghatározása nem ütközik
nehézségbe, hiszen a folyó áras forgalmi adatok teljes körűen rendelkezésre állnak, s az árindex kiszámítása is megoldható, bár többnyire
csak reprezentatív megfigyeléssel nyert adatokból. (Elvben az átlagos volumenváltozás is megállapítható reprezentatív felmérés eredményeként,
azonban csak nagyobb hibával és olyan körülményes módon, annyi többletmunkával, hogy a gyakorlatban ezért ezt nem alkalmazzák.) Az átlagos
volumenváltozás meghatározása tehát a legegyszerűbben az alábbi módon történhet:

A példában szereplő adatok szerint:

Az árindexszel való osztás az árváltozás kiszűrését jelenti. A folyó áras aggregátum árindexszel történő osztását deflálásnak hívják, mely a gazdasági
számításoknál gyakran alkalmazott eljárás. (Elvben csak a tárgyidőszaki súlyozású árindex töltheti be a deflátor szerepét, gyakorlatilag azonban
más, az árszínvonal változását jól jellemző index is használható.)

5.4.2. Az aggregátumok közötti összefüggések


Az aggregátumok hányadosaiból az indexeket lehetett meghatározni. Nemcsak a hányadosok, hanem az aggregátumok különbségeinek vizsgálata
is jól hasznosítható a közgazdasági elemzésben. Ily módon az értékváltozás ( ) abszolút számokkal jellemezhető, s kimutatható, hogy az árak ( ),
illetve a mennyiség változása ( ) erre milyen hatással voltak. Az aggregátumokból a következő különbségek képezhetőek:

A közöttük levő összefüggés :

222
Érték-, ár- és volumenindexek

A volumenváltozás és az árváltozás hatásának számszerűsítése a kétféle felbontással általában eltér egymástól. (Ez az alkalmazott
indexformulák különbözőségével magyarázható.) A a mennyiségváltozásból fakadó bevételváltozást mutatja, míg a az árváltozásból adódó
bevételmódosulást jelzi. A pozitív előjel esetén az árváltozás okozta lakossági többletkiadást, negatív előjel esetén megtakarítást adja.

Az előző példa alapján:

1993-ról 1994-re az árbevétel 91,5 ezer Ft-tal emelkedett. A volumencsökkenés 786,5 ezer Ft bevételkiesést okozott, míg az áremelkedés 878 ezer Ft
árbevétel-növekedést idézett elő. Az árnövekedésből eredő lakossági többletkiadás 878 ezer Ft, tehát az 1994-ben megvásárolt televíziómennyiség
1993-as árakon 878 ezer Ft-tal kevesebbe került volna.

Az indexek és az aggregátumok összefüggését az 5.1. ábra szemlélteti:

223
Érték-, ár- és volumenindexek

5.1. ábra -

5.4.3. Csoportosított sokaságra számított indexek


Gyakran előfordul, hogy az átlagos érték-, ár- és volumenváltozást olyan áruk körére kell meghatározni, melyeknél a termékek valamilyen
lényeges tulajdonság szerinti csoportosítása fontos lehet. Ez esetben az indexekből levonható helyes következtetésekhez szükséges az egyes
árucsoportok elkülönült vizsgálata is, tehát az érték-, ár-, volumenindex árucsoportonkénti kiszámítása. Ekkor az egyes csoportokra kapott indexeket
részindexeknek , az összes termékre vonatkozó indexet főindexnek nevezik. A rész- és főindexek között ugyanolyan összefüggés van, mint
a részátlagok és a főátlag vagy a részviszonyszámok és az összetett viszonyszám között. A főindex kiszámítása tehát többféle módon is történhet:

1. Az azonos jellegű aggregátumok (részaggregátumok) összegeinek hányadosaként:

224
Érték-, ár- és volumenindexek

2. A részindexek részaggregátumokkal súlyozott átlagaként:

– súlyozott számtani átlagformában

– súlyozott harmonikus átlagformában

ahol:

a j-edik termék érték-, ár- vagy volumenindexe,

a vizsgált részindex számlálójában szereplő aggregátum,

a nevezőben található aggregátum.

Az előző feladatoknál az eladott Videoton teletextes tv-készülékek érték-, ár- és volumenváltozását számoltuk ki. Az ott kapott eredmények
részindexként kezelhetők abban az esetben, ha valamennyi, az üzlet által forgalmazott Videoton tv-készülékre vonatkozó átlagos változást vizsgáljuk,
amely ez esetben főindexek segítségével történik (5.4. táblázat).

5.4. táblázat - A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket
forgalmazó üzletben

Árucsoport Forgalom (ezer Ft) Részindexek (%)

225
Érték-, ár- és volumenindexek

1994-ben

1993-ban 1994-ben az 1993-as

árakon

Teletextes
6 914,4 7 002,9 6 123,9 101,3 114,3 88,6
Videoton készülék
Nem teletextes
6 361,1 5 591,1 4 945,1 87,9 113,1 77,7
Videoton készülék
Összesen: 13 275,5 12 594,0 11 069,0 – – –

A Videoton televíziók forgalmának értéke tehát összességében 5,1%-kal csökkent annak következtében, hogy bár a teletextes készülékek forgalma
átlagosan 1,3%-kal nőtt, a nem teletextes televíziók értékesítése átlagosan 12,1%-kal esett vissza. A valamivel nagyobb részarányt képviselő
teletextes tv-k forgalomalakulása tehát erőteljesebb hatással volt az átlagra.

Az átlagos árváltozás a vizsgált termékcsoportnál a következőképpen alakult:

226
Érték-, ár- és volumenindexek

A két termékcsoport együttes volumenváltozása:

A forgalom 5,1%-os csökkenése tehát a két termékcsoport árainak átlagos 13,8%-os emelkedése és az eladott mennyiségük 16,6%-os visszaesése
miatt következett be.

Figyeljük meg, hogy a megfelelő főindexek az árucsoportokra számított részindexek közé esnek.

5.5. Az indexszámok gyakorlati alkalmazása


Az indexszámokat a gazdasági elemzésben nagyon sok területen alkalmazzák. Az értékindex segítségével elemezhető pl. a gazdasági egységek
termelési értékének, árbevételének, forgalmának változása, a felhasznált anyagok, energia stb. értékének változása, az export és import értékének
alakulása, a fogyasztás változása stb.

Az árindexek alkalmazási területe is igen széles körű. A termelés, forgalom, fogyasztás elemzésében egyaránt fontos szerepet játszik. Az alábbiakban
felhasználásának csak néhány lényeges aspektusa kerül kiemelésre.

A fogyasztói árindex az infláció általános mérőszáma és a gazdaság állapotának fontos jellemzője. A lakosság által vásárolt fogyasztási cikkek,
szolgáltatások árainak átlagos változását fejezi ki, így fontos szerepe van az életszínvonal mérésében. Meghatározása hazánkban olyan módon
történik, hogy az ún. fogyasztói kosárba került mintegy 1800 termék, szolgáltatás „reprezentáns” árait figyelik havonta több alkalommal, s ezen
árfeljegyzések számtani átlagát súlyozzák a háztartásoktól begyűjtött fogyasztási szerkezetadatokkal. A reprezentánsok egyedi árindexe a tárgyhavi
és bázishavi átlagárak hányadosa. A fogyasztói árindex a reprezentások egyedi árindexeinek súlyozott átlaga, mégpedig bázissúlyozású, éven
belül változatlan súlyozással. A magyar gyakorlatban a Laspeyres-típusú árindexet számolják, mert a lakossági adatszolgáltatási rendszer 12
ezer háztartást számláló reprezentatív mintájából nyert fogyasztási szerkezet aktuális adatai (a súlyszámok) csak bizonyos időeltolódással állnak
rendelkezésre. A fogyasztói kosár árindexén kívül a termékek meghatározott körére is kiszámolják az árváltozást.

Az árindex jelenleg három fokozatú csoportosításban készül:

– a termékek és szolgáltatások részletes csoportjai (ezek száma 160),

– összegzőcsoportok a részletes csoportokból (számuk 40),

227
Érték-, ár- és volumenindexek

– főcsoportok, melyek az összegzőcsoportokból épülnek fel (számuk 8–10).

A teljes lakossági fogyasztásra vonatkozó árindexen kívül az egyes rétegekre külön is kiszámítják az átlagos árváltozás mértékét.

Az árindexeket havonta közzéteszik, jelezve az előző év hasonló hónapjához, az előző év decemberéhez és a közvetlenül megelőző hónaphoz
viszonyított áralakulást. Az éves árindexek a tárgyévi átlagos árakat veszik alapul, s kétféle viszonyítással, bázis- és láncárindexekként is
meghatározásra kerülnek.

Az árindexet az indexáláshoz is felhasználják, azaz a különféle jellegű ki- vagy befizetési kötelezettségeket (pl. bérek, biztosítási díj) az inflációhoz
igazítják.

Az árstatisztikában lényeges az árarányok változásának vizsgálata is. Ez szintén az árindexek segítségével történik. A különböző termékek
árindexeinek összehasonlításával határozható meg az árolló.Azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonos
volumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe.

Az agrárolló a mezőgazdasági termékek értékesítési árindexének és a mezőgazdaságban felhasznált iparcikkek beszerzési árindexének hányadosa.

1993-ban Magyarországon például a mezőgazdasági termelői felvásárlási árak 18,5%-kal haladták meg az előző évit, míg a termelésben felhasznált
iparcikkek árai 20%-kal emelkedtek, tehát a két árindex hányadosából kiszámítható az agrárolló:

Ez azt jelenti, hogy 1993-ban 1,3%-kal magasabb volumenű mezőgazdasági termék eladása szükséges annyi bevétel eléréséhez, amely az 1992-
es szinttel azonos volumenű ipari termékek megvásárlását lehetővé teszi.

Az árollók másik jelentős alkalmazási területeként az ún. cserearány-mutatókat említhetjük. Ezek a gazdálkodó szervezetek által eladott termékek
árindexét viszonyítják a vásárolt termékek árindexéhez. E mutatók értéke akkor kedvező, ha 100% felett van. A külkereskedelmi cserearány mutatója
az ún. cserearányindex (terms of trade), az adott ország által exportált és az általa importált termékek árindexeinek hányadosa. A mutató értéke
azt fejezi ki, hogy az azonos volumenű export az importtermékek fogyasztásának milyen változását teszi lehetővé.

Hazánkban 1993-ban az importált termékek árai 9,4%-kal haladták meg az előző évi árakat, míg az exportált cikkeknél 11,9%-os áremelkedés
következett be. Így a cserearány-mutató a következőképpen alakult:

1993-ban 2,3%-kal nagyobb volumenű terméket importálhattunk volna, ha az exportból származó bevételt csak importra fordítjuk, tehát javult a
cserearány.

228
Érték-, ár- és volumenindexek

A volumenindexeket, mint már ismert, többnyire az árindexek segítségével számítják ki. A hagyományos felhasználási területeken túl pl. a fogyasztás
reálértékének vagy a reálkereseteknek az alakulását is mérhetik vele, abból fakadóan, hogy az értékváltozásból az árváltozás hatását kiszűrve csak
a volumenváltozás marad.

5.6. Indexsorok
Az eddigiek során az indexszámok csak két időszak adatainak az összehasonlítására szolgáltak. A dinamikus viszonyszámokhoz hasonlóan az
indexeket szintén ki lehet számítani hosszabb időszakra is. A kettőnél több időszakra vonatkozó indexek sorozatát indexsornak hívják.

Az indexsoroknak többféle fajtája különböztethető meg az alábbi szempontok alapján:

a) tartalma szerint (tehát, hogy milyen jelenség változását fejezik ki)

– értékindexsor,

– árindexsor,

– volumenindexsor;

b) a viszonyítás rendje szerint (a dinamikus viszonyszámokhoz hasonlóan)

– bázisindexsor;

– láncindexsor;

c) a súlyozás módja szerint az ár- és volumenindexsoroknál

– állandó súlyozású indexsor,

– változó súlyozású indexsor.

Az előzőek alapján tehát különböző indexsorokat lehet felírni, melyek konkrét kiszámítási módját néhány gyümölcs felvásárlására vonatkozó adatok
alapján mutatjuk be (5.5. táblázat).

5.5. táblázat - Néhány gyümölcs felvásárlására vonatkozó adatok az 1990–1993. években


Felvásárlás mennyisége Termelői felvásárlási átlagárak
Megne-
(1000 tonna) (1000 Ft/tonna)
vezés
1990 1991 1992 1993 1990 1991 1992 1993

229
Érték-, ár- és volumenindexek

Alma 462 268 277 237 10,4 13,8 10,9 8,8

Málna 15 10 12 6 33,3 35,3 76,7 142,9

Meggy 22 26 41 22 28,5 56,6 29,0 21,5

Szilva 18 18 17 7 11,3 22,1 12,3 14,2

A többféle indexsor meghatározásához célszerű egy összes lehetséges értékadatot ( ) tartalmazó táblát összeállítani oly módon, hogy az
egyes évek volumenadatait megszorozzuk valamennyi év áradataival. Így minden, összegzésre alkalmas aggregátum rendelkezésre áll, amely az
indexsorok kiszámításához szükséges (5.6. táblázat).

5.6. táblázat - Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva
1990 1991 1992 1993
A felvásárlás
évi árakon számítva (ezer Ft)
1990 6134,7 8548,1 7045,7 6937,7

1991 4064,6 5920,8 4663,6 4602,0

1992 4641,0 6942,5 5337,8 5275,3

1993 3370,7 4882,3 3767,6 3515,4

A táblázat adataiból néhány indexsor kiszámítását mutatjuk be.

Bázis-értékindexsor

ahol az idősor elemei: 0, 1, 2, ..., n;

230
Érték-, ár- és volumenindexek

lánc-értékindexsor

Figyeljük meg, hogy az értékindexekhez a táblázat „átlójában” szereplő értékadatokat használtuk fel.

Állandó súlyozású bázis-volumenindexsor (állandó súly a 0 időszak ára)

231
Érték-, ár- és volumenindexek

állandó súlyozású lánc-árindexsor (állandó súly a 0 időszak mennyisége)

változó súlyozású bázis-árindexsor

232
Érték-, ár- és volumenindexek

változó súlyozású lánc-volumenindexsor

Figyeljük meg, hogy a volumenindexsor egy-egy elemét mindig azonos oszlopban szereplő (tehát azonos árakon számított) értékadatokból
számítottuk. Az árindexek számításánál pedig a táblázat vízszintes sorában szereplő (azonos felvásárlási mennyiségre vonatkozó) értékadatok
alapján számítottuk ki az indexsor egy-egy elemét.

Az állandó súlyozású indexsornál tehát a súlyszám az indexsor minden egyes tagjánál azonos, míg változó súlyozásnál a súlyadatok indexenként
különbözőek. Attól függően, hogy mely időszak ár-, illetve volumenadata állandó, lehet az indexsor Laspeyres- vagy Paasche-típusúnak megfelelő.
Egyébként az indexsoroknál nem lehet egyértelmű Laspeyres- és Paasche-formuláról beszélni, csak az elvek követése szempontjából történhet a
besorolás. A változó súlyozású indexsoroknál az egyes tagok kiszámításánál a kétféle formula pontosan használható. Az előző példában a változó
súlyozású bázis-árindexsor elemei Paasche-típusúak, a volumenindexsor tagjai Laspeyres-típusúak. (Természetesen a súlyozás kérdése csak az
ár- és a volumenindexsoroknál merül fel.) A kétféle súlyozású indexsor számszerű eredményei eltérnek egymástól, de tartalmuk, mondanivalójuk
lényegileg megegyezik.

A különböző indexsorok más-más előnyökkel és hátrányokkal rendelkeznek.

Az állandó súlyozású indexsor számítása egyszerűbb, s amennyiben a legelső időszak mennyiségi, illetve áradata a súlyszám, az indexsor egymást
követő tagjait folyamatosan meg lehet határozni. Problémát a súlyok elavulása okoz, az, hogy a súlyarányok eltolódnak a tényleges arányoktól.
Ennek oka, hogy hosszabb időszak alatt az első időszak arányai nagymértékben megváltozhatnak, és a termékcserélődés következtében jelentősen
szűkülhet az összehasonlítható termékek köre is.

233
Érték-, ár- és volumenindexek

A változó súlyozású indexsor számítása bonyolultabb, de a súlyarányok jól követik a változásokat. A változó súlyozást elsősorban a láncindexeknél
használják.

Az állandó és a változó súlyozás előnyeinek összekapcsolására a gyakorlatban a kétféle súlyozást általában kombináltan alkalmazzák, ún.
szakaszosan állandó súlyú indexsort számolnak. Ez azt jelenti, hogy egy bizonyos időszakra (általában 5–10 év) a súlyadatokat rögzítik, majd az
időszak eltelte után megváltoztatják, felfrissítik azokat. A különböző periódusok indexeit pedig láncszerűen kapcsolják össze.

5.6.1. Az indexsorok közötti összefüggések


Az indexsorok rendszerében több összefüggés írható fel, melyek közül az alábbiakban a két legfontosabb került kiemelésre:

– az érték-, ár- és volumenindexsor közötti összefüggés és a

– bázis- és láncindexsorok közötti összefüggés.

1. Az érték-, ár-, volumenindexsor összefüggése szerint az ár- és volumenindexsor azonos időszakra vonatkozó tagjainak szorzata egyenlő az adott
időszak értékindexével. Ez az összefüggés azonban csak meghatározott feltételek mellett érvényesül:

a) változó súlyozású láncindexek között, ha az egyik indexsor Laspeyres-, a másik indexsor pedig Paasche-formulával került kiszámításra:

b) bázisindexsorok között, ha az egyik indexsor bázisidőszaki állandó súlyozású, a másik pedig a mindenkori tárgyidőszaki változó súlyozású
indexsor:

234
Érték-, ár- és volumenindexek

c) Fisher-formulával számított indexsorok között (bázis- és láncindexsoroknál egyaránt).

2. A bázis- és láncindexek összefüggése alapján a láncindexek szorzata egyenlő a bázisindexszel, illetve a két szomszédos bázisindex hányadosából
a láncindex meghatározható.

Az értékindexsorok között ez az összefüggés mindenkor fennáll, az ár- és volumenindexsoroknál azonban csak az állandó súlyozású indexsorok
esetében.

Állandó súlyozású árindexek összefüggése:

(pl. ha az n-edik időszak mennyiségeivel számítjuk ki mindegyik láncindexet)

Mivel a változó súlyozású indexsor tartalmi mondanivalóját tekintve megegyezik az állandó súlyozásúval, a fenti művelet – a képletszerű összefüggés
fennállása nélkül – a változó súlyozású indexsoroknál is elvégezhető.

Általában is megállapítható, hogy mivel a súlyozás módja nem érinti az index alapvető tartalmát, az indexekkel minden olyan művelet elvégezhető,
amely a megfelelő egyedi indexek között logikus.

5.7. Területi indexek


Az indexszámok, mint ahogyan arról szó volt, összehasonlító viszonyszámok. Összehasonlításra azonban nemcsak időben, hanem térben is sor
kerülhet. A területi összehasonlítás eredményeként kapott indexek a területi indexek.

A területi volumenindex azt fejezi ki, hogy az összehasonlítandó területeken a termelés, értékesítés mennyisége hányszorosa, hányad
része az összehasonlítás alapjául szolgáló terület termelésének, értékesítésének.

A területi árindex azt mutatja meg, hogy az egyik területen kialakult árszínvonal milyen arányban áll a másik terület árszínvonalával.

A területi értékindexet nem értelmezzük, az csak a területi volumenindex és területi árindex közötti összekötő kapocsként szerepel. Az előzőekben
tárgyalt bármely indexformula területi indexként is értelmezhető, a különbség csak annyi, hogy az összehasonlítandó időszakok helyett két területi

235
Érték-, ár- és volumenindexek

egység adatainak viszonyítására kerül sor. Az eddigi jelölésben a 0, 1 (bázis-, tárgyidőszak) vagy más értelmet kap (0, 1 terület), vagy megváltozik
pl. A-ra, B-re, az adott területek adatainak azonosítása céljából. A súlyszámok tehát A vagy B terület mennyiség-, illetve áradatai lehetnek, a bázis-
vagy beszámolási súlyok helyett. A másik lényeges különbség a területiindex-számítás és az időbeli összehasonlítás között az, hogy míg az egyes
időszakok adatai a viszonyítás során nem felcserélhetőek – mindig a későbbit hasonlítjuk a korábbihoz –, addig a területi indexeknél a sorrend nem
kötött. Bármelyik területi egység adatait viszonyíthatjuk a másikhoz és viszont. Ebből következik, hogy A/B relációjú összehasonlítás eredménye
reciprokviszonyban kell legyen a B/A relációjú összehasonlítás eredményével. Ez az ún. felcserélési próba, amely a már ismert időpróbának felel
meg. Másik követelmény a területi indexekkel szemben a tranzitivitás követelménye, ami az időszakok összehasonlítására használt indexeknél a
láncpróba volt. Ez azt jelenti, hogy két terület közvetlen összehasonlítása a közvetett összehasonlítással azonos eredményt kell, hogy adjon. (Azaz
A és C területek közvetlen viszonyításánál az A/C index a B területen keresztüli közvetett összehasonlításnál az A/B és a B/C indexek szorzatával
megegyező érték legyen.)

A különböző súlyozású indexformulák eredményei között lényegesen nagyobb eltérés lehet, mint az időbeli összehasonlításnál, ezért különösen
indokolt a Fisher-féle index használata. Az összehasonlítandó területeket A-val és B-vel jelölve

a területi árindex Fisher-formája :

a területi volumenindex Fisher-formája:

A területi indexek kiszámításának módját az alábbi példán mutatjuk be (5.7. táblázat).

5.7. táblázat - Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában
A város B város
felhozatal felhozatal
Termék átlagár átlagár
mennyisége mennyisége
megnevezése (Ft/kg) (Ft/kg)
(kg) (kg)
Burgonya 150 000 85,0 70 000 100,0

Sárgarépa 12 000 165,0 6 500 150,0

236
Érték-, ár- és volumenindexek

Vöröshagyma 20 000 42,0 12 000 45,0

Bab (száraz) 7 000 320,0 5 000 300,0

A két város felhozatalának összértéke mindkét város árain számolva

(ezer Ft-ban)

A felhozatal mennyisége
Városok A város B város
árain számítva
A város 17 810,0 19 800,0

B város 9 126,5 10 015,0

A táblázat adatai alapján a területi árindex tehát:

A vizsgált termékek árszínvonala a Fisher-index szerint 9,5%-kal volt alacsonyabb A városban B városhoz viszonyítva.

A területi volumenindexek a példa alapján:

237
Érték-, ár- és volumenindexek

A négy vizsgált termék piaci felhozatalának mennyisége az A városba a Fisher-index alapján átlagosan 96,4%-kal haladta meg B város felhozatalának
mennyiségét.

A területi indexnél – mint arról szó volt – a viszonyítási alap és a viszonyítás tárgya felcserélhetőek, ezért vizsgálható jelen esetben az is, hogy B
város piaci felhozatala A városhoz viszonyítva miként alakult. Pl.:

B város piaci felhozatalának árai a vizsgált cikkeknél tehát átlagosan 10,4%-kal voltak magasabbak A városhoz képest (a volumenalakulás ebben
a relációban hasonlóképpen vizsgálható).

Miután a kétféle viszonyítású indexek egymással reciprokviszonyban állnak, a számítás a következő módon is elvégezhető, pl. az árindexek esetében:

A területi indexek legfontosabb alkalmazási területe a nemzetközi összehasonlítás. Ez esetben a területi indexeknek olyan sajátossága is jelentkezik,
amely a különböző országok eltérő valutaegységéből fakad. Annak következtében, hogy az árindex számlálójának és nevezőjének nem azonos
a mértékegysége, az eredmény nem fejezhető ki százalékos formában. Az árindex ilyenkor a két ország valutái vásárlóerejének arányát fejezi ki
a vizsgált termékek vonatkozásában. Azt mutatja tehát, hogy egy adott (az összehasonlítás alapjául szolgáló) ország egységnyi valutája a másik
(összehasonlítandó) ország hány valutájával egyenlő az összehasonlított termékek körében. A volumenindex a különböző országok gazdasági
fejlettségének, a lakosság életszínvonalának összehasonlítását is szolgálhatja. Kimutatható pl., hogy az egy főre jutó fogyasztás volumene miként
alakul két ország vonatkozásában.

Amennyiben nem két, hanem több terület összehasonlítását végezzük el, az indexsoroknál leírt módon járhatunk el.

5.8. Gyakorlófeladatok
1. A Magyar Statisztikai Évkönyvből (KSH, 1994) valók az alábbi információk:

– A magyar háztartások összes élelmiszer-fogyasztása 1991-ben 374 Mrd Ft, 1992-ben pedig 452 Mrd Ft volt folyó áron számolva.

238
Érték-, ár- és volumenindexek

– Az élelmiszerek fogyasztói ára 1992-ről 1993-ra Magyarországon 29,2%-kal, Ausztriában pedig 2,9%-kal nőtt.

– A nyerskávé-behozatal 1993-ban 3487 millió Ft volt.

– Behozatali forgalmunk folyó áron számítva 1992-ről 1993-ra 32,3%-kal nőtt, kiviteli forgalmunk pedig 2,8%-kal csökkent.

– 1992-ről 1993-ra az importált termékek volumene átlagosan 20,9%-kal nőtt, az exportált termékekre vonatkozóan pedig átlagosan 13,1%-os
csökkenés volt tapasztalható.

– A külkereskedelmi forgalom egyenlege – folyó áron számítva – 1993-ban –342 576 millió Ft volt.

– 1990-ben Magyarországon 427 ezer db színes tv-t gyártottak. 1993-ra a gyártott mennyiség 45,1%-ra csökkent.

Feladat:

Értelmezzük az információkat!

2. Egy piaci árus feljegyezte néhány termékének fontosabb értékesítési adatait:

Eladott mennyiség Egységár (Ft/kg)


Mérték-
Termék márciusban áprilisban márciusban áprilisban
egység
Alma kg 150 130 100 120

Narancs kg 200 240 130 150

Burgonya kg 60 80 70 85

Tojás db 200 300 10* 12*

*Ft/db

Feladat:

a) Mennyi volt az árus bevétele az egyes termékekből, valamint összesen? Vizsgáljuk meg a változást is!

b) Hogyan változott márciusról áprilisra:

– az értékesítés volumene (termékenként),

239
Érték-, ár- és volumenindexek

– a termékek ára?

c) Mennyi volt a négy termék árszínvonal-változása? A kapott eredményt vessük össze a termékenkénti árváltozásokkal!

d) Számítsuk ki az együttes volumenváltozást

– az alapadatokból,

– a már kiszámított indexekből,

– az egyedi volumenindexek alapján!

A számításokat Laspeyres-formula szerint végezzük el!

e) Hány Ft-tal volt több az árus bevétele:

– az árváltozások miatt,

– az értékesített mennyiségek változása miatt?

3. A 4.5. Gyakorlófeladatok 11. példájához kapcsolódva számítsuk ki:

a) a forgalom értékének változását, és

b) elemezzük az erre ható tényezőket!

4. Egy háztartási gépeket is forgalmazó vállalkozás értékesítésére vonatkozó adatok:

Értékesített
Árbevétel (ezer Ft)
Árucikk mennyiség (db)
1993 1994 1993 1994
Hűtőszekrény 1400 1800 46 200 68 400

Hűtő-fagyasztó 300 400 12 000 18 000

Fagyasztószekrény 500 700 20 000 33 600

Fagyasztóláda 700 500 26 600 25 000

Feladat:

240
Érték-, ár- és volumenindexek

a) Vizsgáljuk az értékesítési forgalom alakulását árucikkenként és együttesen!

b) Számítsuk ki, hogyan változott az értékesítés mennyisége árucikkenként külön-külön és a felsorolt árucikkekre átlagosan!

c) Mutassuk ki az árszínvonal-változást és az ebből eredő forgalomnövekedést!

d) Melyik árucikknek nőtt legnagyobb mértékben az ára 1993-ról 1994-re?

5. Egy kisvállalkozás belkereskedelmi tevékenységére vonatkozó adatok:

Árbevétel Az értékesített A folyó áras


Árucsoport 1990-ben mennyiség árbevétel
(ezer Ft) 1995-ben az 1990. évi %-ában
A 3 000 140,0 154,0

B 8 000 120,0 126,0

C 1 000 150,0 150,0

D 10 000 95,0 114,0


Összesen 22 000 ... ...

Feladat:

a) Számítsuk ki a négy árucsoportra vonatkozóan az érték-, ár- és volumenindexet!

b) Számítsuk ki, hogy hány millió Ft-tal nőtt az árbevétel:

– az árváltozás miatt,

– az értékesített mennyiségek változása miatt!

c) Határozzuk meg az ellentétes súlyozású ár- és volumenindexeket! Magyarázzuk meg a megfelelő indexek eltérését!

6. A háztartások fogyasztására vonatkozó adatok:

Összes fogyasztás
Fogyasztási javak folyó áron Mrd Ft-ban Volumenindex*

241
Érték-, ár- és volumenindexek

1991 1992 (%)


Élelmiszerek 374 452 100,4

Italok, kávé, tea 143 165 99,6

Dohányáru 37 43 93,4

Ruházkodás 99 120 98,6


Együtt 653 780 ...

*Bázissúlyozású

Feladat:

a) Hány Mrd Ft-tal, illetve hány %-kal nőtt a fogyasztás nominálértékben?

b) Hogyan alakultak az árak az egyes fogyasztási javaknál, illetve átlagosan?

c) Hány Mrd Ft-tal nőtt a fogyasztás az árak növekedése miatt?

d) A fogyasztás csökkenő mennyiségei miatt hány Mrd Ft-tal lett kevesebb 1992-ben az összes fogyasztási kiadás?

7. Egy család 1992-ben összes kiadásának 30%-át élelmiszerekre, 20%-át ruházati cikkekre, 25%-át szolgáltatásokra, 15%-át tartós fogyasztási
cikkekre, 10%-át pedig egyéb dolgokra költötte.

A termékcsoportok árváltozásáról az alábbiak ismertek:

Árindex*
Kiadási csoport
1991=100%
Élelmiszerek 122

Ruházati cikkek 132

Szolgáltatások 142

Tartós fogyasztási cikkek 110

Egyéb 128

242
Érték-, ár- és volumenindexek

Összesen ...
*1992-es fogyasztási mennyiségekkel
számolva

A család éves jövedelme 1991-ben 380 ezer Ft, 1992-ben pedig 460 ezer Ft volt, és sem 1991-ben, sem 1992-ben nem volt megtakarításuk.

Feladat:

a) Hány %-kal nőtt a család jövedelme nominálértékben?

b) Hogyan változott a fogyasztási cikkek árszínvonala?

c) Hogyan változott a család reáljövedelme (jövedelmének vásárlóértéke)?

8. A nominálkeresetek alakulása Magyarországon:

Nominál átlagkereset*
Év
1980=100%
1990 249,9

1991 313,6

1992 380,4

1993 447,7

* Egy keresőre számítva

A fogyasztói árak 1990-ről 1991-re 35%-kal, 1991-ről 1992-re 23%-kal és 1992-ről 1993-ra további 22,5%-kal nőttek.

Feladat:

Hogyan alakultak a reálkeresetek 1990-hez képest, illetve évről évre?

9. Három termék értékesítésére vonatkozó adatok:

Értékesítési forgalom Mennyiségváltozás


Termék Árváltozás (%)
1993-ban (millió Ft) (%)

243
Érték-, ár- és volumenindexek

1993-ról 1994-re 1993-ról 1994-re

A 40 + 10 + 15

B 60 + 20 + 27

C 100 + 40 + 60
Együtt 200 ... ...

Feladat:

a) Számítsuk ki a volumenindexet mindkét súlyozással! Indokoljuk az eltérő eredményt, magyarázzuk meg a nagyságrendet!

b) Számítsuk ki a Fisher-féle árindexet! Ellenőrizzük számszerű nagyságát!

10. Egy kiskereskedő fontosabb áruinak mennyiségi és áralakulását vizsgálta. Az alábbi adatokat ismerjük:

Termék Volumenindex (%) Árindex (%)


A 102 110

B 105 130

C 110 150

Feladat:

Állapítsuk meg, hogy az alábbi megállapítások közül melyek lehetnek „igazak” és melyek „hamisak”:

a) A három termék árszínvonala nőtt.

b) A három termék mennyiségének növekedése átlagosan nem több, mint 10%.

c) A Paasche-súlyozású árindex kisebb árnövekedést mutat, mint a Laspeyres-súlyozással számított index.

d) Az együttes árindex 110 és 150% között helyezkedik el.

e) A bázisidőszak forgalmiérték-adatainak ismeretében a kiskereskedő pontosan ki tudja számítani valamelyik árindexet (a három termékre).

f) A három termékre számított értékindex 100%-nál kisebb.

244
Érték-, ár- és volumenindexek

g) A Paasche-súlyozású volumenindex nagyobb, mint a Laspeyres-súlyozású .

11. A piacgazdálkodást folytató országokkal kapcsolatos külkereskedelmi forgalom adatai:

Behozatali forgalom Kiviteli forgalom


Árindex
Árindex
Mrd Ft
Év Év Mrd Ft folyó áron
folyó áron Előző
Előző év=100%
év=100%
1985 175 – 1985 162 –

1986 186 105,5 1986 154 98,2

1987 209 110,8 1987 188 110,6

1988 234 114,0 1988 240 114,9

1989 291 114,6 1989 301 116,9

1990 344 116,2 1990 376 114,6

1991 637 126,5 1991 584 120,3

1992 649 111,7 1992 646 168,8

1993 805 110,9 1993 599 110,3

Az árindexek Fisher-formulával kerültek kiszámításra.

Feladat:

a) Vizsgáljuk meg a folyó áras forgalmak alakulását 1985-höz viszonyítva, valamint évről évre! Milyen indexsorokat számoltunk?

b) Vizsgáljuk meg a behozatali, valamint a kiviteli forgalom volumenének alakulását évről évre! Állapítsuk meg az indexsorok típusát!

c) Számítsuk ki, hogy 1985 és 1993 között melyik területen (az importnál vagy az exportnál) volt nagyobb az árváltozás átlagos növekedési üteme!

d) Számítsuk ki a cserearány-mutatókat!

245
Érték-, ár- és volumenindexek

12. Egy vállalat termelésének alakulására vonatkoznak az alábbi adatok:

A termelés értéke (millió Ft)


Év 1990 1991 1992 1993
évi áron
1990 120 124 130 140

1991 117 120 126 132

1992 115 119 124 130

1993 121 124 126 135

Feladat:

a) Vizsgáljuk meg a termelési érték változását!

b) Számítsunk állandó (1992-es) súlyozású lánc-volumenindexeket! Mutassuk be a lánc- és a bázisindexek közötti összefüggést!

c) Számítsuk ki a változó súlyozású lánc-árindexsor elemeit a Laspeyres- és a Paasche-féle súlyozásnak megfelelően is! Magyarázzuk meg az
1993-ra számított indexek eltérését!

246
A. függelék - Irodalom
Hajdú–Pintér–Rappai–Rédey: Statisztika I–II. JPTE, Pécs, 1994.

Hunyadi László–Vita László: Statisztika I. Aula Kiadó, Budapest, 1991.

Hunyadi László–Mundruczó György–Vita László: Statisztika II. Aula Kiadó, Budapest, 1992.

Kerékgyártó Györgyné–Mundruczó György: Statisztikai módszerek a gazdasági elemzésben. Aula Kiadó, Budapest, 1995.

Korpás Attiláné–Molnár Máténé–Szűts István: Általános statisztika I. rész. Tankönyvkiadó, Budapest, 1992.

Köves Pál–Párniczky Gábor: Általános statisztika I–II. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.

247
6. fejezet - Tárgymutató
adat

alap~

leszármaztatott ~

adatfelvétel

reprezentatív ~

részleges ~

teljes körű ~

aggregálás

aggregátum

agrárolló

aszimmetria

~ mérőszámai

asszociáció

~s együttható

Cramer-féle ~

Csuprov-féle ~

Yule-féle ~

ár

árindex

248
Tárgymutató

egyedi ~

Fisher-féle ~

fogyasztói ~

Laspeyres-féle ~

Marshall–Edgeworth–Bowley-féle

Paasche-féle

területi

árolló

átlag

fő~

harmonikus ~

kronologikus ~

mértani ~

négyzetes ~

rész~

számtani ~

~ tulajdonságai

átlagár

~változás

Bortkiewicz-tétel

bot-ábra

249
Tárgymutató

cserearány-index

csoportosítás

deflálás

determinációs hányados

egység (egyed)

megfigyelési

számbavételi

eltérés-négyzetösszeg

belső ~

külső ~

teljes ~

értékindex

egyedi ~

értékösszeg

kumulált ~

relatív ~

~sor

fejlődés átlagos mértéke

fejlődés átlagos üteme

főátlag

~index

250
Tárgymutató

~ok hányadosának elemzése

~ok különbségének elemzése

főindex

függetlenség

függvényszerű kapcsolat

gyakoriság

együttes ~

kumulált ~

perem~

relatív ~

~i eloszlás

~i megoszlás

~i poligon

~i sor

helyzetmutatók

hiba

abszolút ~

relatív ~

hibakorlát

hisztogram

idősor 82

251
Tárgymutató

állapot~

tartam~

indexpróbák

indexsor

ár~

érték~

volumen~

indexszám

ismérv

alternatív ~

diszkrét ~

folytonos ~

időbeli ~

közös ~

megkülönböztető ~

mennyiségi ~

területi ~

~változat

kérdőív

koncentráció

~s együttható

252
Tárgymutató

korreláció

~s hányados

~s tábla

kördiagram

kumulálás

kvantilis

~ eloszlás

kvartilis

alsó ~

felső ~

Lorenz-görbe

medián

mérési skála

arány~

intervallum~

névleges ~

sorrendi ~

módusz

mutatószám

oszlopdiagram

osztályköz

253
Tárgymutató

~határok

~ös gyakorisági sor

osztályközépső

összehasonlítás

összetételhatás-index

összetételhatás-különbség

rangsor

részátlagindex

részhatáskülönbség

részindex

sokaság

álló ~9

diszkrét ~

folytonos ~

fő~

mozgó ~

rész~

véges ~

végtelen ~

sor

csoportosító ~

254
Tárgymutató

idő~

leíró ~

mennyiségi ~

minőségi ~

összehasonlító ~

területi ~

statisztika

leíró ~

statisztikai következtetés

statisztikai tábla

csoportosító ~

egyszerű ~

kombinációs ~

kontingencia~

~dimenziószáma

szórás

~hányados

~négyzet-hányados

szórásnégyzet

belső ~

külső ~

255
Tárgymutató

teljes ~

~-felbontás

szóródás

~ mutatói

átlagos eltérés

átlagos különbség

relatív szórás

sztochasztikus összefüggés

vegyes kapcsolat

viszonyszám

bázis~

dinamikus ~

intenzitási ~

koordinációs ~

lánc~

megoszlási ~

összetett ~

rész~

volumenindex

egyedi ~

Fisher-féle ~

256
Tárgymutató

Laspeyres-féle ~

Marshall–Edgeworth–Bowley-féle ~

Paasche-féle ~

területi ~

vonaldiagram

257

You might also like