Professional Documents
Culture Documents
Általános Statisztika
Általános Statisztika
Havasy, György
Molnár, Máténé
Szunyogh, Zsuzsanna
Tóth, Mártonné
Korpás, Attiláné
Csernyák, László
Általános statisztika I
Havasy, György
Molnár, Máténé
Szunyogh, Zsuzsanna
Tóth, Mártonné
Korpás, Attiláné
Csernyák, László
Szerzők:
A gyakorlófeladatokat:
Szakmai lektor:
A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!
Tartalom
1. A statisztika alapfogalmai .......................................................................................................................................................................... 1
1.1. A statisztika tárgya és szerepe ....................................................................................................................................................... 1
1.2. A statisztikai sokaság és ismérv ...................................................................................................................................................... 2
1.3. Statisztikai adat .............................................................................................................................................................................. 6
1.4. Statisztikai csoportosítás és összehasonlítás ................................................................................................................................. 10
1.5. Viszonyszámok ............................................................................................................................................................................. 15
1.6. Átlagok ......................................................................................................................................................................................... 18
1.7. Gyakorlófeladatok ......................................................................................................................................................................... 25
2. Egy ismérv szerinti elemzés .................................................................................................................................................................... 30
2.1. A mennyiségi ismérv szerinti elemzés ........................................................................................................................................... 30
2.1.1. A mennyiségi ismérv .......................................................................................................................................................... 30
2.1.2. Gyakorisági sorok .............................................................................................................................................................. 32
2.1.3. Értékösszegsor .................................................................................................................................................................. 41
2.1.4. A gyakorisági sorok grafikus ábrázolása ............................................................................................................................. 47
2.1.5. Helyzetmutatók .................................................................................................................................................................. 54
2.1.6. Szóródási mutatók ............................................................................................................................................................. 71
2.1.7. Az aszimmetria mérőszámai .............................................................................................................................................. 81
2.1.8. A koncentráció elemzése ................................................................................................................................................... 83
2.2. Az időbeli ismérv szerinti elemzés ................................................................................................................................................ 87
2.2.1. Idősorok ............................................................................................................................................................................ 87
2.2.2. Dinamikus viszonyszámok .................................................................................................................................................. 89
2.2.3. Az idősorok grafikus ábrázolása ......................................................................................................................................... 93
2.2.4. Az idősorok elemzése átlagokkal ........................................................................................................................................ 94
2.3. Gyakorlófeladatok ....................................................................................................................................................................... 100
3. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése .............................................................................................. 107
3.1. A statisztikai táblákról általában ................................................................................................................................................... 107
3.2. Az egyszerű táblák elemzése ...................................................................................................................................................... 110
3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása ................................................................... 111
3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása ......................................................................................................... 117
3.3. A csoportosító táblák elemzése ................................................................................................................................................... 123
3.3.1. Rész- és összetett viszonyszámok ................................................................................................................................... 124
3.3.2. Szerkezet- és dinamikai változás vizsgálata ...................................................................................................................... 127
3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése .................................................................................................... 133
3.4.1. Függvényszerű kapcsolat. Függetlenség ........................................................................................................................... 139
3.4.2. Az asszociáció szorosságának mérése ............................................................................................................................. 141
iii
Általános statisztika I
iv
Az ábrák listája
2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája ...................................................................................................................... 48
2.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja ................................................................................................................ 49
2.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok ............................................................................. 50
2.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja .......................................................................................................... 52
2.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja ................................................................................................... 53
2.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja .............................................................................................. 54
2.7. ............................................................................................................................................................................................................. 55
2.8. ............................................................................................................................................................................................................. 56
2.9. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 58
2.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése ...................................................................... 69
2.11. ........................................................................................................................................................................................................... 71
2.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe) ................................................................................................. 86
2.13. A takarékbetét-állomány alakulása ...................................................................................................................................................... 93
2.14. A Magyarországra érkező turisták számának alakulása ........................................................................................................................ 94
2.15. Az épített lakások számának alakulása ............................................................................................................................................... 98
3.1. A statisztikai táblák típusai .................................................................................................................................................................. 110
3.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva ................................................................................................. 121
3.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva ................................................. 121
3.4. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 132
3.5. A lakásállomány szobaszám szerinti összetételének alakulása ............................................................................................................. 133
3.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat ................................................................................... 168
5.1. ........................................................................................................................................................................................................... 224
v
A táblázatok listája
1.1. Példák a sokaságokra ............................................................................................................................................................................ 3
1.2. Csoportosító sor általános sémája ........................................................................................................................................................ 10
1.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban ............................................................................... 11
1.4. A népesség megyék szerinti megoszlása 1994. január 1-jén .................................................................................................................. 12
1.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál ............................................................................................................. 14
1.6. Az 1 főre jutó GDP néhány európai országban 1993-ban ....................................................................................................................... 14
1.7. A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén .......................................................................................... 16
1.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál ................................................................................................ 17
1.9. Magyarország 1993. évi idegenforgalmát jellemző adatok ...................................................................................................................... 17
3
2.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m -ben) .................................................. 30
3
2.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben) ........................................................................................................ 31
2.3. A gyakorisági sorok általános sémája ................................................................................................................................................... 33
2.4. A lakások szobaszám szerinti eloszlása ................................................................................................................................................ 35
2.5. A társasház lakásainak megoszlása a vízfogyasztás szerint ................................................................................................................... 36
2.6. A lakások vízfogyasztás szerinti megoszlása ......................................................................................................................................... 37
2.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában .............................................................................................. 38
2.8. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 39
2.9. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................... 40
2.10. Az értékösszegsor általános sémája .................................................................................................................................................... 41
2.11. A település háztartásainak taglétszám szerinti eloszlása ...................................................................................................................... 42
2.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint .......................................................................................... 42
2.13. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 43
2.14. Munkatábla az osztályközép meghatározásához .................................................................................................................................. 44
2.15. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 45
2.16. Az összes vízfogyasztás megoszlása .................................................................................................................................................. 46
2.17. A társasház vízfogyasztására vonatkozó adatok .................................................................................................................................. 47
2.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint ......................................................... 50
2.19. Munkatábla a medián becsléséhez ...................................................................................................................................................... 61
2.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok ....................................................................................... 63
2.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok ......................................................................................... 65
2.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás) .................................................................................... 70
2.23. Munkatábla az átlagos eltérés és a szórás számításához ..................................................................................................................... 75
2.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői ......................................................................................................................... 81
2.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén ........................................... 84
2.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva) ..................................................................................... 85
vi
Általános statisztika I
vii
Általános statisztika I
viii
1. fejezet - A statisztika alapfogalmai
1.1. A statisztika tárgya és szerepe
A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információra
van szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek és
egyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának.
A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység.
A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenység
úgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, a
termények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vette
kezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak az
egyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve – amihez nagy lendületet
adott a valószínűség-számítás kialakulása és tételeinek elterjedése – önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellett
széles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntések
előkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is.
A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása,
elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése.
A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana.
A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatával
foglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, az
energiatermelés, a lakosság fogyasztása stb.
A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikai-statisztikai módszerek. A statisztikai
módszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést.
A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Ide
sorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredmények
áttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait
(tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majd
csoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb.
A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük.
1
A statisztika alapfogalmai
A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körű
megfigyelés túl költséges – így gazdaságtalan – és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylag
kis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire,
tulajdonságaira.
Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségének
ellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggések
vizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagy
azok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét.
Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabban
használt elemzési eszközöket tárgyalja.
A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát.
Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkel
általánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja.
Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb.
A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket – a halmaz elemeit – a
sokaság egységeinek nevezzük.
Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya;
tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzett
egységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb.
Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrét
sokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaság
egy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb.
A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatva
1 2
értelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás) és a vándorlási különbözet miatt állandóan változhat. Ezért e
1
Az élveszületések és halálozások különbsége.
2
A statisztika alapfogalmai
3
sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor) értelmezhető, „ragadható meg”. Ugyanakkor a Videoton-gyár termelése –
mivel a termelés egy folyamat – időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Az
időpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknak
nevezzük.
A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesen
sokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számú
egyed megfigyelésével végezzük.
született gyermekek
Magyarország 1995. évi egy liter (hektoliter, folytonos, mozgó,
üveg stb.) véges
sörfogyasztása sörfogyasztás
A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető.
Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok.
Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területi
elhelyezkedés, a vállalkozás profilja.
2
A megyébe letelepülő és elköltöző népesség különbsége.
3
Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni.
3
A statisztika alapfogalmai
Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb.,
a gépkocsi fogyasztása esetén pedig számadatok.
Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattal
rendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyi
változata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők.
Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységei
egyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznek
egymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük.
Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I.
évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozás
időpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elért
pontszáma stb.
Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg.
Az ismérvek fajtái:
– mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük.
4
A statisztika alapfogalmai
Mérési szintek
A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetséges
változatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1;
nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azaz
mérésének tekinthető.
A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezek
bizonyos tulajdonságaihoz.
– névleges skála,
– sorrendi skála,
– intervallumskála,
– arányskála.
A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségi
ismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyen
nominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják,
közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelme
nincs.
A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatók
osztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán – bár a sorszámok
közötti különbség azonos (egy-egy) – az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyre
sorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésből
származó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendisége
kerül kihasználásra.
Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valós
információt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározása
önkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsius-fok
(pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak.
A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 °C-os és a + 5 °C-os hőmérséklet összege + 25 °C, vagy
hogy a 20 °C-os hőmérséklet kétszerese a 10 °C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető.
5
A statisztika alapfogalmai
Pl. az 5 °C és a 10 °C közötti különbség azonos a 15 °C és 20 °C közötti különbséggel. A 20 °C és 30 °C közötti különbség kétszerese az előbbi
bármelyik különbségnek.
Az arányskálán történő mérés – a legmagasabb mérési szint – nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont a
tulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhez
szükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb.
A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérési
eredmény.
A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adat
tehát nem pusztán a számérték maga.
Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt;
1992-ről 1993-ra az
Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma).
Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992.
december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat:
Statisztikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő
(pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk.
Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órára
jutó termelés stb.
A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk.
6
A statisztika alapfogalmai
– Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntéseket
hozhatunk.
– Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatok
alakításában.
E követelményeknek – az elfogadható pontosság, a gyorsaság és a gazdaságosság – egy időben általában tökéletesen megfelelni nem lehet
(például a gyorsaság a pontosság ellen hat).
Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások,
nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásai
stb.)
A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetben
megelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtása
előtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennek
elmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseket
eredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát az
adatgyűjtéstől kezdve az adatközlésig.
Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaság
megfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges.
A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani.
A teljes körű megfigyelések jellegzetes példái a népszámlálások.
A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellel
lehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaság
teljes körű megfigyelése jelentős költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabb
a teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is.
A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek.
Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaság
kiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot.
A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintából
származó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk.
E mintából való következtetés – éppen a felvétel részlegessége miatt – csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk.
7
A statisztika alapfogalmai
Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várható
termésmennyiség becsléséhez, a közvélemény-kutatásoknál stb.
A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyon
rossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése.
Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, és
az önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók az
alapsokaságra.
A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatív
megfigyelés.
Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak.
A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyát
képező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat)
gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén a
megfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók.
A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat.
A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alapos
szakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nem
eléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást.
Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket,
fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák.
Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibák
szinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat és
a hibákkal torzított mért adat egymástól eltér.
A valóságos adat (A) és a mért adat különbségét a statisztikai adat abszolút hibájának nevezzük és a-val jelöljük:
A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynél
az abszolút hiba biztosan nem nagyobb.
8
A statisztika alapfogalmai
Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának nevezzük. Így minden statisztikai adat megadható az módon. Ez a
megadási mód arra utal, hogy a valóságos adat (A) valahol az és határok között helyezkedik el.
A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyos
nagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikáns
számjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el.
Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban a
legutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke . (Ez a közlési mód azt sugallja, hogy az utolsó három – százas, tízes, egyes
helyi értékű – számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.)
Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani.
9
A statisztika alapfogalmai
A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan)
lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Így
elkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk.
A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körű
információt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerint
osztályoznunk, csoportosítanunk kell.
A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. E
két követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik – de csak egy – kialakított osztályba.
Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzése
nem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nem
egyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozások
tevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú „listát” kapnánk, ami
nehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt.
A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat – szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozási
rendszereket – alkalmazzák.
Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat):
10
A statisztika alapfogalmai
Összesen N
Tehát
A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorok
képzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával.
1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban
Utazás jellege Külföldiek száma
(E fő)
Turista 22 804
Kiránduló 11 719
11
A statisztika alapfogalmai
Átutazó 6 076
Összesen 40 599
12
A statisztika alapfogalmai
Veszprém
Zala
Összesen 10 276 968
Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Ennek
lényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjuk
területi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.).
K: komfortos,
FK: félkomfortos,
A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó.
13
A statisztika alapfogalmai
Összehasonlítás
Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamata
az IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy a
devizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosát
számítjuk ki.
Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (A
kamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.)
Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket – a
csoportosító sorokhoz hasonlóan – az ismérvek fajtája szerint is megkülönböztethetünk.
A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat).
Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sort
szemléltet.
14
A statisztika alapfogalmai
Albánia 340
Ausztria 23 120
Hollandia 20 710
Lengyelország 2 020
Magyarország 3 300
Németország 23 560
Portugália 7 890
Románia 1 120
Spanyolország 13 650
Svájc 36 410
Szlovákia 1 900
1.5. Viszonyszámok
A csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám.
Képlettel:
ahol V: a viszonyszám,
A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból.
15
A statisztika alapfogalmai
Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, a
koordinációs és a dinamikus viszonyszámok.
A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki.
1.7. táblázat - A 20–24 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén
Nem Népesség száma (fő)
Férfi 372 425
Nő 354 289
Összesen 726 714
– a férfiak aránya:
– a nők aránya:
A 20–24 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén.
16
A statisztika alapfogalmai
1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál
Időpont Árfolyam (Ft/DEM)
1994. július 10. 66,12
A különböző fajta, általában különböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük.
Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. E
viszonyszámok általában két – egymással valamilyen kapcsolatban álló – sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1-
jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt.
A különböző fajta, különböző mértékegységű – de egymással kapcsolatban álló – adatokat is statisztikai sorba rendezhetjük. Az így képzett sort
leíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egy
vállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példával
szemléltetjük (1.9. táblázat).
17
A statisztika alapfogalmai
1.6. Átlagok
A viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni.
Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségi
ismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetes
átlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg.
2 , 6 , 4 , 2 , 6 , 4 , 6 , 2 , 5 , 6.
Számtani átlag
A számtani átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad.
Tehát
Adataink alapján:
18
A statisztika alapfogalmai
Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot:
Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó
értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás -ig terjed. (Továbbra is 10 átlagolandó
értékkel dolgozunk, de ezeket csoportba soroltuk be.)
(gyakorisága)
2 3
4 2
5 1
6 4
Összesen 10
19
A statisztika alapfogalmai
A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a
gyakoriságokat elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket -vel jelölünk:
Jellemző, hogy
Példánkban:
2 0,3
4 0,2
5 0,1
6 0,4
Összesen 1,0
Számszerűen:
Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja:
20
A statisztika alapfogalmai
b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az intervallumban hol helyezkedik el.
Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb a
súlyaránya, akkor az átlag az intervallum felső határához esik közelebb.
A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak.
Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák
(különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható:
2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagy
ahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos.
Tehát
21
A statisztika alapfogalmai
A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla:
Ebből:
3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg.
Tehát, ha ( ), akkor .
Ugyanis
Tehát, ha ( ), akkor
Ugyanis
Harmonikus átlag
Aharmonikus átlag (jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad.
22
A statisztika alapfogalmai
Tehát
Példánkban:
Súlyozott formában:
Adataink alapján:
Mértani átlag
Amértani átlag(jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok szorzata változatlan marad.
Tehát:
23
A statisztika alapfogalmai
Példánkban:
Súlyozott formában:
Adataink alapján:
Négyzetes átlag
A négyzetes átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad.
Tehát:
Példánkban:
24
A statisztika alapfogalmai
Súlyozott formában:
Adataink alapján:
Két nemnegatív szám számtani és mértani közepének összehasonlításáról már középiskolában is volt szó, itt bizonyítás nélkül közöljük a különböző
átlagok közötti összefüggéseket.
Ha ugyanazokból az átlagolandó értékekből, azonos súlyarányokkal számítunk különböző átlagokat, közöttük az alábbi nagyságrendi viszony áll fenn:
Példánkban:
(Az átlagok között egyenlőség csak akkor fordulhat elő, ha minden átlagolandó érték egyforma.)
1.7. Gyakorlófeladatok
1. A főiskolai hallgatók anyagi és szociális helyzetét kívánjuk felmérni.
Feladat:
25
A statisztika alapfogalmai
c) Milyen ismérvek vannak az egyes kérdések mögött? Nevezzük meg ezeket, és adjuk meg ezek néhány lehetséges változatát!
2. Néhány sokaság:
Feladat:
Nő 5069
26
A statisztika alapfogalmai
Összesen 8800
Feladat:
1986 5580
1987 5595
1988 5559
1989 5519
1990 5496
1991 5404
1992 5202
Feladat:
b) Számítsuk ki, hogy mennyi egy-egy adat abszolút, illetve relatív hibakorlátja!
5. A hazánkba érkező turisták közül a legtöbben Romániából (5498 ezer fő), Németországból (2838 ezer fő) és Jugoszlávia utódállamaiból (2585
ezer fő) érkeztek 1992-ben.
Ismerjük továbbá, hogy Európából összesen 16 688 ezer fő, Ázsiából 151 ezer fő, Afrikából 20 ezer fő, Amerikából 304 ezer fő, Ausztráliából és
Óceánia országaiból pedig 25 ezer turista érkezett.
Feladat:
27
A statisztika alapfogalmai
– 1992-ben 25 807 lakás épült Magyarországon. A lakásépítések kedvezőtlen alakulását jellemzi, hogy 1970-hez képest 67,85%-kal épült kevesebb
lakás. Hány lakás épült 1970-ben?
– Az orvosellátottság jellemzésére kiszámított mutató számszerű értéke 1980-ban 28,8; 1992-ben 39,6 orvos/tízezer lakos.
– Az ipari ágazatban a maximum 500 főt foglalkoztató vállalkozások átlagos árbevétele 137 millió Ft volt 1992-ben.
Feladat:
Nevezzük meg az itt szereplő viszonyszámok fajtáját, adjuk meg kiszámítási módját!
7.
16 3
20 1
Feladat:
28
A statisztika alapfogalmai
Feladat:
a) Rendeljünk ezen átlagolandó értékek mellé súlyokat többféleképpen úgy, hogy a súlyok összege először 20, majd 50, 10 és 7 legyen, továbbá
a kapott átlagok mindig kisebbek legyenek a megelőzőnél!
29
2. fejezet - Egy ismérv szerinti elemzés
2.1. A mennyiségi ismérv szerinti elemzés
2.1.1. A mennyiségi ismérv
A mennyiségi ismérvek rendkívül nagy szerepet töltenek be a statisztikai elemző munkában. A mennyiségi ismérveket változóknak,
lehetséges kimeneteleiket (ismérvváltozataikat) ismérvértékeknek nevezzük. Az ismérvértékek intervallum- vagy arányskálán mért, valamilyen
mértékegységgel bíró számértékek.
A diszkrét mennyiségi ismérv csak véges vagy megszámlálhatóan végtelen, egymástól jól elkülönülő értéket vehet fel.
A folytonos mennyiségi ismérv egy adott intervallumon belül bármilyen, tehát kontinuumszámosságú értéket felvehet.
A lakásokat például (a megfigyelés időpontjában) jellemezhetjük szobaszámuk és alapterületük szerint. A lakások szobaszáma csak pozitív egész
2
szám lehet, tehát diszkrét mennyiségi ismérv. A lakások alapterülete egy adott intervallumban (pl. 50 és 55 m között) bármilyen értéket felvehet,
tehát folytonos mennyiségi ismérv.
A diszkrét mennyiségi ismérv értékei – elvileg, de általában gyakorlatilag is – pontosan, a folytonos mennyiségi ismérv értékei mindig csak bizonyos
pontosságra kerekítve adhatók meg.
2 2
Például a lakások alapterülete megadható két tizedes pontossággal: 53,78 m , ugyanez egy tizedes pontossággal: 53,8 m , egész számra kerekítve:
2 2
54 m . Ezért két háromszobás lakás szobaszáma biztosan azonos, de két 54 m -es lakás alapterülete már nem biztos, hogy „pontosan” azonos (az
2 2 2
egyik lehet 53,78 m , a másik 54,11 m , de a mérési – kerekítési – pontosság miatt mindkettőt 54 m -nek tekintjük).
Ha egy sokaságot valamilyen mennyiségi ismérv szerint vizsgálunk, akkor első lépésként általában az ismérvértékeket sorba rendezzük, ún. rangsort
készítünk.
30
Egy ismérv szerinti elemzés
10 34 22 26 20
20 40 18 16 22
23 26 25 17 21
16 16 31 19 15
31 17 30 21 23
24 28 22 33 18
22 29 19 24 27
20 21 17 32 17
18 12 19 11 36
3
2.2. táblázat - A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben)
10 17 20 23 29
11 17 21 23 30
12 18 21 23 31
14 18 21 24 31
15 18 21 24 32
16 19 22 25 33
16 19 22 26 34
16 19 22 26 36
17 20 22 27 36
31
Egy ismérv szerinti elemzés
17 20 23 28 40
3
A lakások vízfogyasztása folytonos mennyiségi ismérv, a rangsorban található azonos értékek (pl. négy lakásnál 21 m a fogyasztás) 1
valószínűséggel csak a mérési pontosság miatt nem különböznek egymástól.
Ahhoz, hogy a sokaság összetételéről, szerkezetéről, belső arányairól áttekinthető képet kapjunk, az adatokat (ismérvértékeket) tömörítenünk kell.
Az adatokban rejlő információk tömörítésének, sűrítésének legelterjedtebb módja a sokaság egységeinek mennyiségi ismérv szerinti osztályozása
(csoportosítása). A rangsort általában éppen abból a célból készítjük, hogy megkönnyítse a sokaság egységeinek mennyiségi ismérv szerinti
osztályozását.
Az osztályozás eredménye egy csoportosító sor, melynek általános sémáját az 1.4. alfejezetben már megismertük (1.2. táblázat). Ebben az esetben
a ( ) osztályok a mennyiségi ismérv lehetséges értékeinek részhalmazai. Ha az ismérvnek kevés változata van (pl. a lakások szobaszáma),
akkor általában egy-egy ismérvváltozat képez egy-egy osztályt. Ha az ismérvváltozatok száma nagy (pl. ha a lakásokat alapterületük szerint, vagy
2
az aktív keresőket havi keresetük szerint csoportosítjuk), akkor az osztályok egynél több ismérvértéket magukba foglaló intervallumok (pl. 50–55 m
közötti alapterület, 20 000–25 000 Ft közötti kereset stb.), melyeket osztályközöknek nevezünk.
Az 1.2. táblázatból látható, hogy a csoportosító sor tartalmazza a osztályok mellett a gyakoriságokat is.
A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik.
relatív gyakoriságokat is, melyek nem mások, mint a gyakoriságokból számított megoszlási viszonyszámok. A relatív gyakoriságokat általában
A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányad
része (hány százaléka) tartozik.
32
Egy ismérv szerinti elemzés
A mennyiségi ismérv szerinti osztályozás eredményeként kapott speciális csoportosító sort gyakorisági sornak nevezzük. Ha az osztályok egyetlen
ismérvértékből állnak, a gyakorisági sort gyakorisági eloszlásnak, röviden eloszlásnak nevezzük, más esetekben gyakorisági megoszlásnak,
1
röviden megoszlásnak nevezzük .
Az eloszlás, illetve a megoszlás, mint a neve is jelzi, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között.
Mint látni fogjuk, az általános az, hogy az osztályok közül némelyikben sok ismérvérték van (nagy a gyakoriság), másutt viszont kevés, és általában
minél távolabb vagyunk a nagy gyakoriságú osztályoktól, annál kevesebb.
Összesen N Összesen N
c) változat (eloszlás) d) változat (megoszlás)
Relatív Relatív
Ismérvérték Az osztályközök
gyakoriság gyakoriság
alsó
felső határa
határa
11
Megjegyezzük, hogy a statisztikai gyakorlatban az eloszlást és a megoszlást egymás szinonimáiként is használjuk, noha a fent leírtak elméletileg mindenképpen indokoltak. Bizonyos elméleti
tételek ugyanis csak az egyik esetben érvényesek.
33
Egy ismérv szerinti elemzés
Összesen 1 Összesen 1
ahol
az i-edik ismérvérték,
N : a sokaság elemszáma.
és jellemző, hogy
34
Egy ismérv szerinti elemzés
A 2.3. táblázat c) és d) változatban felírt gyakorisági sorát relatív gyakorisági sornak nevezzük. (Az gyakoriságokat abszolút gyakoriságoknak
is szokás nevezni, a relatív gyakoriságoktól való megkülönböztetés érdekében.)
A gyakorisági (relatív gyakorisági) sorok képzésének – mint azt a 2.3. táblázat is mutatja – a mennyiségi ismérv fajtájától és az ismérvváltozatok
számától függően alapvetően két módja van:
a) Ha a mennyiségi ismérv diszkrét és kevés változattal rendelkezik, akkor a gyakorisági sorban minden ismérvértéket felsorolunk. Pl. a társasház
50 lakását csoportosítjuk a lakások szobaszáma szerint (2.4. táblázat).
1 5 1 10
2 22 2 44
3 17 3 34
4 6 4 12
Összesen 50 Összesen 100
b) Ha a mennyiségi ismérv sokféle értéket vesz fel, akkor az ismérvértékek tartományát egymást át nem fedő intervallumokra, ún. osztályközökre
bontjuk. Az így képzett sort osztályközös gyakorisági (relatív gyakorisági) sornak (megoszlásnak) nevezzük. Az osztályközös gyakorisági sor
képzésénél a következő követelményeknek kell eleget tenni:
– Az osztályközhatárokat úgy kell meghatározni, hogy az ismérvértékek egyértelműen besorolhatók legyenek valamelyik – de csak egy –
osztályközbe.
– Annyi és olyan hosszúságú osztályközöket képezzünk, hogy a kapott gyakorisági sor jól tükrözze a sokaság mennyiségi ismérv szerinti összetételét.
Mutassa meg a sokaság egységeinek az X ismérv (változó) nagysága szerinti megoszlásában mutatkozó szabályszerűséget.
kifejezésre kell juttatni, hogy egy adott, éppen az osztályközhatárra eső érték melyik osztályközbe tartozik. Ez elsősorban akkor okoz gondot,
ha a mennyiségi ismérv folytonos. Például ha a lakásokat alapterületük szerint csoportosítjuk, az ismérv folytonos jellege azt kívánná, hogy az
35
Egy ismérv szerinti elemzés
2 2 2
intervallumok hézagmentesen illeszkedjenek egymáshoz, azaz az osztályközöket a következő módon jelöljük ki: 45–50 m ; 50–55 m ; 55–60 m
stb. A hézagmentesen illeszkedő osztályközhatárokat valódi határoknak nevezzük. Ebben az esetben azonban gondot jelenthet, hogy az éppen
2
osztályközhatárra eső 50, illetve 55 m -es alapterület melyik osztályközbe tartozik.
Az egyértelmű besorolhatóságot a statisztikában kétféleképpen biztosíthatjuk. Az osztályközhatárokat a mérési pontosságnál nagyobb pontossággal
adjuk meg (1. változat), vagy az osztályközök alsó határát a mérési pontosság egy egységével megnöveljük (2. változat). Az egyértelmű besorolás
érdekében megkülönböztetett osztályközhatárokat közölt határoknak szokás nevezni.
3
A kétféle változatot az alábbi gyakorisági sorok szemléltetik (2.5. táblázat). Mindkét esetben 10 m -es hosszúságú osztályközöket képezünk, és
3
figyelembe vesszük, hogy az adatok 1 m pontosságúak .
20,1 – 30,0 21 21 – 30 21
30,1 – 8 31 – 8
Összesen 50 Összesen 50
Az osztályközök számának, illetve hosszának meghatározása már bonyolultabb feladat. Minden csoportosítás mindig bizonyos
információveszteséggel: az egységek egyedi tulajdonságaira vonatkozó ismereteink elvesztésével jár. Ugyanakkor egy jó csoportosítás segíti a
vizsgált sokaság egészének megismerését, ami az alapadatokhoz képest többletinformációt eredményez. Ezért olyan osztályközök kialakítására kell
törekedni, amelyek jól tömörítik a vizsgált jelenség törvényszerűségeit, de még nem eredményeznek számottevő információveszteséget.
Az utóbbi feltétel az osztályközök számának növelését, míg az előbbi a csökkentését indokolja. Ezért minden osztályozás esetén törekedni kell a
tömörítés és részletezés közötti ésszerű kompromisszumra. Az osztályközök számának és hosszának meghatározásához a szakmai ismereteken túl
jó támpontot adnak a 2.1.4. alpontban ismertetendő grafikus ábrák és az alábbiakban közölt információelméleti eredményeken alapuló becslések is.
Az osztályközök száma megbecsülhető a következő módon. Az osztályközök száma azon legkisebb k, melyre már teljesül:
36
Egy ismérv szerinti elemzés
N: a sokaság elemszáma.
Az osztályközök számának ismeretében az osztályközök hosszát – egyenlő hosszúságú osztályközök esetén – az alábbi módon határozhatjuk meg:
a legnagyobb ismérvérték,
a legkisebb ismérvérték.
Az osztályközök számának és hosszának meghatározásához megismert módszerek nem minden esetben alkalmazható és követendő szabályok.
Ezek csak támpontot adnak, és alkalmazásuk olyan esetben célszerű, amikor az különbség nem túl nagy, és az ismérvértékek zöme nem
az intervallum egy szűkebb szakaszán sűrűsödik.
A lakások vízfogyasztásának rangsorából (2.2. táblázat) látható, hogy e feltételek teljesülnek, így a fenti módszereket alkalmazva az osztályközök
száma meghatározható. Mivel
Az osztályközök hossza:
37
Egy ismérv szerinti elemzés
16 – 20 16 16 – 20 32
21 – 25 15 21 – 25 30
26 – 30 6 26 – 30 12
31 – 35 5 31 – 35 10
36 – 3 36 – 6
Összesen 50 Összesen 100
A gyakorisági sorok készítésénél azonban nem törvényszerű az egyenlő hosszúságú osztályközök képzése. A gyakorlatban sokszor különböző
(egyenlőtlen) hosszúságú osztályközöket képezünk, hogy a megoszlásban mutatkozó szabályszerűség felismerhető legyen. Erre általában akkor
kerül sor, ha az különbség igen nagy és az ismérvértékek nem egyenletesen helyezkednek el az intervallumon belül, hanem zömmel
az intervallum egy vagy néhány szűkebb szakaszán sűrűsödnek. Ilyen esetben kevésbé hosszú osztályközöket képezünk az intervallum azon
szakaszán, ahol az ismérvértékek zöme található, és hosszabbakat az intervallum más szakaszain. Különböző hosszúságú osztályközöket képezünk
például, ha a lakossági devizaszámlákat vagy betétkönyveket csoportosítjuk a betétösszeg nagysága szerint. A legnagyobb és legkisebb betétösszeg
közötti különbség igen nagy, és jellemző, hogy a kisebb betétösszegek nagyobb gyakorisággal, a nagyobb betétek kisebb gyakorisággal fordulnak
elő. Így az intervallum alsó szakaszán kisebb hosszúságú, a felső szakaszán nagyobb hosszúságú osztályközöket képezünk.
Ezt a megoldást választjuk a népesség 1 főre jutó jövedelem szerinti, illetve a nyugdíjasok nyugdíjnagyság szerinti csoportosításánál is.
A 2.7. táblázat szerinti – és az előző gyakorisági sorokban is – az első és utolsó (alsó és felső) osztályköz ún. nyitott osztályköz. A további
számítások, elemzések során ezeket úgy kezeljük, mintha zártak lennének. Az első intervallumot ugyanolyan hosszúságúnak tételezzük fel, mint az
őt követőt az utolsót pedig, mint az őt megelőzőt
A gyakorisági (relatív gyakorisági) sorokban rejlő információk tovább bővíthetők a gyakoriságok (relatív gyakoriságok) halmozott összeadásával,
azaz kumulálásával.
2.7. táblázat - A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában
38
Egy ismérv szerinti elemzés
– 5 999 478 ?
25 000 – 7 388 ?
Összesen 1 259 750 –
A kumulált gyakoriságok (jele: ), ill. kumulált relatív gyakoriságok (jele: ) adatai azt mutatják, hogy az adott osztályköz felső határának
megfelelő és annál kisebb ismérvértékek hányszor , ill. milyen arányban fordulnak elő. A kumulált gyakorisági, ill. kumulált relatív gyakorisági
sort úgy képezzük, hogy a gyakoriságokat , ill. relatív gyakoriságokat rendre halmozva összeadjuk.
A kumulált gyakoriságok (relatív gyakoriságok) számítását a lakások vízfogyasztására vonatkozó példa alapján mutatjuk be (2.8. táblázat).
16 – 20 16 21 32 42
39
Egy ismérv szerinti elemzés
21 – 25 15 36 30 72
26 – 30 6 42 12 84
31 – 35 5 47 10 94
36 – 3 50 6 100
Összesen 50 – 100 –
Például:
A gyakorisági (relatív gyakorisági) sorokból lefelé kumulált gyakorisági (relatív gyakorisági) sor is képezhető. E sorok adatai azt mutatják, hogy
az adott osztályköz alsó határánál nagyobb ismérvértékek hányszor , ill. milyen arányban fordulnak elő (2.9. táblázat).
(m3) ( ) ( )
– 15 5 50 10 100
16 – 20 16 45 32 90
21 – 25 15 29 30 58
26 – 30 6 14 12 28
31 – 35 5 8 10 16
36 – 3 3 6 6
40
Egy ismérv szerinti elemzés
Összesen 50 – 100 –
Például:
2.1.3. Értékösszegsor
Az előző alfejezetben a sokaság egységeit mennyiségi ismérv szerint osztályoztuk. Az osztályozás eredménye a gyakorisági sor, ami a mennyiségi
sorok egyik típusa. A másik típus az értékösszegsor.
Az értékösszegsor (2.10. táblázat) a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységek
ismérvértékeinek összegét rendeli.
A vizsgált mennyiségi ismérv értékeinek egyes osztályokon (osztályközökön) belüli összegeit értékösszegeknek (jele: ) nevezzük.
Összesen S Összesen S
41
Egy ismérv szerinti elemzés
Eloszlás esetén az egyes osztályokhoz tartozó értékösszegeket az ismérvértékek és a gyakoriságok szorzataként kapjuk:
A következő gyakorisági sor valamely település háztartásainak taglétszám szerinti megoszlását mutatja (a megfigyelés időpontjában) (2.11. táblázat).
1 51
2 89
3 145
4 85
5 34
6 21
Összesen 425
42
Egy ismérv szerinti elemzés
1 51
2 178
3 435
4 340
5 170
6 126
Összesen 1300
Például:
Osztályközös gyakorisági sor esetén az egyes osztályközök tényleges értékösszegei csak akkor határozhatók meg, ha ismerjük az eloszlást.
A vízfogyasztás rangsora (adatok a 2.2. táblázatban) alapján a tényleges értékösszegsort a 2.13. táblázat mutatja.
16 – 20 287
21 – 25 337
26 – 30 166
31 – 35 161
43
Egy ismérv szerinti elemzés
36 – 112
Összesen 1125
Ha csak az osztályközös gyakorisági sor (a megoszlás) áll rendelkezésre, akkor az értékösszegeket a gyakoriságok és az osztályközepek
szorzataként becsüljük.
Az i-edik osztályközépső:
Az értékösszegek becslését a lakások vízfogyasztás szerinti megoszlását mutató osztályközös gyakorisági sorból (2.6. táblázat) végezzük.
16 – 20 16 5 17,5
21 – 25 15 5 22,5
26 – 30 6 5 27,5
31 – 35 5 5 32,5
36 – 3 5 37,5
Összesen 50 – –
44
Egy ismérv szerinti elemzés
A gyakorisági sor első és utolsó osztályköze nyitott, de a gyakorisági sor alapján végzett számítások során azokat úgy kezeljük, mintha zártak
lennének:
Az osztályközepek meghatározásánál nem vesszük figyelembe az egyértelmű besorolás érdekében megkülönböztetett felső és alsó
osztályközhatárokat, hanem a hézagmentesen illeszkedő, ún. valódi osztályközhatárok alapján számítjuk ki őket. Pl.
16 – 20 280,0
21 – 25 337,5
26 – 30 165,0
31 – 35 162,5
36 – 112,5
Összesen 1120,0
Például:
A 2.14. és 2.15. táblázat adataiból látható, hogy a tényleges és becsült értékösszegek eltérnek egymástól. Az eltérés abból adódik, hogy a becslés
során az ötödik osztályközben feltételezzük pl., hogy az ide besorolt lakások mindegyike 32,5 m3 (az osztályközépnek megfelelő) vizet fogyaszt.
Az osztályközös gyakorisági sor alapján történő becslés annál jobban közelíti meg a tényleges értékösszegeket, minél egyenletesebb az
ismérvértékek eloszlása az osztályközökön belül.
45
Egy ismérv szerinti elemzés
Ha az értékösszegek – ismérvértékek szerinti – megoszlásáról is képet akarunk kapni, akkor relatív értékösszegsort képezünk.
Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét ( ) a teljes
értékösszeghez (S) viszonyítja.
16 – 20 25,0
21 – 25 30,1
26 – 30 14,7
31 – 35 14,5
36 – 10,1
Összesen 100,0
A gyakorisági sorokhoz hasonlóan az értékösszegsorból és a relatív értékösszegsorból is képezhetünk kumulált, ill. lefelé kumulált sorokat (2.17.
táblázat).
46
Egy ismérv szerinti elemzés
Összes vízfogyasztás
Összes vízfogyasztás (m3)
megoszlása (%)
Lefelé Lefelé
Vízfogyasztás Kumulált Kumulált
kumulált kumulált
3
(m ) ( ) ( )
( ) ( )
– 15 62,5 62,5 1120,0 5,6 5,6 100,0
Például:
A társasházban elfogyasztott vízmennyiség 60,7%-át – összesen 680 m3-t – azokban a lakásokban használták fel, amelyekben a vízfogyasztás
25 m3 és annál kisebb volt.
A gyakorisági (relatív gyakorisági) sorok ábrázolása derékszögű koordináta-rendszerben történik. A vízszintes tengelyen a mennyiségi ismérv
értékeit, a függőleges tengelyen pedig a gyakoriságokat (relatív gyakoriságokat) vagy azok kumulált értékeit tüntetjük fel.
47
Egy ismérv szerinti elemzés
A kevés értéket felvevő diszkrét mennyiségi ismérvek esetén csak az ábrázolni kívánt gyakoriságokkal (relatív gyakoriságokkal) arányos hosszúságú,
valamilyen feltűnő módon megjelölt végpontú egyenes szakaszokkal történhet az ábrázolás. Az ilyen típusú ábrát az eloszlás bot-ábrájának
nevezzük.
A 2.1. ábra jellege nem változna meg, ha a függőleges tengelyen az abszolút gyakoriságok helyett a relatív gyakoriságok szerepelnének.
Az osztályközös gyakorisági sorokat, amelyeket leggyakrabban folytonos mennyiségi ismérv szerinti csoportosítással képezünk, hisztogrammal és
gyakorisági poligonnal ábrázoljuk.
A hisztogram hézagmentesen egymás mellé illesztett téglalapokkal szemlélteti a gyakorisági (relatív gyakorisági) sort. (Mi a relatív gyakoriságok
alapján készítettük a 2.2. ábrát.)
48
Egy ismérv szerinti elemzés
49
Egy ismérv szerinti elemzés
2.3. ábra - A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok
A hisztogram téglalapjainak területe arányos a relatív gyakoriságokkal, így a gyakoriságokkal is. A különböző osztályközhosszúságokkal képzett
gyakorisági (relatív gyakorisági) sor ábrázolásánál az arányosság csak úgy biztosítható, ha az eredeti gyakoriságok (relatív gyakoriságok) helyett
az egységnyi osztályközhosszúságra jutó gyakoriságokat relatív gyakoriságokat vagy azok valamilyen többszörösét ábrázoljuk. Az eredeti
gyakoriságok (relatív gyakoriságok) alapján történő ábrázolás ugyanis torzítana, mivel a hosszabb osztályköz nagyobb súlyt kapna, a téglalap területe
az arányosnál nagyobb lenne. Ennek bemutatására szolgál a következő példa. Az adatokat a 2.18. táblázat tartalmazza.
2.18. táblázat - Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint
Biztosítás Biztosítások Osztályközök 1000 osztályközhosszúságra
díja (Ft) hossza jutó gyakoriság
száma (db)
– 2000 15 1000 15,0
50
Egy ismérv szerinti elemzés
Az 1000 osztályközhosszúságra jutó gyakoriság: Pl. a negyedik osztályközben: (A hisztogramot a 2.4. ábra mutatja.)
Ha a relatív gyakoriságokat úgy ábrázoljuk, hogy az osztályköz az egység vagy a téglalapok magassága ( ), akkor a téglalapok összterülete
1. Ebben az esetben sűrűséghisztogramról beszélünk.
A kumulált relatív gyakoriságok ábrázolásánál monoton növekvő függvényt kapunk, amelynek legkisebb értéke 0 és a legnagyobb 1 (százalékos
formánál 100). Ilyen függvényt közvetlenül az eloszlásból is készíthetünk, ekkor eloszlásfüggvénynek nevezzük.
A gyakorisági poligon az osztályközepeknél felmért gyakoriságok (a különböző hosszúságú osztályközöknél az egységnyi osztályközhosszúságra
jutó gyakoriságok) pontjait összekötő, egyenes szakaszokból álló vonaldiagram. Az első és utolsó pontot összekötjük az X tengelyen az első
osztályközt megelőző (azzal azonos hosszúságú) osztályköz, ill. az utolsó osztályközt követő (azzal azonos hosszúságú) osztályköz középpontjával.
51
Egy ismérv szerinti elemzés
52
Egy ismérv szerinti elemzés
53
Egy ismérv szerinti elemzés
A következő alfejezetekben megismerkedünk azokkal a mutatószámokkal, amelyek további és egyben valamilyen számszerű információt nyújtanak
a gyakorisági sorok jellegzetességeiről, az eloszlás helyzetéről, szóródásáról és alakjáról. E mutatószámok alapján, majd később látni fogjuk,
akkor is képet kapunk az eloszlásról, ha nem állnak rendelkezésre az alapadatok és/vagy a grafikus ábrák.
Az eloszlás helyzete: a jellemzőnek tartott értékek – a középértékek (módusz, medián, átlag) és a kvantilisek – helye az X tengelyen. E mutatókat
ezért helyzetmutatóknak is szokás nevezni.
Az eloszlás alakja: szimmetrikus vagy aszimmetrikus, melyről az aszimmetriamérőszámai (alakmutatók) adnak számszerű információt.
2.1.5. Helyzetmutatók
Módusz
A módusz (jele: Mo) azt az értéket jelöli, amelyik a szó hétköznapi értelmében a legáltalánosabb, amelyik a tipikus a sokaságban. Ezért tipikus
értéknek is szokásnevezni .
54
Egy ismérv szerinti elemzés
Mo = 3
A gyakorisági megoszlás ún. nyers módusza a gyakorisági poligon maximumhelye, az az ismérvérték, amely körül az előforduló ismérvértékek
legjobban sűrűsödnek.
2.7. ábra -
A 2.7. ábrán látható gyakorisági poligonnak egy maximumhelye van. Az ilyen megoszlást (illetve eloszlást) egymóduszú megoszlásnak, illetve
eloszlásnak nevezzük, és a móduszt mint helyzetmutatót elsősorban ilyen megoszlások, illetve eloszlások jellemzésére használjuk.
Ha a gyakorisági poligonnak több helyi maximuma van, a megoszlást, illetve az eloszlást többmóduszú megoszlásnak, illetve eloszlásnak
nevezzük. Ilyen eloszlást szemléltet a 2.8. ábra.
55
Egy ismérv szerinti elemzés
2.8. ábra -
A többmóduszú eloszlások gyakran heterogén (nem egynemű) sokaságra utalnak, azaz az eloszlás több (a 2.8. ábrán kettő) egymóduszú eloszlást
mutató részsokaságból tevődik össze. Ilyen esetben a teljes sokaság vizsgálata mellett – ha a heterogenitást okozó ismérv ismert – a sokaságot
részsokaságokra bonthatjuk, és az elemzést a részekre bontott sokaságokra is elvégezhetjük. Ennek részleteiről a 3. fejezetben lesz szó.
A folytonos (és a sok változattal rendelkező diszkrét) mennyiségi ismérv móduszát osztályközös gyakorisági sor alapján becsüljük.
A móduszt az az osztályköz tartalmazza, amelyben az egységnyi osztályközhosszúságra jutó gyakoriság (relatív gyakoriság) a legnagyobb. (Az
ismérvértékek sűrűsége, tömörülése ebben az osztályközben a legnagyobb.) A móduszt tartalmazó osztályközt modális osztályköznek nevezzük.
Azonos hosszúságú osztályközök esetén ez a legnagyobb gyakoriságú (relatív gyakoriságú) osztályköz. Különböző hosszúságú osztályközök esetén
az egységnyi osztályközhosszúságra jutó gyakoriságok (relatív gyakoriságok) alapján keressük meg a modális osztályközt.
A modális osztályköz közepét nyers módusznak nevezzük. Ha szimmetrikus a megoszlás, akkor a nyers módusz maga a módusz.
Ha nem szimmetrikus a megoszlás, akkor a módusz becsléséhez a modális osztályközzel szomszédos osztályközök gyakoriságát is figyelembe
vesszük. Ebben az esetben ugyanis a módusz közelebb van valamelyik osztályközhatárhoz. Feltételezhető, hogy a sűrűsödési hely közelebb esik
a modális osztályköz azon (alsó vagy felső) határához, amelynek nagyobb a gyakorisága.
56
Egy ismérv szerinti elemzés
a modális és az azt megelőző osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,
a modális és az azt követő osztályköz (egységnyi osztályközhosszúságra jutó) gyakoriságának (relatív gyakoriságának) különbsége,
A módusz becslését a lakások vízfogyasztásának gyakorisági sora alapján mutatjuk be (adatok a 2.6. táblázatban):
A tipikus vízfelhasználás becslése a relatív gyakorisági sor alapján (adatok a 2.6. táblázatban):
57
Egy ismérv szerinti elemzés
A módusz grafikus úton is becsülhető. A gyakorisági (relatív gyakorisági) sor jól szerkesztett hisztogramjának segítségével a módusz becsült értéke
szerkeszthető. A 2.9. ábrán két hasonló háromszöget látunk:
Ebből:
Az egységnyi (1000) osztályközhosszúságra jutó gyakoriságok alapján a modális osztályköz: 3000 – 4000 Ft;
58
Egy ismérv szerinti elemzés
Medián
A medián (jele: Me) a mennyiségi ismérvnek az az értéke, amelynél ugyanannyi kisebb, mint nagyobb érték fordul elő. A grafikus ábrákra gondolva,
az X tengelyen az a pont, melyben az X tengelyre állított merőleges a hisztogram területét, illetve a gyakorisági poligon alatti területet felezi (két
egyenlő részre osztja).
A mediánnak van egy érdekes tulajdonsága. Ha minden ismérvértéket a mediánnal helyettesítenénk, akkor ezzel összességében a lehető legkisebb
hibát követnénk el, ha ezt a hibát az módon mérjük. Igaz ugyanis, hogy a
A társasház vízfogyasztásának rangsora (2.2. táblázat) alapján a medián a következő módon számítható.
59
Egy ismérv szerinti elemzés
Tehát a medián a rangsor 25. és 26. ismérvértékének átlaga. A rangsor 25. ismérvértéke: 21 m3, a 26. ismérvértéke: 22 m3.
A lakások felében (50%-ában) a vízfogyasztás 21,5 m3-nél kevesebb, másik felében (50%-ában) ennél több.
Az osztályközös gyakorisági (relatív gyakorisági) sor esetén a mediánt csak becsléssel tudjuk meghatározni.
Feltételezve, hogy a mediánt tartalmazó osztályközön belül az ismérvértékek egyenletesen helyezkednek el, az osztályköz arányos részét az
osztályköz alsó határához hozzáadva, a mediánra megfelelő becslést kapunk.
60
Egy ismérv szerinti elemzés
16 – 20 16 21 0,32 0,42
21 – 25 15 36 0,30 0,72
26 – 30 6 42 0,12 0,84
31 – 35 5 47 0,10 0,94
36 – 3 50 0,06 1,00
Összesen 50 – 1,00 –
A harmadik osztályköz kumulált gyakorisága az első, amely már meghaladja a 25-öt, így a medián a közötti intervallumban van.
61
Egy ismérv szerinti elemzés
A gyakorisági sor alapján becsült érték (21,33 m3) jól közelíti a medián rangsor alapján meghatározott értékét (21,5 m3).
Az átlag
Az ismérvértékek átlaga egyenlő az ismérvértékek összegének és a sokaság elemszámának hányadosával, mely hányados az
ismérvértékek számtani átlaga.
A számtani átlag definíciója alapján könnyen belátható, hogy ha minden ismérvértéket az átlaggal helyettesítünk, akkor ezek összege egyenlő az
eredeti értékek összegével:
62
Egy ismérv szerinti elemzés
az egyes osztályokhoz (osztályközökhöz) tartozó gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk.
A megoszlásból az osztályközepekkel történő számítás esetén az eloszlás átlagára becsült értéket kapunk.
2.20. táblázat - Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok
Biztosítási díj Biztosítások
(Ft) száma (db)
– 2000 15 1 500 0,06
63
Egy ismérv szerinti elemzés
Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem az aránya befolyásolja, ezért súlyként a gyakoriságok helyett használhatók
a relatív gyakoriságok is.
ahol az i-edik osztály (osztályköz) értékösszege, ezért az átlag a következő formában is számítható:
mely nem más, mint az értékek (osztályközepek) súlyokkal számított harmonikus átlaga. Mivel az átlag nagyságát a súlyarányok befolyásolják,
64
Egy ismérv szerinti elemzés
2.21. táblázat - Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok
Biztosítási Összes bevétel
díj (Ft) (Ft) megoszlása (%)
– 2000 1500 22 500 2,00
65
Egy ismérv szerinti elemzés
Kvantilisek
Legyen 0 < q < 1. Ha a rangsorba rendezett sokaságot egy X ismérvérték arányban osztja ketté, akkor ezt az ismérvértéket q-ad rendű vagy
q-adik kvantilisnek nevezzük (jele: ).
Ha a feltételnek két ismérvérték is eleget tesz, akkor ezen intervallumot arányban osztó pont lesz.
Kvintilisek:
Decilisek: ...,
Percentilisek: ...,
A kvartilisek – és egyben az összes kvantilis – rangsorból való meghatározásának és osztályközös gyakorisági (relatív gyakorisági) sorból történő
becslésének menete azonos a mediánnál ismertetett eljárással.
66
Egy ismérv szerinti elemzés
Ekkor:
A szám egész része: törtrésze: Az alsó kvartilis tehát a rangsor 12. és 13. értéke között van; úgy határozzuk meg, hogy a rangsor 12.
ismérvértékéhez, az hozzáadjuk a 13. és 12. ismérvérték közötti különbség 0,75-szeresét:
A felső kvartilis:
így és
A rangsor 38. ismérvértékéhez hozzáadjuk a 39. és 38. ismérvérték közötti különbség 0,25-szeresét:
Osztályközös gyakorisági (relatív gyakorisági) sorból történő becslés esetén a kvantilist az az i-edik osztályköz tartalmazza, amelyre
67
Egy ismérv szerinti elemzés
teljesül. Ekkor
A kvartilisek becslését a vízfogyasztás gyakorisági sora (adatok a 2.19. táblázatban) alapján mutatjuk be.
Az és a második osztályközben a kumulált gyakoriság már nagyobb, mint 12,5. Így az alsó kvartilis 15–20 m3 között van.
A kumulált gyakoriság először a negyedik osztályközben nagyobb, mint 37,5. Ezért a felső kvartilis m3 között van.
A kvantilisek jól szerkesztett ábra – a kumulált gyakoriságok (relatív gyakoriságok) hisztogramja – alapján is becsülhetők (2.10. ábra).
68
Egy ismérv szerinti elemzés
2.10. ábra - A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése
A lakossági jövedelmek vizsgálatánál gyakran a deciliseket számítjuk ki. A 2.7. táblázat a nyugdíjas nők nyugdíjnagyság szerinti megoszlását mutatja.
A gyakorisági sorból a kvartilisek becslésénél megismert módon becsülhetjük a deciliseket is.
A nyugdíjas nők 10%-ának nyugdíja 8894 Ft-nál kisebb, 90%-ának ennél nagyobb volt 1994 áprilisában.
69
Egy ismérv szerinti elemzés
A nyugdíjas nők 50%-ának a nyugdíja 12 200 Ft-nál kevesebb, 50%-ának pedig több volt 1994 áprilisában. (A tehát valóban a mediánnal azonos.)
A többi decilist is hasonló módon kiszámítva (becsülve), az eredményeket sorba rendezve egy speciális gyakorisági (relatív gyakorisági) sort, ún.
deciliseloszlást képezhetünk, melyet a 2.22. táblázat tartalmaz.
2.22. táblázat - A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás)
Nyugdíj Nyugdíjas nők Nyugdíj Nyugdíjas nők
(Ft) száma (fő) (Ft) megoszlása (%)
– 8894 125 975 – 8894 10
70
Egy ismérv szerinti elemzés
A fenti osztályközös gyakorisági sorokban az osztályközök határai a decilisek, az osztályközök gyakorisága (relatív gyakorisága) pedig azonos.
Például a hetedik osztályköz alsó határa: a felső határa: 125 975 főnek, a nyugdíjas nők 10%-ának a nyugdíja 12 924 és
13 648 Ft között volt, 70%-ának a nyugdíja pedig 13 648 Ft-nál kevesebb volt 1994 áprilisában.
Az olyan – nem egyenlő hosszúságú osztályközös gyakorisági (relatív gyakorisági) – sorokat, melyekben minden osztályköz gyakorisága (relatív
gyakorisága) azonos és az osztályközhatárok a kvantilisek (kvartilis, kvintilis, decilis stb.), a gyakorlatban kvantilis eloszlásnak nevezzük. (Az eddig
használt terminológiák szerint indokoltabb lenne a kvantilis megoszlás elnevezés.)
2.11. ábra -
A 2.11. ábrán három eloszlás gyakorisági poligonját mutatjuk be. Mivel szimmetrikusak, az átlaguk, móduszuk és a mediánjuk ugyanakkora, mégis
lényegesen különböznek egymástól. Mi okozza az eltérést? Az, hogy az adatok szétszórtsága, ún. szóródása erősen különbözik az eloszlásokban.
Az egyiknél az átlag körül tömörül az ismérvértékek zöme, a másiknál kevésbé, a harmadiknál teljesen szétszórtan helyezkednek el.
71
Egy ismérv szerinti elemzés
Ahhoz, hogy a középérték jellemző erejét értékelni tudjuk, szükséges, hogy az ismérvértékek szóródásáról is legyen ismeretünk. Az olyan középérték,
amely körül kicsi az ismérvértékek szóródása, jobb jellemzője a sokaságnak, mint az olyan, amelytől az egyes ismérvértékek nagymértékben
különböznek.
Szóródáson azonos fajta számszerű adatok (általában egy mennyiségi ismérv értékeinek) különbözőségét értjük. Önmagában tehát azt a
tényt jelenti, hogy pl. a megfigyelt társasház lakásainak vízfogyasztása különböző nagyságú.
Az ismérvértékek szóródásáról a gyakorisági sor és a grafikus ábrák is adnak információt, emellett azonban szükség van a szóródás mérésére, a
szóródás jelenségének egyetlen számértékben való tömörítésére.
A szóródás mérése az ismérvértékek valamely középértéktől (általában a számtani átlagtól) vett eltérései vagy egymás közötti különbségei
alapján történik. Ezen eltérések, különbségek alapján számított mérőszámok a szóródás abszolút mutatói, amelyek mértékegysége megegyezik
a megfigyelt ismérv mértékegységével.
A szóródás relatív mutatói elvonatkoztatnak az ismérvértékek mértékegységétől, nagyságrendjétől (általában %-os formában fejezzük ki őket), a
szóródás térbeli vagy időbeli összehasonlítására szolgálnak.
Valamennyi mérőszám közös tulajdonsága, hogy a szóródás hiányát (ha minden ismérvérték egyenlő) nullával, meglétét pedig valamilyen nullától
különböző pozitív értékkel jelzi.
– a szóródás terjedelme,
– az átlagos eltérés,
– a szórás,
– az átlagos különbség és
– a relatív szórás.
A szóródás terjedelme
72
Egy ismérv szerinti elemzés
A terjedelem a szóródásnak igen szemléletes kifejezője (pl. egy adott termék legkisebb és legnagyobb fogyasztói árának különbsége, vagy egy adott
évben befizetett legkisebb és legnagyobb személyi jövedelemadó különbsége), a gyakorlatban mégis kevésbé használatos a szóródás mérésére.
Ennek az az oka, hogy értékét a véletlen szerepe számottevően befolyásolhatja, mivel nagysága csak a két legszélsőségesebb ismérvértéktől függ.
Ezért gyakran használják a terjedelem helyett az ún. interkvantilis terjedelemmutatókat is, amelyek két szélső kvantilis különbségével azonosak
(pl. az első és kilencedik decilis vagy az alsó és felső kvartilis különbsége).
Átlagos eltérés
Az átlagos eltérés (jele: δ) az ismérvértékek számtani átlagtól vett eltérésein alapul, ezen eltérések átlaga. Mivel az átlagtól vett
eltérések algebrai összege nulla – a számtani átlag első tulajdonsága, lásd 1.6. pont –, ezért az eltérések abszolút értékeit átlagoljuk.
Az átlagos eltérésaz egyes értékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga:
Az átlagos eltérés azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól.
A gyakorisági sor adataiból az átlagos eltérést súlyozott formában számítjuk (osztályközös gyakorisági sor esetén becsüljük).
73
Egy ismérv szerinti elemzés
Mivel az átlag nagyságát nem a súlyok abszolút nagysága, hanem a súlyok aránya befolyásolja, az átlagos eltérés számításánál súlyként a relatív
gyakoriságok itt is használhatók.
illetve:
E mérőszámot a gyakorlatban viszonylag ritkán használjuk, mert az abszolút érték matematikailag elég nehézkesen kezelhető.
Szórás
A szórás (jele: ) a legfontosabb és egyben a leggyakrabban használt szóródási mérőszám. Számítása szintén az ismérvértékek átlagtól vett
eltérésein alapul. Az eltérések pozitív és negatív előjele okozta problémától úgy is „megszabadulhatunk”, hogy a eltéréseket négyzetre emeljük.
A értékekből tehát négyzetes átlagot számítunk.
74
Egy ismérv szerinti elemzés
Gyakorisági sor alapján a szórást súlyozott formában számítjuk (osztályközös gyakorisági sor alapján becsüljük). Súlyként a gyakoriságokat
vagy a relatív gyakoriságokat használjuk.
vagy
A szórás azt mutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól. Jelentése tehát ugyanaz, mint az átlagos eltérésé, mivel
mindkettő a eltérések átlaga. Az átlagos eltérés (δ) a értékek számtani, a szórás pedig a értékek négyzetes átlaga. Ugyanazon
értékek különféle átlagainak az 1.6. alfejezetben megismert nagyságrendi viszonya miatt az átlagos eltérés mindig kisebb értékkel méri a szóródást,
mint a szórás .
A szórás súlyozott formában történő számítását a vízfogyasztás gyakorisági sora alapján mutatjuk be. (A fejrovatokba csak a már korábban megismert
jelöléseket írjuk.) (2.23. táblázat.)
75
Egy ismérv szerinti elemzés
A szórás rangsor alapján számított (6,685 m3) és az osztályközös gyakorisági sor alapján becsült (6,67 m3) értéke közel esik egymáshoz.
A statisztikai elemző munkában – a következő fejezetben majd látni fogjuk – fontos szerepe van a szórás négyzetének is, amit szórásnégyzetnek
vagy varianciának nevezünk és -tel jelölünk.
A szórás tulajdonságai
Tehát:
22
Mivel ilyenkor a számtani átlag is lesz , ezért
76
Egy ismérv szerinti elemzés
-szeresére változik.
Tehát:
2
Mivel ilyenkor a számtani átlag lesz , ezért
Átlagos különbség
Az átlagos eltérés és a szórás a számtani átlag alapján méri az ismérvértékek különbözőségét. A szóródás az ismérvértékek egymás
közötti különbségei alapján is vizsgálható, illetve mérhető. E mutató bevezetését Corrado Gini olasz statisztikus javasolta, ezért szokás Gini-féle
mérőszámnak is nevezni.
77
Egy ismérv szerinti elemzés
Az átlagos különbség (jele: G) az ismérvértékek egymástól számított különbségei abszolút értékeinek számtani átlaga.
Mivel N db ismérvérték mindegyikének – önmagát is beleértve – N db ismérvértékkel vehetjük a különbségét, összesen különbség képezhető.
Ezek abszolút értékeinek átlaga:
Gyakorisági sor alapján a mutatót súlyozott formában számítjuk (osztályközös gyakorisági sorból becsüljük).
Az átlagos különbség azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól. Számítását a vízfogyasztás gyakorisági
sora alapján mutatjuk be. (A 2.24. táblázatban kiszámított különbségek, illetve szorzatok az átlóra szimmetrikusak, ezért elegendő az átló alatti vagy
fölötti különbségeket és szorzatokat kiszámítani és 2-vel szorozni.)
a) Az ismérvértékek különbségei:
3
Adatok: m
12,5 17,5 22,5 27,5 32,5 37,5
12,5 0 5 10 15 20 25
17,5 0 5 10 15 20
22,5 0 5 10 15
27,5 0 5 10
32,5 0 5
37,5 0
78
Egy ismérv szerinti elemzés
5 16 15 6 5 3
5 * 80 75 30 25 15
16 * 240 96 80 48
15 * 90 75 45
6 * 30 18
5 * 15
3 *
c) Az előző táblák megfelelő rovatainak szorzatai:
Adatok: m3
12,5 17,5 22,5 27,5 32,5 37,5 Összesen
12,5 0 400 750 450 500 375 2475
32,5 0 75 75
37,5 0 0
Összesen 0 400 1950 1860 2600 2265 9075
Az ismérvértékek különbségeinek összege a táblázat c) részében kapott szorzatösszeg kétszeresével azonos: 2 · 9075 = 18 150 m3.
79
Egy ismérv szerinti elemzés
Relatív szórás
A szóródás eddig megismert mérőszámai a megfigyelt mennyiségi ismérv mértékegységében mérik a szóródást. Sok esetben szükség lehet arra,
hogy az értékek nagyságrendjétől és mértékegységétől elvonatkoztatott mérőszámmal mérjük és tegyük összehasonlíthatóvá a szóródást. Ilyen
mérőszám a relatív szórás (jele: V):
Megmutatja, hogy a szórás az átlagnak hányad része. A relatív szórást százalékban szoktuk kifejezni és viszonyszámként értelmezzük.
A képlet átalakításával belátható az is, hogy a relatív szórás az egyedi eltérések viszonylagos nagyságának, a hányadosoknak a négyzetes
átlaga.
Ezért úgy is értelmezhető, hogy az egyes ismérvértékek átlagosan hány %-kal térnek el az átlagtól.
A lakások vízfogyasztására vonatkozó példánkban az átlagos vízfogyasztás 22,4 m3, a szórás pedig 6,67 m3 volt. A szóródás relatív mértéke :
A relatív szórást viszonyszámként értelmezve megállapíthatjuk, hogy a szórás az átlagnak közel 30%-a. Másként fogalmazva az egyes lakások
vízfogyasztása átlagosan 29,8%-kal tér el a 22,4 m3-es átlagtól. A értékek – %-ban kifejezve – rendre: 44,2; 21,9; 0,4; 22,8; 45,1 és 67,4.
A relatív szórás ezen értékek közé esik.
80
Egy ismérv szerinti elemzés
A gyakorisági sorokat ábrázolva megállapítható, hogy a görbék (poligonok) igen változatosak lehetnek, de nagy többségük bizonyos
szabályszerűséget mutat, így besorolható néhány jellegzetes típusba.
– egymóduszú eloszlás
– szimmetrikus,
– többmóduszú eloszlás.
Az egymóduszú gyakorisági sorok poligonjának egy helyi maximuma (csúcsa) van. A helyzetmutatók elhelyezkedésétől függően az eloszlás
szimmetrikus és aszimmetrikus lehet. Az egymóduszú eloszlások jellegzetességeit a 2.25. táblázat tartalmazza.
A társadalmi-gazdasági jelenségek körében a bal oldali aszimmetria a leggyakoribb. Például a lakossági megtakarítások nagyságának, a
vállalkozások nyereségének, a családok egy főre jutó jövedelmének eloszlása tipikusan bal oldali aszimmetriát mutat.
81
Egy ismérv szerinti elemzés
A 2.25. táblázatból látható, hogy a már megismert grafikus ábrák (a hisztogram és a gyakorisági poligon), a középértékek és kvantilisek alapján az
eloszlás típusát, az aszimmetria irányát meg tudjuk állapítani.
A továbbiakban olyan mutatókkal (mérőszámokkal) ismerkedünk meg, amelyek egy számba sűrítve kifejezésre juttatják az aszimmetria fennállását,
irányát és fokát is. Arra a kérdésre kapunk választ, hogy milyen mértékűnek ítélhető a szimmetrikushoz képest a megoszlás aszimmetriája, más
szóval ferdesége.
Az aszimmetria Pearson-féle mutatószáma (jele: A) a számtani átlag és a módusz egyes eloszlástípusok esetén jellemző nagyságrendi viszonyán
alapul:
Az különbség nagysága a ferdeség fokán kívül a szóródás nagyságától is függ. Nagymértékű szóródás esetén ugyanis a különbség akkor
is viszonylag nagy lehet, ha az aszimmetria viszonylag kisfokú. Ezért, ha a két középérték különbségét elosztjuk a szórással, olyan mérőszámot
kapunk, melynek értékéből következtetni tudunk az aszimmetria mértékére. A mérőszám (önmagában a számláló) előjele az aszimmetria irányát
mutatja. Bal oldali aszimmetria esetén , jobb oldali aszimmetria esetén Szimmetrikus eloszlás esetén A mérőszám abszolút értékének
nincs határozott felső korlátja, azonban már 1-nél nagyobb abszolút érték meglehetősen erős aszimmetriára utal.
Az aszimmetria másik mérőszáma,az F mutató (jele: F) az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán
alapul. Bal oldali aszimmetria esetén a medián az alsó , jobb oldali aszimmetria esetén a felső kvartilishez esik közelebb.
Ha a eltérések különbségét elosztjuk azok összegével, olyan mérőszámot kapunk, amely abszolút értékének határozott felső korlátja
van: . Az F mutató lényegesen kisebb értékkel jelzi a már nagyfokúnak tekinthető aszimmetriát, mint az A:
82
Egy ismérv szerinti elemzés
E mutatószám ugyanolyan feltételek mellett ad nulla, pozitív és negatív eredményt, mint az A mutató.
Az F mutatót nemcsak a kvartilisek, hanem a többi kvantilis, például a decilisek alapján is számíthatjuk.
Több gyakorisági sor ferdeségének összehasonlításakor, valamint ugyanazon jelenség eloszlásának időbeli vizsgálatára mindig ugyanazt a
mérőszámot kell használni.
A koncentráción általában tömörülést, összpontosulást értünk. Pl. a népesség nagy része a nagyobb településeken, a városokban összpontosul,
a magánvagyon egyre nagyobb része tömörül (koncentrálódik) a lakosság egy szűkebb körénél stb.
Koncentrációnak nevezzük azt a jelenséget, hogy a sokasághoz tartozó teljes értékössszeg jelentős része a sokaság kevés egységére
összpontosul.
Ha a sokaság elemszáma (N) kicsi, akkor az már önmagában is koncentrációt jelent, hiszen a teljes értékösszeg (S) a szó szoros értelmében kevés
egységre összpontosul.
Ha a sokaság elemszáma nagy, akkor a definícióban szereplő „kevés egységet” relatív módon értelmezzük. Ilyen esetben a koncentráció abban
nyilvánul meg, hogy a sokaság teljes értékösszege egyenlőtlenül oszlik meg a sokaság egységei között.
83
Egy ismérv szerinti elemzés
A koncentráció a relatív gyakoriságok és a relatív értékösszegek összehasonlításával mutatható ki. Ha az egyes osztályokhoz
(osztályközökhöz) tartozó értékek azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi.
2.26. táblázat - Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január
1-jén
Települések Települések
Népesség- számának össznépességének
össznépessége
száma
nagyság (fő)
A 2.26. táblázatból látható, hogy a megye népességének 11,8%-a él a települések 58,4%-át kitevő kistelepüléseken, ugyanakkor a népesség nagy
hányada (38,5%-a) a települések mindössze 0,8%-át kitevő nagytelepüléseken (városokban) koncentrálódik.
A koncentráció vizsgálatának egyik legfontosabb és egyben legelterjedtebb eszköze a Lorenz-görbe, amely a koncentráció meglétén kívül annak
mértékét is szemléletesen mutatja. A Lorenz-görbe egy egységnyi oldalú négyzetben elhelyezett vonaldiagram, mely a kumulált relatív gyakoriságok
függvényében ábrázolja a kumulált relatív értékösszegeket .
84
Egy ismérv szerinti elemzés
pontokat egyenes szakaszokkal összekötjük. (A görbe végpontja a pont.) Általában a illetve adatokat ábrázoljuk, mint ahogyan a
2.12. ábrán is.
A koncentráció hiánya esetén a görbe egybeesik az átlóval. Ebben az esetben az egyes osztályokhoz (osztályközökhöz) tartozó és értékek
azonosak (a teljes értékösszeg egyenletesen oszlik meg a sokaság egységei között).
Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció, így az ábra alkalmas a koncentráció időbeli vagy térbeli összehasonlítására
is.
A 2.26. és 2.27. táblázat adatait felhasználva összehasonlítjuk Nógrád és Zala megye népességének koncentrációját (az 1994. január 1-jei adatok
alapján).
nagyság (fő)
–499 22,4 4,0 22,4 4,0 58,4 11,8
85
Egy ismérv szerinti elemzés
A 2.12. ábráról leolvasható, hogy Zala megyében a népesség koncentrációja nagyobb fokú, mint Nógrád megyében.
A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha a koncentrációs területet a háromszög területéhez
viszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció fokára. A koncentrációs terület arányát a koncentrációs együtthatóval
(jele: K) mérjük.
86
Egy ismérv szerinti elemzés
az ismérvértékek átlaga.
Koncentráció hiánya esetén: ( a görbe egybeesik az átlóval); minél közelebb van K értéke az 1-hez, annál nagyobb fokú a koncentráció.
átlagos különbség:
átlagos népességszám:
Zala megyében a népesség koncentrációja viszonylag nagy fokú, a Lorenz-görbe is ezt jelzi (2.12. ábra).
A társadalmi-gazdasági jelenségek egymástól egyenlő távolságra levő időpontokban, illetve időszakokban megfigyelt értékei
idősorokat alkotnak, melyek a vizsgált jelenség természetétől függően állapot- és tartamidősorok lehetnek.
Az állapotidősorok az álló sokaságok időbeli változását mutatják, az egyes időpontokra vonatkozó állapotfelvételek eredményeit rögzítik. E sorok
sohasem csoportosítás eredményeként jönnek létre, így a bennük szereplő adatok összegezésének nincs tárgyi értelme.
A tartamidősorok mozgó sokaságok időbeli alakulását mutatják. A sor elemei egy-egy időtartam folyamán bekövetkező események adatait tükrözik.
87
Egy ismérv szerinti elemzés
Mindkét típusú idősornál – éppen az időbeliség lényegéből következően – az ismérvváltozatok (időpontok, időszakok) sorrendje szigorúan kötött,
a sor elemei nem cserélhetők fel tetszés szerint.
1986 10 613
1987 12 087
1988 10 766
88
Egy ismérv szerinti elemzés
1989 14 490
1990 20 510
1991 21 860
1992 20 188
1993 22 804
A továbbiakban azokkal az egyszerű elemzési eszközökkel foglalkozunk, amelyek alkalmasak az idősorban rejlő információk szemléltetésére,
a tendenciák, törvényszerűségek feltárására. Az idősorok vizsgálatának általánosan alkalmazott eszközei a dinamikus viszonyszámok, a
grafikusábrázolás és az átlagok.
A kettőnél több adatból álló idősor esetén kétfajta dinamikus viszonyszám számítható: bázis- és láncviszonyszám.
A bázisviszonyszámok (jele: ) az idősor egyes adatainak a bázisul választott időszak (időpont) adatához viszonyított arányát fejezik ki:
ahol az idősor egymást követő adatai, az pedig a bázisul választott időszak (időpont) adata.
Bázisul az idősor bármelyik időszaka (időpontja) választható, sőt az idősoron kívüli időszak (időpont) is. A bázis megválasztásánál alapelvként
rögzíthetjük, hogy bázisként olyan időszak (időpont) adatát helyes választani, melynek nagyságát kivételes, véletlen körülmények nem befolyásolják,
így reálisan lemérhető a vizsgált jelenség változása. A statisztikai elemzések során leggyakrabban az első időszakot (időpontot) választjuk bázisul.
A láncviszonyszámok (jele: ) az idősor egyes adatainak a közvetlenül megelőző időszak (időpont) adatához viszonyított arányát fejezik ki:
89
Egy ismérv szerinti elemzés
időpont
1. –
2.
3.
. . . .
. . . .
. . . .
t.
. . . .
. . . .
. . . .
n.
Vizsgáljuk meg bázis- és láncviszonyszámokkal a lakossági megtakarítások alakulását. Az alapadatokat és a megfelelő viszonyszámokat a 2.31.
táblázatbanközöljük.
90
Egy ismérv szerinti elemzés
Az 1986. évi betétállomány az 1980. évinek (a megfigyelés időpontja mindkét évben december 31.) 1,892-szerese, azaz 189,2%-a. Tehát a
betétállomány 1980-ról 1986-ra 89,2%-kal nőtt.
91
Egy ismérv szerinti elemzés
1980. évre nem tudunk láncviszonyszámot számítani, mert a példánkban nem ismert az 1979. évi betétállomány.
Az 1981. évi bázis- és láncviszonyszám (általában is igaz, hogy a bázisul választott időszak (időpont) utáni időszak (időpont) bázis- és
láncviszonyszáma) azonos, mindkettő az 1980-ról 1981-re bekövetkező változást mutatja. A betétállomány 1980-ról 1981-re 10,2%-kal nőtt.
A bázis- és láncviszonyszámok az idősor eredeti adatainak ismerete nélkül is közvetlenül kölcsönösen kiszámíthatók egymásból.
Bázisviszonyszámokból láncviszonyszámokat ugyanúgy számítunk, mint az idősor eredeti adataiból. Az összehasonlítani kívánt időszak (időpont)
bázisviszonyszámát elosztjuk az őt közvetlenül megelőző időszak (időpont) bázisviszonyszámával.
A t-edik láncviszonyszám
Ugyanis a bázisviszonyszámokat úgy képezzük, hogy az idősor adatait rendre egy konstanssal (a bázisidőszak adatával) osztjuk, ezért a
bázisviszonyszámok egymás közötti aránya megegyezik az eredeti adatok egymás közötti arányával.
A k-adik bázisviszonyszám:
ugyanis:
92
Egy ismérv szerinti elemzés
A 2.13. ábra a takarékbetét-állomány alakulását szemlélteti. Ez az idősor állapotidősor, a megfigyelések időpontja minden évben december 31-e
volt. Ezért az idősor adatait jellemző pontok az időintervallumok (évek) végén helyezkednek el.
A 2.29. táblázat a Magyarországra érkező külföldi turisták számának alakulását mutató tartamidősor. Ábrázolásakor (2.14. ábra) az időintervallumok
(évek) közepén felmért pontokat kötjük össze egyenes szakaszokkal. Az idősorban előforduló legkisebb érték 9724 ezer fő (a legnagyobb 22 804
ezer fő), ezért a függőleges tengelyt megszakítva a beosztást 8000 ezer főnél kezdhetjük. (Ha a tengely beosztása ugyanis 0-tól folyamatos lenne,
a vonaldiagram nagyon „magasra” kerülne.)
93
Egy ismérv szerinti elemzés
A grafikus ábrázolással az ábrázolt adatok közötti arányokat szemléltetjük. Mivel a bázisviszonyszámok között ugyanolyan arányok vannak, mint
az idősor eredeti adatai között, ezért a bázisviszonyszámok alapján is készíthetünk vonaldiagramot. Különösen indokolt a bázisviszonyszámok
ábrázolása akkor, ha több, egymással összefüggő jelenség időbeli alakulását egy koordináta-rendszerben akarjuk szemléltetni.
Az átlagolás célja egyrészt az idősor átlagos értékének meghatározása, másrészt az idősorban végbemenő átlagos változások kimutatása lehet.
94
Egy ismérv szerinti elemzés
Az állapotidősorok adatai egy-egy időpontra vonatkoznak, összegüknek nincs tárgyi értelme. Ebben az esetben az idősor átlaga az átlagos
állomány- (készlet-) nagyságot mutatja. Két időpont esetén ez a nyitó- és záróállomány számtani átlaga ,több időpont esetén pedig a két-
két időpont közötti időszakokra számított átlagos állományok számtani átlaga.
Ezt az átlagot kronologikus átlagnak nevezzük (jele: ), és kizárólag állapotidősorok adatainak átlagolására használjuk. A megfigyelt időpontok
adataiból ( ) közvetlenül az alábbi egyszerűbb alakra hozott formában számítjuk:
A kronologikus átlag tehát olyan súlyozott számtani átlag, melynél az első és utolsó adat súlya a közbeeső adatok súlya pedig 1. A súlyok
összege (a nevezőben szereplő szám) így:
95
Egy ismérv szerinti elemzés
Az adatok összegének van értelme (a II. félévben összesen 207 ezer USD valutát adott el az utazási iroda), ezért átlagolásukra a számtani átlagot
használtuk.
A valutakészlet csak időpontokban értelmezhető (példánkban a hónap utolsó napján záráskor), ezért átlagolásukra a kronologikus átlagot használtuk.
Az idősor lényeges tulajdonságát kifejező tendenciát az időszakról időszakra (időpontról időpontra) bekövetkező változások átlagolásával ragadhatjuk
meg. A változást kétféleképpen mérhetjük: abszolút és relatív módon. Az abszolútváltozás két egymást követő időszak (időpont) adatának különbsége
a relatív változás pedig valamely időszak (időpont) adatának a megelőző időszak (időpont) adatához viszonyított aránya Az
átlagos változást (növekedést vagy csökkenést) két mutatóval mérhetjük: a fejlődés átlagos mértéke és a fejlődés átlagos ütememutatókkal.
96
Egy ismérv szerinti elemzés
A fejlődés átlagos mértéke (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos abszolút változást mutatja a vizsgált
jelenség mértékegységében.
Számítása úgy történik, hogy az egymást követő időszakokra (időpontokra) kiszámítjuk a növekedés (csökkenés) mértékét , majd azokat számtani
átlaggal átlagoljuk.
A mutató elsősorban az időszakról időszakra (időpontról időpontra) közel azonos mértékben növekvő (csökkenő), azaz megközelítőleg lineáris
fejlődést leíró idősorok fejlődési tendenciájának jellemzésére használható. Mivel értéke csak az idősor első és utolsó adatától függ, ezért csak akkor
jellemzi jól a változás átlagos mértékét, ha ezek nem kiugróan magas vagy alacsony (esetleg változó előjelű) értékek.
97
Egy ismérv szerinti elemzés
Az épített lakások számának alakulását mutató vonaldiagram (2.15. ábra) alapján látható, hogy a 2.33. táblázatban egy lineárisnak tekinthető változást
leíró idősor szerepel, ezért a mutató alkalmazása célszerű.
98
Egy ismérv szerinti elemzés
Az épített lakások száma 1985 és 1993 között évente átlagosan 6448 db-bal csökkent.
A fejlődés átlagos üteme (jele: ) az időszakról időszakra (időpontról időpontra) bekövetkező átlagos relatív változást mutatja.
A mutató a láncviszonyszámok mértani átlaga. A mértani átlag alkalmazását az indokolja, hogy a láncviszonyszámok szorzatának van tárgyi értelme.
Valamennyi láncviszonyszám szorzata ugyanis a megfigyelt utolsó időszak (időpont) bázisviszonyszámával azonos.
Mivel
Mivel
alakban is számítható.
A mutató számítása olyan idősorok esetén célszerű, melyeknél az idősor adata időszakról időszakra (időpontról időpontra) közel azonos ütemben
nő (csökken), azaz közelítőleg exponenciális fejlődést mutat.
Ilyen idősor a takarékbetét-állomány alakulása (2.31. táblázat), jól szemlélteti az exponenciális növekedésnek tekinthető fejlődést a grafikus ábra
is (2.13. ábra).
99
Egy ismérv szerinti elemzés
– a láncviszonyszámok alapján:
– az utolsó bázisviszonyszámból:
– a megfigyelt adatokból:
A lakosság takarékbetét-állománya 1980 és 1993 között évenként átlagosan 1,133-szeresére, azaz 13,3%-kal nőtt.
Az idősorok fejlődési tendenciáit kifejező, itt ismertetett mutatószámok végeredményben csak az első ( ) és az utolsó ( ) adatra támaszkodnak.
Ezért az ilyen számítások csak akkor adnak jellemző értékeket, ha az idősor alapvető tendenciája az egyenletes fejlődés (növekedés vagy csökkenés;
lineáris vagy exponenciális értelemben). Tankönyvünk II. kötetében megismerkedünk majd az idősorok fejlődési törvényszerűségeinek függvényekkel
történő leírásával, elemzésével. Az ott megismert eljárások pontosabb képet adnak a jelenségek, folyamatok alakulásáról.
2.3. Gyakorlófeladatok
1. Háztartások élelmiszerre fordított egynapi kiadásai (Ft-ban) az alábbiak:
Feladat:
a) Készítsünk rangsort!
100
Egy ismérv szerinti elemzés
e) Készítsünk hisztogramábrát!
2. Egy budapesti pénzváltó helyen valamely napon 107-en váltottak valutát forintra. Az ügyfelek megoszlása a váltott összeg nagysága szerint az
alábbi:
10 – 20 20
20 – 30 33
30 – 40 23
40 – 50 12
50 – 60 3
60 felett 4
Összesen 107
Feladat:
c) Számítsuk ki és értelmezzük az átlagot, móduszt, mediánt és a kvartiliseket! Jelöljük az a) pontbeli ábrán ezeket az értékeket!
d) Vizsgáljuk a szóródást!
101
Egy ismérv szerinti elemzés
Az adót fizetők %-
Adóköteles jövedelem
os megoszlása
(ezer Ft) 1991 1992
0 –90 20,3 15,2
Feladat:
102
Egy ismérv szerinti elemzés
Kiszámított adatok: Az 1015,2 ezer férfi átlagos nyugdíja 12 679 Ft, a 1218,4 ezer nő átlagos nyugdíja pedig 10 205 Ft volt. A férfiaknál 4149 Ft az
átlagtól való átlagos eltérés, a nőknél pedig 2483 Ft. (Az eltérések négyzetei alapján.)
Feladat:
c) Számítsuk ki az aszimmetria A mutatóját a férfiak és a nők csoportjára! Hasonlítsuk össze a kapott eredményeket!
Foglalkoztatottak
A foglalkoztatottak Vállalatok Árbevétel
száma
nagyságcsoportjai (fő) száma (milliárd Ft)
(1000 fő)
21 –50 1361 60 57
51 –100 782 73 62
103
Egy ismérv szerinti elemzés
Feladat:
b) A vállalatok hány %-a foglalkoztat maximum 500 főt? Mennyi ezen vállalatok összes foglalkoztatottjainak létszáma ténylegesen, illetve a
nagyságcsoportok alapján becsülve?
c) Számítsuk ki a vállalatok és az összes foglalkoztatottak %-os megoszlását! Hasonlítsuk össze az egyes létszámkategóriákhoz tartozó arányokat!
Nevezzük meg a kiszámított viszonyszámokat!
Feladat:
b) A korábban írt 30 pontos zárthelyit a hallgatók átlagosan 20 pontra írták meg, 9 pontos szórással. Melyik zárthelyin volt nagyobb a pontszámok
ingadozása, szóródása?
104
Egy ismérv szerinti elemzés
Feladat:
Milliárd Ft
Év Bevételek Kiadások
1985 25 10
1986 27 10
1987 37 12
1988 39 33
1989 48 59
1990 63 38
1991 78 38
1992 98 53
Feladat:
a) Vizsgáljuk meg a bevételek és a kiadások alakulását 1985-höz képest, valamint évről évre!
d) Mennyi volt a bevételek, kiadások, illetve az egyenleg növekedési üteme a vizsgált időszakban átlagosan?
105
Egy ismérv szerinti elemzés
Betétállomány Előző év
Év 1980 = 100% 1985 = 100%
(milliárd Ft) = 100%
1985 244,1 168,0 100,0 –
Feladat:
d) Hány Mrd Ft volt a betétállomány 1980-ban? Mennyi volt a növekedés évi átlagos mértéke 1980 és 1992 között?
106
3. fejezet - A sokaságok több ismérv szerinti vizsgálata, a
statisztikai táblák elemzése
3.1. A statisztikai táblákról általában
A sokaságok több szempont szerinti megfigyelésének eredménye statisztikai táblák formájában is megadható.
Statisztikai táblának nevezzük a megfelelő külső formával ellátott statisztikai sorok összefüggő rendszerét.
A tábla külső formáján rovatokból álló hálózatot értünk. A rovatok egy része statisztikai adatokat, számokat, más része megnevezéseket, magyarázó
szövegeket tartalmaz. A megnevezéseket tartalmazó rovatok közül azokat, amelyek a tábla bal oldalán helyezkednek el, oldalrovatoknak nevezzük.
Ezek a rovatok a vízszintesen elhelyezkedő sorok elnevezéseit tartalmazzák. A tábla felső részén elhelyezkedő feliratos, szöveges rovatokat
fejrovatoknak nevezzük. A fejrovatokban található megnevezések a függőlegesen elhelyezkedő oszlopokra vonatkoznak. Az egyes sorok és oszlopok
adatainak összegét, illetve a sokaság(ok) egészére jellemző adatokat tartalmazó rovatok az ún. összesen rovatok.
A statisztikai tábla definíciójából – amely szerint: „statisztikai sorok összefüggő rendszere” – következik, hogy a tábla minden egyes adata egyidejűleg
több, de legalább két (egy vízszintesen és egy függőlegesen elhelyezkedő) statisztikai sornak tagja.
Azt a számot, amelyik azt jelzi, hogy a tábla egy-egy adata hány statisztikai sorhoz tartozik, a statisztikai tábla dimenziószámának nevezzük.
Definiálhatnánk a statisztikai táblát oly módon is, hogy a statisztikai sort is táblának
Tehát az előbbi definíció szerint a statisztikai táblák legalább kétdimenziósak
tekintenénk, mégpedig egydimenziós táblának.
. A statisztikai táblákat – a dimenziószám mellett – leggyakrabban a csoportosításnak (az osztályozásnak) a tábla
elkészítésében betöltött szerepe szerint különböztetjük meg.
A csoportosítás szerepe szerint a statisztikai táblák lehetnek egyszerű, csoportosító és kombinációs táblák.
Az egyszerű táblák
Az egyszerű táblákban általában leíró és összehasonlító sorok szerepelnek. Formai ismertetőjegyük, hogy nincsenek összesen rovataik.
Példaként nézzük a budapesti székhelyű külföldi érdekeltségű vállalkozások néhány fontosabb adatának alakulását tartalmazó táblát (3.1. táblázat).
3.1. táblázat - A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok)
Megnevezés 1989 1991 1993
107
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A tábla nem tartalmaz csoportosítást, ezért összesen rovatok sem szerepelnek benne. Három – vízszintesen elhelyezkedő – összehasonlító,
állapotidősor és három – függőlegesen elhelyezkedő – leíró sor alkotja a táblát. A tábla minden adata egyidejűleg két statisztikai sornak tagja, tehát
a 3.1. táblázat egy kétdimenziós egyszerű tábla.
A csoportosító táblák
Az egy ismérv szerinti csoportosítást tartalmazó statisztikai sorok összefüggő rendszere a csoportosító tábla.
A csoportosító táblában egy ismérv szerinti csoportosítás eredményeként keletkezett csoportosító sorok összehasonlítással vagy (és) leíró sorokkal
szerepelnek együtt. A csoportosító tábla egy irányban összesen rovatokat is tartalmaz.
A következő táblában az egy ismérv szerinti csoportosítás összehasonlítással társul (3.2. táblázat).
A tábla függőleges irányban tartalmazza a csoportosítást. A csoportosítás alapja – az életkor – mennyiségi ismérv, ezért a táblában függőlegesen
három mennyiségi sor helyezkedik el. Vízszintesen kilenc összehasonlító, állapotidősor található. Ebben a táblában vízszintes irányban helyezkednek
el az összesen rovatok. Az összesen rovatban lévő adatok alkotják azt az idősort, amely az egész népesség számának alakulását mutatja.
108
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A kombinációs táblák
A sokaság több ismérv szerinti kombinatív osztályozásának eredményeként kapott adatokat kombinációs vagy kontingenciatáblába foglalhatjuk.
A kombinációs tábla legalább két ismérv szerinti kombinatív csoportosítást tartalmaz.
Az 1.4. pontban a magyarországi lakott lakások két ismérv szerinti kombinatív csoportosítása eredményeként adódó sémát közöltünk. A kétszeresen
csoportosított adatokból kiindulva és az adatokat függőleges és vízszintes irányban elrendezve, felírhatjuk a statisztikai sorok olyan összefüggő
rendszerét, amely kombinációs táblát alkot (3.3. táblázat).
3.3. táblázat - A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint
(1990. január 1.)
A tábla kétféle minőségi ismérv – a komfortosság és a településtípus – szerinti kombinatív csoportosítást tartalmaz. Függőlegesen a komfortosság
szerinti csoportosításból keletkezett négy minőségi sor helyezkedik el. Ezek a lakások számának komfortosság szerinti megoszlását mutatják
településtípusonkénti bontásban, valamint az összes lakásra vonatkozóan. A vízszintes irányban elhelyezkedő négy – ugyancsak – minőségi sor
a különböző komfortfokozatú lakások és az összes lakás településtípusonkénti megoszlását jellemzi. A kétféle csoportosításnak megfelelően két
irányban találhatók összesen adatok.
109
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A különböző típusú statisztikai táblák formájában rendelkezésre álló adatok elemzésénél különböző jellegzetes elemzési esetek adódnak, a
vizsgálathoz különböző elemzési eszközöket, módszereket használunk.
A 3. fejezet további részében kétdimenziós statisztikai táblákhoz kapcsolódóan tekintünk át jellegzetes elemzési eseteket, és bemutatjuk, hogy az
egyes esetekben milyen statisztikai elemzési eszközök, módszerek, mutatószámok alkalmazhatók.
Az elemzés során intenzitási viszonyszámokat és összehasonlító viszonyszámokat számíthatunk, bizonyos esetekben a tábla információtartalmát
megfelelő grafikus ábrák segítségével is megjeleníthetjük.
110
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ezzel szemben az intenzitási viszonyszám két különböző fajta és általában különböző mértékegységű statisztikai adat hányadosa.
Az intenzitási viszonyszám azt mutatja meg, hogy az egyik sokaság milyen intenzitással fordul elő a másik sokaság környezetében. Általában
mértékegysége van, amely a viszonyszám számlálójában és nevezőjében szereplő adat – nem feltétlenül azonos – mértékegységéből adódik. Mivel
az egyszerű táblák általában leíró sorokat is tartalmaznak, elemzésük során az ilyen típusú viszonyszámok alkalmazására tág lehetőségek nyílnak.
– sűrűségmutatók,
– arányszámok,
– átlagjellegű mutatók.
Sűrűségmutató például a népsűrűség mutatószáma, amely a népességnek a számára rendelkezésre álló területen való elhelyezkedésének
sűrűségét, intenzitását mutatja. Az ellátottsági mutatók a szociális, a kulturális stb. ellátás színvonalának mérőszámai. (Például a 10 000
lakosra jutó kórházi ágyak száma, amely az egészségügyi ellátás egyik mutatószáma.) Az arányszám elnevezésű mutatószámokat főleg a
népességstatisztikában használják, ilyenek a születési, halálozási stb. arányszámok. Átlagjellegű mutatók például az 1 főre jutó GDP nagysága, 1
termék előállításához szükséges munkaidő stb.
111
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
mutatóval, vagy az
mutatóval.
1980-ban:
1993-ban:
Példánk alapján látható, hogy az intenzitási viszonyszámok bizonyos körénél a viszonyítás tárgyát képező adat és a viszonyítás alapját képező adat
felcserélhető, vagyis az intenzitási viszonyszám számítása céljából kijelölhető tört számlálójában és nevezőjében szereplő adatok felcserélhetők.
Ha ugyanazon két sokaság adata alapján ilyen módon kétféle intenzitási viszonyszám képezhető, az egyiket egyenes, a másikat fordított intenzitási
viszonyszámnak szokás nevezni. A két intenzitási viszonyszám közül azt célszerű egyenesnek nevezni, amely értékének növekedése kedvező
irányú változást jelez.
A 10 000 lakosra jutó orvosok számának növekedése az orvosellátottság javulását jelzi, ezért ezt tekintjük egyenes intenzitási viszonyszámnak;
az 1 orvosra jutó lakosok számát pedig fordított intenzitási viszonyszámnak, ugyanis ennek nagysága fordított arányban áll a vizsgált jelenség
színvonalával.
1
Az ugyanazon két adat alapján számított, egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok fordított arányban állnak egymással .
12
Az orvosellátottság két említett mutatószámánál ügyeljünk arra, hogy az egyenes intenzitási viszonyszám 10 000 lakosra vetítve mutatja az orvosok számát.
112
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ha abból a sokaságból – amelynek a nagyságát jellemző adat (B) az elemzés céljából kiszámítandó intenzitási viszonyszám nevezőjében szerepel
– kiválasztható egy olyan részsokaság (a nagyságát b jellemzi), amely – az egész sokaságnál – közvetlenebb kapcsolatban áll a számlálóban levő
adattal (A-val), akkor kétféle intenzitási viszonyszám számítható.
A viszonyítandó adatot a teljes viszonyítási alappal elosztva nyers intenzitási viszonyszámot a vele szorosabb kapcsolatban álló részsokaság
A kétféle viszonyszám kiszámításához felhasznált adatok lehetővé teszik még egy megoszlási viszonyszám kiszámítását is, amely a tisztított
intenzitási viszonyszám nevezőjében szereplő részsokaság adatának arányát mutatja a nyers intenzitási viszonyszám nevezőjében szereplő teljes
sokaság adatához viszonyítva Ezt az arányt a „tiszta” rész arányának szokás nevezni.
a nyers intenzitási viszonyszám egyenlő a tisztított intenzitási viszonyszám és a tiszta rész arányának szorzatával.
Az összefüggés alapján bármelyik viszonyszám kiszámítható a másik kettő ismeretében. Az összefüggés arra is rámutat, hogy a nyers intenzitási
viszonyszám két tényező hatásának eredménye.
A nyers és tisztított intenzitási viszonyszámok alkalmazásának számos területe van, legjellemzőbb a használatuk a népességstatisztikában
alkalmazott arányszámok esetében. Például a születési arányszám számításánál a születések számát viszonyíthatjuk az egész népesség számához,
illetve viszonyítási alap lehet a szülőképeskorú (15–49 éves) női népesség száma.
A korábbi példánkban az 1 orvosra jutó lakosok száma nyers intenzitási viszonyszámnak tekinthető. Az orvosok sokaságán belül ugyanis van egy
olyan rész – a háziorvosok sokasága –, amely közelebbi kapcsolatban van az ellátandó népességgel. Ezért kiszámítható az 1 háziorvosra jutó
lakosok száma is, amely tisztított intenzitási viszonyszámnak minősül. Az orvosellátottság nyers és tisztított viszonyszámai 1980-ban:
113
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A háziorvosok aránya:
Összefüggésük:
1993-ban:
A háziorvosok aránya:
Összefüggésük:
A 3.4. táblázatban megadott adatok nemcsak intenzitási, hanem dinamikus viszonyszámokkal is elemezhetők.
(0) (1)
2
Annak érdekében, hogy az eredmények közötti pontos, számszerű összefüggéseket bemutathassuk, a viszonyszámok számításánál 2 tizedes pontossággal számoltunk.
A táblázatban található megoszlási viszonyszámok és dinamikus viszonyszámok százalékos formában kifejezett viszonyszámok. A viszonyszámok számításának képletszerű felírásakor a 100-zal
való szorzás kijelölésétől eltekintettünk.
114
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
száma
1 2102,31 1610,72 76,62
háziorvosra
jutó lakosok
száma
A táblázatban, amely ugyancsak egyszerű statisztikai tábla, az abszolút adatok mellett különféle típusú intenzitási viszonyszámok, megoszlási
viszonyszámok, az utolsó oszlopban pedig dinamikus viszonyszámok foglalnak helyet.
Mint látható, nemcsak az abszolút adatok összehasonlításából számíthatunk összehasonlító – jelen esetben dinamikus – viszonyszámokat, hanem
az intenzitási
viszonyszámokból is. Fontos megjegyezni, hogy a különféle típusú intenzitási viszonyszámok közötti összefüggések az azokból számított dinamikus
(és egyéb összehasonlító) viszonyszámok között is fennállnak.
Az intenzitási viszonyszámok összehasonlítása esetén a dinamikus viszonyszámot kétféleképpen is kiszámíthatjuk. Például az 1 orvosra jutó lakosok
számának változását jelző dinamikus viszonyszám kiszámítható:
115
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Az 1 orvosra jutó lakosok száma tehát 28,47% -kal csökkent 1980-ról 1993-ra.
Az ugyanazon két adat alapján számított egymásnak megfelelő egyenes és fordított intenzitási viszonyszámok egymás reciprokai.
116
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Összefüggésük:
(A 10 000-rel való szorzást az indokolja, hogy az egyik viszonyszámnál a nevező 1 egységéről, a másik viszonyszámnál a nevező 10 000 egységéről
van szó.)
A reciprok viszony fennáll az egyenes és fordított intenzitási viszonyszámok dinamikus viszonyszámai között is:
Például: a 10 000 lakosra jutó orvosok számának 1980-ról 1993-ra bekövetkezett változását jelző dinamikus viszonyszám kiszámítható a
következőképpen is:
Egy sokaság változásának tendenciája kirajzolódik a sokaság nagyságadatait tartalmazó – viszonylag hosszabb – idősorból, illetve szemléletesen
tükrözi ezt az idősor adatai alapján készített vonaldiagram.
Ha két vagy több – egymással valamilyen kapcsolatban lévő – sokaság változásának tendenciáját kívánjuk összehasonlítani, akkor az adatok eltérő
nagyságrendje, eltérő mértékegysége miatt csak a dinamikus viszonyszámok alapján vonhatunk le következtetéseket. Követelmény továbbá, hogy
mindegyik adatsor összehasonlítási bázisa azonos legyen. Ha pedig grafikusan akarjuk szemléltetni a különböző jelenségek fejlődési tendenciáit,
akkor célszerű közös (egyetlen) koordináta-rendszerben ábrázolni azokat.
Bemutató példánkat ismét az egészségügy területéről vesszük. A 3.6. táblázat az 1985 és 1993 közötti időszakra (kettőnél több időbeli adat alapján)
mutatja be az ellátottságot jellemző néhány adatot.
117
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Figyeljük meg, hogy a népességszám ezer főben adott, az orvosok számának a láncviszonyszámai, a kórházi ágyak számának pedig a
bázisviszonyszámai (1980-as bázison) ismertek.
A bekövetkezett változások jellemzése és reális összehasonlítása a három jelenség bázis- vagy láncviszonyszámai alapján lehetséges. Ezek
ismeretében történhet ezután a megfelelő intenzitási viszonyszámok dinamikus viszonyszámainak kiszámítása.
A 3.7. táblázat első három oszlopa az alapadatok bázisviszonyszámait, további oszlopai pedig a kiszámítható intenzitási viszonyszámok (1985-ös
bázison számított) bázisviszonyszámait tartalmazzák.
118
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
ágyak
száma száma
száma
1985=100% 1985=100%
1985=100%
1. 2. 3. 4. 5. 6.
1985 100,00 100,00 100,00 100,00 100,00 100,00
– A Dinamikus viszonyszámok című 2.2.2. alpontban megismerkedtünk a bázis- és a láncviszonyszámok közötti összefüggésekkel.
Láncviszonyszámokból bázisviszonyszámok közvetlenül számíthatók, a megfelelő láncviszonyszámok szorzataként.
– A kórházi ágyak számának alakulását jellemző viszonyszámok a 3.6. táblázatban 1980-as bázishoz viszonyítva mérik a változást. E
bázisviszonyszámokat az összehasonlíthatóság érdekében átszámítottuk 1985-ös bázisra.
Az átszámítás úgy történt, hogy az 1980. évi bázison számított bázisviszonyszámokat rendre elosztottuk az „új” bázisul választott 1985. év 1980-
as bázison számított viszonyszámával, az 1,0713-del.
Például a kórházi ágyak számának 1990. évi bázisviszonyszáma, 1985-ös bázishoz viszonyítva
119
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A két bázisviszonyszám hányadosa ugyanarra az eredményre vezet, mintha a két alapadatot osztottuk volna el egymással.
Általánosságban is megállapíthatjuk, hogy új bázisra úgy térünk át, hogy a viszonyszámsor minden elemét elosztjuk az új bázisnak választott
időszak (időpont) eredeti bázisviszonyszámával.
– A táblázat 4., 5. és 6. oszlopában szereplő intenzitási viszonyszámok bázisviszonyszámait az ebben a fejezetben megismert összefüggések alapján
számítottuk ki.
Például
(Az eredeti viszonyszámtört számlálójának – a kórházi ágyak számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – a népesség
számának – a viszonyszámával.)
(Az eredeti viszonyszámtört számlálójának – a népesség számának – bázisviszonyszámát osztottuk az eredeti tört nevezőjének – az orvosok
számának – a viszonyszámával.)
A 3.7. táblázat alapján látható, hogy a népesség számának csökkenő tendenciája mellett az orvosok száma növekedést mutat. A népességszám
és az orvosok számának bázisviszonyszámait összehasonlítva egyértelműen következtethetünk az orvosellátottság javulására, amelyet közvetlenül
jeleznek a 10 000 lakosra jutó orvosok számának, illetve az 1 orvosra jutó lakosok számának bázisviszonyszámai.
A kórházi ágyak számának alakulását 1985 és 1991 között viszonylag egyenletes, de kismértékű növekedés jellemezte. A csökkenő népességszám
mellett ez a 10 000 lakosra jutó kórházi ágyak számának növekedését eredményezte. 1991-től kezdődően azonban a kórházi ágyak száma évről
évre csökkent, nagyobb arányban, mint a népességszám. Ezért 1991-től kezdődően a 10 000 lakosra jutó kórházi ágyak száma is – viszonylagosan
– csökkent.
120
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A 3.2. ábra alapján is következtethetünk az egészségügyi ellátás – különböző intenzitási viszonyszámokkal jellemzett – színvonalának alakulására.
Az egészségügyi ellátottság változásának tendenciáját – egyértelműbben – a 3.3. ábra szemlélteti.
3.3. ábra - Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva
121
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A változás tendenciájának tömör jellemzésére alkalmazhatjuk az átlagos változás mérőszámait, nevezetesen a fejlődés átlagos mértéke és a
fejlődés átlagos üteme mutatószámokat.
Az ismert adatok alapján a fejlődés átlagos mértékének mutatószámával csak a népesség számának alakulását vizsgálhatjuk. (Az orvosokra és a
kórházi ágyakra ugyanis nem ismertek az abszolút számok.)
Ezt úgy értelmezhetjük, hogy Magyarországon a népesség száma 1985 és 1993 között évenként átlagosan 35 250 fővel csökkent.
amely alapján megfogalmazható, hogy a népesség száma 1985 és 1993 között évenként átlagosan 0,34%-kal csökkent.
Nézzük meg, hány %-kal változott a kórházi ágyak száma 1985 és 1993 között:
A 10 000 lakosra jutó kórházi ágyak számának 1985 és 1993 közötti átlagos relatív változására vonatkozó mutatószám értékét kiszámíthatjuk a
kórházi ágyak számának és a népesség számának mutatószámai alapján is a következőképpen:
Ez természetesen kiszámítható a 10 000 lakosra jutó kórházi ágyak számának adataiból közvetlenül is:
122
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Az orvosok számának, valamint az orvosellátottság 1985 és 1993 közötti alakulásának jellemzésére az előbbiekhez hasonló módon elvégezhetők
a számítások.
(csoportok)
Fősokaság
ahol:
123
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A részviszonyszám képlete:
Ezek az összefüggések arra mutatnak rá, hogy az összetett viszonyszám egyúttal átlag is, a részviszonyszámok súlyozott számtani, illetve
harmonikus átlaga. Ez indokolja a jelölését is. Ebből következően minden összetett viszonyszám a legkisebb és legnagyobb részviszonyszám
között helyezkedik el, vagyis:
Az összetett viszonyszámra vonatkozó képleteket szövegesen megfogalmazva a következők mondhatók el. Az összetett viszonyszám
háromféleképpen számítható ki:
124
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
2. a részviszonyszámok súlyozott számtani átlagaként, ahol a súlyok szerepét a részviszonyszámok számítása céljából kijelölhető törtek
nevezőiben szereplő adatok töltik be;
3. a részviszonyszámok súlyozott harmonikus átlagaként, ahol a súlyok a részviszonyszámok számítása céljából kijelölhető törtek számlálóiban
szereplő adatok.
Az összetett viszonyszámok súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási
A következőkben a rész- és összetett viszonyszámoknak különböző elemzési helyzetekben betöltött szerepére mutatunk be példákat.
3.9. táblázat - Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.)
Népességszám Lakások száma
Megnevezés
(ezer fő) (ezer db)
A 3.9. táblázatban szereplő adatok felhasználásával jellemezhető a magyarországi lakásellátottság színvonala. Kiszámítható a lakásellátottság egyik
leggyakrabban használt mutatószáma, a 100 lakásra jutó lakosok száma .
125
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ebben az elemzési helyzetben a településtípusokra vonatkozó intenzitási viszonyszámok részviszonyszámok míg az egész országot jellemző
intenzitási viszonyszám összetett viszonyszámnak tekinthető.
A 3.9. táblázat adataiból – mivel azok részekre bontott sokaságok adatai – megoszlási viszonyszámok is számíthatók. Ezek a viszonyszámok a
népesség, illetve a lakások településtípusonkénti összetételét jellemzik.
A 3.9. táblázatban szereplő adatokat a belőlük számítható viszonyszámokkal kiegészítve állítottuk össze a 3.10. táblázatot.
Megnevezés
Budapest
1 995,7 19,42 810 20,48 246
A többi
4 561,9 44,39 1692 42,78 270
város
3 719,4 36,19 1453 36,74 256
Községek
Összesen 10 277,0 100,00 3955 100,00 260
A 3.10. táblázat utolsó oszlopában található adatok rész- és összetett intenzitási viszonyszámok. Részintenzitási viszonyszám például a Budapestre
vonatkozó 100 lakásra jutó népesség:
126
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
(Figyeljük meg, hogy az egész országot jellemző mutatószám értéke (260) a legkisebb (246) és a legnagyobb érték (270) közé esik.)
3.11. táblázat - A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok)
Ezer db
127
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
1980 1994
Szobák száma
1 973 644
2 1720 1710
A lakásállomány szobaszám szerinti szerkezetét, összetételét a különböző időpontokban megoszlási viszonyszámokkal, az állomány nagyságának
változását pedig dinamikus viszonyszámokkal elemezhetjük. Az egyes csoportokra (részsokaságokra) részviszonyszámok a fősokaságokra
összetett dinamikus viszonyszám számítható. Számításukra és a közöttük levő összefüggésekre a korábbiakban elmondottak érvényesek.
Figyelmünket most elsősorban a szerkezetvizsgálat és a dinamikai változások összefüggéseire fordítjuk. A 3.12. táblázat az előző táblázat adatait
kibővíti a kiszámítható viszonyszámokkal is.
128
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A lakásállomány szerkezetének 1980 és 1994 közötti változására az 1 szobás lakások arányának jelentős, a 2 szobások arányának kismértékű
csökkenése és a 3 szobás lakások arányának nagyfokú növekedése jellemző. (Lásd a %-os megoszlásokat.) 1980 és 1994 között az egész
lakásállomány 11,7%-kal nőtt, miközben a különböző szobaszámú lakások száma ettől eltérő módon változott. Míg az 1 szobás lakások állománya
számottevően csökkent, a 2 szobásoké alig csökkent, addig a 3 szobás lakások száma nagymértékben megnőtt. E változások eredményezték a
lakásállomány szobaszám szerinti szerkezetének az előzőekben vázolt változását.
Az összetétel-változás viszonyszámokkal történő elemzésére tekintsük még a következő példát is (3.13. táblázat).
Budapest
2 059,3 19,23 1 995,7 19,42 96,9
A többi
4 551,3 42,50 4 561,9 44,39 100,2
város
4 098,9 38,27 3 719,4 36,19 90,7
Községek
Összesen 10 709,5 100,00 10 277,0 100,00 96,0
Magyarország népessége 1980 és 1994 között 4,0%-kal csökkent. A budapesti népességszám ettől alig eltérően – de valamivel kisebb mértékben –,
3,1%-kal csökkent, emiatt a budapesti népesség aránya csekély mértékben (19,23%-ról 19,42%-ra, tehát 0,19 százalékponttal) nőtt. A többi városban
a népességszám igen kis mértékben, 0,2%-kal nőtt, mivel a teljes népességszám viszont csökkent, e településcsoport népességének részaránya
megnőtt. A községekben élő népesség száma 1994-ben 9,3%-kal volt kevesebb, mint 1980-ban (tehát nagyobb mértékű csökkenés tapasztalható,
mint az egész országban), ennek hatására a községekben élő népesség aránya 1994-ben kisebb, mint 1980-ban.
A példák alapján könnyen belátható, hogy összefüggés van a fősokaság és a részsokaságok nagyságának és a fősokaság szerkezetének változása
között.
129
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A részsokaságok nagyságának eltérő mértékű változása mindig a fősokaság összetételének megváltozását eredményezi.
a) Ha akkor ebből átrendezéssel következik, ami azt jelenti, hogy ha valamely részsokaság (csoport) dinamikus
viszonyszáma kisebb, mint az összetett dinamikus viszonyszám, akkor a részsokaság aránya a fősokaságon belül csökkent.
Ehhez hasonlóan:
b) ha akkor tehát ha valamely részsokaság (csoport) dinamikus viszonyszáma nagyobb, mint az összetett dinamikus viszonyszám,
akkor a részsokaság aránya a fősokaságon belül nőtt;
c) ha akkor ebből következik, ami azt jelenti, hogy a j-edik részsokaság aránya nem változott.
A dinamikus viszonyszámok ismeretében tehát következtetni tudunk a sokaság összetételében, szerkezetében bekövetkezett változásokra. Minél
jobban eltér valamely részviszonyszám az összetett viszonyszámtól, annál nagyobb mértékű az adott sokaság részarányának változása.
130
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Tételezzük fel, hogy ismerjük a lakásépítések területi megoszlását 1980-ban és az 1994-re bekövetkezett dinamikai változást. Az adatok a 3.14.
táblázatban találhatók.
A lakások
számának változása
A lakások számának
1980-ról 1994-re
%-os megoszlása 1980-ban
(1980=100,0%)
Megnevezés
A teljes lakásállomány nagyságának 1980 és 1994 közötti változását jellemző összetett dinamikus viszonyszámot a 3.14. táblázatban szereplő adatok
alapján a településcsoportokra vonatkozó rész-dinamikus viszonyszámok súlyozott számtani átlagaként számíthatjuk ki.
Tehát megállapítható, hogy az egész lakásállomány 1980-ról 1994-re 11,7%-kal nőtt. A budapesti lakások száma ennél valamivel kisebb mértékben
(11,4%-kal) nőtt, emiatt a budapesti lakások aránya a teljes lakásállományon belül 1980-ról 1994-re kissé csökkent. Tehát az 1994. évi részarányt
jelző megoszlási viszonyszám 20,53%-nál (nem számottevően) kisebb. A többi városban a lakásállomány a teljes állomány növekedésénél nagyobb
fokú növekedést mutat, e tényből az is következik, hogy a többi város részesedése az ország lakásállományából megnőtt, 1994-ben a részesedési
arány 34,27%-nál nagyobb. A községi lakások száma a vizsgált időszakban csökkent (míg az egész lakásállomány nőtt), így a községi lakások
aránya csökkent, az arány 1994-ben 45,20%-nál kisebb volt.
A sokaságok nagyságának és szerkezetének változására vonatkozó információkat nemcsak csoportosító táblák formájában jeleníthetjük meg, hanem
megfelelően megválasztott, megszerkesztett grafikon segítségével is.
131
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A sokaságok nagyságának és összetételének változását leggyakrabban osztott oszlopdiagramokkal vagy osztott kördiagramokkal szemléltetjük.
Oszlopdiagrammal történő ábrázolás esetén az adatokat célszerű eltérő szélességű, azonos magasságú oszlopokkal ábrázolni. Az oszlopok
(téglalapok) eltérő szélességében a sokaság(ok) nagyságának időbeli változását juttatjuk kifejezésre, és az azonos magasságokat az adott időszaki
összetételnek megfelelően megosztjuk, így a szerkezetváltozás is érzékelhetővé válik.
132
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A kördiagram a sokaság szerkezeti megoszlásának igen kifejező ábrázolási módja. Az összetételt a kör területének körcikkekre történő osztásával
szemléltetjük. A részsokaságok arányát jelző megoszlási viszonyszámoknak megfelelő körcikkeket abból az egyszerű összefüggésből határozzuk
meg, hogy a kör területe, azaz a 360°-os középponti szög megfelel a 100%-nak, így 1%-nak 3,6°-os középponti szög, azaz a hozzátartozó körcikk
területe felel meg. Az összetétel ábrázolása mellett lehetőség van arra is, hogy a sokaságok nagyságának időbeli változását is érzékeltessük. Két
időszak adatának összehasonlítása esetén két különálló (esetleg két koncentrikus), eltérő sugarú körrel ábrázolunk.
Síkidomokkal való ábrázolás esetén azok területe arányos az adatok nagyságával, viszont síkidomok megszerkesztésekor egydimenziós
jellemzőkből indulunk ki, így a köröket a sugaruk segítségével szerkesztjük. Ehhez fontos tisztázni, milyen arányban áll a sugarak nagysága
egymással.
Ha azt akarjuk, hogy a körök területaránya a viszonyszámot fejezze ki – mivel a körök területaránya azonos a sugarak négyzetének arányával
–, a sugarak aránya lesz.
Természetesen a 3.5. ábra elkészítéséhez is szükségesek a 3.12. táblázatból kiolvasható viszonyszámok. Az 1994-es lakásállomány nagyságát
szemléltető kör sugara a az 1980. évi állományt reprezentálóénak -szerese.
133
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Az ismérvek közötti kapcsolat lehet függvényszerű, lehet sztochasztikus, illetve az ismérvek lehetnek egymástól függetlenek.
Függvényszerű a kapcsolat két ismérv között, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) egyértelműen meghatározza a másik ismérv
szerinti hovatartozást (ismérvváltozatot). Ilyen összefüggés van például a lakosok születési éve és életkora között.
Sztochasztikus kapcsolatról beszélhetünk akkor, ha az ismérvek között tendenciaszerű összefüggést észlelünk, ha az egyed egyik ismérv szerinti
hovatartozásából csupán a másik ismérv szerinti hovatartozásnak a valószínűsége határozható meg. Ilyen összefüggés van például a munkavállalók
képzettsége és szakmai elismertsége között; a vállalkozások árbevétele és jövedelmezősége között stb.
A két ismérvet egymástól függetlennek mondjuk, ha az egyik ismérv szerinti hovatartozás (ismérvváltozat) ismerete semmiféle információt nem ad
a másik ismérv szerinti hovatartozásról (ismérvváltozatról). Pontos definícióját a 3.4.1. pontban adjuk meg.
A statisztika a sztochasztikus kapcsolat vizsgálatával foglalkozik. Ezt a kapcsolatot – az elmondottak alapján – úgy tekinthetjük, mint a két szélsőség
(a teljes függvényszerűség, illetve a kapcsolat teljes hiánya) közötti átmenetet. A kapcsolat erősségét (intenzitását) aszerint ítéljük meg, hogy az
melyik szélsőséghez áll közelebb.
A kapcsolatot annál lazábbnak, gyengébbnek nevezzük, minél közelebb van a függetlenséghez és annál szorosabbnak, erősebbnek, minél
közelebb áll a függvényszerű kapcsolathoz.
A sztochasztikus kapcsolatról elmondottak általánosíthatók kettőnél több ismérv esetére is, de ebben a fejezetben csak a két ismérv közötti
(kétváltozós) sztochasztikus kapcsolatok vizsgálatának néhány egyszerű elemzési eszközével foglalkozunk.
A vizsgálatba bevont ismérvek fajtája szerint a sztochasztikus kapcsolatnak háromféle típusát különböztetjük meg:
a) Asszociáció(s)kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (nominális változók, illetve egyikük ordinális
mérési szintű változó).
b) Vegyes kapcsolat: az egyik ismérv minőségi vagy területi ismérv (nominális, illetve ordinális skálán mért változó), a másik ismérv mennyiségi
ismérv (intervallum- vagy arányskálán mért változó).
c) Korreláció(s) kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (intervallum- és (vagy) arányskálán mért változó).
Tekintsük a következő példát: a közalkalmazottakat megfigyeljük az iskolai végzettség, a vezetésben betöltött szerep (beosztás), a közalkalmazotti
munkaviszony hossza és a kereset nagysága szerint. Ha összefüggést tapasztalunk az iskolai végzettség és a beosztás között, ezt a kapcsolatot
asszociációnak nevezzük, mert mindkét jellemző minőségi ismérv. Az iskolai végzettség (minőségi ismérv) és a kereset nagysága (mennyiségi
ismérv) közötti kapcsolat, illetve a beosztás (minőségi ismérv) és a kereset nagysága (mennyiségi ismérv) közötti kapcsolat vegyes kapcsolat. A
munkaviszony hossza és a kereset nagysága közötti kapcsolatot pedig korrelációnak nevezzük, mert mindkét jellemző mennyiségi ismérv.
134
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Abból a szempontból, hogy melyik ismérv hat a másikra, háromféle összefüggés képzelhető el. Közvetlen ok-okozati kapcsolat, amikor az egyik ismérv
az ok, a másik az okozat, vagyis az egyik független, a másik függő változónak tekinthető. A munkaviszony hossza és a kereset nagysága közötti
kapcsolatban például a munkaviszony hossza tekinthető független változónak, a kereset nagysága pedig függő változó. Az ismérvek kölcsönhatásban
lehetnek egymással, mint például az ár és a kereslet nagyságának összefüggésében. Egy termék árának nagysága befolyásolja a termék iránti
keresletet, és viszont, a kereslet visszahat az árra. Közvetett kapcsolat, amikor az ismérvek között kizárólag azért tapasztalható összefüggés, mert
azokat közös tényezők befolyásolják.
Az oksági összefüggések természetét általában a jelenségek szakmai ismerete alapján lehet tisztázni.
A sztochasztikus kapcsolatok statisztikai elemzéséhez a sokaság minden egységét egyidejűleg két (vagy több) ismérv szerint vizsgáljuk. Ebben a
fejezetben csak két ismérv összefüggésének vizsgálatával foglalkozunk.
Az asszociáció és a vegyes kapcsolat elemzése általában a sokaságnak a vizsgált két ismérv szerinti kombinatív csoportosításával (osztályozásával)
kezdődik. A kombinatív csoportosítás során az egyik ismérv szerinti csoportosítással kapott részsokaságokon belül a másik ismérv szerint
is osztályozunk. A kombinatív osztályozás eredményét kombinációs (kontingencia-) tábla formájában szokás megadni, emiatt tárgyaljuk a
sztochasztikus kapcsolatok vizsgálatát – a tananyagunknak ebben a részében – a kombinációs táblák elemzéséhez kapcsolódóan.
A kontingenciatáblák a korreláció bizonyos vizsgálataikor is kiindulópontot jelenthetnek, de a mennyiségi ismérvekben rejlő információk tökéletesebb
3
kihasználása olyan módszerek alkalmazását igényli, amelyek másféle adatbázist kívánnak meg.
Két ismérv közötti kapcsolat vizsgálata a kombinációs tábla alapján történhet. A sokaságoknak két ismérv szerinti kombinatív csoportosítását
(osztályozását) tartalmazó kontingenciatábla sémájaként tekintsük a 3.15. táblázatot.
E ismérv
3
A korreláció elemzését lásd a tankönyv II. kötetében.
135
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
ahol:
a sokaság azon egységeinek száma (gyakorisága), amelyek E ismérv szerint az osztályba és ezzel egyidejűleg D ismérv szerint a osztályba
tartoznak ( ),
a sokaság azon egységeinek száma (gyakorisága), amelyek az E ismérv szerint a osztályba tartoznak ( ),
a sokaság azon egységeinek száma (gyakorisága), amelyek a D ismérv szerint a osztályba tartoznak ( ),
Az gyakoriságok a sokaságoknak csak az E ismérv szerinti (függőleges irányú), az gyakoriságok a sokaságoknak csak a D ismérv
szerinti (vízszintes irányú) megoszlását mutatják. Ezeket a gyakoriságokat peremgyakoriságoknak, az ( ) gyakoriságokat együttes
gyakoriságoknak nevezzük.
3.16. táblázat - A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük
és a tanintézet típusa szerint (1990. január 1.)
Szakmunkás-Szakiskolai Középiskolai Egyetemi,
Megnevezés Összesen
tanuló tanuló tanuló főiskolai
136
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
hallgató
Budapest 28 12 66 22 128
Község 84 13 77 16 190
Összesen 197 45 271 80 593
E ismérv
ahol:
a sokaság azon egységeinek aránya (relatív gyakorisága), amelyek egyidejűleg tartoznak az E ismérv szerint az osztályba és a D ismérv
szerint a osztályba ( ). Ezeket együttes megoszlási viszonyszámoknak(relatív gyakoriságoknak) nevezzük,
137
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A 3.16. táblázat adatai alapján készítsük el a relatív gyakoriságok táblázatát! (3.18. táblázat.)
Vidéki város
Községek
Összesen 1
(peremmegoszlás)
A statisztikai gyakorlatban általában ezek 100-szorosát adjuk meg, amely százalékos megoszlást jelent (3.19. táblázat).
138
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ha E és D mindegyike tekinthető független változónak és függvényszerű a kapcsolat, akkor ez csak úgy lehet, hogy valamint az E és D ismérvek
változatai között kölcsönösen egyértelmű leképezés létesíthető. Ez a kontingenciatábla szempontjából azt jelenti, hogy minden sorban és oszlopban
csak egyetlen gyakoriság lehet nullától különböző. Ha nem hangsúlyozzuk, hogy melyik ismérv a független változó, akkor függvényszerű kapcsolaton
ez utóbbit értjük.
Most térjünk át a függetlenségre! Tekintsük a 3.15. táblázatot. Az E és D ismérv akkor független egymástól, ha az E ismérv szerinti megoszlás nem
függ a D ismérv szerintitől és fordítva.
139
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
E ismérv
Az E ismérvváltozatok szerinti megoszlási viszonyszámok nem függhetnek attól, hogy melyik D szerinti ismérvváltozatról van szó. Ezért ezeknek
minden oszlopban egyenlőknek kell lenni. Írjuk fel ezt például az első sorra:
Általánosan:
Könnyű belátni, hogy ezen feltételek teljesülése esetén a D ismérv szerinti rész- és összetett megoszlás sem függ az E ismérvváltozattól. Vagyis azt
mondhatjuk, hogy az E és D ismérv akkor függetlenek egymástól, ha ez az egyenletből álló
140
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
egyenletrendszer teljesül. Olyan megállapításnak tehát, hogy a D ismérv független E-től, nincs helye, mert a függetlenség szimmetrikus reláció.
egyenletrendszerrel. A fenti definíció így is fogalmazható (lásd a 3.17. táblázatot): az E és D ismérvek akkor függetlenek egymástól, ha a perem
megoszlási viszonyszámok (relatív gyakoriságok) szorzata egyenlő a megfelelő együttes viszonyszámokkal.
A 3.18. táblázat alapján könnyen ellenőrizhetjük, hogy a tanulók iskolatípus szerinti és település szerinti megoszlása nem független, mert pl.
Az asszociáció szorosságának mérésére többféle mutatószámot szerkesztettek, ezeket asszociációs együtthatóknak nevezzük.
Olyan esetekben, amikor mindkét ismérv alternatív (két változata van), gyakran alkalmaznak az asszociáció kimutatására koordinációs
viszonyszámokat. A koordinációs viszonyszámok két részsokaság nagyságának egymáshoz viszonyított arányát mutatják. Kombinatív osztályozás
esetén, a kontingenciatáblából kiindulva azonos tartalmú rész- és összetett koordinációs viszonyszámokat képezhetünk (3.21. táblázat).
141
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ha E és D függetlenek, azaz
akkor
Úgy is mondhatjuk, hogy a főátlóban lévő együttes gyakoriságok szorzata egyenlő a mellékátlóban lévő együttes gyakoriságok szorzatával:
Ha e szorzatok különbségét elosztjuk ugyanezen szorzatok összegével, akkor a Yule-féle asszociációs együtthatóhoz (jele: Y) jutunk:
142
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ha az együttható abszolút értéke 0-hoz áll közel, akkor laza kapcsolatról, ha pedig 1-hez áll közel, akkor szoros sztochasztikus kapcsolatról
beszélhetünk.
Hiányossága a mérőszámnak, hogy abszolút értéke akkor is lehet 1, ha a kapcsolat nem függvényszerű. Könnyen belátható, ha a
kontingenciatáblában található egy 0 gyakoriság, akkor az együttható abszolút értéke 1 lesz, annak ellenére, hogy ebben az esetben nem
egyértelműen határozható meg az egyik ismérv szerinti hovatartozás alapján a másik ismérv szerinti hovatartozás.
ha
ha
Tehát pozitív Y érték akkor adódik, ha az azonos indexszel jelzett gyakoriságok a nagyobbak (ezek adnak nagyobb szorzatot), más szóval, ha az
egyik ismérv 1-es jelű változata a másik ismérvnek ugyancsak 1-gyel jelzett változatát „vonzza”, ugyanígy vonzzák egymást a 0-ás jelű változatok
is, míg az egyik ismérvnél 1-gyel, a másik ismérvnél 0-val jelölt változatok „taszítják” egymást. Fordított esetben negatív értéket kapunk.
Nominális mérési szintű változók esetén általában önkényesen döntjük el, hogy melyik ismérvváltozatot tesszük az első helyre, ez a döntés az
együttható abszolút értékét nem befolyásolja, csak az előjelet. Az előjelnek ilyenkor nem tulajdonítunk különösebb jelentőséget.
Ordinális skálán mérhető változók esetén (lásd később) az előjelnek már lesz értelme, jelentősége.
3.22. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)
Ezer fő
Gazdaságilag Gazdaságilag
Megnevezés Összesen
aktív nem aktív
Férfiak 2583,5 2359,9 4 943,4
143
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A 3.22. táblázat alapján a nem és a gazdasági aktivitás nem független ismérvek (pl. ). Ugyanakkor nem függvényszerű a kapcsolat,
hiszen ha választunk egy egyedet és tudjuk, hogy férfi (E első ismérvváltozata), mégsem tudjuk megmondani, hogy gazdaságilag aktív vagy nem.
Csupán azt tudjuk, hogy annak a valószínűsége, hogy gazdaságilag aktív, és annak a valószínűsége, hogy gazdaságilag nem aktív,
Vizsgáljuk meg a 3.22. táblázat adatai alapján a nem és a gazdasági aktivitás ismérve közötti asszociációs kapcsolat szorosságát a Yule-féle
együtthatóval:
Nézzük meg, hogy hogyan alakul az együttható értéke, ha a 3.22. táblázat sorait megcseréljük, vagyis az új táblázatban a nők adatait írjuk az első
sorba, a férfiakét a második sorba (3.23. táblázat).
3.23. táblázat - Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)
Ezer fő
Gazdaságilag Gazdaságilag
Megnevezés Összesen
aktív nem aktív
Nők 2431,5 2935,3 5 366,8
A kapcsolat szorosságára ugyanakkora abszolút értékű számot kaptunk, mint korábban, csak negatív előjellel.
144
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A Yule-féle asszociációs együttható – mint az a számítás módjából egyértelműen látszik – csak alternatív ismérvek szorosságának mérésére
alkalmas. Ha a két ismérv valamelyikének kettőnél több változata van, az eredeti adatokból nem számítható. Ilyen esetben is hasznosíthatjuk ugyan,
de mérsékelt hatásfokkal, ha a nem alternatív ismérvet csoportok összevonásával alternatívvá alakítjuk.
Amennyiben az ismérvek nem alternatívak, az ismérvváltozatok összevonása helyett célszerűbb olyan mutatószámot választani az asszociáció
szorosságának mérésére, amely ebben az esetben is alkalmazható. Ilyenek – többek között – a Csuprov-féle és a Cramer-féle asszociációs
együtthatók.
A Csuprov-féle és a Cramer-féle asszociációs együtthatók alapgondolata a függetlenség feltételezésével számított gyakoriságokhoz ( ) kapcsolódik.
minden esetben. Ha nem egyenlők, akkor nincs függetlenség, és azt gondolhatjuk, hogy a függetlenség feltételezésével számított
értékek minél jobban eltérnek a tényleges értékektől, annál „messzebb” vagyunk a függetlenségtől, vagyis annál szorosabb a kapcsolat.
Például a 3.16. táblázat alapján meghatározhatjuk a függetlenség feltételezésével számított gyakoriságokat. Ezeket tartalmazza a 3.24. táblázat.
A két ismérv függetlensége esetén a 28 ezer (lásd 3.16. táblázat), budapesti lakosú, szakmunkásképzőbe járó tanulóval szemben jóval több tanuló
tartozna ebbe a csoportba.
145
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A 3.16. és 3.24. táblázat adatait összehasonlítva is megállapíthatjuk, hogy sztochasztikus kapcsolat van a két ismérv között, mert a tényleges
gyakoriságok eltérnek a függetlenség feltételezésével számított gyakoriságoktól. Ha nem lenne kapcsolat a két ismérv között, akkor a tényleges ( )
és a függetlenség feltételezésével számított ( ) gyakoriságok rendre megegyeznének.
4
Az (tényleges) és (feltételezett) gyakoriságok eltérésének mérésére szolgáló nevezetes mennyiség a (Khi négyzet)
amely az eltérések négyzetének relatív nagyságát juttatja kifejezésre. Érvényes rá a következő egyenlőtlenség:
és
A a 0 értéket akkor veszi fel, ha a vizsgált két ismérv független egymástól, azaz ha i és j minden értékére teljesül az egyenlőség.
4
A szerepe a matematikai statisztikában igen széles körű. Az asszociációvizsgálat csupán egyik alkalmazási területe. A legjellegzetesebb alkalmazásával a Tankönyv II. kötetében, a Hipotézisek
ellenőrzése című fejezetben foglalkozunk.
146
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Függvényszerű kapcsolat esetén (ekkor s = t). Más szóval a ezt a maximális értékét akkor éri el, ha a kontingenciatábla minden sorában
csak egy 0-tól különböző gyakoriság található, és e gyakoriságok mind különböző oszlopba tartoznak.
A Csuprov-féle asszociációs együttható értéke 0 és 1 között van. A 0 értéket akkor veszi fel, ha a két ismérv független egymástól. Függetlenség
esetén ugyanis a = 0 (és fordítva, ha = 0, akkor a két ismérv független egymástól). A T = 1 értéket csak az s = t esetben érheti el (csak ilyenkor
képzelhető el az, hogy az egyik ismérv szerinti hovatartozás kölcsönösen egyértelműen meghatározza a másik ismérv szerinti hovatartozást), az
esetekben T < 1. Az esetekben a T által elérhető maximális érték:
Megnevezés
147
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A középfokú és felsőfokú tanintézetekben tanulók településforma szerinti hovatartozása és a tanintézetük típusa közötti kapcsolat szorosságát
jellemző Csuprov-féle asszociációs együttható:
Az asszociációs együttható alapján azt a megállapítást tehetjük, hogy a vizsgált ismérvek között laza kapcsolat van.
Az asszociációs összefüggések térbeli vagy időbeli összehasonlítására szolgál a Cramer-féleasszociációs együttható (jele: C). Ez a mutatószám
kétféleképpen számítható.
A Cramer-féle együttható az ismérvváltozatok számától függetlenül mindig 0 és 1 között veszi fel értékét .
Amennyiben s = t, akkor T = C, tehát ha a két ismérv változatainak száma azonos, akkor a Csuprov-féle és a Cramer-féle asszociációs együttható
számszerű értéke megegyezik.
148
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Egy minőségi és egy mennyiségi ismérvet tartalmazó vegyes kapcsolat elemzését a következőképpen rendezett adathalmazból kiindulva vizsgáljuk
(3.26. táblázat).
ahol:
a minőségi ismérv j-edik változata (a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),
149
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
a j-edik részsokaság elemszáma (a j-edik részsokasághoz tartozó megfigyelt X értékek száma). Megjegyezzük, hogy az egyes részsokaságok
elemszáma (az egyes részsokaságokhoz tartozó megfigyelések száma) különböző lehet, vagyis pl. nem feltétlenül egyezik meg -mel
( ).
Például egy település ipari szervezeteit vizsgáljuk gazdálkodási forma (minőségi ismérv) és a foglalkoztatott létszám nagysága (mennyiségi ismérv)
szerint. A megfigyelt létszámadatokat gazdálkodási forma szerint rendezve írhatjuk fel (3.27. táblázat).
3.27. táblázat - Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai
(főben)
A megfigyelt Korlátolt
szervezet Vállalat felelősségű Részvénytársaság Szövetkezet
sorszáma társaság
1. 260 10 120 55
2. 290 11 280 70
3. 470 11 295 88
4. 600 12 570 97
5. – 12 800 143
6. – 13 1500 150
7. – 14 – 215
8. – 14 – 244
9. – 15 – 260
10. – 15 – 305
11. – 16 – –
12. – 17 – –
150
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
13. – 17 – –
14. – 18 – –
15. – 18 – –
16. – 18 – –
17. – 19 – –
18. – 19 – –
19. – 19 – –
20. – 20 – –
21. – 21 – –
22. – 22 – –
23. – 25 – –
24. – 26 – –
25. – 28 – –
26. – 29 – –
27. – 30 – –
28. – 35 – –
29. – 40 – –
30. – 45 – –
31. – 48 – –
32. – 50 – –
151
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
33. – 55 – –
34. – 58 – –
35. – 60 – –
36. – 65 – –
37. – 90 – –
38. – 150 – –
39. – 200 – –
40. – 302 – –
Mivel általában nagyszámú megfigyelést végzünk, az adatokat célszerű kombinációs (kontingencia-) táblába rendezni (3.28. táblázat).
D minőségi
ismérv
X mennyiségi
ismérv
152
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
ahol:
a minőségi ismérv j-edik változata (illetve a minőségi ismérv alapján képzett j-edik részsokaság azonosítója),
az X mennyiségi ismérv alapján képzett i-edik csoport (osztály) azonosítója. Ha X diszkrét, akkor jelentheti az ismérvértéket, de jelölhet
osztályközt is.
a sokaság azon elemeinek száma – gyakorisága –, amelyek a D minőségi ismérv szerint részsokaságba és ezzel egyidejűleg X mennyiségi
ismérv szerint a csoportba (osztályba) tartoznak ( ),
a sokaság azon elemeinek száma, amelyek az X ismérv szerint csoportba (osztályba) tartoznak ( ),
a sokaság azon elemeinek száma, amelyek a minőségi ismérv szerint a j-edik csoportba, részsokaságba tartoznak ( ), .
Például az ipari szervezeteket a megfigyelésekre támaszkodva csoportosíthatjuk – egyidejűleg – gazdálkodási forma és a létszám nagysága szerint,
a két ismérvet egymással kombinálva. A mennyiségi ismérv szerinti osztályozás különösebb mérlegelést igényel. Látjuk, hogy a legkisebb és
legnagyobb létszámadat között nagy a különbség, és a kis létszámú szervezetek adják a cégek zömét. Ezért egyenlőtlen hosszúságú osztályközöket
jelölünk ki. A kombinatív osztályozás eredményét a 3.29. táblázatban adjuk meg.
3.29. táblázat - Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és
létszám szerint
Gazdálko-
Korlátolt
Részvény-
dási forma Vállalat felelősségű Szövetkezet Összesen
társaság
társaság
Létszám (fő)
– 20 – 20 – – 20
21 – 50 – 12 – – 12
51 – 100 – 5 – 4 9
101 – 300 2 2 3 5 12
153
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
301 – 500 1 1 – 1 3
501 – 1000 1 – 2 – 3
1000 – – – 1 – 1
Összesen 4 40 6 10 60
A vegyes kapcsolat vizsgálatának első mozzanata szintén annak a vizsgálata, hogy van-e sztochasztikus kapcsolat a vizsgálatba bevont ismérvek
között. A feladat ebben az esetben úgy is megfogalmazható, hogy szerepet játszik-e a minőségi ismérv a mennyiségi ismérv szerinti eloszlásban?
Ez vizsgálható a kontingenciatáblából kiindulva a 3.4.1. pontban tárgyalt módszerekkel. Megjegyezzük, hogy ezen vizsgálatok eredményét
befolyásolhatja, hogy milyen módon választjuk az osztályközöket.
Mivel vegyes kapcsolat esetén az egyik vizsgálatba bevont ismérv mennyiségi ismérv, az összefüggés-vizsgálat során felhasználhatjuk az átlag-
– részátlag-, főátlag- – számítást, szórásszámítást, a szórásnégyzet-felbontás módszerét. Ezek segítségével számszerűsíthetjük a minőségi
ismérv alapján képzett részsokaságok mennyiségi ismérv szerinti különbözőségét, a minőségi ismérv szerepét a mennyiségi ismérv értékeinek
különbözőségében.
Rész- és főátlagok
A minőségi ismérv szerint csoportosított sokaságban az egyes részsokaságokra számított átlagot részátlagnak (jele: ), a fősokaságokra vonatkozó
átlagot pedig főátlagnak (jele: ) nevezzük.
ahol :
[MA :#-#]
A főátlag
154
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
– súlyozott számtani átlag formában, ahol a súly szerepét a részsokaságok elemszámai, az adatok töltik be,
A főátlag súlyozott átlagként történő számításánál a súlyként szereplő adatok helyettesíthetők az azokból számított megoszlási viszonyszámokkal.
A két ismérv függetlensége esetén (ha a minőségi ismérv szerinti hovatartozás semmiféle hatást nem gyakorol a mennyiségi ismérv nagyságára)
az egyenlőek (minden j-re megegyeznek). Ebből következően (minden j-re). Fontos: az állítás nem fordítható meg. A részátlagok
egyenlőségéből nem következik a függetlenség. Ha arra vagyunk kíváncsiak, hogy az ismérvek függetlenek-e, a 3.4.1. pontban tárgyalt módon
járhatunk el. Ha a 3.28. kontingenciatáblát vizsgáljuk, két ismérv függetlensége esetén a minőségi ismérv szerint képzett részsokaságokban az
relatív gyakoriságok i-t tetszőlegesen rögzítve minden j-re megegyeznek.
Függetlenség esetén tehát a minőségi ismérv szerint képzett részsokaságokban a relatív gyakorisági sorok azonosak. Az egyforma relatív gyakorisági
sorokból pedig a részátlagokra azonos becslések származnak.
A részátlagok és a főátlag számításával, ezek összehasonlításával képet kaphatunk az ismérvek közötti kapcsolatról. Amennyiben a részátlagok
jelentősen eltérnek egymástól és a főátlagtól, ez azt jelzi, hogy van kapcsolat az osztályozás alapját képező minőségi ismérv és mennyiségi ismérv
között.
A 3.27., illetve 3.29. táblázatból meghatározhatjuk a részátlagokat és a főátlagot, illetve azok becsült értékeit. Ha az eredeti adatokat nem ismerjük,
akkor a kontingenciatáblából csak az utóbbiak számíthatók. Ezeket az átlagokat a 3.30. táblázat tartalmazza.
155
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Mivel a részátlagok egymástól és a főátlagtól is eltérnek (ez a helyzet a becsült értékeknél is), a két ismérv közötti kapcsolat megléte nyilvánvaló.
A vegyes kapcsolat szorosságának vizsgálata a szóródásszámítás segítségével történik. Ahhoz, hogy a mérőszámig eljuthassunk, meg kell
ismerkednünk néhány új fogalommal.
Amennyiben a sokaságot részsokaságokra bontva vizsgáljuk – a viszonyszámok és az átlagok számításához hasonlóan –, a fősokaságra és
a részsokaságokra vonatkozóan is számítunk szórást. A részsokaságokra vonatkozó szórást részszórásnak vagy részsokaságokon belüli
szórásnak, a fősokaságra vonatkozó szórást teljes szórásnak nevezzük. A közöttük lévő összefüggés kevésbé egyszerű, mint a részviszonyszámok
és az összetett viszonyszám vagy a részátlagok és a főátlag összefüggése. Az összefüggések bemutatásához nézzük a következőket!
Ha a sokaságot részekre bontva vizsgáljuk, akkor a szórásszámításra alkalmas, ún. átlagtól való eltérést háromféleképpen értelmezhetjük.
a) ( )
az ún. teljes eltérés, amely egy adott ismérvérték és a főátlag közötti eltérés.
156
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
b) ( )
az ún. belső eltérés, amely egy adott j-edik részsokasághoz tartozó ismérvérték és j-edik részátlag közötti eltérés.
c) ( )
Könnyen belátható, hogy a háromféle eltérés között az alábbi összefüggés áll fenn:
A 658,3 fős eltérés ebben az esetben azzal magyarázható, hogy a kiválasztott Rt. létszáma saját csoportján belül mintegy 206 fővel nagyobb, s az
Rt.-k létszámnagysága a szervezetek összességére jellemző átlagot is meghaladja.
A három eltérés közötti összefüggés alapján megállapíthatjuk, hogy adott érték főátlagtól való eltérését két tényező okozhatja:
– egyrészt a részsokaságokon belül különbözőek lehetnek az ismérvértékek, ezeket a különbségeket a eltérés fejezi ki,
– másrészt a részátlagok eltérhetnek egymástól, ingadozhatnak a főátlag körül. Ezt fejezi ki a eltérés, amelyben a csoportosító (minőségi) ismérv
hatása mutatkozik meg.
157
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A részszórások négyzetének az egész sokaságra vonatkozó átlaga a belső szórásnégyzet , tehát a belső szórás:
Ha az ( ) eltérésnégyzetek egész sokaságra vonatkozó átlagát vesszük, akkor a külső szórásnégyzetet kapjuk, és ennek
négyzetgyöke a külső szórás:
Ennek igazolására (a definíciókat felhasználva) elegendő a megismert szórásnégyzetek számlálói – az ún. eltérés-
négyzetösszegek – közötti összefüggés bizonyítása.
158
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Mivel
belső eltérés-négyzetösszeg:
külső eltérés-négyzetösszeg:
A háromféle eltérés-négyzetösszeg, illetve szórásnégyzet összegszerű összefüggése természetesen arra is felhasználható, hogy kettő ismeretében
kiszámítsuk az ismeretlen harmadikat.
Az elmondottak alapján megfogalmazható az is, hogy a fősokaságra vonatkozó teljes szórás kétféleképpen számítható ki:
159
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ezek után nézzük a példánkat. A 3.27. és 3.30. táblázat alapján meghatározhatók a fenti paraméterek, értékeiket a 3.31. táblázat tartalmazza (a
tényleges és nem a becsült értékekkel számoltunk). A teljesség kedvéért a 3.30. táblázat néhány adatát is feltüntettük.
Az eltérés-négyzetösszeg – a fejrovatban kijelölt képlet szerint – például a vállalatoknál a következő (lásd a 3.27. táblázatot is):
160
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A szórás a vállalatoknál:
A teljes szórás:
Az egyes ipari szervezetek létszáma tehát átlagosan mintegy 240 fővel tér el – a négyzetes eltérések alapján számolva – a 60 szervezetre jellemző
141,7 fős átlagtól.
A továbbiakban meghatározzuk a 3.31. táblázat alapján a háromféle eltérés-négyzetösszeget, és bemutatjuk azok összefüggését.
A teljes eltérés-négyzetösszeget (SS) a megfigyelt ipari szervezetek számával osztva kapjuk a teljes szórásnégyzetet:
161
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A belső szórás
az előzőekben már bemutatott összefüggés alapján kiszámítható a különböző típusú gazdasági szervezetek létszámának szóródását jellemző
szórások súlyozott négyzetes átlagaként is:
a súly szerepét betöltő részsokasági elemszámadatok helyettesíthetők azok megoszlási viszonyszámaival, így
A belső szórás megmutatja, hogy az egyes ipari szervezetek – mind a 60 ipari szervezetet figyelembe véve – létszáma átlagosan 160,6 fővel tér el
a „saját” gazdálkodási formáját jellemző átlagos létszámtól. (A négyzetes eltérések alapján számolva.)
162
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A külső szórás
A külső szórás megmutatja, hogy a megfigyelt vállalatok, kft.-k, részvénytársaságok, szövetkezetek átlagos létszáma az együttes átlagos létszámuktól
átlagosan 178,2 fővel tér el. (A négyzetes eltérések alapján számolva.)
Visszatérve a szórásnégyzetek összefüggésére, a teljes szórásnégyzet összetevői alapján az ismérvek sztochasztikus kapcsolatára a következőket
állapíthatjuk meg.
a) Ha az -k egyenlőek (minden j-re), vagyis az egyes részátlagok megegyeznek egymással és ebből következően a főátlaggal, akkor a két
ismérv között nincs kapcsolat. De ez nem jelenti azt, hogy a két ismérv független. Könnyű olyan példát mondani, amelyben a részátlagok egyenlőek és
a függetlenség 3.4.1.-ben megfogalmazott feltétele nem teljesül. Tehát a függetlenségből következik, hogy az E mennyiségi ismérv és a D minőségi
ismérv között nincs kapcsolat, de fordítva nem.
A részekre bontott sokaságból képezhető háromféle szórásnégyzet – a teljes szórásnégyzet és összetevői – alapján következtethetünk a vizsgálatba
bevont két ismérv kapcsolatára, illetve arra, hogy hatást gyakorol-e az osztályozás alapját képező minőségi ismérv a sokaság egységeinek
mennyiségi ismérv szerinti hovatartozására.
163
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ismert az is, hogy a külső szórásnégyzet ( ) a részátlagoknak a főátlagtól való eltérései alapján számított szórásnégyzet, ami éppen az osztályozás
alapját képező minőségi ismérv hatásának tulajdonítható rész a teljes szórásnégyzeten belül.
ún. szórásnégyzet-hányadosnak, amely a mennyiségi ismérv szórásnégyzetének a minőségi ismérv által megmagyarázott hányada.
A , illetve összefüggés következtében belátható, hogy a megismert hányados a intervallumban vehet fel értéket:
Ha , akkor azt mondjuk, hogy a két ismérv között nincs kapcsolat. A eset akkor fordulhat elő, ha a részátlagok mind egyformák, és
ezért
Ha , ez a két ismérv függvényszerű kapcsolatára utal. eset akkor következhet be, ha a részsokaságokban az X értékek nem szóródnak
( ). A minőségi ismérv szerinti hovatartozás egyértelműen meghatározza a mennyiségi ismérvet, a sokaság elemeinek mennyiségi ismérv
szerinti hovatartozását.
A szóráshányados – a szórásnégyzet-hányadossal ellentétben – nem értelmezhető megoszlási viszonyszámként, ezért nem fejezhető ki %-os
formában.
164
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Az ipari szervezetek gazdálkodási formája és a foglalkoztatott létszám közötti kapcsolatot vizsgálva, a korábbiakban kiszámított adatok alapján
A gazdálkodási forma 55,2%-ban magyarázza meg a létszám szóródását (ingadozását). A fennmaradó 44,8% egyéb nem vizsgált (ebben az
összefüggésben véletlenként kezelt) tényezők hatása. A szóráshányados
Azt a statisztikai táblát, amely a sokaság egységeinek mennyiségi ismérvek szerinti kombinatív osztályozását tartalmazza, korrelációs táblának
nevezzük (3.32. táblázat).
A táblázatban X az ok szerepét játszó mennyiségi ismérvet (független változót, tényezőváltozót), Y az okozat szerepét betöltő mennyiségi ismérvet
(függő változót, eredményváltozót) jelenti, amennyiben ilyenek egyáltalán megkülönböztethetők. Ha két ismérv kölcsönhatásban áll egymással, nincs
jelentősége annak, hogy a vizsgált ismérvek közül melyiket jelöljük X-szel, illetve Y-nal.
165
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
az X ismérv alapján képzett i-edik osztály azonosítója, jelenthet ismérvértéket, de jelölhet osztályközt is.
az Y ismérv alapján képzett j-edik osztály azonosítója, jelenthet ismérvértéket, illetve osztályközt.
Mindkét ismérv mennyiségi ismérv, de most is eljárhatunk úgy, hogy az egyik ismérvet (pl: X-et) csak osztályozásra, részsokaságok kialakítására
használjuk, a másikat (az Y-t) pedig átlag- és szórásszámítás segítségével vizsgáljuk, vagyis ugyanúgy járunk el, mint a vegyes kapcsolat
vizsgálatánál.
3.33. táblázat - Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma
szerint
Személyek
Szobák száma
1 1 2 1 1 – – – 5
2 1 2 10 7 1 1 – 22
3 – 1 2 7 2 4 1 17
4 – – – – 3 2 1 6
Összesen 2 5 13 15 6 7 2 50
A társasház lakásait egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint figyeltük meg. Már a táblázat adataiból is kitűnik,
hogy a kisebb szobaszámú lakásokban általában kevesebb személy lakik, a nagyobb szobaszámúakban pedig több.
Esetünkben, mivel mindkét jellemző tulajdonság mennyiségi ismérv, korrelációs kapcsolatról beszélünk. Attól függően, hogy az X ismérv nagyobb
(kisebb) értékeihez az Y ismérv nagyobb (kisebb) értékei tartoznak vagy éppen fordítva, kétféle korrelációról beszélhetünk.
Pozitív korreláció áll fenn két ismérv között, ha az X nagyobb értékeihez általában Y nagyobb értékei, illetve X kisebb értékeihez Y kisebb értékei
tartoznak. Fordított esetben negatív korrelációról beszélünk (X nagyobb értékeihez általában Y kisebb értékei tartoznak, illetve fordítva).
166
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ha a szobaszámot (X) csoportosító ismérvnek tekintjük és kiszámítjuk a különböző szobaszámú lakásokban élők átlagos számát akkor
tömörebben fejeződik ki a két ismérv sztochasztikus összefüggése.
Az X ismérv szerint képzett ( ) osztályok halmazán értelmezett függvényt, amely -hez az részátlagot rendeli, az Y változó X változóra
vonatkozó (X szerinti) tapasztalati regressziófüggvényének nevezzük.
3.34. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati
regressziófüggvénye
Szobaszám Átlagos lakószám (fő)
1 2,40
2 3,36
3 4,53
4 5,67
A tapasztalati regressziófüggvény a két ismérv közötti kapcsolatra vonatkozó – a jelenlegi elemzési helyzetben a korrelációs táblába foglalt –
információt egyetlen statisztikai sorba ( -hez rendelt részátlagok sorozata) sűríti. Egyértelműen láthatóvá vált, hogy a két ismérv között van
korreláció, mégpedig pozitív irányú korreláció. (A szobaszámok nagyobb értékeihez az átlagos lakószám növekvő értékei tartoznak.)
A tapasztalati regressziófüggvény nemcsak a korreláció létezésének kimutatására alkalmas, hanem a kapcsolat lényegét, természetét is tömören
kifejezi. Grafikusan is ábrázolható a pontokat összekötő vonaldiagram formájában, ahol vagy az ismérvérték, vagy az X
szerint képzett i-edik osztályköz osztályközepe. A pontokat összekötő szakaszoknak mint függvényértékeknek ugyan nincs statisztikai
jelentése, ennek ellenére a statisztikai gyakorlatban e pontokat összekötjük. Így alkothatunk szemléletesebb képet a két mennyiségi ismérv közötti
sztochasztikus kapcsolat jellegéről, tendenciájáról.
167
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A tapasztalati regressziófüggvényt célszerű az egyedi értékadatok alapján (a két mennyiségi ismérvnek a sokaság egyes egységeit jellemző,
összetartozó értékpárjai alapján) készített pontdiagrammal közös koordináta-rendszerben ábrázolni. A vonaldiagram és a ponthalmaz kölcsönös
helyzete tájékoztat a korrelációs kapcsolat szorosságáról is.
Példánkban 50 lakást figyeltünk meg egyidejűleg a szobák száma (X) és a lakásban élő személyek száma (Y) szerint. Minden lakást jellemez egy
szobaszám- és egy lakószám- adat. Az összetartozó értékeket derékszögű koordináta-rendszerben egy-egy pontként ábrázolva
készítjük el a korrelációt szemléltető pontdiagramot és ugyanebben a koordináta-rendszerben ábrázoljuk a tapasztalati regressziófüggvényt (3.6.
ábra).
3.6. ábra - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat
A csoportosított adatokból kiinduló korrelációelemzés során a kapcsolat szorosságának mérése a vegyes kapcsolat szorosságának mérésével analóg
módon történik. Ha az osztályozást X ismérv szerint végezzük, úgy az Y értékekre vonatkozó részátlagokhoz ( ) és főátlaghoz ( ) háromféle
szórásnégyzet kapcsolódik. Az Y belső szórásnégyzete az Y külső szórásnégyzete az Y teljes szórásnégyzete (Az Y arra utal, hogy
a függő változó (Y) szórásnégyzetéről van szó.) Közöttük a
168
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A determinációs hányados azt mutatja meg, hogy az X ismérv mekkora hányadát magyarázza meg az Y ismérv szórásnégyzetének. Szokás %-
os formában is kifejezni.
Korreláció esetén:
Ha az oksági kapcsolat nem egyirányú, akkor logikailag indokolt lehet, hogy az X ismérvnek az Y ismérv szerinti szorossági mérőszámait számítsuk
ki, vagyis a
Ebben az esetben az X a „szóródó” ismérv, az Y pedig a csoportosító ismérv szerepét tölti be.
Ha az X és az Y közötti kapcsolat sztochasztikus, akkor általában a kétféle megközelítésből számított mutatószámok nem egyeznek meg:
169
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Ha az ismérvek (változók) függetlenek, akkor Ez azt is jelenti, hogy a tapasztalati regressziós függvény állandó. Fordítva nem igaz:
abból, hogy (ekkor is nulla), nem következik a függetlenség.
Ha akkor azt mondjuk, hogy az ismérvek (változók) korrelálatlanok. A korrelálatlanság is szimmetrikus reláció.
Vizsgáljuk meg a lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat szorosságát. A kapcsolat szorosságának jellemzésére
kiszámítjuk a determinációs hányadost és a korrelációs hányadost. E mutatószámok meghatározásához szükség van a Y ismérv
főátlagára, a megfigyelt lakásokban élő személyek átlagos számára ( ), a külső szórásnégyzetre, a teljes szórásnégyzetre.
A külső szórásnégyzet:
Az előző lépésben kiszámított főátlag, valamint a 3.34. táblázatban közölt részátlagok alapján:
A teljes szórásnégyzet:
170
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A determinációs hányados:
Ez úgy értelmezhető, hogy a lakásokban levő szobák száma 42%-ban magyarázza meg a lakásokban élő személyek számának szóródását. (A
fennmaradó 58% a szobaszámon kívüli, egyéb, most nem vizsgált tényezők hatása.)
A korrelációs hányados
A szorossági mérőszám alapján megállapítható, hogy a szobák száma és a lakásokban élő személyek száma között közepes erősségű
sztochasztikus kapcsolat van.
A következőkben – a részletes számítás mellőzésével – felírjuk az ismérvek (a változók) felcserélésével értelmezett – X-nek Y-ra vonatkozó –
tapasztalati regressziófüggvényét (3.35. táblázat) és az ehhez rendelhető determinációs hányadost és korrelációs hányadost.
3.35. táblázat - A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati
regressziófüggvénye
Lakószám (fő)
Átlagos szobaszám
171
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
1 1,50
2 1,80
3 2,08
4 2,40
5 3,33
6 3,14
7 3,50
Az X-nek Y-ra vonatkozó tapasztalati regressziófüggvénye is jelzi, hogy pozitív irányú kapcsolat van az ismérvek között. A
3.5. Gyakorlófeladatok
1. Szerkesszünk olyan statisztikai táblát (adatok nélkül), amely tartalmazza a Magyarországon bejegyzett fuvarozócégek 1994. I. és II. félévi
teljesítményeit (félévenként, külön-külön) a szállítás módja (közúti, vasúti, légi és egyéb) és cégforma (vállalat, gazdasági társaság, magánfuvarozó)
szerint!
2. Szerkesszünk (adatok nélkül) olyan statisztikai táblát, amely a fogyasztói árak alakulását mutatja 1985-höz viszonyítva napjainkig kiadási
főcsoportok (élelmiszerek, élvezeti cikkek, ... egyéb iparcikkek és szolgáltatások) szerint!
172
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Feladat:
4. Két megyében az orvosok és a lakosok számára, valamint az orvosellátottság mutatószámaira vonatkozóan az alábbi adatokat ismerjük:
Adatok: főben
Tízezer
Egy orvosra
Orvosok Lakosok lakosra jutó
Megye jutó lakosok
száma száma orvosok
száma
száma
A 640 ... 312,5 ...
Feladat:
b) Vonjunk le következtetéseket!
173
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Feladat:
174
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
A játszóterek területe
Feladat:
Villamosenergia-termelés
Népesség száma az
Év
év elején (ezer fő) 1988=100%
1988 10 464 100,0
A széntermelés 1988-ban 20 875 ezer tonna volt, ami 1993-ra 60,3%-ra csökkent.
Feladat:
d) A kiszámított változási tendenciát feltételezve mennyi a várható termelés ezen ipari termékekből 1996-ban? (1993-ban 32 630 millió kWh villamos
energiát állítottak elő.)
175
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Feladat:
b) Számítsuk ki, hogyan változott a munkavállalási korú népesség 1990-hez képest, illetve évről évre!
d) Számítsuk ki, hogy hány %-kal változott a népesség az egyes csoportokban és együttesen!
1993-
Csoportok 1990. január 1. 1993. január 1. as év az
1990. év
Ezer fő % Ezer fő % %-ában
Aktív keresők
4795,2 87,2 3866,9 ... ...
GYES-en, GYED-en lévők
244,7 4,5 262,1 ... ...
Foglalkoztatott
432,0 7,9 223,0 ... ...
nyugdíjasok
Foglalkoztatottak együtt 5471,9 99,6 4352,0 ... ...
Munkanélküliek 24,2 0,4 663,0 ... ...
Összesen 5496,1 100,0 5015,0 100,0 91,25
176
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Feladat:
10. Vállalkozásokat vizsgálunk jövedelmezőségük alapján két egymást követő évben. Az eredményeket az alábbi tábla tartalmazza:
1994-ben
Alacsony Közepes Magas Összesen
1993-ban
Alacsony 100 80 – 180
Közepes 60 90 10 160
Magas – 30 30 60
Összesen 160 200 40 400
Feladat:
2. függetlenséget feltételezve!
b) Számítsuk ki a Csuprov- és a Cramer-féle együtthatót a tényleges helyzetnek megfelelően! Értelmezzük a kapott eredményt!
11. Valamely városban a kereskedelmi szálláshelyek vendégforgalmát a szállás típusa és a turisták lakhelye szerint vizsgáltuk. A megfigyelt adatok
1994-ben 1000 főben a következők voltak:
Turistaszállás 30 10 40
177
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Feladat:
A kollégisták adatai:
2500; 3000; 3000; 3100; 3300; 3500; 3800; 4000; 4000; 4400 és 5000 Ft.
Feladat:
a) Számítsuk ki az átlagos havi kiadást a különböző lakáshelyzetű hallgatói csoportokban! Vonjunk le következtetéseket!
13. Egy tanulócsoport 15 hallgatójánál megvizsgáltuk, hogy van-e összefüggés a matematikafelvételin elért összpontszám és a felkészülés között.
(Járt-e előkészítő tanfolyamra vagy sem.) A vizsgálat eredményéből a következő számítási eredmények ismertek:
178
A sokaságok több ismérv szerinti
vizsgálata, a statisztikai táblák elemzése
Feladat:
c) Írjuk le a jelentését!
Relatív
Feladatsor Hallgatók száma Átlagos pontszám
szórás (%)
A 11 17,00 16,47
B 8 16,25 31,63
C 6 18,30 18,03
Összesen 25 ... ...
Feladat:
a) Számítsuk ki az összes
– belső eltérésnégyzetet,
– külső eltérésnégyzetet,
– teljes eltérésnégyzetet!
c) Számítsuk ki, hogy a feladatsorok „nehézsége” és az elért pontszám között milyen szoros a kapcsolat!
d) A pontszámok ingadozását, szóródását hány %-ban befolyásolja az, hogy melyik feladatsort írta a hallgató?
179
4. fejezet - Összetett intenzitási viszonyszámok (főátlagok)
összehasonlítása
4.1. A standardizálás módszere
Ha valamilyen jelenség színvonalát (pl. termékek önköltségét, lakosok orvosellátottságát, munkavállalók átlagbérét stb.) akarjuk jellemezni, akkor
erre a célra a 3. fejezetben megismert intenzitási viszonyszámokat használhatjuk fel. Ha a sokaság a vizsgált színvonal szempontjából heterogén,
akkor a vizsgálatot a heterogenitást előidéző ismérv megfelelő homogén csoportjaira is el kell végezni. A sokaság egészére számított intenzitási
viszonyszámokat összetett intenzitási viszonyszámoknak neveztük és jelöltük, a csoportokra pedig intenzitási részviszonyszámokat számítottunk
és azokat jelöltük. Ha a vizsgált színvonalat átlaggal fejeztük ki, akkor a sokaság egészére főátlagot ( ), a homogén csoportokra pedig
részátlagokat ( ) számítottunk. Beláttuk, hogy az átlagos színvonalat kifejező mutatókat (összetett intenzitási viszonyszám, illetve főátlag) két
tényező befolyásolja:
Fejezetünkben azzal foglalkozunk, hogy hogyan történik az átlagos színvonal térbeli különbözőségének vagy időbeli változásának vizsgálata.
Látni fogjuk, hogy a heterogenitás figyelembevétele ebben az esetben még fontosabb. Előfordulhat ugyanis, hogy nemcsak a vizsgált színvonal
(önköltség, orvosellátottság, átlagbér) változik két időszak között, hanem a csoportosító ismérv szerinti összetétel is. (Pl. a különböző önköltséggel
dolgozó üzemek termelésének, eltérő ellátottságú települések lakosainak, különböző átlagkeresetű dolgozók létszámának aránya.) Így előfordulhat,
hogy minden csoportban csökken a részátlag (pl. az átlagbér), a főátlag (a sokaság egészére számított átlagbér) mégis nő. Ha térbeli összehasonlítást
végzünk (pl. két vállalkozást hasonlítunk össze), akkor az eltérésekre (különbségekre) irányítjuk figyelmünket.
Tekintsük a következő példát (4.1. táblázat). Két vállalkozásnál hasonlítjuk össze a dolgozók átlagos havi jövedelmét. A-nál 45 E Ft, B-nél 40 E Ft.
Ebből megállapíthatjuk, hogy B-nél 5 E Ft-tal kevesebb az átlagos jövedelem. E megállapítás fedi a valóságot, de hogy elemzésünk kielégítő legyen,
a különbség okait, tényezőit is vizsgálnunk kell. Valóban rosszabbak-e a kereseti lehetőségek B-nél? Nemek szerint is vizsgálva a jövedelmeket
bővítsük a példát:
180
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Nő 300 10 1000 30
Összesen 2700 60 2000 50
Férfiak:
Nők:
Együtt:
Férfiak:
Nők:
Együtt:
Megállapíthatjuk, hogy B vállalkozásnál mind a férfiak, mind a nők jobban keresnek, mint A-nál. (A férfiak átlagos jövedelme 2 E Ft-tal, a nőké 3,3 E
Ft-tal magasabb.) Ez a megállapítás látszólag ellentmond annak, hogy B-ben alacsonyabb az átlagos jövedelem.
Két összetett intenzitási viszonyszám (főátlag) eltérése azonban nem magyarázható meg egyedül az intenzitási részviszonyszámok (részátlagok)
eltérésével. Az eltérésben a nemek szerinti eltérő összetétel is szerepet játszik. Példánkban A-nál a magasabb jövedelmű férfiak aránya 83% ,
B-nél pedig csak 40% . Ahhoz, hogy megállapításaink helytállók legyenek, külön kell választanunk e két ok hatását. Ez a standardizálás
módszerével történik.
181
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
A standardizálás módszerével a térben (illetve időben) eltérő összetett intenzitási viszonyszámok (főátlagok) közötti különbséget (vagy
hányadost) összetevőkre (illetve tényezőkre) bontjuk.
A standardizálás módszerét Kőrösy József (1844–1906) magyar származású statisztikus (demográfus) dolgozta ki és alkalmazta először. Különböző
területeken élők korcsoportos halálozási arányszámait (1000 lakosra jutó halálozások száma egy adott területen vagy időszakban) vizsgálta,
hasonlította össze. E tevékenysége során jött rá arra, hogy helytelen következtetések levonásához vezet az, ha csak az átlagos halálozási
arányszámok alapján végzi el az összehasonlítást. Ugyanis az egyes népességcsoportok életkörülményein, egészségügyi ellátásának színvonalán
kívül a halálozások számát nagymértékben befolyásolja a népesség életkor szerinti összetétele is. Tudott dolog, hogy a csecsemőkortól (0–1 éves
kor) eltekintve, minél idősebb korosztályt vizsgálunk, rendszerint annál nagyobb a halálozások előfordulása.
Tehát olyan népességcsoportoknál, ahol kedvezőbb életkörülmények, jobb orvosi ellátás hatására magasabb az átlagos életkor – ennélfogva
nagyobb arányú az idősebb korosztály népességen belüli aránya –, magasabb lehet az átlagos halálozási arányszám, mint egyéb, kedvezőtlenebb
körülmények között élő népességcsoportoknál, annak ellenére, hogy az egyes korosztályoknál valószínűleg ellentétes irányú eltérés tapasztalható.
A felismert probléma megoldására dolgozta ki Kőrösy József a standardizálás módszerét. A különböző területek népességének átlagos
halálozási arányszámát úgy értelmezte, mint az egyes életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyet
a részviszonyszámok nagysága és a népesség kor szerinti összetétele, megoszlása együttesen határoz meg. A két tényező hatását pedig úgy
választotta el egymástól, hogy egy-egy tényező hatásának elemzésekor a másik tényezőt standardnak (állandónak) tételezte fel.
Az összetett intenzitási viszonyszámok (illetve főátlagok) térbeli összehasonlításánál azt vizsgáljuk, hogy azok mennyivel térnek el egy másik, azonos
módon csoportosított statisztikai sokaság összetett intenzitási viszonyszámától (vagy főátlagától), azaz a különbségeket képezzük.
Az időbeli elemzés során azt elemezzük, hogy az összetett intenzitási viszonyszám (vagy főátlag) hány %-kal változott az egyik időszakról a másik
időszakra, azaz a hányadosokat számítjuk ki.
Ismeretes, hogy az intenzitási viszonyszám és a számtani átlag között igen közeli a rokonság. Ugyanazt a színvonalmutatót általában kifejezhetjük
viszonyszámként vagy átlagként, attól függően, hogy milyen adatokból számítottuk. Ebből következik, hogy megállapításaink mindkét mutatószámra
vonatkoznak. Ebben a fejezetben elsősorban olyan problémákat tárgyalunk, amelyek intenzitási viszonyszámokkal jellemezhetők. Ezért a
továbbiakban a módszert az intenzitási viszonyszámokra mutatjuk be, és a alapképletnek megfelelő jelöléseket használjuk. De mindaz, amit
elmondunk, az átlagokra is érvényes.
182
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
csoportok
1
2
M
Vizsgált
K I
sokaság
ahol a táblázat két utolsó oszlopában a részviszonyszámok összehasonlítására szolgáló különbségeket és az hányadosokat
A két szóban forgó ok hatását oly módon fogjuk kimutatni, hogy a két összehasonlítandó összetett viszonyszám közötti (K) tényleges különbséget,
illetve a két mutató tényleges hányadosát (I) úgy bontjuk fel két részre, hogy:
1. a illetve a megfelelő részviszonyszámok közötti különbségeknek, illetve a hányadosaiknak a két összetett viszonyszám különbségére,
illetve hányadosára gyakorolt hatását, a illetve pedig a két sokaság eltérő összetételének a két összetett viszonyszám különbségére, illetve
hányadosára gyakorolt hatását mutassa;
2. teljesüljön továbbá, hogy az egyes hatásokat kifejező különbségek összege a teljes különbséggel egyenlő: A hányadosok szorzata
pedig az összetett viszonyszámok hányadosával egyenlő: .
183
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
60 −11 124 800 2,4 52,0 117 990 2,3 51,3 –0,7
Összesen 189 500 20,0 ... 160 310 15,0 ... ...
184
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Egyszerűbben írva:
1
Súlyozott számtani átlag formában :
Egyszerűbben írva:
185
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Ha csak ezt az arányszámot ismernénk, azt gondolnánk, hogy B országban lényegesen rosszabbak az életkörülmények és az egészségügyi
viszonyok. Ha azonban a korcsoportos halálozási arányszámokat vizsgáljuk (lásd a 4.3. táblázat adatait), egészen más következtetésre jutunk, mert
B országban minden egyes korcsoportban alacsonyabb a halálozási arányszám.
E feltűnő ellentmondás magyarázata abban van, hogy B országban magasabb a viszonylag magas halandóságú idősebb korúak aránya.
A standardizálás módszerével kimutatjuk, hogy a megállapított 1,2 ezrelékpontos különbséget milyen mértékben magyarázhatjuk
186
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
A részhatáskülönbség azt fejezi ki, hogy csupán a megfelelő részviszonyszámok eltérése milyen hatást gyakorolt az összetett
intenzitási viszonyszámok eltérésére.
A ország összetett viszonyszáma, ha súlyként a B ország megoszlási gyakoriságait használjuk (ez a standard), pedig:
Megállapíthatjuk, hogy 0,6 ezrelékponttal alacsonyabb az átlagos halálozási arányszám amiatt, hogy minden korcsoportban alacsonyabbak az
arányszámok (lásd a 4.3. táblázat utolsó oszlopát).
Példánkban:
187
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Mivel a átlag, ezért a mindig a és a között helyezkedik el. Példánkban a legkisebb eltérés –5,4 (az első korcsoportban), a legnagyobb
eltérés –0,1 (pl. az 5−14 éves korcsoportnál).
A összetételhatás-különbség azt fejezi ki, hogy csupán az összetétel különbözősége milyen hatást gyakorolt az összetett intenzitási
viszonyszámok eltérésére.
Ennek a tényezőnek a hatását példánkban úgy tudjuk kimutatni, ha mindkét ország halálozási arányszámát azonos részviszonyszámok
(korcsoportonkénti halálozási arányszámok) figyelembevételével számítjuk ki és azután megállapítjuk a különbségüket. Megoldásunkat úgy folytatjuk,
hogy az A ország korcsoportonkénti halálozási arányszámait tekintjük standardnak ( ).
A kimutatott pozitív előjelű 1,8‰ azt jelenti, hogy B országban, kizárólag abból adódóan, hogy a lakosság nagyobb hányadát teszik ki az idősebbek,
1000 lakosra 1,8 ezrelékponttal több halálozás jutott.
188
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Ha a standard adatsorokat úgy választjuk meg, hogy A ország lakosság-összetételét és B ország korcsoportonkénti halálozási arányszámait
vesszük standardnak (tehát az előzőekkel éppen ellentétesen), az országos halálozási arányszámok különbségének felbontására (a számítások
mellőzésével) az alábbieredményeket kapjuk:
A kétféle standard adatsor választása esetén a és számszerű eredménye ugyan eltér egymástól, de tendenciájukban hasonló módon mutatják
az egyes tényezőknek a különbség kialakításában játszott szerepét.
Ha számításánál B ország a standard, akkor számításánál A országot kell standardnak venni (és fordítva). Ugyanis ekkor
189
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
A tényleges összetett intenzitási viszonyszámok hányadosát főátlagindexnek, a standard összetétellel számított hányadost ( )
3
részátlagindexnek, a standard részviszonyszámokkal számított hányadost ( ) pedig összetételhatás-indexnek nevezzük.
Ipari 640 000 160 4000,0 774 000 180 4300,0 107,5
Mezőgaz-dasági 1 440 000 480 3000,0 1 408 000 440 3200,0 106,7
Összesen 2 080 000 640 3250,0 2 182 000 620 3519,4 ...
4.3.1. A főátlagindex
A főátlagindex azt fejezi ki, hogy az intenzitási viszonyszámmal kifejezhető átlagos színvonal hogyan változott egyik (bázis-) időszakról
a másik (tárgy-) időszakra.
190
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
A forgalom változása:
Mindhárom számítás ugyanarra az eredményre vezet. Míg az első kettőnek gyakorlati jelentősége van, addig a harmadik számítási forma bizonyítja,
hogy a főátlagindex nagyságát két tényező befolyásolja:
A megyei átlagos 1 lakosra jutó forgalom 8,3%-os növekedését két tényező okozta:
191
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
4.3.2. A részátlagindex
A részátlagindex a részviszonyszámok változásának az összetett viszonyszám változására gyakorolt hatását fejezi ki. Eltekint a sokaság
összetétel-változásától.
Ezért a részátlagindexet változó részviszonyszámokkal és standard összetétellel képzett hányadosként számítjuk ki. Mindig a tárgyidőszak tényleges
összetételét tekintjük standardnak .
4
2. Aggregát formában :
Példánkban:
4
Az 5. fejezetben ismertetésre kerülő indexek analógiájára. Jelentését lásd ott.
192
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Példánkban:
Példánkban
Megállapíthatjuk, hogy az 1 lakosra jutó forgalom értékének településtípusonkénti növekedése 7,0%-kal növelte a megyei 1 lakosra jutó forgalmat.
A részátlagindex mindenkor a legnagyobb és legkisebb egyedi indexek ( ) között foglal helyet, mivel azok súlyozott átlaga. A főátlagindex, mivel
a részátlagok változásán kívül a sokaság összetétel-változásának hatását is tartalmazza, kerülhet az egyedi indexek közé, de mutathat az egyedi
indexeknél nagyobb vagy kisebb százalékos változást is.
193
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Példánkban:
Megállapíthatjuk, hogy az összetétel-változás (1,2%-os mértékben) növelte az egy lakosra jutó forgalmat.
Ha a részátlagindex számításánál a tárgyidőszakot vettük standardnak, akkor ebből már következik, hogy itt a bázisidőszaknak kell standardnak
lenni, mert ekkor igaz, hogy
azaz
Még egyszer hangsúlyozzuk, hogy az egyenlőség fennállásának feltétele, hogy az -t tárgyidőszaki összetétellel, az -t pedig bázisidőszaki
intenzitási részviszonyszámokkal számoljuk. (Vagy fordítva: -t adatsorral; -t pedig adatsorral.)
194
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Példánkban:
Hogy az összetétel hogyan változott, azt a 4.5. táblázat szemlélteti megoszlási viszonyszámokkal.
A megoszlási viszonyszámok alátámasztják előbbi megállapításunkat. A megye népességén belül megnőtt az ipari települések népességének
aránya, ahol (érthetően) nagyobb az 1 főre jutó kereskedelmi forgalom.
195
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Vizsgáljuk meg az átlagbérek alakulását egy vállalkozásnál 1994. és 1995. január hónapjában (4.6. táblázat).
A bruttó átlagkeresetet a béralap és a létszám hányadosaként ( ) mint intenzitási viszonyszámot értelmezzük. Az egyes állománycsoportokra
és a vállalkozás dolgozóinak összességére kiszámított bruttó átlagkereseteket és azok időbeli változását a 4.7. táblázat tartalmazza:
196
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Megállapíthatjuk, hogy az átlagkereset mind a két állománycsoportban egyaránt 10–10%-kal nőtt. Ugyanakkor az együttes (átlagos) átlagkereset-
növekedés csak 9,4%. Ennek a látszólagos ellentmondásnak az a magyarázata, hogy az egyes állománycsoportok összlétszámon belüli aránya
is megváltozott. Az alacsonyabb átlagkeresettel rendelkező fizikai állománycsoport összlétszámon belüli aránya növekedett (mert az összlétszám
változatlansága mellett létszámuk nőtt), ugyanakkor a magasabb átlagkeresetű, nem fizikai állománycsoportban lévő dolgozók aránya csökkent
(változatlan összlétszám mellett létszámuk csökkent).
Mint azt a 4.3.2. pontban bizonyítottuk, a részátlagindex az egyedi indexek között helyezkedik el. Példánk ebből a szempontból speciálisnak
tekinthető, ugyanis mindkét állománycsoportban egyaránt 10%-kal nőtt az átlagkereset. Így a bruttó átlagkereset növekedésének átlagos nagysága is
éppen 10%. A részátlagindex tehát az átlagkereset vizsgált csoportonkénti változásainak átlagát fejezi ki, rövidebben szólva az átlagkereset átlagos
változását. Mint láttuk, az együttes bruttó átlagkereset ennél kisebb mértékben nőtt (I = 109,4%).
A létszámarányok változásának hatását az összetételhatás indexével mutatjuk ki. A számításnál feltételezzük, hogy 1995-re is az 1994-es kereseti
adatok jellemzőek.
Az átlagkereset változása különbségszámítással is elemezhető, bár azt mondtuk, hogy az időbeli változást általában az indexekkel elemezzük.
197
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
A növekedés tényezői:
(A számításnál a standardizálás egyes lépéseiben ugyanúgy jártunk el, mint a megfelelő és indexnél.)
A 3431 Ft-os keresetnövekedésben az állománycsoportonkénti átlagkereset-növekedések (fizikaiaknál 600 Ft, nem fizikaiaknál 4000 Ft) együttes
hatása 3643 Ft volt, amit „lerontott” a kedvezőtlen összetétel-változás. (Az alacsony keresetű csoport létszámaránya nőtt meg 84,2%-ról 89,5%-ra.)
Az árstatisztikai vizsgálatnál megkülönböztetjük az egyedi (elemi) ár és az átlagár fogalmát. Egyedi ár fogalma alatt egy adott minőségű termék vagy
szolgáltatás meghatározott körülmények között történt adásvétele során a termék vagy szolgáltatás egy egységéért fizetett pénzösszeget értjük. Az
átlagár pedig bizonyos okok miatt különböző (pl. a termék minősége, a feljegyzés időpontja vagy helye) elemi árak átlaga.
– a vizsgált termékek, cikkek, szolgáltatások homogén csoportba tartozzanak, tehát olyan árucsoportba, amelybe tartozó cikkek, szolgáltatások
azonos szükségleteket elégítenek ki, az egyes cikkek, szolgáltatások eltérő árainak oka a minőségi különbségekben keresendő. (A statisztikai
gyakorlatban meghatározott esetekben heterogén termékek, cikkek, szolgáltatások átlagárát is elemezzük, ezzel tananyagunkban nem foglalkozunk.)
– a termékek, cikkek természetes mértékegységben összesíthetők legyenek (ez ún. technikai előfeltétele az átlagárszámításnak).
Az átlagár tehát csak homogén csoportba tartozó és természetes mértékegységben összesíthető termékek, szolgáltatások körére értelmezhető.
Átlagárat számíthatunk például a különböző minőségű kenyér elemi áraiból.
198
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
ahol v megfelel az A típusú adatnak, q pedig a B típusú adatnak. (Az összetett intenzitási viszonyszámra bevezetett jelölésrendszer szerint.)
– az egyedi (elemi) árak súlyozott harmonikus átlagaként, ha a mennyiségi adatok mellett a adatok ismertek:
199
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Az átlagár nagysága – nyilvánvalóan – függ az elemi árak nagyságától és a különböző nagyságú elemi árakkal jellemzett termékek értékesítési
részarányától.
A termékcsoport átlagárának időbeli változását, a változás okainak feltárását az itt megismert indexek szolgálják. Az alkalmazást a következő példa
segítségével mutatjuk be (4.8. táblázat).
4.8. táblázat - Egy homogén árucsoportba tartozó három cikk értékesítési adatai
Március Április
Árváltozás
Forgalom Értékesített Ár Forgalom Értékesített Ár
Cikk mennyiség mennyiség (Március=
(1000 (Ft/ (1000 (Ft/
Ft) (db) db) Ft) (db) db) =100%)
A 720,0 800 900 940,5 950 990 110
Márciusi átlagár:
Áprilisi átlagár:
Főátlagindex:
Ha az átlagár 15,2%-os növekedésében csak az árak változásának hatását akarjuk kimutatni, akkor az átlagárat mindkét időszakban az áprilisban
forgalmazott cikkek áprilisi mennyiségi adataival kell súlyoznunk. Így az átlagár részátlagindexéhez jutunk:
200
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Általánosítva
(A részátlagindex képlete azonos a következő fejezetben bemutatásra kerülő árindex képletével, tehát ténylegesen csak az árak változását
tükrözi.)
A részátlagindex súlyozott harmonikus átlag (esetleg súlyozott számtani átlag) formában is kiszámítható:
(A súlyozott számtani átlag formát a gyakorlatban nem használjuk, ezért ennek számszerű bemutatásától eltekintünk.)
A két időszak között megváltozott a forgalmazott mennyiség cikkek szerinti összetétele, ennek az átlagár változására gyakorolt hatását az
összetételhatás-index segítségével mutatjuk ki. Ebben az indexben a márciusi termékenkénti árakat használjuk mindkét időszak átlagárának
kiszámításához:
201
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Általánosítva:
Ennek feltétele, hogy a változatlannak tekintett tényezőt ( -nél a temékösszetételt, -nél az egyedi árakat) ellentétes időszakból válasszuk.
Példánkban:
Az átlagár változását tehát döntően az egyedi árak változása okozta (15,6%-os mértékben), valamelyest csökkentő hatást gyakorolt a
termékösszetétel megváltozása. Megnőtt ugyanis a viszonylag olcsóbb B cikk aránya (31,6%-ról 34%-ra).
Nyomatékosan felhívjuk a figyelmet arra, hogy az itt ismertetett átlagárindexek csak a mennyiségben közvetlenül összesíthető termékek viszonylag
szűkebb körére értelmezhetők. (Mint azt már a bevezetőben is hangsúlyoztuk.)
A következő fejezetben a közvetlenül nem összesíthető, különnemű, általában különböző mértékegységű termékek értékének, árának és
mennyiségének időbeli összehasonlítására szolgáló indexekkel ismerkedünk meg.
4.5. Gyakorlófeladatok
1. Két országban (A és B) vizsgáljuk a születési viszonyokat. A születések számára és a szülőképes korú nők számára vonatkozó adatok az alábbiak:
202
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
40 – 49 4,0 8,0 60 40
Összesen 20,0 40,0 1888 2860
Feladat:
a) Hasonlítsuk össze az 1000 nőre jutó születést a szülőképes korú nők egyes korcsoportjaiban és az ország egészében!
1. a születési arányszámok különbözősége miatt mennyivel (hány ezrelékponttal) magasabb az A ország arányszáma? (A ország összetételével
számoljunk.)
2. az eltérő korösszetétel miatt kedvezőbb vagy kedvezőtlenebb-e A ország születési arányszáma? Megállapításainkat támasszuk alá a megoszlási
viszonyszámok kiszámításával is!
Férfiak Nők
száma nyugdíj összege száma nyugdíj összege
Életkor (év)
(1000 fő) (1000 Ft/fő) (1000 fő) (1000 Ft/fő)
11 – 54 7,1 19,8 6,7 12,6
Feladat:
Hasonlítsuk össze a férfiak és a nők átlagos nyugdíját! Mutassuk ki a különbséget kialakító tényezőket!
203
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
A ország B ország
Népesség Halálozási arány Népesség Halálozási arány
Életkor (év)
(millió fő) (‰) (millió fő) (‰)
10 – 14 6 2,0 3 1,5
15 – 59 12 3,5 15 2,5
Feladat:
B 100 110 15 15
C 70 130 9 15
Összesen 270 350 44 50
Feladat:
a) Számítsuk ki az egy főre jutó hozzáadott értéket mindkét évre üzemenként és a vállalkozás egészére! Vizsgáljuk a változást 1993-ról 1994-re!
204
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
b) Mutassuk ki megfelelő indexekkel, hogy milyen szerepet játszott a vállalkozás termelékenységének javulásában (romlásában):
II. 10 10,6 40
III. 12 13,2 40
Összesen ... ... 100
Feladat:
a) Számítsuk ki a részátlagindexet!
205
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Feladat:
c) Milyen tényezők befolyásolták az együttes termésátlag változását? Mutassuk ki e hatásokat a standardizálás módszerével!
7. Egy vállalatnál 1993-ban a vezető beosztásúak átlagos bruttó bére 60 ezer Ft, a beosztottaké pedig 24 ezer Ft volt. 1994-re a vezetők átlagbére
21%-kal, a beosztottaké pedig 15%-kal nőtt. 1993-ban a vezetők aránya 20%, 1994-ben pedig 10% volt.
Feladat:
Ismert továbbá, hogy 1994-ben az összes kifizetett bruttó bérek 40%-át a szakmunkásoknak, 30%-át a betanított munkásoknak, a többit a
segédmunkásoknak fizették ki.
Feladat:
206
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
B 30 15 40
C 40 36 40
Feladat:
a) Az adatok tanulmányozása alapján (számolás nélkül) válasszuk ki, hogy az alábbi három változat közül melyik felelhet meg a valóságnak?
Telephely
A B C
Változat
1. 20 40 40
2. 10 40 50
3. 60 20 20
10. Egy felsőoktatási intézményben valamennyi oktatói csoportban (tanársegéd, adjunktus, docens, főiskolai tanár) 5,6%-kal nőttek az átlagbérek
egyik időszakról a másikra. Az összes oktatóra számított átlagbér növekedése pedig csak 2%-os volt.
207
Összetett intenzitási viszonyszámok
(főátlagok) összehasonlítása
Feladat:
11. Egy magánkereskedő háromféle minőségű burgonyát értékesít. Az értékesítéssel kapcsolatos adatok az alábbiak:
Feladat:
208
5. fejezet - Érték-, ár- és volumenindexek
5.1. Az indexszám fogalma
A gazdasági elemzésekben kiemelkedő jelentősége van az összehasonlításnak. Az azonos jellegű, azonos mértékegységű adatoknál ez egyszerű
módon megoldható, pl. viszonyszámokkal. Gyakran van azonban szükség a közvetlenül nem összesíthető adatokra vonatkozó átlagos változás
meghatározására. A gazdasági egységeknél nagyon lényeges információ a termelés vagy a forgalom teljes volumenének alakulása, melynek
megállapítása – hacsak nem egyféle cikket gyárt, forgalmaz a cég – a már ismert számításokkal nem végezhető el. Nemzetgazdasági és nemzetközi
szinten úgyszintén fontos az egyes gazdasági folyamatokban bekövetkezett mennyiségi változás kimutatása, s ez is megfelelő – az eddig tárgyaltaktól
eltérő – módszerek alkalmazását követeli meg. Napjainkban az árváltozás mértékének ismeretére vonatkozó igény is különösen nagy, mikro- és
makro-összehasonlítás vonatkozásában egyaránt. A mértékegységbeli különbözőség vagy a termékek eltérő volta nem teszi lehetővé direkt módon
a viszonyítást. Ezért olyan eljárásra volt szükség, amely az összehasonlíthatóság nehézségét kiküszöböli. Bizonyos termékeknél az átszámított
természetes mértékegységben történő számbavétel kivitelezhető (pl. égetett szeszes italoknál 50°-os szesz, állattenyésztésben számosállat stb.),
többnyire azonban csak nagyon körülményesen vagy egyáltalán nem lehetséges. Olyan közös jellemzőt kell találni, melynek segítségével az
összehasonlítás a termékek széles körében megoldható. Ez a közös jellemző az ár, amellyel az értékben történő számbavétel elvégezhető. Az érték
a mennyiség és az egységár szorzatából határozható meg. Az értékadatok összeadhatóak, tehát ily módon az egyes termékek, termékcsoportok
mennyisége összesíthetővé válik.
A közvetlenül nem összesíthető, de valamilyen szempontból összetartozó adatok átlagos változását mutató összetett összehasonlító viszonyszám
az indexszám.
Az indexszám viszonyszámnak is és átlagnak is felfogható. Viszonyszám, mert két adat hányadosa, amely időbeli és területi összehasonlításnál is
alkalmazható. Átlag, mert az egyes termékekre (jelenségekre) vonatkozó viszonyszámok átlagaként is meghatározható.
Indexek számításával már az előző fejezet is foglalkozott az összetett intenzitási viszonyszámok (főátlagok) összehasonlítása során. Ezeket az
indexeket standardizáláson alapuló indexeknek is szokták nevezni.
Azokat az indexeket, amelyekkel ebben a fejezetben fogunk megismerkedni, értéken alapuló indexeknek nevezzük.
209
Érték-, ár- és volumenindexek
mennyiséget q-val, a kettő szorzatát , az értéket v-vel jelöljük. Az összehasonlítandó két időszak jelölése bázisidőszak esetén 0, tárgyidőszak
(vagy beszámolási időszak) esetén 1 indexszel történik. Így tehát az egyedi indexek meghatározásának módja:
egyedi értékindex
egyedi árindex
egyedi volumenindex
A számítások egy konkrét példa kapcsán (5.1. táblázat) a következőképpen végezhetők el:
5.1. táblázat - Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az
1993–1994-es években
Eladott Ár Eladás értéke (ezer Ft)
TS 3354
43 39 43 900 49 900 1887,7 1946,1 1712,1 2145,7
TXT
TS 3353
32 29 47 900 52 900 1532,8 1534,1 1389,1 1692,8
TXT
TS 5355
40 37 55 900 62 900 2236,0 2327,3 2068,3 2516,0
TXT
210
Érték-, ár- és volumenindexek
TS 6354
21 16 59 900 74 900 1257,9 1198,4 958,4 1572,9
TXT
Összesen – – – – 6914,4 7005,9 6127,9 7927,4
(Megjegyezzük, hogy a táblázat utolsó két oszlopában szereplő értékadatokra csak a későbbi számításoknál lesz szükség.)
5.2. táblázat - Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek
Egyedi indexek (%)
Televíziók típusa Értékindex Volumenindex Árindex
A fenti indexek tehát azt jelentik, hogy az egyes televíziótípusok forgalmának értéke, árai s az eladott mennyiségek miként alakultak a vizsgált
időszakban. Pl. a TS 3354 TXT készülékből az eladás értéke 3,1%-kal emelkedett, ára 13,7%-kal nőtt, értékesített mennyisége pedig 9,3%-kal
csökkent 1994-ben 1993-hoz viszonyítva (5.2. táblázat).
Több termékre, termékcsoportra az átlagos érték-, ár- és volumenváltozást az indexszámok mutatják, melyek kiszámítása aggregátumokkal és
átlagolással történhet.
211
Érték-, ár- és volumenindexek
Az előző példa alapján kiszámított értékindex tehát azt mutatja, hogy a négyfajta teletextes televízió forgalmának értéke átlagosan 1,3%-kal
emelkedett a vizsgált időszakban.
– a termékek árváltozása és
– a termékek mennyiségváltozása.
Ezen hatások kimutatására szolgál a másik két index, az árindex és a volumenindex, melyek az értékindexből kiindulva is kiszámíthatóak.
Az árindex (jele: ) a különböző termékek, árucikkek, szolgáltatások árainak átlagos változását, az árszínvonal alakulását fejezi ki.
Az árindex is meghatározható két összesített értékadat (aggregátum) hányadosából. Miután azonban csak az árváltozást akarjuk mérni, a
mennyiségváltozás hatását ki kell szűrni. Ez oly módon történhet, hogy a két aggregátum csak az árakban tér el, a mennyiség mindkét időszakra
azonos, tehát az csak a súlyszám szerepét tölti be. Attól függően, hogy a két vizsgált időszak közül melyik mennyiséget tekintjük állandónak (a
bázisidőszaki vagy a tárgyidőszaki adatokat), kétféle árindex számítása lehetséges:
bázisidőszaki súlyozású
tárgyidőszaki súlyozású
A képletekben szereplő , illetve szorzatok összegzéseként kapott értékadatokat (ezek a valóságban nem léteznek) fiktív aggregátumoknak
nevezzük.
212
Érték-, ár- és volumenindexek
A két árindex általában nem ad azonos eredményt az eltérő súlyszámok miatt. (A kétféle súlyozású index különbözőségének magyarázatára
a későbbiekben kerül sor.) Jelen példánkban is bázismennyiségekkel súlyozva 14,6, míg beszámolási súlyokkal számolva 14,3%-os átlagos
áremelkedés mutatható ki a vizsgált időszakban.
Kiszámítása az árindexhez hasonlóan történhet, csak a hányadosban szereplő aggregátumok jelen esetben a mennyiségi adatokban különböznek
egymástól. Az árak mint súlyszámok változatlanok. Attól függően, hogy a bázis- vagy a beszámolási időszak áradatait használjuk fel, a volumenindex
is kétféle lehet:
bázisidőszaki súlyozású
tárgyidőszaki súlyozású
A vizsgált cikkcsoportban tehát bázisárakkal súlyozva 11,4, beszámolási áradatokkal súlyozva pedig 11,6%-os átlagos volumencsökkenés mutatható
ki 1993-ról 1994-re.
A szakirodalom a bázisidőszaki súlyozású ár- és volumenindexet Laspeyres-féle, a tárgyidőszaki súlyozású indexeket pedig Paasche-féle
indexeknek nevezi, az alkotók nevéből kiindulva.
(Elvileg bármely más időszak árait is fel lehet használni a volumenindex kiszámításához, mint ahogy az árindex meghatározásához is többféle
mennyiségi adat jöhet számításba. Közgazdasági megfontolásból és gyakorlati kivitelezhetőségi okokból azonban az előzőekben ismertetett bázis-
és tárgyidőszaki súlyozás terjedt el.)
Az átlagformában való számítás a gyakorlatban azért jelentős, mert bizonyos esetekben nem a q és a p adatsorok, hanem értékadatok és egyedi
indexek állnak rendelkezésre.
213
Érték-, ár- és volumenindexek
Az értékindex átlagformái
Az értékindex ilyen formában történő kiszámítására a gyakorlatban ritkán kerül sor, miután a tényleges értékadatok (aggregátumok) többnyire
rendelkezésre állnak, tehát az aggregát formában történő számolás általában megoldható. Esetenként azonban szükség lehet az átlagformában
történő számításra is, melynek formái a következők:
számtani átlagforma
Az 1,3%-os átlagos értékváltozást oly módon számítottuk ki, hogy az egyes televíziótípusok egyedi értékindexeit az 1993-as, bázisforgalmakkal
súlyoztuk.
harmonikus átlagforma
Ez esetben az átlagos értékváltozás meghatározása az egyedi indexek 1994-es, beszámolási forgalmi adatokkal történő súlyozásával került
kiszámításra.
Az árindex átlagformái
Laspeyres-féle árindex
214
Érték-, ár- és volumenindexek
Az átlagolandó értékek (egyedi árindexek) súlya a tényleges bázisidőszaki érték, azaz az index nevezőjében szereplő aggregátum .
Paasche-féle árindex
Paasche-féle árindex
Ennél a formulánál a tárgyidőszaki tényleges forgalmi adatokkal történik az egyedi árindexek súlyozása.
Laspeyres-féle árindex
215
Érték-, ár- és volumenindexek
Itt a súly szerepét betöltő aggregátum nem valós adat, hanem a bázismennyiség tárgyidőszaki áron számított értéke.
A volumenindex átlagformái
Laspeyres-féle volumenindex
A számtani átlaggal számolt, bázissúlyozású volumenindexnél ez esetben az egyedi volumenindexek súlyszámai a bázisidőszaki, 1993-as forgalmi
adatok.
Paasche-féle volumenindex
216
Érték-, ár- és volumenindexek
Paasche-féle volumenindex
Laspeyres-féle volumenindex
Természetesen az indexek értéke nem függ attól, hogy aggregát vagy átlagformában kerültek kiszámításra, tehát mint példánkból is kiderült, azonos
eredményt ad mindkét számítási mód.
Az indexek kiszámításának lehetséges módozatait a következő oldalon, az 5.3. táblázatban foglaljuk össze.
217
Érték-, ár- és volumenindexek
aggregátuma
Árindex Bázisidőszak Fiktív
aggregátuma
aggregátum
Bázisidőszaki súlyozású,
(Laspeyres-féle)
Árindex Fiktív Tárgy-
(beszámolási)
aggregátum időszak
Tárgyidőszaki súlyozású,
(Paasche-féle) aggregátuma
időszaki aggregátum
Bázisidőszaki súlyozású,
aggregátum
(Laspeyres-féle)
Volumenindex Fiktív Tárgyidőszak
aggregátum aggregátuma
Tárgyidőszaki súlyozású,
(Paasche-féle)
A volumenindexnél, csakúgy, mint az árindexnél valós és fiktív (nem azonos időszakhoz tartozó mennyiség- és áradatok szorzatából számított –
illetve –) értékadatokkal is történhet a súlyozás. (Meg kell jegyezni, hogy a gyakorlatban a tényleges adatokkal történő súlyozásnak van
jelentősége, mert azok közvetlenül rendelkezésre állnak, míg a fiktív értékadatok csak számítással határozhatók meg.)
Már utaltunk rá s a számszaki példa is bizonyította, hogy a bázis- és beszámolási súlyozású indexek értékei nem egyeznek meg egymással.
Az átlagolandó értékek mindkét esetben azonosak, a különbözőség egyértelműen a súlyozás eltéréséből fakad, abból, hogy a súlyarányok
218
Érték-, ár- és volumenindexek
megváltoznak. Ennek oka, hogy az egyedi volumen- és árindexek között sztochasztikus kapcsolat – többnyire negatív korreláció – található. Ez azt
jelenti, hogy általában egy-egy termék áremelkedése az adott termék eladott mennyiségének csökkenését vonja maga után, jelentősebb árnövekedés
pedig erőteljesebb mennyiség-visszaesést eredményez. Tehát nagyobb értékhez kisebb érték tartozik és viszont, s ennek következtében
általában azon termékek mennyiségi aránya nő, melyeknél s azoké csökken, ahol Ez azt vonja maga után, hogy a bázissúlyozású index
számszerű értéke magasabb, mint a tárgyidőszaki súlyozásúé:
Példánkban is nagyobb értékűek a bázissúlyozású indexek, mint a beszámolási súlyozásúak (114,6% és 114,3%, illetve 88,6% és 88,4%). A kétféle
súlyozású index értékének eltérése azonban kicsi, mert bár a negatív korreláció egyértelműen megfigyelhető, az egyedi indexek szóródása csak
nagyon kis mértékű.
Bortkiewicz mutatta ki, hogy a bázis- és tárgyidőszaki súlyozású indexek számszerű értékének eltérése három tényezővel magyarázható:
2
– a kétféle egyedi index közötti sztochasztikus kapcsolatot mérő lineáris korrelációs együtthatóval .
(A kétféle súlyozású index értéke tehát csak akkor egyezik meg, ha az egyedi ár- vagy az egyedi volumenindexek nem szóródnak, illetve az egyedi
ár- és volumenalakulás között nincsen korreláció.)
Már szó volt róla, hogy mindkét index elfogadható, egyaránt jól jellemzi az ár-, illetve a volumenváltozást, bár mindkettő meghatározott feltételezéssel
él. (Tárgyidőszakban is bázisidőszaki árak, vagy bázisidőszakban is tárgyidőszaki árak.) Abban az esetben, ha a két index értéke közötti eltérés
nem nagymértékű, elegendő csak az egyik alkalmazása. Nagyobb különbség esetén azonban célszerű a két alapforma eredményét átlagolni. Az
átlagolással ún. keresztezett indexformulák képezhetők. A gyakorlatban legtöbbször a Fisher-féle keresztezett formula kerül kiszámításra a kétféle
súlyozású index mértani átlagaként:
22
A lineáris korrelációs együttható két mennyiségi ismérv közötti kapcsolat szorosságát jellemzi. Határai: Tankönyvünk második kötetében foglalkozunk vele.
219
Érték-, ár- és volumenindexek
Fisher-féle indexek
Árindex
Volumenindex
Különböző indexformulák használhatók tehát, a közülük való választást az ún. indexpróbákkal lehet megalapozottá tenni. Az indexpróbák az
indexekkel szemben támasztott követelményeket fogalmazzák meg, melyek alapján az egyes mutatószámok értékelhetőek. A legfontosabb
indexpróbák a következők:
Időpróba: ugyanazon indexformulával számított index értéke az időszakok felcserélése mellett reciproka legyen az index eredeti értékének.
Tényezőpróba: az ugyanazon típusú formulával számított volumen- és árindex szorzata legyen egyenlő az értékindexszel.
Láncpróba: a valamely formulával számított láncindexek szorzata legyen egyenlő az ugyanazon formulával számítható bázisindexszel.
A Fisher-index tekinthető az egyik legjobb formulának, mert az tesz leginkább eleget az indexekkel szemben támasztott követelményeknek (l. a
következő pontot); az első négynek teljes mértékben, az utolsónak, a láncpróbának jó közelítéssel felel meg.
A Fisher-index mellett más keresztezett indexformulák is használatosak, így pl. az ún. Marshall–Edgeworth–Bowley-féle formulák:
220
Érték-, ár- és volumenindexek
Ez az összefüggés nemcsak az egyes termékeknél, hanem a vizsgált termékcsoportok körében is fennáll. Az értékindex egyenlő az ár- és
volumenindex szorzatával, ha azok eltérő súlyozásúak. A Fisher-féle indexnél ez a feltétel nem szerepel, nincs is értelme.
A vizsgált termékcsoportban 1993-ról 1994-re az átlagos, hozzávetőleges 14%-os árnövekedés és a kb. 12%-os volumencsökkenés hatására az
árbevétel 1,3%-kal emelkedett.
221
Érték-, ár- és volumenindexek
Az indexszámok közötti összefüggéseknek a gyakorlatban nagy jelentőségük van, mert ezek felhasználásával két index ismeretében a harmadik
előállítható. Általában a volumenindexet számítják ki ilyen közvetett módszerrel. Ennek oka, hogy az értékindex meghatározása nem ütközik
nehézségbe, hiszen a folyó áras forgalmi adatok teljes körűen rendelkezésre állnak, s az árindex kiszámítása is megoldható, bár többnyire
csak reprezentatív megfigyeléssel nyert adatokból. (Elvben az átlagos volumenváltozás is megállapítható reprezentatív felmérés eredményeként,
azonban csak nagyobb hibával és olyan körülményes módon, annyi többletmunkával, hogy a gyakorlatban ezért ezt nem alkalmazzák.) Az átlagos
volumenváltozás meghatározása tehát a legegyszerűbben az alábbi módon történhet:
Az árindexszel való osztás az árváltozás kiszűrését jelenti. A folyó áras aggregátum árindexszel történő osztását deflálásnak hívják, mely a gazdasági
számításoknál gyakran alkalmazott eljárás. (Elvben csak a tárgyidőszaki súlyozású árindex töltheti be a deflátor szerepét, gyakorlatilag azonban
más, az árszínvonal változását jól jellemző index is használható.)
222
Érték-, ár- és volumenindexek
A volumenváltozás és az árváltozás hatásának számszerűsítése a kétféle felbontással általában eltér egymástól. (Ez az alkalmazott
indexformulák különbözőségével magyarázható.) A a mennyiségváltozásból fakadó bevételváltozást mutatja, míg a az árváltozásból adódó
bevételmódosulást jelzi. A pozitív előjel esetén az árváltozás okozta lakossági többletkiadást, negatív előjel esetén megtakarítást adja.
1993-ról 1994-re az árbevétel 91,5 ezer Ft-tal emelkedett. A volumencsökkenés 786,5 ezer Ft bevételkiesést okozott, míg az áremelkedés 878 ezer Ft
árbevétel-növekedést idézett elő. Az árnövekedésből eredő lakossági többletkiadás 878 ezer Ft, tehát az 1994-ben megvásárolt televíziómennyiség
1993-as árakon 878 ezer Ft-tal kevesebbe került volna.
223
Érték-, ár- és volumenindexek
5.1. ábra -
224
Érték-, ár- és volumenindexek
ahol:
Az előző feladatoknál az eladott Videoton teletextes tv-készülékek érték-, ár- és volumenváltozását számoltuk ki. Az ott kapott eredmények
részindexként kezelhetők abban az esetben, ha valamennyi, az üzlet által forgalmazott Videoton tv-készülékre vonatkozó átlagos változást vizsgáljuk,
amely ez esetben főindexek segítségével történik (5.4. táblázat).
5.4. táblázat - A Videoton televíziók forgalmának alakulása az 1993–1994. években egy fővárosi, iparcikkeket
forgalmazó üzletben
225
Érték-, ár- és volumenindexek
1994-ben
árakon
Teletextes
6 914,4 7 002,9 6 123,9 101,3 114,3 88,6
Videoton készülék
Nem teletextes
6 361,1 5 591,1 4 945,1 87,9 113,1 77,7
Videoton készülék
Összesen: 13 275,5 12 594,0 11 069,0 – – –
A Videoton televíziók forgalmának értéke tehát összességében 5,1%-kal csökkent annak következtében, hogy bár a teletextes készülékek forgalma
átlagosan 1,3%-kal nőtt, a nem teletextes televíziók értékesítése átlagosan 12,1%-kal esett vissza. A valamivel nagyobb részarányt képviselő
teletextes tv-k forgalomalakulása tehát erőteljesebb hatással volt az átlagra.
226
Érték-, ár- és volumenindexek
A forgalom 5,1%-os csökkenése tehát a két termékcsoport árainak átlagos 13,8%-os emelkedése és az eladott mennyiségük 16,6%-os visszaesése
miatt következett be.
Figyeljük meg, hogy a megfelelő főindexek az árucsoportokra számított részindexek közé esnek.
Az árindexek alkalmazási területe is igen széles körű. A termelés, forgalom, fogyasztás elemzésében egyaránt fontos szerepet játszik. Az alábbiakban
felhasználásának csak néhány lényeges aspektusa kerül kiemelésre.
A fogyasztói árindex az infláció általános mérőszáma és a gazdaság állapotának fontos jellemzője. A lakosság által vásárolt fogyasztási cikkek,
szolgáltatások árainak átlagos változását fejezi ki, így fontos szerepe van az életszínvonal mérésében. Meghatározása hazánkban olyan módon
történik, hogy az ún. fogyasztói kosárba került mintegy 1800 termék, szolgáltatás „reprezentáns” árait figyelik havonta több alkalommal, s ezen
árfeljegyzések számtani átlagát súlyozzák a háztartásoktól begyűjtött fogyasztási szerkezetadatokkal. A reprezentánsok egyedi árindexe a tárgyhavi
és bázishavi átlagárak hányadosa. A fogyasztói árindex a reprezentások egyedi árindexeinek súlyozott átlaga, mégpedig bázissúlyozású, éven
belül változatlan súlyozással. A magyar gyakorlatban a Laspeyres-típusú árindexet számolják, mert a lakossági adatszolgáltatási rendszer 12
ezer háztartást számláló reprezentatív mintájából nyert fogyasztási szerkezet aktuális adatai (a súlyszámok) csak bizonyos időeltolódással állnak
rendelkezésre. A fogyasztói kosár árindexén kívül a termékek meghatározott körére is kiszámolják az árváltozást.
227
Érték-, ár- és volumenindexek
A teljes lakossági fogyasztásra vonatkozó árindexen kívül az egyes rétegekre külön is kiszámítják az átlagos árváltozás mértékét.
Az árindexeket havonta közzéteszik, jelezve az előző év hasonló hónapjához, az előző év decemberéhez és a közvetlenül megelőző hónaphoz
viszonyított áralakulást. Az éves árindexek a tárgyévi átlagos árakat veszik alapul, s kétféle viszonyítással, bázis- és láncárindexekként is
meghatározásra kerülnek.
Az árindexet az indexáláshoz is felhasználják, azaz a különféle jellegű ki- vagy befizetési kötelezettségeket (pl. bérek, biztosítási díj) az inflációhoz
igazítják.
Az árstatisztikában lényeges az árarányok változásának vizsgálata is. Ez szintén az árindexek segítségével történik. A különböző termékek
árindexeinek összehasonlításával határozható meg az árolló.Azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonos
volumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe.
Az agrárolló a mezőgazdasági termékek értékesítési árindexének és a mezőgazdaságban felhasznált iparcikkek beszerzési árindexének hányadosa.
1993-ban Magyarországon például a mezőgazdasági termelői felvásárlási árak 18,5%-kal haladták meg az előző évit, míg a termelésben felhasznált
iparcikkek árai 20%-kal emelkedtek, tehát a két árindex hányadosából kiszámítható az agrárolló:
Ez azt jelenti, hogy 1993-ban 1,3%-kal magasabb volumenű mezőgazdasági termék eladása szükséges annyi bevétel eléréséhez, amely az 1992-
es szinttel azonos volumenű ipari termékek megvásárlását lehetővé teszi.
Az árollók másik jelentős alkalmazási területeként az ún. cserearány-mutatókat említhetjük. Ezek a gazdálkodó szervezetek által eladott termékek
árindexét viszonyítják a vásárolt termékek árindexéhez. E mutatók értéke akkor kedvező, ha 100% felett van. A külkereskedelmi cserearány mutatója
az ún. cserearányindex (terms of trade), az adott ország által exportált és az általa importált termékek árindexeinek hányadosa. A mutató értéke
azt fejezi ki, hogy az azonos volumenű export az importtermékek fogyasztásának milyen változását teszi lehetővé.
Hazánkban 1993-ban az importált termékek árai 9,4%-kal haladták meg az előző évi árakat, míg az exportált cikkeknél 11,9%-os áremelkedés
következett be. Így a cserearány-mutató a következőképpen alakult:
1993-ban 2,3%-kal nagyobb volumenű terméket importálhattunk volna, ha az exportból származó bevételt csak importra fordítjuk, tehát javult a
cserearány.
228
Érték-, ár- és volumenindexek
A volumenindexeket, mint már ismert, többnyire az árindexek segítségével számítják ki. A hagyományos felhasználási területeken túl pl. a fogyasztás
reálértékének vagy a reálkereseteknek az alakulását is mérhetik vele, abból fakadóan, hogy az értékváltozásból az árváltozás hatását kiszűrve csak
a volumenváltozás marad.
5.6. Indexsorok
Az eddigiek során az indexszámok csak két időszak adatainak az összehasonlítására szolgáltak. A dinamikus viszonyszámokhoz hasonlóan az
indexeket szintén ki lehet számítani hosszabb időszakra is. A kettőnél több időszakra vonatkozó indexek sorozatát indexsornak hívják.
– értékindexsor,
– árindexsor,
– volumenindexsor;
– bázisindexsor;
– láncindexsor;
Az előzőek alapján tehát különböző indexsorokat lehet felírni, melyek konkrét kiszámítási módját néhány gyümölcs felvásárlására vonatkozó adatok
alapján mutatjuk be (5.5. táblázat).
229
Érték-, ár- és volumenindexek
A többféle indexsor meghatározásához célszerű egy összes lehetséges értékadatot ( ) tartalmazó táblát összeállítani oly módon, hogy az
egyes évek volumenadatait megszorozzuk valamennyi év áradataival. Így minden, összegzésre alkalmas aggregátum rendelkezésre áll, amely az
indexsorok kiszámításához szükséges (5.6. táblázat).
5.6. táblázat - Az 1990–1993. évi felvásárlás összértéke különböző évi árakon számítva
1990 1991 1992 1993
A felvásárlás
évi árakon számítva (ezer Ft)
1990 6134,7 8548,1 7045,7 6937,7
Bázis-értékindexsor
230
Érték-, ár- és volumenindexek
lánc-értékindexsor
Figyeljük meg, hogy az értékindexekhez a táblázat „átlójában” szereplő értékadatokat használtuk fel.
231
Érték-, ár- és volumenindexek
232
Érték-, ár- és volumenindexek
Figyeljük meg, hogy a volumenindexsor egy-egy elemét mindig azonos oszlopban szereplő (tehát azonos árakon számított) értékadatokból
számítottuk. Az árindexek számításánál pedig a táblázat vízszintes sorában szereplő (azonos felvásárlási mennyiségre vonatkozó) értékadatok
alapján számítottuk ki az indexsor egy-egy elemét.
Az állandó súlyozású indexsornál tehát a súlyszám az indexsor minden egyes tagjánál azonos, míg változó súlyozásnál a súlyadatok indexenként
különbözőek. Attól függően, hogy mely időszak ár-, illetve volumenadata állandó, lehet az indexsor Laspeyres- vagy Paasche-típusúnak megfelelő.
Egyébként az indexsoroknál nem lehet egyértelmű Laspeyres- és Paasche-formuláról beszélni, csak az elvek követése szempontjából történhet a
besorolás. A változó súlyozású indexsoroknál az egyes tagok kiszámításánál a kétféle formula pontosan használható. Az előző példában a változó
súlyozású bázis-árindexsor elemei Paasche-típusúak, a volumenindexsor tagjai Laspeyres-típusúak. (Természetesen a súlyozás kérdése csak az
ár- és a volumenindexsoroknál merül fel.) A kétféle súlyozású indexsor számszerű eredményei eltérnek egymástól, de tartalmuk, mondanivalójuk
lényegileg megegyezik.
Az állandó súlyozású indexsor számítása egyszerűbb, s amennyiben a legelső időszak mennyiségi, illetve áradata a súlyszám, az indexsor egymást
követő tagjait folyamatosan meg lehet határozni. Problémát a súlyok elavulása okoz, az, hogy a súlyarányok eltolódnak a tényleges arányoktól.
Ennek oka, hogy hosszabb időszak alatt az első időszak arányai nagymértékben megváltozhatnak, és a termékcserélődés következtében jelentősen
szűkülhet az összehasonlítható termékek köre is.
233
Érték-, ár- és volumenindexek
A változó súlyozású indexsor számítása bonyolultabb, de a súlyarányok jól követik a változásokat. A változó súlyozást elsősorban a láncindexeknél
használják.
Az állandó és a változó súlyozás előnyeinek összekapcsolására a gyakorlatban a kétféle súlyozást általában kombináltan alkalmazzák, ún.
szakaszosan állandó súlyú indexsort számolnak. Ez azt jelenti, hogy egy bizonyos időszakra (általában 5–10 év) a súlyadatokat rögzítik, majd az
időszak eltelte után megváltoztatják, felfrissítik azokat. A különböző periódusok indexeit pedig láncszerűen kapcsolják össze.
1. Az érték-, ár-, volumenindexsor összefüggése szerint az ár- és volumenindexsor azonos időszakra vonatkozó tagjainak szorzata egyenlő az adott
időszak értékindexével. Ez az összefüggés azonban csak meghatározott feltételek mellett érvényesül:
a) változó súlyozású láncindexek között, ha az egyik indexsor Laspeyres-, a másik indexsor pedig Paasche-formulával került kiszámításra:
b) bázisindexsorok között, ha az egyik indexsor bázisidőszaki állandó súlyozású, a másik pedig a mindenkori tárgyidőszaki változó súlyozású
indexsor:
234
Érték-, ár- és volumenindexek
2. A bázis- és láncindexek összefüggése alapján a láncindexek szorzata egyenlő a bázisindexszel, illetve a két szomszédos bázisindex hányadosából
a láncindex meghatározható.
Az értékindexsorok között ez az összefüggés mindenkor fennáll, az ár- és volumenindexsoroknál azonban csak az állandó súlyozású indexsorok
esetében.
Mivel a változó súlyozású indexsor tartalmi mondanivalóját tekintve megegyezik az állandó súlyozásúval, a fenti művelet – a képletszerű összefüggés
fennállása nélkül – a változó súlyozású indexsoroknál is elvégezhető.
Általában is megállapítható, hogy mivel a súlyozás módja nem érinti az index alapvető tartalmát, az indexekkel minden olyan művelet elvégezhető,
amely a megfelelő egyedi indexek között logikus.
A területi volumenindex azt fejezi ki, hogy az összehasonlítandó területeken a termelés, értékesítés mennyisége hányszorosa, hányad
része az összehasonlítás alapjául szolgáló terület termelésének, értékesítésének.
A területi árindex azt mutatja meg, hogy az egyik területen kialakult árszínvonal milyen arányban áll a másik terület árszínvonalával.
A területi értékindexet nem értelmezzük, az csak a területi volumenindex és területi árindex közötti összekötő kapocsként szerepel. Az előzőekben
tárgyalt bármely indexformula területi indexként is értelmezhető, a különbség csak annyi, hogy az összehasonlítandó időszakok helyett két területi
235
Érték-, ár- és volumenindexek
egység adatainak viszonyítására kerül sor. Az eddigi jelölésben a 0, 1 (bázis-, tárgyidőszak) vagy más értelmet kap (0, 1 terület), vagy megváltozik
pl. A-ra, B-re, az adott területek adatainak azonosítása céljából. A súlyszámok tehát A vagy B terület mennyiség-, illetve áradatai lehetnek, a bázis-
vagy beszámolási súlyok helyett. A másik lényeges különbség a területiindex-számítás és az időbeli összehasonlítás között az, hogy míg az egyes
időszakok adatai a viszonyítás során nem felcserélhetőek – mindig a későbbit hasonlítjuk a korábbihoz –, addig a területi indexeknél a sorrend nem
kötött. Bármelyik területi egység adatait viszonyíthatjuk a másikhoz és viszont. Ebből következik, hogy A/B relációjú összehasonlítás eredménye
reciprokviszonyban kell legyen a B/A relációjú összehasonlítás eredményével. Ez az ún. felcserélési próba, amely a már ismert időpróbának felel
meg. Másik követelmény a területi indexekkel szemben a tranzitivitás követelménye, ami az időszakok összehasonlítására használt indexeknél a
láncpróba volt. Ez azt jelenti, hogy két terület közvetlen összehasonlítása a közvetett összehasonlítással azonos eredményt kell, hogy adjon. (Azaz
A és C területek közvetlen viszonyításánál az A/C index a B területen keresztüli közvetett összehasonlításnál az A/B és a B/C indexek szorzatával
megegyező érték legyen.)
A különböző súlyozású indexformulák eredményei között lényegesen nagyobb eltérés lehet, mint az időbeli összehasonlításnál, ezért különösen
indokolt a Fisher-féle index használata. Az összehasonlítandó területeket A-val és B-vel jelölve
5.7. táblázat - Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában
A város B város
felhozatal felhozatal
Termék átlagár átlagár
mennyisége mennyisége
megnevezése (Ft/kg) (Ft/kg)
(kg) (kg)
Burgonya 150 000 85,0 70 000 100,0
236
Érték-, ár- és volumenindexek
(ezer Ft-ban)
A felhozatal mennyisége
Városok A város B város
árain számítva
A város 17 810,0 19 800,0
A vizsgált termékek árszínvonala a Fisher-index szerint 9,5%-kal volt alacsonyabb A városban B városhoz viszonyítva.
237
Érték-, ár- és volumenindexek
A négy vizsgált termék piaci felhozatalának mennyisége az A városba a Fisher-index alapján átlagosan 96,4%-kal haladta meg B város felhozatalának
mennyiségét.
A területi indexnél – mint arról szó volt – a viszonyítási alap és a viszonyítás tárgya felcserélhetőek, ezért vizsgálható jelen esetben az is, hogy B
város piaci felhozatala A városhoz viszonyítva miként alakult. Pl.:
B város piaci felhozatalának árai a vizsgált cikkeknél tehát átlagosan 10,4%-kal voltak magasabbak A városhoz képest (a volumenalakulás ebben
a relációban hasonlóképpen vizsgálható).
Miután a kétféle viszonyítású indexek egymással reciprokviszonyban állnak, a számítás a következő módon is elvégezhető, pl. az árindexek esetében:
A területi indexek legfontosabb alkalmazási területe a nemzetközi összehasonlítás. Ez esetben a területi indexeknek olyan sajátossága is jelentkezik,
amely a különböző országok eltérő valutaegységéből fakad. Annak következtében, hogy az árindex számlálójának és nevezőjének nem azonos
a mértékegysége, az eredmény nem fejezhető ki százalékos formában. Az árindex ilyenkor a két ország valutái vásárlóerejének arányát fejezi ki
a vizsgált termékek vonatkozásában. Azt mutatja tehát, hogy egy adott (az összehasonlítás alapjául szolgáló) ország egységnyi valutája a másik
(összehasonlítandó) ország hány valutájával egyenlő az összehasonlított termékek körében. A volumenindex a különböző országok gazdasági
fejlettségének, a lakosság életszínvonalának összehasonlítását is szolgálhatja. Kimutatható pl., hogy az egy főre jutó fogyasztás volumene miként
alakul két ország vonatkozásában.
Amennyiben nem két, hanem több terület összehasonlítását végezzük el, az indexsoroknál leírt módon járhatunk el.
5.8. Gyakorlófeladatok
1. A Magyar Statisztikai Évkönyvből (KSH, 1994) valók az alábbi információk:
– A magyar háztartások összes élelmiszer-fogyasztása 1991-ben 374 Mrd Ft, 1992-ben pedig 452 Mrd Ft volt folyó áron számolva.
238
Érték-, ár- és volumenindexek
– Az élelmiszerek fogyasztói ára 1992-ről 1993-ra Magyarországon 29,2%-kal, Ausztriában pedig 2,9%-kal nőtt.
– Behozatali forgalmunk folyó áron számítva 1992-ről 1993-ra 32,3%-kal nőtt, kiviteli forgalmunk pedig 2,8%-kal csökkent.
– 1992-ről 1993-ra az importált termékek volumene átlagosan 20,9%-kal nőtt, az exportált termékekre vonatkozóan pedig átlagosan 13,1%-os
csökkenés volt tapasztalható.
– A külkereskedelmi forgalom egyenlege – folyó áron számítva – 1993-ban –342 576 millió Ft volt.
– 1990-ben Magyarországon 427 ezer db színes tv-t gyártottak. 1993-ra a gyártott mennyiség 45,1%-ra csökkent.
Feladat:
Értelmezzük az információkat!
Burgonya kg 60 80 70 85
*Ft/db
Feladat:
a) Mennyi volt az árus bevétele az egyes termékekből, valamint összesen? Vizsgáljuk meg a változást is!
239
Érték-, ár- és volumenindexek
– a termékek ára?
c) Mennyi volt a négy termék árszínvonal-változása? A kapott eredményt vessük össze a termékenkénti árváltozásokkal!
– az alapadatokból,
– az árváltozások miatt,
Értékesített
Árbevétel (ezer Ft)
Árucikk mennyiség (db)
1993 1994 1993 1994
Hűtőszekrény 1400 1800 46 200 68 400
Feladat:
240
Érték-, ár- és volumenindexek
b) Számítsuk ki, hogyan változott az értékesítés mennyisége árucikkenként külön-külön és a felsorolt árucikkekre átlagosan!
Feladat:
– az árváltozás miatt,
c) Határozzuk meg az ellentétes súlyozású ár- és volumenindexeket! Magyarázzuk meg a megfelelő indexek eltérését!
Összes fogyasztás
Fogyasztási javak folyó áron Mrd Ft-ban Volumenindex*
241
Érték-, ár- és volumenindexek
Dohányáru 37 43 93,4
*Bázissúlyozású
Feladat:
d) A fogyasztás csökkenő mennyiségei miatt hány Mrd Ft-tal lett kevesebb 1992-ben az összes fogyasztási kiadás?
7. Egy család 1992-ben összes kiadásának 30%-át élelmiszerekre, 20%-át ruházati cikkekre, 25%-át szolgáltatásokra, 15%-át tartós fogyasztási
cikkekre, 10%-át pedig egyéb dolgokra költötte.
Árindex*
Kiadási csoport
1991=100%
Élelmiszerek 122
Szolgáltatások 142
Egyéb 128
242
Érték-, ár- és volumenindexek
Összesen ...
*1992-es fogyasztási mennyiségekkel
számolva
A család éves jövedelme 1991-ben 380 ezer Ft, 1992-ben pedig 460 ezer Ft volt, és sem 1991-ben, sem 1992-ben nem volt megtakarításuk.
Feladat:
Nominál átlagkereset*
Év
1980=100%
1990 249,9
1991 313,6
1992 380,4
1993 447,7
A fogyasztói árak 1990-ről 1991-re 35%-kal, 1991-ről 1992-re 23%-kal és 1992-ről 1993-ra további 22,5%-kal nőttek.
Feladat:
243
Érték-, ár- és volumenindexek
A 40 + 10 + 15
B 60 + 20 + 27
C 100 + 40 + 60
Együtt 200 ... ...
Feladat:
a) Számítsuk ki a volumenindexet mindkét súlyozással! Indokoljuk az eltérő eredményt, magyarázzuk meg a nagyságrendet!
10. Egy kiskereskedő fontosabb áruinak mennyiségi és áralakulását vizsgálta. Az alábbi adatokat ismerjük:
B 105 130
C 110 150
Feladat:
Állapítsuk meg, hogy az alábbi megállapítások közül melyek lehetnek „igazak” és melyek „hamisak”:
e) A bázisidőszak forgalmiérték-adatainak ismeretében a kiskereskedő pontosan ki tudja számítani valamelyik árindexet (a három termékre).
244
Érték-, ár- és volumenindexek
Feladat:
a) Vizsgáljuk meg a folyó áras forgalmak alakulását 1985-höz viszonyítva, valamint évről évre! Milyen indexsorokat számoltunk?
b) Vizsgáljuk meg a behozatali, valamint a kiviteli forgalom volumenének alakulását évről évre! Állapítsuk meg az indexsorok típusát!
c) Számítsuk ki, hogy 1985 és 1993 között melyik területen (az importnál vagy az exportnál) volt nagyobb az árváltozás átlagos növekedési üteme!
d) Számítsuk ki a cserearány-mutatókat!
245
Érték-, ár- és volumenindexek
Feladat:
b) Számítsunk állandó (1992-es) súlyozású lánc-volumenindexeket! Mutassuk be a lánc- és a bázisindexek közötti összefüggést!
c) Számítsuk ki a változó súlyozású lánc-árindexsor elemeit a Laspeyres- és a Paasche-féle súlyozásnak megfelelően is! Magyarázzuk meg az
1993-ra számított indexek eltérését!
246
A. függelék - Irodalom
Hajdú–Pintér–Rappai–Rédey: Statisztika I–II. JPTE, Pécs, 1994.
Hunyadi László–Mundruczó György–Vita László: Statisztika II. Aula Kiadó, Budapest, 1992.
Kerékgyártó Györgyné–Mundruczó György: Statisztikai módszerek a gazdasági elemzésben. Aula Kiadó, Budapest, 1995.
Korpás Attiláné–Molnár Máténé–Szűts István: Általános statisztika I. rész. Tankönyvkiadó, Budapest, 1992.
Köves Pál–Párniczky Gábor: Általános statisztika I–II. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.
247
6. fejezet - Tárgymutató
adat
alap~
leszármaztatott ~
adatfelvétel
reprezentatív ~
részleges ~
teljes körű ~
aggregálás
aggregátum
agrárolló
aszimmetria
~ mérőszámai
asszociáció
~s együttható
Cramer-féle ~
Csuprov-féle ~
Yule-féle ~
ár
árindex
248
Tárgymutató
egyedi ~
Fisher-féle ~
fogyasztói ~
Laspeyres-féle ~
Marshall–Edgeworth–Bowley-féle
Paasche-féle
területi
árolló
átlag
fő~
harmonikus ~
kronologikus ~
mértani ~
négyzetes ~
rész~
számtani ~
~ tulajdonságai
átlagár
~változás
Bortkiewicz-tétel
bot-ábra
249
Tárgymutató
cserearány-index
csoportosítás
deflálás
determinációs hányados
egység (egyed)
megfigyelési
számbavételi
eltérés-négyzetösszeg
belső ~
külső ~
teljes ~
értékindex
egyedi ~
értékösszeg
kumulált ~
relatív ~
~sor
főátlag
~index
250
Tárgymutató
főindex
függetlenség
függvényszerű kapcsolat
gyakoriság
együttes ~
kumulált ~
perem~
relatív ~
~i eloszlás
~i megoszlás
~i poligon
~i sor
helyzetmutatók
hiba
abszolút ~
relatív ~
hibakorlát
hisztogram
idősor 82
251
Tárgymutató
állapot~
tartam~
indexpróbák
indexsor
ár~
érték~
volumen~
indexszám
ismérv
alternatív ~
diszkrét ~
folytonos ~
időbeli ~
közös ~
megkülönböztető ~
mennyiségi ~
területi ~
~változat
kérdőív
koncentráció
~s együttható
252
Tárgymutató
korreláció
~s hányados
~s tábla
kördiagram
kumulálás
kvantilis
~ eloszlás
kvartilis
alsó ~
felső ~
Lorenz-görbe
medián
mérési skála
arány~
intervallum~
névleges ~
sorrendi ~
módusz
mutatószám
oszlopdiagram
osztályköz
253
Tárgymutató
~határok
osztályközépső
összehasonlítás
összetételhatás-index
összetételhatás-különbség
rangsor
részátlagindex
részhatáskülönbség
részindex
sokaság
álló ~9
diszkrét ~
folytonos ~
fő~
mozgó ~
rész~
véges ~
végtelen ~
sor
csoportosító ~
254
Tárgymutató
idő~
leíró ~
mennyiségi ~
minőségi ~
összehasonlító ~
területi ~
statisztika
leíró ~
statisztikai következtetés
statisztikai tábla
csoportosító ~
egyszerű ~
kombinációs ~
kontingencia~
~dimenziószáma
szórás
~hányados
~négyzet-hányados
szórásnégyzet
belső ~
külső ~
255
Tárgymutató
teljes ~
~-felbontás
szóródás
~ mutatói
átlagos eltérés
átlagos különbség
relatív szórás
sztochasztikus összefüggés
vegyes kapcsolat
viszonyszám
bázis~
dinamikus ~
intenzitási ~
koordinációs ~
lánc~
megoszlási ~
összetett ~
rész~
volumenindex
egyedi ~
Fisher-féle ~
256
Tárgymutató
Laspeyres-féle ~
Marshall–Edgeworth–Bowley-féle ~
Paasche-féle ~
területi ~
vonaldiagram
257