You are on page 1of 436

Tátrainé Körmendy E.

Katalin

STATISZTIKA
Készült a HEFOP 3.3.1-P.-2004-09-0102/1.0 pályázat támogatásával.

Szerző: Tátrainé dr Körmendy E. Katalin


főiskolai docens

Lektor: Szalka Éva


egyetemi docens

© Tátrainé Körmendy E. Katalin, 2006


Statisztika A dokumentum használata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 3 ►

A dokumentum használata

Mozgás a dokumentumban
A dokumentumban való mozgáshoz a Windows és az Adobe Reader meg-
szokott elemeit és módszereit használhatjuk.
Minden lap tetején és alján egy navigációs sor található, itt a megfelelő
hivatkozásra kattintva ugorhatunk a használati útmutatóra, a tartalomjegy-
zékre, valamint a tárgymutatóra. A ◄ és a ► nyilakkal az előző és a követ-
kező oldalra léphetünk át, míg a Vissza mező az utoljára megnézett oldalra
visz vissza bennünket.

Pozícionálás a könyvjelzőablak segítségével


A bal oldali könyvjelző ablakban tartalomjegyzékfa található, amelynek
bejegyzéseire kattintva az adott fejezet/alfejezet első oldalára jutunk. Az
aktuális pozíciónkat a tartalomjegyzékfában kiemelt bejegyzés mutatja.

A tartalomjegyzék használata
Ugrás megadott helyre a tartalomjegyzék segítségével
Kattintsunk a tartalomjegyzék megfelelő pontjára, ezzel az adott fejezet
első oldalára jutunk.
Keresés a szövegben
A dokumentumban való kereséshez használjuk megszokott módon a
Szerkesztés menü Keresés parancsát. Az Adobe Reader az adott pozíció-
tól kezdve keres a szövegben.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 3 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 4 ►

Tartalomjegyzék
1. Bevezetés ........................................................................................ 7
1.1. A statisztika fogalma.................................................................................... 7
1.2. Alapfogalmak................................................................................................ 7
1.3. Összefoglalás .............................................................................................. 22
2. Viszonyszámok............................................................................. 25
2.1. A dinamikus (= időbeli) viszonyszám..................................................... 26
2.2. A területi viszonyszám .............................................................................. 29
2.3. A megoszlási viszonyszám........................................................................ 32
2.4. Az intenzitási viszonyszám....................................................................... 35
2.5. Gyakorló feladatok .................................................................................... 38
2.6. Összefoglalás .............................................................................................. 43
2.7. Mintapéldák korábbi vizsgadolgozatokból............................................. 44
3. Középértékek................................................................................ 47
3.1. A középértékek fogalma ........................................................................... 47
3.2. A számtani átlag ......................................................................................... 48
3.3. A mértani átlag ........................................................................................... 53
3.4. A négyzetes átlag........................................................................................ 55
3.5. A harmonikus átlag.................................................................................... 56
3.6. Módusz........................................................................................................ 57
3.7. Medián......................................................................................................... 59
3.8. Gyakorló feladatok .................................................................................... 63
3.9. Összefoglalás .............................................................................................. 66
3.10. Mintapéldák korábbi vizsgadolgozatokból........................................... 69
4. Szóródás........................................................................................ 77
4.1. A szóródás fogalma ................................................................................... 77
4.2. A szóródás legfontosabb mutatói............................................................ 77
4.3. Gyakorló feladatok .................................................................................... 85
4.4. Összefoglalás .............................................................................................. 85
5. A gyakorisági görbék (eloszlások) alakjának vizsgálata.............. 86
5.1. Szimmetria – aszimmetria......................................................................... 86
5.2. Csúcsosság – lapultság .............................................................................. 90
5.3. Gyakorló feladatok .................................................................................... 90

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 4 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 5 ►

5.4. Összefoglalás .............................................................................................. 91


6. A koncentráció.............................................................................. 92
6.1. Fogalma, fajtái, kimutatása, mérése......................................................... 92
6.2. Gyakorló feladatok .................................................................................... 98
6.3. Összefoglalás .............................................................................................. 99
7. Az ismérvek közötti kapcsolat.....................................................100
A sokaságok egyszerre több ismérv szerinti vizsgálata ..............................100
7.1. Asszociáció ...............................................................................................103
7.2. Vegyes kapcsolat ......................................................................................109
7.3. Korrelációs kapcsolat ..............................................................................115
7.4. Gyakorló feladatok ..................................................................................119
7.5. Összefoglalás ............................................................................................122
7.6. A 4., 5., 6., 7. fejezetek tartalmához kapcsolódó mintapéldák
korábbi vizsgadolgozatokból .................................................................123
8. Standardizálás .............................................................................129
8.1. Bevezetés...................................................................................................129
8.2. A standardizálás – elméleti összefoglalás .............................................131
8.3. Gyakorlati alkalmazás..............................................................................135
8.4. Gyakorló feladatok ..................................................................................144
8.5. Összefoglalás ............................................................................................148
8.6. Mintafeladatok korábbi vizsgadolgozatokból ......................................149
9. Ár-, érték-, volumenindex-számítás ............................................154
9.1. Bevezetés...................................................................................................154
9.2. Egyedi elemzések .....................................................................................154
9.3. Összevont (együttes, átlagos) elemzések ..............................................159
9.4. Az ár-, érték-, volumenindexek felhasználási lehetőségei ..................166
9.5. Kiegészítés ................................................................................................173
9.6. Gyakorló feladatok ..................................................................................178
9.7. összefoglalás .............................................................................................180
9.8. Mintafeladatok korábbi vizsgadolgozatokból ......................................183
10. Becslés .......................................................................................187
10.1. Bevezetés.................................................................................................187
10.2. Becsült sokasági jellemzők....................................................................195
10.3. Gyakorló feladatok ................................................................................229

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 5 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 6 ►

10.4. Összefoglalás ..........................................................................................232


10.5. Mintapéldák korábbi vizsgadolgozatokból.........................................235
11. Hipotézisellenőrzés = statisztikai próbák ................................ 240
11.1. A hipotézisellenőrzés alapfogalmai .....................................................241
11.2. A hipotézisellenőrzés menete ..............................................................247
11.3. Statisztikai próbák..................................................................................248
11.4. Gyakorló feladatok ................................................................................277
11.5. Összefoglalás ..........................................................................................284
11.6. Mintapéldák korábbi vizsgadolgozatokból.........................................287
12. Az idősorok elemezése.............................................................. 292
12.1. Bevezetés.................................................................................................292
12.2. Trendszámítás ........................................................................................294
12.3. A szezonhatás vizsgálata.......................................................................312
12.4. A véletlenhatás vizsgálata .....................................................................319
12.5. Előrejelzés...............................................................................................321
12.6. Záró példa...............................................................................................324
12.7. Gyakorló feladatok ................................................................................335
12.8. Összefoglalás ..........................................................................................337
12.9. Mintapéldák korábbi vizsgadolgozatokból.........................................339
13. Korreláció-, regresszió-számítás............................................... 344
13.1. Bevezetés.................................................................................................344
13.2. Kétváltozós elemzések..........................................................................345
13.3. Háromváltozós elemzések....................................................................376
13.4. Gyakorló feladatok ................................................................................407
13.5. Összefoglalás ..........................................................................................412
13.6. Mintapéldák korábbi vizsgadolgozatokból.........................................416
Táblázatok...................................................................................... 422
Felhasznált irodalom:..................................................................... 435

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 6 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 7 ►

1. Bevezetés

1.1. A statisztika fogalma


A bennünket körülvevő világ1 megismeréséhez igen sokféle adat (= infor-
máció) összegyűjtésére, rendszerezésére, feldolgozására, elemzésére
van szükségünk. Ezeket a feladatokat végzi el a statisztika. Ebből a
szempontból nézve, a statisztika gyakorlati tevékenység.
Ahhoz, hogy az összegyűjtött adatokból valóban használható eredmé-
nyeket kapjunk, és azokból helyes következtetéseket vonjunk le, munkán-
kat elméletileg is meg kell alapozni. Az alkalmazott módszereket és az
eljárási szabályokat az elméleti statisztika foglalja össze. A statisztika
ebből a szempontból nézve tudomány.
Végül a statisztika magát az összegyűjtött és rendezett adathalmazt is
jelenti2.

1.2. Alapfogalmak
1.2.1. Sokaság
Sokaságnak nevezzük azoknak az egyedeknek az összességét (= halma-
zát), melyekre az adatgyűjtés irányul. A sokaságokat különböző szempont-
ok szerint csoportosíthatjuk. A legfontosabb megkülönböztetés:
• álló sokaság;
• mozgó sokaság.
Az álló sokaság állományjellegű, időpillanatra vonatkozik. (pl.: egy
ország lakossága a népszámlálások idején3, egy felsőoktatási intézmény
hallgatói a beiratkozások idején.)
A mozgó sokaság folyamatot tükröz, időtartamra vonatkozik. (pl.:
egy bolt forgalma egy hónap alatt4, egy gyár termelése egy félév alatt, egy
család kiadásai egy év alatt.)

1 A bennünket körülvevő világ = természet, társadalom, gazdaság.


2 Szokás még magukat az alkalmazott képleteket (függvényeket) is statisztikának nevezni.
3 Népszámlálások ideje = az év egy rögzített napja (pl. január 1.). Akkor is ennek a nap-
nak az adatait veszik fel a számláló biztosok, ha nem ezen a napon kopogtatnak be egy-
egy lakásba.
4 A napi forgalom összesíthető hetente, havonta, negyedévente, évente.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 7 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 8 ►

További – az irodalomjegyzékben felsorolt, a témát részletesebben taglaló tanköny-


vekben megtalálható – szempontok alapján beszélhetünk:
1. diszkrét (= elemeik jól elkülöníthetőek) és folytonos (= elemeiknek elkülönítésé-
ről gondoskodni kell);
2. egynemű (= elemeiknek csak közös tulajdonságai vannak) és összetett (= eleme-
iknek nemcsak közös, hanem megkülönböztető tulajdonságai is vannak);
3. véges (= elemeik megszámlálhatóak) és végtelen (= elemeik nem megszámlálhatóak);
4. fő (= az összetett sokaság egésze) és rész (= az összetett sokaság valamilyen szem-
pont alapján elkülönített részei); stb. sokaságokról is.

1.2.2. A sokasági egység


A sokaság egy-egy tagját, elemét sokasági egységnek nevezzük. A soka-
ság egységei vagy természetükből fakadóan elkülönülnek, vagy a megfigye-
lés érdekében a statisztikai munkát végzők alakítják ki az elkülöníthető
egységeket. A statisztikai munkában betöltött szerepük szerint az egysé-
geknek két típusát különböztetjük meg:
• megfigyelési,
• számbavételi.
Adatgyűjtésünk a megfigyelési egységre (pl.: egy város lakói, egy mezőgazda-
sági termelő állatállománya, egy gyár termelése) vonatkozik, kérdéseinket pedig a
számbavételi egységhez (pl.: egy város lakói5, egy mezőgazdasági termelő6, a gyár
statisztikusai, munkaügyi stb. dolgozói7) intézzük.

1.2.3. Ismérv
Azokat a tulajdonságokat, melyek alapján a megfigyelt egységek egy so-
kaságot képeznek, vagy éppen elkülönülnek, ismérveknek nevezzük. Az
ismérvek típusai
• közös,
• megkülönböztető;
• időbeli,
• területi,
• mennyiségi,
• minőségi.

5 A város lakói a rájuk vonatkozó adatokat meg tudják mondani.


6 A mezőgazdasági termelő képes adatokat szolgáltatni állatállományáról stb.
7 A gyár termeléséről és egyéb adatairól egyes – ezzel a feladattal megbízott – dolgozók
tudnak nyilatkozni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 8 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 9 ►

A közös ismérv a sokaság minden elemét jellemzi, azok éppen ezek alap-
ján tartoznak a sokasághoz. A megkülönböztető ismérv a sokaság eleme-
inek csak egy-egy részét jellemzi, részsokaságok képzésére ad lehetőséget.
(pl.: Egy egyetem hallgatóinak közös tulajdonsága, hogy az adott időpontban, az adott intéz-
ménybe beiratkoztak; hallgatói jogviszonnyal rendelkeznek; de nem mind ugyanabban a város-
ban vagy községben születtek, más középiskolákban tanultak, más szakterületet választottak stb.)
Az időbeli ismérvek időpontokat vagy időszakokat jelölnek; a területi-
ek földrajzi megkülönböztetést fejeznek ki; a mennyiségiek műveletek
végzésére alkalmas számok, a megfigyelt egységek nagyságát, méretét, kapa-
citását adják meg, ismérvváltozataik diszkrétek8, ill. folytonosak9; a minősé-
gi ismérvek változatai pedig szavakkal megfogalmazható tulajdonságok.
(Példák a felsorolás sorrendjében:
• születési dátum, az érettségi megszerzésének éve;
• születési hely, állandó lakóhely;
• testmagasság (cm; folytonos), ösztöndíj (forint; folytonos), egy tanuló kötelező isko-
lai elfoglaltságának mennyisége (óra; diszkrét), testvéreiknek száma (fő; diszkrét), a
félév végén leteendő vizsgáik (db; diszkrét) stb.;
• családi állapota, foglalkozása, iskolai végzettsége stb.)

Akármelyik eddig felsorolt ismérvről is van szó, annak vannak változatai,


azaz lehetséges kimenetei.
Például: a hallgatók születési ideje (= időbeli ismérv): 1980, 1981, 1982 stb., születési
helyük (= területi ismérv): Budapest, Győr, Szeged stb.; testmagasságuk (= mennyiségi
ismérv): 160 – 165, 165 – 170 cm stb.; szakterületük (= minőségi ismérv): mérnök, köz-
gazdász, jogász stb.
Az ismérvváltozatok, a folytonos mennyiségi ismérveket – ezeket osz-
tályközökbe, azaz „tól – ig” határok közé szokás sorolni – kivéve, jól elkü-
löníthetők. Az ismérvek különleges csoportját alkotják az un. alternatív
ismérvek, melyeknek mindig csak két10 változata van.

8 Ha az egyes ismérvváltozatokhoz tartozó előfordulásokat ábrázoljuk a koordináta rend-


szerben (lásd: későbbi fejezetekben), akkor a vízszintes tengely nem minden pontjához
tudunk előfordulásokat rendelni.
9 Ha az egyes ismérvváltozatokhoz tartozó előfordulásokat ábrázoljuk a koordináta rend-
szerben (lásd: későbbi fejezetekben), akkor elméletileg a vízszintes tengely minden pont-
jához tudunk előfordulásokat rendelni.
10 Alternatív ismérvek: férfi – nő, kereső – eltartott.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 9 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 10 ►

1.2.4. Statisztikai adat


A megfigyelt sokaság egy-egy elemének a vizsgálat tárgyát képező tulajdon-
ságára vonatkozó aktuális értékét statisztikai adatnak nevezzük. A statisz-
tikai adatok különböző szempontok alapján csoportosíthatóak. Így vannak:
• szöveges és
• számszerű;
• abszolút
• relatív;
• eredeti és
• számított adatok.
Szöveges adatok a szavakkal megfogalmazott ismérvváltozatok, melyek a
könnyebb feldolgozhatóság érdekében kódolhatóak. A számszerű ada-
tok lehetnek abszolút jellegűek, melyek adatgyűjtésből származnak, vagy
összegzéssel, különbségképzéssel, szorzással állíthatók elő és van mérték-
egységük; ill. relatív jellegűek, melyek két statisztikai adat hányadosaként
állíthatók elő, és nem mindig van mértékegységük. Az eredeti, más néven
alapadatok adatgyűjtésből származnak; a számított adatokat pedig külön-
böző matematikai műveletek eredményeként nyerjük. A számított adatok
kitüntetett csoportját alkotják a mutatószámok, melyeket rendszeresen,
és mindig azonos tartalommal számítunk ki.
(Példák a felsorolás sorrendjében:
• szöveges: férfi – nő, kereső – eltartott, a hallgatók korábbi iskoláinak listája stb.
• számszerű, abszolút: havi jövedelmek nagysága, egy ország lakóinak száma stb.
• számszerű, relatív: egy gyár termelésének növekedése %-ban;
• eredeti: egy hallgató személyes adatai;
• számított: minden relatív számszerű adat;
• mutatószám: egy főre jutó GDP, egy ország népsűrűsége stb.)
A számszerű adatokkal kapcsolatban szokás, különböző mérési-, elemzési
szintekről11 is beszélni. Végül azt is fontos tudnunk, hogy a statisztikai ada-
tok korlátozott pontosságúak, vagyis azt kell általánosnak tekintenünk, hogy
a statisztikai adatgyűjtés eredményeképpen kapott adatok a valódi értéktől
kisebb – nagyobb mértékben eltérnek. Ennek két oka van. Szubjektív, az

11 Névleges: kizárólag megkülönböztetésre szolgáló számok (postai irányítószámok,


házszámok); sorrendi (egy sportverseny helyezettjei); különbségi (arányuk nem értel-
mezhető; az egyes naptári napok középhőmérsékletének eltérései) és arány (az egyes
hallgatók ösztöndíjainak hányadosa).

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 10 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 11 ►

adatgyűjtést végző személyek nem pontos munkavégzése, nem megfelelő


felkészítése; az esetleg nem egyértelmű kérdések, a válaszadás megtagadása
stb. Ennek nagysága nem ismerhető meg, de mindent meg kell tennünk
kisebbítése érdekében. Objektív, más néven véletlen hiba. Ez az adatgyűjtés
nem teljes-körű voltából adódik. Nagysága szabályos mintavétel esetén
megismerhető (= becsülhető). A statisztikai adatok hibáját mind abszolút,
mind relatív módon kifejezhetjük.
(Példa a statisztikai kiadványokban közölt adatok hibájának számítására:
Magyarország népessége 2004-ben 10.11712 ezer fő;

• abszolút hiba13: a = ( A′ − A) = ±500 fő ,

a 500
• a relatív hiba pedig α = = ⇒ 0,004942% .
A 10.117.000
1.2.5. Statisztikai adatok rendezése = csoportosítása
Az összegyűjtött illetve kiszámított statisztikai adatokat annak érdekében,
hogy azok áttekinthetőek legyenek, rendezni kell. A rendezés megszokott
formái a statisztikai sorok (= az adatokat egyetlen szempont alapján
csoportosítjuk) és a statisztikai táblák (= az adatokat egyszerre több
szempont szerint csoportosítjuk). A statisztikai sorok fajtái az ismérvekhez
kapcsolhatóak, ill. alkalmazzuk az un. leíró sort, ez egyetlenegy sokasági
egységre vonatkozó különböző jellegű, részben különböző mértékegységű
adatokat sorakoztat fel. A statisztikai táblákat az azokban található össze-
sen-rovatok száma alapján különböztetjük meg. Az adatokból akár soro-
kat, akár táblákat alkotunk, bizonyos formai követelményeknek14 (lásd: 1.2.
sz. tábla) is eleget kell tennünk. Kérjük, tekintse át az alábbi példákat, majd
az azokról készült rövid összefoglalót!

1.1. sz. tábla


Magyarország népessége , (ezer fő)
év 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
adat 10.337 10.321 10.301 10.280 10.253 10.222 10.200 10.175 10.142 10.117
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – hosszú idősorok, 1. oldal)

12 Adatforrás: Magyar Statisztikai Évkönyv 2003 (KSH, 2004 – hosszú idősorok, 1. oldal)
13 a = abszolút hiba, α = relatív hiba, A = tényleges adat (= amire kíváncsiak vagyunk),

A = közölt adat (= a statisztikai kiadványokban, jelentésekben)
14 A minta-táblából egyetlen formai kellék hiányzik, az összegrovat.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 11 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 12 ►

1.2. sz. tábla


Az élveszületések száma Magyarországon A formai kellékek megnevezé-
(fő) se15
év élveszületés cím, (mértékegység)
1995 112 054
1996 105 272 fejléc
1997 100 350
1998 97 301 oldalrovat (ismérvváltozatok)
1999 94 645
2000 97 597 megfigyelt adatok
2001 97 047
2002 96 804
2003 94 647
2004 92 200*16
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – hosszú idősorok, 1. oldal)

1.3. sz. tábla 1.4. sz. tábla


A gazdaságilag aktív népesség néhány Magyarország férfi lakossága
európai országban életkor szerint
2003 2004. jan. 1.
aktív népesség lakosok
ország korév17
(ezer fő) (fő)
Ausztria 3.876 0 47.936
Csehország 5.096 1 49.156
Dánia 2.858 2 49.570
Finnország 2.682 3 49.881
Franciaország 26.409 4 47.949

15 A közölt minta alapján a többi sor ill. tábla formai kellékei is azonosíthatóak.
16 Becsült adat.
17 Korév = valakinek az életkora az adott évben (adott év évszáma – születés évszáma)
függetlenül attól, hogy a vizsgálat elvi időpontjában az illető már betöltötte-e az adott
kort vagy sem.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 12 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 13 ►

Görögország 4.407 ……
Hollandia 8.432 85 4.314
Írország 1.861 86 3.731
Lengyelország 16.946 87 3.214
Magyarország 4.166 …..
…….. összesen 4.804.113
adatforrás (1.3. sz.tábla): Magyar statisztikai évkönyv 2003 ((KSH, 2004 – nemzetközi adatok,555. oldal)
adatforrás (1.4. sz tábla): Magyar statisztikai évkönyv 2003 (KSH, 2004 –népességi adatok,36. oldal)

1.5.sz. tábla
Külföldi érdekeltségű vállalkozások18 saját tőke szerint, Magyao.-on 2003-ban
saját tőke
– 150 150,1 – 200 200,1 – 250 250,1 – 500 500,1 – 750 750,1 –
(millió Ft)
szervezetek
22.958 362 283 718 315 1.128
(db)
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – a gazdasági szervezetek adatai, 289. oldal)

1.6.sz. tábla
A magyarországi közoktatási intézmények az ellátott feladatok
típusa szerint, a 2003/2004 tanévben
az intézmény jellege az intézmények száma (db)
szakiskola 3
középiskola 99
középfokú iskola 163
általános iskola 335
óvoda 861
iskola + kollégium 390
óvoda + iskola + kollégium 42
többcélú intézmény 297
összesen 2.190
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – oktatási adatok, 226. oldal)

18A tábla adatai nem tartalmazzák azokat a vállalkozásokat, ahol a külföldi részesedés 10
% alatti, ill. az un. offshore vállalkozások számát.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 13 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 14 ►

1.7. tábla
Írország fontosabb adatai, 2004
megnevezés mértékegység19 adat
terület km2 70.283
népesség millió fő 3,96
a népesség összetétele
ír % 94
angol 3
vallások
katolikus 77
%
anglikán 9
presbiteriánus ……
hivatalos nyelvek – ír, angol
főváros – Dublin
a főváros lakossága millió fő 1,0
államforma – köztársaság
az alkotmány kihirdetése – 1937
az önállóság elnyerése – 1921
a törvényhozás létszáma
képviselőház fő 166
szenátus 60
GDP milliárd USD 152,1
GDP/fő USD 38.430
gazdasági növekedés előző évhez % + 1,8
infláció + 2,8
%
munkanélküliség 4,8
pénznem – euró
adatforrás: Zsebvilág 2004, A Föld országai (HVG, 76. old.)

19 A táblák (sorok) egyes rovataiban (celláiban) szereplő jelek: „–” = a rovatban nem
szerepelhet adat; „….” = a rovatba tartozó adat ismeretlen; „000” = az adott nagyság-
renden a rovatban nem szerepelhet adat.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 14 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 15 ►

1.8. tábla
Az 1.2.5. fejezetben szereplő statisztikai sorokhoz kapcsolódó fontosabb ismeretek
sorszám típus tudnivalók röviden
1.1. állapot idősor Adatai többszörös halmozódást20 tartal-
maznak, így azok összegzése értelmetlen.
1.2. tartam idősor Adatai összegezhetőek.
∑y i = 987.917 fő21 =
A vizsgált időszakban Magyarországon 987.917
gyermek született.
1.3. területi sor Adatai összegzésének csak akkor lenne értelme, ha a
felsorolt országok valamilyen egységet alkotnának.
14. mennyiségi sor Adatai összegezhetőek.
diszkrét ismérv-
változat
∑y i = 4.804.113 fő =
2004-ben Magyarországnak összesen
4.804.11322 fő férfi lakosa volt.
1.5. mennyiségi sor Adatai összeadhatók,
folytonos is-
mérvváltozat
∑y i = 425.754 db
2003-ban hazánkban összesen 425.754 külföldi
érdekeltségű vállalkozás működött.
1.6. minőségi sor A tábla adatai összeadhatók,
∑y i = 2.190 db
A 2003/2004-es tanévben hazánkban 2.190 olyan
közoktatási intézmény működött, ahol a gyermekek 3
és 1823 éves koruk között tanulhatnak.
1.7. leíró sor A Föld országainak sokaságából kiválasztottunk
egy egységet (= Írország), és erre vonatkozóan
közöltünk különböző jellegű adatokat.

20 Halmozódás = aki már a megfigyelés első évében (1996) is élt, és a megfigyelés utolsó
évében is (2004), azt kilencszer venné számításba az összegzés stb.
21 y = az időpontokhoz, időszakokhoz tartozó adatok statisztikai jelölése
i
22 Ez az adat un. továbbvezetett népességszám. Az előző (2001) népszámlálás adatait
növelik a születések és bevándorlások adataival, ill. csökkentik a halálozások és az elván-
dorlások adataival.
23 Az évismétlők ill. a felnőttképzésben résztvevők esetenként magasabb életkorúak is lehetnek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 15 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 16 ►

1.9. sz. tábla


Fontosabb népmozgalmi adatok, Magyarország
válás terhességmeg-
házasságkötés teljes termékenységi
év ezer szakítás száz
ezer lakosra arány24
lakosra élveszületésre
1949 11,7 1,4 0,9 2,54
1960 8,9 1,7 110,7 2,02
1970 9,3 2,2 126,7 1,97
1980 7,5 2,6 54,4 1,92
1990 6,4 2,4 71,9 1,84
2000 4,7 2,3 60,7 1,33
2001 4,3 2,4 58,1 1,31
2002 4,5 2,5 57,9 1,31
2003 4,5 2,5 56,8 1,28
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – népmozgalmi adatok, 2. oldal)

1.10. sz. tábla


Országos (Magyarország) közúthálózat jelleg szerint (km)
megnevezés 1990 1995 2000 2001 2002 2003
gyorsforgalmi utak
autópálya 267 335 448 448 533 542
autóút 82 85 57 57 48 90
főutak
elsőrendű főút 1.888 2.055 2.713 2.713 2.164 2.177
másodrendű főút 4.499 4.390 4.330 4.330 4.346 4.337
gyorsforgalmi utak
115 159 242 251 276 286
csomóponti ágai
mellékutak
összekötő út 17.527 17.853 17.916 17.916 17.958 17.998

24 Teljes termékenységi arány = 1000 egy időben született leánygyermek élete folyamán
(illetve a szülőképeskor felsőhatáráig – 49 év – eljutva) összesen hány gyermeket szül az
adott év termékenységi arányszámának feltételezése mellett. (Köves – Párniczky: Általá-
nos statisztika, KJK, 742. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 16 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 17 ►

bekötőút 4.810 4.680 4.646 4.651 4.638 4.609


állomáshoz vezető út 553 516 495 496 497 497
összesen 29.741 30.073 30.307 30.322 30.460 30.536
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – szállítási adatok, 496. oldal)

1.11. tábla
A magyarországi népesség nyelvismerete főbb korcsoportok szerint, 2001.
febr.25
korcsoportok (év)
nyelv26 – 14 15 – 39 40 – 59 60 – összesen
magyar 1.690.679 3.564.984 2.842.430 2.079.130 10.177.223
bolgár 230 1.116 1.281 886 3.513
cigány (roma) 19.931 35.656 16.613 4.871 77.071
görög 351 2.503 1.318 987 5.159
horvát 2.626 13.699 13.557 12.667 42.549
lengyel 680 3.481 5.355 1.690 11.206
német 86.105 544.196 251.833 158.652 1.040.786
örmény 72 215 141 73 501
román 2.603 44.447 28.226 19.445 94.721
ruszin 143 758 763 562 2.226
szerb 1.082 11.006 6.963 6.432 25.483
szlovák 3.090 11.721 17.843 28.010 60.664
szlovén (vend) 358 1.759 1.886 1.640 5.643
ukrán 925 6.229 4.510 2.325 13.989
összesen 1.694.936 3.574.493 2.842.430 2.081.559 10.198.315
adatforrás: Magyar statisztikai évkönyv 2003 (KSH, 2004 – népességi adatok, 42. oldal)

25 Az eddigi utolsó népszámlálás bevallásai alapján.


26 Csak a magyar és a bejegyzett hazai kisebbségek nyelvei.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 17 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 18 ►

1.12. sz. tábla


Az 1.2.5. fejezetben szereplő statisztikai táblákhoz kapcsolódó fontosabb
ismeretek
sorszám típus tudnivalók röviden
1.9. egyszerű Adatai sem függőleges, sem vízszintes irány-
ban nem összesíthetők.
Függőleges irányban négy állapot idősort,
vízszintes irányban pedig kilenc leíró sort
tartalmaz27.
1.10. csoportosító Adatai csak függőleges irányban összesíthe-
tők.28
Függőleges irányban hat minőségi sort, víz-
szintes irányban pedig kilenc állapot29 idősort
tartalmaz30.
1.11. kombinációs Adatai mind függőleges, mind vízszintes
irányban összeadhatók.
Függőleges irányban öt minőségi sort,
vízszintes irányban pedig tizenöt mennyiségi
sort tartalmaz.
A tábla utolsó sorának (= legalsó) és utolsó
oszlopának (= jobb szélső) találkozásában a
cella (= rovat) a főösszeg adatot
tartalmazza.31

27 A tábla minden adata két statisztikai sorhoz tartozik, így a táblát szokás kétdimenzi-
ósnak nevezni.
28 Az összesen rovat adatai az egyes évek teljes közút hálózatának hosszát adják meg.
29 Állapot idősor, mert az egyik évben már meglévő út benne van a következő évi út-
hosszban is.
30 A tábla adataiból részösszegek is képezhetők (autópálya + autóút = gyorsforgalmi út).
Ha ezeket a részösszegeket is kiszámítottuk volna, akkor további három állapot idősor-
hoz jutottunk volna.
31 Példák az összesen rovat adatainak jelentésére:
1.694.936 = 2001-ben Magyarországon egymillió-hatszázkilencvennégyezer-
kilencszázharminchat 14 éven aluli gyermek élt.
10.177.223 = 2001-ben Magyarországon tízmillió-százhetvenhétezer-
kettőszázhuszonhárom magyar nyelvet beszélő ember élt.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 18 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 19 ►

1.2.6. Statisztikai adatok ábrázolása


A statisztikai adatokat egyrészt szemléletesebbé tételük, másrészt elemzési
célokból is ábrázolni szoktuk. Az ábrázolás történhet a koordináta rend-
szerben és azon kívül32 is. Az alábbiakban csak az ábrázolás egyszerűbb
módozataira térünk ki röviden. A koordináta rendszer pozitív negyedében
készíthetünk
• pont-,
• vonal- és
• oszlopdiagramot,
ill. a sokaságok szerkezetét jól szemléltethetjük a koordináta rendszeren
kívül készített kör- vagy oszlopdiagrammal.

Magyarország népessége

10350
népesség (ezer fő)

10300
10250
10200
10150
10100
1994 1996 1998 2000 2002 2004 2006
évek

1. sz. ábra: Pontdiagram az 1.1. sz. tábla adatai alapján

32 Például egy ország jószág-állományának növekedése egyre nagyobb állatfigurákkal,


csökkenése pedig egyre kisebbekkel szemléltethető a statisztikához nem értők számára
igen érzékletesen.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 19 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 20 ►

Az élveszületések száma Magyarországon

élveszületések (fő) 120 000


100 000
80 000
60 000
40 000
20 000
0
1994 1996 1998 2000 2002 2004 2006
évek

2. sz. ábra: Vonaldiagram az 1.2. sz. tábla alapján

A gazdaságilag aktív népesség néhány európai


országban (2003)
aktív népesség (ezer fő)

30 000
25 000
20 000
15 000
10 000
5 000
0
Franciaország

Hollandia

Lengyelország

Magyarország
Ausztria

Csehország

Dánia

Finnország

Görögország

Írország

országok

3.sz. ábra: Oszlopdiagram az 1.3.sz. tábla alapján

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 20 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 21 ►

0%5%
14% 7%
szakiskola
2%
középiskola
15% középfokú iskola
általános iskola
18% óvoda +
iskola + kollégium
óvoda + iskola + kollégium
többcélú intézmény

39%
A magyarországi közoktatási intézmények az ellátott feladatok
típusa szerint (2003/2004 tanévben)

4.sz. ábra: Kördiagram az 1.6. sz. tábla alapján


Néhány fontos szabály az ábrák készítésével kapcsolatban:
• Állapot idősor esetén az adatokat mindig ahhoz az időponthoz vesz-
szük fel, amelyikhez az adat tartozik.
• Tartam idősor esetén az adatokat mindig két időpont közé, középen vesszük fel.
• Ha idősorok adataiból készítünk vonaldiagramot, akkor a vonal az első és
az utolsó időpont adatán túl nem hosszabbítható meg. (Arról ui. nincs infor-
mációnk, hogy a megfigyelés előtti utolsó időpont adata kisebb vagy nagyobb volt-e, mint
az első megfigyelt adat; ill. nem tudjuk, hogyan fog alakulni a vizsgált jelenség a jövőben.)
• Ha az állapot idősor adatai ábrázoljuk oszlopdiagrammal, akkor az
oszlopok nem érhetnek össze. (Az ábrázolt adatok összege nem értelmezhető,
így a területek összege sem.)
• Az oszlopdiagramok esetén az adattal az oszlopok területe arányos.
(Éppen ezért, ha egy mennyiségi (= gyakorisági) sor osztályközei nem azonos széles-
ségűek, akkor az ábrázolás előtt átalakításokat kell végeznünk. Hasonló probléma je-
lentkezik majd a módusz számításánál is.)
• A mennyiségi sorok adataiból készült vonaldiagram neve: gyakorisági
görbe (= gyakorisági poligon), az oszlopdiagram neve: hisztogram.
• Ha két különböző időpontra vonatkozóan készítünk kördiagramot
ugyanarról a sokaságról, akkor ábránk nemcsak a sokaság szerkezetét,
hanem a körök területének arányosításával az adatok relatív változását
is kifejezi. (Az új kör sugara = rúj =r régi * vd 33)

33A viszonyszámokat – minden ilyen és ehhez hasonló számításban – együtthatós formájuk-


ban használjuk. (A számítás képletében szereplő jelöléseket lásd a következő (2.1.) fejezetben.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 21 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 22 ►

1.3. Összefoglalás34
statisztika 1. tudomány a módszereket és az eljárásokat foglalja
össze
2. gyakorlati tevé- adatgyűjtés, rendszerezés, feldolgozás,
kenység elemzés
3. adathalmaz az összegyűjtött és rendszerezett adatok
összessége

sokaság a statisztikai vizsgálat tárgyát képező egyedek összessége


fajtái: álló – mozgó időpillanatra – időtartamra
diszkrét – folytonos jól megkülönböztethető elemek –
önkényes megkülönböztetés
egynemű – összetett nem bontható részsokaságokra –
felbontható részsokaságokra
véges – végtelen elemei megszámlálhatóak – elemei
nem megszámlálhatóak

sokasági egység a sokaság egy-egy eleme


fajtái 1. megfigyelési amire az adatgyűjtés vonatkozik
2. számbavételi akitől az adatot beszerezzük

ismérv azok a tulajdonságok, melyek alapján a statisztikai megfigyelés


tárgyát képező egységek egy halmazt alkotnak (közös ismérv)
ill. különböző sokaságokba oszthatók (megkülönböztető is-
mérv)

34 Ehhez a fejezethez önálló feladatokat nem állítottunk össze. A következő fejezetek


feladatiban azonban lesznek olyan kérdések, melyek ennek a témakörnek a tudását igény-
lik. (A fogalmak tisztázásának egyébként legfontosabb célja, hogy „egy nyelvet beszél-
jünk”.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 22 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 23 ►

fajtái 1. időbeli az adatok megkülönböztetése időpont-


ok szerint
2. területi az adatok megkülönböztetése földrajzi
területek szerint
3. mennyiségi az adatok a megfigyelési egységek nagy-
sága, mérete, kapacitása stb. szerint
4. minőségi az adatok megkülönböztetése a megfigyelési
egységek színe, neme stb. szerint
5. alternatív csak két ismérvváltozata van

ismérvváltozat az ismérvek lehetséges kimenetelei


példák 1. időbeli a hallgatók születési dátumai (évek)
2. területi a hallgatók születési helyei (városok)
3. mennyiségi a hallgatók születési súlya (gramm)
4. minőségi a hallgatók családi állapota (nős, nőtlen,
férjezett stb.)
5. alternatív férfi – nő v. kereső – eltartott stb.

statisztikai adat a megfigyelt sokaság egy-egy elemének a vizsgálat tárgyát


képező tulajdonságára vonatkozó aktuális értéke
fajtái 1. számszerű 1. abszolút adatgyűjtésből,
számításból;
van mértékegysége
2. relatív számításból;
előfordul, hogy nincs
mértékegysége
2. szöveges kódolhatjuk

adatgyűjtés az elemzéshez szükséges adatok „beszerzése”


fajtái 1. teljes körű a sokaság minden elemére ki-
terjed
2. részleges35 a sokaság nem minden elemére
terjed ki

35 Lásd: Becslés témakör

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 23 ►


Statisztika Bevezetés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 24 ►

az adatok hibája korlátozott pontosságúak


fajtái 1. adatgyűjtési hi- szubjektív emberi tényezők miatt
a keletkezés oka szerint bák
2. véletlen hibák a nem teljes körű megfigyelés
miatt
fajtái 1. abszolút hiba a= Á−A
a hiba jellege szerint 2. relatív hiba a
α=
A

statisztikai sorok a statisztikai adatok egyetlen tulajdonság (= ismérv) alapján


történő rendezése
fajtái 1. minőségi szavakkal megfogalmazható ismérvvál-
tartalmuk szerint tozatok alapján
2. mennyiségi számokkal megfogalmazható ismérvvál-
tozatok alapján
3. területi földrajzi megnevezések képezik az is-
mérvváltozatokat
4. időbeli dátumok képezik az ismérvváltozatokat
5. leíró egy-egy földrajzi, gazdasági stb. egységre
vonatkozóan különböző jellegű adato-
kat tartalmaz
fajtái 1. összehasonlító adatainak összege nem értelmez-
felhasználásuk szerint hető
2. csoportosító adatainak összege értelmezhető

statisztikai táblák a statisztikai adatok egyszerre több tulajdonság (= ismérv)


alapján történő rendezése
fajtái 1. egyszerű egyik irányban sem összegezhető
a bennük található összesen 2. csoportosító csak egyirányú összegzés lehetsé-
rovatok alapján ges
3. kombinációs kétirányú összegzés lehetséges

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 24 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 25 ►

2. Viszonyszámok
Az összegyűjtött és rendezett statisztikai adatok elemzésére az elméleti statisz-
tika igen sok módszert dolgozott ki. Ezek közül a legegyszerűbbek a viszony-
számok, melyeket két statisztikai adat hányadosaként állíthatunk elő. Leg-
ismertebb és leggyakrabban alkalmazott fajtáit az 2.1. sz. tábla foglalja össze.
2.1. sz. tábla
A viszonyszámok fajtái
típus meghatározás példa36
dinamikus Két különböző időpontra, 10.117
= 0,9787
időszakra vonatkozó adat 10.337
hányadosa. A magyar népesség 2004-es adatát
viszonyítottuk az 1995-ös adathoz.37
területi ösz- Két különböző földrajzi 3.876
= 0,9304
szehasonlító terület azonos jellegű adatá- 4.166
nak hányadosa. Ausztria gazdaságilag aktív népessé-
gének aránya a magyarországi adat-
hoz viszonyítva.38
megoszlási = relatív gyakoriság 2.079.130
= 0,9988
Az összegezhető statisztikai 2.081.559
sorok egyes részadatainak és A 60 éven felüli magyarul beszélő
a sor összesen adatának népesség aránya a teljes 60 éven
hányadosa. felüli népességhez viszonyítva.39

36 A viszonyszámok egyes típusaira felírt példáknál – egyelőre – az olvasók korábbi ma-


tematika ismereteire támaszkodunk.
37 Lásd: 1.8. sz. tábla.
38 Lásd: 1.10. sz. tábla.
39 Lásd: 1.18. sz. tábla

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 25 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 26 ►

A viszonyszámok fajtái (folytatás)


típus típus típus
intenzitási Két különböző jellegű, de egy- 3,96 millió fő
= 0,00005643
mással valamilyen kapcsolatban 70.233 km 2
álló statisztikai adat hányadosa Írország népsűrűsége 2004-ben.40

2.1. A dinamikus (= időbeli) viszonyszám

A dinamikus viszonyszámok az időben változó jelenségek elemzésére al-


kalmasak. Megmutatják, hogy kiválasztott időponthoz (= bázisviszony-
szám) vagy a felmérés idejét megelőző időponthoz (= láncviszonyszám)
képest a vizsgált sokaság adatai hányszorosára nőttek vagy hányadrészükre
csökkentek, illetve hány százalékkal változtak. A viszonyszámok képletei:

2.2. sz. tábla


Az időbeli (= dinamikus) viszonyszámok képletei:
I. II. III.
dinamikus viszonyszám bázisviszonyszám láncviszonyszám
y2 yi yi
vd = bi = li =
y1 yb yi −1
A képetekben szereplő betűk jelentése:
vd = bi = li = yi =
dinamikus vi- bázisviszonyszám láncviszonyszám a megfigyelt adat
szonyszám
i = 1,2,..., n n=
a megfigyelt időpontok (időszakok) a megfigyelések darabszáma
sorszáma
Az I. képletet (2.2. sz. tábla) akkor alkalmazzuk, ha megfigyeléseink mindössze
két időpontra vonatkoznak; a II. és III. képletet pedig akkor, ha megfigyelése-
ink hosszabb időszakot ölelnek át. Bázis adatnak általában az idősor első adatát

40 Lásd: 1.14. sz. tábla

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 26 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 27 ►

tekintjük, de vannak esetek, amikor ezt nem tehetjük meg41. Ha a kiszámított


arányszámok nullával kezdődnek, az a megfigyelt adat csökkenését jelenti; ha
eggyel vagy ennél nagyobb számmal, akkor a vizsgált jelenség növekedéséről
beszélhetünk. A dinamikus viszonyszámokat általában százalékban is megadjuk,
ez elsősorban a viszonyszámok jelentésének megfogalmazását könnyíti meg.

BEMUTATÓ FELADAT

2.3. sz. tábla (az 1.8. sz. tábla alapján)


Magyarország népessége ,
év 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
i 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
adat 10.17
10.337 10.321 10.301 10.280 10.253 10.222 10.200 10.142 10.117
(ezer fő) 5
bázis-vsz.
100,0 99,842 99,7 99,4 99,2 98,9 98,7 98,4 98,1 97,9
(%)
10.337 10.301
bi szá- 10.321 10.280
10.337 10.337 stb.
mítása 10. 337 10 .337

adat
10.337 10.321 10.301 10.280 10.253 10.222 10.200 10.175 10.142 10.117
(ezer fő)
lánc-vsz.
– 99,8 99,8 99,8 99,7 99,7 99,8 99,8 99,7 99,8
(%)
10.301 10.280
li szá- 10.321
– 10.321 10.301 stb.
mítása 10.337

A kiszámított viszonyszámok jelentését többféleképpen is megfogalmazhatjuk43, íme:


b6 = 98,9%

41 Például, a legutóbbi (2001) népszámlálás szerinti magyar népesség létszámadatát nem


hasonlíthatjuk egy az I. világháborút megelőző népszámlálási adathoz, hiszen a két idő-
pont között jelentősen csökkent hazánk területe. (Áthidaló megoldás: a korábbi nép-
számlálások alapadataiból meghatározható a mai területre vonatkozó lakosság.)
42 Az osztás eredményét – 10.321/10.337 = 0,998452162 (= együtthatós forma) – kerekí-
tettük, majd beszoroztuk százzal, így kaptuk meg a viszonyszámot. (A százzal való szor-
zást a statisztika könyvekben nem szokás feltüntetni.)
43 Természetesen nincs szükség mindig mind a három megfogalmazásra. A feltett
kérdést vagy a feladat utasítását kell figyelni, és annak megfelelően fogalmazni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 27 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 28 ►

♥ 2000-ben Magyarország népessége az 1995-ös népesség kilencszáz-


nyolcvankilenc ezred része volt.
♥2000-ben Magyarország népessége az 1995-ös népesség 98,9 %-a
volt.
♥ 2000-ben Magyarország népessége 1,1 %-kal kevesebb volt, mint
1995-ben
Fontos tudnunk, hogy:
• A dinamikus viszonyszámok típusai között matematikai összefüggés
van, ezt ismerve az alapadatok hiányában is ki tudjuk számítani a bá-
zisviszonyszámokból a láncviszonyszámokat és fordítva; illetve a már
ismert bázisviszonyszámokat felhasználva is lehetőségünk van új bá-
zisra áttérni.

2.4. tábla
Összefüggések:
k
= a k-adik bázisviszonyszám kiszámítható az
bk = Π li
i =1 első k láncviszonyszám szorzataként, ill.,
= a k-adik láncviszonyszám kiszámítható a k-
b adik és a (k-1)-edik bázisviszonyszám hánya-
lk = k
bk −1 dosaként.

brégi ,k
búj ,k = = áttérés új bázisra
brégi , amit bázisul választottunk

• A dinamikus viszonyszámok nemcsak megfigyelt adatokból, hanem


más viszonyszám típusok adataiból is számíthatók.44
• Az idősorok adataiból nemcsak azok relatív változását, hanem abszo-
lút változását is kiszámíthatjuk:
d i = y i − y i −1 ⇒ például: d 9 = 10117 − 10142 = −25 ezer fő
♥ Magyarország lakossága 2003-ról 2004-re 25 ezer fővel csökkent.

44 Erre a további viszonyszám-típusok tárgyalása után visszatérünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 28 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 29 ►

A képletben szereplő betűk jelentése:


di yi i = 1,2,..., n
abszolút válto- a megfigyelt a megfigyelt időpontok (időszakok) sorszá-
zás adat ma

2.2. A területi viszonyszám

Két különböző földrajzi terület azonos jellegű adatának hányadosa a terü-


leti viszonyszám.

Ezzel a viszonyszámtípussal elemezhetjük például a gazdaságilag aktív


népességre vonatkozó, különböző európai országokból összegyűjtött ada-
tainkat. Külön képlete nincs, a bázisviszonyszám képletét szoktuk érte-
lemszerűen45 alkalmazni. A viszonyítási alap kiválasztásakor a számítással
megválaszolandó kérdésre kell figyelni, illetve vannak esetek, amikor kerü-
lendő az olyan területi egység bázisul választása, melynek adata szélsősé-
ges46 az összehasonlítandó területi egységek sokaságában. További gondot
okoz a területi összehasonlítás során az aggregátumok (pl.: egy ország teljes
termelési értéke) összehasonlítása ill. az adatok eltérő pénz-mértékegysége47.

45 Értelemszerűen = i ebben az esetben nem az egyes évek sorszáma, hanem a különbö-


ző földrajzi területek (országok, megyék, városok stb.) sorszáma.
46 Szélsőséges, azaz kiugróan magas vagy alacsony adatot figyeltünk meg. Számpéldánk-
ban ilyen kiugróan magas adatot találunk Franciaország ill. Lengyelország mellett. (Lét-
számadataik egy nagyságrenddel nagyobbak a többi ország létszámadatánál.)
47 Erre a kérdésre a későbbiekben még visszatérünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 29 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 30 ►

BEMUTATÓ FELADAT

2.5. sz. tábla


időbeli
élveszületési területi össze-
össze-
arány hasonlítás
hasonlí-
(ezrelék) (%)
tás
ország i számítás
változás 1970 2003
1970 2003 (%)
vint(1) vint( 2 ) Magyarország =
1970 =
100 %
100 %
Románia 1 21,1 9,6 -54,5 143,5 103,2
Portugália 2 20,8 10,8 -48,1 141,5 116,1

Szlovákia 3 17,7 9,6 -45,8 120,4 103,2
(9,6/21,1)*100-
Lengyelor- 100
4 16,8 9,2 -45,2 114,3 98,9
szág
Lettország 5 16,8 8,8 -47,6 114,3 94,6
Norvégia 6 16,748 12,0 -28,1 113,6 129,0
Olaszország 7 16,7 9,4 -43,7 113,6 101,1
Magyar- →
8 14,749 9,3 -36,7 (16,7/14,7)*100 100,0 100,0
ország
Német-
9 13,4 8,6 -35,8 91,2 92,5
ország
adatforrás: Demográfiai évkönyv, 2003 (KSH, 2004; 110.old.)
élveszületési arány = születések ezer lakosra vetítve (= intenzitási viszonyszám, lásd:
2.4. fejezet)

A színes háttérrel jelzett adatok jelentése:


vint( 2.1)
vd1 = 50
vint(1.1)

48 Kéttizedes pontossággal (az összefüggések bemutatása érdekében) = 16,67.


49 Kéttizedes pontossággal (az összefüggések bemutatása érdekében) = 14,74.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 30 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 31 ►

♥ -54,5 % : 2003-ban Romániában 1000 lakosra vetítve 54,5 %-kal


kevesebb gyermek született, mint 1970-ben;
A1.8 A
vint(1) = , ill. vint( 2) = 2.8
B1.8 B2.8

♥ 14,7 ill. 9,3 ezrelék: Magyarországon 1970-ben 1000 lakosra 13,4,


2003-ban pedig 8,6 élveszületés jutott.
vint(1.6) vint( 2.6)
vterületi (16 ) = ill. vterületi ( 26 ) =
vint(1.8) vint( 2.8)

♥113,6% ill. 129,0% : Norvégiában 1970-ben 13,6 %-kal, 2003-ban


pedig 29,0%-kal magasabb volt az élveszületési arány, mint hazánkban.
Vizsgáljuk meg, mi bújik meg az eltérő élveszületési arányszámok, ill. azok
eltérő változása mögött! Ehhez a 2.4. sz. táblában szereplő adatokra is
szükségünk van.
2.6. sz. tábla
élveszületések (fő) lakosság (millió fő)
ország
1970 2003 1907 = 100 % 1970 2003 1907 = 100 %
Norvégia 64.551 54.720 84,77 3,87 4,56 117,53
Magyarország 151.819 94.647 63,34 10,30 10,14 98,26

Hasonlítsuk össze Norvégia és Magyarország (= 100%) élveszületési


arányszámát51! Ne egyszerűen a 2.5. sz. táblában szereplő adatokkal dol-
gozzunk, hanem tüntessük fel azokat az adatokat is, melyekből az össze-
hasonlítandó intenzitási viszonyszámokat kiszámítottuk! Majd végezzük el
a lehetséges matematikai átalakításokat! Végül a számadatokat helyettesít-
sük – az általánosítás érdekében – betűjeleikkel!

50 A futó index első száma jelzi, hogy a bázis (1) vagy a tárgyidőszak (2) adatát, a második
szám pedig az ország sorszámát.
51 Hasonló levezetést végezhetünk az időbeli viszonyszámok alapján is. A következtetés
tökéletesen ugyanaz lesz. (A 2.8. sz. tábla adatait felhasználva próbálja meg!)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 31 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 32 ►

Összehasonlítás a számokkal:
vint(16) 64.551
16,67 3.870 = 64.551 * 10.300 = 64.551 : 3.870 = 0,4252 ≅ 113%
vterületi = = ≅
vint(18) 14,74 151.819 3.870 151.819 151.819 10.300 0,3757
10.300

Összehasonlítás a betűjelekkel:
Ai
v int(16 ) Bi Ai B j Ai Bi
v területi ( az intenzitási viszonyszámra = = = * = : = v területi ( A− ra ) : v területi ( B − re )
v int(18) Aj Bi A j A j B j
Bj

Szövegesen megfogalmazva:

Két viszonyszám hányadosa egyenlő a viszonyszámok számlálójában sze-


replő adatok arányának és a viszonyszámok nevezőjében szereplő adatok
arányának52 hányadosával.

2.3. A megoszlási viszonyszám

A megoszlási viszonyszámok a sokaságok szerkezetének bemutatására


szolgálnak. Kifejezik azt, hogy a teljes sokaság hányad részét, hány szá-
zalékát képviselik az egyes részsokaságokba (= az egyes ismérvváltozatokhoz) tar-
tozó elemek.

2.7. sz. tábla


A megoszlási viszonyszám képlete:
relatív gyakoriság53 megoszlási viszonyszám
fi fi
mennyiségi sorokból gi = =
n ∑f i wi = g i *100 (%)
yi
egyéb összeadható sorokból gi =
∑ yi

52 A megfogalmazásban szereplő mindkét arány szó helyett írhattuk volna: hányadosának


53 A megoszlási viszonyszám együtthatós formája.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 32 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 33 ►

A képletekben szereplő betűk jelentése:


wi = fi = yi =
gi =
megoszlási vi- megfigyelt előfor- a megfigyelt
relatív gyakoriság
szonyszám dulások adatok
n = ∑ fi
i = 1,2,..., n
a megfigyelések darab- a megfigyelt ismérvváltozatok sorszáma
száma

Tekintettel arra, hogy az egyes részsokaságok elemeinek száma mindig


kisebb, mint a teljes sokaság elemeinek darabszáma ( f i 〈 n ) 54, a relatív gya-
koriságok mindegyikére igaz, hogy g i 〈1 , illetve ha valamennyi részsoka-
ságra kiszámítjuk a relatív gyakoriságokat, akkor fennáll a következő ösz-
szefüggés: ∑ g i = 1 55. Ha a kiszámított viszonyszámokat százalékos for-
mában adjuk meg, akkor a megismert összefüggések így írhatók fel:
wi 〈100 % és ∑ wi = 100 % .

Korábbi adatainkat felhasználva számoljunk ki néhány relatív gyakoriságot


(megoszlási viszonyszámot), és fogalmazzuk meg jelentésüket!

54 És y i 〈 ∑y i .
55 Ezt az összefüggést a későbbiekben, például az átlagok esetében, a számítások egysze-
rűsítésére fogjuk használni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 33 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 34 ►

BEMUTATÓ FELADAT

2.8. sz. tábla


Magyarország56 férfi
relatív megoszlási
lakossága életkor szerint
gyakoriság viszonyszám
2004. jan. 1.
számítása
lakosok gi
wi
korév (fő) mértékegysége
fi (%)
nincs
47.936
0 47.936 0,009978 1,00
4.804.113
49.156
1 49.156 0,010232 1,02
4.804.113
49.570
2 49.570 0,010318 1,03
4.804.113
49.881
3 49.881 0,010383 1,04
4.804.113
4 47.949 0,009981 1,00
……57 …… …… ……
85 4.314 0,000898 stb. 0,09
86 3.731 0,000777 0,08
87 3.214 0,000669 0,67
….. …… …… ……
összesen 4.804.113 1 1 100

g i = 0,010383 ≅ 0,01 ⇒ wi = 1,04%

♥ 2004-ben a magyarországi férfi lakosság egyszázad része, azaz egy


egész négyszázad százaléka volt hároméves.

56 Lásd: 1.11. sz. tábla.


57 A tábla egyes rovataiban pontokkal jeleztük, hogy nem minden korévet tüntettünk fel,
így természetesen a kiszámított viszonyszámok összege szemmel láthatóan nem adja ki az
egyet, ill. a száz százalékot.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 34 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 35 ►

2.4. Az intenzitási viszonyszám

Az intenzitási viszonyszámok két egymással összefüggésben lévő


sokaságot vizsgálva kifejezik, hogy az egyik sokaság egy elemére a másik
sokaság elemeiből hány egység jut.

Például:
• egy ország egy területi egységére (km 2 ) jutó lakosok (ezer fő ) száma,
• az egy házi orvosra ( fő ) jutó lakosok ( fő ) száma,
• a szülőképeskorú nőkre (ezer fő ) jutó újszülöttek ( fő ) száma,
• az egységnyi termékre (darab, liter, tonna , stb.) jutó termelési költség (Ft ) .
Tankönyvünk előző oldalain már találkoztak is ezzel a viszonyszámtípussal,
így 1.7. sz. tábla Írországra vonatkozó adatai között szerepelt az 1 főre jutó
GDP, továbbá az 1.9. sz. tábla 3. és 4. oszlopában a terhességmegszakítás
száz élveszületésre, illetve a teljes termékenységi arány.
Az intenzitási viszonyszámoknak több fajtáját szokás megkülönböztetni.
2.9. sz. tábla
Az intenzitási viszonyszámok fajtái
típus példa
Egy vállalkozás termelési értékét (= A) a vállalkozás összes dolgozójá-
nyers nak létszámához (= B) viszonyítjuk = egy dolgozóra jutó termelési
érték (Vnyers = A/B)
Egy vállalkozás termelési értékét (= A) a vállalkozás fizikai dolgozói-
tisztított nak létszámához viszonyítjuk (= b) = az egy fizikai dolgozóra jutó
termelési érték (= Vtisztított = A / b)
Egy vállalkozás termelési értékét (= A) a vállalkozás összes dolgozójá-
egyenes nak létszámához (= B) viszonyítjuk = egy dolgozóra jutó termelési
érték ( = Vnyers = A/B)
Egy vállalkozás összes dolgozójának létszámát (= B) viszonyítjuk a
fordított vállalkozás termelési értékéhez (= A) = az egy (ezer) forintnyi termelési
érték előállításához szükséges dolgozó létszám (= V = B / A).

Példáinkból jól látható, hogy a nyers és a tisztított intenzitási viszony-


szám csak nevezőjében különbözik. A tisztított viszonyszám nevezőjében

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 35 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 36 ►

a nyers viszonyszám nevezőjének (= B) egy részhalmaza (= részsokasága


= b) szerepel; olyan részsokasága, amelyikkel a számlálóban szereplő adat-
nak szorosabb kapcsolata, mint az egész sokasággal.
Az egyenes és a fordított intenzitási viszonyszám egymás reciprokai.
Egyenesnek tekintjük azt az intenzitási viszonyszámot, melynek növeke-
dése kedvező, fordítottnak pedig azt, amelyiknek növekedése kedvezőtlen
jelenség.
Elsősorban a régebbi tankönyvek az itt közölt elhatárolás mellett egy másik szem-
pontot is megadnak. Egyenesnek tekintik azt az intenzitási viszonyszámot, amelyiket a
mindennapi életben rendszeresen használunk (pl.: az egy hektárra jutó búzatermés, az egy
lakosra jutó GDP, az egy dolgozóra jutó termelési érték stb.), fordítottnak pedig ezek
reciprokait, melyek a mindennapi ember számára kissé furcsának hatnak.
Ha egy dolgozóra egyre nagyobb termelési érték jut, – feltéve, hogy ez nemcsak az
árak növekedésének következménye, – az kedvező; ez ugyanis azt jelenti, hogy a dolgo-
zók nagyobb intenzitással végezték munkájukat.
Ha egy (ezer, millió) forintnyi termelési érték előállításához egyre több dolgozóra van
szükség, akkor az azt jelenti, hogy a dolgozók csökkenő intenzitással végezték munkáju-
kat, és ennek következtében növekszik a termékek önköltsége.
Természetesen vannak olyan intenzitási viszonyszámok, melyek esetében azt a kér-
dést is fel kell tennünk, hogy kinek a szempontjából mondjuk ki, hogy kedvező, avagy
kedvezőtlen egy jelenség. Pl.: egy orvosra egyre több beteg jut, ez az orvosnak anyagilag
kedvező, ugyanis több beteg után kapja meg az egészségbiztosítótól az un. kártya-pénzt; a
betegeknek viszont kedvezőtlen, mert kevesebb időt tud rájuk fordítani orvosuk.

2.10. tábla
Az intenzitási viszonyszámok képletei és azok összefüggései
nyers tisztított egyenes fordított
A A A B
Vny = Vt = Ve = Vf =
B b B A
összefüggések58
A b Ve *V f = 1
Vnyers = * = Vt * g
b B

58 Az összefüggések ismerete egyes esetekben megkönnyítheti számítási munkánkat, ill.


ellenőrzésre is lehetősége ad.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 36 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 37 ►

BEMUTATÓ FELADATOK

2.11 .sz. tábla


népsűrűség-számítás
terület népesség népsűrűség
ország
ezer km2 millió fő fő / km2 számítás
Magyarország 93 10,13 109 (10,13 / 93)*1000
Németország 357 82,54 231 (82,54 / 357)*1000
adatforrás: Magyar statisztikai évkönyv 2003 (KSH 2004, 549. old. Terület – népesség –
főváros)

2.12. sz. tábla


telekommunikáció, 2003
telefon fővo- mobil tele- telefon mobil
népesség59
ország nal fon fővonalak telefon
millió fő darab / ezer fő ezer db
Ma- 3.656.930 6.847.880
gyaror- 10,13 361 676 = =
szág 361*10.130 676*10.130
Né- 29.796.940 64.793.900
metor- 82,54 659 785 = =
szág 659*82.540 785*82.540
adatforrás: Magyar statisztikai évkönyv 2003 (KSH 2004, 549. old. Terület – népesség –
főváros ill. 574. old. Telekommunikáció)

A 2.11. sz. és a 2.12. sz. táblák kiemelt adatainak jelentése:

Ve = 109 fő
km 2
♥ Magyarországon egy négyzetkilométernyi területen átlagosan 109
ember él.

59 Évközepi népesség.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 37 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 38 ►

Ve = 659 db
ezer fő

♥ Németországban ezer lakosra 659 telefon fővonal jut, azaz egy la-
kosra 0,659 fővonal jut.
Az intenzitási viszonyszámokból további viszonyszámok60 számítha-
tók, ill. ha az ismert viszonyszám számításának csak egyik tényezőjére vo-
natkozóan rendelkezünk adattal, kiszámíthatjuk a másik tényezőt61 is.

2.5. Gyakorló feladatok

1. feladat

Válogassa ki az alábbi adatok közül a viszonyszámokat és állapítsa meg


azok típusát!
Számadatok:
Palau Köztársaság területe: 508 km2
Palau Köztársaságban a maldív lakosság: 96 %
Palau Köztársaságban a GDP: 5000 USD/fő
Palau Köztársaságban a gazdasági növekedés: 1,1 %
Palau Köztársaságban a képviselőház: 16 tagú
Katar adóssága:9907,2 millió USD
Oroszország népsűrűsége: 8.5 fő / km2
France Albert Renét, a Seychelle-szigetek államfőjét 1977-ben iktatták be hivata-
lába.

60 Például a 2.12. sz. tábla adatai alapján:


v Mo 676
= = 0,861146496 ⇒ 86,1% ⇒ −13,9% , azaz 1000 magyar lakosra 13,9 %-kal keve-
v No 785
sebb mobil telefon jut, mint 1000 német lakosra, azaz a lakosság mobiltelefonnal való
ellátottsága hazánkban rosszabb. (Még nagyobb a lemaradásunk a telefon fővonalak
tekintetében. Az előzővel azonos módon elvégzett számítás eredménye: -45,2 %.)
61 Ezt tettük akkor is, amikor meghatároztuk az 2.12. sz. tábla utolsó két oszlopának
adatait, tekintettel arra, hogy az adatforrásul szolgáló Statisztikai Évkönyv csak a „népes-
ség” és a „telefonfővonal, ill. mobil telefon ezer lakosra” adatokat közölte.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 38 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 39 ►

2. feladat

1. Állapítsa meg, hogy az alábbi statisztikai adatok, milyen viszony-


számokkal elemezhetők!
2. Végezze el az elemzést!
3. A kiszámított adatok jelentését fogalmazza meg!
4. Soroljon föl minden olyan információt, amit – az 1. fejezetben közölt
ismeretek alapján – a feladathoz közölt statisztikai táblákról, a bennük
szereplő statisztikai sorokról, ill. adatokról fel tud sorolni.
statisztikai adatok
A Balaton-part kereskedelemi szálláshelyeinek száma (db)
1993 1994 1995 1996 1997
4.396 3.080 3.208 2.600 1.958

Egy vállalkozás tevékenységeire vonatkozó adatok:


megnevezés 1997 1998
termelési érték (millió Ft) 900 825
foglalkoztatottak száma (fő) 180 150
fizikai foglalkoztatottak száma (fő) 120 105

A munkanélküliek száma iskolai végzettségük alapján (ezer fő):


iskolai végzettség 1997 1998
8 általánosnál kevesebb 15,4 14,0
áltanos iskola 127,4 108,2
szakmunkásképző 124,8 107,6
gimnázium 30,4 30,6
szakközépiskola 40,9 40,9
főiskola 7,0 7,9
egyetem 2,9 3,8
összesen 348,8 313,0

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 39 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 40 ►

3. feladat

A következő megfogalmazások, statisztikai adatok és viszonyszámok alap-


ján írja fel az alábbiakban megfogalmazott viszonyszám számítását!
Pl.: egy vállalat termelése 2003-ban 5 milliárd Ft, ez a következő évre 10
1,1 * 5
%-kal nőtt. Megoldás: 1,1 =
5

Figyelem, egyes esetekben több viszonyszám is számítható.


megfogalmazások:
A 20 – 24 év közötti magyar lakosság (726.714 fő) 51,2 %-a férfi.
A magyar népesség 1985-ről (5.591 ezer fő) 1992-re megközelítőleg 7 %-kal csök-
kent.
A kilencvenes években Magyarországon egy orvosra (41.397 fő) 248,3 fő lakos
jutott.

4. feladat

Egy bank értékpapír-állománya (milliárd Ft) / év eleji adatok /


év 1997 1998 1999 2000 2001 2002 2003 2004 2005
adat 510,7 575,0 625,4 641,8 720,2 905,0 1.240,0 1.461,0 1.840,0

1. Számolja ki az állomány változását jellemző viszonyszámokat!


Figyelem! A zsebszámológépeknek általában van „állandó osztó
vagy állandó szorzó” funkciójuk. Használja ki !
2. A 2002-es évre mutassa be a kiszámított viszonyszámok közötti ösz-
szefüggést!
3. Fogalmazza meg a 2000 évi adatok jelentését!
4. Állapítsa meg, hogy a közölt adatok milyen jellegűek, ill. milyen sta-
tisztikai sor elemeit képezik!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 40 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 41 ►

5. feladat

Egy vállalkozás dolgozóit arról kérdezték naponta mennyi időt vesz


igénybe a munkahelyre utazásuk ill. a hazafelé út. A válaszokat az alábbi
táblába rendezték:
utazási idő a dolgozók száma
perc / nap fő
- 10 20
10 – 20 30
20 – 30 40
30 – 50 50
50 - 10
összesen 150
1. Számolja ki a dolgozók utazási idő szerinti megoszlását kifejező vi-
szonyszámokat!
2. Fogalmazza meg egy-egy adat jelentését!
3. Írja fel a kiszámított viszonyszámokkal kapcsolatos összefüggéseket
statisztikai jelekkel!
4. Állapítsa meg, hogy a közölt adatok milyen jellegűek, ill. milyen sta-
tisztikai sor elemeit képezik!

6. feladat

Egy szállítási vállalat gépjárműállományának megoszlása:


életkor állomány megoszlás (%) változás (%)
2000. I.
év 2003. I.1. 2000. I.1. 2003. I.1. állomány szerkezet
1.
stat. jel.:
-2 70 50
2–4 60 60
4–6 40 45
6–8 30 30
8 –10 50 15
összesen 250 200

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 41 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 42 ►

1. Számítsa ki a gépjárműállomány életkor szerinti megoszlását kifejező


viszonyszámokat mindkét esztendő adatai alapján!
2. Számítsa ki a különböző életkorú gépkocsik darabszámának változá-
sát, továbbá az életkor szerinti megoszlás változását!
3. Fogalmazza meg a vastagon bekeretezett adatok jelentését!
4. Mutassa ki a változásokat kifejező viszonyszámok közti összefüggést
a 4 – 6 éves gépkocsik esetében!
5. Ha helyesen dolgozott a „változások” egyik oszlopában nem állhat
adat az összesen rovatban. Indokolja meg, miért!
6. Állapítsa meg, hogy a közölt adatok milyen jellegűek, ill. milyen sta-
tisztikai sor elemeit képezik!

7. feladat

A hangversenyek és a hangverseny-látogatók számának alakulása egy vá-


rosban:
év előadások látogatók az egy elő- változások (%)
adásra az egy
db ezer fő előadások látogatók
jutó….. …
1999 991 452,2
2000 1014 437,5
2001 723 314,3
2002 547 210,7
2003 616 221,1

1. Számolja ki – minden évre – az egy előadásra jutó hallgatók számát!


2. Számolja ki a megadott és az Ön által kiszámított adatok időbeli vál-
tozását! (Csak a bázis viszonyszámokat kell meghatároznia.)
3. Fogalmazza meg a vastagon bekeretezett cellákban található adatok
jelentését!
4. Mutassa ki a 2000 évi adatokra vonatkozóan az összefüggést!
5. Döntse el, kiegészíthetjük-e a feladat tábláját összesen sorral! Dönté-
sét indokolja!
6. Állapítsa meg, hogy a közölt és a kiszámítandó adatok milyen jellegű-
ek, ill. milyen statisztikai sor elemeit képezik!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 42 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 43 ►

2.6. Összefoglalás
viszonyszám = két statisztikai adat hányadosa
fajtái: 1. dinamikus
2. területi összehasonlító
3. megoszlási
4. intenzitási

dinamikus viszony- = két időpontra / időszakra / vonatkozó adat hányado-


szám sa

fajtái 1. bázis az összehasonlítás alapja yi


állandó bi =
yb
2. lánc az összehasonlítás alapja yi
változó li =
y i −1

megoszlási viszony- = a sokaság egy részadatának és összesen adatának hányado-


szám sa, a sokaság szerkezetének vizsgálatára alkalmas
formái relatív gyakoriság gyakorisági f
sorból: gi = i
∑f i

tartam idő- yi
sorból: gi =
∑ yi
megoszlási viszonyszám (%) wi = g i *100(%)

összefüggések
∑g i =1 ∑w i = 100%
különbségük %-pont

intenzitási viszonyszám = két egymással összefüggésben lévő sokaság adatainak


hányadosa
fajtái 1. egyenes – fordí- A B
tott V= V=
B A
2. nyers – tisztított A A
V= V=
B b

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 43 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 44 ►

mértékegysége kétdimenziós = a megfigyelt adatok mértékegység-


ének hányadosa
összefüggések A B A A b
* =1 = *
B A B b B
előretekintés az intenzitási viszonyszám „rokonságot” mutat a
számtani átlaggal

2.7. Mintapéldák korábbi vizsgadolgozatokból62

1. minta

Töltse ki az üres rovatokat!


a vállalkozások száma
év évenkénti évenkénti
1988 előző év
ezer db abszolút relatív
= 100 % = 100 %
változás változás
statisztikai jel ⇒
1988 291,0
1989 110,2
1990 135,2
1991 129,8
1992 606,2
1993 236,7
1994 778,0
1995 93,8
1996 745,2
1997 659,7
1998 222,9

62 A dolgozat írásakor természetesen egy-egy kitöltendő rovat – a bele kerülő adatnak,


szövegnek megfelelően – nagyobb terjedelmű. (Ez a megjegyzés minden további minta-
példa esetén igaz.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 44 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 45 ►

2. minta

Nevezze meg az alábbiakban felsorolt viszonyszámok fajtáját!


a viszony-
1. megfogalmazások
szám típusa
Az egy főre jutó GDP Magyarországon 1998-ben 4.694
2.
USD volt, ami az előző évinél 5,1 %-kal volt több.
Az építőiparban a 100 fizikai foglalkoztatottra jutó szellemi
3. foglalkozásúak száma 29 fő, a fizikaiak aránya 77,4 % volt
1998-ban.
4. 1998-ban az 1000 lakosra jutó születések száma 9,6 volt.
A felsőoktatásban egy oktatóra 12,1 hallgató jutott 1998-
5.
ban.
A PSzF-en 19998-ban oklevelet szerzett hallgatók 61,9 %-a
6.
nő volt.
Budapest népessége 1990-ről 1999-re (jan.1.) 8,8 %-kal
7.
csökkent.
1998-ban az egy főre jutó évi átlagos gyümölcsfogyasztás
8.
62,6 kg volt.

3. minta

Az orvosi ellátottság néhány adata (december 31-i állapotok) /adatforrás:


KSH/
1980 2002
megnevezés statisztikai
adat adat statisztikai jel.
jel.
népesség (ezer fő) 10.705 10.175
az orvosok száma (fő) 30.842 37.295
a háziorvosok száma (fő) 5.092 5.125

1. Számítsa ki az eredmény-táblában megnevezett viszonyszámokat!


2. A 2002-re vonatkozó adatok jelentését fogalmazza meg!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 45 ►


Statisztika Viszonyszámok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 46 ►

(A kiszámított adatokat és azok megnevezését az eredmény-táblában kell rögzíteni.)


eredmény-tábla
az orvos-ellátottsági adatok alapján megne- eredmény
számítható viszonyszámok vezés 1980 2002
1 orvosra jutó lakos
1 háziorvosra jutó lakos
az ezer lakosra jutó orvos
az ezer lakosra jutó háziorvos
a népesség változása
az orvosok számának változása
a háziorvosok számának változása
az 1 orvosra jutó lakosok számának
változása
az 1 háziorvosra jutó lakosok számának
változása
az ezer lakosra jutó orvosok számának
változása
az ezer lakosra jutó háziorvosok szá-
mának változása

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 46 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 47 ►

3. Középértékek

3.1. A középértékek fogalma


A statisztikai elemzések eredményeit felhasználó különböző szakemberek
igen gyakran igénylik, hogy a vizsgált sokaságokat egyetlen adattal jelle-
mezzük, erre teremt lehetőséget a különböző fajtájú középértékek számí-
tása. Ezek, ahogy a név is sugallja, a sokaságok elemei között középső
helyet63 foglalnak el, és ez teszi alkalmassá a számítás eredményeként
kapott adatokat arra, hogy a fenti követelménynek megfeleljenek.
A középértékeket két nagy csoportra oszthatjuk:
• számított és
• helyzeti középértékek.
A számított középértékek alapvető tulajdonsága, hogy nagyságukat az
összes rendelkezésre álló adat befolyásolja. A statisztika elmélet többféle
változatukat különbözteti meg, ezek:
• számtani (aritmetikai),
• mértani (geometriai),
• négyzetes (kvadratikus =quadratikus)
• harmonikus.
A helyzeti középértékek esetében azok elhelyezkedési rendje játszik
döntő szerepet, éppen ezért nagyságukat nem az összes rendelkezésre álló
adat befolyásolja. Speciális helyük következtében értékük ábra64 segítségé-
vel határozható meg. Változataik:
• módusz,
• medián.

63 [ ]
Minden átlagra, minden feladatra, mindig igaz, hogy xmin 〈 x 〈 xmax .
64Az ábra képletté konvertálható, a gyakorlatban ezt használják, mi is ezt adjuk meg, ezt
használjuk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 47 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 48 ►

3.2. A számtani átlag

A számtani (aritmetikai) átlag az a szám, melyet az átlagolandó értékek


helyébe írva azok összege nem változik.

Ebből a definícióból vezethető le a számtani átlag képlete:


n

n ∑x i

∑ xi = nxa ⇒ xa =
i =1
i =1
n
65

A képletben szereplő betűk jelentése:

xi = xa=
n= i=
a megfigyelt ele- az elemek sorszá-
átlagolandó érték, számtani átlag mek száma ma (1-től n-ig)

Abban az esetben, ha a sokaság több elemének azonos a számértéke, lehe-


tőségünk van a számítások egyszerűsítésére. Ez azonban az azonos szám-
értékű (= ismérvváltozatú) elemek előzetes összerendezését követeli meg.
Így a képlet a következőképpen módosul:
m

∑f x i i m
xa = és x a = ∑ g i xi
i =1 66
k

∑f
i =1
i
i =1

65 Azt a számtani átlagot, amelyiket ezzel a képlettel számítottunk ki egyszerű számtani


átlagnak szokás nevezni.
66 Azt a számtani átlagot, amelyiket ezzel a képlettel számítottunk ki súlyozott számtani
átlagnak szokás nevezni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 48 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 49 ►

A képletekben szereplő betűk jelentése:


m=
xi = xa= a különböző átlagolandó
átlagolandó érték, számtani átlag értékek (= az ismérvérté-
kek) darabszáma
fi = i=
m

az azonos ismérvértékű
az azonos ismérvértékű
csoportok sorszáma (1-től
összefüggés: ∑f
i =1
i =n
elemek száma m-ig)
g i = az azonos ismérv-értékű elemek relatív gyakorisága
Számtani átlagot akkor szokás számítani, ha
• az átlagolandó értékek összegének értelme (= jelentése) van,
• más számított középérték használata nem indokolt67.
A számtani átlag több fontos tulajdonsággal68 rendelkezik, ezek ismerete
lehetővé teszi számításaink egyszerűsítését69, eredményeink gyors (= ráné-
zéses70) ellenőrzését, illetve újabb statisztikai módszerek kidolgozását71. A
tulajdonságok közül itt és most egyet emelünk ki: a számtani átlag min-
dig az átlagolandó értékek intervallumán belül helyezkedik el.
A számtani átlag nagysága az átlagolandó értékek abszolút nagy-
ságától és a súlyok relatív nagyságától, azaz egymáshoz viszonyított
arányától függ. Az átlag minden esetben annak az átlagolandó értéknek a
közelében helyezkedik el, amelyiknek a legnagyobb a relatív (= g i ) súlya.
Nagyobb számértékű átlagolandó értékek nagyobb számértékű átlagot eredményeznek
(és fordítva). Átlagolja a következő adatokat: 2, 4, 6 (átlag = 4); majd 3, 5, 7 (átlag = 5)!
Átlagolja a következő adatokat: 2, 4, 6 először 3, 5, 7, majd 6, 10, 14 és végül 4, 8, 9
súlyokkal! Figyelje meg az átlagokat (4,53 – 4,53 – 4,48), vonjon le következtetéseket!

67 Így például, az iskolai bizonyítványok átlagát is számtani átlagként határozzuk meg, pedig
az érdemjegyek összegének nincs értelme. (Természetesen sem szorzatuknak, sem négyze-
tüknek és reciprokuknak sem, így a többi ismertetett átlag-típus számítása sem indokolt.)
68 Részletesen lásd: – többek között – dr Köves P. – dr Párniczky G.: Általános c. tankönyvében.
69 Pl.: az összetett sokaságok átlaga a részsokaságok átlagaként is, – tehát nemcsak az
egyedi átlagolandó értékekből, – is meghatározható. (Lásd: vegyes kapcsolat.)
70 Ne fogadjon el olyan eredményt, amelyik az átlag az átlagolandó értékek intervallumán
kívül esik. Számításait azonnal kezdje újra!
71 Az un. négyzetes minimum tulajdonságot használható fel a trend- és a regresszió-
egyenletek illesztésekor.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 49 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 50 ►

BEMUTATÓ FELADAT

3.1. sz. tábla


A korbetöltött rokkantsági nyugdíjasok megoszlása a teljes ellátás havi ösz-
szege szerint, 2004. január
az ellátás férfiak osztály- értékösszeg relatív gya- értékösszeg
havi összege fő közép ezer Ft72 koriság „helyettes”
Ft fi yi si = f i * y i gi g i * yi
– 9.999 25 5.000 125. 0,000154 0,769472
10.000 –
114 15.000 1.710 0,000702 10,526380
19.999
20.000 –
759 25.000 18.975 0,004672 116,805900
29.999
30.000 –
9.265 35.000 324.275 0,057033 1996,1650
39.999
40.000 –
41.515 45 000 1.868.175 0,255557 11500,0700
49.999
50.000 –
46.720 55.000 2.569.600 0,287598 15817,8900
59.999
60.000 –
25.938 65.000 1.685.970 0,159669 10378,4600
69.999
70.000 –
14.413 75.000 1.080.975. 0,088723 6654,24200
79.999
80.000 –
8.969 85.000 762.365. 0,055211 4692,9500
89.999
90.000 –
6.098 95.000 579.310 0,037538 3566,1040
99.999
100.000 – 8.633 105.000 906.465 0,053143 5579,9970
összesen 162.449 – 9.797.945 1 60313,9755
adatforrás: Magyar Statisztikai Évkönyv 2003 (KSH, 2004 161. old. Társadalombiztosí-
tás, szociális ellátás)

72 Ahol csak lehet, használja ki az ilyen egyszerűsítéseket (itt a számolás eredménye oszt-
va százzal), kevesebb számjegyet kell leírnia, ill. egy esetleges további számításnál vissza-
billentyűzni a zsebszámológépbe, és ez kevesebb hibalehetőséget rejt magában.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 50 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 51 ►

xa =
∑fx i i
=
9.797.945.000
≅ 60.314 Ft
∑f i 162.449

♥ 2004-ben a korbetöltött rokkantsági nyugdíjas férfiak átlagosan 60.314


Ft ellátást73 kaptak havonta.
Megjegyzések:
• Tekintettel arra, hogy egy-egy osztályközbe (= egy-egy részsokasága) a
sokaság több eleme tartozik, súlyozott átlagot számítottunk.
• A rokkantsági nyugdíjak összegének (= értékösszegek összege) van
jelentése (= összes ilyen címen kifizetett ellátás), tehát számtani átla-
got számítottunk.
• Osztályközös gyakorisági sor esetén az átlagolandó érték = osztály-
közép
xa + x f
= xi = 74
2
• A nyitott (= nincs alsó vagy felső határa)75 osztályközök osztályköze-
pét a következő ill. a megelőző osztályköz szélességét feltételezve kell
ki számítani.
• Vegye észre, ha súlynak a relatív gyakoriságokat használjuk, akkor a
g i xi feliratú oszlop – lásd: 3.1. sz. tábla utolsó oszlopa – összesen ro-
vata (minden további művelet elvégzése nélkül) magát az átlagot tar-
talmazza.
• A legnagyobb relatív gyakoriságot a [50 000 – 59 999] osztályköz mel-
lett találjuk, tehát „erre felé” kell megtalálnunk az átlagot.76

73 Ellátás = rokkantsági nyugdíj


74 x a = az adott osztályköz alsó határa és x f = az adott osztályköz felső határa.
75 Az osztályközöket egy-egy vizsgálathoz gyakran előre – korábbi tapasztalataink – alap-
ján elkészítjük. Ha pedig a határokat már ekkor lezárnánk, akkor előfordulhatna, hogy a
sokaság egy-egy elemét ki kellene hagynunk a besorolásnál, mert olyan nagy vagy olyan
kicsi értéket vettek fel, amire előre nem számítottunk. Ez pedig torzulást okozna, hamis
eredményekhez vezetne.
76 Annak oka, hogy az átlag egy osztályközzel „feljebb csúszott”, az hogy a 60 ezer Ft
feletti nyugdíjasok aránya (≅ 39 %) nagyobb, mint az 50 ezer Ft alatti nyugdíjasok aránya
(≅ 32 %).

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 51 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 52 ►

Számtani átlagot azonban nemcsak mennyiségi sorokból, hanem össze-


gezhető idősorokból, azaz a tartam idősorokból is számíthatunk. Az
idősoroknál alkalmazott jelöléseket használva a képlet így módosul:
n

∑y i
ya = i =1
.
n
Például az 1.2. sz. tábla (Az élveszületések száma Magyarországon) adatai alapján:
112.054 + 105.272 + ... + 94.647 − 92.200
ya = ≅ 98.792 fő ,
10
♥ azaz 1995 és 2004 között évente átlagosan 98.792 élveszületés tör-
tént hazánkban.
• Állapot idősorokból, ezek összege nem értelmezhető, egy speciális
súlyozású számtani átlagot = kronologikus átlagot számítunk.
y1 n −1 y
+ ∑ yi + n
2 i =2 2
y kr =
n −1

Az 1.1. sz. tábla adatai alapján:

10.337 10.236
+ 10.321 + ... + 10.142 +
ykr = 2 2 = 10.236 ezer fő ,
9
♥ azaz hazánk népessége a vizsgált időszakban évente átlagosan 10.236 ezer fő volt.

• A számtani átlagot (és a későbbiekben tárgyalásra kerülő szórást is) kiszámíthatjuk a


zsebszámológépek statisztikai programjával is. Ez feleslegessé teszi a 3.1. sz. táblához
hasonló nagyméretű munkatáblák kitöltését, azaz munkánk gyorsabbá válik.
• Kapcsoljuk be a zsebszámológépet77! ON/C
• Állítsuk át statisztikai programra! MODE ⇒ 1 ⇒ 0

77 SHARP EL-531WH (A gépekhez vásárláskor kapott használati útmutatóból derülhet


ki, hogy az Ön gépe alkalmas-e statisztikai számítások végzésére, és ha igen, annak
leírását is csatolta a gyártó. Ha nem találja a korábban vásárolt gép leírását, keresse a
gyártó honlapján!)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 52 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 53 ►

• Vigyük be az első átlagolandó értéket! szám(ok) ⇒ STO


• Vigyük be az első átlagolandó érték súlyadatát! szám(ok) ⇒ M+
• Ismételjük az utóbbi két műveletet – az előző sorrendben! – addig, amíg vala-
mennyi átlagolandó értéket ill. azok súlyadatát be nem vittük a gépbe.
• Nyerjük ki a rész- és a végeredményeket!
• számtani átlag RCL , 4
• szórás RCL , 6
• értékösszeg (= a számtani átlag számításakor a számlálóban szereplő adat)
RCL , tizedespont .
• elemszám (= a számtani átlag számításakor a nevezőben szereplő adat) RCL , 0
• az átlagolandó értékek négyzetének összege RCL , +/-
• A zsebszámológép memóriája mindaddig megőrzi az eredményeket (kikapcsolás
esetén is), amíg nem kezdünk (a fent leírt módon) egy újabb átlagszámításba.
• Az eredmények kinyeréséhez használt billentyűk statisztikai funkcióját is
láthatja a zsebszámológép előlapján; általában a szám- ill. műveleti billen-
tyűk jobb felső sarkánál, apró, színes betűkkel.
• A számtani átlag (és minden más statisztikai mutató is) meghatározható a személyi
számítógépek EXCEL programjával is. (Ennek részletes leírása azonban meghaladja
tananyagunk kereteit.)

3.3. A mértani átlag

A mértani (= geometriai) átlag az a szám, melyet az átlagolandó értékek


helyébe írva azok szorzata változatlan.

Ebből a definícióból vezethető le a mértani átlag képlete:

n n n yn
Π xi = x gn ⇒ x g = n Π xi ⇒ l = n −1 Π li = n −1 bn = n −1
i =1 i =1 i =2 y1

A képletekben szereplő betűk jelentése:

xi = i=
xg= n=
az elemek
átlagolandó a megfigyelt
geometriai átlag sorszáma (1-től
érték, elemek száma
n-ig)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 53 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 54 ►

∑ fi m m yn
x g = i =1 Π x i f i ⇒ l = ∑
f i −1
Π li fi = n−1 bn = n−1
i =1 i =2 y1

A képletben szereplő betűk jelentése:


m=
xi = xg= a különböző átlagolandó
átlagolandó érték, geometriai átlag értékek (= az ismérvérté-
kek) darabszáma
fi = i = az azonos ismérvér- m

az azonos ismérvértékű tékű csoportok sorszáma összefüggés: ∑f


i =1
i =n
elemek száma (1-től m-ig)
g i = az azonos ismérv-értékű elemek relatív gyakorisága

Az elsőként megadott képlettel az un. egyszerű78, a másodikként meg-


adottal az un. súlyozott mértani átlagot számítjuk. A geometria átlagot
akkor alkalmazzuk, ha az átlagolandó értékek szorzatának van jelentése,
így például a láncviszonyszámok átlagolására.79

BEMUTATÓ FELADAT

A 2.3. sz. tábla adatai alapján:


10117
l = 9 0,998 * 0,998 * 0,998 * 0,997 * ... * 0,998 = 9 0,979 = 9 = 0,9976 ⇒ 99,76% ⇒ −0,24%
10337
l = 9 0,9986 * 0,997 3 = 0,9976

♥ Magyarország népessége a vizsgált időszakban évente átlagosan 0,24 %-


kal csökkent.
Az idősorokból a relatív változás (= láncviszonyszám) mellett, ahogy
arról már volt szó80, az adatok abszolút változását is kiszámíthattuk. A
láncviszonyszámokhoz hasonlóan ezek is átlagolhatók:

78 Egyszerű = az átlagolandó értékek egyszer-egyszer fordulnak elő. (Lásd: számtani átlag)


79 Lásd: az egyszerű geometria átlag ill. a súlyozott geometriai átlag képlete mellett, l.
80 Lásd: 2.1. Dinamikus viszonyszámok.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 54 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 55 ►

∑d i
y n − y1 10117 − 10337
d= i =2
= 81Például: d= ≅ −2,8 ezer fő
n −1 n −1 9
♥ Magyarország népessége a vizsgált időszakban évente átlagosan ≅
2800 fővel csökkent.

3.4. A négyzetes átlag

A négyzetes (=kvadratikus =quadratikus) átlag az a szám, melyet az átla-


golandó értékek helyébe írva azok négyzeteinek összege nem változik.

Ebből a definícióból vezethető le a négyzetes átlag képlete:


n m

n ∑ xi2 ∑f x i
2
i m

∑ x = nx ⇒ x q =
2
i
2
q
i =1

n
ill. xq = i =1
m
= ∑g x i
2
i
i =1
∑f i =1
i
i =1

A képletekben szereplő betűk jelentése:


m=
xi = x q= a különböző átlagolandó
átlagolandó érték, négyzetes átlag értékek (= az ismérvérté-
kek) darabszáma

fi = i=
m

az azonos ismérvértékű
az azonos ismérvértékű
csoportok sorszáma (1-
összefüggés: ∑f
i =1
i =n
elemek száma től m-ig)
g i = az azonos ismérv-értékű elemek relatív gyakorisága

Az elsőként megadott képlettel az un. egyszerű, a másodikként megadot-


tal az un. súlyozott négyzetes átlagot számítjuk. A számított átlagok ezen
típusát akkor alkalmazzuk, ha az átlagolandó értékek négyzetének van
jelentése, ill. akkor, ha az átlagolandó értékek között pozitív és negatív

81 Jelmagyarázat: lásd a 2.1. Dinamikus viszonyszámok.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 55 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 56 ►

előjelűek egyaránt előfordulnak, de az előjeleknek vizsgálatunk szempont-


jából nem tulajdonítunk jelentőséget. Így például a négyzetes átlag az átla-
golandó értékek átlagtól való átlagos eltérésének vizsgálatára is (különö-
sen) alkalmas82.

3.5. A harmonikus átlag

A harmonikus átlag az a szám, melyet az átlagolandó értékek helyére írva


azok reciprokainak összege változatlan.

Ebből a definícióból vezethető le a harmonikus képlete:


m

m
1 n
∑f i
1

i =1 x i
= nx h ⇒ x h = n
1
ill. xh = i =1
n
fi
= m
gi
∑x
i =1
∑x
i =1

i =1 x i
i i

A képletekben szereplő betűk jelentése:


xi = xh= m = a különböző átlago-
landó értékek (= az is-
átlagolandó érték, harmonikus átlag mérvértékek) darabszáma

fi = i=
m

az azonos ismérvértékű
az azonos ismérvértékű
csoportok sorszáma (1-
összefüggés: ∑f
i =1
i =n
elemek száma től m-ig)
g i = az azonos ismérv-értékű elemek relatív gyakorisága

Az elsőként megadott képlettel az un. egyszerű, a másodikként megadot-


tal az un. súlyozott harmonikus átlagot számítjuk. A számított átlagok

82 Alkalmazására bemutató példát is csak a szóródás taglalásánál talál.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 56 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 57 ►

ezen típusát akkor alkalmazzuk83, ha az átlagolandó értékek reciprokának


van jelentése. Például, dolgozók az adott munkamennyiség elvégzéséhez
szükséges idejét nem összegezhetjük, hiszen ha együtt végeznék az előírt
feladatot, nyilván a leghosszabb egyéni időnél is kevesebbre lenne szüksé-
gük a teljesítéshez. Az adott munkamennyiség elvégzéshez szükséges idők
reciproka (= egységnyi időre jutó teljesítmény) azonban értelmes.

3.6. Módusz

A módusz a legtöbbször előforduló (= legáltalánosabb = tipikus = a leg-


divatosabb) ismérvérték a sokaságban. Diszkrét ismérvváltozatok esetén: a
leggyakrabban előforduló ismérvérték; folytonos ismérvváltozatok esetén:
a gyakorisági görbe84 csúcspontjához tartozó ismérvérték.

A módusz értékének meghatározása diszkrét ismérvváltozatok esetén rá-


nézéssel történik. A módusz az az ismérvérték, amelyik mellett a legna-
gyobb előfordulást f max vagy a legnagyobb relatív gyakoriságot g max
(megoszlási viszonyszámot, wmax ) találjuk.

3.2./ a sz. tábla


Egy hallgatói csoport megoszlása a statisztika vizsgaeredmények alapján
eredmények 1 2 3 = Mo 4 5
hallgatók
12 25 50 = f max 20 13
(fő)

♥ Az adott hallgatói csoportban tehát a leggyakrabban előforduló vizsga-


eredmény a közepes (3).
Az osztályközös gyakorisági sorból a módusz meghatározása a fenti-
eknél egy kicsit bonyolultabb. Először ellenőriznünk kell, hogy az osztály-

83 Ezen átlagtípust leggyakrabban azonban csak „formaként” használjuk, pl. ha számtani átlagot
akarunk számítani, de nem ismerünk minden alapadatot, akkor így is dolgozhatunk:
m m

∑s
i =1
i ∑s
i =1
i (A további felhasználásokat lásd: standardizálás, ár-, érték-, volumenindex-kör.)
xa = m
= m
si
∑f
i =1
i ∑
i =1 x i

84 Lásd: a statisztikai adatok ábrázolása.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 57 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 58 ►

közök azonos szélességűek-e. Ha igen, akkor ki kell választanunk a


modális osztályközt (= ahol a módusz elhelyezkedik)85. Majd be kell
helyettesítenünk a módusz képletébe86 a megfelelő adatokat.
k1
Mo = mo + h
k1 + k 2

A képletben szereplő betűk jelentése:


k1 = f mo − f mo −1 f mo =
Mo = a móduszt tartalmazó
vagy
módusz osztályköz megfigyelt
k1 = g mo − g mo −1
gyakorisága
f mo −1 =
mo = x mo ,alsó = k 2 = f mo − f mo +1
a móduszt tartalmazó
a móduszt tartalmazó vagy osztályközt megelőző
osztályköz alsó határa k 2 = g mo − g mo +1 osztályköz megfigyelt
gyakorisága
f mo +1 = g mo −1 =
g mo =
a móduszt tartalmazó a móduszt tartalmazó
a móduszt tartalmazó
osztályközt követő osz- osztályközt megelőző
osztályköz relatív gyako-
tályköz megfigyelt gyako- osztályköz relatív gyako-
risága
risága risága
g mo +1 =
h = x mo, felső − x mo,alsó = x mo, felső =
a móduszt tartalmazó osz-
a móduszt tartalmazó móduszt tartalmazó osz-
tályközt követő osztályköz
osztályköz szélessége tályköz felső határa
relatív gyakorisága

85 Ha nem, akkor átalakítást kell végeznünk, de ez nem képezi tananyagunk részét.


86 A módusz értékének ábrával történő meghatározása sem képezi tananyagunk részét, de
jó tudnunk, hogy a képlet az ábra koordináta geometriai „lefordítása”.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 58 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 59 ►

BEMUTATÓ FELADAT

A 3.1. sz. tábla adatai alapján dolgozunk.


40.000 – 49. 999 41.515 45.000 1.868.175 0,255557 11500,0700
50.000 – 59. 999 46.720 55.000 2.569.600 0,287598 15817,8900
60.000 – 69. 999 25.938 65.000 1.685.970 0,159669 10378,4600

k1 46.720 − 41.515
Mo = mo + h = 50.000 + (60.000 − 50.000) =
k1 + k 2 (46.720 − 41.515) + (46.720 − 25.938)
0,287598 − 0,255557
50.000 + (60.000 − 50.000) ≅ 52.000 eFt
(0,287598 − 0,255557) + (0,287598 − 0,159669)
♥ 2004. januárjában a korbetöltött rokkantnyugdíjas férfiak havi ellátásá-
nak leggyakoribb összege 52.00087 Ft volt. Úgy is fogalmazhatunk, hogy a
megfigyelt nyugdíjak sűrűsödési88 pontja 52.000 Ft.

3.7. Medián

A medián az az érték, amelyiknél a sokaság elemeinek egyik fele kisebb


értéket, a másik fele pedig nagyobb értéket vesz fel.

A medián értékének kiszámítása sorszámának meghatározásával kezdődik,


majd a medián helyének kiválasztásával folytatódik. A következő lépés pe-
dig attól függ, hogy a ismérvváltozataink diszkrétek avagy folytonosak-e.
n +1
A medián sorszáma: s Me =
2
A képletben szereplő betűk jelentése:
s Me = n=
a medián sorszáma a sokaság elemeinek száma

87 A módusz kiszámított értékét (52002,9 Ft) a megfigyelt adatok nagyságrendjére kerekítet-


tük.
88 A második megfogalmazás kifejezi, hogy nem ismerjük (az adatokat osztályközbe ren-
dezve kaptuk) valamennyi nyugdíjas ellátásának összegét, így szélső esetben meg az is elő-
fordulhat, hogy az általunk kiszámított 52.000 Ft nem is szerepelt az eredeti adatok között,
de abban biztosak lehetünk, hogy az ellátások összege e körül az összeg körül tömörül.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 59 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 60 ►

A medián helyének meghatározásához adatainkat az ismérvváltozatok sze-


rint növekvő sorrendbe kell rendezni. ( Lásd: 1.5., 3.1. és 3.2. sz. táblánk;
ezeket a szokásoknak megfelelően eleve így adtuk meg.) Majd a megfigyelt
vagy a relatív gyakoriságokból képezni kell az un. felfelé kumulált gyako-
risági sort. Ennek a statisztikai sornak egyes adatai ( f i′) megmutatják, hogy
egy bizonyos xi értéket és annál kisebb értéket a sokaság elemei közül hány
elem vesz fel, vagy a sokaság elemeinek hányad része (g i′ ) veszi fel.

BEMUTATÓ FELADAT

3.3. sz. tábla (Lásd: 3.1. sz. tábla.)


kumulált kumulált
relatív gyako-
az ellátás havi férfiak gyakorisági relatív gyako-
riság
összege sor risági sor
fő fő – –
Ft fi f i′ gi g i′
– 9.999 25 25 0,000154 0,000154
10.000 – 19.999 114 139 0,000702 0,000856
20.000 – 29.999 759 898 0,004672 0,005528
30.000 – 39.999 9.265 10.163 0,057033 0,062561
40.000 – 49.999 41.515 51.678 0,255557 0,318118
50.000 – 59.999 46.720 98.398 0,287598 0,605716
60.000 – 69.999 25.938 124.336 0,159669 0,765385
70.000 – 79.999 14.413 138.749 0,088723 0,854108
80.000 – 89.999 89.69 147.718 0,055211 0,909319
90.000 – 99.999 6.098 153.816 0,037538 0,946857
100.000 – 8.633 162.449 0,053143 1
összesen 162.449 – 1 –

♥ A vizsgált nyugdíjasok (162.449 fő) közül 10.613 fő, azaz az összlétszám


6,3 %-a kapott a megfigyelt hónapban legfeljebb 40.000 Ft havi ellátást.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 60 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 61 ►

A medián helye pedig ott található, ahol teljesül a következő nagyság-


rendi reláció: f i′〉 s Me
Példánkban
n + 1 162.449 + 1
sMe = = = 81.225. ,
2 2
ennél a sorszámnál a 6. osztályköz kumulált gyakorisága (98398) már na-
gyobb, tehát a medián ebben az osztályközben található89. Ha ismérvvál-
tozataink diszkrétek lettek volna, akkor munkánk itt véget is ér. A mediánt
(mint a móduszt is) ránézéssel meg tudjuk állapítani90.
Állapítsa meg a 3.2./a sz. táblából a medián értékét!

3.2./b tábla
Egy hallgatói csoport megoszlása a statisztika vizsgaeredmények alapján
eredmények 1 2 3 =Me 4 5
hallgatók (fő) 12 25 50 20 13
kumulált gyak. 12 37 87 > 60. 107 120

♥ A hallgatók egyik fele közepesnél rosszabb, a másik fele pedig közepest


jobb eredményt ért el a vizsgán.
(Tekintettel arra, hogy ötvenen kaptak közepest, kicsit furcsán hangzik a megfogalmazás,
de ha arra gondolunk, hogy a közepesek között is, pl. a teljesítmény-százalék alapján,
tudunk különbséget tenni, akkor már nem is olyan megdöbbentő a medián fentiekben
leírt megfogalmazása.)
A folyamatos ismérvváltozatok esetén azonban, a módusz becsléséhez
hasonlóan, képletre van szükségünk.
′ −1
s Me − f me ′ −1
0,5 − g me
Me = me + * h = me + *h
f me g me

89 Ha a relatív gyakoriságokkal akarunk dolgozni, akkor természetesen a medián sorszá-


ma mindig 0,5, ez ∑g i fele, de ebben az esetben is ugyanazt az osztályközt választjuk
ki, hisz 0,605716 már nagyobb 0,5-nél.
90

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 61 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 62 ►

A képletben szereplő betűk jelentése:


me = x me ,alsó =
Me = s Me =
a medián a mediánt tartalmazó
a medián sorszáma
osztályköz alsó határa
′ −1 =
f me ′ −1 =
g me
a mediánt tartalmazó a mediánt tartalmazó h = x me, felső − x me,alsó =
osztályközt megelőző osztályközt megelőző a mediánt tartalmazó
osztályköz kumulált gya- osztályköz kumulált rela- osztályköz szélessége
korisága tív gyakorisága
g me =
f me = x me,alsó =
a mediánt tartalmazó
mediánt tartalmazó osz- a mediánt tartalmazó
osztályköz kumulált rela-
tályköz gyakorisága osztályköz alsó határa
tív gyakorisága
xme, felső =
a mediánt tartalmazó
osztályköz alsó határa

sMe − f me ′ −1 81.225 − 51.678


Me = me + * h = 50.000 + (60.000 − 50.000) =
f me 46.720
0,5 − g ′me−1 0,5 − 0,318118
me + * h = 50.000 + (60.000 − 50.000) ≅ 56.324 Ft
g me 0,287598

♥ A vizsgált nyugdíjas férfiak egyik fele ≅56.300 Ft-nál kisebb, másik fele
pedig ennél nagyobb összegű ellátást kapott 2004. januárjában.
Megjegyzések:
• Az osztályközös gyakorisági sorból számított módusz és medián soha
nem „lóghat ki” a kiválasztott osztályközből.
• A medián képletének értelemszerű alkalmazásával a sokaság más osz-
tópontjait is meg tudjuk határozni, ezeket pedig pl., a sokaság szim-
metriájának elemzéséhez használjuk fel.
Q1 = Qa = alsó kvaritlis (quartilis) = az az érték, melynél a sokaság elemeinek ne-
gyed része kisebb, háromnegyed része pedig nagyobb értéket vesz fel.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 62 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 63 ►

Q3 = Q f = felső kvaritlis (quartilis) = az az érték, melynél a sokaság elemeinek há-


romnegyed része kisebb, egynegyed része pedig nagyobb értéket vesz fel.
D1 = első decilis = az az érték, melynél a sokaság elemeinek egy tized része kisebb,
kilenc tized része pedig nagyobb értéket vesz fel.
D9 = kilencedig decilis = az az érték, melynél a sokaság elemeinek kilenc tized része
kisebb, egy tized része pedig nagyobb értéket vesz fel stb.

3.8. Gyakorló feladatok

1. feladat

A következőkben felsorolt számtani átlagokról döntse el, hogy azok mi-


lyen típusúak!
átlagok:
1. Egy általános iskolás kisgyermek nap, mint nap feljegyezte hány perc az út
otthonról az iskolába. Majd kiszámította az átlagos idő-szükségletet.
Egy édesanya egy éven keresztül feljegyezte a család napi villamos-energia
2.
fogyasztását. Minden hónap végén kiszámította az egy napra jutó fogyasz-
tást.
Majd az év végén a havi átlagokat felhasználva újra kiszámolta a napi fo-
3.
gyasztás átlagát.
Egy egyetemi évfolyamon kikérdezték a hallgatókat tanulási szokásaikról.
Többek között arra voltak kíváncsiak, hogy a kötelező órákon kívül naponta
mennyi időt töltenek tanulással. A kikérdezés után az összegyűjtött adatokat
4.
kombinációs táblába rendezték. A tábla oldalrovataiban a tanulásra fordított
idő (órában) szerepelt; az adatokat osztályközökbe rendezték. A tábla fejléc-
ében az egyetem különböző szakjai szerepeltek.
Először kiszámították a szakonkénti átlagos tanulási időt.
5. Majd az egyetem adott évfolyamának egészére is elvégezték a számítást.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 63 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 64 ►

2. feladat

Döntse el, – a számtani átlag tulajdonságai ill. a nagyságát befolyásoló


tényezőkről tanultak alapján – hogy lehetnek-e az alábbi átlagok a meg-
adott számpéldák megoldásai!
átlagok
a) b) c) d) e)
x = 1500USD x = 2144 fő x = 6,95kg x = 21440 fő x = 4,95kg

számpéldák:
Egy állattenyésztő juhállományának gyapjúhozamát vizsgálták. A gyapjúho-
zamra vonatkozó megfigyelt adatokat (kg) osztályközökbe rendezték. Az
1. első osztályköz: − 4,5 , az utolsó osztályköz 8,5 − .
Az osztályközök kilogrammonként növekedtek, és a gyakoriságok a közép-
ső osztályközöknél tömörültek.
Egy pénzintézetben a lakossági devizaszámlákon található összegeket
(USD) rendezték osztályközös gyakorisági sorba. Az első osztályköz:
2.
− 100 , az utolsó két osztályköz 50.001 − 10.000 ill. 100.001 −
A gyakoriságok a felsőbb osztályközöknél tömörültek.
Zala megye településeit a települések lakóinak száma (fő) szerint rendezték
osztályközös gyakorisági sorba. Az első osztályköz: − 499 , az utolsó két
3.
osztályköz 10.000 − 49.999 ill. 50.000 −
A gyakoriságok az alacsonyabb értékű osztályközöknél tömörültek.

3. feladat

Egy vállalkozásnál a női dolgozók átlagkeresete 75.000,– Ft / hó, férfiaké


pedig 95.000,– Ft / hó. A vállalat egyes telephelyein az egy dolgozóra jutó
béradatokat az alábbi tábla tartalmazza.
I. telephely II. telephely III. telephely IV. telephely
y a = 90.000 Ft / hó y a = 88 . 000 Ft / hó y a = 86.000 Ft / hó y a = 80.000 Ft / hó

Számítással mutassa be, hogy mi a különbség az egyes telephelyek között,


hogy az azonos férfi, női átlagbér ellenére más-más átlagbér adódott!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 64 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 65 ►

4. feladat

Néhány egyetemi szak hallgatóinak teljesítményei matematikából az első


zárthelyi dolgozat alapján:
teljesítmény villamos- gépész- informatikus közgazdász
mérnökök mérnökök
% fő
- 5091 30 20 34 35
51 – 60 20 20 68 88
61 – 70 10 15 34 88
71 – 80 10 10 22 35
81 – 90 6 3 11 28
91 – 4 2 11 6
összesen 80 70 180 280

1. Számítsa ki szakonként és a négy csoportra együttesen is a teljesítmé-


nyek átlagát! Az együttes átlagot kétféleképpen is számítsa ki!
2. Számítsa ki szakonként és a négy csoportra együttesen is a helyzeti
középértékeket, a kvartiliseket és a deciliseket!
3. Minden kiszámított adat jelentését fogalmazza meg!
4. Nevezze meg az adat-tábla típusát, a táblában található statisztikai
sorok típusát, darabszámát!

91Figyelje meg!
Bemutató példánkban az osztályközök 9-es számjeggyel végződte, ezért a számítások úgy
voltak egyszerűbbek, hogy a következő osztályköz alsó határát tekintettük az előző felső
határának. Itt fordított a helyzet. Nincs szabály, az egyszerűbb számításra törekedjen.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 65 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 66 ►

5. feladat

Írja fel az alábbiakban megadott átlagok számítását, majd fogalmazza


alábbiakban jelentésüket!
I. II.
egy fagylaltárus bevételeinek alaku-
a gépkocsik számának változása
lása
tárgy / bázis
hol ? januártól áprilisig havi + 3 %
(%)
Budapesten +2 áprilistól augusztusig havi +135 %
a vidéki városokban + 4 augusztus októberig havi – 20 %
községekben –1 októbertől januárig havi – 40 %

3.9. Összefoglalás
középérték = a sokaság elemei között középső helyet elfoglalva lehetővé teszi
a sokaság jellemzését egyetlen adattal
fajtái 1. számított = értékét minden megfigyelt adat befo-
lyásolja
2. helyzeti = értékét nem minden megfigyelt adat
befolyásolja

számított középértékek
fajtái 1. számtani átlag
2. mértani átlag
3. négyzetes átlag
4. harmonikus átlag

helyzeti középértékek
fajtái 1. módusz
2. medián

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 66 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 67 ►

számtani átlag92 = az a szám, melyet az átlagolandó értékek helyébe írva azok


összege változatlan
fajtái 1. egyszerű = minden átlagolandó érték egyszer for-
az átlagolandó értékek dul elő
előfordulása alapján 2. súlyozott = az átlagolandó értékek többször for-
dulnak elő
fajtái 1. részátlag = az egyes részsokaságokra jellemző
összetett sokaság esetén 2. főátlag = a teljes (fő) sokaságra jellemző
képletei 1. egyszerű
1. xa =
∑x i
2. xa =
∑f x
i i

2. súlyozott n ∑f i

tulajdonságok legfontosabb xi (min) 〈 x a 〈 xi (max)


megjegyzés ez a tulajdonság valamennyi középértékre
igaz
rokonság intenzitási viszonyszámmal
az értékét befolyáso- 1. egyszerű az átlagolandó értékek abszolút nagysága
ló tényezők az átlagolandó értékek abszolút nagysága
2. súlyozott +
a súlyok relatív nagysága
összefüggés a rész- a főátlag = a részátlagok súlyozott számtani átlaga
és a főátlag között
mértani átlag = az a szám, melyet az átlagolandó értékek helyé-
be írva azok szorzata állandó
négyzetes átlag = az a szám, melyet az átlagolandó értékek helyé-
be írva azok négyzeteinek összege állandó

92 FONTOS: 1. A számtani átlag a legtöbb, a továbbiakban ismertetésre kerülő sta-


tisztikai elemzési módszerben előfordul, így tudása az egész tantárgy tanulása érdekében
nélkülözhetetlen.
2. Samuelson92 szerint, mindent, amit a gazdasági életről tudunk a statisztika
alapján tudjuk, így tantárgyunk egy közgazdásznak a többi tantárgy tanulásához is nélkü-
lözhetetlen.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 67 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 68 ►

harmonikus átlag = az a szám, melyet az átlagolandó értékek helyé-


be írva azok reciprokainak összege állandó
fajtáik
• az átlagolandó értékek előfordulása alapján lásd: számtani átlag
• összetett sokaságok esetén
képletek harmonikus

xh =
n
xh =
∑f i
=
1
1
∑x f
∑x i g
∑ xi
i i i

négyzetes

∑x 2
∑f x 2

xq =
i
xq =
i i
= ∑g x 2

∑f
i i
n i

mértani
x g = n Πx i x g = ∑ i Πxifi = Πxigi
f

alkalmazásuk 1. harmonikus ha az átlagolandó értékek reciproka értel-


mes
2. négyzetes ha az átlagolandó értékek négyzete értel-
mes vagy
ha az átlagolandó értékek nem mindegyi-
kének azonos az előjele, és az előjelnek
nem tulajdonítunk jelentőséget → szórás
ha az átlagolandó értékek szorzatának van
3. mértani értelme → lánc viszonyszámok átlagolása

nagyságrendjük xh 〈 x g 〈 xa 〈 xq
legfontosabb tulajdonságuk
a rész- és főátlag összefüggése lásd: számtani átlag
az értéküket befolyásoló tényezők

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 68 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 69 ►

3.10. Mintapéldák korábbi vizsgadolgozatokból

1. minta

Egy lakótelepi háztömb egyik lépcsőházának melegvíz-fogyasztási adatai


(2005. január):
fogyasztás
m3-re kerekítve 2 3 4 5 6 7 8 összesen

lakások
db 2 3 5 20 19 5 6 60

Töltse ki az alábbi eredmény-táblát!

eredmény-tábla
számszerű
statisz- eredmény
feladat számítás megfogalmazás
tikai jel +
mértékegység
a sokaságot jel-
lemző számított
középérték:
a leggyakoribb
vízfogyasztás
a rangsor közép-
ső lakosának
vízfogyasztása:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 69 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 70 ►

2. minta

Egy hallgatói csoport megoszlása a tanulóbiztosítás féléves díjai szerint:


0,0 1,2 1,5 2,0 2,5 3,0 3,5
biztosítási ezer
– – – – – – – összesen
díjak Ft
1,2 1,5 2,0 2,5 3,0 3,5 4,0
hallgatók fő 30 25 20 15 15 10 5 60
Töltse ki az alábbi eredmény-táblát!
eredmény-tábla
számszerű
eredmény
statisz-
feladat számítás + megfogalmazás
tikai jel
mérték-
egység
a sokaságot jel-
lemző számított
középérték:
a leggyakoribb
biztosítási díj
a rangsor közép-
ső tagjának biz-
tosítási díját
A szürke háttérrel és vastagabb kerettel kiemelt osztályközhöz tarto-
zó adatok:
osztályközép
kumulált gyako-
riság
relatív gyakoriság
kumulált relatív
gyakoriság
értékösszeg
relatív értékösszeg
kumulált relatív
értékösszeg

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 70 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 71 ►

3. minta

Az élveszületések (97301 fő) megoszlása az újszülöttek születési súlya alap-


ján 1998-ban:
Minden részadatnak csak az első két tizedesét másolja át a lapra. (Ne kerekítsen, csak másoljon!)

az újszülöttek munkatábla
születési súly
megoszlása
gramm %
- 1.000 0,5
1.001 – 1.500 0,7
1.501 – 2.000 1,7
2.001 – 2.500 5,4
2.501 – 3.000 19,4
3.001 – 3.500 37,7
3.501 – 4.000 26,5
4.001 - 8,1
összesen 100,0

Számítsa ki a sokaságot jellemző számított középértéket!


Írja ide a kiszámított középértéket!
Csak az egész számok kellenek.
Csak másoljon, kerekíteni nem kell.

Számítsa ki a szóródás leggyakrabban használt abszolút és relatív mutató-


ját!
Írja ide a kiszámított relatív szóródási
mutatót!
Csak az egész számok kellenek.
Csak másoljon, kerekíteni nem kell.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 71 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 72 ►

Döntse el igazak (I) avagy hamisak (H)-e az alábbi állítások!

sorszám megfogalmazás
Az alapadatokat tartalmazó tábla első sorában a 0,5 adat = megfigyelt
1. adat, jelentése: 1998-ban az élveszületett csecsemők 0,5 %-a 1000
gramm alatti súllyal jött világra.
Az alapadatokat tartalmazó tábla első sorában a 0,5 adat = számított
2. adat, jelentése: 1998-ban az élveszületett csecsemők 0,5 század része
1000 gramm alatti súllyal jött világra.
Az alapadatokat tartalmazó tábla első sorában a 0,5 adat = számított
3, adat, jelentése: 1998-ban az élveszületett csecsemők 0,5 %-a átlago-
san 500 gr súllyal jött világra.
Az alapadatokat tartalmazó tábla első sorában a 0,5 adat = számított
4. adat, jelentése: 1998-ban az élveszületett csecsemők 0,5 %-a átlago-
san 750 gr súllyal jött világra.
5. Az Ön által kiszámított adatok mértékegysége nem azonos.
megoldás 1. 2. 3. 4. 5.

Döntse el igazak (I) avagy hamisak (H)-e az alábbi állítások!

sorszám megfogalmazás
Az „újszülöttek megoszlása” oszlop (lásd: munkatábla) adatai relatív
1.
gyakoriságok.
A „születési súly” oszlop (lásd: munkatábla) adatai jelentik az átla-
2. golandó értékeket, s Ön szabadon döntheti el, hogy a két szám
közül melyikkel dolgozik.

A számított középérték és a szóródás abszolút mutatója súlyozott


3. formában számítandó, hiszen az egyes osztályközökbe nem egy-egy
csecsemő tartozik.
Súlynak választható a megfigyelt gyakoriság ( f i ) , a megoszlási
4.
viszonyszám (g i ) , vagy a relatív gyakoriság (wi ) .
Súlynak választható a megfigyelt gyakoriság ( f i ) , a megoszlási vi-
5.
szonyszám (wi ) , vagy a relatív gyakoriság (g i ) .
megoldás 1. 2. 3. 4. 5.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 72 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 73 ►

4. minta

Tekintettel arra, hogy a számtani átlag és a – következő fejezetben ismertetés-


re kerülő – szóródás legfontosabb mutatóinak kiszámítása – sok éves tapasz-
talat – a hallgatók egy jelentős részének nagy gondot okoz, további, a vizsgá-
kon már sokszor szerepelt számpéldákat is közlünk megadva a számtani átlag
és a szórás aktuális értékét. Természetesen a feladatokban szereplő adatokból
minden egyéb mutatót – módusz, medián stb. kiszámíthat gyakorlásképpen.
A feladatokat előveheti a becslés témakörnél (Stat. II.) is, elvégezheti
az átlag, a szórás az értékösszeg (kitalálva egy kiválasztási arányt), valamint
az egyes osztályközökbe tartozó elemek arányának intervallumbecslését is.
4.1.

Egy biztosító társaság új poggyászbiztosításának előkésítése során minta-


vételes technikával vizsgálja az utazók szokásait, többek között a poggyá-
szok értékét. A megfigyelt adatok:
a poggyász érté- az utasok szá- a poggyász érté- az utasok szá-
ke ma ke ma
Ft93 fő Ft fő
- 1.000 3 30.001 – 40.000 10
1.001 – 15.000 20 40.001 – 50.000 8
15.001 – 20.000 35 50.001 – 7
20.001 – 30.000 17 összesen 100

♥ xa = 22.940 Ft σ = 14.009 Ft

93 Gyakorlati tanácsok:
Célszerű a zsebszámológépbe való billentyűzésnél a sok-sok nullát elhagyni, azaz ezerrel
egyszerűsíteni, úgy is mondhatjuk: ezres nagyságrendben dolgozni.
Jusson eszébe, az osztályközök alsó határainak utolsó számjegye (1) a megkülönböztetés
miatt szükséges, az osztályközepek meghatározásánál nem vesszük figyelembe.
Jusson eszébe, a nyitott osztályközök közepének megállapításakor olyan szélesnek feltéte-
lezzük azokat, amilyen széles a szomszédos osztályköz. (Természetesen az első osztály-
köz nem kezdődhet negatív számmal.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 73 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 74 ►

4.2.

Egy vállalkozás részmunkaidős dolgozóinak nettó átlagfizetés szerintimegoszlása:


nettó dolgozók
átlagfizetés
ezer Ft fő
- 50 20
50 – 60 50
60 – 70 100
70 – 80 30
összesen 200

♥ xa = 62 ezer Ft σ ≅ 8,4 ezer Ft

4.3.

Egy városban, az egyik évben a felépült lakások alapterület szerinti meg-


oszlása a következő volt.
alapterület lakások
m2 %
35,0 – 45,0 10
45,1 – 55,0 20
55,1 – 65,0 35
65,1 – 75,0 25
75,1 – 85,0 10
összesen 100

♥ xa = 60,5 m2 σ ≅ 11,2 m2

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 74 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 75 ►

4.4.

Egy magyarországi település vállalkozásainak megoszlása a foglalkoztatott


létszám alapján:
létszám vállalkozás
fő db
– 20 20
21 – 50 12
51 – 100 9
101 – 300 12
301 – 500 3
501 – 1000 3
1001 – 1
összesen 60

♥ xa ≅ 140 fő94 σ ≅ 228 fő

4.5.

Egy település max. 5 főt foglalkoztató kereskedelmi egységeinek megosz-


lása havi bevételük alapján:
kereskedelmi
bevétel
egység
millió Ft db
– 18,0 6
18,1 – 22,0 10
22,1 – 26,0 10
26,1 – 30,0 8
30,1 – 34,0 5
34,1 – 1
összesen 40

♥ xa ≅ 23,9 millió Ft σ ≅ 5,3 millió Ft

94 A létszámadatokból számított átlagokat, szórásokat a – megfogalmazások során –


mindig kerekítse egészekre!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 75 ►


Statisztika Középértékek
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 76 ►

4.6.

Egy nagykereskedelmi vállalat raktárában az ott tárolt 80.000 db dobozos


üdítőital töltési tömegének ellenőrzésére 300 elemű mintát vettek. A minta
adatai:
töltési tömeg doboz
gramm db
– 940 15
941 – 960 21
961 – 980 51
981 – 1.000 60
1.001 – 1.020 63
1.021 – 1.040 42
1.041 – 1.060 30
1.061 – 18
összesen 300

♥ xa ≅ 1001 gramm σ ≅ 35,8 gramm

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 76 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 77 ►

4. Szóródás

4.1. A szóródás fogalma


Ha az 1.5., a 3.1. vagy a 3.2. sz. tábla ismérvváltozatait (= átlagolandó érté-
keit) szemügyre vesszük, különösebb vizsgálódás nélkül is láthatjuk, hogy
azok eltérnek egymástól, és ugyanezt tapasztaljuk akkor is, ha adatainkat a
saját számtani átlagukhoz (173 millió Ft; 60314 Ft; 2,975 ≅ 3 /közepes/)
hasonlítjuk. Ezt a két jelenséget nevezzük szóródásnak. A szóródás vizs-
gálatára azért van szükségünk, mert így tájékozódhatunk arról, hogy az
átlag (= x a ) mennyire jellemző arra a sokságra, melynek adataiból kiszá-
mítottuk, ill. különböző sokaságokat összehasonlíthatunk ebből a szem-
pontból is; továbbá a szóródási mutatókat újabb vizsgálatokhoz (pl.:
szimmetria) használhatjuk fel.

4.2. A szóródás legfontosabb mutatói


Az átlagolandó értékek és az átlag közötti eltérés elemzésére több kü-
lönféle mutató áll rendelkezésünkre
• terjedelem,
• kvartilis eltérés,
• átlagos eltérés,
• szórás,
• relatív szórás.
Az átlagolandó értékek egymástól való eltérésének elemzésére leg-
gyakrabban az átlagos különbség (= az eltérések átlaga = G) nagyságát
szokás meghatározni.
A terjedelem a legkisebb és a legnagyobb átlagolandó érték különbsé-
ge (R = x min − x max ) , kijelöli azt az intervallumot, amiben az átlag elhelyezkedik. Gya-
korlati haszna azonban nem túl nagy, mert a szélső értékeket a véletlen szeszélyei erősen
befolyásolják.
A kvartilis eltérés a terjedelemhez hasonlóan különbség jellegű mutató
(ITQ = Q3 − Q1 ) , nagyságát a szélső értékek már nem befolyásolják, s mert a rang-
sorba95 állított adatok középső 50 %-át határolja, alkalmas a kiugró értékek feltárására.

95 A megfigyelt adatok növekvő sorba rendezett halmaza.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 77 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 78 ►

Az átlagos eltérés az egyes átlagolandó értékek és az azokból számított számtani át-


lag különbségeinek (d i = xi − x a ) számtani átlaga. A különbségek átlagolása során
azok előjelétől eltekintünk96, vagyis a különbségek abszolút értékével dolgozunk. Az
egyszerű számtani átlagok „párjaként” egyszerű, a súlyozott számtani átlagok „párjaként”
pedig súlyozott átlagos eltérést számítunk.
n k

∑ di ∑f i di
egyszerű: δ = δ=
i =1 i =1
súlyozott: k
n
∑f
i =1
i

A szóródás eddig taglalt mutatóinak képleteiben szereplő betűk jelentése:


di = fi =
n = ∑ fi =
az átlagolandó megfigyelt előfor- gi = =
a megfigyelések
érték és számtani dulások relatív gyakoriság
darabszáma
átlag különbsége
ITQ = x min =
δ= R=
interkvartilis terje- a legkisebb átlago-
átlagos eltérés terjedelem
delem landó érték
i = 1,2,...
x max =
a különböző átla- Q 1 = Qa = Q 3= Q f =
a legnagyobb átla-
golandó értékek alsó kvartilis felső kvartilis
golandó érték
sorszáma

Az átlagolandó értékek és az átlag eltérésének jellemzésére azonban leg-


gyakrabban nem az eddig felsoroltakat, hanem a szórás és a relatív szó-
rás mutatóját használjuk. A szórás mellett szól egyrészt a számtani átlag
kvadratikus minimum tulajdonsága97, másrészt az a tény, hogy a további-
akban fontos mutatók98 képezhetők segítségével.

96 Az átlagtól való eltérések előjeles összeg = 0 (Lásd: a számtani átlag tulajdonságai.)

∑ (x − a ) = min., ha a = x a ill. ∑ f (x − a ) = min., ha a = x a Úgy is


2 2
97
i i i
fogalmazhatunk, hogy a számtani átlag az a középérték, amelyik legközelebb áll az egyes
átlagolandó értékekhez.
98 Lásd: aszimmetria, ismérvek közötti kapcsolatok.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 78 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 79 ►

A szórás (= σ ) az átlagolandó értékek és az átlag eltérésének négy-


zetes átlaga, a szóródás abszolút mutatója, melynek mértékegysége min-
dig azonos az átlagolandó értékek és az átlag mértékegységével.

Ha egyszerű számtani átlagot számítottunk, akkor a tapasztalati (1.) ill. az


elméleti (2.) szórás képlete:
n n n n

∑ d i2 ∑ (xi − xa )2 ∑ d i2 ∑ (x i − xa )
2

1. σ = = 2. s = =
i =1 i =1 i =1 i =1 99
n n n −1 n −1
Ha súlyozott számtani átlagot számítottunk, akkor a tapasztalati(1.) ill. az
elméleti (2.) szórás képlete:
k k k

∑ f i d i2 ∑ f i ( xi − x a )
2
k ∑ f (x i i − xa )
2

1. σ =
i =1
k
= i =1
k
= ∑g d i i
2
2. s =
i =1
k

∑ i =1
fi ∑i =1
fi i =1
∑f i =1
i

Fontos, figyelnünk a szórás átlag-voltára. Mint minden átlag esetén, itt is


igaz, hogy az átlagnak (= itt a szórás) a legkisebb és a legnagyobb átlago-
landó értékek (= itt az átlagtól való eltérések) között kell elhelyezkednie,
azaz [d min 〈σ 〈 d max ] .

A relatív szórás (= v ) a szórás és a számtani átlag hányadosa; melyet


– elsősorban a megfogalmazás megkönnyítése érdekében, – százalékban is
kifejezhetünk.

Ez a mutató lehetővé teszi, hogy összehasonlítsuk különböző sokaságok (kü-


lönböző nagyságrendű és mértékegységű) szóródását. A relatív szórás képlete:
σ
v=
xa

99A nevezőben szereplő „-1”-re a Becslés c. fejezetben kapnak magyarázatot. (A becslés


témakörének tárgyalásáig számításainkat mindig az (1.) sz. képletek szerint végezzük.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 79 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 80 ►

A képletekben szereplő betűk jelentése:


σ= xi = xa=
szórás átlagolandó érték, számtani átlag
d i = xi − x a =
fi = k
az átlagolandó értékek és
a számtani átlag abszolút
az azonos ismérvértékű összefüggés: ∑f
i =1
i =n
elemek száma
eltérése
fi i= k=
gi =
∑ fi az azonos ismérvértékű a különböző átlagolandó
az azonos ismérv-értékű csoportok sorszáma (1- értékek (= az ismérvérté-
elemek relatív gyakorisága től k-ig) kek) darabszáma
v=
relatív szórás

Az átlagos különbség értékének meghatározása rendkívül munkaigényes és ezért rendkívül


hosszadalmas feladat. A számítások elvégzése előtt a megfigyelt adatokat egy olyan kombinációs
táblába kell rendeznünk, melynek mind a fejlécében, mind az oldalrovatában az átlagolandó érté-
keket soroljuk fel, belső rovatai pedig a különbségek abszolút értékeit tartalmazzák. (Átlójában,
melyre az adatok szimmetrikusak, pedig természetesen nullák sorakoznak, hiszen az értékek ön-
maguktól nem különböznek.) Ha az átlagolandó értékek mindegyike csak egyszer fordult elő,
akkor a különbségek abszolút értékének képzése után azonnal azok összegzése és átlagolása kö-
vetkezik. (Lásd: „egyszerű” képlet) Ha azonban az ismérvváltozatok többször fordultak elő, akkor
ezt a lépést még a súlyozás is megelőzi. (Lásd: „súlyozott” képlet.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 80 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 81 ►

n n k k
1 1
egyszerű: G =
n2
∑∑ xi − x j
i =1 j =1
súlyozott: G =
n2
∑∑ f
i =1 j =1
i f j xi − x j

A képletekben szereplő betűk jelentése:


G= xi = x j = k

átlagos különbség átlagolandó értékek


összefüggés: ∑f
i =1
i =n

k=
n= fi =
a különböző átlagolandó
a megfigyelt elemek szá- az azonos ismérvértékű értékek (= az ismérvérté-
ma elemek száma kek) darabszáma
i= j=
az azonos ismérvértékű átlagolandó értékek (1-től n-ig) vagy a csoportok sor-
száma (1-től k-ig)

BEMUTATÓ FELADATOK I.

4.1. sz. tábla (az 1.5. sz. tábla adatai alapján)


Külföldi érdekeltségű vállalkozások saját tőke szerint, Magyarországon
2003-ban
szerveze- átlagolan-
saját tőke
tek dó érték f i xi di f i d i2
(millió Ft) ( fi ) ( xi )
2.869.
– 150 22. 958 125 -48 52.895.232
750
150,1 – 200 362 175 63.350 +2 1 448
200,1– 250 283 225 63.675 +52 765.232
250,1 – 500 718 375 269. 250 +202 29.297.272
500,1 – 750 315 625 196. 875 +452 64.355.760
750,1– 1128 875 987. 000 702 555.882.912
4.449.
összesen 25.764 – – 703.197. 856
900

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 81 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 82 ►

k k

∑fx i i
4.449.900
∑fd i i
2

703.197.856
xa = i =1
= ≅ 173 millió Ft σ= i =1
k
= = 165 millió Ft
k
25.764 25.764
∑f
i =1
i ∑f i =1
i

σ 165
v= = → 95,4%
xa 173

♥ 2003-ban a Magyarországon működő külföldi érdekeltségű vállalko-


zások átlagos saját tőkéje 173 millió Ft volt, 165 millió Ft-os, azaz 95,4 %-
os szórás mellett.
♥ Ha részletesebben akarunk fogalmazni, akkor elmondhatjuk, hogy
az egyes vállalkozások saját tőkéje átlagosan 165 millió Ft-tal tér el (azaz,
165 millió forinttal kisebb vagy nagyobb) a vállalkozások alkotta sokaságra
kiszámított átlagos saját tőkeértéktől, a 173 millió forinttól; és ez az eltérés
igen nagymértékű, ≅ 95 %-os
A 4.1. sz. tábla d i sorának adatai alapján megfigyelhetjük, hogy a szórás
valóban a legkisebb 2 és a legnagyobb 702 eltérés között helyezkedik el.
A vállalkozások saját tőkéje átlagosan ≅ 85,3 millió Ft-tal (= δ ) tér el az átlagos sa-
ját tőkeértéktől.
22.958 * − 48 + 362 * 2 + ... + 1.128 * 702
(Számítása: ).
25.764
Az átlagtól való átlagos eltérést ez a számítási mód lényegesen kisebbnek mutatja
(δ 〈σ ) , mint az előző, az általában használt szórás elnevezésű mutató; és ez a nagyság-
rendi reláció minden esetben (nemcsak ebben a számpéldában) igaz.100

100 Ha azonos átlagolandó értékekből valamennyi tanult számított átlagtípus értékét


x 〈x 〈x 〈x
kiszámítjuk, azok mindig a következő nagyságrendi sort alkotják: h g a q . (A
bizonyítást most mellőzzük, de próbálja meg, pl.: a 4, 5, 6, 7 értékekkel!) Az átlagos
különbség pedig lényegében = számtani átlag, a szórás pedig = négyzetes átlag.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 82 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 83 ►

BEMUTATÓ FELADATOK II.

4.2. sz. tábla (a 3.1. sz. tábla alapján)


férfiak 1. súlyozott
az ellátás havi relatív értékösszeg
ezer eltérés
összege fő gyakoriság „helyettes”
Ft négyzetek101
Ft fi xi gi g i * xi g i d i2
– 9.999 25 5 0,000154 0,769472 471.184
10.000 – 19. 999 114 15 0,000702 10,526380 1.441.458
20.000 – 29. 999 759 25 0,004672 116,805900 1.631.306
30.000 – 39. 999 9.265 35 0,057033 1.996,16500 36.546.666
40.000 – 49. 999 41.515 45 0,255557 11.500,070000 59.932.869
50.000 – 59. 999 46.720 55 0,287598 15.817,890000 8.121.364
60.000 – 69. 999 25.938 65 0,159669 10.378,460000 3.506.107
70.000 – 79. 999 14.413 75 0,088723 6.654,242000 19.135.652
80.000 – 89. 999 8.969 85 0,055211 4.692,950000 33.645.506
90.000 – 99. 999 6.098 95 0,037538 3.566,104000 45.162.665
100.000 – 8.633 105 0,053143 5.579,997000 106.117.994
összesen 162.449 – 1 60.313,9755 315.712.771

1. osztályközép

k
x a = ∑ g i x i ≅ 60314 Ft σ = 315712771 ≅ 17768 Ft
i =1

σ 17768
v= = → 29,5%
xa 60314

♥ A korbetöltött rokkant nyugdíjas férfiak 2004. januárban átlagosan


60.314 Ft ellátásban részesültek. Ettől az összegtől egy-egy nyugdíjas ellá-
tása átlagosan 17.768 Ft-tal, azaz 29,5 %-kal tér el.
Összehasonlítva az előző (saját tőkére) vonatkozó feladat eredményeit és
ezen feladat (nyugdíjak) eredményeit, jól láthatjuk, hogy a nyugdíjak szó-
101 Az oszlop adatai az első tizedesről kerekített egész számok.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 83 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 84 ►

ródása lényegesen kisebb. A nyugdíjasok sokaságát a kiszámított átlag job-


ban jellemzi.102 Nézze meg, hogy a saját tőkék alapján csoportosított vál-
lalkozások sokaságának ábráját és a nyugdíjasoknak az ellátás összege alap-
ján készített ábráját! Figyelje meg a jelentős különbségeket!

A külföldi érdekeltségű magyar vállalkozások


megoszlása a saját tőke nagysága alapján (2003)

25 000
a vállalkozások száma (db)

20 000

15 000

10 000

5 000

0
0 200 400 600 800 1000
saját tőke (millió Ft)

4.1. sz. ábra

A korbetöltött rokkantnyugdíjas férfiak megoszlása az


elltása összege alapján (2004. jan.)

50000
a nyugdíjasok száma (fő)

45000
40000
35000
30000
25000
20000
15000
10000
5000
0
0 20000 40000 60000 80000 100000
az ellátás összege (Ft)

102 Eredményeinken kevésbé lepődnénk meg, ha részletesen foglalkoztunk volna a


terjedelemmutatókkal. A nyugdíjak egy 100.000 egység szélességű, a saját tőkék pedig egy
750.000.0000 egység szélességű intervallumban helyezkednek el.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 84 ►


Statisztika Szóródás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 85 ►

4.2. sz. ábra

4.3. Gyakorló feladatok


Gyakorló feladatokat a 7. fejezet végén talál, de dolgozhat a 3. fejezet fel-
adataival is.

4.4. Összefoglalás

Az a jelenség, hogy az átlagolandó értékek eltérnek


szóródás
egymástól és az átlagtól.
1. terjedelem R = x max − x min
2. kvartilis terjede-
ITQ = Q3 − Q1
lem
3. átlagos eltérés
= az átlagtól való átlagos δ =
∑f d i i
(súlyozott)
mutatók
eltérés abszolút mutatója ∑f i
az átlag és az átlagolandó
értékek eltérésének kimutatá- 4. szórás
σ=
∑ f i d i2
sára = az átlagtól való átlagos ∑ fi
eltérés abszolút mutatója
(súlyozott)
5. relatív szórás σ
= az átlagtól való átlagos v =
xa
eltérés relatív mutatója
mutató
az átlagolandó értékek egy- nem képezi a számkérendő
átlagos különbség
mástól való eltérésének kimu- tananyag részét
tatására

a leggyakrabban használt mutatók: szórás + relatív


szórás
megjegyzések
a szórás formailag = négyzetes átlag, tehát
d min 〈σ 〈 d max

a szóródás vizsgálatának 1. az átlag jellemző voltának vizsgálata


célja 2. egyéb mutatók képzése

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 85 ►


Statisztika A gyakorisági görbék (eloszlások) alakjának vizsgálata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 86 ►

5. A gyakorisági görbék (eloszlások)


alakjának vizsgálata

5.1. Szimmetria – aszimmetria


A gyakorisági görbék alakjának vizsgálata azt a cél szolgálja, hogy megálla-
pítsuk az egyes vizsgált sokaságok eloszlása milyen irányban és milyen
mértékben tér el a normális eloszlás elméleti görbéjétől.
A normális eloszlás elméleti görbéje103:

Standard normális eloszlásfüggvény értékei

0,6
a z-változóhoz tartozó függvényé.

0,5
0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
z-változó

5.1.sz. ábra

A normális eloszlás szimmetrikus eloszlás, jellemzője, hogy


Mo = Me = x a . Ha a korábbi definíciókat végiggondoljuk – módusz a
gyakorisági görbe csúcspontjához tartozó érték, a medián a középső ér-
ték, a számtani átlag nagyságát a súlyok relatív nagysága befolyásolja – a
három középérték egyenlősége már természetesnek tűnik.
A szimmetria következtében a z = 0 ponttól balra és jobbra elhelyezkedő elemek
száma egyenlő, ill. a z = 0 ponttól balra és jobbra azonos „lépést megtéve”, mindig azo-
nos nagyságú súlyt (= előfordulást vagy relatív gyakoriságot = előfordulási valószínűséget
= előfordulási esélyt) találunk.

xi − x a
103 z= (Részletesebben a Becslés fejezetben)
σ

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 86 ►


Statisztika A gyakorisági görbék (eloszlások) alakjának vizsgálata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 87 ►

Az aszimmetria mérése, tehát, ezeket az értékeket felhasználva történhet.


Mutatói:
x a − Mo 3( x a − Me )
A= P=
σ σ

A képletekben szereplő betűk jelentése:


A= P= xa=
Pearson-féle aszimmetria Pearson-féle aszimmetria
mutató (1.) mutató (2.) számtani átlag
σ= Mo = Me =
szórás módusz medián

A mutatók előjele az aszimmetria irányát jelzi. A pozitív előjel baloldali


(= a gyakorisági görbe jobbra hosszan elhúzódik, az átlag a görbe csúcs-
pontjától jobbra található; lásd: 4.1. sz. ábra), a negatív előjel jobboldali
(= a gyakorisági görbe balra hosszan elhúzódik, az átlag a görbe csúcs-
pontjától jobbra található) aszimmetriát jelez.
Az A jelű mutató abszolút értékének elméleti felső határa nincs, de a
gazdasági statisztika gyakorlatában előforduló, többé-kevésbé szabályos
aszimmetrikus gyakorisági sorokra vonatkozólag igaz: A〈1 és a mutató
0,5-nél nagyobb abszolút értéket felvéve már erős aszimmetriát jelez.
A P jelű mutató is – a látszat ellenére (a képletben a medián szerepel),
– a módusz és a számtani átlag eltérésén alapszik. Mérsékelten aszimmetri-
kus sokaságokra ugyanis igaz, hogy a medián az átlag és a módusz, átlaghoz
közelebbi harmadoló pontján helyezkedik el, azaz x a − Mo = 3(x a − Me ) .
A mutató abszolút értékének elméleti felső határ három, de mérsékel-
ten aszimmetrikus sokaságok esetén nem szokott egynél nagyobb értéket
felvenni. Ha számításainkat osztályközös gyakorisági sorból végezzük,
akkor a gyakorlatban célszerűbb ezt a mutatót alkalmazni, mert a medián
értékét pontosabban tudjuk meghatározni (= becsülni).
Mind az A , mind a P , jelű mutató nevezőjében szerepel a szórás, az-
az nem egyszerűen a középértékeknek az aszimmetriára utaló eltérését
vesszük figyelembe. A szórással való osztásra azért van szükségünk, hogy
a vizsgált jelenség mérésére egy az adatok nagyságrendjétől és mértékegy-
ségétől független mutatószám álljon rendelkezésünkre. Következtetéseket
levonni, és összehasonlításokat végezni csak így áll módunkban.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 87 ►


Statisztika A gyakorisági görbék (eloszlások) alakjának vizsgálata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 88 ►

Ismertek és használatosak még további mutatók is, pl.: F0 , 25 (a kvartilisek és a


medián eltérésére alapozva) ill. F0 ,1 (decilisek és a medián eltérésére alapozva). A számí-
tógépes programok pedig egy α -jelű mutatóval dolgoznak (a momentumokra alapozva),
de ennek nincs elméleti felső határa, így értékéből igen nehéz bármilyen következtetés
levonni. (Ezek a mutatók nem képezik tananyagunk részét.)

Az szimmetria – aszimmetria kapcsán leírtak összefoglalása104:

5.2. sz. ábra

BEMUTATÓ FELADATOK I.

5.1. sz. tábla (az 1.5. és a 4.1. sz. táblák alapján)


Külföldi érdekeltségű vállalkozások saját tőke szerint, Magyarországon
2003-ban
saját tőke 150,1 – 200,1 – 250,1 – 500,1 –
– 150 750,1 – összesen
(millió Ft) 200 250 500 750
szerveze-
tek 22.958 362 283 718 315 1.128 25.764
( fi )
( f i′) 22.958 23.320 23.603 24.321 24.636 25.764 –

Korábbi számításainkból ismert, hogy x a = 173 millió Ft, és σ = 165 mil-


lió Ft.

104 Korpás Attiláné: Statisztika I. (Nemzeti Tankönyvkiadó, Budapest – 1996)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 88 ►


Statisztika A gyakorisági görbék (eloszlások) alakjának vizsgálata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 89 ►

A medián sorszáma105 = 12882,5; értéke pedig =


12.882,5 − 0
0+ (150 − 0) ≅ 84,2 millió Ft.
22.958
3(173 − 84,2 )
Így az aszimmetria: P = ≅ 1,61 , vagyis igen nagy mértékű.
165
Ha a sokaság ábrájára tekintünk (4.1. sz ábra), ezen nem is csodálkozha-
tunk.106

BEMUTATÓ FELADATOK II.

A korbetöltött rokkantnyugdíjas férfiak sokaságára vonatkozóan már meg-


határoztuk a számtani átlag: 60.314 Ft107, a módusz: 52.000 Ft108 és a
medián értékét: 56.00 Ft109, valamint a szórás nagyságát: 11.768 Ft110. Ez a
statisztikai sor azonos szélességű osztályközökbe rendezve tartalmazta az
adatokat, így mindkét tanult aszimmetria mutató értékét meghatározhatjuk:
60.314 − 52.000 3(60.314 − 56.300)
A= ≅ 0,47 és P = ≅ 0,68
17.768 17.768
♥ A vizsgált sokaságra a meglehetősen erős aszimmetria jellemző. (Ezt
jelzi az is, hogy a korábbiakban ismertetett, és a mérsékelten aszimmetri-
kus sokaságokra igaz, összefüggés most nem teljesül,
60314 − 52000 ≠ 3(60314 − 56300) → 8314 ≠ 3 * 4014 )

105 Lásd: 3.7. sz. fejezet


106 A másik tanult mutató meghatározására most nem kerülhetett sor, mert nem egyenlő
hosszúságú osztályközök esetére nem ismertük meg a módusz számítását.
107 Lásd: 3.2. fejezet
108 Lásd: 3.6. fejezet
109 Lásd: 3.7. fejezet
110 Lásd: 4.2. fejezet

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 89 ►


Statisztika A gyakorisági görbék (eloszlások) alakjának vizsgálata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 90 ►

5.2. Csúcsosság – lapultság


A tapasztalati gyakorisági görbék nemcsak jobbra vagy balra elhúzódva tér-
hetnek el a normális eloszlás elméleti görbéjétől, hanem abban is, hogy an-
nál hegyesebbek vagy lapultabbak. A csúcsosság (lapultság) mérésére
leggyakrabban a szélső kvartilisek ill. a szélső decilisekre alapozó „K”-jelű
mutatót (ennek értéke normális eloszlás esetén: 0,263) használják, ill. a szá-
mítógépes programok itt is egy α -jelű111 mutatóval operálnak. Ha egy adott
sokaságra kiszámítottuk „K” értékét és az az etalon-értéknél nagyobb, akkor
a sokaság görbéje lapultabb a normális eloszlás görbéjénél, (és fordítva).
Q3 − Q1 126 − 42
K= = ≅ 0,255
2(D9 − D1 ) 2(182 − 17 )

♥ A külföldi érdekeltségű magyar vállalkozások (2003) saját tőkéjük nagy-


sága alapján felírt tapasztalati eloszlás görbéje (= gyakorisági görbéje) va-
lamivel hegyesebb, mint a normális eloszlás elméleti görbéje.
A mutatóban szereplő kvartilisek és decilisek értékét, – tekintettel arra, hogy ezek
számítására csak utalást tettünk (a medián képletének értelemszerű alkalmazásával hatá-
rozható meg nagyságuk) – megadtuk. Jelentésük:
♥ Q3 = A vizsgált vállalkozások háromnegyed részének ≅126 millió Ft-nál ki-
sebb, egynegyed részének pedig ennél nagyobb a saját tőkéje.
♥ Q1 =A vizsgált vállalkozások egynegyed részének ≅42 millió Ft-nál kisebb,
háromnegyed részének pedig ennél nagyobb a saját tőkéje.
♥ D9 =A vizsgált vállalkozások kilenctized részének ≅182 millió Ft-nál kisebb,
egytized részének pedig ennél nagyobb a saját tőkéje.
♥ D1 = A vizsgált vállalkozások egytized részének ≅17 millió Ft-nál kisebb, ki-
lenctized részének pedig ennél nagyobb a saját tőkéje.
(Mindegyik adat kiszámítása a sorszám meghatározásával kezdődött, az előbbi sorrendben:
n +1 n +1 n +1 n +1
*3 , , *9 , . Majd megkerestük a kvartilisek ill. decilisek helyét
4 4 10 10
a kumulált gyakorisági sorban. Végül alkalmaztuk a már többször hivatkozott képletet.)

5.3. Gyakorló feladatok


Gyakorló feladatokat a 7. fejezet végén talál, de dolgozhat a 3. fejezet gya-
korló feladatival is.

111 Gond, hogy ennek sincsenek elméleti határai.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 90 ►


Statisztika A gyakorisági görbék (eloszlások) alakjának vizsgálata
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 91 ►

5.4. Összefoglalás
szimmetria a sokaság olyan eloszlása, amikor x a = Mo = Me
aszimmetria a sokaság olyan eloszlása, amikor x a ≠ Mo ≠ Me

fajtái 1. baloldali Mo〈 Me〈 x a


2. jobboldali Mo〉 Me〉 x a
x a Mo
A= baloldali aszimmetria
σ
mérőszámai (= mutatói) 3 * ( x a − Me ) esetén előjelük: „+”
P=
σ
jobboldali aszimmetria
(Q − Me ) − (Me − Q1 )
F= 3 esetén előjelük: „–”
(Q3 − Me ) + (Me − Q1 )

a mutatók etalon-értékei 0〈 A 〈 0,5 0〈 P 〈 3 0〈 F 〈 0,2


= a vizsgált sokaság eloszlás görbéjének eltérése a
csúcsosság (lapultság) normális eloszlás görbéjétől a függőleges tengely men-
tén
Q3 − Q1
mérőszáma K= =
2(D9 − D1 )
a mérőszáma etalon-
0,263
értéke

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 91 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 92 ►

6. A koncentráció

6.1. Fogalma, fajtái, kimutatása, mérése


A koncentráció szó általában összevonást, összpontosítást, tömörítést
jelent. Közgazdaságtanból ismert fogalom például a tőke-koncentrációja, az
eredetileg felaprózott kis tőkék (kisvállalatok) nagy tőkévé (nagyvállalatok-
ká) egyesülése; földrajzi, történelmi tanulmányainkból pedig tudjuk, hogy
egyes országok lakossága – egészen régi időktől fogva (koronként és or-
szágonként ugyan eltérő intenzitással, de) napjainkra egyre inkább a na-
gyobb települések köré csoportosul, ahol az emberek védelemre, munkára,
szolgáltatásokra és az élet legkülönbözőbb területein több lehetőségre
számíthatnak.

Koncentrációról a statisztika akkor beszél, ha a sokasághoz tartozó teljes


⎛ n ⎞
értékösszeg ⎜ ∑ si ⎟ jelentős része (vagy egésze) a sokaság kevés egységére
⎝ i =1 ⎠
összpontosul.

Ha egy vizsgált sokaság nagyon kicsi (= igen kevés elemből áll), akkor
beszélünk abszolút koncentrációról. (pl. a magyar autógyártás); ha viszont
a sokaság nagy (= sok, igen sok eleme van), akkor a definícióban szereplő
kevés kifejezés csak relatív módon (a teljes sokaság nagyságához viszonyít-
va) értelmezhető. Ha a sokaság egységei között az értékösszeg egyenlete-
sen oszlik meg, akkor a koncentráció teljes hiányáról szokás beszélni. A
lehető legnagyobb fokú koncentráció pedig az, amikor a teljes értékösz-
szeg egyetlen egységre jut.
A koncentráció fokát különböző mutatószámokkal jellemezhetjük.
Ezek egyik része inkább az abszolút, másik része inkább a relatív koncent-
ráció számszerű kimutatására alkalmas. Léteznek azonban olyan mutatók
is, melyek mindkét típus esetében jól használhatóak. A szakirodalomban
fellelhető sok mutató közül most csak néhányat emelünk ki.
Az abszolút koncentrációt legegyszerűbben az elemek (egységek)
számával ( = n ) vagy átlagos nagyságával (= x a ) jellemezhetjük. Minél ki-
sebb, pl. egy iparágban a termelőegységek száma és nagyobb az azokban
foglalkoztatott létszám átlagos nagysága, annál nagyobb az abszolút kon-
centráció.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 92 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 93 ►

A relatív koncentráció mértékét legszemléletesebben az un. Lorenz-


görbe mutatja be. A Lorenz-görbe a kumulált relatív gyakoriságok (g i′ )
függvényében ábrázolja a kumulált relatív értékösszegeket (zi′ ) . A függ-
vényt egy négyzetben, melynek átlója (a zérus ponttól fut az
k k

∑g = ∑z
i =1
i
i =1
i = 1 pontig) alatt szokás elhelyezni. Az átló (g i′ = zi′ ) fejezi ki

a koncentráció teljes hiányát. Ha a görbe az átlóhoz közel helyezkedik el,


akkor a koncentráció alacsony (minél közelebb, annál alacsonyabb); ha a
görbe az átlótól távol helyezkedik el, akkor a koncentráció magas (minél
távolabb, annál magasabb.) A Lorenz-görbe megszerkesztése előtt célsze-
rű meggyőződni arról, hogy az éppen vizsgált sokaságban jelen van-e egy-
általán a koncentráció. Erre a relatív gyakoriságok (g i ) és a relatív érték-
összegek (zi ) összevetése alapján következtethetünk. Ha az alacsony érté-
kű ismérvértékek esetén g i 〉 zi , a magas értékűeknél pedig megfordul a
nagyságrendi reláció, akkor a koncentráció egész biztosan jelen van, ele-
mezhető.
A Lorenz-görbe nevezetes pontja az átlagpont. Ennek abszcisszája112
az átlagnál kisebb egységek sokaságon belüli arányát, ordinátája113 pedig az
ezekhez tartozó értékösszeg arányát mutatja. Az átlagpont koordinátáit
megállapíthatjuk, ha meghúzzuk a Lorenz-görbe átlóval párhuzamos érin-
tőjét, és az érintési ponthoz tartozó értékeket leolvassuk mind a két ten-
gelyről. A gyakorlatban ezt a pontot csak akkor tanácsos meghatározni, ha
a görbét meglehetősen sok pontja alapján (= folytonosnak tekinthető)
szerkesztettük meg.
A Lorenz-görbe és az átló által bezárt területet koncentrációs terü-
letnek nevezzük. Ha ezt a területet az átló alatti egész területhez viszonyít-
juk, akkor kapjuk meg az un. koncentrációs együtthatót. Ennek értéke
egyszerűbben (a területek tényleges ismerete nélkül) is meghatározható114.
G
L=
2 xa

112 Abszcissza = a pont távolsága zérustól a vízszintes tengelyen mérve.


113 Ordináta = a pont távolsága zérustól a függőleges tengelyen mérve.
114 A matematikai bizonyítást mellőzzük.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 93 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 94 ►

A képletben szereplő betűk jelentése:


L= G= xa=
koncentrációs együttha-
átlagos különbség115 számtani átlag

A koncentráció leggyakrabban használt általános mutatói (= mind az
abszolút, mind a relatív koncentráció mértékét kifejezik) CR-arányszám és a
HI-index (Herfindahl-index).
A CR-arányszám megmutatja, hogy a sokaság néhány legnagyobb egysége,
hogyan részesedik a teljes értékösszegből. Rendszerint a 3 – 20 legnagyobb
egységet szokás használni a koncentráció jellemzésére. Különösen kedvel-
tek a négy legnagyobb egységnek a teljes értékösszegből való részesedését
mutató arányszámok. Ha például egy ország autógyártásának 70 %-a a négy
legnagyobb gyár adja, akkor az ország autóipara erősen koncentrált.
1
A HI-index és 1 határok között mozogva méri a koncentráció nagysá-
n
gát. A koncentráció hiánya esetén minden egység egyformán részesedik a
1
teljes értékösszegből, ezt jelzi: . Ez az index, pl. öt gyár (HI = 0,2) létezése
n
esetén egy iparág koncentrációját feltétlenül nagyobbnak jelzi, mint nyolc
gyár (HI = 0,125) működése esetén. A HI-index nagysága azonban nemcsak a
sokaság egységeinek számától függ, hanem a megfigyelt értékek szóródásától
is. Az eddigieket figyelembe véve számítása a következő képletekkel történik.
k
v2 +1
HI = ∑ zi2 vagy HI =
i =1 n

A képletekben szereplő betűk jelentése:


HI = si
zi = = σ
k
v= =
Herfindahl-index = a
koncentráció általános
∑s
i =1
i xa
mutatója relatív szórás
relatív értékösszeg116
n = az eltérő ismérvértékek (bemutató példáinkban az osztályközök) száma

115 Értékét – ha a példamegoldásokhoz szükséges – megadjuk.


116Tulajdonképpen zi is egy relatív gyakorisági mutató. Az új jelölést azért alkalmazzuk,
hogy jól elkülöníthető legyenek a Lorenz-görbe abszcisszái és ordinátái.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 94 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 95 ►

BEMUTATÓ FELADATOK I.

A külföldi érdekeltségű magyar vállalkozások saját tőke szerinti koncentrá-


cióját vizsgáljuk.

6.1. sz. tábla (4.3. sz. tábla alapján)


xi gi g i′ zi zi′ zi2
125 0,891088 0,891088 0,644902 0,644902 0,415899
175 0,014051 0,905139 0,014236 0,659138 0,000203
225 0,010984 0,916123 0,014309 0,673448 0,000205
375 0,027868 0,943992 0,060507 0,733955 0,003661
625 0,012226 0,956218 0,044243 0,778197 0,001957
875 0,043782 1 0,221803 1 0,049196
összesen 1 – 1 – 0,471121

♥ A vizsgált 25.764 vállalkozás 1,5 %-a rendelkezik átlagosan 175 mil-


lió Ft értékű saját tőkével.
♥ A vizsgált 25.764 vállalkozás 91,6 %-nak legfeljebb 250117 milliót Ft
értékű a saját tőke állománya.
♥ A vizsgált 25.764 vállalkozás összes saját tőkéjének (≅ 4.449,9 milli-
árd Ft) 6 %-ával azok a vállalatok rendelkeznek, melyek saját tőkéje 250 és
500 millió Ft között van.
♥ A vizsgált 25.764 vállalkozás összes saját tőkéjének (≅ 4.449,9 milli-
árd Ft) 77,8 %-a olyan vállalkozások kezében van, melyeknek saját tőke
állomány legfeljebb 750 millió Ft.

117 Lásd: 4.1. sz. tábla

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 95 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 96 ►

A külföldi érdekeltségű magyar vállalkozások


saját tőke szerinti koncentrációja

1
kumulált relatív értékösszeg
0,8

0,6

0,4

0,2

0
0 0,2 0,4 0,6 0,8 1
kumulált relatív gyakoriság

6.1. ábra

A Lorenz-görbét az 6.1. sz. tábla vastagon bekeretezett oszlopainak adatai


alapján szerkesztettük meg.

A 0 pontból induló egyenes a négyzet átlója, a koncentráció hiányát jelzi.


Az ugyanonnan induló görbe alapján alacsony mértékű koncentrációról
beszélhetünk. Ennek az az oka, hogy bár az értékösszeg több mint fele
egyetlen osztályközben (az elsőben) található, de igen nagymértékű (a szé-
les terjedelem miatt) a sokaság szórása.

A koncentráció számszerű mértéke:


k
v 2 + 1 0,956 2 + 1
HI = ∑ zi2 = 0,471121 vagy HI = = = 0,319 118
i =1 n 6

Mindkét számérték a mutató elméleti alsó határához ⎛⎜ 1 ≅ 0,17 ⎞⎟ van köze-


⎝6 ⎠
lebb, tehát a Lorenz-görbéhez hasonlóan alacsony koncentrációt jeleznek.119

118 A mutató számításához szükséges adatokat a 4.1. táblához tartozó számításokból vettük.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 96 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 97 ►

BEMUTATÓ FELADATOK – II.

A korbetöltött rokkantnyugdíjas férfiak koncentrációja havi


ellátásuk alapján

0,8
kumulált relatív értékösszeg

0,6

0,4

0,2

0
0 0,2 0,4 0,6 0,8 1
kumulált relatív gyakoriság

6.2. ábra

119 Számértékűk eltérésnek oka, hogy kevés osztályközzel dolgoztunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 97 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 98 ►

6.2. sz. tábla (a 4.2. sz. tábla alapján)

xi gi g i′ zi z i′ zi2
1,62761E-
5.000 0,00015 0,00015 1,3E-05 1,3E-05
10
3,04595E-
15.000 0,0007 0,00086 0,00017 0,00019
08
3,75054E-
25.000 0,00467 0,00553 0,00194 0,00212
06
35.000 0,05703 0,06256 0,0331 0,03522 0,00109536
45.000 0,25556 0,31812 0,19067 0,22589 0,036355081
55.000 0,28760 0,60572 0,26226 0,48815 0,068779823
65.000 0,15967 0,76538 0,17207 0,66022 0,029609406
75.000 0,08872 0,85411 0,11033 0,77055 0,012171982
85.000 0,05521 0,90932 0,07781 0,84836 0,006054188
95.000 0,03754 0,94686 0,05913 0,90748 0,003495844
105.000 0,05314 1 0,09252 1 0,008559179
1 – 1 – 0,166124644

A Lorenz-görbét most is a vastagon bekeretezett oszlopok adatai alapján


szerkesztettük meg. Az átló és a görbe elhelyezkedéséből a koncentráció
igen csekély voltára, gyakorlatilag hiányára következtethetünk. Ugyanezt
jelzi a Herfindahl-index is ≅ 0,17

6.2. Gyakorló feladatok


Gyakorló feladatokat a 7. fejezet végén talál, de dolgozhat a 3. fejezet gya-
korló feladatainak adataival is.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 98 ►


Statisztika A koncentráció
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 99 ►

6.3. Összefoglalás
koncentráció
általánosságban: = összevonás, összpontosítás, tömörítés
= ha a sokasághoz tartozó teljes értékösszeg jelentős
statisztikában
része a sokaság kevés egységére összpontosul, azaz
ha xi akkor
kis értékű g i 〉 zi
nagy értékű g i 〈 zi
1. abszolút
fajtái
2. relatív
1. Lorenz-görbe
kimutatás
2. koncentrációs együtthatók
= egy egységnyi oldalú négyzetben elhelyezett vonaldi-
Lorenz-görbe
agram
vízszintes tengelyen: kumulált relatív gyakoriság (g ′)i
függőleges tengelyen kumulált relatív értékösszeg (zi′ )
ha nagy a koncentráció a görbe messze van az átlótól
ha kicsi a koncentráció a görbe közel van az átlóhoz
= a koncentrációs terület és a az átló alatti terület há-
nyadosa
G
koncentrációs együttha- =K =
tók 2 xa
k
v2 +1
HI = ∑ zi2 ≅ HI =
i =1 n
0〈 K 〈1 alsó = nincs koncentráció
az együtthatók határértékei 1
〈 HI 〈1
n felső = erős (teljes) a koncentráció

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 99 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 100 ►

7. Az ismérvek közötti kapcsolat

A sokaságok egyszerre több ismérv szerinti


vizsgálata
Két egyetemi évfolyam hallgatóinak (90 – 90 kiválasztott személynek)
tettük fel a kérdést, sportol-e rendszeresen, avagy sem. A kapott válaszo-
kat a hallgatók nemét is figyelembe véve kombinációs táblákba rendeztük.
7.1.1. sz. tábla
I. évfolyam II. évfolyam
nem→
férfiak nők férfiak nők
sportol?↓ összesen összesen
fő fő

igen 15 30 45 27 18 45
nem 15 30 45 3 42 45
összesen 30 60 90 30 60 90

7.1.2. sz. tábla


I. évfolyam II. évfolyam
nem→
férfiak nők férfiak nők
sportol?↓ összesen összesen
% %

igen 50 50 50 90 30 50
nem 50 50 50 10 70 50
összesen 100 100 100 100 100 100

7.1.3. sz. tábla


I. évfolyam II. évfolyam
nem→
férfiak nők férfiak nők
sportol?↓ összesen összesen
% %

igen 50 50 100 60 40 100


nem 50 50 100 6,7 93,3 100
összesen 33,3 66,7 100 33,3 66,7 100

Hasonlítsuk össze a két évfolyamra vonatkozó adatokat!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 100 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 101 ►

Az I. évfolyamon mind a férfiaknak, mind a nőknek ugyanakkora hányada


sportol ill. nem sportol. A II. évfolyam esetében viszont ezek az arányok nem
azonosak. A férfiakra jellemező, hogy sportolnak, 90 százalékuk válaszolt
igennel; míg a nőkre inkább az a jellemező, hogy nem sportolnak, 70 százalé-
kuk válaszolt nemmel. A II. évfolyam adatai alapján elmondható, hogy a „fér-
fi” ismérvváltozat vonzza a „sportol, a „nő” ismérvváltozat pedig a „nem
sportol” ismérvváltozatot. Ezeket az adatokat ismerve a II. évfolyamon a 91.
hallgató nemét ismerve (férfi) nyugodtan gondolhatunk (asszociálhatunk) arra,
hogy az illető sportol, és gondolatunk 90 %-os biztonsággal igaznak tűnik.
Megfigyelhetjük továbbá, hogy az I. évfolyamra vonatkozó, az eredeti
megfigyelt adatokat tartalmazó 7.1.1. sz. tábla egyik ill. másik oszlopának
belső rovataiban (kettős vonallal kerítettük) azonos számok szerepelnek; a
megoszlási viszonyszámokat tartalmazó 7.1.2.sz. (100 % = a férfiak ill. a
nők száma), valamint a 7.1.3.sz. (100 % = a sportolók ill. a nem sportolók
száma) táblákban pedig csupa azonos adatot láthatunk. Ezzel szemben a II.
évfolyamra vonatkozó táblák adatai nem egyformák, viszont mindhárom
táblában a bal felső sarokból a jobb alsó sarokba tartó átlón (szürke háttér-
rel kiemeltük) helyezkednek el a nagyobb számok, az ezekhez tartozó is-
mérvváltozat-párokról írtuk az előbbiekben azt, hogy vonzzák egymást.
Általánosítsuk tapasztalatainkat!
A sokaságok elemei (mindig) több különféle tulajdonsággal rendelkeznek, azaz
a legkülönbözőbb ismérvek szerint rendezhetők, elemezhetőek. Ha a sokasá-
gok elemeit tulajdonságaik alapján csoportosítjuk, azaz az ismérvváltozatok
szerint rendezzük, akkor a különféle szempontok alapján megmutatkozó szer-
kezetük mutathat hasonlóságot, azonosságot, de lehet teljesen eltérő is. Ragad-
junk ki az elméletileg lehetséges szempontok szerint most csak kettőt, melyek-
ről azt gondoljuk, van köztük valamilyen kapcsolat! Tekintsük az egyik szem-
pontot befolyásoló tényezőnek, a másikat befolyásolt tényezőnek, és vé-
gezzük el a sokaság csoportosítását egyszerre a két szempont szerint! Az ada-
tok így egy kombinációs táblába rendezhetőek. Ennek általános sémája:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 101 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 102 ►

7.2. sz. tábla


az egyik ismérv
változatai →
y1 y2 …… yj ….. yt összesen
a másik ismérv
változatai↓
x1 f 11 f 12 f1 j f 1.
x2 f 21 f 2.
….
xi f i1 f ij f i.
….
xs f is
összesen f .1 f .2 f. j n

A kombinációs tábla sémájában szereplő betűk jelentése:


xi = yj = f ij =
az egyik ismérv változatai a másik ismérv változatai megfigyelt gyakoriságok
f. j = f i. = i = 1....s =
a megfigyelt gyakoriságok a megfigyelt gyakoriságok az egyik ismérv vál-
oszlop szerinti összesen adata sor szerinti összesen adata tozatainak száma

f . j és f i . = j = 1....t =
a másik ismérv válto-
peremgyakoriságok zatainak száma
s t s t
n = ∑ f i . = ∑ f . j = ∑∑ f ij =
s〈t
i =1 j =1 i =1 j =1 a Csuprov és a
a megfigyelt sokaság elemeinek száma Cramer mutatónál
Ha a megfigyelt előfordulások mindegyike a tábla főátlójában helyezkedik
el (árnyékolással jeleztük), akkor azt mondhatjuk, hogy az egyik ismérvhez
való tartozás egyértelműen meghatározza a másik ismérvhez való tarto-
zást. (Nagyon fontos szem előtt tartani, hogy az egyértelműen kifejezéssel
nagyon óvatosan kell bánnunk. Statisztikai vizsgálataink ugyanis szinte
mindig a sztochasztikus = közelítő jellegű kapcsolatokra terjednek ki, me-
lyek erősségét befolyásolja a megfigyelés helye, ideje, köre stb. ill. az a

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 102 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 103 ►

tény, hogy az esetek többségében nem a teljes, hanem csak mintasokasá-


gokkal dolgozunk.) Ha az előfordulási adatok a főátló körül tömörülnek,
és attól távolodva egyre kisebbek, akkor az egyik ismérvhez való tartozás
erősen befolyásolja a másik ismérvhez való tartozást. Ha pedig az előfor-
dulási adatok a tábla majdnem minden rovatában azonos (megközelítő-
en azonos) nagyságúak, akkor az egyik ismérvhez való tartozás nem be-
folyásolja a másik ismérvhez való tartozást. Az előfordulási adatok táblá-
ban való elhelyezkedése jelzi ugyan, hogy létezik-e az ismérvek között
kapcsolat, sőt utal annak erősségére, de nem egzakt mutatója annak. A
mutatószámok kapcsolattípusonként különbözőek.
A következőkben ismérvek közötti kapcsolatok három típusát tárgyaljuk.
1. Asszociáció = a megfigyelt adatok csoportosításához két minőségi,
két területi vagy egy minőségi és egy területi ismérvet használunk.
2. Vegyes kapcsolat = a megfigyelt adatok csoportosításához egy minő-
ségi (= befolyásoló tényező) és egy mennyiségi (= befolyásolt tényező)
ismérvet használunk.
3. Korreláció = a megfigyelt adatok csoportosításához kettő vagy több
mennyiségi ismérvet használunk. Ebben az esetben a befolyásolt és a
befolyásoló tényező szerepe – két ismérv esetén – általában felcserél-
hető. Több ismérv esetén pedig a befolyásoló tényezők száma nő.

7.1. Asszociáció
Tekintettel arra, hogy ebben az esetben az ismérvváltozatok nem számokkal
fejezhetők ki, a kapcsolat szorosságát kifejező mutatók a megfigyelt ( f ij ) és
( )
a függetlenséget kifejező f ij* előfordulásokra alapoznak. A független ese-
mények egyszerre történő bekövetkezésének valószínűségéről tanultak120
felhasználásával tudjuk meghatározni az elméleti előfordulásokat, amelyek
megmutatják, hogy xi , y j ismérvváltozat-pároshoz a sokaság hány eleme
tartozna, ha az ismérvek között nem lenne kapcsolat. Összehasonlítva a
kétféle előfordulást tudunk következtetni a kapcsolat szorosságára. Ha ( f ij )
( )
és f ij* adatok rendre azonosak, akkor az ismérvek között nincs kapcsolat
(= függetlenek egymástól), ha pedig eltérésük igen nagy, akkor a kapcsolat
erős. Annak érdekében, hogy ezt az „igen nagy” kifejezést ne szubjektív
módon értelmezzük, meg kell határozni azt az elméleti értéket, amihez a

120 Két független esemény egyszerre történő bekövetkezésének valószínűsége egyenlő a


két esemény bekövetkezési valószínűségének szorzatával.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 103 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 104 ►

különbségeket hasonlítani lehet. Így egy mértékegység nélküli mutatószám-


hoz jutunk, ami a különböző időpontokban, helyeken, és a különböző soka-
ságokra vonatkozó számításaink összehasonlítását is lehetővé teszi.
Az asszociáció leggyakrabban használt mutatói:

χ2
Csuprov-féle mutató: T =
n (s − 1)(t − 1)

χ2
Cramer-féle mutató: C =
n (s − 1)
Ha az ismérvváltozatok száma mindkét ismérvre vonatkozóan kettő121, akkor a
mutató egyszerűsíthető:

f 22 f11 − f12 f 21 g 22 g11 − g12 g 21


Yule-féle mutató: a = ≅
f 22 f11 + f12 f 21 g 22 g11 + g12 g 21

Az asszociációra vonatkozó képletekben szereplő betűk jelentése:


T = a Csuprov-féle asz- C = a Cramer-féle asszo- a = a Yule-féle asszociá-
szociációs együttható ciációs együttható ciós együttható
s = az egyik ismérv válto- t = a másik ismérv válto- n = a sokaság elemeinek
zatainak száma (s 〈 t ) zatainak száma (s 〈 t ) száma122
f i. f . j
χ 2 = ∑∑
s t (f ij − f ij* )
2
f ij = a megfigyel gyako- f ij* =
n
= a függet-

i =1 j =1 f ij* riságok lenséget kifejező számított


előfordulások123
g ij = a megfigyelt elő-
f i . = sor szerinti perem- f . j = oszlop szerinti
fordulásokból számított
gyakoriságok peremgyakoriságok
relatív gyakoriságok

121 A csupán két ismérvváltozatú ismérveket nevezik alternatív ismérveknek.


122 Lásd a kombinációs tábla általános sémájánál található betűjel-magyarázatot.
123 Az egyik ismérv szerinti előfordulás valószínűsége = f i. , a másik ismérv szerinti
n
előfordulás valószínűsége = f . j . Szorzatuk adja az egyszerre történő bekövetkezés való-
n
színűségét, ezt kell az elemszámmal szorozni, hogy a megfigyelttel azonos mértékegységű
adathoz jussunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 104 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 105 ►

A mutatók jelentésének megfogalmazásához ismernünk kell azok határér-


tékeit, és a határértékek jelentését.
mutató határok
Csuprov-féle asszociáci-
0〈T 〈1 , ha s = t 0〈T 〈 4
(s − 1) , ha s〈t
ós együttható (t − 1)
Cramer-féle asszociációs
0〈C 〈1
együttható
Yule-féle asszociációs (megoszlási viszonyszám
0〈a 〈1
együttható jellegű mutató)124
jelentések 0 = (alsó határ) = 1 = (felső határ) = szoros
mindhárom esetben nincs kapcsolat a kapcsolat

BEMUTATÓ FELADAT

A Magyar statisztikai évkönyv125 adatait felhasználva 1992 és 2003 évekre


vonatkozóan a foglalkoztatottakat egyszerre két ismérv (ágazat = minő-
ségi ismérv ill. nem = minőségi ismérv) szerint csoportosítottuk. Egy-
részt kíváncsiak voltunk arra, hogy van-e kapcsolat az ágazatok és a foglal-
koztatottak neme között. (Van-e olyan ágazat, amelyik „vonzza” férfiakat,
ill. van-e olyan, amelyik „vonzza” a nőket?) Másrészt kíváncsiak voltunk
rajta, hogy megváltozott-e a mutató értéke az eltelt évtized alatt?
A 7.3. sz. tábla első része (I.) az 1992-re, a 7.4. sz. tábla első része (I.) pedig a 2003-
ra vonatkozó megfigyelt adatokat tartalmazza. Ezekből megtudjuk pl., hogy 1992-
ben a mezőgazdaságban 316.700 (= f 1;1 ) (68,8 %) férfi és 143.400 ( f 1;2 ) (31,2 %)
nő dolgozott. Az adott ágazatban foglalkoztatottak létszáma 2003-ra jelentősen (-
53,2 %) csökkent, és megváltozott a férfiak nők aránya is. 2003-ban a mezőgazdaság
166.600 (= f 1;1 ) (77, 4 %) férfi és mindössze 48.600 ( f 1;2 ) (22,6 %) nő számára
biztosított munkahelyet. Vannak azonban olyan ágazatok is (építőipar, kereskedelem
stb.), ahol éppen ellenkező előjelű változások történtek, azaz nőtt a dolgozók lét-
száma. Ha a nemzetgazdaság egészére vonatkozó adatokat vesszük szemügyre (ösz-
szesen sor), akkor szintén csökkenést figyelhetünk meg. 2003-ban 1,6 %-kal keve-

124 Figyelje meg a mutató számlálója és nevezője ugyanazokat a szorzatokat tartalmazza,


csak a szorzatok közötti előjel különböző!
125 Magyar Statisztikai évkönyv 2003 (KSH, 2004)
http://portal.ksh.hu/pls/ksh/docs/hun/xftp/idoszaki/merofelm/merofelm

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 105 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 106 ►

sebb férfi és 3,7 %-kal kevesebb női munkavállalóról tudott a statisztika. A létszám-
változások mellett egy csekély mértékű arányváltozást is megfigyelhetünk. A férfiak
aránya 53,7 %-ról 54,2 %-ra (0,9 %-kal, azaz 0,5 százalékponttal) nőtt, a nőké pedig
46,3 %-ról 45,8 %-ra (-1,1 %, azaz -,5 százalékponttal) csökkent.126
A 7.3. sz. és a 7.4. sz. táblák második része (II.) a függetlenséget feltéte-
lező adatokat tartalmazza. Az építőipar sorában, a férfiak oszlopában ta-
lálható szám (116.400 = f 5*; 2 ) azt jelenti, hogyha semmiféle kapcsolat nem
lenne a foglalkoztatottak ágazat és a nem szerinti megoszlása között, akkor
ebben a rovatban nem a megfigyelt 184.300 főnek, hanem ennél keve-
sebbnek (116.400 fő = f 5; 2 ) kellene szerepelnie.
A táblák harmadik része (III.) a megfigyelt és a függetlenséget kifejező
adatok összehasonlítását, a mutatók (Csuprov, Cramer) számlálójában
szereplő χ 2 részszámításait tartalmazza. Így a Csuprov-féle mutató érté-
ke 1992-ben ill. 2003-ban:

452,3966 563,328
T= ≅ 0,1766 T = ≅ 0,1996
4025,8 (2 − 1)(14 − 1) 3922 (2 − 1)(14 − 1)

A Cramer-féle mutató értéke pedig 1992-ben ill. 2003-ban:

452,3966 563,328
C= ≅ 0,3352 C= ≅ 0,379
4025,8 * (2 − 1) 3922 * (2 − 1)
A mutatók alsó (= 0) ill. felső (Cramer: 1, Csuprov: 0,5266) határait figye-
lembe véve levonhatjuk a következtetést, hogy
♥ a foglalkoztatottak gazdasági ágazat és nem szerinti megoszlása kö-
zött van kapcsolat, s ez a kapcsolat az eltelt évtized alatt erősebbé vált. (A
mutatók értéke nőtt.)
Befejezésül fontos megjegyeznünk, hogy
• A Cramer-féle mutató számértéke, ha s〈 t , akkor mindig nagyobb.
(Csak a kisebbik ismérvváltozat darabszám szerepel a nevezőben.)
• A tananyag második felében – hipotézisellenőrzés – megismerünk
majd egy módszert annak kimutatására, hogy a mutatók által jelzett
kapcsolat jelentős (= szignifikáns) mértékű-e avagy sem.

126A 6.3. és a 6.4. sz. táblák adatainak elemzése során dinamikus és megoszlási viszony-
számokat számítottunk. (Lásd: 2.1., 2.3. fejezetek.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 106 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 107 ►

7.3. sz. tábla


1992 1992
1992 függetlenséget felté- a megfigyelt és a függet-
megnevezés megfigyelt adatok telező adatok lenséget feltételező adatok
f i. * f . j összehasonlítása = χ ösz-
2
f ij
f ij* =
n szetevőinek számítása127
I. II. III.
ágazat férfi nő össz. férfi nő össz. férfi nő össz.
mező-gazd. 316,7 143,4 460,1 247,01 213,09 460,1 19,662 22,791 42,453
bányászat 45,5 7,2 52,7 28,29 24,41 52,7 10,465 12,131 22,597
feldolgozó
590,6 462,9 1.053,5 565,58 487,92 1053,5 1,106 1,283 2,389
ipar
villamos-
76,7 31,4 108,1 58,03 50,07 108,1 6,003 6,959 12,962
energiaipar
építőipar 184,3 32,5 216,8 116,39 100,41 216,8 39,621 45,928 85,549
kereskedelem 200,7 279,7 480,4 257,90 222,49 480,4 12,690 14,710 27,400
vendéglátás 48,7 66,9 115,6 62,06 53,54 115,6 2,877 3,334 6,211
szállítás 243 103,4 346,4 185,96 160,43 346,4 17,490 20,274 37,763
pénzügyi
16,5 52,2 68,7 36,88 31,82 68,7 11,264 13,057 24,321
szolgáltatás
ingatlanügyek 68,4 71,9 140,3 75,32 64,98 140,3 0,636 0,737 1,373
közigazgatási
134,8 101,9 236,7 127,08 109,63 236,7 0,470 0,544 1,014
szolgáltatás
oktatás 75,4 236,4 311,8 167,39 144,41 311,8 50,556 58,604 109,161
egészségügy 58,9 177,4 236,3 126,86 109,44 236,3 36,407 42,203 78,610
egyéb szolg. 101,1 97,3 198,4 106,51 91,89 198,4 0,275 0,319 0,594
összesen 2.161,3 1.864,5 4.025,8 2.161,3 1.864,5 4.025,8 209,522 242,875 452,3966

127 A számításokat az EXCEL programmal végeztük. Az adatokat a matematika szabályai


szerint kerekítettük. Ha azonban soronként ill. oszloponként ellenőrizni kívánja az össze-
adásokat, akkor kis „hibát” találhat, mert a gép a háttérben a nem kerekített adatokkal
dolgozik. Ez a megjegyzés minden további táblánkra igaz, ahol a terjedelem miatt nem
tekinthettünk el a kerekítésektől.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 107 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 108 ►

7.4. sz. tábla


2003
2003
a megfigyelt és a füg-
2003 függetlenséget feltétele-
getlenséget feltételező
megnevezés megfigyelt adatok ző adatok adatok összehasonlítá-
f ij f i. * f . j
sa = χ összetevőinek
2
f ij* =
n
számítása128
ágazat férfiak nők össz. férfiak nők össz. férfiak nők össz.
mezőgazd. 166,6 48,6 215,2 116,686 98,5134 215,2 21,351 25,290 46,640
bánya 11 1,8 12,8 6,940 5,860 12,8 2,374 2,812 5,187
feldolgozó
547,3 378,2 925,5 501,828 423,672 925,5 4,120 4,880 9,001
ipar
villamos
50,2 18 68,2 36,980 31,220 68,2 4,726 5,598 10,324
energiaipar
építőipar 275,1 24,3 299,4 162,342 137,058 299,4 78,319 92,767 171,086
kereskedelem 267,6 285,5 553,1 299,904 253,196 553,1 3,480 4,121 7,601
vendéglátás 59,7 79,7 139,4 75,586 63,814 139,4 3,339 3,955 7,293
szállítás 219,5 83,7 303,2 164,402 138,798 303,2 18,467 21,871 40,338
pénzügyi
22,6 50,2 72,8 39,474 33,326 72,8 7,213 8,544 15,757
szolgáltatás
ingatlanügyek 143,7 122,3 266 144,231 121,769 266 0,002 0,002 0,004
közigazgatási
151,5 143,9 295,4 160,173 135,227 295,4 0,470 0,556 1,026
szolgáltatás
oktatás 71,4 257,6 329 178,391 150,609 329 64,169 76,006 140,175
egészségügy 62,5 204,7 267,2 144,882 122,318 267,2 46,844 55,485 102,329
egyéb szolgál-
77,9 96,9 174,8 94,781 80,019 174,8 3,006 3,561 6,568
tatás
összesen 2126,6 1795,4 3922 2126,6 1795,4 3922 257,879 305,45 563,328

128 Lásd: a 7.3. sz. táblához csatolt lábjegyzet.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 108 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 109 ►

7.2. Vegyes kapcsolat


Vegyes kapcsolatról beszélünk, ha a megfigyelt adatok csoportosításához
egy minőségi (= befolyásoló tényező, csoportképző ismérv) és egy mennyi-
ségi (= befolyásolt tényező) ismérvet használunk, például, ha arra vagyunk
kíváncsiak, hogy egy vállalkozás (nemzetgazdasági ág, vagy az egész nem-
zetgazdaság) férfi és női dolgozóinak keresete (bére, jövedelme) között
van-e eltérés, azaz befolyásolja-e a fizetéseket a foglalkoztatottak neme.
A kapcsolat erősségének kimutatására a szórásokat használjuk fel. Egy
összetett sokaság esetén kétféle számtani átlag és háromféle szórást értékét
határozhatjuk meg.
• Az egyes részsokaságokra vonatkozóan a részátlagokat (= x j ) ,
• az egész sokaságra vonatkozóan pedig a főátlagot ( x ) számíthatunk.
Majd ezek ismeretében vizsgálhatjuk:
• az egyes részsokaságokban az átlagolandó értékek és az adott csoport
részátlagának átlagos eltérését (= csoportszórás = σ j ), és a csoport-
szórásokat átlagolhatjuk is (= belső szórás = σ B ).
• Vizsgálhatjuk az egyes átlagolandó értékek és a főátlag átlagos eltérését
(= teljes szórás = σ T ).
• Végül kiszámíthatjuk a részátlagok és a főátlag átlagos eltérését (=
külső szórás = σ K ).
A felsorolt átlagok és szórások számítása. Jelöléseink részben a 7.2. sz.
táblához igazodnak, ill. – egyes esetekben – egyszerűbb súly-jelölések is
szerepelnek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 109 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 110 ►

részátlag = csoport
főátlag
átlag
az átlagolandó értékek- a részátlagokból:
s ből:
∑f ij xi s
t

∑ f. j x j
t

∑n x
xj = i =1
s ∑f i. i x
x=
j =1
=
j =1
j i

∑f x= i =1 t t

i =1
.j

∑f
s

i.
∑f j =1
.j ∑n j =1
j

i =1

∑ f (x ij i − xj)
2

csoportszórás σj = i =1
s

∑f
i =1
.j

t t

∑ f . jσ 2j
j =1
∑n σ
j =1
j
2
j

belső szórás σB = t
= t

∑f
j =1
.j ∑n j =1
j

t t

∑ f . j (x j − x )
j =1
2
∑ n (x
j =1
j j − x)
2

külső szórás σK = t
= t

∑f
j =1
.j ∑n
j =1
j

teljes szórás
az alapadatokból:
s az összefüggés alapján:
∑ f (x i. i − x)
2

σ T = σ B2 + σ K2
σT = i =1
s

∑f
i =1
i.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 110 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 111 ►

A képletekben szereplő betűk jelentése:


f i . = a megfigyelt gyako-
xi = a befolyásolt ismérv f ij = megfigyelt gyakori-
riságok sor szerinti össze-
változatai ságok
sen adata
f . j = a megfigyelt gyakoriságok oszlop szerinti ösz- i = 1....s = az egyik is-
szesen adatai, ezeket gyakran így is jelölik: n j mérv változatainak száma
j = 1....t = a másik is-
f . j és f i . = peremgyakoriságok
mérv változatainak száma
s t t s t
n = ∑ f i . = ∑ f . j = ∑ n j = ∑∑ f ij = a megfi- x j = részátlag = cso-
i =1 j =1 j =1 i =1 j =1
portátlag
gyelt sokaság elemeinek száma
x = főátlag x j = részátlag σ j = csoport szórás
σ B = belső szórás σ K = külső szórás σ T = teljes szórás
A szórások (külső – belső – teljes) közötti összefüggés bizonyítása129 a
következő elgondolásból indul: ( xi − x ) = (xi − x j ) − (x j − x ) .
Számítsuk ki, hogy a teljes szórásnégyzet hányad részét (hány százalékát)
teszi ki egyik ill. másik összetevője!

σ K2 σ B2
1= +
σ T2 σ T2
Az így kapott megoszlási viszonyszámok közül mutatóul a külső szórás-
négyzet és a teljes szórásnégyzet hányadosát használjuk, tekintettel arra,
hogy a belső szórás nagyságát nem a csoporthoz tartozás, hanem sok más
tényező befolyásolja. (A bevezetőben említett dolgozói bérek példát foly-
tatva, a férfiak (vagy a nők) csoportjában a bérek azért térnek el egymástól
és az átlagtól, mert a dolgozók nem ugyanannyi ideje állnak alkalmazásban,
nem ugyanolyan iskolai- ill. szakképzettséggel rendelkeznek, nem egyfor-
mán teljesítik a normát stb.)

129 A teljes levezetést a matematika tankönyvekben keressék.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 111 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 112 ►

A vegyes kapcsolat szorossági mutatója (= H ) ill. a befolyásolás mér-


tékét kifejező mutató (= H 2 ) tehát:

σK σ2 σ K2 σ B2
H= = 1 − B2 H2 = = 1 − → % 130
σT σT σ T2 σ T2

A mutatók megoszlási viszonyszám-jellegéből következik, hogy alsó hatá-


ruk 0, felső határuk pedig 1, ill. 100 %. Ha külső szórás nulla (vagy ah-
hoz nagyon közeli érték), az azt jelenti, hogy a részátlagok nem (vagy csak
nagyon kevéssé) térnek el a főátlagtól, azaz egy-egy sokasági elem számára
teljesen mindegy, hogy melyik csoporthoz tartozik. A H ≅ 0 tehát a
kapcsolat hiányát jelenti. Ha külső szórás a teljes szórás igen nagy részét
teszi ki (esetleg egyenlő azzal), azaz a belső szórás igen kicsi (esetleg nulla),
akkor épp ellenkező helyzettel találkozunk. A H ≅ 1 tehát az igen szo-
ros kapcsolatot jelenti.

BEMUTATÓ FELADAT

A Magyarországon kiadott szépirodalmi művek131 példányszám (= meny-


nyiségi ismérv) és műfaj szerinti (= minőségi ismérv) megoszlására vonat-
kozóan az alábbi adatokat ismerjük.
7.5. sz. tábla
verses regény és elbe- egyéb szép-
példányszám színmű
mű szélés próza
(db) (%)
(%) (%) (%)
– 500 65,5 7,7 30,5 15,8
500 – 1.000 13,8 8,7 22 23,0
1.000 – 2.000 7,2 14,7 16,9 21,9
2.000 – 3.000 5,5 23,6 6,8 21,3
3.000 – 5.000 7,2 23,2 8,5 13,1
5.000 – 10.000 0,8 11,3 11,9 4,9

130 A mutatókban szereplő betűk jelentését az átlagok és a szórások számítási képletei


mellett megtalálják.
131 Magyar statisztikai évkönyv, 2003 (KSH, 2004; 255. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 112 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 113 ►

10.000 – 20.000 – 3,4 3,4 –


20.000 – 30.000 – 3,4 – –
30.000 – 40.000 – 2,9 – –
40.000 – – 1,1 – –
összesen 100 100 100 100,0
db 348 1.575 59 183

A 7.5. sz. tábla adatai alapján a következő statisztikai jellemzőket számítot-


tuk ki.
7.6. sz. tábla
részátlag132 (db) 861 5.541 2.407 1.964
csoportszórás133
1.219 8.242 3.295 1.719
(db)
A részátlagok súlyozott számtani átlagaként meghatároztuk a főátlagot
(4.401 db). A csoportszórások négyzetes átlaga adta a belső szórást (7.085
db). A részátlagok és a főátlag átlagos eltérése jelenti a külső szórást (1.889
db). A szórások között fennálló összefüggést felhasználva pedig megismer-
tük a teljes szórást (7.332 db). Végül kiszámítottuk a vegyes kapcsolat mu-
tatóit (H = 0,26 ill. H2 = 6,8 %).

főátlag:
t

∑f
j =1
.j xj
348 * 861 + 1.575 * 5.541 + ...
x= t
= ≅ 4.401 db
348 + 1.575
∑f j =1
.j

132 A megoszlásokkal súlyozott számtani átlagokat számítottunk, az eredményeket egé-


szekre kerekítettük. (Lásd: 3.2.)
133 A csoportszórásokat a megoszlásokkal súlyozva számítottuk ki, az eredményeket
egészekre kerekítettük. (Lásd: 4.2.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 113 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 114 ►

belső szórás:
t

∑f
j =1
.j σ 2j
348 *1.219 2 + 1.575 * 8.242 2 + ...
σB = t
= ≅ 7.085 db
348 + 1.575...
∑f
j =1
.j

külső szórás:
t

∑ f (x − x)
2
.j j
j =1
σK = t
=
∑f
j =1
.j

348 * (861 − 4.401) 2 + 1.575 * (5.41 − 4.401) 2 + ....


= ≅ 1.889 db
348 + 1.575 + ...
teljes szórás:
σ T = σ B2 + σ K2 = 7.0852 + 1.8892 = 7.332 db

σ K 1.889 σ 2 1.8892
H= = ≅ 0,26 H= K
= ≅ 0,262 ⇒ 6,6%
σ T 7.332 σ 2
T
7.332 2

♥ SZÖVEGES ELEMZÉS
2003-ban hazánkban 2.165 különféle szépirodalmi művet adtak ki átlago-
san 4.400 (4.401) példányban, igen magas (167 %-os) szórás mellett. A leg-
nagyobb átlagos példányszámot (5.541 db) a regények + elbeszélések kate-
góriában figyelhetjük meg, a legkisebbet pedig a verses művek csoportjában
(861 db). A legnagyobb (8.242 db) és a legkisebb csoportszórások (1.219 db)
is ugyanezekre a részsokaságokra jellemzőek. Az egyes szépirodalmi kate-
góriákban megjelent átlagos példányszámok átlagosan 1.889 darabbal tér-
nek el (= kisebbek vagy nagyobbak) a teljes sokaságra számított átlagos
példányszámtól. A különböző példányszámok (= átlagolandó értékek) pe-
dig átlagosan 7.332 darabbal térnek el a teljes sokaságra számított átlagos
példányszámtól. A szépirodalmi művek jellege és a megjelenési példány-
számok között gyenge (H = 0,26) kapcsolat figyelhető meg; a művek jellege
mindössze 6,6 %-ban (= H2) befolyásolja azok megjelentetett mennyiségét.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 114 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 115 ►

7.3. Korrelációs kapcsolat


Ha megfigyelt adatok csoportosításához kettő vagy több mennyiségi is-
mérvet használunk, akkor beszélünk korrelációs kapcsolatról. Ebben az
esetben a befolyásolt és a befolyásoló tényező szerepe – két ismérv esetén
– általában felcserélhető. Több ismérv esetén mindig csak a befolyásoló
tényezők száma nőhet. A továbbiakban csak a kétváltozós esetekre térünk
ki röviden134.
Ha a kapcsolat szorosságát két mennyiségi ismérv között akarjuk kimu-
tatni, és az adatokat kombinációs táblába rendeztük (6.2. sz.), akkor a ve-
gyes kapcsolatnál megismert H-mutató és H2-mutatót használhatjuk, de
mindkét mutatóból kettőt számíthatunk ki, tekintettel arra, hogy a csoport-
képző ismérv szerepe nem eleve adott. Ha az x-vel jelzett változó tölti be
ezt a szerepet, akkor csak y változó adataival számolunk (y ismérvértékeit
átlagoljuk, azok szórását határozzuk meg), ill. fordítva, ha az y-val jelzett
változó tölti be a befolyásoló tényező szerepét, akkor csak x változó adata-
ival számolunk (x ismérvértékeit átlagoljuk, azok szórását határozzuk meg).
A mutatókat a futóindexben alkalmazott jelölésekkel különböztetjük meg.
H futóindexében a függőleges vonal előtt mindig a befolyásolt tényező
(= eredményváltozó), a függőleges vonal után pedig a befolyásoló tényező
(= magyarázó változó, csoportképző ismérv) betűjelét láthatjuk. A szórá-
sok futóindexében pedig annak a változónak a betűjele olvasható zárójel-
ben, amelyik változó ismérvértékeivel számoltunk.
σ K ( x)
Ha x a befolyásoló tényező: H y x =
σ T ( x)

σ K ( y)
Ha y a befolyásoló tényező: H x y =
σ T ( y)

134 A többváltozós esetekről tananyagunk későbbi fejezetében lesz szó.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 115 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 116 ►

BEMUTATÓ FELADAT

Egy hallgatói csoport két zárthelyi dolgozatot írt statisztikából. A hallgatók


létszámadatait a két eredmény közötti kapcsolat vizsgálata érdekében
kombinációs táblába rendeztük.
7.6. sz. tábla
ZH I.
→ 31 – 41 – 51 – 61 – 71 – 81 – 91 -
- 30 együtt
ZH 40 50 60 70 80 90 100
II.↓
- 30 7 1 – 3 – 1 – – 12
31 –
2 – 2 – – 1 – – 5
40
41 –
4 – 1 2 1 1 1 1 11
50
51 –
9 2 2 3 2 1 2 1 22
60
61 –
9 – – 2 1 2 3 17
70
71 –
1 – – 2 1 1 3 8
80
81 –90 – – – – – 2 2 2 6
90 -
– – – – – – 1 – 1
100
együtt 32 3 5 12 5 9 9 7 82

A létszámadatok főben, a zárthelyi dolgozatok eredményei %-ban (= elért


pontszám / elérhető pontszám).
Jelöljük az első ZH (ZH I.) eredményeit „x”-vel és a második ZH (ZH II.)
eredményeit „y”-val!
Legyen először a magyarázó változó az első ZH eredménye (ennek a
dolgozatnak az eredményadataival nem számolunk, ezek a csoportképző
ismérv szerepét töltik be), majd másodszor a második ZH eredménye
(most pedig ennek a dolgozatnak az eredményadataival nem számolunk,
ezek a csoportképző ismérv szerepét töltik be)!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 116 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 117 ►

Munkánk mindkét esetben a részátlagok ill. a csoportszórások ki-


számításával kezdődik.
Például azon hallgatók ZH II. átlag-eredménye, akik a ZH I. dolgoza-
tot átlagban 15 %-ra teljesítették (= első, nyitott osztályköz)
≅47,2% = 7 *15 + 2 * 35 + 4 * 45 + 9 * 55 + 9 * 65 + 1 * 75
32
Átlagolandó értékek az osztályközepek: 15, 35, 45, 55, 65, 75, 85, 95. A súlyok pedig
az első oszlopban szereplő megfigyelt előfordulások. (Ugyanígy járunk el a további szá-
mítások során.) A további részátlagok: 41,67 /45,0 / 48,33 / 59,0 / 58,33 / 68,33 / 70,7.
Azoknak a hallgatóknak, akik a ZH I. dolgozatot átlagban 15 %-ra teljesí-
tették, az egyéni teljesítménye a csoport átlageredményétől (47,2%) átlagosan:
19,16 %-ponttal = 7 * (15 − 47,2) 2 + 2 * (35 − 47,2) 2 + ... + 1(75 − 47,2) 2 tér el.
32
A további csoportszórások: 18,86 / 8,94 /21,34 /1,20 / 22,12 /15,63 /14,00.
A fenti eredmények ismeretében kiszámíthatjuk a főátlagot (= a részát-
lagok súlyozott számtani átlaga), majd a külső szórást (= a részátlagok
átlagos eltérése a főátlagtól) és az un. belső szórást (= a csoportszórások
súlyozott négyzetes átlaga). Majd a szórások közötti összefüggést felhasz-
nálva meghatározhatjuk a teljes szórás (= az átlagolandó értékek és a főát-
lag átlagos eltérése) értékét.
főátlag:
32 * 47,19 + 3 * 41,67 + ... + 7 * 70,71
x= ≅ 53,29%
82
külsőszórás:
32 * (47,19 − 53,29) 2 + 3 * ( 41,67 − 53,29) 2 + ... + 7 * (70,71 − 53,29) 2
σK = ≅ 9,1%
82

belső szórás:

32 *19,16 2 + 3 *18,86 2 + ... + 7 *14,0 2


σB = ≅ 18,03%
82
teljes szórás:

σ T = 9,12 + 18,032 ≅ 20,2%

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 117 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 118 ►

A kapcsolat szorossági mutatója:


9,1
H= ≅ 0,45 .
20,2
A befolyásolás mértéke:

9,12
H= ≅ 0,45 2 ⇒ 20,3%
20,2 2

♥A hallgatók a ZH II. dolgozat elérhető pontszámának átlagosan


53,29 %-át érték el, egyéni eredményeik átlagosan 20,2 %-ponttal térnek el
ettől az átlagtól.
♥ A ZH I. dolgozat eredménye gyenge közepes kapcsolatban van a
ZH II. eredményével.
♥ A ZH I. eredménye mindössze 20,3 %-ban befolyásolja a ZH II.
eredményét. (Más tényezők, mint az egyéni képességek, a szorgalom, a felada-
tok nehézsége, a vizsgarutin stb. együttesen jelentősebb szerepet játszottak.)
Ha a változók szerepét felcseréljük, ebben az esetben az átlagolandó
értékek nem változnak, hiszen ugyanolyan osztályközöket képeztünk az
első és a második ZH eredményeiből. A súlyok viszont változnak, a so-
rokban szereplő előfordulásokkal kell dolgoznunk. Így az első részátlag:
7 *15 + 1 * 35 + 3 * 55
x1 = = 31,67% ,
12
azaz azok a hallgatók, akik a második ZH elérhető pontszámának maxi-
mum 30 %-át érték el, az első ZH elérhető pontszámának átlagosan 31,67
%-át érték el.
A további részátlagok: 39,0 / 48,64 / 42,27 /42,06 / 68,75 /85,0 / 85,0.
Az első részátlaghoz tartozó csoportszórás:

7 * (15 − 31,67) 2 + 1* (35 − 31,67) 2 + 3 * (55 − 31,67) 2


σ1 = = 21,34% − pont ,
12
vagyis egy-egy – a vizsgált részsokaságba tartozó – hallgató átlagosan
21,34 %-ponttal ért el jobb vagy rosszabb eredményt, mint az átlagos tel-
jesítményszázalék (= 31,67).
A további csoportszórások: 22,45 / 28,69 /26,83 /29,86 /25,95 /8,16 / 0,0.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 118 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 119 ►

A belső szórás értéke: 25,62, a külső szórásé: 14,79, a teljes szórás pe-
dig: 29,58; így a kapcsolat szorossága (= H) 0,5, ebből következően a be-
folyásolás mértéke (= H2) 25 %.
Összehasonlítva a két számítás eredményét azt tapasztaljuk, hogy a
változók szerepének felcserélése befolyásolja H és H2 mutatók értékét.
Tekintettel arra, hogy az egyik ill. a másik esetben nem azonos súlyokkal
dolgoztunk (más példákban az átlagolandó értékek között is adódhat elté-
rés), természetesen nem azonos átlag- és szórás-adatokat kaptunk. Általá-
nosságban, ha a változók szerepét felcseréljük, akkor H és H2 mutatók
értéke csak a két szélső esetben („nincs kapcsolat” = H y x = H x y = 0 ill.
„igen szoros a kapcsolat” = H y x = H x y = 1 ) azonos.
A korrelációs kapcsolatra – amikor a megfigyelt adatokat adat-párokba
rendezve (= lista) adjuk meg – még visszatérünk135.

7.4. Gyakorló feladatok

1. feladat

Halálozások a meghaltak neme és a halál oka szerint


(Magyarország, 2003)136
a meghaltak neme
→ férfi nő összesen
a halál oka ↓
daganatos betegségek 19.063 14.999 34.062
táplálkozási és anyagcsere 1.101 1.650 2.751
keringési rendszer 31.841 37.210 69.051
légzőrendszer 3.210 2.229 5.439
emésztőrendszer 5.846 3.599 9.445
összesen 61.061 59.687 120.748

Vizsgálja meg, van-e kapcsolat a meghaltak neme és a halál oka között!

135 Lásd: Korreláció-és regressziószámítás fejezet


136 Magyar statisztikai évkönyv, 2003 (KSH, 2004; 68. – 70. old.) /A legfőbb halálokokat emeltük ki, a
halálestek 88 %-át./

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 119 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 120 ►

2. feladat

A Magyarországra bevándorló külföldiek száma (fő) életkoruk szerint 137


1980 2002
életkor (év)
férfi nő összesen férfi nő összesen
0 – 14 165 145 310 652 611 1.273
15 – 19 205 157 362 608 707 1.315
20 – 24 241 475 716 1.568 1.536 3.103
25 – 29 182 330 512 1.773 1.406 3.179
30 – 39 221 199 420 2.119 1.296 3.415
40 – 49 73 81 154 1.213 671 1.884
50 – 59 32 47 79 569 384 953
60 – 19 40 59 229 294 523
összesen 1.138 1.474 2.612 8.741 6.905 15.646

1. Vizsgálja meg, volt-e kapcsolat a bevándorlók életkora és neme között


1980-ban ill. 2002-ben!
2. A kapott eredményeket hasonlítsa össze!
3. A részeredmények jelentését (pl.: a bevándorló férfiak átlagéletkora
stb.) is fogalmazza meg egy-egy mondattal!
4. Ábrázolja a megfigyelt adatokat!
5. Számolja ki a relatív gyakoriságokat!
6. Vizsgálja meg a koncentrációt, az aszimmetriát, a csúcsosságot mind-
két év adatai alapján együttesen és nemenként is!
7. Nevezze meg a tábla, a benne szereplő sorok és adatok típusát is!
Figyelem! Egyes feladatok ismétlő jellegűek, ha szükséges, lapoz-
zon vissza az előző fejezetekhez!

137 Demográfiai évkönyv, 2003 (KSH, 2004; 90. old.) /Az ismeretlen korúak – számuk
elenyésző– nélkül./

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 120 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 121 ►

3. feladat

Egyetemünk hallgatói körében néhány éve felmérést végeztünk, többek


között arra voltunk kíváncsiak, mennyi családjukban az egy főre jutó jö-
vedelem. A „bevallott” adatokat szakonként csoportosítva osztályközös
gyakorisági sorba rendeztük.
nettó hallgatók (fő) szakok szerint
jövede-
lem közgazdász közgazdász mérnök
jogász együtt
ezer FT (egyetem) (főiskola) (közlekedés)
– 30 1 2 5 3 11
31 – 50 5 6 12 9 32
51 – 70 13 23 14 32 82
71 – 100 22 26 37 29 114
101 – 200 42 33 22 24 121
201 – 17 10 10 3 40
összesen 100 100 100 100 400
1. Szakonként és a sokaság egészére is számítsa ki
• a számtani átlagot,
• a szórást
• a móduszt,
• a mediánt,
• az aszimmetria mutatóit,
• a koncentráció mutatóit,
• a csúcsosság mutatóját!
• Szerkessze meg a Lorenz-görbét!
2. Ábrázolja az adatokat!
3. Elemezze a kapcsolatot!

4. feladat

1. Gyűjtsön adatokat melyek alapján a megismert szorossági mutatók


számítását be tudja mutatni!
2. A gyűjtött adatokkal végezze el a számításokat!
3. Írjon szöveges elemzéseket!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 121 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 122 ►

7.5. Összefoglalás
ismérvek kö- = ha a vizsgált sokaság különböző ismérvek alapján feltáruló
zötti kapcsolat szerkezete hasonlóságot, vagy azonosságot mutat
1. asszociáció
fajtái 2. vegyes kapcsolat
3. korreláció
1. sztochasztikus (ezt vizsgáljuk)
jellege
2. függvényszerű
f 11 f 22 − f 12 f 21 g11 g 22 − g12 g 21
1. Yule a= ≅
f 11 f 22 + f 12 f 21 g11 g 22 + g12 g 21

az asszociáció χ2
2. Csuprov T=
mutatói n (s − 1)* (t − 1)
χ2
3. Cramer C=
n (s − 1)
szorossági befolyásolás
a vegyes kap-
σK σ2 σ K2 σ B2
csolat mutatói H= = 1 − B2 H2 = = 1 − → %
σT σT σ T2 σ T2
szorossági befolyásolás
σ K ( x)
a korrelációs Hy x = ill.
kapcsolat muta- σ T ( x)
mint vegyes kapcsolat
tói σ K ( y)
Hx y =
σ T ( y)
0〈mutató〈1
a kapcsolat muta- általában
kivétel: Csuprov, ha s〈t s −1
tók határértékei 0〈T 〈 4
a határértékek t −1
jelentése alsó = felső =
a kapcsolat teljes hiánya igen szoros kapcsolat

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 122 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 123 ►

7.6. A 4., 5., 6., 7. fejezetek tartalmához


kapcsolódó mintapéldák korábbi
vizsgadolgozatokból

1. minta

Egy 80 főt foglalkoztató vállalkozás adatai:


havi nettó fizikai dolgozók szellemi dolgozók
kereset férfi nő férfi nő
ezer Ft fő fő
– 60 – 1 – –
61 – 80 2 6 – 1
81 – 100 11 8 – 2
101 – 120 13 4 1 3
121 – 140 12 – 2 1
141 – 160 8 – 2 –
161 – – – 2 1
összesen 46 19 7 8

1. Állapítsa meg, hogy a dolgozók jövedelmét nemük (férfi, nő) vagy


foglalkoztatásuk jellege (fizikai, szellemi) befolyásolja-e nagyobb mér-
tékben!
2. A szorossági mutató nevezőjében szereplő szórás kiszámítására a szó-
rások közötti összefüggést használja!
3. Vegye észre, és használja a számolás gyorsításához beírt adatokat, to-
vábbá az azonos adatokat!
4. A szükséges számítások elvégzéshez az alábbi munkatáblát szokás
összeállítani.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 123 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 124 ►

1. munkatábla
havi net- férfiak nők férfiak nők férfiak nők
átlago-
tó kere-
landó súlyozott eltérés
set (ezer fő értékösszeg
érték négyzet
Ft)
– 60
61 – 80
81 – 100
101 – 120 Nem kell kitölteni.
121 – 140
141 – 160
161 –
összesen 6.330,00 2.510,00 31.683,18 14.962,96

2. munkatábla
havi net- átlago- fizikai szellemi fizikai szellemi fizikai szellemi
tó kereset landó súlyozott eltérés
fő értékösszeg
(ezer Ft) érték négyzet
– 60
61 – 80
81 – 100
101 – 120 Nem kell kitölteni.
121 – 140
141 – 160
161 –
összesen 6.950,00 1.890,00 40.984,60 13.760,00

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 124 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 125 ►

1. eredménytábla
a mutatók
megnevezés értéke, mérték-
statisztikai jele számítása
egységgel
a férfiak átlagbére
a nők átlagbére
a férfiak átlagbér-
ének szórása
a nők átlagbérének
szórása
a két csoport szó-
rásának átlaga
a kapcsolat szo-
rossági mutatója

2. eredménytábla
a mutatók
megnevezés értéke, mérték-
statisztikai jele számítása
egységgel
a szellemi dolgo-
zók átlagbére
a fizikai dolgozók
átlagbérének szórá-
sa
a szellemi dolgo-
zók átlagbérének
szórása
a két csoport szó-
rásának átlaga
a kapcsolat szoros-
sági mutatója

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 125 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 126 ►

2. minta

Egy reprezentatív felmérés során vizsgálták a magyarok szabadság-kivételi


szokásainak és jövedelmi helyzetének kapcsolatát. A megfigyelés során
2.500, 14 évnél idősebb magyar állampolgárt kérdeztek meg.
megfigyelt adatok:
a szabadságot
jövedelem 2 hetet
egyben elaprózva összesen
egyszerre
veszi igénybe
alacsony 88 472 240 800
közepes 120 680 200 1000
magas 112 497 91 700
összesen 320 1649 531 2500

Állapítsa meg, van-e kapcsolat az állampolgárok jövedelmi helyzete és


szabadság-kivételi szokásai között!

számított adatok:
a szabadságot
2 hetet
egyben elaprózva
jövedelem egyszerre összesen
veszi igénybe
alacsony 102,40 527,68 169,92
közepes 659,60 212,40
magas 461,72 148,68
összesen

Töltse ki a fenti tábla üres rovatait!


Az adatokat zsebszámológépe kijelzőjéről két tizedes pontossággal másol-
ja át! (Kerekíteni nem kell.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 126 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 127 ►

mellékszámítás:
A szabadságot
2 hetet
jövedelem egyben elaprózva összesen
egyszerre
veszi igénybe
alacsony 36,79
közepes Nem kell kitölteni! 1,85
magas 30,66
összesen 9,19 51,99 69,30
Töltse ki a fenti tábla üres rovatait!
A zsebszámológép kijelzőjéről az egész számot és az első két tizedest má-
solja át, kerekíteni nem kell.
eredménytábla
a mutatók
megnevezés statisztikai számítása értéke, mérték-
jele egységgel
az egyik tanult mutató
a másik tanult mutató

3. minta

Egy hallgatói csoport megoszlása a tanulóbiztosítás féléves díjai szerint:


biztosítási díjak hallgatók
ezer Ft fő
0,0 – 1,2 30
1,2 – 1,5 25
1,5 – 2,0 20
2,0 – 2,5 15
2,5 – 3,0 15
3,0 – 3,5 10
3,5 – 4,0 5
összesen 60

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 127 ►


Statisztika Az ismérvek közötti kapcsolat
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 128 ►

1. Számítsa ki a szóródás két leggyakrabban használt mutatóját!


2. Számítsa ki az aszimmetria „A” és „P” jelű mutatóit!
3. Készítse el a Lorenz-görbét!
4. Fogalmazza meg a kiszámított mutatók jelentését, továbbá az újabb
részeredmények jelentését!
5. A Lorenz-görbe alapján nyilatkozzon a sokaság koncentrációjáról!

biztosítási hallgatók
díjak
ezer Ft fő
0,0 – 1,2 30
1,2 – 1,5 25
1,5 – 2,0 20
2,0 – 2,5 15
2,5 – 3,0 15
3,0 – 3,5 10
3,5 – 4,0 5
összesen 60

1. eredmény-tábla
Az első üres sorba a kiszámított mutató statisztikai jelét, a második üres
sorba pedig számértékét és mértékegységét kell írni.
a szórás abszolút mutatója az aszimmetria mutatója
a számtani
a relatív a szórás a számtani átlag
a megfigyelt átlag és a
gyakori- relatív és a módusz
gyakoriságokkal medián
ságokkal mutatója összehasonlítá-
súlyozva összehasonlí-
súlyozva sával
tásával

2. eredmény-tábla
Írjon szöveges elemzést!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 128 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 129 ►

8. Standardizálás

8.1. Bevezetés
Magyarországon az alkalmazásban álló fizikai foglalkozásúak bruttó átlag-
keresete 2000-ben 61.930138Ft, 2003-ban pedig 91.397 Ft volt. Ugyanezen
években az alkalmazásban álló szellemi foglalkozásúakra vonatkozó ada-
tok: 121.779 Ft ill. 143.753 Ft. A fizikai foglalkozásúak átlagkeresete tehát
≅ 48 %-kal139, a szellemi foglalkozásúaké pedig ≅ 18 %-kal emelkedett. A
nemzetgazdaság egészére vonatkozó bruttó átlagkereset (= a fizikai és
szellemi foglalkozásúak átlagkeresetének súlyozott számtani átlaga) a két
megfigyelt évben 87.645 ill. 137.193 Ft, azaz 2003-ban 56,5 %-kal140 ma-
gasabb volt. Hogyan lehetséges az, hogy a nemzetgazdasági átlagkereset
növekedése mind a fizikai, mind a szellemi dolgozók átlagkeresetének
növekedését meghaladta?
A feltett kérdésre könnyebben tudunk válaszolni, ha végiggondoljuk a
fentiekben felsorakoztatott átlagkereseti adatok számítását, ill. felírjuk
számításukat statisztikai jelekkel, képletekkel. Az átlagkereseteket kétfé-
leképpen is kiszámíthatjuk.
• Egy összegben ismerve a bérjellegű kifizetéseket ( A) és a foglalkozta-
tottak létszámát (B ) , intenzitási viszonyszámként
(v ) .Képletszerűen:
A
rész-intenzitási viszonyszám (= részátlag): v = ill.
B

összetett intenzitási viszonyszám (főátlag): V =


∑A
∑B
• A dolgozókat bérkategóriák szerint ( xi ) osztályközös gyakorisá-
gi ( f i ) sorba rendezhetjük, és súlyozott számtani átlagként határoz-
hatjuk meg az átlagkereseti adatokat. Képletszerűen:

138 Adatforrás: Magyar statisztikai évkönyv, 2003 (KSH – Budapest 2004, 96. – 97. old.)
139 if= 91.397 / 61.930 = 1,4758 → + 48 % ill. isz = 143.753 / 121.779 = 1,18044 → +
18 %
140 I = 137.193 / 87.645 =1,5653 → + 56,5 %

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 129 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 130 ►

részátlag (=rész-intenzitási viszonyszám): x j =


∑fxi i
ill.
∑f i

főátlag (=összetett intenzitási viszonyszám): x =


∑n x j j

∑n j

A képletben szereplő súly adat ( f i ) a részsokaságra vonatkozó osztályközönkénti


megfigyelt előfordulás, ezek összege egy-egy részsokaságra vonatkozóan = n j .
A két számítás eredménye természetesen azonos, a téma további tárgyalá-
sának egyszerűsítése érdekében pedig csak az intenzitási viszonyszámoknál
megszokott jelöléseket alkalmazzuk.
Írjuk fel a fősokaságra vonatkozó összetett intenzitási viszonyszámok re-
latív változásának számítását a szokásos statisztikai jelöléseket alkalmazva141!

∑A 1 ∑B v 1 1
V1
=
∑ B1 = ∑ B1
V0 ∑ A0 ∑ B0 v0
∑ B0 ∑ B0
A részletezett képletből jól látható, hogy az átlagkeresetek csökkenése vagy
növekedése nem egyetlen adat változásának a következménye. A két idő-
pontban ugyanis eltérő szerkezetű142 létszám (B ) és eltérő abszolút érté-
kű egyedi bér (v ) adatokat figyelhettünk meg. E két tényező változásának
hatását elkülönítve kaphatunk választ az első bekezdésben feltett kérdésünk-
re. A hatások elkülönítésére alkalmas módszer a standardizálás.

141Tulajdonképpen dinamikus viszonyszámot számítunk.


142A létszámadat a számítás során súlyként szerepel. A súlyokról pedig tudjuk, hogy nem
abszolút, hanem relatív nagyságukkal befolyásolják a számítás eredményét. Természete-
sen lehetséges, hogy a B-jelű adatok abszolút értéke is megváltozik. (Erre a problémára
még visszatérünk.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 130 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 131 ►

8.2. A standardizálás – elméleti összefoglalás

A standardizálás olyan statisztikai módszer, mellyel főátlagokat, azaz ösz-


szetett intenzitási viszonyszámokat143 hasonlíthatunk össze. S ahogy már
említettük, lehetőségünk van az eltérést kialakító tényezők feltárására is.

Az összehasonlítást elvégezhetjük indexek (i, I ) és különbségek (k, K )


formájában is, mind térbeli, mind időbeli adatokra vonatkozóan.
A számítások eredményeként az alábbiakban felsorolt indexekhez és
különbségekhez jutunk.
• Egyedi indexek = a részviszonyszámok relatív változása (eltérése144).
(A bevezetőben megadott a fizikai és szellemi dolgozók bruttó átlag-
bérének 48 ill. 18 %-os emelkedése szintén egyedi index.)
• Egyedi különbségek = a részviszonyszámok abszolút változása. (A
fizikai dolgozók bruttó átlagbére 29.467145, a szellemi dolgozóké pedig
21.974 Ft-tal magasabb volt 2003-ban.)
• Főátlagindex = az összetett intenzitási viszonyszámok relatív válto-
zása, a két befolyásoló tényező hatását együtt tartalmazza. (A beveze-
tőben megadott, a nemzetgazdaság valamennyi dolgozójára vonatkozó
56,5 %-os növekedés szintén főátlagindex.)
• A főátlagok különbsége = az összetett intenzitási viszonyszámok
abszolút változása, a két befolyásoló tényező hatását, akárcsak a
főátlagindex, együtt tartalmazza. (A nemzetgazdaság valamennyi dol-
gozójára vonatkozó bruttó átlagbér 2003-ban 49.548146 Ft-tal maga-
sabb volt, mint 2000-ben.)
• Részátlagindex = az összetett intenzitási viszonyszámoknak a részvi-
szonyszámok növekedése vagy csökkenése miatt bekövetkező relatív

143 A rész-intenzitási viszonyszámok és a részátlagok, ill. az összetett intenzitási viszony-


számok és a főátlagok tartalmi és számértékének azonosságát belátva, a továbbiakban
csak a viszonyszám elnevezést tüntetjük fel.
144 Változásról beszélünk, ha az összehasonlítás különböző időpontokra vonatkozó
adatok alapján történik. Eltérésről szólunk, ha különböző területekre vonatkozó adatok
összehasonlítását végezzük. A továbbiakban mindig csak a változás szót tüntetjük fel,
mondataink egyszerűbbé tétele érdekében.
145 k = 91.397 – 61.930 = + 29.467 Ft ill. k = 143.753 – 121.779 = + 21.974 Ft
f sz
146 K = 137.193 – 87.645 = 49.548 Ft

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 131 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 132 ►

változás. Számításához147 a másik befolyásoló tényezőt – a súlyok szer-


kezetét – állandónak kell tekintetni.
• A főátlagok különbsége (= abszolút változása) a részviszonyszám-
ok eltérése miatt. Számításához a másik befolyásoló tényezőt – a sú-
lyok szerkezetét – ahogy az indexnél is, állandónak kell tekintetni.
• Összetételindex = az összetett intenzitási viszonyszámoknak a B-jelű
adatok (súlyok) szerkezetének módosulása miatt bekövetkező rela-
tív változását fejezi ki. Számításához a másik befolyásoló tényezőt – a
részviszonyszámokat –állandónak kell tekintetni.
• a főátlagok különbsége a B-jelű adatok (súlyok) szerkezetének
módosulása következtében (= abszolút változása). Számításához a má-
sik befolyásoló tényezőt – a részviszonyszámokat – akárcsak az index-
nél, állandónak kell tekintetni.
A felsorolt indexeket és különbségeket a következő képletekkel számíthat-
juk ki:
v1
• egyedi indexek: i =
v0

• egyedi különbségek: k = v1 − v0
∑A 1 ∑Bv 1 1

• főátlagindex: I =
V1
=
∑B 1
=
∑B 1
=
∑g v
1 1

V0 ∑A 0 ∑B v 0 0 ∑g v
0 0

∑B 0 ∑B 0

• a főátlagok mindkét hatást tartalmazó különbsége: K = V1 − V1


• részátlagindex,
ha állandónak tekintjük a régebbi időszak súly adatait:

147Ennek az indexnek és a továbbiakban felsorolásra kerülő mutatóknak a számításához


még további elméleti ismeretekre van szükségünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 132 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 133 ►

∑B v
0 1

I′ =
Vst (1)
=
∑B 0
=
∑B v 0 1
=
∑g v 0 1
=
∑ B v *i = ∑ B v
0 0 0 1

V0 ∑B v
0 0 ∑B v 0 0 ∑g v 0 0 ∑B v ∑ B v
0 0 0 1

∑B 0
i

ha állandónak tekintjük az újabb időszak súly adatait:

∑B v1 1

I′ =
V1
=
∑B 1
=
∑B v 1 1
=
∑g v 1 1
=
∑ B v *i = ∑ B v
1 0 1 1

Vst ( 2 ) ∑B v1 0 ∑B v 1 0 ∑g v 1 0 ∑B v ∑ B v
1 0 1 1

∑B 1
i

főátlagoknak a részviszonyszámok eltérése miatti különbsége:

K ′ = Vst (1) − V0 vagy K ′ = V1 − Vst ( 2 )

• összetételindex,
ha állandónak tekintjük a régebbi időszak átlagolandó értékeit:

∑B v1 0

I ′′ =
Vst ( 2 )
=
∑B 1
=
∑g v 1 0
, ahol g 0 =
B0 B
és g1 = 1
V0 ∑B v0 0 ∑g v 0 0 ∑ B0 ∑ B1
∑B 0

ha állandónak tekintjük az újabb időszak átlagolandó értékeit:

∑B v 1 1

I ′′ =
V1
=
∑B 1
=
∑g v 1 1

Vst (1) ∑B v 0 1 ∑g v 0 1

∑B 0

a főátlagoknak a súly adatok szerkezeti változása miatt adódó különbsége:

K ′′ = Vst ( 2 ) − V0 vagy K ′′ = V1 − Vst (1)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 133 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 134 ►

A képletekben szereplő betűk jelentése:


A= B= v=
az intenzitási vi- az intenzitási vi- egyedi intenzitási viszonyszám =
szonyszám számlá- szonyszám nevező- részátlag =
lójában szereplő jében szereplő adat az összetett intenzitási viszonyszám
adat = súly számításánál az átlagolandó érték

k=
i= I= K
egyedi különb-
egyedi index főátlagindex a főátlagok különbsége
ség

K′= V0
I′= a főátlagok különbsége I ′′ összetett intenzitási
részátlagindex a részátlagok eltérése összetételindex viszonyszám = főátlag
miatt (régebbi)

K ′′ V1 Vst (1) Vst ( 2 )


a főátlagok különbsége a összetett intenzitási
súly adatok szerkezeté- viszonyszám = főátlag standard (= állandó tényezőt
nek eltérése miatt (újabb) tartalmazó) fiktív főátlagok

g0 = g1 =
a B0 adatok megoszlása = relatív gya- a B1 adatok megoszlása = relatív gya-
koriság koriság

A felsorakoztatott képleteket végigtekintve, láthatjuk, hogy a


részátlagindex az egyedi indexek átlagaként is előállítható, azaz nemcsak
nevében átlag (mert két átlagot viszonyítva kapjuk meg értékét), hanem
tartalmában is az. Tehát igaz rá, hogy [i min 〈 I ′〈i max ]. A főátlagindexre és az
összetételindexre ilyen nagyságrendi relációt nem tudunk megadni. Ezek
lehetnek kisebbek a legkisebb egyedi indexnél, és nagyobbak a legnagyobb
egyedi indexnél, de az egyik ismeretében (számítása után) már biztosak
lehetünk a másik nagyságrendjében.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 134 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 135 ►

• ha [i min 〈 I 〈i max ] és I 〈 I ′ , akkor I ′′〈100%


• ha [i min 〈 I 〈i max ] és I 〉 I ′ , akkor I ′′〉100%
• ha I 〈imin , akkor I ′′〉100%
• ha I 〉 imax , akkor I ′′〈100%
A három, a sokaság egészére vonatkozó index és a hozzájuk tartozó kü-
lönbségek között nemcsak logikai (= a szétbontott hatások egyesíthetőek),
hanem számszaki összefüggés is felírható. I = I ′ * I ′′ ill. K = K ′ + K ′′ A
tökéletes számszaki egyezőség azonban csak az un. keresztbe-súlyozással
érvényesül, vagyis ha a részátlagindex számításánál a régebbi időszak súly
adatait vettük állandónak, akkor az összetételindex számításánál az újabb
időszak részviszonyszámait kell állandónak venni (és fordítva).
Végezetül megjegyezzük, hogy tananyagunkban ugyan nem szerepel,
de ismert a többszörös standardizálás módszere is, amikor nemcsak két,
hanem több befolyásoló tényező hatását is ki tudjuk mutatni (természete-
sen egyszerre több másik tényezőt állandónak véve).

8.3. Gyakorlati alkalmazás

BEMUTATÓ FELADAT I. – különböző időpontokra vonatkozó adatok


összehasonlítása

A 8.1. sz. tábla a bevezetőben szereplő adatokat, valamint az ott nem kö-
zölt súlyadatokat tartalmazza.
8.1.1.sz. tábla
dolgozók meg- fiktív adatok
megnevezés bruttó átlagbér
oszlása a hatások elkülöníté-
→ Ft / fő / hó
% séhez
állománycsoport 2000 2003 2000 2003 1. 2.
fizikai 61.930 91.397 0,57033 0,1253 52.126 7.760
szellemi 121.779 143.753 0,42967 0,8747 61.766 106.520
együtt 87.645 137.193 1 1 113.892 114.280
v0 és g 0 ∗ v1 = g1 ∗ v0 =
statisztikai jelölés v1 és V1 g 0 g1
V0 Vst (1) Vst ( 2)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 135 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 136 ►

8.1.2. sz. tábla


megnevezés
a bruttó átlagbér változása

állománycsoport % Ft / fő / hó
fizikai 147,6 29.467
szellemi 118,0 21.974
együtt 156,5 49.548
statisztikai jelölés i és I k és K
A nemzetgazdasági bruttó átlagbér változásának összetevőit a követke-
zőkben mindkét megismert módon meghatározzuk.
• Részátlagindexek és a hozzájuk tartozó különbségek:
ha állandónak tekintjük a régebbi időszak súly adatait

I′ =
Vst (1)
=
∑g v
0 1
=
113.892
= 129,9%
V0 ∑g v
0 0 87.645

K ′ = Vst (1) − V0 = 113.892 − 87645 = 26.247 Ft

ha állandónak tekintjük az újabb időszak súly adatait

I′ =
V1
=
∑ g1v1 = 137.193 = 120,0%
Vst ( 2) ∑ g1v0 114.280

K ′ = V1 − Vst ( 2 ) = 137.193 − 114.280 = 22.913 Ft

• Összetételindexek és a hozzájuk tartozó különbségek:


ha állandónak tekintjük a régebbi időszak átlagolandó értékeit

I ′′ =
Vst ( 2 )
=
∑g v
1 0
=
114.280
= 130,4%
V0 ∑g v
0 0 87.645

K ′′ = Vst ( 2) − V0 = 114.280 − 87645 = 26.635 Ft

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 136 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 137 ►

ha állandónak tekintjük az újabb időszak átlagolandó értékeit

I ′′ =
V1
=
∑ g1v1 = 137.193 = 120,5%
Vst (1) ∑ g 0 v1 113.892

K ′′ = V1 − Vst (1) = 137.193 − 113.892 = 23.301 Ft

• Összefüggések az indexek és a különbségek között:


Vst (1) V1 V Vst ( 2 )
I = I ′ ∗ I ′′ = ∗ = 1,299 ∗1,205 = 1 ∗ = 1,200 ∗1,304 = 156,5%
V0 Vst (1) Vst ( 2 ) V0

K = K ′ + K ′′ = (Vst (1) − V0 ) + (V1 −V st (1) ) = 26.247 + 23.301 = 49.548 Ft


ill.

K = K ′ + K ′′ = (V1 − Vst ( 2 ) ) + (Vst ( 2) −V 0 ) = 22.913 + 26.635 = 49.548 Ft

♥ SZÖVEGES ELEMEZÉS148:
Hazánkban az alkalmazásban állók nemzetgazdasági bruttó átlagbére
2003-ban 56,5 %-kal, azaz 49.548 Ft-tal magasabb volt, mint 2000-ben.
A növekedést két azonos előjelű tényező okozta. Egyrészt mind a fizi-
kai (≅+48%,+29.467 Ft), mind a szellemi (+18 %, +21.974 Ft) dolgozók
bruttó átlagbére növekedett; másrészt megváltozott a két alkalmazotti
csoport egymáshoz viszonyított aránya. A magasabb átlagbérű szellemi
dolgozók aránya jelentős mértében – 44,5 %-ponttal – megemelkedett. A
nagyobb átlagolandó érték így nagyobb súlyt kapott.
A fizikai ill. szellemi dolgozók bruttó átlagbérének növekedése a nem-
zetgazdasági bruttó átlagbér növekedéséhez 20,0 %-kal (22.913 Ft-tal); a
dolgozó csoportok létszámarányának megváltozása pedig 30,4 %-kal
(26.635 Ft-tal) járult hozzá.

148 A szöveges elemzést csak az egyik – a részátlagindex számításánál az újabb időszak


relatív gyakoriságait állandónak véve – írtuk le.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 137 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 138 ►

BEMUTATÓ FELADAT II. – különböző időpontokra vonatkozó ada-


tok összehasonlítása

Magyarországi születési arányszámok149 összehasonlítása.

8.2.1. sz. tábla


az anya élveszületés a nők létszáma 1000 nőre jutó születés
életkora (fő) (fő) (fő / 1000 fő) = (‰)
(év) 1960 2003 1960 2003 1960 2003
-14 79 118 386.877 300.605 0,20420 0,39254
15 – 19 19.562 6.483 375.000 316.852 52,16533 20,46067
20 – 24 55.929 20.143 349.364 364.223 160,08800 55,30403
25 – 29 38.426 37.089 367.770 413.333 104,48380 89,73152
30 – 34 20.343 22.022 386.309 354.986 52,65992 62,03625
35 – 39 9.882 7.452 395.865 314.267 24,96306 23,71232
40 – 150 2.210 1.340 616.748 750.476 3,58331 1,78553
együtt 148.391 96.650 2.879.893 2.816.745 51,52657 34,31266
statisztikai
A0 A1 B0 B1 v0 és V0 v1 és V1
jel

8.2.2. sz. tábla

az anya a nők megoszlása


relatív abszolút fiktív adatok
életkora (%)
változás változás
(év) 1. 2. 1960 2003
-14 1,922 0,188 151.865,4 61.383,321 13,4 10,7
15 – 19 0,392 -31,705 7.672.746 16.528.690 13,0 11,2
20 – 24 0,346 -104,784 19.321.237 58307.748 12,1 12,9
25 – 29 0,859 -14,752 33.000.563 43.186.594 12,8 14,7
30 – 34 1,178 9,376 23.965.161 18.693.533 13,4 12,6

149 adatforrás: Demográfiai évkönyv 2003 (KSH – Budapest –2004, 11. old. , 40. old.)
150 Az adatforrásként használt évkönyv 1960-ra ill. 2003-ra nem azonos bontásban tar-
talmazza az adatokat, a számítások érdekében a 40 év feletti nőket egy korcsoportba
vontuk össze.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 138 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 139 ►

35 – 39 0,950 -1,251 9.386.878 7.845.064,6 13,7 11,2


40 – 0,498 -1,798 1.101.224 2.689.189 21,4 26,6
együtt 0,666 -17,214 94.599.675 147.312.203 ≅1 ≅1
statisztikai
i és I k és K B0 v1 B1v0 g0 g1
jel

8.2.3./1. sz. tábla


eredmény
megnevezés számítás eredmény számítás
‰-pont
főátlagindex és a főátlagok különbsége
34,3 66,6 %
I és K 51,5
34,3 − 51,5 -17,2

standard főátlagok
Vst (1) , ahol (B0 v1 )
94.599.675
32,8 ‰
2.879.893
Vst ( 2) , ahol 147.312.203
52,3 ‰
(B1v0 ) 2.816.745

részátlagindex és a hozzá tartozó különbség


I ′ és K ′ standard: 32,8
63,7 % 32,8 − 51,5 -18,7
B0 51,5

I ′ és K ′ standard: 34,3
65,4 % 34,3 − 52,3 -18,0
B1 52,3

összetételindex és a hozzá tartozó különbség


I ′′ és K ′′ stan- 52,3
101,6 % 52,3 − 51,5 +0,8
dard: v0 51,5

I ′′ és K ′′ stan- 34,3
104,6 % 34,3 − 32,8 +1,5
dard: v1 32,8

0,637*1,046 I = 66,6 -18,7+1,5 K=-


összefüggések
0,654*1,016 % -18,0+0,8 17,2

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 139 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 140 ►

♥ SZÖVEGES ELEMEZÉS151:
Magyarországon ezer szülőképeskorú nőre 1960-ban 51,5; 2003-ban pedig
34,3 születés jutott. A születési arányszám tehát 33,4 %-kal (= 100 – 66,6
%), azaz 17,2152 ezrelékponttal csökkent.
A csökkenésnek két ellenkező előjelű összetevője van. Egyrészt a kor-
osztályok majd mindegyikében (a legtermékenyebbek mindegyikében)
csökkent a születési arányszám; másrészt megváltozott a nők korosztá-
lyonkénti összetétele.
A korosztályonkénti születési arányszámok változása következtében az or-
szágos adat 36,3 %-kal (= 100 – 63,7 %), vagyis 18,7 ezrelékponttal csökkent.
A nők korosztályonkénti szerkezeti változása önmagában az országos
adat növekedéséhez vezetett volna. (4,6 % relatív növekedés, ami 1,5 ezre-
lékpont abszolút növekedést jelent.) A szerkezetváltozás növekedést ered-
ményező hatása annak következménye, hogy éppen a két legtermékenyebb
korosztályban (20 – 24 és 25 – 29 évesek) emelkedett a szülőképeskorú
nők aránya (+0,8 ill. +1,9 százalékponttal), így a legmagasabb abszolút-
értékű részviszonyszámok kapták a legnagyobb súlyokat.
Fontos megfigyelni a szülőképeskorú nők létszámának alakulását.
1960-hoz képest 63.148 fővel kevesebben voltak 2003-ban. Ennek ellené-
re az összetételindex növekedést jelez. Ez is jól mutatja azt, amire már
többször felhívtuk a figyelmet, a súlyoknak nem az abszolút, hanem a
relatív nagysága a befolyásoló tényező.

151 A szöveges elemzést csak az egyik – a részátlagindex számításánál a régebbi időszak


relatív gyakoriságait állandónak véve – írjuk le.
152 17,2 ezrelékpont = minden 1000 nő tizenhéttel kevesebb gyereket szül.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 140 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 141 ►

BEMUTATÓ FELADAT III. – területi153 összehasonlítás

8.3.1. sz. tábla


megne- bruttó átlagbér dolgozók megosz- fiktív adatok
vezés (2003) lása (2003) a hatások elkülö-
→ Ft / fő / hó % nítéséhez
ágazat ipar mező- ipar mező- 1. 2.
nem gazda- gazdaság
ság
férfi 144.907 89.940 0,60436 0,76177 54.356 110.386
nő 105.133 78.510 0,39564 0,23823 31.062 25.046
együtt 129.171 87.217 1 1 85.418 135.432
statisztikai v1 és g 0 ∗ v1 = g1 ∗ v 0 =
jelölés v0 és V0 g0 g1
V0 Vst (1) Vst ( 2)

8.3.2. sz. tábla


részátlagindexek és összetételindex és
megnevezés a bruttó átlagbérek különbségek különbségek
eltérése
standard: B0 standard: v0
állománycso- 85.418 / 129.171 = 135.432 / 129.171
% Ft / fő / hó
port 66,1 % =104,8
85.418 - 129.171 = - 135.432 / 129.171 =
fizikai 62,1 -54.967
43.753 Ft +6.261 Ft
szellemi 74,7 -26.623 standard: B1 standard: v1
87.217 / 135.432 = 87.217 / 85.418 =
együtt 67,5 -41.954
64,4 % 102,1 %
87.217 - 135.432 = - 87.217 - 85.418 =
statisztikai jelölés i és I k és K
48.215 Ft +1.799 Ft

153 A területi összehasonlítás nem feltétlenül földrajzi ételemben használatos. A


gazdasági szaknyelvben szokás a nemzetgazdaság különböző területeiről beszélni,
miközben az egyes nemzetgazdasági ágakra, ágazatokra gondolunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 141 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 142 ►

♥ SZÖVEGES ELEMEZÉS
2003-ban Magyarországon a mezőgazdasági alkalmazottak bruttó átlagbé-
re 32,5 %-kal, azaz 41.954 Ft-tal alacsonyabb volt, mint az ipari alkalma-
zottaké.
Az eltérést két ellentétes előjelű hatás okozza. Egyrészt mind a két
megfigyelt részsokaságban (férfiak, nők) alacsonyabb az alkalmazottak
bruttó átlagbére. Ha a nemzetgazdaság két vizsgált ága között csak ebben
lenne eltérés (vagyis a nemek aránya azonos lenne), akkor a mezőgazdasági
és az ipari átlagbérek között még nagyobb különbség mutatkozna. A me-
zőgazdasági átlagbér 35,6 %-kal, azaz 48.215 Ft-tal lenne alacsonyabb.
Az eltérés másik oka a dolgozók nemek szerinti összetételének külön-
bözősége. A mezőgazdaságban a magasabb átlagbérű férfiak aránya majd-
nem 16 %-ponttal nagyobb, tehát a magasabb átlagolandó érték nagyobb
súlyt kap. Ezért, ha csak a nemenkénti szerkezet eltérésére figyelünk, azt
tapasztaljuk, hogy a mezőgazdasági átlagbérek 4,8 %-kal, azaz 6.261 Ft-tal
magasabbnak látszanak.
Fontos megjegyezni, hogy területi adatok elemzése esetén nem adódik
értelemszerűen, hogy melyik adatot jelöljük „0”-val és melyiket „1”-vel;
ezt eldönteni a számítást végzők feladata. A döntéshez azonban az elem-
zés során végig ragaszkodnunk kell. Ha a jelöléseket fordítva osztottuk
volna ki, természetesen részben más számadatokat kapunk eredményül, de
a következtetéseink a jelen megoldás következtéseivel azonosak lennének.
Tekintsük viszonyítási alapnak (0) a mezőgazdaságra vonatkozó adato-
kat és viszonyítandó értéknek (1) az ipar adatait. A főátlagindex = 148,1
%, a főátlagok eltérése epdig +41954 Ft. A részátlagindex (standard az
újabb időszak súly adata) = 151,2 %, az összetételindex (a tanult számsza-
ki összefüggésre figyelve) = 97,9 %. A két indexhez tartozó különbségek
pedig (az eddigi sorrendnek megfelelően) +43.753 Ft / fő / hó ill. -1.799
Ft / fő / hó. (Az indexek reciprokai az előzőekben kiszámítottaknak, a
különbségeknek pedig csak az előjele változott.) És most így fogalmazha-
tunk: az iparban dolgozók bruttó átlagbére 48,1 %-kal magasabb stb.
A standardizálás módszerét árak elemzésére is felhasználhatjuk, de
csak homogén árucsoportok esetén. Erre az ár-, érték-, volumenindex
számítás témakörben visszatérünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 142 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 143 ►

záró megjegyzések:
Az intenzitási viszonyszámok és a számtani átlag szoros "rokonságot" mutat, ezért
∑A ∑B v = g v = ∑ f x = g ∑s ∑s
1. V =
ij
= ∑ ij ij
∑ ij ij
xij =
ij
=
ij
= xa
∑B ∑B ∑f
ij ij ij
ij ij ij f ij n
ahol: xi = v , ∑ f = B , ∑ g = 1 és s = f * x
i i i i i i i

A képletekben két futóindexeket kellene alkalmaznunk (pl Bio ), az első a részeket


(csoportokat) jelentené, a második az eltérő időpontokat ill. az eltérő területeket, a
2.
képletek egyszerűbb írása érdekében azonban az első futóindex feltüntetésétől
eltekintünk.
A kapott számszerű eredmények szöveges megfogalmazásánál vigyáznunk kell a
megfelelő kifejezések használatra.
3. Ha időbeli összehasonlítást végzünk, akkor növekedésről, csökkenésről,
ha térbeli összehasonlítást végzünk, akkor eltérésről (azaz az egyik terület adata kisebb,
kevesebb vagy nagyobb, több lehet a másik terület adatánál) beszélhetünk.
Az indexeket ( I ) %-os formában használjuk, 100 % feletti részük jelenti a növeke-
dést, ill. azt, hogy a számlálóban szereplő területre vonatkozó adat nagyobb; a 100
4.
%-ra kiegészítő adat pedig a csökkenést ill. azt, hogy a számlálóban szereplő terü-
letre vonatkozó adat kisebb.
5. A különbségek ( K ) mértékegysége értelemszerűen megegyezik V mértékegységével.
A standardizálás módszerét homogén árucsoportok esetében az árak elemzésére is
6.
felhasználhatjuk. Erre a 9. fejezetben tértünk ki.
Ahogy a bemutató példákból is jól látható, a részátlagindex és az összetételindex ill.
az ezekhez tartozó különbségek nagysága, attól függően, hogy melyik adatokat
7. tekintettük állandónak, eltérő (egyes esetekben igen erősen). Az eltérés részletes
vizsgálata nem képezi tananyagunk részét, de a módszer használatakor éppen ezért
célszerű mindig mind a két súlyozást alkalmazva kiszámítani az adatokat.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 143 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 144 ►

8.4. Gyakorló feladatok

1. feladat

A magyar lakosság és a meghaltak életkoronkénti és nemenkénti


megoszlása, 2003154
meghaltak lakosság
életkor nők férfiak nők férfiak

–10 399 503 496.256 521.953
11 – 20 122 232 617.457 642.727
21 – 30 250 763 777.656 811.908
31 – 40 599 1.492 669.253 682.514
41 – 50 2.546 6.043 750.476 716.010
51 – 60 5.052 11.262 715.045 629.522
61 – 70 8.599 14.979 595.429 434.170
71 – 80 19.623 19.800 484.446 284.551
81 – 28.617 14.942 217.888 95.101
összesen 65.807 70.016 5.323.906 4.818.456

1. Mutassa ki az ezer lakosra jutó halálozási arányszámok nemenkénti


eltérését, továbbá az eltérést okozó tényezőket indexek és különbségek
formájában is!
2. Írjon szöveges elemzést!
3. Számítsa ki155 valamennyi részsokaságra vonatkozóan valamennyi
eddig tanult és kiszámítható statisztikai adatot (középértékek, szóródás
stb.)
4. Készítsen ábrákat!
5. Hasonlítsa össze a rész és a fősokaságok megoszlását, koncentráció-
ját!

154 Adatforrás: Demográfiai évkönyv (KSH, Budapest – 2004; 58. – 59. old. ill. 8. – 9. old. )
155 Az ismétlő feladatok megoldása érdekében, ha szükséges, lapozzon vissza az előző
fejezetekhez!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 144 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 145 ►

2. feladat

A 15 – 74 éves népesség gazdasági aktivitása nemek szerint Magyarorszá-


gon156
a gazdaságilag a gazdaságilag
foglalkoztatott
aktív 15 – 74 éves nem aktív 15 – 74
népesség
megnevezés népesség éves népesség
ezer fő
2000 2003 2000 2003 2000 2003
férfi 2.264,7 2.265,0 2.105,8 2.126,5 1.441,0 1.426,4
nő 1.855,2 1.901,4 1.750,4 1.795,4 2.218,6 2.152,1

1. Elemezze az aktivitási arány időbeli változását!


2. Elemezze a munkanélküliségi ráta időbeli változását!
3. Mindkét esetben mutassa ki az eltérést okozó tényezők hatását!
4. Írjon szöveges elemzést!

3. feladat

Az alkalmazásban álló nők bruttó átlagkeresete (Ft / fő / hó) 1998-ban és


2003-ban
• fizikaiak: 52.421 ill. 98.173
• szellemiek: 118.914 ill. 246.984
• együtt: 71.931 ill. 147.345
1. Elemezze a nők bruttó átlagkeresetének változását tényezőkre bon-
tással indexek és különbségek formájában is!
2. Írjon szöveges elemzést!

156 Magyar statisztikai évkönyv, 2003 (KSH, Budapest – 2004; 86. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 145 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 146 ►

4. feladat

Az alkalmazásban álló férfiak bruttó átlagkeresetének (Ft / fő / hó) változá-


sát vizsgálták 1998 és 2003 adatait összehasonlítva. A számítások során a
következő eredmények adódtak:
I = 2,048421404 I ′′ = 1,038840633 K ′′ = 5509 standard: B0

1. Számítsa ki – a tanult indexösszefüggéseket szem előtt tartva – az


elemzéshez hiányzó adatokat!
2. Írjon szöveges elemzést!

5. feladat

Egy vállalkozás bér- és létszámadatai:


bázis év tárgy év
nettó nettó
bérka- dolgozók bérka- dolgozók
bér bér
tegória tegória
ezer Ft fő ezer Ft fő
A 70 – 90 35 A 80 – 100 40
100 –
B 90 – 110 80 B 80
120
110 – 120 –
C 120 C 120
130 150
130 – 150 –
D 15 D 10
150 180
együtt 250 együtt 250
stat. jelölés

1. Számítsa ki az egy főre jutó bér változását, továbbá a változást okozó


tényezőket %-ban és Ft-ban is! (állandó: B1)
2. Írjon szöveges elemzést!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 146 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 147 ►

6. feladat

foglalkozási létszám egy főre jutó egy főre jutó


csoport 2004. jan. bér (2004) bér (2005)
megoszlás (%) e Ft e Ft
szellemi 68,8 200 220
adminisztratív 25,0 150 160
fizikai 6,2 100 115
összesen 100,0 … 203

1. Elemezze az egy főre jutó bér alakulását!


2. Mutassa ki befolyásoló tényezők hatását! A relatív és az abszolút vál-
tozást is számolja ki!
3. Írjon szöveges elemzést!

7. feladat

Egy termék gyártását egy vállalkozás budapesti és vidéki gyáregysége egy-


aránt rendszeresen végzi. A termék gyártásával kapcsolatban a következő
adatok állnak rendelkezésünkre:
2005. jan. 2006. jan.
a termelés az önköltség
gyáregység termelés önköltség
megoszlása változása
db Ft / db % Ft / db
Budapest 5 000 2 500 60 + 400
vidék 5 000 2 000 40 + 400
együtt

1. Elemzze az önköltség változását, mutassa ki a befolyásoló tényezők


hatását külön-külön, Ft-ban és %-ban is!
2. Írjon szöveges elemzést!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 147 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 148 ►

8. feladat

Két bánya 2005 évi termelési adatait hasonlítjuk össze. „Z” bánya termelé-
se a külszíni és a földalatti termelési mód között 75 – 25 %-ban oszlik
meg. A két bánya termelékenységét (= termelés létszámra vetítve) össze-
hasonlítva („Y” hasonlítva „Z”-hez) a következő indexeket kapjuk:
külszíni: 0,93 földalatti:1,00 együttesen: 1,10.
1. Számítsa ki a két bánya termelékenységének eltérését okozó tényezők
hatását indexek formájában!
2. Írjon szöveges elemzést!

8.5. Összefoglalás
= olyan statisztikai módszer, mellyel főátlagokat vagy összetett intenzi-
tási viszonyszámokat hasonlíthatunk össze úgy, hogy nemcsak azok
standar-
eltérésének relatív (I = index) vagy abszolút (K = különbség) nagysá-
dizálás
gát tudjuk megállapítani, hanem lehetőségünk nyílik az eltérést kialakí-
tó tényezők (= összetétel, egyedi indexek) hatásának kimutatására is.
az összehasonlítás elvégezhető:
– térben
– időben

alkalmazott képletek
V1
I
=
V0
, ahol
V1 =
∑B v 1 1
V0 =
∑B v
0 0
K = V1 − V0

∑B 1 ∑B 0

V1
I′
=
Vst ( 2 )
,
Vst ( 2 ) =
∑B v 1 0
= V1 − Vst ( 2 )
átlagfor- ahol → ∑B 1

mában K′
Vst (1)
is szá-
mít-ható
= ,
Vst (1) =
∑B v 0 1
= Vst (1) − V0
V
ahol →
0
∑B 0

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 148 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 149 ►

Vst ( 2 ) = Vst − V0
=
V0
I ′′ K ′′
V
= 1 = V1 − Vst (1)
Vst (1)

Összefüggések: (lásd: 6. sz. megjegyzés)


I st′ :B1 * I st′′:v0 vagy Kst′ :B1 + Kst′′:v0 vagy
I I st′ :B0 * I st′′:v1 K Kst′ :B0 + Kst′′:v1

8.6. Mintafeladatok korábbi vizsgadolgozatokból

1. minta

Egy kereskedelmi vállalkozás két részlegének adatai:


a forgalom meg-
az egy eladóra jutó forgalom
oszlása
részlegek
2005 2003 2005
% ezer Ft / fő / hó
konfekció 58 2.960 4.000
rövidáru 2.467 3.360
együtt 2.592

1. Elemezze az egy eladóra jutó forgalom nagyságát!


2. Mutassa ki a változásban szerepet játszó tényezők hatását!
3. Írjon szöveges elemzést!
4. A számításokat kétféleképpen is végezze el!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 149 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 150 ►

eredménytábla
A dolgozat-lapon természetesen több helye lesz az adatok beírására.
megfogalmazás számadat mértékegység stat. jelölés
a konfekció osztályon történt abszo-
lút változás
a konfekció osztályon történt relatív
változás
a rövidárú osztályon történt abszolút
változás
a konfekció osztályon történt relatív
változás
az együttes abszolút változás
az együttes relatív változás
a termelékenység változásának hatása
– abszolút változás (standard: a
2003-as létszámmegoszlás)
a termelékenység változásának hatása –
relatív változás
(standard: a 2003-as létszámmegoszlás)
a szerkezetváltozás hatása – abszolút
változás
a szerkezetváltozás hatása – relatív
változás
a termelékenység változásának hatása
– abszolút változás (standard: a
2005-ös létszámmegoszlás)
a termelékenység változásának hatása –
relatív változás
(standard: a 2005-ös létszámmegoszlás)
a szerkezetváltozás hatása – abszolút
változás
a szerkezetváltozás hatása – relatív
változás

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 150 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 151 ►

2. minta

Egy mezőgazdasági termelő háromféle szőlőt termeszt. A tárgyidőszaki


termésátlagok a következők: „A”: 5,0 tonna/ha, „B”: 6,5 tonna/ha, „C”:
7,0 tonna/ha. Az együttes termésátlag pedig 6,6 tonna/ha.
Az egyes fajták termésátlagainak változása a bázisidőszakról a tárgy-
időszakra: – 0,5; -0,7; -1,0 tonna/ha (adatok az előző sorrend szerint). Az
átlagos termésátlagok változása: + 0,3 tonna/ha.
A termőterületi arányok megváltozása miatt az együttes termésátlag a
vizsgált időszakban 0,9 tonna/ha-ral növekedett.
Elemezze az átlagos szőlőtermés változását indexek és különbségek for-
májában is! Standard: B1.
A főátlagok abszolút változása a részátlagok változása miatt.
Előjel is kell. A zsebszámológép kijelzőjéről csak az egésze számokat és az
első tizedest másolja át!
.…...
A főátlagok relatív változása. Előjel is kell. A zsebszámológép kijelzőjéről
csak az egésze számokat és az első tizedest másolja át!
…….
A főátlagok relatív változása az összetétel változása miatt. Előjel is kell. A
zsebszámológép kijelzőjéről csak az egésze számokat és az első tizedest másolja át!
……..

Döntse el az alábbi kijelentésekről, hogy igazak-e! igaz /


Az üres cellákba I (= igaz) vagy H (= hamis) betűt kell írni. hamis
Az Ön által megoldott feladatban a fiktív főátlag az összetételindex
nevezőjében szerepelt, így tudtuk a másik összetevő állandóságát
biztosítani.
Az Ön által megoldott feladatra vonatkozóan igaz, hogy a termőterületi
arányok a magasabb átlaghozamú fajták javára módosultak.
Az Ön által megoldott feladatra vonatkozóan igaz, hogy a termés-
átlagok átlagosan csökkentek.
Ha a standardizálásnál az állandónak vett tényezőt megváltoztatjuk, lehet-
séges, hogy más előjelű eredményeket (K’ és K”-re) kapunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 151 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 152 ►

3. minta

Két ország (K, L) halálozási arányszámait (=halálozási ráta, ezrelékben)


hasonlítottuk össze (a viszonyítási alap = K ország) az alábbi adatok isme-
retében:
életkor népesség halálozási ráta
millió fő ezrelék
év
K L K L
0 – 14 6 3 2,0 1,5
15 – 59 12 15 3,5 2,5
60 - 2 12 50,0 45,0
együtt 20 30

Miután elvégezte a szükséges számításokat (ahol standard: B0 ), írja be az


alábbi elemző szövegbe a hiányzó számadatokat, illetve fogalmakat!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 152 ►


Statisztika Standardizálás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 153 ►

szöveges elemzés
a színnel nem jelzett keretekbe szöveget,
a kék színűbe számokat,
a zöld színűbe mértékegységeket kell írni.

Két ország ……………………….. (= meghaltak / lakosság) hasonlítottuk


össze korcsoportonként és együttesen; abszolút és relatív módon is. Az ösz-
szehasonlítás során ………………………. adatait tekintettük
…………………….....
A korcsoportonkénti halálozási ráták rendre …………………….-ban
………………., ennek ellenére az együttes halálozási ráta
…………………….-ban a …………..,kerekítve …….. ……., azaz …….
…………..
Ha két országban ……………….. lenne a lakosság
………………………………… és csak a korcsoportonkénti halálozási
ráták térnének el, akkor természetesen ugyanarra az eredményre jutnánk, mint
a korcsoportonkénti összehasonlításnál; vagyis ……………….-ban az együt-
tes halálozási ráta ………. …….., azaz ……… ………….. ………………
lenne.
Az eltérő következtetés oka, hogy a lakosság korszerinti összetétele jelentősen
…………. ………………-ban a lakosság ………….. ………….., mint
………………-ban. A ……………….. életkorban pedig természetesen
………………. a …………………. (Azaz ………………. átlagolandó
értékhez ……………. …………………. = súlyok tartoznak és fordítva. Ez
pedig lefelé viszi a főátlagot /……………………………./.
Ha tehát a lakosság ……………………….. ………… lenne azonos a két
országban és csak a korszerinti összetétel térne el, akkor ………………….-
ban az együttes halálozási ráta …………. ………., azaz …………….
…………….. lenne ……………...
A standardizálással kapcsolatos számítások elvégzéshez szükségünk volt egy
…………. kiszámítására. Jelen esetben ………….. létszám adataival súlyoztuk
…………… halálozási ráta adatait. Az így kapott standard főátlag: …………..
…………… Ennek jelentését kétféleképpen is megfogalmazhatjuk.
1000 lakosra …………. halálozás jutna ……….., ha ott is az
……………….. halálozási ráták lennének érvényesek.
1000 lakosra ………… halálozás jutna …………….., ha ott is a
………………. létszámarányok lennének érvényesek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 153 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 154 ►

9. Ár-, érték-, volumenindex-számítás

9.1. Bevezetés
Egy család fogyasztásának, egy vállalat vagy egy nemzetgazdasági ág ter-
melésének, egy kereskedő forgalmának – és folytathatnánk a sort – össze-
sítése a fogyasztási javak, az előállított ill. az értékesített termékek sokszor
igen különböző természetes mértékegységei157 miatt gyakorlatilag egyetlen
módon lehetséges, ha ismerjük a megfigyelt javak, szolgáltatások stb. árait.
Ha ugyanis ezek mennyiségét (qi ) beszorozzuk egységárukkal ( pi ) már
összesíthető adatokhoz – a fogyasztás, a termelés, az értékesítés – értéké-
hez (vi = qi ∗ pi ) jutunk.

Ebben a fejezetben egy olyan statisztikai módszerrel ismerkedünk meg,


melynek segítségével az árakat, a mennyiségeket és az értéket egyedileg és
együttesen is elemezhetjük; változásukat, eltérésüket és összefüggéseiket
különbségek (k , K ) ill. indexek (i, I ) formájában kimutatva.

9.2. Egyedi elemzések


Egy-egy termék árát (i p ) , önköltségét; eladott vagy megtermelt mennyiségét
(i ) két időszak vagy két földrajzi terület adatai alapján is összehasonlíthatjuk.
q

A két változás (eltérés) együtt a vizsgált termékek értékének (iv ) , összköltség-


ének változását mutatja meg. Természetesen a statisztikai megfigyelés nem
terjed ki mindenegyes hazánkban előállított vagy forgalmazott termékre. A
teljes körű megfigyelés megoldhatatlan feladat (pénz, idő stb.) és tulajdonkép-
pen felesleges is. A tapasztalatok ugyanis azt mutatják, hogy egyes termékcso-
portokra vonatkozóan mindig kiválasztható egy-egy un. vezértermék, és elég
ennek változásait megfigyelni. (A vezértermék „húzza maga után” a termék-
csoport többi termékét.) Ilyen vezértermék pl. a tej-féleségek esetén a 2,8 %-os
literes kiszerelésű zacskós tej, vagy a kenyérféleségek esetén az 1 kg-os félbarna
kenyér. A vezértermékek közös jellemzője, hogy igen nagy mennyiségben

157 Gondoljuk meg, pl. az élelmiszerboltokban kilogrammban mérik a kenyeret, a húst,


literben a tejet, tubusban árulják a fogkrémet, különböző méretű flakonokban az üdítőt,
dobozokban a konzervet stb.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 154 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 155 ►

állítják elő, és nagyon sokan vásárolják az alacsonyabb jövedelmű lakossági


rétegek számára is elérhető áruk miatt.
Az egyedi vizsgálatok során számíthatunk:
• indexeket (= relatív változás, relatív eltérés158) és
• különbségeket (= abszolút változás)
az árakra,
az értékekre és
a volumenre (= mennyiségre) vonatkozóan is.
A felsorolt indexek és különbségek képletei:
p i1 qi1 vi1 qi1 pi1
ip = iq = iv = =
pi 0 qi 0 vi 0 qi 0 pi 0

árindex mennyiségi index értékindex


k p = pi1 − pio k q = qi1 − qi 0 k v = vi1 − vi 0

az árak változása a mennyiségek változása az érték változása


A képletekben szereplő betűk jelentése:
pi = qi = vi = i=
az i-edik termék az i-edik termék az i-edik termék a vizsgált termé-
ára mennyisége értéke kek sorszáma

iq = 0=
ip = iv = a bázisul válasz-
egyedi mennyiségi tott időszak jelö-
egyedi árindex egyedi értékindex
index lése
kq = kv = 1=
kp =
az egyedi mennyi- egy-egy termék a bázishoz hason-
az egyedi árak lítandó időszak
ségek abszolút értékének abszo-
abszolút változása adata
változása lút változása

Egyedi indexek esetén a számítás közvetlen eredménye mértékegység


nélküli szám, ezt százalékszámmá alakítjuk, majd a 100 %-hoz hasonlítva

158 A továbbiakban mindig csak változásról fogunk beszélni (= időbeli összehasonlítás),


ahogy a standardizálás témakörénél is tettük. A bemutató feladatok között azonban
találnak területi összehasonlításra vonatkozót is.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 155 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 156 ►

(= változatlanság) megkapjuk a relatív változásokat kifejező adatokat. (A


megfogalmazásokban rendszerint ez utóbbiak szerepelnek.)
A három egyedi indexek között – ahogy azt a képletek felírásából is
láthatjuk – összefüggés van, az értékváltozás két részre bontható, azaz
nemcsak a megadott formában, hanem a két másik index szorzataként159 is
felírható.
iv = i p ∗ i q

Az egyedi különbségek mindegyikének van mértékegysége, az árak és az


értékek esetén ez valamilyen pénznem, a mennyiségek esetében pedig db,
kg, l stb. lehet, a termék jellegétől függően. Az eltérő mértékegységek
azonban nem teszik lehetetlenné, hogy az értékek változását pénzben kife-
jezve is szétbontsuk összetevőire. A standardizálásnál megismert „állandó
tényező” gondolatát kell itt is követnünk. Ha az árak okozta értékváltozást
akarjuk felírni, akkor a mennyiségeket kell állandónak tekinteni, így:
q1 p1 − q1 p0 vagy q0 p1 − q0 p0 .

Ha pedig a mennyiségek változásának az értékre gyakorolt hatását akarjuk


kimutatni, akkor az egységárakat kell állandónak tekinteni, így:
q1 p1 − q0 p1 vagy q1 p0 − q0 p0 .

Ezekből a különbségekből azután „összerakható” a teljes értékváltozás,


így:
k v = (q1 p1 − q1 p0 ) + (q1 p0 − q0 p0 )

vagy
k v = (q0 p1 − q0 p0 ) + (q1 p1 − q0 p1 )

Az értékváltozás az árváltozásból és a mennyiségváltozásból adódó része


forintban kifejezve, ha az egyik ill. a másik számítást alkalmazzuk, eltérő
adatokat eredményez, ezért mindig alaposan meg kell gondolni160, melyik
képletet alkalmazzuk, ill. célszerű mindkét számítást elvégezni. (Számotte-
vő különbség a két számítás részeredményei között azonban csak akkor

159 Az indexek szorzása mindig együtthatós formájukkal történik.


160 Az összevont indexeknél visszatérünk a problémára.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 156 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 157 ►

van, ha olyan jelentős mértékű árváltozás történt, ami erősen befolyásolta


a mennyiségek alakulását.)

BEMUTATÓ FELADAT

9.1.1. tábla

A magyar mezőgazdaság adatai161 (kiemelés)


2000 2003
felvásár- felvásár-
megneve- termésmennyi- termésmennyi-
lási át- lási át-
zés ség ség
lagár lagár
ezer tonna ezer tonna
Ft / tonna Ft / tonna
búza 3.692 27.778 2.941 30.195
statisztikai
q0 p0 q1 p1
jelölés

9.1.2. tábla
1. munkatábla
a felvásárolt búza értéke,
a felvásárolt búza értéke
fiktív adatok
megnevezés milliárd Ft
milliárd Ft
2000 2003 1. 2.
búza 102,6 88,8 111,5 81,7
statisztikai jelölés q0 p0 q1 p1 q0 p1 q1 p0

161 Magyar statisztikai évkönyv 2003 (KSH – Budapest, 2004. 339., 393. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 157 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 158 ►

9.1.3. tábla
2. munkatábla
indexek különbségek
mennyi-
megneve- ár mennyiség érték ár érték
ség
zés
milliárd
% Ft ezer tonna
Ft
30.195 = 2.941 = 88,8 = 30.195 - 2.941 – 88,8 -
búza 27.778 3.692 102,6 27.778 = 3.692 = 102,6=
=108,70 = 79,66 = 86,60 =2.417 =(-751) =(-13,8)
statisztikai ip iq kp kq
iv kv
jelölés

9.1.4. tábla
3. munkatábla
értékváltozás (milliárd Ft) az értékváltozás ösz-
megnevezés az árak válto- a mennyiség szetevőkből
zása változása milliárd Ft
állandó következtében
111,5 - 102,6= 81,7 - 102,6= 8,9 + (- 22,7) = (-13,8)
a 2000 évi adat
=8,9 =(-20,9)
statisztikai
q0 p1 − q0 p0 q1 p0 − q0 p0
jelölés
7,1 + (- 20,9) = (-13,8)
88,8 - 81,7= 88,8 - 111,5=
a 2003 évi adat
=7,1 =(-22,7)
statisztikai
q1 p1 − q1 p0 q1 p1 − q0 p1
jelölés

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 158 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 159 ►

♥ SZÖVEGES ELEMEZÉS
A magyar búzatermelés 2000 és 2003 évi mennyiségi adatait (ezer tonna) és
felvásárlási árait (Ft/tonna) hasonlítottuk össze. Megállapítottuk, hogy a fel-
vásárlási ár 8,7 %-kal (i p ) emelkedett, a termelt mennyiség viszont ≅20 %-
kal (iq ) csökkent. A két ellentétes hatás következtében a megtermelt búza
értéke is – 1≅3,4 %-kal (iv ) –– csökkent. Végezetül elkülönítettük az érték-
változás összetevőinek hatását pénzmértékegységben is. Ha csak az árak
változtak volna, akkor az érték is növekedett volna 8,9 milliárd Ft-tal. Ha
csak a mennyiség változott volna a ténylegesnél nagyobb 22,7 milliárd Ft-
os lett volna az értékcsökkenés. (És ez a csökkenés az erősebb hatás.)

9.3. Összevont (együttes, átlagos) elemzések


Tekintettel arra, hogy az egyes termékek, szolgáltatások ára és mennyisége
nem egyforma mértékben és nem azonos irányban változik, még akkor
sem tudjuk biztosan megmondani, hogy például egy család helyzete javult-
e vagy éppen romlott, azaz jövedelméért a korábbinál nagyobb vagy ki-
sebb mennyiségű terméket ill. szolgáltatást tudott-e megvásárolni, ha fo-
gyasztói kosarának igen sok vagy majdnem minden összetevőjére megha-
tározzuk az egyedi indexeket. Hasonló a helyzet, ha a vállalatok akarják
megtudni, helyzetük hogyan alakult, akár mint vevőknek a beruházási ja-
vak vagy a munkaerő piacán, akár mint eladóknak értékesítési piacaikon.
Ezért van szükség az összevont indexek és különbségek számítására is.
Ezek a termékek egy-egy csoportját vagy akár teljes sokaságát együtt vizs-
gálják, és az átlagos ár-, mennyiség- és értékváltozást mutatják. To-
vábbá szükség van ezen együttes változások pénzben (abszolút változás)
történő kifejezésére is.
Az együttes változások számítása legkönnyebb az értékváltozások ki-
mutatása esetében. Az értékadatok ugyanis összesíthetőek, összegüknek
van jelentése. Megmutatják egy család teljes fogyasztását, egy áruház teljes
forgalmát stb. Ezek az összesített adatok pedig oszthatóak egymással ill.
kivonhatóak egymásból. Képletszerűen:

Iv =
∑q p1 1
K v = ∑ q1 p1 − ∑ q0 p0
∑q p0 0

aggregát értékindex aggregát értékváltozás

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 159 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 160 ►

A különböző termékek árainak és mennyiségi adatainak összesítése azon-


ban értelmetlen. Sőt – ahogy erről a bevezetőben már írtunk – a mennyi-
ségek összesítése sokszor lehetetlen is. Az árak összesítése pedig, ha azt
feltételezzük, hogy van olyan vásárló, aki minden megfigyelt áruból egyet-
egyet vesz, akkor sem lehetséges, hiszen az egy itt q-jelű, mennyiségi adat,
amivel szorozni kellett az árat (természetesen ez a számadaton nem vál-
toztatott), így az eggyel szorzott áradatok összege, már értékadat. Az ösz-
szesítési nehézséget úgy oldjuk meg, ahogy azt az egyedi értékváltozás
összetevőkre bontásánál is tettük, értékeket összesítünk, majd ezeket oszt-
juk egymással, ill. vonjuk ki egymásból. Ezek az értékadatok azonban
mindig csak egyik tényezőjükben különböznek. Ennek az a következmé-
nye, hogy a kiszámított ár- és mennyiségi index mindig kétféle jelentést
hordoz. Egyrészt átlagos átváltozást ill. átlagos mennyiségváltozást
fejeznek ki, másrészt az árváltozások ill. a mennyiségváltozások következ-
tében kialakult értékváltozást, vagyis az értékváltozás összetevőit mu-
tatják. Képletszerűen:

I 0p =
∑q p
0 1
I 1p =
∑q p
1 1
I q0 =
∑q p
1 0
I q1 =
∑q p1 1

∑q p
0 0 ∑q p
1 0 ∑q p
0 0 ∑q p0 1

Laspeyres féle Paasche féle Laspeyres féle Paasche féle


árindex árindex mennyiségi- mennyiségi
index index
Ha felsorolt indexek számlálójában szereplő adatból kivonjuk a nevezőjé-
ben szereplő adatokat, akkor jutunk a már említett abszolút változást kife-
jező különbségekhez. Ezek az indexek felsorolási rendjének megfelelően:
• Az árváltozásokból bekövetkező értékváltozások:

K p0 = ∑ q0 p1 − ∑ q0 p0

K 1p = ∑ q1 p1 − ∑ q1 p0

• A mennyiségváltozásokból bekövetkező értékváltozások:

K q0 = ∑ q1 p0 − ∑ q0 p0

K q1 = ∑ q1 p1 − ∑ q0 p1

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 160 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 161 ►

A gyakorlati tapasztalatok azt mutatták, hogy a különböző szemléletű (bá-


zis- = Laspeyres, tárgyidőszaki = Paasche) indexek esetenként nemcsak
kisebb-nagyobb mértékben eltérőnek mutatták az árak vagy a mennyisé-
gek változását, hanem még előjelükben sem egyeztek meg. Ezért célszerű-
nek látszott átlagformulákat kidolgozni. Ezek közül a legismertebbek a
Fisher-féle ár- és mennyiségi index, a Laspeyres- és a Paasche-féle indexek
mértani átlaga. (Ezekhez azonban nem tudunk különbségeket rendelni.)

I pF = I p0 * I 1p I qF = I q0 * I q1

árindex mennyiségi index


Az eddig felsorolt összevont (aggregát) képletekben szereplő betűk jelen-
tése:
(Azokat a betűjeleket, melyek már az egyedi index-képletekben előfordultak, nem
ismételjük.)
Ip = Iq = Iv =
összevont árindex összevont mennyiségi index összevont értékindex
Kp = Kq =
az árváltozások miatt a mennyiségváltozások mi- K v =
bekövetkezett értékválto- att bekövetkezett értékvál- az értékváltozás pénzben
zás pénzben kifejezett tozás pénzben kifejezett kifejezett nagysága
nagysága nagysága
0 = L = Laspeyres-féle = 1 = P = Paasche-féle = a
F = a Fisher-féle átlag-
a bázisszemléletű indexek tárgyidőszaki szemléletű
formula jelölése
jelölése indexek jelölése

Az eltérő szemléletű árindexekkel kapcsolatban igen sok vita volt és folyik


napjainkban is. A bázisidőszaki súlyozás azt jelenti, hogy az árváltozás
indukálta mennyiségváltozásokat a számítások során nem vesszük figye-
lembe. Ezzel szemben a tárgyidőszaki súlyozás alkalmazása során már, az
esetleg nagyon nagy mértékű áremelés következtében erősen megváltozott
fogyasztási szerkezettel dolgozunk. A lehetséges árindexek közül való vá-
lasztás tehát alkalmas egy jelentős áremelés „elfedésére” is.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 161 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 162 ►

Az elemzéshez felsorolt indexekkel kapcsolatban leírtuk, átlagjelentéssel


bírnak. Ha számításuk további lehetséges képleteit felírjuk, és alaposan
áttekintjük, ennek részletes magyarázatára már nincs is szükség.

• értékindex: I v =
∑ q p *i 0 0 v
=
∑q p 1 1

∑q p 0 0
qp
∑ i 1 1

• árindexek:

I p0 =
∑q p *i
0 0 p
=
∑q p 0 1
ill. I 1p =
∑q p *i 1 0 p
=
∑q p1 1

∑q p 0 0
qp
∑ i 0 1 ∑q p 1 0
qp
∑ i 1 1

p p

• mennyiségi indexek:

I q0 =
∑q p *i
0 0 q
=
∑q p 1 0
ill. I q1 =
∑ q p *i 0 1 q
=
∑q p1 1

∑q p 0 0
qp
∑ i 1 0 ∑q p 0 1
qp
∑ i 1 1

q q

Általános szabály, hogy ha az aggregát képlet nevezőjében szereplő érték-


adatot alkalmazzuk súlynak, akkor a számtani átlagformát; ha pedig a
számlálójában szereplő értékadatot alkalmazzuk súlynak, akkor a harmo-
nikus átlagformát kell használnunk. Ezekben a formákban az értékadatok
helyett természetesen azok megoszlása is szerepelhet.162
Például:

Iv =
∑q p *i 0 0 v
= ∑ g 0iv =
∑q p 1 1
=
1
,
∑q p 0 0
qp
∑ i 1 1
∑i
g1
v v

q0 p0 q p
ahol g 0 = és g1 = 1 1
∑ q0 p0 ∑ q1 p1
Végezetül az összefüggésekre kell figyelmünket fordítani! Ahogy az
egyedi vizsgálatnál láttuk, az ár- és a mennyiségváltozás az értékváltozás

162 Lásd: a számtani átlaggal kapcsolatban tanultakat!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 162 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 163 ►

két tényezője, így az értékindex az ár- és a mennyiségi index szorzataként


előállítható, és az értékváltozás forintban kifejezett nagysága is felosztható
a két tényező elkülönített hatására. Ez a lehetőség az aggregát indexek és
különbségek esetében is fennáll, de a különböző szemléletmódok miatt
nem minden esetben, számszakilag pontos csak az un. keresztbe-
súlyozással lesz.

I v = I p0 * I q1 = I 1p * I q0 = I pF * I qF K v = K 1p + Kq0 = K p0 + Kq1

BEMUTATÓ FELADAT I.

9.2.1.sz. tábla
A magyar mezőgazdaság adatai163: fontosabb zöldségfélék
2000 2003
termésmennyi- piaci termésmennyi- piaci
megnevezés
ség átlagár ség átlagár
ezer tonna Ft / kg ezer tonna Ft / kg
fejeskáposzta 120 65,8 153 90,7
paradicsom 203 197,1 281 232,8
petrezselyemgyö-
34 372,4 30 393,3
kér
sárgarépa 89 154,7 81 180,1
uborka 103 192,1 94 184,5
vöröshagyma 117 95,2 94 129,1
zöldbab 27 296,0 26 278,3
zöldpaprika 98 276,5 84 267,3
statisztikai jelölés q0 p0 q1 p1

163 Magyar statisztikai évkönyv 2003 (KSH – Budapest, 2004. 339., 393. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 163 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 164 ►

9.2.2.sz. tábla
1. munkatábla
a zöldségfélék piaci ér- a zöldségfélék piaci értéke,
megnevezés téke (millió Ft) fiktív adatok (millió Ft)
2000 2003 1. 2.
fejeskáposzta 7.896,0 13.877,1 10.884,0 10.067,4
paradicsom 40.011,3 65.416,8 47.258,4 55.385,1
petrezselyemgyökér 12.661,6 11.799,0 13.372,2 11.172,0
sárgarépa 13.768,3 14.588,1 16.028,9 12.530,7
uborka 19.786,3 17.343,0 19.003,5 18.057,4
vöröshagyma 11.138,4 12.135,4 15.104,7 8.948,8
zöldbab 7.992,0 7.235,8 7.514,1 7.696,0
zöldpaprika 27.097,0 22.453,2 26.195,4 23.226,0
együtt 140.350,9 164.848,4 155.361,2 147.083,4
statisztikai jelölés q0 p0 q1 p1 q0 p1 q1 p0

9.2.3. sz. tábla


2. munkatábla
indexek különbségek
megnevezés ár mennyiség érték ár mennyiség érték
% Ft / kg ezer tonna millió Ft
fejeskáposzta 137,8 127,5 175,7 24,9 33 +5.981,1
paradicsom 118,1 138,4 163,5 35,7 78 +25.405,5
petrezselyemgyökér 105,6 88,2 93,2 20,9 -4 -862,6
sárgarépa 116,4 91,0 105,9 25,4 -8 +819,8
uborka 96,0 91,2 87,7 -7,6 -9 -2.443,3
vöröshagyma 135,6 80,3 109,0 33,9 -23 +997,0
zöldbab 94,0 96,2 90,5 -17,7 -1 -756,2
zöldpaprika 96,7 85,7 82,9 -9,2 -14 -4.643,8
együtt – – 117,5 – – +24.497,5
statisztikai jelölés ip iq iv kp kq kv

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 164 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 165 ►

9.2.4. sz. tábla


indexek (%) értékkülönbségek (millió Ft)
mennyiség-
árváltozás
ár mennyiség érték változás együtt
miatt
miatt
I p0 = I q0 = K p0 = K q0 = Kv =
I v = 117,5
110,7 104,8 +15.010,3 +6.732,5 +24.497,5
I p0 ∗ I q1 K p0 + K q1
I 1p = I q1 = K 1p = K q1 =
≅ =
112,1 106,1 +17.765,0 +9.487,2
1,107*1,061 +15.010,3+9.487,2
I 1p ∗ I q0 K 1p + K q0
I pF =
I qF = 105,4 ≅ =
111,4
1,121*1,048 +17.765,0+6.732,5
I pF ∗ I qF

1,114*1,054

♥ SZÖVEGES ELEMEZÉS
A Magyar statisztikai évkönyv (2003) adatai alapján a legfontosabb zöld-
ségfélék piaci értékének változását vizsgáltuk. A zöldségfélék ára átlagban
( )
10,7 %-kal (I p0 ), termelt mennyisége pedig 6,1 %-kal I q1 emelkedett. E
két változás következtében a piaci érték 17,5 %-kal magasabb volt 2003-
ban, mint 2000-ben.
Ha csak az árak változtak volna, akkor 15.010,3 millió Ft-tal, ha pedig
csak a termelt mennyiségek változtak volna, akkor 9.487,2 a millió Ft-tal,
és így együtt 24.497,5 millió Ft-tal emelkedett a kiemelt termékek együttes
piaci értéke.
A termékeket egyedileg vizsgálva megállapíthatjuk, hogy a legnagyobb
árnövekedés a fejeskáposztát jellemzi (+37,8%), a legnagyobb árcsökkenés
pedig a zöldbabot (-6%). A termelt mennyiségek általában csökkentek,
kivéve a fejeskáposztát (+27,5%) és a paradicsomot (+38,4%). A mennyi-
ségek átlagos növekedése annak köszönhető, hogy ezen, növekvő mennyi-

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 165 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 166 ►

ségű termékek aránya a megfigyelt sokaságon belül elég jelentős. A vizsgált


termékek közül négynek emelkedett a piaci értéke, legnagyobb mértékben
– és ez az előzőek figyelembevételével nem meglepő – a fejeskáposzta
esetén (+75,7%); négy termék esetében pedig csökkenést tapasztaltunk, s
ez a zöldpaprikára vonatkozóan a legnagyobb, ≅17 %.
Fontos megjegyeznünk, hogy mezőgazdasági termékekről lévén szó a
termelt mennyiségeket nagymértékben befolyásolhatta az időjárás, és ez
természetesen jelentős hatást gyakorolt a piaci árakra is.
Az ár-, és a mennyiségi indexek jelentésének megfogalmazása így is helyes lenne, az-
az a szöveges elemzés első bekezdésében ez is szerepelhetett volna: A zöldségfélék piaci
( )0
árának átlagos növekedése következtében 10,7 %-kal I p , termelt mennyiségének változása miatt
( )
1
pedig 6,1 %-kal I q emelkedett piaci értékük.

9.4. Az ár-, érték-, volumenindexek felhasználási


lehetőségei
Az eddigiekben bemutatott indexeket nemcsak az árak, a mennyiségek és
az értékek időbeli változásának elemzésére használhatjuk. A módszert
felhasználhatjuk:
1. területi és
2. nemzetközi elemzésekhez,
3. a jövedelmek értékének vizsgálatára,
4. indexsorok képzésére és az
5. un. árollók számítására is, valamint
6. a tőzsdei árfolyamok jellemzésére, továbbá
7. piacelemzésre, az egyedi ár- és mennyiségi indexek közötti korrelációs
kapcsolatot megfigyelve.
1. A területi összehasonlítás során két különböző földrajzi hely pia-
cán vizsgálunk azonos termékeket. A számítások megkezdése előtt mindig
el kell döntenünk, hogy melyik terület adatát használjuk viszonyítási alap-
nak (= bázisnak), és melyik területét viszonyítandó értéknek. Döntésünk-
höz a számítások során végig ragaszkodnunk kell. A szöveges elemzés ké-
szítése közben pedig vigyáznunk kell a helyes szóhasználatra, nem írhatunk
növekedésről, csökkenésről, változásról. Egyik terület árai csak alacso-
nyabbak (kisebbek) vagy magasabbak (nagyobbak) lehetnek a másik terüle-
ten jellemző áraknál, azaz eltérhetnek egymástól, ill. lehetnek azonosak.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 166 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 167 ►

2. A területi összehasonlítás speciális esete a nemzetközi összeha-


sonlítás, amikor is két országban figyeljük meg valamely termékek árait,
termelt vagy fogyasztott mennyiségeit, majd elvégzzük a számításokat.
Fontos, hogy az elemzés során nem váltjuk át egyik ország valutáját sem a
másikéra. Ennek következtében az értékindex értelmezhetetlenné válik, az
árindex jelentése megváltozik, egyedül a mennyiségi index őrzi meg eredeti
jelentését, és csak az ehhez tartozó különbség értelmezhető. A számítások
során kötelező a Fisher-féle indexek használata, ugyanis az egyes orszá-
gok esetleg igen eltérő árarányai ill. termelési, fogyasztási szerkezete miatt
gyakran tapasztaljuk, hogy a különböző szemléletű indexek más előjelű
eredményt mutatnak, ezért elengedhetetlen az átlagolás.
Milyen új jelentést kap az árindex? Akármelyik szemléletű árindexet is
számítjuk ki, mindegyik azt fogja megmutatni, hogy az egyik országban
hányszor több (vagy kevesebb) saját valutát kell kiadni azonos mennyiségű
terméktömeg megvásárlása esetén. Ebből következik, hogy az árindex
ebben az esetben a valutákat (és nem az árakat) hasonlítja össze. Ha
például a számlálóban szereplő értékadat a nagyobb, vagyis az osztás
eredménye egy egész fölötti, akkor annak az országnak a valutája a rosz-
szabb, amelyiknek adatai éppen a számlálóban szerepeltek.
(Gondoljunk egy egyszerű, és nagyon sokunk által személyesen is ismert tényre! Ausztriá-
ban egy kg banánt 1 euró körüli áron, itthon pedig 300 Ft körüli áron tudunk megvásárol-
ni – 2006. március –, és mindannyian tudjuk azt is, hogy nem a forint az erősebb valuta.)
A vizsgálat további érdekessége – és tulajdonképpen ez adja az elemzés
igazi értelmét – az, hogy a különböző termékcsoportok vizsgálata gyakran
igen eltérő eredményre vezet. Tehát a forint / euró arány más lesz az élel-
miszerek, más a szolgáltatások (fodrász, fogász, optikus stb.) és megint más
a vendéglátás stb. megfigyelése esetén. Ennek oka, hogy az egyes termékek
és szolgáltatások árainak arányai és a termelt vagy fogyasztott mennyiségek
arányai sem azonosak az egyes országokban. (Ezek a vizsgálatok egyébként
magyarázatot adhatnak az un. bevásároló turizmusra is.)
Néhány gyakran vásárolt élelmiszerre vonatkozóan gyűjtöttünk adato-
kat. Az egységárakat a Billa-lánc (Ausztria) ill. a TESCO-lánc (Magyaror-
szág) húsvéti katalógusából vettük, a mennyiségeket pedig egyéni kikérde-
zés (két négytagú család) alapján jegyeztük föl. A megfigyelt adatokat a
9.3.1. sz. tábla, a mutatók értékének meghatározásához szükséges számítá-
sokat pedig a 9.3.2. sz. tábla tartalmazza. (Az indexekben a 9.3.2. sz. tábla
összesen adatai szerepelnek.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 167 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 168 ►

BEMUTATÓ FELADAT

9.3.1. sz. tábla


egységár mennyiség / hó
megneve-
mérték- Ausztria Magyarország
zés Ausztria Magyarország
egység euró/kg Ft / kg
alma kg 2,25 296 30 20
banán kg 1,69 349 30 10
ementáli
kg 11,9 1.850 2 1
sajt
húsvéti
kg 3,99 1.450 2 2
sonka
Zippfer sör 0,5 liter 0,67 280 60 30
ásványvíz liter 0,29 119 120 30
Fanta üdítő liter 0,66 260 30 12
statisztikai jelölés p1 p0 q1 q0

9.3.2. sz. tábla


megnevezés q0p0 q1p1 q0p1 q1p0
alma 5.920 67,5 45 8.880
banán 3.490 50,7 16,9 10.470
ementáli sajt 1.850 23,8 11,9 3.700
húsvéti son-
ka 2.900 7,98 7,98 2.900
Zippfer sör 8.400 40,2 20,1 16.800
ásványvíz 3.570 34,8 8,7 14.280
Fanta üdítő 3.120 19,8 7,92 7.800
együtt 29.250 244,78 118,5 64.830

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 168 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 169 ►

9.3.3. sz. tábla


indexek Laspeyres Paasche Fisher
ár 0,00405 0,003776 0,003911
mennyiség 2,21641 2,065654 2,139705

♥ A két család közül a vizsgált élelmiszerekből az Ausztriában élő csa-


lád átlagosan ≅ 114 %-kal többet vásárolt, és azonos mennyiségű termé-
kért saját valutájából kevesebbet kellett kiadnia (I pF 〈1) . A vizsgált termé-
kek körében 1Ft = 0,003911Euró , ill. 1Euró = 255,689 Ft .
Ez azt jelenti, hogy az osztrák családnak akkor érdemes hazánkban be-
szereznie a vizsgált termékeket (eltekintve most az utazás költségeitől), ha
1Euróért legalább egy bank többet ad ≅ 256 Ft-nál. Ebben az esetben a
többlet pénzt a 9.3.1. sz. táblában szereplő termékekből még nagyobb
mennyiségek megvásárlására fordíthatja, vagy más termékeket is megve-
het.
3. Mindennapi tapasztalataink mutatják, hogy egyes esetekben hiába
emelkedik keresetünk, családunk összes jövedelme (= nominálértéke),
nem tudunk több terméket fogyasztani, több szolgáltatást igénybe venni,
sőt esetenként vissza kell fogni fogyasztásunkat (= reálérték). Az értékin-
dex alkalmas arra, hogy kimutassuk a jövedelmek nominálértékének válto-
zását, a mennyiségi index pedig a reálérték változását mutatja meg. A két
index közötti kapcsolatot az árszínvonal változása (= átlagos árváltozás)
teremti meg.
A KSH 2002-es és 2003-as bruttó ill. nettó átlagkereseti adatai alapján
vizsgáltuk a nomináljövedelmek (értékindex) és a reáljövedelmek (mennyi-
ségi index) alakulását külön a férfiakra és a nőkre, ill. a szellemi és fizikai
foglalkozásúakra. Számításainkhoz a hivatalos fogyasztói árindexet (104,7
% = I p ) használtuk164.

164 adatforrás: Magyar statisztikai évkönyv 2003 (KSH – 2004, 99., 101. és 348. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 169 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 170 ►

BEMUTATÓ FELADAT

9.4.1. sz. tábla


a nettó
bruttó átlagke- nettó átlag-
a bruttó átlagkereset
megne- reset átlagkereset kereset
változása
vezés Ft / fő / hó Ft / fő / hó válto-
zása
2002 2003 2002 2003 2003 / 2002 (%) I v
147.345/131.243=1,124
férfiak 131.143 147.345 82.745 93.604 +13,1
+12,4
nők 111.725 128.931 72.036 84.199 +15,4 +16,9
fizikai
alkalma- 84.751 91.397 58.472 66.716 +7,8 +14,1
zottak
szellemi
alkalma- 169.826 193.275 101.615 115.739 +13,8 +13,9
zottak

9.4.2. sz. tábla


a fogyasztói árindexszel korrigált átlagkereset
változások
megnevezés bruttó nettó
2003 / 2002 (%) I q
1,124/1,047= 1,0735
férfiak +8,0
+7,4
nők +10,2 +11,7
fizikai alkalmazottak +3,0 +9,0
szellemi alkalmazottak +8,7 +8,8

♥ A 9.4. sz. táblák adatiból kiolvashatjuk, hogy 2002-ről 2003-ra a mind


a bruttó, mind a nettó átlagkereset a nők esetében emelkedett legnagyobb
mértékben (+15,4 ill. +16,9%), így természetesen a reáljövedelem is a fog-
lalkoztatottak ezen csoportjában nőtt a leginkább (+10,2 ill. +11,7 %). A

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 170 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 171 ►

felsorakoztatott indexek körül a lakosság helyzetének javulását legponto-


sabban a fogyasztói árindexszel korrigált nettó jövedelem-változás adatai
fejezik ki.
4. Abban az esetben, ha a vizsgált termékek körére nemcsak két év
adatai állnak rendelkezésünkre, lehetőségünk van indexsorokat összeállíta-
ni. Az indexsorok165 egyes elemei lehetnek bázisviszonyszámok166 és
láncviszonyszámok167. Vonatkozhatnak mind az árakra, mind a mennyisé-
gekre és az értékekre is. Képezhetünk indexsorokat állandó- és változó
súlyozással; ill. Laspeyres vagy Paasche szemléletben is. Az eddigiekben
felsorolt indexsorok mindegyikének vannak előnyei és hátrányai. Például
az igen hosszú indexsorok esetén az állandó súlyozás a valóságtól való
nagymértékű elszakadást eredményezheti. (Ilyen esetekben megoldás lehet
a szakaszosan változó – pl.: 5 évente – súlyozás alkalmazása.) A változó
súlyozás viszont a számszaki összefüggéseket nem biztosítja, azaz két in-
dexsor tagjainak ismeretében nem tudjuk pontosan meghatározni a har-
madik indexsor egyes elemeit. (Egyébként, ha nincs más lehetőségünk,
akkor a számítások során csak a logikai összefüggésre alapozunk.)
• a bázis érték-indexsor (%):

100,0 ; ∑q i1 pi1
; ∑q i2 pi 2
;∑
qi 3 p i 3
; stb.
∑q i 0 pi 0 ∑q i 0 pi 0 ∑q i 0 pi 0

• lánc érték-indexsor (%):

∑q i2 pi 2
; ∑q i3 pi 3
; stb.
∑q i1 pi1 ∑q i 2 pi 2

• bázis ár-indexsor változó súlyokkal, Paasche-szemléletben (%):

100,0; ∑q i1 pi1
; ∑q i2 pi 2
; ∑q i3 pi 3
; stb.
∑q i1 p i 0 ∑q i 2 pi 0 ∑q i 3 pi 0

5. A gazdaságstatisztikai elemzésekben gyakori, hogy két egymással va-


lamilyen kapcsolatban álló termékcsoport indexeit hasonlítják össze, és az
összehasonlítás eredményét ugyancsak hányados (%-os) formában adják
meg. Az ilyen jellegű összehasonlítás az árindexekre vonatkozóan a leg-
165 Az indexsorok részletesebb tárgyalása nem képezi tananyagunk részét.
166 Mindig a legelső év adatai képezik a viszonyítási alapot.
167 Mindig az előző év adatai képezik az összehasonlítás alapját.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 171 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 172 ►

gyakoribb. Az eredményül kapott adatot pedig árollónak nevezik. A két


legismertebb árolló a cserearányindex és az agrárolló.
Az agrárolló a mezőgazdasági termeléshez felhasznált különböző
termékekre és szolgáltatásokra vonatkozó árindex és a mezőgazdaság által
előállított, értékesített termékek árindexének hányadosa. (A két termék-
halmaz közti kapcsolat mibenléte különösebb magyarázatra sem szorul. A
mezőgazdasági termékek értékesítése feltétele annak, hogy a termelők be-
szerezhessék azokat az ipari termékeket – gépeket, növényvédő-szereket
stb. –, melyek nélkül nem tudják folytatni tevékenységüket.)
A cserearányindex, a kivitel (export) és a behozatal (import) közötti
hasonló kapcsolatra alapozva, hasonlítja össze az export- és az import-
árindexeket.

Az árolló azt mutatja meg, hogy valamely bevételt biztosító termékek bá-
zisidőszakival azonos, illetve egységnyi volumenéért mennyivel nagyobb
vagy kisebb volumenű másféle termék kapható cserébe a tárgyidőszakban.

I bp
árolló =
I pk

I bp = a bevételt biztosító termék árindexe (kivitel)


I pk = a vásárolni kívánt termék árindexe (behozatal)

Például, hazánkban 1993-ban az importált termékek ára 9,4 %-kal volt


magasabb, mint az előző évben, az exportált cikkek ára pedig 11,9 %-kal.
Ugyanezek az adatok 1999/2000 viszonylatában +12,9 % ill. +9,9 %, vé-
gül a 2003-as és a 2002-es adatokat összehasonlítva: +0,1 ill. -0,4 %.
♥ Így 1993-ban a cserearány javulását mutatott az előző évhez képest
(1,119 / 1,094 = 102,3 %). Ez azt jelenti, hogyha az egész exportból szár-
mazó bevételt importra fordítottuk volna, akkor az import mennyiségét 2,3
%-kal emelhettük volna. 2000-re vonatkozóan viszont a cserearány romlá-
sát figyelhettük meg (1,099 / 1,129 = 97,3 %), vagyis ha az egész exportból
származó bevételt importra fordítottuk volna, akkor is csak kisebb (2,7 %-
kal) mennyiségű árut importálhattunk volna. Az utolsó megfigyelés szintén
cserearány-romlást jelez (0,996 / 1,001 = 0,995 → -0,5 %).

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 172 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 173 ►

6. A tőzsdeindex elnevezést kétféle értelemben is használják, egyrészt


a részvények átlagos árszintjének, másrészt a részvények átlagos árfolya-
mának megjelölésére is. A legnevezetesebb tőzsdeindex az 1884 óta számí-
tott Dow-Jones ipari index (USA). Értékét 30 különböző iparágban mű-
ködő, vezető iparvállalat részvényeinek árfolyamát átlagolva határozzák
meg, folyamatosan követve a napi árfolyammozgásokat. (1991-től a Buda-
pesti Értéktőzsde indexe – BUX168 – is meghatározásra kerül. Értéke:
1992-ben = 988,4; 2003-ban = 9.914,1. Bázis = 1991. jan. 2.)
7. Az egyedi ár- és mennyiségi indexeket a koordináta rendszerben áb-
rázolva (a vízszintes tengelyen az árindexek, a függőleges tengelyen pedig a
mennyiségi indexek értékeit felvéve) általában (ha nem un. sznob-
termékekről stb. van szó) a megfigyelt (számított) adatok pontjai közé egy
negatív lejtésű egyenes (görbe) illeszthető. Ennek alapján azt feltételezhet-
jük, hogy a két index között negatív korrelációs kapcsolat van. Ilyen
ábra elkészítése a bemutató példáinkban szereplő igen kevés adat miatt
nem lehetséges, de gondoljunk elméleti közgazdaságtani tanulmányainkra,
a keresleti görbe ereszkedő jellegére.

9.5. Kiegészítés
A standardizálás tárgyalása során megemlítettük, hogy egyes esetekben –
homogén árucsoportok – a megfigyelt adatok mind a standardizálás módsze-
rével, mind az ár-, érték-, volumenindexekkel elemezhetők. Az alábbiakban
egy bemutató példával szemléltetjük az ilyen eseteket. Megfigyeléseink két
magyarországi üdülőkörzetre vonatkoznak, és az egy éjszakára jutó szállásdíj
elemzését végezzük el. Legfontosabb megfigyelésünket előre bocsátjuk:

I ′ = I p0 , ha standard: B0 és

I ′ = I 1p , ha standard: B1

Az elemzés lényeges különbsége, hogy a standardizálás során az átlagár


változását, az ár-, érték-, volumenindex-kör mutatóinak kiszámításával
pedig az átlagos árváltozást lehet vizsgálni.

168 Az indexkosárban szereplő részvénytársaságok piaci értékének (= piaci ár szorozva a


törzsrészvények mennyiségével) változását tükrözi. Az index ezen értékpapírcsomag
bázisidőponthoz viszonyított értékváltozását mutatja. (Magyar statisztikai évkönyv 2003,
KSH-2004 349. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 173 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 174 ►

9.5.1. sz. tábla


Az egy vendégéjszakára jutó szállásdíjak, és a vendégéjszakák két ki-
emelt üdülőkörzet adatai, 2003169
szállásdíj (Ft) / éjszaka vendégéjszaka (ezer db)
megnevezés Sopron- Sopron-
Balaton- Balaton-
Kőszeg hegy- Kőszeg hegy-
part part
alja alja
szálloda 5.048 4.124 642 2.608
panzió 3.303 3.185 119 240
turistaszállás 1.284 1.254 44 86
ifjúsági szálló 1.273 1.403 8 265
üdülőház 988 3.136 89 299
kemping 1.599 1.531 218 893
statisztikai p0 p1 q0 q1
jelölés v0 v1 B0 B1

9.5.2. sz. tábla


1. munkatábla: részszámítások170
A0= A1= i= i= i=
B0*v1 B1*v0
stat.jel. B0*v0 B1*v1 v1/v0 B1/B0 A1/A0
megnev. ip = iq= iv=v1/v0=
q0*p0 q1*p1 q0*p1 q1*p0
p1/p0 q1/q0 iq*ip
az adatok ezer Ft-ban
szálloda 3.240,8 10.755,3 2.647,6 13.165,2 0,8170 4,0623 3,3187
panzió 393,1 764,4 379,0 792,7 0,9643 2,0168 1,9448
turistaszállás 56,5 107,8 55,2 110,4 0,9766 1,9545 1,9089

ifjúsági szálló 10,2 371,8 11,2 337,3 1,1021 33,1250 36,5078


üdülőház 87,9 937,7 279,1 295,4 3,1741 3,3596 10,6635
kemping 348,6 1.367,2 333,8 1.427,9 0,9574 4,0963 3,9221
összesen 4.137,1 14.304,2 3.705,9 16.128,9 – – –

169 Adatforrás: Magyar statisztikai évkönyv, 2003 (KSH, Budapest – 2004; 479. old.)
170 Lásd: a 7.3. táblához írt lábjegyzetet

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 174 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 175 ►

9.5.3. sz. tábla


2. munkatábla: az indexek és a különbségek számítása
főátlagok (= összetett intenzitási
ár-, érték-, volumenindexek
viszonyszámok) standardizálás
stat. stat.
eredmények számítás eredmények számítás
jelölés jelölés
14.304.278 / 14.304.278 /
Iv 3,4576 V1 3.257,636
4.137.067 4.391
14.304.278 – 4.137.067 /
Kv 10.167.211 V0 3.693,81
4.137.067 1.120
3.705.885 /
I p0 0,8958 Vst:B0 3308,826 3705885 / 1120
4.137.067

3.705.885 –
K p0 -431.182 Vst:B1 3.673,193 16.128.992 /
4.137.068
4.391
14.304.278 / 3257,636 /
I 1p 0,8869 I 0,881918
16.128.992 3693,81
14.304.278 – 3.257,636 –
K 1p -1.824.714 K -436,174
16.128.993 3.693,82
16.128.992 / I st′ :B0 3.308,826 /
I q0 3,8987 0,895776
4.137.067 3.693,81
16.128.992 – K st′ :B0 -384,984 3.308,826 –
K q0 11.991.925
4.137.068 3.693,82
14.304.278 / I st′ :B1 3.257,636 /
I q1 3,8599 0,886867
3.705.885 3.673,193
14.304.278 – K st′ :B1 3.257,636 –
K q1 10.598.393 -415,558
3.705.886 3.673,194
0,895776 * I st′′:v0 3.673,193 /
3,4576 0,994419
3,859882 3.693,81
0,886867 * K st′′:v0 3.673,193 –
3,4576 -20,6165
össze- 3,898654 3.693,82
függés -431.182 +
10.167.211
10.598.393
-1.824.714 + I st′′:v1 3.257,636 /
10.167.211 0,984529
11.991.925 3.308,826
K st′′:v1 3.257,636 –
-51,1903
3.308,827

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 175 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 176 ►

2. munkatábla: az indexek és a különbségek számítása (folytatás)


főátlagok (= összetett intenzitási
ár-, érték-, volumenindexek
viszonyszámok) standardizálás
stat. stat.
eredmények számítás eredmények számítás
jelölés jelölés
0,895776 *
0,881918
0,984529
0,886867 *
0,881918
össze- 0,994419
függés (-384,174) +
-436,174
(-51,1903)
(-415,558) +
-436,174
(-20,665)

9.5.4. sz. tábla


Üdülőkörzet → Sopron-Kőszeg hegyalja Balaton-part

szálláshely típus ⎛ Bi ⎞
megoszlás ⎜ ⎟%
↓ ⎜ B
⎝ ∑
i


szálloda 57,32 59,39
panzió 10,63 5,47
turistaszállás 3,93 1,96
ifjúsági szálló 0,71 6,04
üdülőház 7,95 6,81
kemping 19,46 20,34
összesen 100 100

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 176 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 177 ►

♥ SZÖVEGES ELEMZÉS
A Sopron-Kőszeg hegyalja és a Balaton-part üdülőkörzetekre vonatkozó
adatok – eltöltött vendégéjszakák (ezer db) és az egy éjszakára jutó szál-
lásdíj (Ft), 2003-ban – összehasonlítását végeztük el kétféle módszerrel.
1. Kimutattuk az egy vendégéjszakára jutó szállásdíj eltérését és az elté-
rést okozó tényezők hatását. (= standardizálás)
2. Elemeztük a szálláshelyek bevételeinek változását kimutatva az átlagos
ár- és mennyiségváltozásokat is. (ár-, érték-, volumenindex-kör)
Az összehasonlítás során viszonyítási alapnak a Sopron-Kőszeg hegyalja üdülő-
körzetet tekintettük. A számításokat pedig mindkét súlyozási rendszerrel
(Laspeyres, Paasche ill. standard: B0 és standard: B1) elvégeztük, a szöveges elem-
zésben azonban csak az egyik rendszer ( I v = I p0 ∗ I q0 és az ezzel ekvivalens stan-
dardizálás: I st′ :B0 ) számadatai szerepelnek. (A kétféle súlyozással számított ered-
mények egyébként az eltéréseket minden esetben azonos előjelűnek mutatják.)
Az azonos számértékű indexeket vastagabb számokkal írtuk, és szürke
háttérrel, valamint erősebb kerettel is kiemeltük. (9.5.3. sz. tábla)
A Balaton-part üdülőkörzetben a szállásdíjakból származó bevételek a
vizsgált évben 246 %-kal, azaz 10.167.211 ezer Ft-tal magasabbak voltak,
mint a Sopron-Kőszeg hegyalja üdülőkörzetben. Az eltérésnek két ellenté-
tes előjelű összetevője van. A Balaton-parton az árak (= szállásdíjak / éj-
szaka) átlagosan 10,4 %-kal alacsonyabbak, viszont az eltöltött vendég-
éjszakák száma átlagosan 289,9 %-kal több. Az árak eltérése a Balaton-
part bevételi előnyét 431.182 ezer Ft-tal csökkentette. A vendégéjszakák
eltérő nagyságára figyelve (azonos árakat feltételezve) viszont még na-
gyobb tóparti többletet figyelhetünk meg (+ 10.598.393 ezer Ft).
A Balaton-part üdülőkörzetben egy vendégéjszakára átlagosan ≅ 3.258
Ft jutott 2003-ban, a Sopron-Kőszeg hegyalja üdülőkörzetben pedig ≅
3.694 Ft, azaz a tóparton ≅ 12 %-kal, ≅ 436 Ft-tal kevesebbet kellett fizetni
a felsorolt szálláshelyeken egy éjszakáért. Az eltérésnek két azonos előjelű
oka van. Egyrészt majdnem minden szálláshely típus esetén a Balaton-part
üdülőkörzetben kisebbek az egy vendégéjszakára jutó bevételek (= részin-
tenzitási viszonyszámok), így átlagosan is alacsonyabbak 10,4 %-kal, azaz
≅ 385 Ft-tal. Másrészt eltérő volt a két üdülőkörzetben a vendégéjszakák
szálláshely típusonként való megoszlása, (9.5.4.sz. tábla) bár ez csak igen
csekély mértékű ≅ 1,5 %-os, azaz mindössze ≅ 51 Ft-os különbséget jelez a
főátlagokra vonatkozóan. (Ennyivel alacsonyabbak azonos egy éjszakára
jutó betételeket feltételezve a Balaton-part üdülőkörzet szállásdíjai.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 177 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 178 ►

9.6. Gyakorló feladatok

1. feladat

a vizsgált kereskedelmi vállalko- változások a bázis év-


zás bevételei (millió Ft) hez viszonyítva (%)
mennyi-
megnevezés a bázis évben érték ár
a tárgy- ség
bázis tárgyidőszaki évben
áron áron
111. bolt 200 +15 -2
112. bolt 400 450 +20
„A” város
211. bolt 150 300 +25
212. bolt 500 -5
„B” báros 500 +20
vállalkozás
1. Számítsa ki a hiányzó adatokat!
2. A vállalkozás egészére vonatkozóan írjon szöveges elemzést! A szöve-
ges elemzésben szerepeljenek az abszolút változások is!

2. feladat

Egy mezőgazdasági őstermelő öt különféle zöldséget vitt ki szombaton és


vasárnap is a piacra. A szombati bevétele 15.000 Ft-tal, azaz 30 %-kal volt
nagyobb, mint a vasárnapi. Vasárnap a zöldségeket átlagosan 25 %-kal
drágábban árulta (bázis szemléletű index).
1. Számítsa ki az őstermelő szombati ill. vasárnapi bevételét, valamint a
bevétel változásának tényezőit abszolút és relatív módon is!
2. Írjon szöveges elemzést! Az összehasonlítás alapja: szombat.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 178 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 179 ►

3. feladat

2005. április171
egy győri kiskereskedő egy budapesti kiskereskedő
adatai adatai
alma
eladott eladott
féleségek egységár egységár
mennyiség mennyiség
kg Ft / kg kg Ft / kg
idared 250 250 800 230
jonagold 200 220 400 200
starking 120 190 100 190
jonatán 200 150 150 140
zöld 100 310 200 280
összesen 870 – 1650 –

1. Hasonlítsa össze az alma átlagárát (viszonyítási alap = budapesti


kiskereskedő) ill. mutassa ki az átlagos árváltozást!
2. Írjon szöveges elemzést!

4. feladat

Egy áruház-lánc árbevétele egyik évről a másikra 30 %-kal, azaz 3 milliárd


Ft-tal emelkedett, az árak pedig átlagosan 20 %kal nőttek.
1. Számítsa ki a tanult indexeket és különbségeket mindkét súlyozási
módszerrel.
2. Írjon szöveges elemzést!

171 Adatforrás: saját gyűjtés

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 179 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 180 ►

9.7. összefoglalás
indexek, indexösszefüggések
p
egyedi i p = i1
pi 0
ár

együttes
I p0 =
∑q i0 pi1
I 1p =
∑q i1 p i1
I pF = I 0p I 1p
= átlagos ∑q i 0 pi 0 ∑q i1 p i 0

qi 1
egyedi iq =
mennyiség

qi 0
együttes
I q0 =
∑q i1 pi 0
I q1 =
∑q i1 p i1
I qF = I q0 I q1
= átlagos ∑q i 0 pi 0 ∑q i 0 p i1

vi1
egyedi iv = = iv = i p * iq
vi 0
érték

együttes
Iv =
∑q i1 p i1
= I v = I 0p * I q1 = I 1p * I q0 = I pF * I qF
= átlagos ∑q i0 pi 0

különbségek, különbség összefüggések


ár k p = pi1 − pi 0
mennyi- k q = qi1 − qi 0
ségi egyedi
k v = vi1 − vi 0 = (qi1 pi1 − qi1 pi 0 ) + (qi1 pi 0 − qi 0 pi 0 ) =
érték
(qi 0 pi1 − qi 0 pi 0 ) + (qi1 pi1 − qi 0 pi1 )
érték együttes K v = ∑ qi1 pi1 − ∑ qi 0 p i 0 = K p0 + K q1 = K 1p + K q0

átlagformák

I 1p =
∑ q p *i
1 0 p
=
∑q p 1 1
vagy I p0 =
∑ q p *i
0 0 p
=
∑q p 0 1

ár ∑q p1 0
qp
∑ i 1 1 ∑q p 0 0
qp
∑ i 0 1

p p

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 180 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 181 ►

átlagformák

I q0 =
∑ q p *i = ∑ q p
0 0 q 1 0
vagy I q1 =
∑ q p *i
0 1 q
=
∑q p1 1

mennyiségi ∑q p ∑ q p
0 0 1 0 ∑q p
0 1
qp
∑ i 1 1
i q q

Iv =
∑ q p *i
0 0 v
=
∑q p
1 1
érték ∑q p 0 0
qp
∑ i
1 1

az indexek jelentései (általánosságban)


Megmutatja, hogy valamely termék (szolgáltatás)
ár
ára hányszorosára (hány százalékkal) változott.
Megmutatja, hogy valamely termék (szolgálta-
mennyiségi tás) mennyisége hányszorosára (hány százalék-
kal) változott.
Megmutatja, hogy valamely termék (szolgálta-
egyedi

érték tás stb.) értéke hányszorosára (hány százalék-


kal) változott.
Megmutatja, hogy a vizsgált termékek (szolgál-
tatások) ára átlagosan hányszorosára (hány
ár százalékkal) változott.
A mennyiségeket vagy
állandónak tekintjük.. Megmutatja, hogy a vizsgált termékek értéke az
árak változása következtében hányszorosára
(hány százalékkal) változott.
Megmutatja, hogy a vizsgált termékek (szolgál-
tatások) mennyisége (= volumene) átlagosan
mennyiségi hányszorosára (hány százalékkal) változott.
Az árakat állandónak vagy
tekintjük.. Megmutatja, hogy a vizsgált termékek értéke a
együttes = átlagos

mennyiségek változása következtében hányszo-


rosára (hány százalékkal) változott.
Megmutatja, hogy a vizsgált termékek (szolgál-
érték tatások stb.) értéke hányszorosára (hány száza-
lékkal) változott.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 181 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 182 ►

vagy
Megmutatja, hogy a vizsgált termékek (szolgál-
érték tatások stb.) értéke átlagosan hányszorosára
(hány százalékkal) változott.

a különbségek jelentései (általánosságban)


Megmutatja, hány forinttal változott valamely ter-
ár
mék ára.
Megmutatja, hány kilogrammal (darabbal stb.) vál-
mennyiségi tozott valamely termék eladott (gyártott stb.) meny-
nyisége.
egyedi

Megmutatja, hány forinttal változott valamely termék


érték
eladott (gyártott stb.) mennyiségének értéke.
ár Megmutatja, hány forinttal változott a vizsgált ter-
A mennyisége- mékek (szolgáltatások stb.) forgalma (termelési értéke
ket állandónak stb.) annak következtében, hogy a bázis- és a tárgy-
tekintjük.. időszakban nem ugyanazon árak voltak érvényesek.
Megmutatja, hány forinttal változott a vizsgált ter-
mennyiségi mékek (szolgáltatások stb.) forgalma (termelési ér-
Az árakat állan- téke stb.) annak következtében, hogy a bázis- és a
együttes = átlagos

dónak tekintjük.. tárgyidőszakban nem ugyanazokat a mennyiségeket


értékesítették (gyártották stb.).
Megmutatja, hány forinttal változott a vizsgált ter-
érték mékek (szolgáltatások stb.) forgalma (termelési ér-
téke stb.).

a módszer felhasználható 9.4. fejezet

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 182 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 183 ►

9.8. Mintafeladatok korábbi vizsgadolgozatokból

1. minta

Egy sportcikkeket árusító bolt forgalmát figyeltük meg két egymást követő
évben. A vizsgálatba bevont kiemelt áruféleségek, ill. a már megkezdett
számítások adatait tartalmazza az alábbi tábla.
forgalom a bázis
a vizsgálatba bevont árváltozás forgalomváltozás
évben
termékek
millió Ft %
sportruha 20 +15 +20
sportcipő 15 +10 +10
egyéb termékek 30 +20 +65
statisztikai jelölés
1. Az alábbi 1. sz. segédtáblából válassza ki azokat a betű-jeleket, melyek
a fenti táblában szereplő adatokat jelölik, majd sorszámukat írja be a fenti
tábla utolsó sorába.
Írja be a fenti tábla utolsó sorába a kiválasztott betűjelek sorszámát!
1. segédtábla (statisztikai betűjelek)
1. 2. 3. 4. 5. 6.
p0 p1 q0 q1 v0 v1

7. 8. 9. 10. 11. 12.


ip iq iv kp kq kv

13. 14. 15. 16. 17. 18.


∑q 0
p0 ∑q p 1 1 ∑q 0
p1 ∑q p 1 0
Iv Kv

19. 20. 21. 22. 23. 24.


0 0 1
Iv Kv I p K p I p K 1p

25. 26. 27. 28. 29. 30.


0 0 1 1 F
I q K q I q K q I p I qF

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 183 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 184 ►

31. 32. 33. 34. 35. 36.


i q * 100 − 100 i p * 100 − 100 iv * 100 − 100 I * 100 − 100 I v * 100 − 100 I p0 * 100 − 100
1
p

37. 38. 39. 40. 41. 42.


I * 100 − 100
0
q
I * 100 − 100
1
q
I * 100 − 100
F
p
I * 100 − 100
F
q q 0 p1 q1 p 0

2. Számítsa ki azokat az adatokat, melyeket az alábbi eredménytábla ol-


dalrovatában szövegesen megfogalmaztunk! Majd válassza ki az 1.sz.
segédtáblából ezek statisztikai betűjeleit, és azok sorszámait szintén írja be
az eredménytáblába!
1. eredménytábla : egyedi számítások
statisztikai sport- sport- egyéb
a kiszámítandó adat megnevezése
jelölés ruha cipő termékek
forgalom tárgyidőszak (millió Ft)
mennyiségi változás (egyedi) %
forgalom millió Ft , azt feltételez-
ve, hogy csak az értékesítési árak
változtak
forgalom millió Ft , azt feltételez-
ve, hogy csak az értékesítés meny-
nyisége változott
forgalomváltozás (egyedi) millió Ft

3. Számítsa ki a 2. sz. eredménytáblában szövegesen megadott indexeket


és különbségeket! A számítások eredményeit írja be az üres rovatokba!
2. eredmény-tábla: együttes számítások
számadat megfogalmazás
átlagos árváltozás Laspeyres-szemléletben (Előjel is kell!)
átlagos mennyiségváltozás (%) Paasche-szemléletben (Előjel is
kell!)
forgalomváltozás (%) az árak miatt Paasche-szemléletben (Előjel
is kell!)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 184 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 185 ►

forgalomváltozás (%)a mennyiségek változása miatt Laspeyres-


szemléletben (Előjel is kell!)
a különböző szemléletű árváltozások átlaga (%)(Előjel is kell!)
a különböző szemléletű mennyiségváltozások átlaga (%)
a forgalom értékének abszolút változása (egész boltra) (Előjel is kell!)
a forgalom értékének abszolút változása az árak változása követ-
keztében Paasche-szemléletben (Előjel is kell!)
a forgalom értékének abszolút változása a mennyiségek változása
következtében Paasche-szemléletben (Előjel is kell!)

4. Döntse el, igazak-e az alábbi kijelentések! A 3. sz. eredménytábla utol-


só, üres oszlopába írjon „I” (= igaz) vagy „H” (= hamis) betűt!
3. eredménytábla: igaz – hamis
kijelentések I/H
A vizsgált bolt forgalmának növekedése elsősorban az árak nagymér-
tékű növekedésének köszönhető.
A bolt forgalma 138 %-kal növekedett annak köszönhetően, hogy a
második évben magasabb áron adták el a termékeket.
A bolt forgalma 10500000 Ft-tal növekedett annak köszönhetően,
hogy a termékeket a második évben magasabb áron tudta értékesíteni.
(súly: tárgyidőszaki)
A sportcipők kivételével a bolt termékei iránti kereslet az áremelkedé-
sek ellenére nem csökkent.
A bolt által értékesített termékek az áremelkedésre úgy reagáltak,
ahogy ez általánosságban történik, visszaesett az eladás mennyisége.
A bázis- és a tárgyidőszaki súlyozású indexek nem azonos irányúnak
mutatják az átlagos ár- és az átlagos mennyiségváltozást.
A 6.4. eredmény-tábla utolsó két adatának szorzataként kiszámítható
a forgalom értékének változása, hiszen az ár- és a mennyiségváltozás
együtt az értékek változását jelenti.
A vizsgált bolt forgalmának növekedése elsősorban az értékesített
mennyiségek kb. 20 % -os növekedésének köszönhető.
Ebben a feladatban tulajdonképpen felesleges volt az „F” jelű inde-
xek kiszámítása, olyan csekély az eltérés a kétféle súlyozás eredményei
között.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 185 ►


Statisztika Ár-, érték-, volumenindex-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 186 ►

A 2.sz. eredmény-tábla utolsó két adatának szorzataként nem kiszá-


mítható ki a forgalom értékének változása, bár az ár- és a mennyiség-
változás együtt az értékek változását jelenti, de „keresztbe” kellett
volna súlyoznunk.
A bolt forgalma 10500 eFt-tal növekedett annak köszönhetően, hogy
a termékeket a második évben magasabb áron tudta értékesíteni.
(súly: bázisidőszaki)
A bolt forgalma 38 %-kal növekedett annak köszönhetően, hogy a
második évben magasabb áron adták el a termékeket.
A sportcipők kivételével a bolt termékei iránti kereslet az áremelkedé-
sek ellenére növekedett.

2. minta

Két kisebb magánvállalkozás („A” és „B”; viszonyítási alap = „B”) bevéte-


li adatai alapján a következő indexeket és különbségeket számoltuk ki:

Iv I q1 K p0
0,95 0,864 +50 mFt

Számítsa ki hiányzó indexeket, különbségeket, valamint a két vállalkozás


forgalmi forgalmának adatait! A számítások eredményeit írja be az alábbi
eredménytáblába!
eredménytábla
szöveges megfogalmazás statisztikai jel adat
„A” vállalkozás forgalma
„B” vállalkozás forgalma
a két vállalkozás forgalmának különb-
sége
a mennyiségek eltérése miatt forgalom
különbség
az árak eltérését mutató index

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 186 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 187 ►

10. Becslés

10.1. Bevezetés
A társadalmi-, gazdasági jelenségekre vonatkozó adatokat a megfigyelést
végzők egyes esetekben a vizsgált sokaságok minden egyes tagjára (= ele-
mére) vonatkozóan összegyűjtik ekkor teljeskörű felvételről beszélünk;
más esetekben viszont csak a vizsgált sokaság elemeinek egy részére terjed
ki az adatgyűjtés, ezt részleges felvételnek nevezzük.
Teljeskörű felvétel pl.: népszámlálások, a népmozgalmi jelenségek megfigyelése (szü-
letés, halálozás stb.), vetésterület összeírása; részleges felvétel pl.: a különböző termékek
árainak megfigyelése, közvéleménykutatások.
A részleges adatfelvétel eredményeként kiszámított sokasági jellem-
zők (átlag, szórás stb.) sajátossága, hogy kisebb – nagyobb hibával tükrö-
zik a valóságot, ennek ellenére nem lehet célunk minden esetben a
teljeskörű felvétel. Ennek egyrészt technikai okai vannak, másrészt az
idő és a pénz szűkössége.
A mezőgazdaság várható terméseredményeinek megállapításához nem szedhetjük le
még a beérés előtt az összes gyümölcsöt. A termékek megsemmisüléssel, használhatat-
lanná válással járó minőségellenőrzése során (pl. villanyégők) nem vizsgálhatunk meg
minden elkészült darabot.
A gazdasági élet valamennyi szereplője a folytonosan változó feltételekre a lehető
leggyorsabban akar reagálni, vagyis rövid idő alatt szükséges döntéseket hoznia, és ez
nem engedi meg a hosszas adatgyűjtési-elemzési munkát.
A pénz pedig még a leggazdagabb államokban is mindig kevesebb mint, amennyit az
egyes célok megvalósítása igényel. Kevesebb sokasági egyedre adatot gyűjteni és kevesebb
adatot feldolgozni, elemezni pedig természetesen kevesebb idő és kevesebb pénz.
A részeleges adatfelvétel fajtái172 közül jegyzetünkben kizárólag a
reprezentatív adatgyűjtéssel foglalkozunk.
Reprezentatív felvétel esetén a megismerni kívánt teljes sokaságból
(= alapsokaságból; elemeinek száma = N ) szigorú szabályok szerint kivá-
lasztunk egy részsokaságot (= mintasokaságot = mintát; elemeinek

172További részleges adatfelvételi fajták:


- a monográfia. Ez leginkább segédeszköznek tekinthető a vizsgált sokaság egyedeinek
megismerésében.
- a kísérleti eredmények gyűjtése. Ebben az esetben az azonos feltételek biztosításával érjük el, hogy
megfigyelési eredményeinket egy végtelen sokaság egy-egy ismertté vált elemének tekintsük.
- egyéb (nem reprezentatív) részleges megfigyelések, lásd: 10.1.4.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 187 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 188 ►

száma = n ), és csak ennek elemire vonatkozóan gyűjtünk adatokat. A


minta adatainak feldolgozása után

a kapott eredményeket viszont a teljes sokaságra vonatkoztatjuk.

Tulajdonképpen tudományos indukciót173 végzünk, vagyis az egyesből


következtetünk az általánosra.
A reprezentatív adatgyűjtéssel kapcsolatban felmerülő legfontosabb
kérdések:
1. Milyen elméleti alapokon nyugszik az eljárás?
2. Milyen szabályok szerint kell elvégeznünk a mintába kerülő elemek
kiválasztását, továbbá: hány elem kerüljön a mintába?
3. Hogyan értékelhetjük eredményeinket, figyelembe véve, hogy nem a
teljes sokságra vonatkozó adatokkal dolgozunk, azaz hogyan követ-
keztessünk a mintából a teljes sokaságra?
1. A reprezentatív adatfelvételi módszer elmélete a valószínűség-
számítás törvényein, más szóval a véletlen tömegjelenségek törvényein
nyugszik. Ezért követelmény, hogy az alapsokaság a szó szoros értelmé-
ben sokaság legyen, azaz nagytömegű egységet foglaljon magában. Elméle-
tileg adott alsó korlát a nagy tömegre nincs, a gyakorlatban azonban az
alapsokaság174 több ezer, esetleg több millió egyedből áll.
2. Az alapsokasági elemek közül a mintasokaságba kerülő elemeket a
következő alapvető módszerekkel választhatjuk ki:
2.1. véletlenen alapuló kiválasztás:
• egyszerű véletlen,
• egylépcsős (csoportos),
• többlépcsős
• rétegzett mintavétel.
2.2. nem véletlenen alapuló kiválasztási eljárások175

173Az indukció "párja", "ellentettje" a dedukció, amikor az általános ismeretek segítenek az


egyes megismerésében.
174Elméletileg természetesen az alapsokaság elemeinek száma lehet végtelen is, de mert a
közgazdasági gyakorlatban véges sokaságokkal dolgozunk, jegyzetünkben is csak az ezek-
re vonatkozó számításokkal foglalkozunk.
175 Ezekkel jegyzetünkben nem foglalkozunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 188 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 189 ►

2.3. szisztematikus kiválasztás176.


A minta elemeinek kiválasztása matematikai szempontból lehet ismétlé-
ses (= visszatevéses) vagy ismétlés nélküli (= visszatevés nélküli). Ismét-
1
léses kiválasztásnál az alapsokaság bármelyik elemének esélye (=
N
valószínűsége) van a mintába bekerülni. Ez az esély a kiválasztás során
végig meg is marad, hiszen minden húzás N elem közül történik. Az
ismétlés nélküli mintavétel során a kihúzható elemek száma egyre csök-
ken. Az első kiválasztás után már csak (N-1) elem közül választhatjuk ki a
második elemet, majd (N-2) elem közül a harmadikat és így tovább. Így
⎛1 1 1 ⎞
elméletileg egyre nagyobb esélye ⎜ 〈 〈 〈...⎟ van a maradék
⎝ N N −1 N − 2 ⎠
elemek közül egynek – egynek a mintába kerülni, de gyakorlatilag a kivá-
1
lasztási valószínűség ebben az esetben is , vagyis az előzővel azonos,
N
1 1 1
hiszen N igen nagy számot jelent177 és így ≅ ≅ ≅...., úgy is
N N −1 N − 2
1
fogalmazhatunk: a kiválasztási valószínűség határértéke = .
N
2.1. A mintavétel véletlensége azt jelenti – ahogy erről már volt szó –,
hogy az alapsokaság minden elemének egyenlő esélye van arra, hogy a
mintasokaság eleme legyen, azaz a mintába kerüljön. Így a minta elfogulat-
lanul, minden emberi szubjektivitást kizárva tükrözi a valóságot.
2.1. a) Az egyszerű véletlen kiválasztás végrehajtásának alapvető fel-
tétele, hogy a homogén alapsokaság elemeiről teljes körű nyilvántartás-
sal rendelkezzünk. A szükséges nyilvántartás az alapsokaság minden ele-
mét kell hogy tartalmazza, de valamennyit bizonyosan csak egyszer.
A nyilvántartás lehet egy névjegyzék (pl.: a SZE beiratkozott hallgatóinak névsora),
egy térkép (pl.: Magyarország valamennyi települését feltüntető térkép), valamilyen lista
(pl.: egy termelővállalat által előállított valamennyi termékféleség tételes felsorolása).

176 Például egy főiskola hallgatói (= N ) közül úgy választunk ki egy n-elemű mintát, hogy
N
minden -dik hallgató a mintába kerül. Jegyzetünkben ezzel a módszerrel sem foglal-
n
kozunk, de megjegyezzük, hogy az ilyen speciális eljárások nagy körültekintést igényelnek,
illetve az így nyert eredmények pontossága nagyban függ az alkalmazási feltételek szak-
szerű kezelésétől.
177 Lásd: 10.1.3.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 189 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 190 ►

Fontos megjegyeznünk, hogy napjainkban tömegesen alkalmazzák a


"találomra" való kiválasztást, – véletlen mintának feltüntetve! – például
a közvélemény-kutatások, az internetes szavazások alkalmával. Ezek a
módszerek sokszor jóval olcsóbban és gyorsabban adnak eredményt, mint
egy szabályosan megvalósított mintavételes eljárás, de ezekben az esetek-
ben le kell mondanunk arról, hogy a hiba nagyságáról objektív ismereteink
legyenek178.
A rendelkezésre álló teljes körű nyilvántartásból technikai szem-
pontból sokféleképpen választhatunk egyszerű véletlen mintát, például:
• sorsolással,
• a véletlenszám-tábla felhasználásával,
• a számítógép véletlenszám-generátora segítségével.
A sorsolás lebonyolításához a fentiekben említett teljes körű nyilvántartá-
son kívül egy sorsolási gömbre (= "nagy kalapra") és benne az alapsokaság
elemeit képviselő kis cédulákra (ezeken van az elemek neve vagy sorszáma)
van szükség. A kiválasztás a cédulák újra és újra történő összekeverése után
azok kihúzogatásával történik. Ha a kiválasztás ismétléses, akkor a kihú-
zott cédula, a rajta szereplő adatok feljegyzése után, visszakerül a sorsolási
gömbbe; ha pedig ismétlés nélküli, akkor természetesen nem kerül vissza.
A véletlenszám-táblás kiválasztás segédeszköze majd minden statisz-
tika könyvben megtalálható. Íme egy részlet:

10.1.sz. tábla
oszlopszám
sor-szám sor-szám
1. 2. 3. 8. 9. 10.
16. 01 47 69 71 21 02 … … 15 78 24 38 32 13 16.
17. 17 71 98 82 87 19 22 62 78 63 37 25 17.
18. 14 40 28 22 68 48 68 16 03 89 52 54 18.
19. 61 71 92 22 42 33 45 43 48 76 93 08 19.
20. 25 91 04 91 31 66 51 72 37 09 57 06 20.

178Például interneten csak az szavazhat, akinek van hozzáférési lehetősége és azok közül
is csak az, akinek kedve is van az adott kérdéssel kapcsolatban véleményt nyilvánítani,
vagyis a véletlen törvényszerűségein alapuló matematikai módszerekről le kell
mondanunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 190 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 191 ►

Használatához elengedhetetlen az alapsokaság elemeinek sorszámozása. A


mintavétel a tábla véletlenszerűen kiválasztott pontjától kezdődik. Az egy-
más mellett szintén véletlenszerűen (innen a tábla neve) sorakozó négy
(vagy több) jegyű számok közül azokat jegyezzük fel, melyek sorszám-
ként179 szerepelnek nyilvántartásunkban, a sorszámként nem szereplő szá-
mokat pedig "átugorjuk". Ezt mindaddig folytatjuk, amíg annyi sorszámot
nem jegyeztünk fel, ahány elemű mintára szükségünk van. Számításainkat
pedig a feljegyzett sorszámokhoz tartozó elemek adataival végezzük. A
véletlenszám-táblát ismétléses kiválasztással állították össze, ha mégis
ismétlés nélküli kiválasztáshoz akarjuk segédeszközként használni, akkor
azokat a számokat, melyeket egyszer már feljegyeztünk, át kell „ugranunk”.
A legkorszerűbb módszer a számítógép alkalmazása, ehhez azonban
meg kell vásárolnunk a megfelelő szoftvereket, és az alapsokaságról ké-
szült nyilvántartásunk adatait gépre kell vinnünk. A mintavétel ebben az
esetben a program leírásában szereplő parancsok megfelelő végrehajtásá-
val történik.
2.1. b) Egylépcsős (= csoportos) mintavételt akkor alkalmazunk, ha a
vizsgálni kívánt alapsokaságról nem rendelkezünk (és nem is lehet köny-
nyen, gyorsan beszerezni) teljes körű nyilvántartással. Ebben az esetben
egy közbülső, úgy is mondhatjuk, közvetítő, azaz elsődleges sokaságot
kell keresnünk.
Ha például az általános iskolát befejező tanulók olvasási színvonalát akarjuk felmérni,
akkor hiába keresünk olyan nyilvántartást, amelyik hazánk összes nyolcadik osztályos
tanulójának legfontosabb – a megkülönböztetéshez és a felleléshez szükséges – adatait
tartalmazná. Találunk viszont nyilvántartást az Oktatási Minisztériumban az általános
iskolákról. Az általános iskolák sokasága lesz az elsőleges, a közvetítő sokaság.
A minta elemeinek megismerése a közvetítő sokaság ismeretében két
lépésben történik. Első lépcsőben – innen az elnevezés – a közvetítő so-
kaság elemei közül választunk (például egyszerű véletlen módszerrel),
majd a mintába került közvetítő sokaságbeli elemek valamennyi elemét
"megvizsgáljuk".
Az általános iskolák közül választunk, de a kiválasztott iskola valamennyi nyolcadikos
tanulóját kikérdezzük.
Ennél az adatfelvételi módnál – általában – azonos költségek mellett az
egyszerű véletlen kiválasztásnál nagyobb mintát képezhetünk. A nagyobb
elemszám pedig a sokaság jobb megismerését teszi lehetővé.

179Az alapsokaság elemeinek sorszámozása, ha a táblánk négyjegyű, természetesen nem


egyessel kezdődik, hanem "0001"-vel.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 191 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 192 ►

2.1. c) A többlépcsős kiválasztást is a vizsgálni kívánt alapsokság nyil-


vántartásának hiányában kell esetenként alkalmaznunk. Az egylépcsős (=
csoportos) mintavételtől ez a módszer annyiban különbözik, hogy nem
egyszer, hanem többször alkalmazzuk a mintavételt.
Előző példánkat folytatva, a kiválasztott iskolákban nem minden tanuló olvasás-tudását
vizsgáljuk meg; vagyis újabb, általában EV, mintavételt hajtunk végre.
Ennél a mintavételi módnál – homogén (=egynemű) elsődleges minta-
vételi egységek esetén – lehetőségünk van kisebb elemszámú mintával
dolgozni ( = költségkimélő megoldás). Ha pedig mégis azonos elemszámú
mintát veszünk, az a hiba nagyságának csökkenését eredményezi.
2.1. d) A rétegzett kiválasztás során a heterogén (= összetett) alap-
sokaság elemeit valamely kiegészítő információ (= megkülönböztető
ismérv) alapján csoportosítjuk, arra törekedve, hogy minél egyneműbb
részsokaságokat nyerjünk. A mintavétel ebben az esetben nem a bontatlan
alapsokaságból történik (amikor is előfordulhat, hogy lesz olyan réteg,
amelyiknek egyetlen eleme sem kerül be a mintába), hanem az egyes réte-
gekből külön-külön, azokon belül pedig az egyszerű véletlen mintavétel
szabályai szerint.
A nyolcadikosokra vonatkozó példánkat folytatjuk. Ha korábbi tapasztalataink azt
mutatják, hogy a családi háttér – például a szülők iskolai végzettsége – befolyásolja a
tanulók olvasási színvonalát, akkor célszerű újabb mintavételünket is a tanulók családi
háttér szerinti megoszlását ismerve elvégezni. Természetesen előzetes ismeretek hiányá-
ban is feltehetjük a kérdést, befolyásoló tényező-e a szülők végzettsége, ill. utólagos
rétegzést is végezhetünk.
A rétegzett mintavétel óriási előnye180, hogy egyetlen adatgyűjtés ered-
ményeként az egyszerű véletlen mintavételhez képest sokkal több és pon-
tosabb (= kisebb a hiba) eredményhez jutunk.
Példánkban nemcsak néhány szám, az olvasásra kapott érdemjegyek átlaga, módusza,
mediánja, szórása stb., fogja jellemezni a sokaságot, hanem annyiszor több szám, ahány réteg-
re tudtuk bontani a tanulókat, sőt az ismérvek közti kapcsolatok számítására is sor kerülhet.
A rétegzett mintavétellel kapcsolatban két nehéz kérdést kell megoldanunk.

180A rétegzett mintavételnek más előnyei is vannak. Ezeket részben már említettük
részben később említjük meg.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 192 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 193 ►

1. Megtalálni azt a rétegképző ismérvet, amely alapján – a vizsgált


probléma szempontjából – valóban homogén részsokságokhoz ju-
tunk.
2. A minta elemeit fel kell osztani az egyes rétegek között. Ez történ-
het:
1. egyenletesen,
2. arányosan,
3. optimálisan:
– szórás alapján
– költségek alapján.
2.1. Egyenletes rétegzés esetén az alapsokaság minden egyes rétegé-
ből azonos számú (n1 = n2 = n j ) elemet választunk ki, függetlenül attól,
hogy az egyes rétegek az alapsokaságon belül azonos vagy éppen igen elté-
rő súlyt képviselnek-e. Előnye, hogy egyszerű végrehajtani; hátránya, hogy
nagyfokú torzítást okozhat.
2.2. Arányos rétegzés esetén az alapsokaság nagyobb elemszámú réte-
géből több (ha N1 〉 N 2 akkor n1 〉 n2 ), a kisebb elemszámú rétegéből keve-
sebb elemet (ha N1 〈 N 2 akkor n1 〈 n2 ) választunk, arra ügyelve, hogy az
egyes rétegekből olyan arányban kerüljenek elemek a mintába, amilyen
arányt az adott réteg az alapsokaságban képvisel.
2.3. Az optimális rétegzés összefoglaló elnevezés, a nem arányos
rétegzés egyik fajtája. Az eljárásnak az optimalizálási kritériumtól függően
több változata is ismert. Ha például célunk (= kritériumunk) a hibanagy-
ság minimalizálása, akkor az elemszámot az egyes rétegek között úgy
kell elosztani, hogy a standardhiba181 a lehető legkisebb legyen, ezért figye-
lembe kell vennünk az egyes rétegek eltérő szórását is. Amelyik réteg szó-
rása kisebb, abból kevesebb (ha σ 1 〈σ 2 akkor n1 〈 n2 ), amelyik réteg szórá-
sa nagyobb, abból több elem (ha σ 1 〉σ 2 akkor n1 〉 n2 ) kerül a mintába.
Egy kevéssé szóródó sokaságot kevesebb eleme segítségével is megismer-
hetünk, míg egy nagyon szóródó sokaság megismerése csak több külön-
böző eleme révén lehetséges.
Ha célunk (= kritériumunk) a költségek csökkentése, akkor pedig fi-
gyelembe vesszük azt is, hogy az egyes rétegek adatainak beszerzése eltérő
költségigényű. Ha igen szűkösek az anyagi lehetőségeink, akkor a magas
adatgyűjtési költségű réteg elemei közül kevesebb, az alacsonyabb költségű
181Lásd: 10.1.7.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 193 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 194 ►

réteg elemei közül több kerül a mintába. (A kétféle szempontot – szórás


és költség – természetesen együtt is figyelembe vehetjük.)
Ha például az adatgyűjtést, feldolgozást végző szervezetek székhelyétől távoli telepü-
lésen élők adatainak felmérése több pénzbe kerül /utazás, szállás, posta stb./, mint az
adatgyűjtővel azonos helyen élőké, akkor a székhelyen kérdeznek ki több és a székhelytől
távolabb kevesebb embert.

Az egyes rétegekbe kerülő mintaelemszám meghatározása


egyenletes rétegzés arányos rétegzés
n Nj nj Nj
nj = = ⇒ nj = ∗n
m N n N
szórás optimális rétegzés szórás- és költség-optimális rétegzés
1

w j ∗σ j w j ∗ σ jπ j 2
nj = n∗ nj = n∗
∑w j ∗σ j
∑ w j ∗ σ jπ j 2

1

Az elemszám meghatározására szolgáló képletekben szereplő betűk jelen-


tése
nj = n= Nj =
a j-edik réteg elemszáma a a minta teljes elemszá- a j-edik réteg elemeinek
mintában ma, száma az alapsokaságban
Nj
wj = = N =
N σj =
az alapsokaság elemei-
a j-edik réteg aránya a a j-edik réteg szórása
nek száma
teljes sokaságban
πj =
az egyes rétegekből történő adatgyűjtés költsége egy elemre vetítve
A véletlenen alapuló kiválasztás eddig leírt bármelyik formáját is alkalmaz-
zuk, előre el kell döntenünk, hogy hány elem (n) kerüljön a mintába. Az
erről való döntést megnehezíti, hogy két ellentétes igénynek kell eleget
tennünk. Nyilvánvaló, hogy a vizsgált sokaságról minél pontosabb képet
akarunk kapni, ez pedig főleg a minta elemszámának növelésével érhető el.
Ugyanakkor gyorsan és a lehető legkisebb költség mellett akarunk ered-
ményhez jutni, ez pedig a minta elemszámának csökkentésével valósítható
meg. A gyakorlatban a megoldást az ésszerű kompromisszumok jelentik.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 194 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 195 ►

A felvázolt ellentét élét tompítja, hogy a statisztikai vizsgálatok tárgyát


képező sokaságok általábann igen magas elemszámúak (N ) , így egy vi-
⎛ ⎞
szonylag csekély arányú ⎜ ⎟ kiválasztás esetén is elég nagy elemszámú
⎝ N ⎠ ami a jól kiválasztott mintavételi módszer
(n) minta áll rendelkezésünkre,
mellett lehetővé teszi a sokaság alapos megismerését.
A minta elemszámának mind abszolút (= hány elemű a minta), mind relatív
(= kiválasztási arány) nagysága befolyásolja a számítások gyakorlati menetét.
A minta elemszám abszolút nagyságát figyelve, ha n〈100 , akkor kis-
mintáról beszélünk.
n
A kiválasztási arányt figyelve pedig akkor beszélünk kismintáról, ha 〈 0,1 .
N

10.2. Becsült sokasági jellemzők


A mintavételből származó adatokból kiszámítható statisztikai jellemzők közül
• az átlag (10.2.1),
• az értékösszeg (10.2.3),
• a szórás (10.2.2.) és
• az arány (10.2.4.) 182
számítási módszerét, becslését ismertetjük egyszerű véletlen kiválasztást (=
EV) illetve arányos rétegzést (= AR) feltételezve.
A megkezdett témakör részletes kifejtése előtt fontosnak tartjuk felhívni figyelmet
arra, hogy amikor a következőkben az idősorok elemzésével – trendszámítás stb. – és a
regresszió-számítással fogunk foglakoztunk, akkor is becslésről van szó. Hiszen a számí-
tásokhoz felhasznált idősoraink nem végtelen hosszúak, a 10 – 15 év kiválasztásával
mintegy mintát veszünk a végtelen időből. Amikor pedig például a lakosság jövedelme és
fogyasztása között keressük a kapcsolatot, akkor sem ismerjük ezeket az adatokat – hi-
szen mintát veszünk – a lakosság minden egyedére vonatkozóan.

10.2.1. Számtani átlag becslése egyszerű véletlen (EV) mintából


Ha egy soksági jellemző becslését akarjuk elvégezni először is ki kell vá-
lasztanunk a megfelelő becslőfüggvényt.

A becslőfüggvény egy olyan n-változós függvény, amely valamely sokasági


jellemző értékének mintából történő meghatározására szolgál.

182Lásd: viszonyszámok

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 195 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 196 ►

Egy becslőfüggvényt akkor tartunk megfelelőnek, ha torzítatlan183, kon-


zisztens184 és hatásos185. Jegyzetünkben a becslőfüggvények közötti válasz-
tással nem foglalkozunk, egy-egy sokasági jellemző (= paraméter) megha-
tározására általában egyetlen becslőfüggvényt adunk meg.
Bármely sokasági jellemző becslését, így a számtani átlagét is, elvégez-
hetjük pontbecslésként (= egyetlen szám az eredmény), ekkor a számítá-
sokban szinte semmi különbség nincs ahhoz képest, amit már a középér-
tékek taglalásakor leírtunk, de amit eddig a számtani átlag képletének hív-
tunk, azt a továbbiakban a számtani átlag becslőfüggvényének nevezzük.
Egyszerű számtani átlag186 esetén: Súlyozott számtani átlag esetén:

∑x ∑fx = gx
xa =
i
xa = ∑
i i

∑f
i i
n i

A számtani átlag becslőfüggvényeiben szereplő betűk jelentése:


xa = xi = n =
a számtani átlag az átlagolandó értékek a minta elemeinek száma
fi fi
gi = = =
fi = ∑f i
n
az egyes értékek előfordu- az egyes értékek előfordulási aránya a mintában (=
lása (db, fő) a mintában relatív gyakoriság, %-os formában pedig megoszlási
viszonyszám)
A megadott becslőfüggvény alapján meghatározott átlagról tudjuk, hogy
az nem a sokaság minden tagjára vonatkozó adatok ismeretében számító-
dott ki, és így bizonytalanságot rejt magában (= mintavételi hiba). De
a bizonytalanság nagyságáról, vagy a másik oldalról közelítve a problémá-

183Torzítatlan,ha várható értéke megegyezik a becsülni kívánt sokasági jellemző értéké-


vel.
184Konzisztens, ha n minden határon túl való növelése esetén annak valószínűsége, hogy
a becsülni kívánt sokasági jellemző értékének és a becslőfüggvény értékének eltérése
kisebb egy ε számnál = 1 (azaz biztos esemény)
185Két (vagy több) becslőfüggvény közül az a hatásosabb, amelyiknél kisebb becsült
sokasági jellemző szórása.
186 Egyes, főleg az újabb tankönyvek „x” helyett „y” jelölést alkalmaznak. Javasoljuk, ne
a betűjeleket rögzítse memóriájában! Így jobb: számtani átlag = az átlagolandó értékek
összege osztva az elemek darabszámával.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 196 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 197 ►

hoz, a becslés pontosságának nagyságáról semmit sem tudunk. Ezekhez az


ismeretekhez az intervallumbecslés segítségével juthatunk el.

Az intervallumbecslés során valamely előre meghatározott valószínűség


mellett megadjuk azt az alsó határt, aminél kisebb nem lehet a mintából
számított és az egész sokaságra vonatkoztatott átlag, illetve megadjuk azt a
felső határt, amelynél pedig nagyobb nem lehet.
[xa ± ∆]

A keretbe foglalt megfogalmazás egy két oldalról zárt intervallumot jelent,


a statisztikai gyakorlatban azonban előfordul, hogy valamely sokasági jel-
lemzőnek csak az alsó vagy a felső határa lényeges (pl. termékek méret ill. minő-
ségi követelményei), ezekben az esetekben egyoldalú intervallumokat írunk
fel [x − ∆ ) 187 ill. (x + ∆ ] 188. Az alulról és felülről is zárt intervallum kétol-
dalú-, a csak egyik oldalon zárt intervallum pedig egyoldalú becslés
eredménye.

A hibahatár egy a becslés valószínűségéhez tartozó szorzószám ( z =


standard normális eloszlású valószínűségi változó) és az úgynevezett stan-
dardhiba (σ x ) felhasználásával számítható ki.

∆ = z ∗σ x

A hibahatár számításában szereplő betűk jelentése:


∆=
xa = hibahatár = maximális σx =
a számtani átlag hiba a becslés standardhibája

z =
a választott valószínűségtől függő standard normális valószínűségi változó

187 Alulról zárt.


188 Fölülről zárt.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 197 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 198 ►

Matematikai tanulmányainkból tudjuk, hogy N elemből n elemet nem


csak egyféleképpen lehet kiválasztani.189 Ennek az a következménye, hogy
az egyes mintákból számított átlagok nem tökéletesen azonosak, azaz min-
táról mintára ingadoznak.
Legyen az alapsokaság 10 elemű (= N), és válaszunk belőle 2 elemű (= n)
visszatevés nélküli mintákat! Az alapsokaság elemei (A-tól J-ig) és értékük:
A B C D E F G H I J
1 2 3 1 3 2 4 3 2 1 ⇐ xi

Az alapsokaság átlaga: Az alapsokság szórása:

∑x ∑ (x − xa )
2
i 22 i 9,6
xa = = = 2,2 σ= = =0,98
N 10 N 9

A kiválasztható ismétlés nélküli minták száma:


⎛10 ⎞ ⎛ 10! ⎞
⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ =45 db
⎝ 2 ⎠ ⎝ 8!∗2!⎠

A kiválasztott minták elemei és átlagai:


10.2. sz. tábla
AB: 1,5 AC: 2,0 AD: 1,0 AE: 2,0 AF: 1,5 AG: 2,5 AH: 2,0 AI: 1,5 AJ: 1,0
BC: 2,5 BD: 1,5 BE: 2,5 BF: 2,0 BG: 3,0 BH: 2,5 BI: 2,0 BJ: 1,5
CD: 2,0 CE: 3,0 CF: 2,5 CG: 3,5 CH: 3,0 CI: 2,5 CJ: 2,0
DE: 2,0 DF: 1,5 DG: 2,5 DH: 2,0 DI: 1,5 DJ: 1,0
EF: 2,5 EG: 3,5 EH: 3,0 EI: 2,5 EJ: 2,0
FG: 3,0 FH: 2,5 FI: 2,0 FJ: 1,5
GH: 3,5 GI: 3,0 GJ: 2,5
HI: 2,5 HJ: 2,0
IJ: 1,5

⎛N⎞ ⎛ N + n − 1⎞
189Ismétlés nélküli kiválasztásnál ⎜⎜ ⎟⎟ , ismétléses kiválasztásnál pedig ⎜⎜ ⎟⎟
n
⎝ ⎠ ⎝ n ⎠
darab n-elemű mintát választhatunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 198 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 199 ►

A mintából számított átlag nagysága (és így más sokasági jellemző nagysága
is) tehát annak függvénye, hogy a sokaság mely elemei kerültek a mintába,
azaz

a becsült sokasági jellemző = valószínűségi változó,


melyet várható értékével, szórásával és eloszlásával jellemezhetünk.

Foglalkozzunk először az eloszlás kérdésével! A valószínűségszámítás


központi határeloszlás tételét felhasználva bizonyítható, hogy a mintá-
ból számított átlag normális eloszlású. (Ábrázolva alakja egy harang-
hoz hasonlít. Ez az úgynevezett haranggörbe, más néven Gauss-görbe.)
Ennek alapján van lehetőségünk felírni azt a valószínűséget
Ψ ( z ) = P(M − zσ 〈 X 〈 M + zσ ) , mely kifejezi, hogy az átlag milyen kör-
nyezetben helyezkedik el.
A valószínűség előzőekben megadott képletében nem találjuk a meny-
nyiségi változókra alkalmazott eddigi jelölésünket (xi ) . Ennek oka, hogy a
mintaátlagot, mint valószínűségi változót nulla várható értékű és egységnyi
szórású változóvá (= standard normális valószínűségi változó) kell transz-
formálni annak érdekében, hogy az éppen vizsgált sokaság adatainak nagy-
ságrendjétől és mértékegységétől el tudjunk vonatkoztatni.

xi − x a
z=
σ

Értékeit "standard normális eloszlású változó eloszlásfüggvényének


értékei" c. táblából190 olvashatjuk ki. A tábla z értékei (az átalakítás követ-
keztében) [−4,+4] határok közé esnek, vagyis P = 100 % annak a valószínű-
sége, hogy az átalakított változó [− 4,+4] között lesz. Ha a táblában található
értékek ábráját is elkészítjük, majd a görbe alatt különböző szélességű inter-
vallumokat jelölünk ki, továbbá kikeressük az intervallumok határaihoz ( zi )
tartozó valószínűségeket Φ ( z i ) , akkor azt tapasztaljuk, hogy ha az interval-
lum szűk, akkor kisebb, ha az intervallum szélesebb, akkor nagyobb a való-
színűsége annak, hogy egy transzformált változó benne található. Tehát a
becsült átlag (és más sokasági jellemző) köré szerkesztett intervallumok

190 Lásd a jegyzet végén.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 199 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 200 ►

szélessége és az intervallumba kerülés valószínűsége azonos irány-


ban változnak. Azaz minél biztosabb (= nagyobb valószínűséggel igaz)
eredményt akarunk kapni, annál szélesebb intervallummal kell dolgoznunk.
Gondoljuk végig, hogy mit is jelent ez a gyakorlatban! Egy gyümölcstermeléssel foglal-
kozó vállalkozó még a teljes beérés előtt leszedi néhány véletlenszerűen kiválasztott fáról a
termést, leméri, majd az egy fára jutó átlag termés nagyságát (kg/fa) beszorozza fáinak
számával, annak érdekében, hogy megtudja, mekkora termésre számíthat, azaz termésbecs-
lést végez. Ha nem pontbecsléssel akarja meghatározni az eredményt, akkor valamilyen
valószínűség mellett kiszámítja az össztermés legkisebb és legnagyobb várható mennyiségét,
az értékösszeget. Ha nagyobb valószínűség mellett például [50 ± 10] kg/fa lenne a várható
termés, akkor kisebb valószínűség mellett – a fenitek értelmében –, feltételezzük csak
[50 ± 5] kg/fa termést becsülne. Ez pedig 1000 db fa mellett az összetermés alsó és felső
határában már jelentős különbséget eredményezne. Ami például a gyümölcs elszállításához
szükséges ládák megrendelésénél okozna számára nagy gondot, nem lesznek-e költségei túl
magasak az esetleg feleslegesen megrendelt ládák miatt, ha a termés nem a becslés felső
határa közelében alakul; vagy nem lesz-e ládahiány, ha túl óvatos és az alsó határ közelében
lévő termés mennyiséghez rendel csomagolóeszközöket, de térjünk vissza az elmélethez!

Összefoglalva: a becsült átlag körül elhelyezkedő intervallum szélessége a


választott valószínűségtől (is) függ. A valószínűségi követelmény az inter-
vallum szélességét a hibahatáron keresztül befolyásolja.

A hibahatár számításának másik tényezője az úgy nevezett standardhiba (=


véletlen hiba). A standard hiba létezése annak következménye, hogy nem a
teljes sokságra vonatkozóan ismerjük az adatokat. Ahogy ezt már említettük
is, egy-egy teljes sokságból elvileg sok n-elemű minta válaszható ki. Az ezek-
ből számított átlagok191 egymástól és a teljes sokság adataiból számított átlag-
tól kisebb – nagyobb mértékben különböznek, de matematikailag bizonyítha-
tó, hogy a teljes sokságra jellemző átlag a mintabeli átlagok határértéke; más-
képpen fogalmazva, a minta átlagok a teljes sokságra jellemző átlag körül in-
gadoznak. Ha a teljes sokságból az elméletileg lehetséges összes n-elemű min-
tát vennénk, kiszámolnánk ezek átlagait, majd megnéznénk, hogy ezek átlago-
san mennyivel térnek el az alapsokaság átlagától akkor kapnánk meg a stan-

191 Lásd: példánkat a 9. oldalon.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 200 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 201 ►

dardhibát192, amit végül is az egyetlen ténylegesen ismert minta szórásának


segítségével határozunk meg (= becsüljük meg).
σ s
σx = sx =
n n
A standardhiba számításában szereplő betűk jelentése:
sx = σ= n = s=
a becsült standard sokaság szórá- a minta elemeinek a minta szó-
hiba sa száma rása

A hibahatár és a standardhiba képletét együtt vizsgálva, jól látható, hogy a


szórás a hibahatárral, azaz az intervallum szélességével egyenesen
arányos (= a szórás a számlálóban szerepel), vagyis, ha a minta nagyon
szóródó, akkor azonos valószínűségi követelmény mellett szélesebb hatá-
rok között fog mozogni a becsült érték.

A minta elemszáma (= a nevezőben szerepel) viszont fordítottan ará-


nyos a hibahatárral, azaz az intervallum szélességével. Számítási kép-
let nélkül – a formális logika alapján is – világos, hogy egyre több adat
ismeretében (= n egyre nagyobb), a teljes sokságról egyre többet tudva,
pontosabb eredményt kaphatunk, vagyis azonos valószínűség mellett a
becsült érték szűkebb határok között mozoghat.

A valószínűségi szint és az intervallum szélessége, valamint a minta


elemszáma és az intervallum szélessége közötti összefüggés felismerése és
megértése azért is fontos, mert mind a valószínűségről, mind a minta
elemszámáról a statisztikai munkát végző szakemberek döntenek, illetve a
döntéshez ők adnak tanácsot a munkát megrendelőknek, akik nem feltét-
lenül jártasak a statisztika tudományában.

192A standardhiba számításához egyes esetekben még egy un. korrekciós tényezőt is felhaszná-
lunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 201 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 202 ►

BEMUTATÓ FELADAT I.

Egy egyetem hallgatóinak köréből (= teljes sokaság) egyszerű véletlen


mintát vettünk (n = 100 fő, a kiválasztási arány =1,6 %). Célunk a hallga-
tók szórakozási kiadásainak vizsgálata volt. A minta adatai:

10.3.sz. tábla
szórakozási kiadás osztályközép a hallgatók száma a mintában
ezer Ft / hó /fő xi fi
– 5,0 3,5 6
5,1 – 8,0 6,5 10
8,1 – 11,0 9,5 18
11,1 – 14,0 12,5 35
14,1 – 17,0 15,5 15
17,1 – 20,0 18,5 11
20,0 – 21,5 5
összesen - 100
adatforrás: saját gyűjtés SZE, 2006. márc.
A mintában szereplő hallgatók havi szórakozási kiadásainak átlaga ≅12.380
Ft (= x a ) 193 Továbbá ismert – egy korábbi teljeskörű felvételből – a szóra-
kozási kiadások szórása, σ = 4.407 Ft . Az átlagra vonatkozó eredmény
pontbecslés. Számításainkat kétoldalú intervallumbecsléssel
(P = 95% ) folytatjuk, ennek lépései:
σ 4.430
1. a standard hiba kiszámítása: σ x = = ≅ 443 Ft
n 100
2. a táblabeli érték (= z ) kikeresése, (lásd: a megoldás után)

3. a hibahatár (± ∆ ) kiszámítása: ± ∆ = z ∗ σ x = 1,96 ∗ 443 ≅ 868 Ft

193 Ha az osztályközepek megállapításával gondja van, lapozzon vissza a középértékek


tárgyalásához.
Használja a tudományos számológépét!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 202 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 203 ►

4. az intervallum felírása, megfogalmazása:


[xa ± ∆ ] = [12.380 ± 868] ≅ [11.510〈 xa 〈13.250] Ft
2. A táblabeli értéket ( z i ) a "standard normális eloszlású változó eloszlásfügg-
vényének értékei" (= z − tábla ) c. táblából194 kerestük ki. Ezt a táblát akkor
használhatjuk különböző becslési, hipotézisellenőrzési feladatokhoz, ha a
minta elemeinek száma száz vagy annál több, és ismerjük az alap-
sokaság szórását. A két feltételnek együtt kell teljesülnie.
A táblabeli érték kikeresését az is befolyásolja, hogy egy- vagy két olda-
li becslést végzünk-e. Abban az esetben, ha csak egy oldalról zárt inter-
vallumot akarunk szerkeszteni, akkor a tábla belső rovataiban megkeres-
sük a becslési valószínűség megadott vagy kiválasztott értékének együttha-
tós alakját, majd leolvassuk a tábla oldalrovatából (egész szám és az első
tizedes), ill. fejlécéből (második tizedes) a zi értéket. A két oldalról zárt
intervallum szerkesztéséhez azonban a táblában való keresgélés előtt el
kell végezni a megadott, kiválasztott valószínűség átalakítását.
Ψ (z ) + 1 1 − Ψ (z )
Φ (z ) = = Ψ (z ) +
2 2

A teljes valószínűség, a biztos esemény = 1,0. Ebből levonjuk a becslésnél használni


kívánt valószínűség értékét, a 0,95-t. A fennmaradó rész – 0,05 – az intervallumon kívül
esés valószínűsége, amit α -val jelölünk és szignifikancia-szintnek nevezünk.195 Ez az
egyoldalú becslés esetén az intervallum egyik végén található. Ezt, a szimmetria elérése
érdekében szétosztjuk az intervallum két oldalára. Ennek következtében 0,025-val jobbra
csúszik az intervallum alsó és felső határa is.

Az átalakítási képletben szereplő betűk jelentése


Ψ (z ) =
Φ(z ) =
a megadott, kiválasztott becslési való-
az átalakított, a kétoldalú becsléshez
színűség, amit átalakítás nélkül az egy-
használt becslési valószínűség együtt-
oldalú becslésnél használunk, együttha-
hatós formában
tós formában

194Lásd: a jegyzet végén


195Lásd: hipotézisellenőrzés.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 203 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 204 ►

Az átalakításra azért van szükség, mert a tankönyvekben közölt táblákat


úgy állították össze, hogy azok a változók előfordulási valószínűségét a
mínusz végtelen és az oldalrovatban (+ fejlécben) meghatározott pozitív
z érték közti intervallumra adják meg. S mert 1 − Ψ (z ) = Ψ (− z ) 196, ezért
egyúttal ismert egy adott negatív z érték és a pozitív végtelen közötti elő-
fordulási valószínűség is.
Ezért, ha például P = 95 %-os valószínűséggel dolgozunk, akkor a táb-
lában egyoldalú becslés esetén Ψ (z ) ≅ 0,95-nél kell a z (1,65) értéket kike-
resnünk, kétoldalú becslés esetén pedig Φ ( z ) = 0,975 értéknél. Így szám-
példánkban a táblából kikeresett z érték: 1,96197.

10.4.sz. tábla
A standard normális eloszlásfüggvény értékei, Φ ( z i ) , részlet198
z 0 1 2 3 4 5 6 7 8 9

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9572 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9461 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

♥ Ha a vizsgált egyetem hallgatói köréből az elméletileg lehetséges


összes 100 elemű EV mintát vettük volna, az azokból számított átlagos
szórakozási kiadások (= minta átlagok) a teljes sokság adataiból kiszámít-
ható átlagos szórakozási kiadástól átlagosan 450 forinttal térnének el. (= a
standardhiba jelentése)
♥A vizsgált egyetem hallgatói havonta és fejenként átlagosan 12.380
forintot költenek szórakozásra. (= a pontbecslés jelentése)

196 A normális eloszlás = szimmetrikus eloszlás.


197A tábla belsejében találja növekvő sorrendben a valószínűségeket. Addig keressen,
amíg 0,9750-t nem talál. Majd olvassa le a sor elején található z érték első két-két szám-
jegyét, itt 1,9! Végül a 0,975-t tartalmazó oszlop tetején olvassa le a z érték harmadik
számjegyét is. Ha valamilyen z vagy Φ (z ) értéket nem talál meg pontosan, alkalmazza a
kerekítés matematikai szabályait!
198A táblákban a könnyebb keresés érdekében szokták egy egyes sorokat eltérő háttérrel
megkülönböztetni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 204 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 205 ►

♥ A 100 elemű EV minta alapján 95 %-os valószínűségen állítjuk,


hogy a vizsgált egyetem hallgatói havonta legalább 11.510 és legfeljebb
13.250 forintot költenek szórakozásra. (= az intervallum becslés jelentése)

Ha számításainkat egyoldalú intervallumbecsléssel (P = 95% ) végeztük


volna, akkor a munka menete a táblabeli érték kikeresésétől módosul, és
természetesen más intervallum határokat kapunk:
σ 4.430
1. a standard hiba kiszámítása: σ x = = ≅ 443 Ft
n 100
2. a táblabeli érték (= z ) kikeresése, (lásd: a kétoldalú becslés leírásánál)

3. a hibahatár (± ∆ ) kiszámítása: ± ∆ = z ∗ σ x = 1,65 ∗ 443 ≅ 731 Ft

4. az intervallum felírása, megfogalmazása.

[x + ∆ ) = ([12.380 − 731〈 X 〈+∞ )) ≅ [11.650) Ft


vagy
(x − ∆] = (− ∞〈 X 〈(12.380 + 731)] ≅ (13.110] Ft.
♥ A 100 elemű EV minta alapján 95 %-os valószínűséggel állíthatjuk,
hogy a vizsgált egyetem hallgatói havonta legkevesebb 11.650 Ft-t költe-
nek szórakozásra.
♥ A 100 elemű EV minta alapján 95 %-os valószínűséggel állíthatjuk,
hogy a vizsgált egyetem hallgatói havonta 13.110 Ft-nál nem költenek
többet szórakozásra.199

199 Gyakorlati kérdés: Honnan tudjuk, hogy egy- vagy kétoldalú becslést kell-e végez-
nünk? A kérdésfeltevésből. Ha egy termék (pl. liszt, cukor stb.) zacskókba töltésénél a
munkát végző vállalkozás vagy az értékesítést végző kereskedő számára csak az lényeges,
hogy a vevőt ne károsítsák meg, akkor elég a töltési tömeg alsó határára figyelni. Ha
viszont egy teherszállító eszközről van szó (pl. lift), ahol baleset történhet a túlterhelésnél,
elég a hasznos teher felső határára figyelni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 205 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 206 ►

BEMUTATÓ FELADAT II.

Figyeljük meg, hogyan változnak az I. bemutató feladatban szereplő szá-


mítás eredményei, ha:
• a minta elemszáma növekszik vagy csökken:
legyen n 2 = 200 ,
illetve n3 = 50 ,
• a becslés valószínűsége változik, kisebb illetve nagyobb lesz:
4. legyen P = 90% ,
5. illetve P = 98% !
Annak érdekében, hogy az egyik (elemszám) ill. a másik tényező (valószí-
nűség) a rész– ill. a végeredményre gyakorolt hatását ki tudjuk mutatni, az
éppen nem vizsgált tényezőt állandónak kell tekintenünk.
A minta elemszámának változtatása esetén a valószínűség állandó, jelen esetben ma-
rad az eredeti 95 %, a valószínűség változtatása esetén pedig a minta elemszáma marad
változatlan, itt az eredeti 100 elemmel dolgozunk. Az átlag és a szórás is mindig azonos!
Ha nem történik új mintavétel, hogyan is gondolhatjuk, hogy a megemelt számú, il-
letve a csökkentett elemszámú minta is ugyanazt az átlagot eredményezi? Ha a minta
átlagát elfogadtuk sokasági átlagnak (= indukció), akkor a sokasági átlagot elfogadhatjuk
az új minta átlagának (= dedukció)
Az egyes változtatások következtében módosult eredmények:

1. n 2 = 200 és P1 = 95%

Változik a standardhiba:
σ 4.430
σx = = ≅ 313 Ft,
n 200
és ennek következtében a hibahatár:
± ∆ = z ∗ σ x = 1,96 ∗ 313 ≅ 613 Ft,

és természetesen az intervallum alsó és felső határa is:


[xa ± ∆] = [12.380 ± 612] ≅ [11.770〈 xa 〈12.990]Ft.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 206 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 207 ►

Az intervallum szélessége =
2 ∗ ∆ = 2 ∗ 613 ≅ 1.220 ≅ [( x + ∆ ) − ( x − ∆ ) = 12.990 − 11.770 = 1.220] Ft

♥ A 200 elemű EV minta alapján 95 %-os valószínűségen állítjuk,


hogy a vizsgált egyetem hallgatói havonta legalább 11.770 és legfeljebb
12.990 forintot költenek szórakozásra.

2. n3 = 50 és P1 = 95%

Ebben az esetben is változik a standardhiba:


σ 4.430
σx = = ≅ 626 Ft,
n 50
a hibahatár:
± ∆ = z ∗ σ x = 2,00 ∗ 626 ≅ 1.250 Ft,

és az intervallum alsó és felső határa is:


[xa ± ∆] = [12.380 ± 1.250] ≅ [11.130〈 xa 〈13.630] Ft.
Az intervallum szélessége =
2 ∗ ∆ = 2 ∗1.250 = 2.500 ≅ [( x + ∆ ) − ( x − ∆ ) = 13.630 − 11.130 = 2.500] Ft
A táblabeli értéket, tekintettel arra, hogy az ismertetett két feltétel – száz vagy annál
nagyobb elemszám és az alapsokaság szórásának ismerete – közül csak az egyik teljesült,
nem a már bemutatott, hanem a Student eloszlás táblából kerestük ki. Ezt a táblát a számí-
tások után ismertetjük.
♥ Az 50 elemű EV minta alapján 95 %-os valószínűségen állítjuk,
hogy a vizsgált egyetem hallgatói havonta legalább 11.130 és legfeljebb
13.630 forintot költenek szórakozásra.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 207 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 208 ►

3. n1 = 100 és P2 = 90%

Változik a táblából kikeresett érték:


Ψ ( z ) + 1 0,90 + 1
Φ(z ) = = = 0,95 → z i = 1,65 200,
2 2
ennek következtében a hibahatár is:
± ∆ = z ∗ σ x = 1,65 ∗ 443 ≅ 731 Ft,

ill. az intervallum alsó és felső határa is:


[xa ± ∆] = [12.380 ± 731] ≅ [11.650〈 xa 〈13.110] Ft.
Az intervallum szélessége =
2 ∗ ∆ = 2 ∗ 731 = 1.460 ≅ [( x + ∆ ) − (x − ∆ ) = 13.110 − 11.650 = 1.460]Ft.

♥ A 100 elemű EV minta alapján 90 %-os valószínűségen állítjuk,


hogy a vizsgált egyetem hallgatói havonta legalább 11.650 és legfeljebb
13.110 forintot költenek szórakozásra.

4. n1 = 100 és P3 = 98%

Változik a táblából kikeresett érték:


Ψ ( z ) + 1 0,98 + 1
Φ(z ) = = = 0,99 → z i = 2,33 ,
2 2
a hibahatár :
± ∆ = z ∗ σ x = 2,33 ∗ 443 ≅ 1.031 Ft,

ill. az az intervallum alsó és felső határa is:


[xa ± ∆] = [12.380 ± 1.032] ≅ [11.350〈 xa 〈13.410] Ft.

200 A 10.3. sz. táblában ez az első bekeretezett érték.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 208 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 209 ►

Az intervallum szélessége =
2 ∗ ∆ = 2 ∗1.032 = 2.060 ≅ [( x + ∆ ) − ( x − ∆ ) = 13.410 − 11.350 = 2.060] Ft

♥ A 100 elemű EV minta alapján 98 %-os valószínűségen állítjuk,


hogy a vizsgált egyetem hallgatói havonta legalább 11.350 és legfeljebb
13.410 forintot költenek szórakozásra.

Megfigyeléseink:
• Az 1. és a 2. esetben az elemszám növekedése illetve csökkenése kö-
vetkeztében – a fordított arányosság miatt – csökken, ill. növekszik az
intervallum szélessége. (Eredeti szélesség = 1.740, megváltozott szé-
lesség: n 2 = 200 → 1.220 (= szűkebb) és n3 = 50 → 2.500 (= tágabb)
• A 3. és a 4. esetben a becslési valószínűség növekedése illetve csök-
kenése következtében – az adatok egyező irányban való mozgása miatt
– növekszik, ill. csökken az intervallum szélessége. (Eredeti szélesség
= 1.740, megváltozott szélesség: P2 = 90% → 1.460 (= szűkebb) és
P3 = 98% → 2.060 (= tágabb)

Összefoglalva: a minta elemszámának növelése (csökkentése) az interval-


lum szélességét csökkenti (növeli); a becslés valószínűségének növelése
(csökkentése) pedig az intervallum szélességét növeli (csökkenti).

Az 50 elemű mintából történt számítás során a hibahatár meghatározásához


– ahogy ezt jeleztük is – másik táblából kerestük ki az adott valószínűséghez
tartozó értéket. Miért? A számtani átlag becslésének elméleti leírása során
már említettük, hogy a számtani átlagot, mint valószínűségi változót többek
között szórása is jellemzi. A szórást azonban egyes esetekben ismertnek (ko-
rábbi teljeskörű felmérésből) tekinthetjük, azonban nem mindig. (Nincs
minden esetben korábbi, s főleg teljeskörű felmérés.) Tehát magát a szórást
is mintából becsüljük, azaz a szórás is mintáról mintára ingadozó valószínű-
ségi változó, és számításához egy nem független201 valószínűségi változót (=
átlag) is felhasználunk. Ennek következménye, hogy a z -változó helyett t -

201 A függetlenség kérdésére a szórás becslésével kapcsolatban térünk ki.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 209 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 210 ►

változót kell használnunk. Ennek értékeit tartalmazza a Student -féle tábla. A


t -változót változókat pedig szabadságfokuk (= n − 1 ) (is) jellemzi202.
A becslés szabadságfoka203 a számítások során felhasznált független ele-
mek számát jelenti. Ez itt és most azért n − 1 , mert a t -változó számításánál
szereplő értékek közül a szórás nem független valószínűségi változó. Példánk-
ban (2. változat) ez 49 (v = n − 1 = 50 − 1) . A Student-táblában ezt az értéket
nem találjuk, ezért a hozzá legközelebb található 60-as szabadságfokhoz tartozó
" t" értéket keressük ki. Ez a keresett érték: 2,0.
A Student -táblával még nem dolgoztunk, ezért röviden ismertetjük
szerkezetét. Az oldalrovatban található a szabadságfokok (v ) felsorolása.
A táblában található utolsó szabadságfok 120. E fölött gyakorlatilag nincs
különbség a Student-tábla és a " z" -tábla értékei között. A tábla fejrovatában
vannak a valószínűségi értékek. (Ezek száma jóval kevesebb, mint a " z" -
tábla esetén, de csak – a helyhiány miatt – az oktatási célra készült jegyze-
tekben.) Ezt a táblát is egyoldalú becslésre adták meg, így itt is "el kell
tolni" az intervallum határokat, vagyis ha a becslés megadott valószínűsége
95 %, akkor abban az oszlopban kell a "t" értéket keresni, amelyiknek a
fejlécében 0,975 található.204

10.5. sz. tábla


A Student eloszlás értékei, (t i ) , részlet
v 0,55 0,60 0,70 0,75 0,80 0,90 0,95 0,975 0,99 0,995
1 0,158 0,325 0,727 1,000 1,376 3,08 6,31 12,71 31,82 63,66

40 0,126 0,255 0,529 0,681 0,851 1,30 1,68 2,02 2,42 2,70
60 0,126 0,254 0,527 0,679 0,848 1,30 1,67 2,00 2,39 2,66
120 0,126 0,254 0,526 0,677 0,845 1,29 1,66 1,98 2,36 2,62
∞ 0,126 0,253 0,524 0,674 0,842 1,28 1,65 1,96 2,33 2,58

202 A z-változó szabadságfoka = végtelen, ezért ezzel nem kellett foglalkoznunk.


203Lásd részletesebben: 2.1.8.1.1.
204 Gyakorlatias megközelítés: z-tábla: valószínűség a tábla belsejében, leolvasandó érték
az oldalrovatban (+fejlécben), t-tábla: valószínűség a fejlécben, leolvasandó érték a tábla
belsejében.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 210 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 211 ►

10.2.2. Szórás becslése egyszerű véletlen (EV) mintából


A szórás mintából történő számítása előtt két fontos elméleti kérdést kell
tisztázni:
• a függetlenség,
• a szórás eloszlása.
1. Függetlenség
Már említettük, hogy matematikai szempontból a mintavétel lehet vissza-
tevéses (= ismétléses) és a visszatevés nélküli (= ismétlés nélküli). A visz-
szatevéses mintavételt alkalmazva minden választásunk N elem közül
történik, azaz egyik elem mintába kerülése nem befolyásolja a másik elem
mintába kerülését. Másképpen fogalmazva, bármelyik elem mintába kerü-
lése független a többi elem mintába kerülésétől. A visszatevéses mintavétel
független mintát eredményez.
A visszatevés nélküli mintavételnél a kiválasztható elemek száma
folyamatosan csökken. Egy-egy elem mintába kerülése javítja a többi elem
mintába kerülési esélyeit, hiszen – ha igen csekély mértékben is –, de nő a
kiválasztás valószínűsége. Vagyis ez a mintavételi módszer nem eredmé-
nyez tökéletesen független mintát, de mert általában az alapsokaság
elemeinek száma igen nagy és ehhez képest a minta elemeinek száma kicsi,
azaz a kiválasztási arány alacsony (= 10 % alatti), ezért az így kapott mintát
is függetlennek tekinthetjük.
A függetlenség problémája azonban más megközelítésben is felme-
rül. Kérdés, hogy a mintákból számított statisztikai adatok (átlag, módusz,
medián stb.) függetlenek-e?

Azok a statisztikai adatok, amelyeknek számításához csak az alapsokaság-


ból véletlenszerűen kiválasztott adatokat használunk fel (pl.: átlag) függet-
len valószínűségi változók.

Azok a statisztikai adatok (pl.: a szórás), melyeknek a számításához nem-


csak az alapsokaságból véletlenszerűen kiválasztott adatokat használunk
fel, hanem olyanokat is, melyek értéke mintáról mintára ingadozik nem
függetlenek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 211 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 212 ►

A számítás során felhasznált független elemek számát nevezzük


szabadságfoknak. Mivel a szórás számításánál csak az átlag szerepel, mint
nem független elem, ezért a szórás szabadságfoka: v = n − 1 .205
A szabadságfok figyelembevételével a szórás korábban megismert – de
csekély mértékben módosult – képlete = becslőfüggvénye:
Ha egyszerű számtani átlagot
Ha súlyozott számtani átlagot számítottunk
számítottunk:

s=
∑ (x i − xa )
2

=
∑d i
2
s=
∑ f (x − x )
i i a
2

=
∑fd ≈
i i
2

g i d i2
n −1 n −1 ∑ f −1
i ∑ f −1
i

A szórás (pont)becslőfüggvényeiben szereplő betűk jelentése:


xa = xi = n =
a számtani átlag az átlagolandó értékek a minta elemeinek száma
fi fi
fi = gi = = =
∑f i
n
az egyes értékek előfor-
az egyes értékek előfordulási aránya a mintában (=
dulása (db, fő) a mintá-
relatív gyakoriság, %-os formában pedig megoszlási
ban
viszonyszám)
di =
az átlagolandó értékek és a számtanis átlag különbsége
A képletek nevezőjében szereplő " −1" tagot a gyakorlatban csak kisminta
(n〈100) esetén érvényesítjük, hiszen, ha n 〉 100 , akkor n és n − 1 között
elhanyagolható a különbség.206
2. A szórás eloszlása
A szórás eloszlására a szórás köré szerkesztendő intervallum miatt kell fi-
gyelnünk. A szórás nem normális eloszlású valószínűségi változó. Jól látható
ez, ha a 10.2. sz. táblában szereplő egyszerű példánk szórásait ábrázoljuk.

205 Fontos megjegyezni, hogy ha a minta elemszáma kisebb száznál (= kisminta), akkor
az átlag becslésénél is felvetődik a függetlenség problémája (különösen azért, mert ilyen-
kor nagyobb az esély a szélsőséges mintára), ahogy erről a t-tábla használatával kapcsolat-
ban már volt szó.
206 Például 10 ≅ 3,16 és 11 ≅ 3,32 vagy 500 ≅ 22,36 és 501 ≅ 22,38

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 212 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 213 ►

10.6.sz. tábla
a szórás értéke előfordulás
0,0 9
0,5 22
1,0 11
1,5 3

A 10.2. sz. táblában szereplő N = 10 elemű


alapsokaságból választott n = 2 elemű minták
szórásainak megoszlása

25
előfordulás (db)

20

15
Adatsor1
10

0
0 0,5 1 1,5 2

szórások (nincs mértéke.)

10.1. ábra
Az ábra jobbra elnyújtott. Ezt az eloszlás-típust χ 2 (kh’ )2 -eloszlásnak ne-
vezzük.207 A másféle – aszimmetrikus – eloszlás-típus a számítások so-
rán másik tábla – "a χ 2 = (kh’ )2 -eloszlású változó eloszlásának kvantilis értékei"
– használatát teszi szükségessé. A tábla szerkezete – így az abban való
keresés is – azonos a t-táblánál megismerttel.
Az elméleti problémák tisztázása után íme a szóráshoz tartozó intervallum
számításának képlete = becslőfüggvénye:

(n − 1)s 2 〈σ 2 〈 (n − 1)s 2
χ2α χ α2
1−
2 2

207A minta elemszámának növelésével a szórások eloszlása is közelíti a normális eloszlást.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 213 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 214 ►

A szórás intervallumának becslőfüggvényében szereplő betűk jelentése:


σ =
s= n =
az alapsokaság becsülni
a mintából becsült szórás a minta elemeinek száma
kívánt szórása
χ2α = χ α2 =
1−
2 2

táblabeli érték az intervallum alsó hatá- táblabeli érték az intervallum felső


rához határához
α = 1− P = P =
szignifikancia-szint a becslés valószínűsége

BEMUTATÓ FELADAT

Folytassuk a számtani átlag becslésénél megkezdett (10.2. sz. tábla), az egyete-


mi hallgatók szórakozási kiadásaira vonatkozó példát! A szórás pontbecslése:

s=
∑ f (x − x )
i i a
2

=
194.256.000
≅ 4430 Ft
∑ f −1 i 100 − 1

Az intervallum meghatározásának lépései:


1. a táblabeli értékek kikeresése,
2. az intervallum határainak kiszámítása, megfogalmazása.
A számtani átlag intervallumának meghatározásához képest – a becslő-
függvényre nézve ez egyértelmű – kevesebb műveleti lépésre van szüksé-
günk; de nem egy, hanem két különböző táblabeli értéket kell kike-
resnünk, továbbá – és ez lényeges különbség – a számítás közvetlen
eredménye nem a szórás, hanem annak négyzete (= variancia).
Jelen feladatunkban, a becslés valószínűsége 95 % (= P ) , így a
szignifikancia-szint 5 % (= α ) , ami azt jelenti, hogy a szórás alsó határának
α
kiszámításához a = 0,025 feliratú oszlopban, a felső határ kiszámításá-
2
α
hoz pedig a 1 − = 0,975 feliratú oszlopban keressük ki a táblabeli érté-
2
ket. Mivel a szabadságfok 99 (= n − 1 = 100 − 1) , kerekítve 100, ezért a két
kikeresett adat a az előbbi sorrendben: 74,2 illetve 129,6.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 214 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 215 ►

10.7. sz. tábla

( )
A Khi-négyzet eloszlás χ i2 értékei, részlet
v 0,005 0,01 0,025 0,05 0,10 0,25 0,50 0,75 0,90 0,95 0,975 0,990 0,995
1 0,00 0,00 0,00 0,00 0,02 0,10 0,46 1,32 2,71 3,84 5,02 6,63 7,88

70 43,3 45,4 48,8 51,7 55,3 61,7 69,3 77,6 85,5 90,5 95,0 100,4 104,2
80 51,2 53,5 57,2 60,4 64,3 71,1 79,3 88,1 96,6 101,9 106,6 112,3 116,3
90 59,2 61,8 65,6 69,1 73,3 80,6 89,3 98,6 107,6 113,1 118,1 124,1 128,3
100 67,3 70,1 74,2 77,9 82,4 90,1 99,3 109,1 118,5 124,3 129,6 135,8 140,2

Így az intervallum:

(n − 1)s 2 〈σ 2 〈 (n − 1)s 2 =
99 ∗ 4430 2 2 99 ∗ 4430 2
〈σ 〈 =
χ2α χ α2 129,6 74,2
1−
2 2

14.991.243,1〈σ 2 〈 26.184.165,8 ⇒ ≅ [3872〈σ 〈5117] Ft

♥ A 100 elemű EV minta alapján 95 %-os valószínűségen állítjuk,


hogy a vizsgált egyetem hallgatóinak havi szórakozási kiadása legalább
3.870 és legfeljebb 5.120 forinttal tér el (= kisebb vagy nagyobb) a szóra-
kozásra átlagosan elköltött összegtől.
Figyeljük meg az intervallum aszimmetriáját! A mintából számí-
tott (= becsült) szórás és az alsó határ között 560 Ft, illetve a becsült
szórás és a felső határ között 690 Ft a különbség.
Ha számításainkat kisebb elemszámú mintából végeztük volna, a fenti két különbség
között nagyobb lenne az eltérés; ha pedig nagyobb elemszámú mintával dolgoztunk
volna, az eltérés kisebb lenne.

10.2.3. Az értékösszeg becslése egyszerű véletlen (EV)


mintából
A becslés célja – ahogy erről már a fejezet bevezetőjében is szó volt – egy
sokasági jellemző értékének kiszámítása az egyetlen ismert minta alapján
úgy, hogy az abból számított értéket – egy adott valószínűség mellett –
vonatkoztatjuk a teljes sokaságra. Az átlag és a szórás esetében ez úgy
teljesült, hogy a számítások végeredménye, a minta átlaga és a szórása egy-

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 215 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 216 ►

ben a teljes sokaságra vonatkozó átlag és szórás is egy alsó és felső határ
között. A minta értékösszegéről azonban soha nem mondhatjuk, hogy az
a teljes sokaság értékösszege lenne.
Gondoljuk el, meg akarjuk becsülni egy egyetemen a hallgatók közleke-
dési kiadásainak havi, vagy éves összegét, az semmiképp nem azonos a min-
tában szereplő, lényegesen kevesebb számú hallgató kiadásainak összegével.
A teljes sokaságra vonatkozó értékösszeget tehát csak két lépésben
tudjuk meghatározni, így számításához feltétlenül ismernünk kell
• vagy a sokaság elemeinek számát (= N ) , ekkor a becsült átlagból kap-
juk meg az értékösszeget;
• vagy a minta kiválasztási arányát ⎛⎜ = ⎞⎟ , ekkor a mintára vonatkozó
n
⎝ N⎠
értékösszegből számítjuk ki a teljes sokaságra vonatkozót.
A sokasági értékösszeg számításának (pont)becslőfüggvényei:
n
N és x ismeretével és x′ ismeretével
N
N
X ′ = N ∗ x 208 X′= x′
n

A sokasági értékösszeg számításának intervallum-becslőfüggvényei:

[X ′ ± ∆] = N ∗ [xa ± ∆] [X ′ ± ∆] = N ∗ [x′ ± ∆′] = N ∗ [xa ± ∆]


n n

A sokasági értékösszeg becslőfüggvényeiben szereplő betűk jelentése:


X′ = x′ = n ∗ x = x =
a teljes sokságra vonat- a minta sokaságra vonat- a mintából számított és a teljes
kozó becsült értékösszeg kozó számított értékösszeg sokságra vonatkoztatott átlag
N = ∆′ = n ∗ ∆ =
n =
a teljes sokság elem- a mintára vonatkozó érték-
a minta elemszáma
száma összeg hibahatára
∆ =

208A második képlet az elsőből – az összefüggések figyelembevételével – értelemszerűen


adódik.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 216 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 217 ►

az átlag hibahatára

BEMUTATÓ FELADAT

Folytassuk a számtani átlag becslésénél megkezdett (10.2. sz. tábla), majd a szó-
rás számításával továbbvitt, az egyetemi hallgatók szórakozási kiadásaira vonat-
kozó példát! Kiegészítő adat: a vizsgált egyetem hallgatóinak száma = 6.250 (=
100 / 0,016) fő. Az értékösszeg pontbecslése és intervallumbecslése:
X ′ = N ∗ x = 6.250 ∗12.380 ≅ 77.375.000 Ft = 77,4 millió Ft
[X ′ ± ∆] = N ∗ [xa ± ∆] = 6.250[12.380 ± 868] ≅ [72,0〈 X ′〈82,8] millió Ft
♥ A 100 elemű EV minta alapján 95 %-os valószínűségen állítjuk,
hogy a vizsgált egyetem hallgatói (6.250 fő) legalább 72,0 és legfeljebb 82,8
millió forintot költenek el havonta szórakozásra.
10.2.4. Sokasági arány becslése egyszerű véletlen (EV)
mintából
A nem homogén sokaságok valamely megkülönböztető ismérv alapján
részsokaságokra bonthatók, ahogy a bemutató feladatban szereplő egye-
tem hallgatói is szórakozási kiadásaik nagysága alapján (és természetesen
egyéb ismérvek alapján is). Az egyes részsokaságok aránya azonban mintá-
ról mintára kisebb-nagyobb mértékben változhat. Ezért ebben az esetben
sem elégedhetünk meg a pontbecsléssel, hanem intervallumbecslést kell
végezni, azaz meg kell állapítani, hogy az egyes részsokságok a teljes soka-
ság legalább és legfeljebb hányad részét adják. Az egyes részsokaságok
arányára vonatkozó becslést azonban csak úgy tudjuk elvégezni, ha a cso-
portképzésre használt ismérvváltozatokat alternatív-ismérvekké alakít-
juk. Az egyik csoport azon elemeké, amelyek arányát éppen ki akarjuk
számítani (= "1"-vel jelzett ismérvváltozat), a másik csoportot pedig a
sokaság összes többi eleme (= "0"-val jelzett ismérvváltozat) alkotja.
Ha például egy egyetem hallgatói közül azok arányának intervallumát akar-
juk kiszámítani, akik az adott intézmény székhelyén szüleikkel élnek, akkor ők
képezik az egyik részsokságot = "1"-vel jelzett ismérvváltozat; az összes többi
hallgató pedig a másik részsokságot jelenti = "0"-val jelzett ismérvváltozat.
Az alternatív ismérvek szerinti részsokaságokra való felbontás után a
számítás menete azonos az átlag becslés lépéseivel, vagyis:
1. a sokasági arány, azaz az alternatív ismérvek átlagának (= p ) és

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 217 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 218 ►

2. a szórásnak ( = s ) kiszámítása a mintából,


3. a standardhiba (= σ p ) meghatározása ,
4. a táblabeli érték (= z ) kikeresése ,
5. a hibahatár (= ± ∆ ) kiszámítása ,
6. a becsült arányhoz tartozó intervallum (= [ p ± ∆ ]) felírása, megfogalmazása.

Átlagnak209 tekintjük alternatív ismérvek arányának meghatározása esetén


az "1"-es ismérvváltozattal jelzett részsokaság mintából meghatározott
arányát. Az alternatív ismérvek szórása pedig az alternatív részsokságok
arányának mértani átlaga.

A soksági aránynak és az arány szórásának (pont)becslőfüggvénye:


arány szórás
fk fk
p= = ≅ gi s= p∗q
n ∑f i

A becsült arányhoz tartozó alapsokasági elemszám becslőfüggvénye:


N j = N ∗ pj [N j ] [
± ∆ = N ∗ pj ± ∆p ]
A sokasági arány, az arányra vonatkozó szórás és az alapsokasági elem-
szám becslőfüggvényeiben szereplő betűk jelentése:
s= p= q = 1− p =
az alternatív ismérvek a vizsgált részsokság az alternatív részsokaság
mintából számított szórása aránya aránya

Nj =
n = a becsült arányhoz tarto- N=
a minta elemszáma zó alapsokasági elemszám az alapsokaság elemszáma
(pontbecslés)

209 x = p ∗1 + q ∗ 0 = p

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 218 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 219 ►

BEMUTATÓ FELADAT

Folytassuk a számtani átlag becslésénél megkezdett (10.2. sz. tábla), az


egyetemi hallgatók szórakozási kiadásaira vonatkozó példát!

10.8. sz. tábla

osztály- a hallgatók
szórakozási
száma a mintá-
kiadás közép
ban
ezer Ft / hó /fő xi fi
– 5,0 3,5 6
5,1 – 8,0 6,5 10
8,1 – 11,0 9,5 18
11,1 – 14,0 12,5 35
14,1 – 17,0 15,5 15
17,1 – 20,0 18,5 11
20,0 – 21,5 5
összesen - 100
Határozzuk meg azon hallgatók arányát és számát, akiknek a havi szóra-
kozási kiadása 15.000 Ft vagy annál magasabb!
A feladat megoldása első ránézésre lehetetlennek tűnik, hiszen 15.000
forintos osztályköz határ nincs. Osszuk fel tehát azt az osztályközt, ame-
lyik a megadott értéket tartalmazza! A felosztásnál azt feltételezzük, hogy
az elemek egyenletesen helyezkednek el az osztályközön belül210. Így a
megjelölt (szürke háttér, vastagabb keret) osztályköz a felbontás után két
részből áll: 14,1 – 15,0 és 15,1 – 17,0, a részekbe tartozó gyakoriságok
pedig: 5 és 10. Most már összegezhetjük a kritériumnak megfelelő előfor-
dulásokat: f k = 10 + 11 + 5 = 26 , majd elvégezhetjük a megadott sorrend-
ben a számításokat:

210 Mint a módusz számításánál.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 219 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 220 ►

26
1. p = = 0,26 q = 1 − 0,26 = 0,74
100
2. s = pq = 0,26 ∗ 0,74 ≅ 0,44
s 0,44
3. σ p = = ≅ 0,044
n 100
5. ± ∆ = z ∗ σ p = 1,96 ∗ 0,044 ≅ 0,086 ⇒ 8,6% 211
6. [ p ± ∆ ] = [26 ± 8,6] = [17,4 ; 34,6]%

[
7. N j ± ∆ = ] 100
0,016
[
[0,174 ; 0,346] ≅ 1088〈 N j 〈 2163 fő ]
Ezzel a feladattal először a számtani átlag becslésével találkoztunk, ott közöltük a kivá-
⎛ n⎞
lasztási arány ⎜ = ⎟ nagyságát (1,6 %), ezt az adatot használtuk fel most az alapsoka-
⎝ N⎠
ság elemszámának meghatározására (N = 6.250 fő).
♥ A 100 elemű EV minta alapján 95 %-os valószínűségen állíthatjuk,
hogy a vizsgált egyetem hallgatói közül legalább 1.088 és legfeljebb 2.163
fő havonta 15.000 forintnál többet költ szórakozásra.
10.2.5. Adott intervallum-szélességhez (=adott hibahatárhoz)
tartozó elemszám illetve valószínűség meghatározása
(EV minta)
Az eddig bemutatott példákban mindig adott mintából dolgoztunk és elő-
re adott valószínűség mellett számítottuk ki a becsülni kívánt sokasági
jellemzők aktuális értékét. A kérdés azonban „fordítva” is felmerülhet:
1. Mekkora mintát kell vennünk adott valószínűség mellett egy sokaság-
ból, hogy a hibahatár egy előre megadott értéknél ne legyen nagyobb?
2. Hány %-os valószínűséggel kerül valamelyik sokasági jellemző adott
mintaelemszám mellett egy előre meghatározott szélességű intervallumba?
A fenti kérdéseinkre roppant egyszerűen válaszolhatunk. Mivel a kérdés
„megfordult”, a válaszadás során is "visszafelé" kell gondolkodnunk!

211 Tekintettel arra, hogy ugyanazon feladatot folytattuk, és a valószínűségi előíráson sem
változtattuk, új táblabeli értéket nem kellett keresni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 220 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 221 ►

1. Adott valószínűség, adott hibahatár → elemszám?


⎡ σ ⎤
A [xa ± ∆ ] = [xa ± z ∗ σ x ] = ⎢ xa ± z ∗ ⎥ képletből ismert az átlag (= x a ) és a
⎣ n⎦
szórás (= σ ) , például egy korábbi mintavétel eredményeképpen; a valószí-
nűség pedig és ennek következtében a " z" -érték adott. Fejezzük ki tehát
az összefüggésből az ismeretlent, az elemszámot!212
2
σ z ∗σ ⎛ z ∗σ ⎞
±∆ = z∗ → n= → n=⎜ ⎟ 213
n ∆ ⎝ ∆ ⎠

2. Adott elemszám, adott hibahatár → valószínűség?


⎡ σ ⎤
Az előbbiekben már felírt [xa ± ∆ ] = [xa ± z ∗ σ x ] = ⎢ xa ± z ∗ ⎥ képletből a
⎣ n⎦
címben megadott feltételek alapján a valószínűség ismeretlen volta miatt a
" z" -érték a kiszámítandó adat. Fejezzük ki, tehát ezt!

σ ∆∗ n
±∆ = z∗ → z=
n σ

Ha egyoldalú becslést végeztünk, akkor a képlet alapján kiszámított z ér-


tékhez tartozó valószínűség kikeresésével választ kapunk a feltett kérdésre.
Ha azonban kétoldalú becslést végzünk akkor még nem vehetjük kézbe a
táblát. A kiszámított " z" -értékhez tartozó Φ (z ) értéket át kell alakíta-
nunk214, ennek képlete:
P = Φ (z ) − (1 − Φ (z ))

212Lehet, hogy ez a megközelítés túlságosan matematikai jellegű, de egyrészt a statisztika


a matematikára épül, másrészt a statisztika-elmélet részletesebb ismerete nélkül – talán –
így a legegyszerűbb.
213 A betűjelek a korábbi képletekből mind ismertek.
214Ha szükséges, lapozzon vissza a számtani átlag becsléséhez! (A táblában való keresés-
ről leírt tudnivalókhoz.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 221 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 222 ►

BEMUTATÓ FELADAT215

A vizsgált hallgatók szórakozási kiadásának becslésekor legyen az előre


meghatározott hibahatár 400 Ft.
1. A keresett elemszám (a valószínűség az eredeti):
• kétoldalú becslést feltételezve:
2 2
⎛ z ∗ σ ⎞ ⎛ 1,96 ∗ 4.430 ⎞
n=⎜ ⎟ =⎜ ⎟ ≅ 471 fő
⎝ ∆ ⎠ ⎝ 400 ⎠
• egyoldalú becslést feltételezve:
2 2
⎛ z ∗ σ ⎞ ⎛ 1,65 ∗ 4.430 ⎞
n=⎜ ⎟ =⎜ ⎟ ≅ 334 fő
⎝ ∆ ⎠ ⎝ 400 ⎠
2. A keresett valószínűség (az elemszám az eredeti):
• kétoldalú becslést feltételezve:

∆∗ n 400 ∗ 100
z= = ≅ 0,90
σ 4430
Φ ( z i ) = 0,8159
Ψ ( z i ) = Φ (z i − (1 − Φ ( z i ))) = 0,8159 − (1 − 0,8159) = 0,6318

• egyoldalú becslést feltételezve:

∆∗ n 400 ∗ 100
z= = ≅ 0,90
σ 4430
Φ ( z i ) = 0,8159

♥ Ha az a cél, hogy a hibahatár 868 Ft-ról (kétoldalú becslés) ill. 731


Ft-ról (egyoldalú becslés) 400 Ft-ra csökkenjen (= szűkebb legyen az in-
tervallum), akkor 95 %-os valószínűség mellett 471 (kétoldalú becslés) ill.
334 (egyoldalú becslés) elemű EV mintát kell venni az alapsokaságból.

215 Gyakorlati megoldás: az ilyen jellegű feladatoknál mindig „z”-táblával dolgozunk, ui.
több valószínűségi adat közül válogathatunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 222 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 223 ►

♥ Ha az a cél, hogy a hibahatár 868 Ft-ról (kétoldalú becslés) ill. 731


Ft-ról (egyoldalú becslés) 400 Ft-ra csökkenjen (= szűkebb legyen az in-
tervallum), akkor az alapsokaságból vett 100 elemű EV minta alapján csak
63 (kétoldalú becslés) ill. 81 %-os (egyoldalú becslés) valószínűség mellett
igazak az intervallumhatárok.216
10.2.6. Korrekciós tényezők
1. A mintavétel egyik ismertetett módszere az ismétlés nélküli (visszate-
vés nélküli) kiválasztás. Alkalmazásának előnye, hogy elkerülhető egyetlen
elemnek többszöri mintába kerülése, és ezzel a valóságot torzan tükröző
minta létrejötte. Ezzel szemben hátránya, hogy a kiválasztás során a füg-
getlenség követelménye sérül. Azt már tudjuk, hogy az alapsokaság eleme-
inek (= N ) nagy száma, a szó szoros értelemben vett sokaság és ehhez
viszonyítva a minta elemeinek (= n ) alacsony száma ⎛⎜ 〈10% ⎞⎟ a független-
n
⎝N ⎠
ség sérüléséből adódó problémákat enyhíti. Vannak azonban olyan esetek,
amikor vagy az alapsokaság nem igazán nagy tömegű, vagy a kiválasztási
arány nem 10 % alatti, ilyenkor számítási eredményeink pontosítása érde-
kében korrekciós tényezőt kell alkalmaznunk.
A korrekciós tényezőt (= k ) számításaink során a standardhiba
meghatározásánál iktatjuk be a műveleti sorrendbe. Képletét bizonyí-
tás217 nélkül közöljük.

N −n n
k= ≅ 1−
N −1 N

A korrekciós tényező gyakorlatban alkalmazott egyszerűsített képlete (=


bekeretezve) egyértelműen mutatja, hogy az ismétlés nélküli kiválasztás
standard hibája, ebből következően pedig – azonos valószínűségi köve-
telmény mellett – hibahatára is kisebb, azaz szűkebb intervallumba kerül a
becsült soksági jellemző.218

216 Az elemszámra és valószínűségre vonatkozó eredmények minden külön magyarázat


nélkül logikusan következnek a számtani átlag becslésekor levezetett II. bemutató feladat
megállapításaiból.
217A bizonyítás a valószínűség számítással foglalkozó tudományos irodalomban és egyes
matematikai tankönyvekben is megtalálható.
218 A gyök alatti tényező mindenképpen kisebb egynél.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 223 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 224 ►

A következő (10.8. sz.) kis tábla pedig azt szemlélteti, miért is van lehe-
tőség 10 % alatti kiválasztási arány esetén a korrekciós tényező elhagyásá-
ra. Alacsony kiválasztási arány mellett az ismétléses (számolás a korrekciós
tényező nélkül) és az ismétlés nélküli kiválasztás (számolás a korrekciós
tényezővel) eredménye között rendkívül csekély az eltérés.219.

10.9. sz. tábla


kiválasztási a korrekciós tényező
arány (%) értéke
50 0,707
30 0,837
20 0,894
10 0,949
5 0,975
4 0,980
2 0,990
1 0,995

2. Korrekciós tényezőt – de másféle képlettel és módon – alkalmazunk


abban az esetben is, ha a becsülni kívánt sokasági arány nem folytonos
eloszlású sokaságra vonatkozik, pl.: ha a hallgatók érdemjegyek220 szerinti
eloszlását vizsgáljuk. A korrekciós tényezőt ebben az esetben a pontbecs-
lésnél iktatjuk a számítás menetébe.
fk 1
p= + 221
n 2n
Ha a minta elemszáma alacsony, akkor alkalmazása mindenképpen indo-
kolt, ha azonban n elég nagy szám használata nem módosítja számottevő-
en az eredményt.

219A végső kerekítések során sokszor nagyobb eltéréseket okozunk.


A korrekciós tényező alkalmazására itt feladatot nem mutatunk be.
220 Az érdemjegyek egész számok, a tapasztalati eloszlásfüggvénynek szakadásai vannak.
221 A képletben szereplő betűjelek már ismertek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 224 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 225 ►

10.2.7. Arányos rétegzés (AR)


Rétegzett kiválasztás alkalmazására akkor kerülhet sor, ha az alapsokaság-
ról készült nyilvántartásában az egyes elemekre vonatkozóan olyan többlet
információ (= megkülönböztető ismérv) is található, melynek alapján egy-
értelműen elvégezhető a részsokaságokra (= rétegekre) bontás.
A rétegzett kiválasztás egyik, már említett előnye, hogy a sokaságról
biztosan pontosabb képet kapunk, mint az egyszerű véletlen mintavétel
esetén, hiszen biztosított, hogy mindegyik rétegből kerül elem a mintába.
A rétegzett mintavétel ezen előnyét a mintavétel költségeinek csökkentésé-
re is felhasználhatjuk. Ha ugyanis lemondunk a pontosabb eredményről,
azaz megelégszünk az azonos szélességű intervallummal, akkor ez keve-
sebb elemet kell kiválasztani és megfigyelni.
A rétegzett kiválasztási módszer számítási képleteit itt csak a több
szempontból is legegyszerűbb, úgy is fogalmazhatunk, hogy a legkézen-
fekvőbb, arányos rétegzésre vonatkozóan mutatjuk be. A számítások
menete – és ez nemcsak az arányos rétegzésre igaz – mindig két részre
tagolódik. Először a rétegeken belül dolgozunk, másodszor pedig a réte-
gek eredményeiből számítjuk ki a teljes sokaságra jellemző adatokat. Mivel
az egyes rétegekből egyszerű véletlen kiválasztással történik a mintába
kerülő elemek kiválasztása, új képletekkel ehhez a munkaszakaszhoz nem
kell megismerkedni. A második munkaszakaszban a rétegekre jellemző
statisztikai jellemzőkből a teljes sokságra vonatkozó adatok az alábbiak
szerint határozhatók meg:
számtani átlag standardhiba
1
xa = ∑ w j x j σx = ∑ w jσ 2j
n

Az arányos rétegzésre vonatkozó becslőfüggvényekben szereplő betűk


jelentése:
xa = xj = n = nj =
teljes sokaság az egyes réte- ∑ n j = a minta az egyes rétegek elem-
átlaga gek átlaga elemszáma száma a mintában

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 225 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 226 ►

Nj nj N =
wj = = Nj =
N n
= az egyes rétegek aránya a
∑N j
= a teljes az egyes rétegek elem-
sokság elemszáma száma az alapsokaságban
teljes sokaságban és a mintában
σx σj
= az átlag = az egyes
standard hibája rétegek szórása

Az arányosan rétegzett minta átlaga az egyes rétegek átlagának súlyo-


zott számtani átlaga, ahol a súlyként a rétegek alapsokaságbeli (= minta
sokaságbeli) arányát használjuk.

Vegyük észre, hogy


• a teljes sokaságra vonatkozó standardhiba közvetlenül a rétegek szórá-
sából számítható;

• továbbá, hogy a w jσ =2 ∑N σ j
2
j
= σ B szorzat nem más, mint
∑N
j
j

egy belső szórás (=a rétegek szórásának négyzetes átlaga). S mert a


belső szórás kisebb222 a teljes szórásnál, matematikai magyarázatot is
kapunk arra, hogy miért is kisebb a az arányos rétegzés hibája, mint az
egyszerű véletlen mintáé.
Természetesen, ha ismerni akarjuk a rétegek átlagához tartozó intervallu-
mok alsó és felső határait, akkor a szokásos módon kiszámíthatjuk az
egyes rétegek standard hibáit is, illetve, ha szükséges a teljes sokaság szórá-
sa is kiszámítható a rétegek szórásainak súlyozott négyzetes átlagaként,
ahol súlyként a rétegek teljes sokaságbeli arányát (= a minta sokaságbeli
arányát) használjuk.

222 Figyelembe véve a σ T = (σ K + σ B ) összefüggést, tudjuk, hogy σ B ≤ σ T , vagyis a


2 2

kétféle mintavétel szórása és így standard hibája legfeljebb azonos lehet, de többnyire a
rétegzett mintavételé a kisebb. (A teljes és a belső szórás abban az esetben azonos, ami-
kor tulajdonképpen feleslegesen rétegeztünk, mert az egyes rétegek átlagai megegyeznek
egymással és a főátlaggal is, amiből pedig az következik, hogy a külső szórás nulla, továb-
bá az is, hogy a rétegzéshez felhasznált megkülönböztető ismérv, nem befolyásolja a
rétegekre jellemző paraméterek alakulását.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 226 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 227 ►

Záró megjegyzés
Ha egyenletes rétegzéssel (ER) dolgozunk, akkor a teljes sokaságra
vonatkozó átlag becslése ugyanúgy történik, mint az AR esetében (= a
rétegek átlagának alapsokaságbeli aránnyal súlyozott átlaga), de a standard
hiba számításához a teljes szórást kell ismerni.

BEMUTATÓ FELADAT

A számtani átlag becslésénél bemutatott példa folytatása. A hallgatók szó-


rakozási kiadásának átlagát nemenkénti bontásban is kiszámoltuk. A becs-
lési valószínűség 95 %-os.223

10.10. sz. tábla


a hallgatók ará-
a teljesítmények
nya a teljes sok- a hallgatók átlaga
szórása
a hallgatók ságban és a
neme mintában
% ezer Ft

wj =
Nj
=
nj
xj =
∑fxi i
σj =
∑ f (x − x )
i i j
2

N n ∑f i ∑f i

férfi 61 ≅ 13.800 ≅ 4.010

nő 39 ≅ 10.200 ≅ 4.100

együtt 100 ≅ 12.400

A hallgatók átlagos teljesítményének standard hibája AR mintavétel:

σx =
1
n
∑w σ
j
2
j =
1
100
(
∗ 0,61∗ 4.010 2 + 0,39 ∗ 4.100 2 ≅
4045
)
≅ 405 Ft
100
A 95 %-os becslési valószínűség esetén – az előző feladatokban már kike-
resett – " z"− érték: 1,96

223Ha más valószínűséget választanánk, nem látnánk egyértelműen az EV és az AR


mintavételből adódó különbséget.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 227 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 228 ►

A becsült érték hibahatára:


± ∆ = z ∗ σ x = 1,96 ∗ 405 = 810 Ft

A hallgatók átlagos szórakozási kiadásának intervalluma:


[x a
[
± ∆ ] = 12.380 ± 810 ] ≅ [11.570〈 X 〈13.190] Ft
♥ 100 elemű AR minta alapján 95 %-os valószínűséggel állítjuk, hogy a
vizsgált egyetem hallgatóinak havi szórakozási kiadása legalább 11.570 és leg-
feljebb 13.190 Ft. Az intervallum szélessége = 2∆ = 2 ∗ 810 ≅ 1620 Ft (Emlé-
keztetőül az EV minta intervallumának szélessége = 2∆ = 2 ∗ 868 ≅ 1740 Ft.)
A hallgatók átlagos szórakozási kiadásaira vonatkozó intervallum számítá-
sa ER mintavétel esetén, lépésenként:

σ B = w jσ 2j = 0,61∗ 4.010 2 + 0,39 ∗ 4.100 2 ≅ 4.45 Ft

∑ w (x − x )
2

= 0,61(13.800 − 12.380 ) + 0,39(10.200 − 12.380 ) = 1.756 Ft


j j 2 2
σK =
∑w j

σ T = σ B2 + σ K2 = 4.045 2 + 1.756 2 = 4415 ≅ 4410 Ft


σT 4410
σx = = = 441 Ft
n 100
∆ = z ∗ σ x = 1,96 ∗ 441 = 864 Ft

[x ± ∆] = [12.380 ± 864] ≅ [11.510〈 X 〈13.240] Ft


♥ 100 elemű ER minta alapján 95 %-os valószínűséggel állítjuk, hogy
a vizsgált egyetem hallgatóinak havi szórakozási kiadása legalább 11.510 és
legfeljebb 13.240 Ft. Az intervallum szélessége = 2∆ = 2 ∗ 864 ≅ 1.730 Ft
(Emlékeztetőül az EV minta intervallumának (2∆ = 2 ∗ 868 ≅ 1.740 ) és az
AR intervallumának (2∆ = 2 ∗ 810 ≅ 1.620 ) szélessége Ft.
Összehasonlítva az intervallumszélességek (szórások, standardhibák,
hibahatárok):
AR 〈 ER 〈 EV

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 228 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 229 ►

A bemutató feladatban a háromféle mintavétel intervallumszélessége csak csekély eltérést mutat.


Ennek oka, hogy a két réteg (férfiak, nők) átlagos szórakozási kiadása és annak szórása is igen
hasonló. A hallgatók neme mindössze 15,9 %-ban befolyásolja a hallgatók szórakozási kiadá-
sát.224

10.3. Gyakorló feladatok

1. feladat

Mintavételes eljárással vizsgáljuk egy egyetemen különböző szakokon ta-


nuló diákjainak teljesítményét matematikából.
10.11. sz. tábla
a minta adatai:
villamos- gépész-
teljesítmény informatikus közgazdász
mérnökök mérnökök
% fő
- 50 30 20 34 35
51 – 60 20 20 68 88
61 – 70 10 15 34 88
71 – 80 10 10 22 35
81 – 90 6 3 11 28
91 – 4 2 11 6
összesen 80 70 180 280
1. Becsülje meg szakonként a hallgatók a teljesítményének átlagát!
2. Becsülje meg szakonként a hallgatók a teljesítményének szórását!
3. Feltételezzük, hogy a mintavétel egyenletes rétegzéssel történt, becsül-
je meg az egyetemi átlagot, ha a kiválasztási arány 4 %!
4. Feltételezzük, hogy a mintavétel arányos rétegzéssel történt, becsülje
meg az egyetemi átlagot, ha a kiválasztási arány 4 %!
5. Becsülje meg a villamosmérnök hallgatók esetében a 80 % feletti
teljesítmény nyújtók arányát és számát, ha a kiválasztási arány 4 %!

224 H 2 mutatót számítottunk. Ha szükséges, lapozzon az ismérvek közötti kapcsolatok


fejezethez (Stat. I.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 229 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 230 ►

6. Vegye alapul a gépészmérnök hallgatókra végzett átlagbecslés (P =95


%) eredményeit! Változzon a hibahatár kétszeresére, majd felére! Mi-
lyen valószínűség mellett (elemszám az eredeti) tudja garantálni az
adott intervallumszélességet? Hány elemű mintát kell venni (a való-
színűség az eredeti?
Ha szorgalmas, a fenti adatokból még egyéb becslési feladatokat is elvégezhet.
Minden becslési feladatot P = 90%, majd P = 95 %, végül P = 98 % való-
színűségen is végezzen el!

2. feladat

A háztartások villamosenergia-fogyasztásának vizsgálatára egyik megyénk-


ben 1,4 % -os ( n = 200) EV mintát vettek. A minta adatai:

10.12. sz. tábla


a háztartások aránya a min-
fogyasztás
tában
kWh %
– 80 5,0
81 – 100 12,5
101 – 120 20,0
121 – 160 22,5
161 – 200 20,0
201 – 300 12,5
301 – 7,5
összesen 100
1. Becsülje meg a háztartások átlagos villamosenergia-fogyasztását!
Egyoldalú és kétoldalú intervallumot is szerkesszen!
2. Becsülje meg a háztartások átlagos villamosenergia-fogyasztásának
szórását!
3. Becsülje meg az egyes fogyasztási kategóriákba (= osztályközökbe)
tartozó fogyasztók számát!
4. Becsülje meg az összes fogyasztást!
5. Milyen intervallumok adódnának az átlagra (a felsorolt valószínűsége-
ken), ha a minta 2,5 %-os kiválasztású lenne?

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 230 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 231 ►

Minden becslési feladatot P = 90%, majd P = 95 %, végül P = 98 %


valószínűségen is végezzen el!

3. feladat

Egy gazdaságban, ahol két fajta almát termesztenek, a 2000 almafa össz-
termését kívánják megbecsülni. A két fajtából arányosan vesznek mintát.
a fák száma minta
fajta db átlaga szórása
összesen minta kg /fa
A 1500 150 107 25
B 500 … 100 18
1. Becsülje meg egy almafa átlagtermését!
2. Becsülje meg a gazdaság teljes almatermését!
A becslések eredményeit 95 %-os megbízhatósági intervallumban akarjuk ismerni.

4. feladat

Egy régióban 6.000 lakás épült az elmúlt évben. Az újonnan épült lakások
közül 500 lakást választottunk ki rétegzett mintavétellel az átlagos kivitele-
zési idő becslésére. A minta adatai:
a kivitelezési idő a mintá-
az új lakások száma
ban
kivitelezés
a régióban a mintában átlaga szórása
db hó
vállalkozó által 4.000 250 15 5
egyéni 2.000 250 24 6
Becsülje meg 5 %-os megbízhatósági szinten az átlagos kivitelezési időt!
• a vállalkozói kivitelezésben épült lakásokra vonatkozóan,
• az egyéni kivitelezésben épült lakásokra vonatkozóan,
• az összes lakásra vonatkozóan!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 231 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 232 ►

10.4. Összefoglalás
= valamely alapsokasági jellemző meghatározása mintasokasági
becslés
adatok ismeretében
= az eredmény egyetlen szám-
1. pontbecslés
adat
fajtái: = az eredmény egy minimum
2. intervallumbecslés és egy maximum érték (tól –
ig)

egyszerű véletlen mintából225


történhet: egyenletes
rétegzett mintából
arányos

EV

a számtani átlag
becslőfüggvény:

f i xi
(a leggyakrabban hasz- xa = = ∑g x

i i
becslése f
nált formák) i

1. pontbecslés
2. standardhiba (= átlagos hiba)
lépések
3. hibahatár (= maximális hiba)
4. intervallum
σ s
standardhiba becslőfüggvény: σx = ≅
n n
becslőfüggvény: ∆ = z ∗ σ x vagy ∆ = t ∗ σ x
z-tábla ha n〉100 és σ = ismert
hibahatár t-tábla ha n〈100 vagy σ = nem ismert
szabadságfok
keresés a táblákban
valószínűség
= a becsléshez használt független elemek száma
szabadságfok
pl.: az átlagbecslésnél = (n-1)
– egyoldalú becslésnél átalakítás nél-
= adott feltétel
valószínűség kül,
– kétoldalú becslésnél átalakítással

225 Vannak egyéb mintavételi módok (többet fel is soroltunk), de számítási feladatokat
csak ezekre vonatkozóan mutattunk be.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 232 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 233 ►

[x ± ∆]
egyoldalú
intervallum
kétoldalú
[x − ∆;+∞ ) vagy
(− ∞; x + ∆]

becslőfüggvény:
∑ f (x − x ) ∑fd ≈
2 2
i i a i i
(a leggyakrab- s= = g i d i2
ban használt) ∑ f −1i ∑ f −1
i

szabadságfok (n-1)
a szórás
becslése
(n − 1)s 2 〈σ 2 〈 (n − 1)s 2
intervallum χ2α χ α2
1−
2 2
A négyzetgyökvonásról ne feledkezzünk meg!
χ 2 -tábla Két értéket kell kikeresni.

a sokasági arány becslőfüggvény: fk 1− fk


becslése p= , q= ,
n n
p + q =1
feltétel: alternatív ismérvekké f k = amire a vizsgálat
alakítás vonatkozik
n − f k = összes többi
lépések: ua. mint számtani átlag, de s= p∗q

az értékösszeg becs- kiindulás a számtani


lése átlag intervallumából
[X ′ ± ∆] = N ∗ [x ± ∆]

az alapsokasági
elemszám becslése
kiindulás a sokasági
arány intervallumából
[N j ]
± ∆ = N ∗ [ p ± ∆]

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 233 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 234 ►

a hibahatár képletét át kell rendezni n-re


adott hibahatárhoz elemszám 2
⎛ z ∗σ ⎞
(EV) n=⎜ ⎟
⎝ ∆ ⎠
a hibahatár képletét át kell rendezni z-re,
∆∗ n
z=
σ
adott hibahatárhoz valószínű-
majd kikeresni a z-hez tartozó valószínűséget,
ség (EV)
– ha egyoldalú a becslés, ez az eredmény
– ha kétoldalú a becslés, át kell alakítani
P = Φ (z ) − (1 − Φ (z ))

a standardhiba számításánál a képletben szereplő szó-


ER rást a külső, belső és teljes szórás megismert össze-
függése alapján számítjuk
a standardhiba számításánál a képletben szereplő szó-
rás = az un. belső szórás
AR
1
σx =
n
∑ w jσ 2j

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 234 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 235 ►

10.5. Mintapéldák korábbi vizsgadolgozatokból226

1. minta

80 véletlenszerűen kiválasztott lakótelepi lakás vízfogyasztását figyelték meg (m3


/ hónap / lakás). Az átlagos fogyasztás 12,4m3 3,7m3 szórás mellett. Végezzen
intervallumbecslést mindkét pontbecslés mellé (P = 98 %)! Fogalmazza meg
az átlagra vonatkozó adatok jelentését!
1. intervallum 2. intervallum

megfogalmazás

Ha az átlagra vonatkozó becslés estén ∆ = ±1,1 adódott volna, hány %-os


valószínűséggel tudná az eredményeket „garantálni”?
valószínűség
indoklás

Válaszoljon röviden! Milyen fajtái és milyen előnyei vannak a rétegzett


mintavételnek?
fajták
előnyök

2. minta

Egy konzervgyár zöldborsót exportál. A szabvány szerinti töltési tömeg 3000 g, 50 g


szórás mellett. Egy véletlenül kiválasztott napon a délelőtti és a délutáni műszakban is 30-
30 elemű EV mintát vettek. A minták adatai:

• délelőtt: átlagos töltési tömeg 3050 g, 52 g szórás mellett


• délután: átlagos töltési tömeg 2950 g, 49 g szórás mellett

226 Ahogy már az előző fejezetekben is utaltunk rá, a dolgozatíráskor a számításokhoz és


a szöveges válaszokhoz lényegesen több (= elegendő) hely áll majd rendelkezésére, mint
amennyit itt az üres rovatok jeleznek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 235 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 236 ►

P = 90 %

Számítsa ki, hány elemű mintát kellene venni (P = mint eddig), hogy az interval-
lum szélessége felére csökkenjen! A délelőtti műszak adataival dolgozzon!
Magyarázza meg a kapott eredményt!
Válaszoljon! Kaphat-e eltérő eredményt, ha a délutáni műszak adatival dolgozik.
(Ne számoljon, gondolkodjon!)

Számítsa ki, milyen valószínűséggel kellene dolgoznia (elemszám = az eredeti),


ha az intervallum szélességét duplájára akarná növelni! A délutáni műszak adatai-
val dolgozzon! Magyarázza meg a kapott eredményt!

3. minta

munka-
korcsoport
nélküliek
év fő
- 20 48
20 – 25 90
25 – 30 120
30 – 40 180
40 – 50 150
50 - 12
összesen 600

95 %-os valószínűség mellett adjon becslést a munkanélküliek átlagos életkorára


ill. annak szórására!
átlag

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 236 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 237 ►

szórás

98 %-os valószínűség mellett adjon becslést a 40 év feletti munkanélküliek ará-


nyára és létszámára, ha a kiválasztási arány 2 ezrelékes!
arány

létszám

Fogalmazza meg az előzőekben kiszámított adatok jelentését!


átlag + létszám

arány + létszám

4. minta

Az alábbi kijelentésekről döntse el, hogy igazak-e!


A kijelentések melletti üres oszlopba írjon I (= igaz) vagy H (= hamis) betűt!
kijelentések I/H
1. Reprezentatív felvétel esetén a megfigyelni kívánt sokságból
tetszés szerint veszünk mintát.
2. Reprezentatív adatgyűjtés esetén az alapsokaság elemeinek ösz-
szességére vonatkozik az adatgyűjtés.
3. Reprezentatív adatgyűjtés esetén a kapott eredményeket az alap-
sokaságra vonatkoztatjuk.
4. Reprezentatív adatgyűjtés esetén az alapsokaság akár 50 – 100
elemű is lehet.
5. A reprezentatív adatgyűjtés során nincs jelentősége annak, hogy
hány elemű mintát választunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 237 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 238 ►

6. A reprezentatív adatgyűjtéssel való vizsgálódást a matematika


fejlődése, konkrétan a valószínűségszámítás elméleti fejlődése
teszi lehetővé.
7. A mintából számított adatokat mindenféle megfontolás nélkül
vonatkoztathatjuk a teljes sokaságra.
8. A mintába került elemek számának meghatározásakor két ellen-
tétes igénynek (minél pontosabb eredmény, alacsony költéség)
kell eleget tennünk.

5. minta

Egy egyetemi szak hallgatóinak (EV) teljesítménye matematikából az első


zárthelyi dolgozat alapján:
villamos-
teljesítmény
mérnökök
% fő
- 50 30
51 – 60 20
61 – 70 10
71 – 80 10
81 – 90 6
91 – 4
összesen 80
1. Számítsa ki a hallgatók teljesítményének átlagát!
2. Számítsa ki a hallgatók teljesítményének szórását!
3. Mind az átlagot, mind a szórást határozza meg pont- és intervallum-
becsléssel (P = 95 %, kétoldalú becslés) is!
4. Fogalmazza meg mindkét intervallumbecslés eredményét!
A kiszámított adatokat és a számítás részeredményeit is írja az eredmény-
tábla megfelelő rovatába!
Minden részeredményt 3 tizedesig számítson, és 2 tizedesre kerekítve
használja tovább!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 238 ►


Statisztika Becslés
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 239 ►

Ha az eredmény-tábla valamely rovatába nem kerülhet adat, akkor ab-


ba tegyen egy vízszintes vonalat!
Ha olyan szabadságfokkal kell dolgoznia, amit nem talál meg a megfe-
lelő statisztikai táblában, akkor mindig FELFELÉ kerekítsen (= az adott
szabadságfok feletti adatnál keresgéljen a táblában).

eredmény-tábla
átlag szórás
pontbecslés

intervallumbecslés átlag szórás


standard hiba
valószínűség
(együtthatós formában)
szabadságfok
táblabeli érték
hibahatár
az intervallum alsó határa
az intervallum felső határa
az intervallum szélessége

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 239 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 240 ►

11. Hipotézisellenőrzés = statisztikai


próbák
A statisztikai becslések során a vizsgált sokaságok egy-egy jellemzőjének
megismerése érdekében a teljes sokaságból mintát veszünk. Ugyanakkor
mindig van egy előzetes feltevésünk (= hipotézisünk) is a vizsgált para-
méterre vonatkozóan. A két érték – a mintából származó és az előre meg-
adott – azonban nem feltétlenül azonos "számtani" értelemben227, ennek
ellenére a statisztikus még nyilatkozhat azok egyezőségéről.

A statisztikai egyezőség ugyanis azt jelenti, hogy a mintából származó ér-


ték benne van egy előre meghatározott, az előzetesen feltételezett érték
körül elhelyezkedő intervallumban (= konfidencia intervallum).

Feltevéseink nemcsak paraméterekre (átlag, arány stb.) vonatkozhatnak,


hanem a sokaságok eloszlására is. A hipotézisellenőrzés (= hipotézis-
vizsgálat = tesztelés) célja pedig az, hogy feltevéseink helyességéről meg-
győződjünk, vagy éppen azok elvetéséről döntsünk.
Az ellenőrzés során tehát a mintából számított statisztikai jellemzőket
egy korábbi teljes körű felvétel eredményeihez, az esetleg létező norma-
értékekhez, egy másik mintavétel eredményeihez hasonlítjuk. Ennek során
a kérdés mindig úgy merül fel, hogy az eredmények közötti számszerű
eltérést lényegesnek (= szignifikánsnak) tekintjük-e, vagy elhanyagolható
mértékűnek (= nem szignifikánsnak). Az összehasonlítás megoldásá-
ra szolgálnak a statisztikai próbák.
Fontos tudnunk, hogy a jegyzetünkben leírt ellenőrzési módszerek
mind a sokaság normális eloszlását feltételezik, amiről már ezen próbák
elvégzése előtt meg kell győződnünk. Erre szolgál az illeszkedésvizsgálat.

227 A mintabeli érték lehet kisebb és nagyobb is, azaz nincs szó a számadatok utolsó
tizedesjegyig való tökéletes azonosságáról.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 240 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 241 ►

11.1. A hipotézisellenőrzés alapfogalmai


A hipotézisellenőrzés első lépése feltevéseink matematikai formában való
megfogalmazása. Ha például azt akarjuk ellenőrizni, hogy egy cukorkát
csomagoló gép egy-egy zacskóba valóban a szabványban megadott meny-
nyiséget rakja-e, akkor egyszerű véletlen mintát veszünk egy véletlenül kivá-
lasztott időpontban. Majd a számítások (= átlagos töltősúlyra, ill. annak
szórására vonatkozó intervallumbecslés) befejezése után összehasonlítjuk a
mintából adódó átlagot ( = x a ) a szabványban előírt értékkel (= X 0 ) . Ha a
két érték megegyezik (= nincs szignifikáns eltérés), azaz a gép az előírások-
nak megfelelően dolgozik, akkor különbségük határértéke nulla.
Matematikai formában:
lim(X a − X 0 ) = 0

Az előbbiekben kifejtett gondolatból kiindulva kapjuk hipotézis-felírásunk


általános alakját, és ebből a felírásból adódik hipotézis neve:
nullhipotézis.
Az ellenőrzés során azonban soha nem elég egyetlen hipotézist felír-
nunk. Feltevéseinket (= nullhipotéziseinket) mindig egy ellenhipoté-
zissel, azaz alternatív hipotézissel szemben kell megfogalmaznunk,
méghozzá úgy, hogy a két feltevés megvalósulása tökéletesen kizárja
egymást.
Az alternatív hipotézis lehet egyoldalú és kétoldalú is, sőt megfo-
galmazhatunk konkrét ellenhipotézist is.
Statisztikai hipotézisek matematikai formában:
alternatív hipotézisek
nullhipotézis egyoldalú
kétoldalú konkrét228:
baloldali jobboldali
H 0 : xa = X 0 H 1 : xa ≠ X 0 H 1 : xa 〈 X 0 H 1 : xa 〉 X 0 H 1 : xa = X 2

228Jegyzetünkben ezzel a az esettel nem foglalkozunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 241 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 242 ►

A hipotézisek felírásában szereplő betűk jelentése:


xa =
H1 =
H0 = a mintából számított
az alternatív hipotézis
a nullhipotézis jele jele sokasági jellemző, itt
átlag
X0= X2 =
az előre megadott (feltételezett) sokasá- egy másik előre megadott (feltétele-
gi jellemző, itt átlag zett) sokasági jellemző, itt átlag
Azt, hogy a két állítás, azaz a nullhipotézis és az alternatív hipotézis közül
melyiket fogadjuk el, statisztikai próbákkal döntjük el.

A statisztikai próba során egy megfelelő próbafüggvény aktuális értéké-


nek és az ehhez alkalmas statisztikai tábla kikeresett értékének összehason-
lítása történik meg.

Ha kétoldalú alternatív hipotézist fogalmaztuk meg, akkor a nullhipotézist


abban az esetben fogadjuk el, illetve az alternatív hipotézist abban az eset-
ben vetjük el, ha a próbafüggvény abszolút értéke kisebb a megfelelő táb-
lából kikeresett értéknél.

A táblabeli érték kikeresése pedig éppen úgy történik, mint a kétoldalú


becslésnél.
Az elfogadás és elvetés szabálya megfogalmazható másképp is. A kike-
resett táblabeli érték ugyan pozitív előjelű, de mert a normális eloszlás
görbéje szimmetrikus, ez az érték két azonos abszolút nagyságú, de külön-
böző előjelű adatot jelent, ahogy a 11.1. sz. ábra is mutatja. Ez a két érték a
görbe alatt kijelöl egy tartományt [− z 〈 0〈+ z ] . Ezt a tartományt nevezzük
elfogadási tartománynak. A határokon kívül található részt pedig kriti-
kus tartománynak. Ha a megoldott próbafüggvény értéke az elfogadási
tartományba kerül, akkor a nullhipotézist fogadjuk el (és egyúttal elvetjük
az alternatív hipotézist), ha a próbafüggvény értéke a kritikus tartományba
kerül, akkor a nullhipotézist elvetjük (és egyúttal elfogadjuk az alternatív
hipotézist).

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 242 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 243 ►

11.1. ábra: elfogadási- és kritikus tartomány kétoldalú alternatív hipotézis


esetén

Ha az alternatív hipotézis H 1 : X a 〈 X 0 formájú, azaz egyoldali (baloldali),


akkor nullhipotézist abban az esetben fogadjuk el (és vetjük el az alternatív
hipotézist), ha a próbafüggvény előjeles értéke nagyobb ( − z ) értéknél,
azaz nagyobb az elfogadási tartomány alsó határánál (Ebben az esetben az
elfogadási tartomány felső határa a pozitív végtelen). Ellenkező esetben a
nullhipotézist vetjük el, és természetesen az alternatív hipotézist fogadjuk
el. (Lásd: 11.2.. sz. ábra)

11.2.. ábra:elfogadási- és kritikus (baloldali) tartomány egyoldalú alternatív


hipotézis esetén

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 243 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 244 ►

Ha az alternatív hipotézis H 1 : X a 〉 X 0 formájú, azaz egyoldali (jobboldali),


akkor a nullhipotézist abban az esetben fogadjuk el (és vetjük el az alternatív
hipotézist), ha a próbafüggvény előjeles értéke kisebb (+ z ) értéknél, azaz
kisebb az elfogadási tartomány felső határánál. (Az elfogadási tartomány
alsó határa a negatív végtelen). Ellenkező esetben a nullhipotézist vetjük el,
és természetesen az alternatív hipotézist fogadjuk el. (Lásd: 11.3.. sz. ábra)

11.3. ábra: elfogadási- és kritikus (jobboldali) tartomány egyoldalú


alternatív hipotézis esetén

A hipotézisvizsgálatok során, bármilyen pontosan is megtartjuk az előírá-


sokat mind a mintavételre, mind az ellenőrzésre vonatkozóan, hibákat
követhetünk el. Ezek a hibák abból adódnak, hogy nem ismerjük a teljes
sokaságot, így eredményeinket csak bizonyos valószínűség mellett tudjuk
elfogadni. Az elkövethető hibák fajtái:
• elsőfajú hiba ( = α ) ,
• másodfajú hiba ( = β )

Elsőfajú hibát akkor követünk el, ha a nullhipotézis helyes (= igaz), de a


próbafüggvény alapján mégis annak elvetése mellett döntünk.

Másodfajú hibát akkor követünk el, ha a nullhipotézis nem helyes (=


nem igaz), de a próbafüggvény alapján mégis annak elfogadása mellett
döntünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 244 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 245 ►

A hipotézisellenőrzés során elkövethető hibákat mutatja be az 11.4.. sz.


ábra és az 11.1 .sz. tábla foglalja össze.

11.1. sz. tábla


a H 0 -ban megfogal- a H 0 -ra vonatkozó döntés
mazott állítás elfogadjuk elvetjük
rossz döntés =
igaz helyes döntés
elsőfajú hiba
* 1−α α
rossz döntés =
nem igaz helyes döntés
másodfajú hiba
* β 1− β

* a döntések, illetve a hibák elkövetésének valószínűsége

11.4. ábra: a hipotézisellenőrzés során elkövethető hibák

A hibákat bemutató ábrából (11.4. sz.) és táblából (11.1. sz.) kiolvasható a


becslés valószínűségi követelménye és az elsőfajú hiba elkövetési valószí-
nűségének összefüggése. A becslés valószínűsége (= P ) a becsült sokasági
jellemző intervallumba kerülési valószínűségét adja meg, és ennek komp-
lementere (1 − P ) az intervallumon kívül esés valószínűségével egyenlő,
(hiszen a két esemény teljesen kizárja egymást), így együtt a biztos ese-
ményt jelentik. A hipotézisellenőrzés során pedig éppen akkor követjük el
az elsőfajú hibát, ha egy olyan nullhipotézist vetünk el, ami helyes, vagyis a

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 245 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 246 ►

sokasági jellemző az intervallumban van, de a próbafüggvény alapján még-


is azt állítjuk, hogy az intervallumon kívül helyezkedik el. Ebből az követ-
kezik, hogy az elsőfajú hiba elkövetési valószínűsége éppen egyenlő az
intervallumon kívül esés valószínűségével.
Az elsőfajú hiba elkövetésének valószínűsége
α = 1 − P (%) α = 1 − Ψ (z )

Az elsőfajú hiba elkövetési valószínűségének képletében szereplő betűk


jelentése
α = P =
a becslés valószínűségi követelménye (%)
az elsőfajú hiba elkövetési valószínűsége
Ψ (z ) =
(az első képletben %-os, a másodikban
együtthatós formájú) a becslés valószínűségi követelménye
együtthatós formában
Az elsőfajú hiba elkövetési valószínűségét szokás szignifikancia-
szintnek229 is nevezni.
Az első- és másodfajú hibával kapcsolatban fontos tudni, hogy azok
elkövetési valószínűsége ellenkező irányban változik.
Ha tehát mindent megteszünk annak érdekében, hogy az elsőfajú hiba elkövetésének
valószínűségét csökkentsük, akkor a másodfajú hiba elkövetésének valószínűsége – és ezt
nem akadályozhatjuk meg – növekedni fog. Illetve, ha a másodfajú hiba elkövetési való-
színűségét akarjuk mindenáron csökkenteni, akkor számolnunk kell az elsőfajú hiba elkö-
vetési valószínűségének növekedésével. A gyakorlati életben mindig a megoldandó prob-
léma sajátosságai, illetve a becslés célja dönti el, hogy melyik hiba elkövetése a nagyobb
baj, és ennek elkövetési valószínűségét igyekeznek korlátozni, természetesen úgy, hogy
semmiképpen ne emelkedjen túl magasra a másik hiba elkövetési valószínűsége sem.

Bonyolítja a helyzetet, hogy a két hiba elkövetési valószínűsége nem


számítható ki közvetlenül (például egyszerű kivonással) egymásból230.

229Szignifikáns = jelentőséggel bíró, valamit meghatározó, eldöntő; a hipotézis megen-


gedhető voltát igazoló, a feltevés helyességét valószínűsítő.
230A kérdés részletesebb tárgyalása nem képezi tananyagunk részét. Ez kérdéskör bőveb-
ben megismerhető az irodalomjegyzékben felsorolt szakkönyvekből.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 246 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 247 ►

11.2. A hipotézisellenőrzés menete


1. Megfogalmazzuk a nullhipotézist és vele szemben felállítjuk az al-
ternatív hipotézist.
2. Kiválasztjuk a megfelelő próbafüggvényt.

A próbafüggvény a mintaelemeknek egy olyan függvénye, amelynek el-


oszlása a nullhipotézis igazságát feltételezve pontosan ismert, a mintavétel
előtt azonban ennek értéke is valószínűségi változó.

A próbafüggvénynek több szempont szerint kell megfelelőnek lennie,


egyrészt a nullhipotézisben megfogalmazott állításnak, azaz nem minden
nullhipotézis ellenőrizhető azonos próbafüggvénnyel; másrészt a minta
eloszlás-típusának, valamint a mintavétel módjának is. Mi csak azokkal az
esetekkel foglalkozunk, amikor
• az alapsokasági elemek kiválasztása egyszerű véletlen módszerrel tör-
ténik,
• a kiválasztási arány kicsi, és
• így a minta jó közelítéssel függetlennek tekinthető.
3. Megválasztjuk az elsőfajú hiba elkövetésének valószínűségét, azaz
megadjuk a szignifikancia-szintet, figyelembe véve mindazt, amit ezzel
kapcsolatban elmondtunk.
4. A szignifikancia-szintnek és a szabadságfoknak (ahol van) megfele-
lően kijelöljük az elfogadási tartományt és a kritikus tartományt.
5. Végrehajtjuk a mintavételt, a mintából meghatározzuk azokat a so-
kasági jellemzőket, amelyek a vizsgálat céljának megvalósítása érdekében
szükségesek. Majd kiszámítjuk a kiválasztott próbafüggvények számszerű
értékeit.
Az ellenőrzési feladat gyakran már a mintára vonatkozó átlag ismeretében
merül fel. Természetesen ekkor nincs szükség az újbóli mintavételre.
6. Döntést hozunk a megfogalmazott H 0 és H 1 hipotézisekkel kap-
csolatban. Ha a próbafüggvény értéke az elfogadási tartományba esik, ak-
kor elfogadjuk a H 0 és elvetjük a H 1 hipotézist. Ha pedig a próbafügg-
vény értéke a kritikus tartományba esik, akkor fordítva döntünk, azaz el-
fogadjuk a H 1 és elvetjük a H 0 hipotézist.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 247 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 248 ►

11.3. Statisztikai próbák


A statisztika elmélet a próbákat több különféle szempont szerint csopor-
tosítja. Így többek között beszélhetünk:
• paraméteres és nem-paraméteres,
• egyoldali és kétoldali, illetve
• egymintás és kétmintás próbákról.
A paraméteres statisztikai próbákat csak meghatározott eloszlású soka-
ságok esetén használhatjuk, a nem-paraméteres próbákat, pedig bármely
eloszlás esetén. A próba egyoldalisága illetve kétoldalisága a felállított
alternatív hipotézis jellegétől függ. Az egymintás statisztikai próbák ese-
tén egyetlen mintavétel történik, és az ebből számított soksági jellemzőket
például valamilyen norma-értékhez hasonlítjuk, kétmintás próba esetén
viszont két mintavétel történik, azonos feltételek mellett (a minták elem-
száma azonban lehet különböző), és a két mintából számított sokasági
jellemzőket egymáshoz hasonlítjuk. Jegyzetünkben ezeket a csoportosítá-
sokat nem használjuk, hiszen csak néhány próba-fajtát ismertetünk.
Várható értékre irányuló próbák:
" z" -próba
Akkor alkalmazzuk, ha a mintából231 számított átlagot, értékösszeget, sok-
sági arányt akarjuk hasonlítani egy a mintától független értékhez (pl.: nor-
ma, szabvány, korábbi teljeskörű felmérés adata stb.), és ismert az alapso-
kaság szórása, azaz a próbafüggvényben szereplő szórás nem a mintából
származik. További feltétel, hogy n ≥ 100 . A hipotézissel kapcsolatos
döntéshez szükséges elméleti értéket a " z" -táblából keressük ki. A tábla-
beli érték kikeresésének módja attól függ, hogy az alternatív hipotézis egy-
avagy kétoldali.
A próba szabadságfoka = végtelen.

231A sokaságról feltételezzük – lásd a bevezetőben –, hogy normális eloszlású.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 248 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 249 ►

Elfogadási tartomány különböző ellenhipotézisek esetén:

H 1 : xa 〈 X 0 → [zα ; ∞[
⎡ ⎤
H 1 : xa ≠ X 0 → ⎢ z α ; z α ⎥
⎣ 2 2⎦
⎤ ⎤
H 1 : xa 〉 X 0 → ⎥ − ∞; z α ⎥
1−
⎦ 2 ⎦

egymintás " t" -próba


Akkor alkalmazzuk, ha a mintából számított átlagot, értékösszeget, soka-
sági arányt akarjuk hasonlítani egy a mintától független értékhez, de a
próbafüggvényben szereplő szórás is a mintából számítódott, ill. ha
n〈100 . Ez utóbbi ténynek az a következménye, hogy a próbafüggvény
értékét egy nem független változó (a mintáról mintára ingadozó átlag) is
befolyásolja, ezért szabadságfoka (= n − 1) . Így a döntéshez szükséges
értéket a " t" -táblából keressük ki attól függően, hogy milyen – egy- avagy
kétoldalú – ellenhipotézist állítottunk fel.
Elfogadási tartomány különböző ellenhipotézisek esetén:

H 1 : xa 〈 X 0 → [tα ; ∞[
⎡ ⎤
H 1 : xa ≠ X 0 → ⎢t α ; t α ⎥
⎣ 2 2⎦
⎤ ⎤
H 1 : xa 〉 X 0 → ⎥ − ∞; t α ⎥
1−
⎦ 2 ⎦

kétmintás " t" -próba


Ha két egymástól független mintavétel eredményeit akarjuk összehasonlí-
tani, akkor kétmintás próbákkal dolgozunk.
(Például két főiskola hallgatóinak átlagos tanulmányi eredményeit, két gép által cso-
magolt termékek átlagos töltősúlyát, két megyében a iskolás korú gyerekek arányát stb.).
Ezen próbák közül jegyzetünkben csak egyet tárgyalunk. A próba sza-
badságfoka a két minta elemszámától függ: (n1 + n2 − 2 ) 232. A döntéshez

232Mindkét mintában szerepel egy-egy nem független változó.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 249 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 250 ►

szükséges értéket most is a " t" -táblából keressük ki, az előzőekben már
részletezett módon233. A próbafüggvény használatánál – és ez a helyes
következtetések miatt nagyon fontos – nincs jelentősége annak, hogy me-
lyik mintát tekintjük "egyesnek" és melyiket "kettesnek".
A " t " -próba elnevezéssel még fogunk találkozni. Azonos nevű próbát végzünk majd
azonos táblából vett elméleti értékek felhasználásával, de más próbafüggény-képlettel a
regressziós egyenletek paramétereinek tesztelésekor (= a paraméterekkel kapcsolatos
hipotézisek ellenőrzésére) is.

F-próba
Alkalmazási esetei:
a) ha két minta szórásait akarjuk összehasonlítani, illetve
b) ha kettőnél több minta átlagainak azonosságáról akarunk meg-
győződni = variancianalízis
Az átlagok összehasonlítását természetesen páronként is megoldhatjuk, de háromnál
több minta esetén ez már – különösen számítógépi segítség nélkül – igen hosszadalmas
munkát jelentene.

a)
Ha két szórást hasonlítunk össze, akkor a próbafüggvény tört formájú, és
mind a nevezőjében, mind a számlálójában olyan statisztikai adat szerepel,
amely nem tökéletesen független valószínűségi változó, ezért a számláló-
nak (v1 = n1 − 1) és a nevezőnek (v2 = n2 − 1) a minták elemszámának
azonossága (eltérése) miatt azonos vagy eltérő a szabadságfoka. Így az
elméleti F-értékek felsorolására nem elég egyetlen tábla, mert annak mind
a fejrovatában – (v1 ) –, mind az oldalrovatában – ( v2 ) – szabadságfokok
szerepelnek. (A valószínűségeket pedig a tábla címében kell keresni.)
Az F-táblában való adatkeresés egyszerűsítése érdekében a próbafügg-
vény számlálójába mindig a nagyobbik szórás kerül. Ennek az a követ-
kezménye, hogy nem kell az elfogadási tartomány alsó határát kiszámíta-
nunk. A döntéshozatalnál elég arra figyelnünk, hogy a próbafüggvény
számszerű értéke nagyobb-e vagy kisebb-e a táblából kikeresett értéknél,
ha nagyobb, akkor a nullhipotézis ( H0 ) elvetése és az alternatív hipotézis
( H1 ) elfogadása mellett kell döntenünk, ha pedig kisebb, akkor éppen el-
lenkező döntést hozunk.

233 Elfogadási tartomány, mint az egymintás esetben.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 250 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 251 ►

b)
Amikor több minta átlagát hasonlítjuk össze, akkor varianciaanalízist
végzünk. Az F-táblában való keresésben különbséget jelent az, hogy a
kizárólag egyoldali ellenhipotézis miatt a megadott szignifikancia-szint
átalakítására soha nem kerül sor.
Felmerülhet a kérdés, miért használhatók a szórásokat az átlagok egye-
zőségének eldöntésére? Ha figyelembe vesszük az ismérvek közötti kap-
csolatokról tanultakat234, akkor erre a kérdésre könnyen válaszolhatunk.
Az egyes átlagok akkor térnek el egymástól és a főátlagtól lényegesen, ha a
megkülönböztető ismérvnek (ennek alapján képeztük a részsokságokat)
jelentős befolyásoló szerepe van (magas a külső szórás értéke, szoros kap-
csolatot jelez a H-mutató), ha pedig a megkülönbözető ismérvnek nincs
jelentős szerepe, akkor a részátlagok közel vannak egymáshoz (vagy meg-
egyeznek) illetve a főátlaghoz.
A próbafüggvény számlálójának (= a külső szórásnak) m − 1 a szabad-
ságfoka, a nevezőnek (= a belső szórásnak) pedig n-m. Az m − 1 szabad-
ságfokot a főátlag nem független jellege magyarázza, az n-m szabadságfo-
kot pedig a belső szórás számításánál felhasznált m darab nem független
minta-szórás felhasználása.
Az F-próba elnevezéssel jegyzetünkben még fogunk találkozni. Azonos nevű próbát
végzünk majd azonos táblából vett elméleti értékek felhasználásával, de más
próbafüggény-képlettel a regressziós egyenletek paramétereinek tesztelésére (= a paramé-
terekkel kapcsolatos hipotézisek ellenőrzésére).

χ 2 -próba.
Ezt a próbát több egészen különböző statisztikai jellemző ellenőrzésére
használhatjuk. Így
a) a mintabeli szórások és a teljes sokaságra vonatkozó szórások összeha-
sonlítására,
b) a sokságok eloszlásának tesztelésére (= illeszkedésvizsgálat) és
c) az ismérvek függetlenségének igazolására.
Az alkalmazott próbafüggvény, a próba szabadságfoka és a felírásra kerülő
hipotézisek a felhasználás céljától függően változnak, azonos viszont a

234Lásd: vegyes kapcsolat

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 251 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 252 ►

( )
tábla – "a χ 2 khí 2 eloszlású változó eloszlásának kvantilis értékei”, ahonnan
az elméleti értékeket kell kikeresni.235
a)
Ha egy mintából származó és egy mintától független szórást akarunk ösz-
szehasonlítani, akkor próba szabadságfoka: n − 1 .
Elfogadási tartomány különböző ellenhipotézisek esetén:

[
H 1 : s 〈σ 0 → χ α2 ( v ) ; ∞ [
⎡ ⎤
H 1 : s ≠ σ 0 → ⎢ χ α2 ; χ α2 ⎥
⎣ 2 (v) 2 (v) ⎦
⎤ ⎤
H 1 : s〉σ 0 → ⎥ − ∞; χ α2 ⎥
⎦ 2
(v)

b)
Az eloszlásvizsgálat célja azt ellenőrizni, hogy a annak a sokaságnak,
melyből az aktuális mintát vettük eloszlása illeszkedik-e valamilyen mate-
matikából ismert elméleti eloszlás-típusra, vagyis az ismérvértékek tapasz-
talati (= megfigyelt) előfordulásai ( fi ) azonosak-e azokkal az előfordulási
( fi ∗ ) adatokkal, amit a feltétezett eloszlás-típus elméleti adatai alapján szá-
míthatunk ki.
A nullhipotézis elfogadása itt azt jelenti, hogy a vizsgált sokság eloszlá-
sa illeszkedik a feltételezett matematikai eloszlás-típusra, az ellenhipotézis
elfogadása pedig ennek épp az ellenkezőjét (= nem illeszkedik).
A próba legtöbb számítási munkát igénylő része az elméleti előfordulások
( fi ∗ ) meghatározása. Ennek lépései, ha azt feltételezzük, hogy a sokaság
eloszlása a normális eloszlás elméleti görbéjére illeszkedik:

235Ennek bemutatására itt nincs szükség, ezt alkalmaztuk a szórások intervallumának


számításánál is.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 252 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 253 ►

3. az ismérvértékek átalakítása (= transzformációja) standard normá-


lis valószínűségi változóvá = " z" 236
a táblabeli értékek = Ψ( z ) kikeresése
a kikeresett értékek átalakítása az egyes osztályközökbe (= intervallumok-
ba) tartozó valószínűségi értékekké = p∗
A " z" -táblából kikeresett Ψ( z ) értékek átalakítására azért van szükség,
mert minden kikeresett érték a negatív vagy a pozitív végtelen és az adott
" z" érték közti intervallumra adja meg az előfordulás valószínűségét, a
tapasztalati előfordulások azonban egy-egy osztályközre vonatkoznak. Az
összehasonlításhoz tehát az elméleti előfordulásoknak is egy-egy osztály-
közre kell vonatkozniuk. Ez az átalakítás, ha a transzformált ismérvérték
(= " z" ) negatív, akkor két lépésben történik; ha azonban a transzformált
ismérvérték pozitív előjelű, akkor csak egy lépésre van szükség. A negatív
transzformált ismérvérték esetén először a kikeresett valószínűség komp-
lementerét 1 − Ψ( z) kell kiszámítani. A második lépésben – és ez mind a
negatív, mind a pozitív " z" esetében szükséges tennivaló – az átfedéseket
szüntetjük meg. Ezek után kezdhetjük el a próbafüggvényben szereplő
( )
elméleti előfordulások f i ∗ kiszámítását, illetve a próbafüggvény érté-
kének meghatározását, majd következhet a döntéshozatal.
Az illeszkedésvizsgálatnak – és ez a próba szabadságfokának meghatá-
rozása miatt is fontos – két típusát különböztetjük meg:
• tiszta illeszkedésvizsgálat és
• becsléses illeszkedésvizsgálat.
Tiszta illeszkedésvizsgálatról akkor beszélünk, ha az ismérvértékek
átalakításakor nem a mintából számított átlagot és szórást használjuk, ha-
nem a teljes sokaságra vonatkozó adatokat. Becsléses illeszkedésvizsgá-
latról akkor beszélünk, ha az átalakításnál használt szórás és /vagy/ átlag a
mintából származik.
A szabadságfok meghatározása ennél a próbánál nem a minta elemei-
nek számából indul ki, hanem az osztályközök darabszámából. Ugyanis
egyetlen mintába került elem osztályközbe sorolása sem maradhat el, ezért
ha valamelyik elem sem az első, sem a második stb. osztályközbe nem illik
bele, akkor az utolsóba "kénytelenek" vagyunk besorolni, vagyis itt már

236Az átalakítás képletét lásd: a becslés fejezet bevezetőjében.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 253 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 254 ►

nincs szabad döntési lehetőségünk, a függetlenség megsérült. (Ezért is


gyakori, hogy a szélső osztályközök nyitottak.) A szabadságfok tehát:
• tiszta illeszkedésvizsgálat esetén: k − 1
• becsléses illeszkedésvizsgálat esetén: k − 1 − r .
(Ahol k = az osztályközök száma; r = 1, ha csak az átlag vagy csak a szó-
rás származik a mintából, és r = 2 , ha mind az átlag, mind a szórás a min-
tából ismert.)
Az illeszkedés vizsgálatot végezni nagyon kevés elemszámú minta ese-
tén tilos, mert hamis eredményre juthatunk. Ezért az alkalmazás minimum
feltételei:
• legalább öt osztályköz,
• osztályközönként legalább öt elem.
Ha az egyes osztályközökben ötnél kevesebb elem található, de az osztály-
közök száma több mint öt, akkor élhetünk az összevonás lehetőségével. A
próbát ugyanis nem csak azonos hosszúságú osztályközökre bontott soka-
sággal szabad elvégezni.
Az illeszkedésvizsgálat mindig valamilyen konkrét ismérv alapján tör-
ténik, ebből következik, hogy ha ugyanazt a sokaságot egy másik ismérv
alapján is felosztjuk, akkor az illeszkedésvizsgálatot újból el kell végezni.
Az illeszkedésvizsgálat próbafüggvényének számított értékét a már is-
mert χ 2 -táblából kikeresett elméleti értékhez hasonlítjuk. A táblabeli érték
nagysága függ a szabadságfoktól és a szignifikancia-szinttől. A megadott α
érték alapján a tábla 1 − α feliratú oszlopából választjuk ki a megfelelő
adatot. A valószínűségek átalakítására, a próba egyoldalisága miatt, nem
kerül sor.
Fontos gyakorlati kérdés. A sokaságok elemeinek osztályközökbe soro-
lásánál egyes esetekben a legutolsó osztályköz nyitott, azaz felső határa el-
méletileg a végtelen, más esetekben viszont az osztályköz felső határa adott.
Ez a "lezárás" lehetetlenné teszi, hogy a ∑ pi∗ = 1 szabály (= a valószínűsé-
gek összege = a megoszlási viszonyszámok összege = 1, azaz 100 % ) telje-
süljön. Ezért akkor is, ha osztályköz felülről lezárt, felső határát végtelennek
tekintjük, az ehhez tartozó valószínűsége pedig 1, azaz a biztos esemény.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 254 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 255 ►

c)
A függetlenségvizsgálat segítségével az asszociáció237 mutatóinak igaz-
ságtartalmát lehet ellenőrzi. Nullhipotézise a függetlenséget, alternatív
hipotézise pedig az összefüggést feltételezi.
Próbafüggvénye gyakorlatilag megegyezik238 az illeszkedésvizsgálat
próbafüggvényével. Eltérő viszont az elméleti előfordulások kiszámítá-
sa.239 A próba szabadságfoka a két ismérv ismérvváltozatainak számából
határozható meg: v = ( s − 1)(t − 1)
A próba során a szabadságfok és az előre megadott szignifikancia-szint
( ) alapján a χ 2 -táblából az 1 − α feliratú oszlopban kell a megfelelő
α
elméleti értéket kikeresni. A valószínűségek átalakítására, a próba egyol-
dalisága miatt, ebben az esetben sem kerül sor.
A próba "érdekessége" – az eddig tárgyalt összes próbához hasonlítva
–, hogy tulajdonképpeni cél a kapcsolat kimutatása és annak ellenőrzése,
ez mégis az ellenhipotézisben kerül megfogalmazásra.
A felsorolt próbák függvényei:
" z" -próbamegjegyzés a tábla kétmintás "t" -
egymintás "t" -próba
alatt próba
xa − X 0 xa − X 0 xa − X 0 xa − X 0 x1 − x2
z= = t= = t=
σx σ sx s 1 1
sd ∗ +
n n n1 n2

Megjegyzés: A " z" -próba próbafüggvényét a számtani átlag ellenőrzését feltételezve


adtuk meg, de értelemszerűen a számlálóban szerepelhet P = a mintából számolt soka-
sági arány és P0 = a "kívülről" megadott arány, illetve a nevezőben az ehhez tartozó
szórásból számítva a sokasági arány standard hibája stb. (Megjegyzésünk érvényes az
egymintás- és a kétmintás t-próbára, a szórások összehasonlítására szolgáló próbákra és a
variancia-analízisra is.)

237Lásd: ismérvek közötti kapcsolat, Csuprov-, Cramer, Yule mutatók.


238 A különbség csupán annyi, hogy a tapasztalati és az elméleti előfordulások betűjelé-
nek futóindexében mindig két betű szerepel. Emlékezzen, az adatokat kombinációs táb-
lába rendeztük!
239 Lásd: a felsorolt mutatóknál.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 255 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 256 ►

" F " -próba


" F " -próba a kétmintás "t" -próbában
szórások össze-
varianciaanalízis szereplő szórás számítása
hasonlítására
SK
s2
F = 12 F=
vK
sd =
(n1 − 1)s12 + (n2 − 1)s2 2
s2 SB n1 + n2 − 2
vB

" χ 2 " -próba


" χ 2 " -próba " χ 2 " -próba
szórások összeha-
illeszkedésvizsgálat függetlenségvizsgálat
sonlítására

(f − f i∗ )
2

χ = ∑∑
(f − f ij∗ )
2

χ2 = ∑
i 2 ij

χ 2
=
(n − 1)s 2 f i∗ f ij∗
σ2 f i. ∗ f . j
f i∗ = p∗ ∗ n f ij∗ =
n

A próbafüggvényekben szereplő betűk jelentése:


σ
σx = =
X0= n
xa =
az előre megadott (felté- a mintától független –
a mintából számított soka-
telezett) sokasági jellem- megadott –szórásból és
sági jellemző, itt átlag a minta elemszámából
ző, itt átlag
számított standard hiba
s = σ =
n =
a minta szórása a mintától független –
a minta elemszáma
megadott – szórás
sx =
n1 és n2 = s1 és s2 =
a két minta elemszáma a két minta szórása, a minta szórásból és
ahol s1 〉 s2 elemszámából számí-
tott standard hiba
v K = (m − 1) és sd
x1 , x2 = v B = (n − m ) = a két minta szórásának
a két minta átlaga szabadságfokok négyzetes átlaga, az aláb-
(varianciaanal.) bi képlet alapján számítva

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 256 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 257 ►

fi = f ij = SK =
tapasztalati előfordulá- tapasztalati előfordulások, a részátlagok és főátlag
sok, ∑ fi = n ∑∑ f ij =n súlyozott eltérésnégy-
(illeszkedésvizsg.) (függetlenségvizsg.) zeteinek összege

fi = elméleti előfordu- f ij∗ = elméleti előfordulá- SB =
lások, sok, az egyes minták szó-
∑f i

=n ∑∑ f ∗
ij =n rásnégyzeteinek súlyo-
(illeszkedésvizsg.) zott összege
(függetlenségvizsg.)
f i. és f . j =

p = peremgyakoriságok = a m=
elméleti valószínűség ≈ kombinációs tábla sorainak a független minták
elméleti megoszlási vi- ill. oszlopainak összesen darabszáma
szonyszám adatai(függetlenségvizsg.)

BEMUTATÓ FELADATOK

11.3.1. " z" -próba


Folytatjuk a számtani átlag becslésénél megkezdett példánkat.240
Egy egyetem hallgatóinak köréből egyszerű véletlen mintát vettünk (n =
100 fő, a kiválasztási arány =1,6 %). Célunk a hallgatók szórakozási kiadá-
sainak vizsgálata volt. A megfigyelt és rendezett adatokat a 11.2. sz. tábla
tartalmazza. A minta átlaga ≅12.380 Ft, ≅4.430 Ft szórás mellett.

240 Lásd: 10. fejezet

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 257 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 258 ►

11.2.sz. tábla
szórakozási osztály- a hallgatók száma a
kiadás közép mintában
ezer Ft / hó /fő xi fi
– 5,0 3,5 6
5,1 – 8,0 6,5 10
8,1 – 11,0 9,5 18
11,1 – 14,0 12,5 35
14,1 – 17,0 15,5 15
17,1 – 20,0 18,5 11
20,0 – 21,5 5
összesen – 100
adatforrás: saját gyűjtés SZE, 2006. márc.

Egy korábbi teljes körű adatgyűjtésből ismert, hogy a hallgatók szórakozá-


si kiadásainak átlaga 11.000 Ft (= X 0 ) 4.000 Ft szórás (= σ 0 ) mellett. A két
átlag számszaki eltérése miatt felmerül a kérdés, valódi változás történt-e,
magasabbak lettek-e a hallgatók szórakozási kiadásai. A választ 5 %-os
szignifikancia szinten kell megadni.
Kövessük a hipotézisellenőrzés felvázolt műveleti sorrendjét!241

1. A hipotézisek megfogalmazása:
változat nullhipotézis alternatív hipotézis próba
a H 0 : X a = 11.000 Ft H 1 : X a ≠ 11.000 Ft kétoldalú
egyoldalú
b H 0 : X a = 11.000 Ft H 1 : X a 〉11.000 Ft
(jobb)
A gyakorlati munka során általában nem fogalmaznak meg több hipotézist, itt a bemuta-
tás kedvéért szerepel a két különböző lehetőség. (A harmadik lehetőséget – baloldali – fel
sem írtuk, nevetséges lenne azt állítani, hogy a 12.380 Ft kisebb a 11.000 Ft-nál.)

241 Lásd: 11.2.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 258 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 259 ►

2. A próbafüggvény kiválasztása:
Erre most nincsen szükség, hiszen a bemutatásra kerülő próbafüggvény-
hez készítettünk példát.
3. A szignifikanciaszint kijelölése:
A szignifikancia-szintet a feladat megadta: α = 5% → 0,05 .
Ez az általánosan használt szignifikancia-szint, ezért ha valamelyik feladatban nem szere-
pel valószínűségre vonatkozó előírás, akkor ezzel az értékkel szokás számolni.

4. Az elfogadási és a kritikus tartomány kijelölése:


A tartományok határainak kijelölése a "z" -tábla segítségével történik. A
megadott szignifikancia-szintből kiindulva meg határozzuk azokat a való-
színűségeket / (Ψ (z )) vagy (Φ (z )) /, amelyeknél kikeressük a táblából a tar-
tományok határait jelentő " z" -értéket. A tartományok határai attól függ-
nek, hogy egyoldali vagy kétoldali próbát végzünk-e. Kétoldali próba esetén
a kritikus tartomány két részre oszlik és az elfogadási tartomány bal illetve
jobb oldalán helyezkedik el (11.1. sz. ábra), ezért az intervallumbecslésnél
leírt módon átalakítjuk az (1 − α ) = Ψ (z ) valószínűséget, és Φ (z ) = 0,975
értéknél keressük ki a döntéshez szükséges " z" -értéket, ami 1,96.
Ha egyoldali próbát végzünk, akkor a kritikus tartomány egésze az el-
fogadási tartomány egyik vagy másik oldalán helyezkedik el. Tehát nincs
szükség az (1 − α ) = Ψ (z ) valószínűség átalakítására, azaz a Ψ (z ) = 0,95 va-
lószínűséghez tartozó " z" -értéket kell kikeresnünk, ami 1,65.
A keresett tartományok határai242
változat elfogadási tartománya kritikus tartomány

[− 1,96 ↔ +1,96] [− ∞ → −1,96] és


a)
[+ 1,96 → +∞]
b) [− ∞ ↔ +1,65] [+ 1,65 → +∞]

242 Ha a hipotéziseket még a mintavétel és az abból történt számítás előtt írjuk fel, akkor
előfordulhat, hogy a szórakozási kiadások csökkenését feltételezzük, vagyis baloldali
alternatív hipotézist írunk fel. Ebben az esetben a tartományok így alakultak volna: elfo-
gadási = [− 1,65 ↔ +∞ ] ; kritikus [− ∞ → −1,65] .

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 259 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 260 ►

5. A próbafüggvény számszerű értékének meghatározása:

xa − X 0 12.380 − 11.000
z= = ≅ 3,45
σx 4.000
100

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről:


A döntések adatai
változat alternatív hipotézis H0 H1
a) H 1 : xa ≠ 11.000 Ft elvetve elfogadva
b) H 1 : xa 〉11.000 Ft elvetve elfogadva

a)
Mivel a próbafüggvény számszerű értéke (3,45) az elfogadási tartomá-
nyon kívül esik, illetve úgy is fogalmazhatunk, hogy a próbafüggvény érté-
ke nagyobb a táblabeli értéknél 3,45〉1,96 ezért a nullhipotézist elvetjük és
egyúttal az alternatív hipotézist elfogadjuk. Azaz
♥ a 100 elemű EV minta alapján 5 %-os szignifikancia-szinten állítjuk,
hogy a hallgatók havi szórakozási kiadásainak átlaga nem azonos a korábbi
teljeskörű felvétel eredményével. Úgy is fogalmazhatunk, hogy szignifikáns
különbség van a két adat között.
b)
Mivel a próbafüggvény számszerű értéke (3,45) a kritikus tartományba esik,
így döntésünk az a) változatnál leírttal teljesen azonos, de kicsit másképp fo-
galmazhatunk. Az alternatív hipotézis felírási módjából, ui. egyértelmű, hogy
♥ a 100 elemű EV minta alapján 5 %-os szignifikancia-szinten állítjuk,
hogy a hallgatók havi szórakozási kiadásainak átlaga az eltelt időszakban
növekedett, nagyobb a korábbi teljeskörű felvétel eredményénél.
Felmerülhet a kérdés, van-e olyan szignifikancia-szint, ami mellett nem
vetjük el a nullhipiotézist? Vegyük elő az eddig is használt táblát, és keres-
sük meg a próbafüggvény eredményénél már nagyobb „z” értékhez tarto-
zó Φ ( z ) értéket! Ha z = 3,46 , akkor Φ ( z ) = 0,9997 . Ha egyoldalú ellen-
hipotézissel dolgoztunk, akkor már ismert is a válasz, α = 0,03% . Ha
azonban kétoldalú ellenhipotézissel dolgoztunk, akkor még el kell végezni

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 260 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 261 ►

a szokásos átalakítást243, így α = 0,06% . (Azaz nagyobb az elsőfajú hiba


elkövetésének valószínűsége.)

11.3.2. Egymintás " t " -próba


Ismét a számtani átlag becslésénél megkezdett – és a z-próbával továbbvitt
– példával dolgozunk. Legyen most a minta elemszáma 50 (= n2 ) , és téte-
lezzük föl, hogy csak a minta szórását (s = 4.430 ) ismerjük. Természete-
sen most is rendelkezésünkre áll a korábbi teljes körű felvétel átlaga
X 0 = 11.000 , és megválaszolandó kérdéseink is ugyanazok. Történt-e
igazi változás, vagy csak a véletlennek – a véletlen mintának – köszönthető
a nem tökéletes számszaki egyezés?
Ismét kövessük a hipotézisellenőrzés felvázolt műveleti sorrendjét! Az elő-
ző részletességtől azonban eltekintünk, a megoldást rövidítve mutatjuk be.244

1. A hipotézisek megfogalmazása:
változat nullhipotézis alternatív hipotézis próba
a) H 0 : X a = 11.000 Ft H 1 : xa ≠ 11.000 Ft kétoldali
b) H 0 : X a = 11.000 Ft H 1 : xa 〉11.000 Ft jobboldali

4. Az elfogadási és a kritikus tartomány kijelölése:


A tartományok határainak kijelöléséhez szükséges értékeket a " t" -táblából
keressük ki. A szabadságfok v = (n − 1) = 49 . A valószínűségek értéke
pedig ismét attól függ, hogy egyoldali t 049,95 = 1,67 vagy kétoldali
t 049,975 = 2,00 becslést végzünk.
A táblában a 49-es szabadságfokot nem találjuk meg, így az adatot a v = 60 sorból
vettük. Egyúttal ismerkedjünk meg a táblabeli értékek szokásos jelölésével! A kitevőben a
szabadságfokot, az alsó futóindexben pedig a valószínűségi értéket találjuk.

243 Lásd: 10.2.5.


244A műveletek sorszámát azonban megtartottuk, ezért követi az 1. sz. lépést a 4. sz.
lépés! (A további példákban is így teszünk.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 261 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 262 ►

Így az egyes hipotézis-változatokhoz tartozó tartományok a következők:


változa- elfogadási tar-
H1 kritikus tartomány
tok tomány
[− ∞ → −2] és
a) H 1 : xa ≠ 11.000 Ft [− 2 ↔ +2]
[+ 2 → +∞]
b) H 1 : xa 〉11.000 Ft [− ∞ ↔ +1,67] [+ 1,67 → +∞]

5. A próbafüggvény számszerű értékének meghatározása:


X a − X 0 12.380 − 11.000
t= = = 2,2
sx 4.430
50
Annak következtében, hogy a minta elemszáma kisebb (n1 = 100 〉 n2 = 50 ) , a nevező
értéke nagyobb, ezért lesz a próbafüggvény számszerű értéke (3,45〉 2,2 ) kisebb, mint a
z-próbánál.

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről:


A döntések adatai
változat alternatív hipotézis H0 H1
a) H 1 : xa ≠ 11.000 Ft elvetve elfogadva
b) H 1 : xa 〉11.000 Ft elvetve elfogadva

A következtetés mindkét változat esetén azonos a " z" -próbánál megho-


zott döntéssel, a próbafüggvény számított értéke ugyanis most sem része
az elfogadási tartománynak, azaz
♥ az 50 elemű egyszerű véletlen minta alapján 5 %-os szignifikancia-
szinten állítjuk, hogy a hallgatók havi szórakozási kiadásainak átlaga az
eltelt időszakban növekedett, nagyobb a korábbi teljeskörű felvételkor
megállapított értéknél.
Ha egy átlagra (arányra stb.) vonatkozó ellenőrzést " t " -próbával kell el-
végeznünk nagyon fontos szem előtt tartanunk azt a szabályt, hogy a
vizsgálatot a szórások ellenőrzésével kell kezdenünk (feltéve, ha a
teljes sokaságra vonatkozóan ismerjük a mintától független szórást). Abban
az esetben, ha a szórásokra vonatkozó egyezőségi ( H0 : s = σ ) hipotézist

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 262 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 263 ►

elvetjük az adott szignifikancia-szinten, akkor az ellenőrzendő paraméterek


összehasonlítását már el sem kell végeznünk. Azok az átlagok (arányok
stb.) ugyanis, melyekhez nem azonos szórás tartozik nem egyformán jel-
lemzik a sokságot, tehát semmiképpen nem tekinthetők azonosnak.
11.3.3. Kétmintás " t " -próba
Az adatok egyik részét ismét az átlagbecslésnél megoldott, és azóta több-
ször is szereplő példából vesszük. Ez tekintjük most "egyes" mintának,
ahol a szórakozási kiadások átlaga 12.380 Ft (= x1 ) 4.430 ( = s1 ) szórás
mellett, a minta elemeinek száma pedig: 100 (n1 ) . A mintavételt egy másik
egyetemen is elvégeztük 50 ( = n2 ) főt kiválasztva. Ott a szórakozási ki-
adások átlagára 13.600 Ft-os becsült érték adódott (= x2 ) 4.800 Ft ( = s2 )
szórás mellett.
Az adatok összehasonlítását a következőkben három különböző
szignifikancia-szinten is elvégezzük egyoldalú és kétoldalú ellenhipotézis-
sel szemben is.
Az ellenőrzést a megismert szabály szerint a szórások azonosságának vagy eltérősé-
gének megállapításával kellene kezdenünk, ettől most eltekintünk, de a kérdésre még
visszatérünk.

Kövessük a hipotézisellenőrzés már megismert és az előzőekben is alkal-


mazott műveleti sorrendjét (ismét rövidítve)!
1. A hipotézisek megfogalmazása:
változat nullhipotézis alternatív hipotézis próba
a)
H 0 : x1 = X 2 H 1 : x1 ≠ x2 kétoldalú

b) H 0 : x1 = x2 H 1 : x1 〈 x2 baloldali

4. Az elfogadási és a kritikus tartomány kijelölése:


A tartományok határainak kijelöléséhez szükséges értékeket a " t " -táblából
keressük ki. A szabadságfok = 148 = (n1 + n2 − 2 ) . A valószínűségek érté-
ke pedig most is attól függ, hogy egyoldali vagy kétoldali becslést végzünk.
148
Így kétoldali próba esetén t 0,975 = 1,96 , egyoldali próba esetén pedig
t 0148
, 95 = 1,65 a táblából kikeresett érték.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 263 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 264 ►

A táblában a 148-as szabadságfokot nem találjuk meg, így az adatot a


v = ∞ sorból vettük.

Így az egyes hipotézis-változatokhoz tartozó tartományok a következők:


α = 5%
elfogadási tarto-
változat H1 kritikus tartomány
mány
a) x1 ≠ x2 [−1,96 ↔ +1,96] [−∞ → −1,96] és [+1,96 → +∞]
b) x1 〈 x2 [−1,65 ↔ +∞] [−∞ → −1,65]
α = 5%
a) x1 ≠ x2 [− 1,65 ↔ +1,65] [− ∞ → −1,65] és [+ 1,65 → +∞]
b) x1 〈 x2 [− 1,28 ↔ +∞] [− ∞ → −1,28]
A tábla a következő oldalon folytatódik.

α = 1,0%
a) x1 ≠ x2 [− 2,58 ↔ +2,58] [− ∞ → −2,58] és [+ 2,58 → +∞]
b) x1 〈 x2 [− 2,33 ↔ +∞] [− ∞ → −2,33]
5. A próbafüggvény számszerű értékének meghatározása:

x1 − x2 12.380 − 13.600
t= = ≅ −1,58 , ahol
1 1 1 1
sd ∗ + 4456 ∗ +
n1 n2 100 50

sd =
(n1 − 1)s12 + (n2 − 1)s 2 2 =
(100 − 1)4.430 2 + (50 − 1)4.800 2 ≅ 4.456 Ft
n1 + n2 − 2 148

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 264 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 265 ►

A döntések adatai
α = 5%
alternatív hipoté-
változat H0 H1
zis
a) H 1 : x1 ≠ x2 elfogadva elvetve
b) H 1 : x1 〈 x2 elfogadva elvetve
α = 10%
a) H 1 : x1 ≠ x2 elfogadva elvetve
b) H 1 : x1 〈 x2 elvetve elfogadva
α = 1,0%
a) H 1 : x1 ≠ x2 elfogadva elvetve
b) H 1 : x1 〈 x2 elfogadva elvetve

♥ A két – 100 ill. 50 elemű – minta alapján 5 és 1 % os szignifikancia-


szinten is, mind az egy-, mind a kétoldalú alternatív hipotézissel szemben
a nullhipotézis elfogadása mellett döntöttünk, azaz a két egyetem hallgató-
inak havi szórakozási kiadásai nem térnek el egymástól jelentős mérték-
ben. A 10 %-os szignifikancia-szinten azonban már eltérést tapasztalunk
az egyoldali ellenhipotézis alapján.

Nagyon fontos tehát, hogy egy-egy ellenőrzés során alapos körültekintés-


sel válasszunk szignifikancia-szintet, és fogalmazzuk meg alternatív hipo-
tézist.

11.3.4. F-próba

Két mintából számított szórás összehasonlítása


A kétmintás " t " -próbánál közöltük azt a szabályt, hogy az átlagokra felállí-
tott hipotézisek ellenőrzését meg kell előzze a szórásokra vonatkozó hipo-
tézisek tesztelése. Végezzük el most az ott közölt két minta szórásainak
összehasonlítására az F-próbát! Tekintettel arra, hogy az átlagok összeha-
sonlíthatósága csak a szórások egyezősége esetén lehetséges nincs értelme
az egyoldali ellenhipotéziseknek.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 265 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 266 ►

1. A hipotézisek megfogalmazása:
Ho H1 a próba
s1 = s2 s1 ≠ s2 kétoldalú

4. Az elfogadási és a kritikus tartomány kijelölése:


Ha α = 5 %-os szignifikancia szinten dolgozunk, akkor azt az F-táblát kell
használnunk, amelyik felett ezt olvassuk: 1 − α = 0, 975 . A számláló sza-
badságfoka (itt szerepel a második minta szórása): 49, a nevezőé (itt szere-
pel az első minta szórása) pedig 99. Így az elméleti érték: F049,975
, 99
= 1,53 .
A táblákban nem szereplő 49-es és 99-es szabadságfokok helyett a 60-
as és a 120-as szabadságfokokhoz tartozó értékeket olvastuk le.

5. A próbafüggvény számszerű értékének meghatározása:

s12 4.800 2
F= = = 1,17
s 22 4.430 2

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről.


Ennél a próbánál elég megvizsgálnunk – ahogy ezt már jeleztük – a tábla-
beli érték és a próbafüggvény számszerű értékének nagyságrendi relációját:
számított (1,17) 〈 táblabeli (1,53)
Az alternatív hipotézist elvetjük és ezzel szemben a nullhipotézist elfogad-
juk, azaz
♥ 5 %-os szignifikanci-szinten állítjuk, hogy a két minta szórása azo-
nos; vagy így is fogalmazhatunk, a szórások között nincs szignifikáns
különbség.
Variancia-analízis
Egészítsük ki a két minta átlagát (= a hallgatók szórakozási kiadásai) ösz-
szehasonlító példát újabb mintákból vett adatokkal! Döntsük el, van-e
lényeges különbség az egyes mintákból számított átlagok között!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 266 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 267 ►

11.3. sz. tábla


elemszám átlag szórás
sorszám
db Ft Ft
1. 100 12.380 4.430
2. 50 13.600 4.800
3. 65 14.500 5.200
4. 30 15.300 5.100
5. 70 11.500 3.600

1. A hipotézisek megfogalmazása az aktuális feladattól függetlenül


mindig azonos:
H 0 : x1 = x2 = x3 = ..... = xm = X

H 1 : xi ≠ x j

Szavakkal megfogalmazva,
A nullhipotézis szerint valamennyi minta átlaga – természetesen csak
az adott szignifikancia-szinten – azonos és egyben megegyezik az átlagok
átlagával, a főátlaggal.
( x1 ,..., xm az egyes minták átlagai, ezeket részátlagoknak is tekinthetjük;
X = az egyes minták átlagainak átlaga, ezt főátlagnak is tekinthetjük.)
Az alternatív hipotézis szerint a vizsgált átlagok közül legalább kettő
nem egyezik meg egymással. Ha a mintákat nem ugyanazokból a sokasá-
gokból vettük (ha mind az öt minta más-más egyetemen végzett vizsgálat
eredménye), akkor azt mondhatjuk, az egyes sokaságok átlagai nem azo-
nosak, de ha nincs információnk a minták eredetéről, akkor így fogalmaz-
hatunk: az egyes minták nem származhatnak ugyanabból a sokaságból.

4. Az elfogadási és a kritikus tartomány kijelölése:


Ha α = 5 %-os szignifikancia-szinten dolgozunk, akkor az elfogadási tarto-
mány felső határa F = 1,83 .
4 ;310
0 , 95

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 267 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 268 ►

5. A próbafüggvény számszerű értékének meghatározása:


Az öt minta átlagának (súlyozott számtani) átlaga = főátlag:

x=
∑n ∗ x j j
=
100 ∗12.380 + 50 ∗13.600 + ... + 70 ∗11.500
≅ 13.094 Ft
∑n j 315

Az öt minta szórásainak (súlyozott négyzetes) átlaga = belső szórás245:

σB =
SB
=
∑n ∗s j
2
j
=
∑nj ∑n j

100 ∗ 4.430 2 + 50 ∗ 4.800 2 + ... + 70 ∗ 3.600 2


≅ 4.563 Ft
315

A számításhoz a belső szórás képletének számlálójában lévő érték ( S B )


szükséges: S B = 6.559.590.000
A négy minta átlagának és a főátlagnak (súlyozott négyzetes) átlagos elté-
rése = külső szórás:

∑ n (x − x )
2
SK j j
σK = = =
∑nj ∑n j

100 ∗ (12.380 − 13.094) + 50 ∗ (13.600 − 13.094 ) + ... + 70(11.500 − 13.094)


2 2 2
≅ 1.280
315
Ft

A számításhoz a külső szórás képletének számlálójában lévő érték ( S K )


szükséges: S K = 516.127.301,6

245 Mind külső, mind a belső szórás számításánál a mintaelemek összege (315) szerepel a
nevezőben. A szórás becslésénél tanult ”-1”-t azért lehetett elhagyni, mert ekkora elem-
szám esetén már nincs jelentősége. (Elhagyása nem módosítja az eredményeket, ill. legfel-
jebb akkora mértékben, amennyit a számítások végén úgy is „elkerekítünk”.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 268 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 269 ►

A próbafüggvény értéke:
SK 516.127.301,6
vK 4 ≅ 6,1
F= =
SB 6.559.590.000
vB 310

Egyes tankönyvek a variancia-analízis képletet a szórások felhasználásával (is) közlik:

σ 2K 1.280 2
vK 4 ≅ 6,1
F= =
σ 2B 4.563 2

vB 310

A két eredmény azonossága, a matematikai összefüggéseket ismerve, nem meglepő. Eb-


ből következik, hogy mindkét számítás használható, attól függően, mely rész-, ill. vég-
eredmények állnak rendelkezésünkre. (Egyébként az alkalmazott jelölésekben is eltérnek
az egyes tankönyvek – és nemcsak ebben az esetben –, mi a legegyszerűbb jelölési rend-
szerhez próbáltunk igazodni.)

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről.


Ennél a próbánál is elég megvizsgálnunk – ahogy ezt már jeleztük – a tábla-
beli érték és a próbafüggvény számszerű értékének nagyságrendi relációját:
számított (6,1) 〉 táblabeli (1,83)
Ennek alapján az alternatív hipotézist fogadjuk el, és egyúttal a
nullhipotézist elvetjük, azaz
♥5 %-os szignifikancia-szinten állítjuk, hogy a minták átlagai közül
legalább kettő nem azonos.
Ha pontosan akarjuk tudni, melyik két átlag nem egyezik, akkor mégis
el kell végeznünk páronként az összehasonlítást, és ezt nyilvánvalóan a
legkisebb és a legnagyobb mintaátlag összevetésével célszerű kezdeni.
(Összehasonlítva a legkisebb és a legnagyobb átlaghoz tartozó szórásokat
– F = 5.100 2 / 3.600 2 ≅ 2 – a szokásos szignifikancia-szinten arra követ-
keztetésre jutottunk, hogy a 15.300 Ft-os és a 11.500 Ft-os kiadási átlag
nem véletlenül térnek el egymástól. Ezután elhagyva az öt mintaátlag kö-
zül a legkisebbet, ismét elvégeztük a variancia-analízist. A próbafüggvény
értéke: ≅4,1, a táblabeli érték: 2,6, azaz döntésünk nem változott.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 269 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 270 ►

11.3.5. χ 2 (kh’ 2 ) -próba

A mintából származó és a mintától független szórás


összehasonlítása
Ismét a hallgatók szórakozási kiadásaira vonatkozó példa adataival dolgo-
zunk.
A vizsgált egyetem hallgatóinak köréből egyszerű véletlen mintát vet-
tünk (n = 100 fő). A mintából számított átlaga ≅12.380 Ft, ≅4.430 Ft szó-
rás mellett. Ezeket az eredményeket hasonlítjuk egy korábbi teljeskörű
adatgyűjtésből származó átlaghoz (X 0 = 11.000 Ft ) , melyhez 4.000 Ft
szórás (= σ 0 ) tartozik. A két átlag összehasonlítását már kétféleképpen is
elvégeztük (z-próba, egymintás t-próba). Azt is tudjuk, hogy ezeket a pró-
bákat meg kellett volna előzze a szórások összevetése, ennek bemutatása
következik most. A választ az általában használt 5 %-os szignifikancia-
szinten kell megadni.

1. A hipotézisek246 megfogalmazása:
Ho H1 a próba
s1 = σ 0 s1 ≠ σ 0 kétoldalú

4. Az elfogadási és a kritikus tartomány kijelölése:


H1 elfogadási tartomány

s≠σ [χ 2
0 , 025 ( 99 ) ]
↔ χ 02,975( 99 ) → [74,2 ↔ 129,6]

5. A próbafüggvény számszerű értékének meghatározása:

χ2 =
(n − 1)s 2 = (100 − 1)4.430 2 ≅ 121,4
σ 02 4.000 2

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről.

246 Tekintettel arra, hogy az átlagok összehasonlíthatósága csak a szórások egyezősége


esetén lehetséges nincs értelme az egyoldali ellenhipotéziseknek. (Lásd: F-próba a mintá-
ból származó szórások összehasonlítására.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 270 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 271 ►

A próbafüggvény számított értéke a táblabeli értékek által határolt inter-


vallumon belül helyezkedik el, a nullhipotézist tehát elfogadjuk, az alterna-
tív hipotézist pedig elvetjük, így
♥5 %-os szignifikancia-szinten állítjuk, hogy annak a sokaságnak,
melyből a minta származik a szórása azonos a korábbi teljeskörű felmé-
résből származó szórással.
Illeszkedés (= eloszlás) vizsgálat
A becslés témakörének taglalásakor már többször említettük, hogy a tan-
könyvünkben tárgyalt módszerek alkalmazása a vizsgált sokaságok normá-
lis eloszlását feltételezik, vagy legalábbis azt, hogy az attól való eltérés sta-
tisztikai értelemben ne legyen jelentős mértékű. Ennek ellenére mindeddig
nem győződtünk meg arról, hogy az egyetemi hallgatók sokasága a szóra-
kozási kiadások alapján normális eloszlásúnak tekinthető-e. A követke-
zőkben ezt vizsgáljuk.

1. A hipotézisek megfogalmazása az aktuális feladattól függetlenül


mindig azonos:
H 0 : P( X i ) = Pi ∗

H1: létezik olyan P( X i ) ≠ Pi ∗

4. Az elfogadási és a kritikus tartomány kijelölése:


Ha α = 5 %-os szignifikancia szinten dolgozunk, és becsléses illeszkedés-
vizsgálatot végzünk, akkor az elfogadási tartomány felső határa
χ 02,95( 4 ) = 9,49 .

5. A próbafüggvény számszerű értékének meghatározása:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 271 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 272 ►

11.4. sz. tábla (a 10.2.sz. tábla alapján)


a hallgatók
szórakozási
száma a χ2
kiadás
mintában zi Ψ ( z i ) 1 − Ψ ( z i ) pi∗ f i ∗ összete-
ezer Ft / hó vői
fi
/fő
– 5,0 6 -1,66605 0,95215 0,04785 0,04785 4,79 0,306
5,1 – 8,0 10 -0,98879 0,83862 0,16138 0,11353 11,35 0,161
8,1 – 11,0 18 -0,31154 0,62231 0,37769 0,21631 21,63 0,609
11,1 – 14,0 35 0,36571 0,64271 0,26502 26,50 2,726
14,1 – 17,0 15 1,04297 0,85151 0,20880 20,88 1,656
17,1 – 20,0 11 1,72022 0,95730 0,10579 10,58 0,017
20,0 – 5 ∞ 1,0000 0,04270 4,27 0,171
összesen 100 – – 1,0000 100 5,646

A tábla egyes adatait (szürke háttér, dupla vonalas keret) így számítottuk
ki:
5 − 12,38
• z1 = −1,66605 ≅
4,43
A számításokat EXCEL-programmal végeztük. A számítógép nem kerekített, így
4,429652 ezer Ft-os szórással dolgozott. (Ezért, ha ellenőrizni akarja munkánkat, Ön
se kerekítsen.)

• Ψ ( z 2 ) = 0,83862 ≅ 0,8365 ↔ 0,8389


Az egyes z értékekhez tartozó táblabeli értékeket is a számítógép kereste ki, ha az
órai munkához megvásárolható táblagyűjtemény z-táblájából keressük ki az értéket, –
ez négy tizedes pontosságú – a 0,8365 vagy a 0,8389 áll rendelkezésünkre. (Célszerű
a kerekítés matematikai szabályai szerint eljárni, vagy végezhetünk interpolációt.)

• 1 − Ψ ( z 3 ) = 1 − 0,62231 = 0,37769
A táblából kikeresett érték komplomenterének (= kiegészítőjének) kiszámítására
azért van szükség, mert ha z negatív, akkor a táblából kikeresett valószínűség az
adott negatív határ és a pozitív végtelen közötti előfordulást valószínűségét adja meg,
azaz nem kezelhető együtt a pozitív z értékekhez kikeresett valószínűségekkel.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 272 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 273 ►

• p4∗ = 0,26502 = 0,64271 − 0,37769


A táblából kikeresett pozitív z értékhez tartozó valószínűségek és az „átfordított” va-
lószínűségek is mind a negatív végtelen és az adott határ közötti előfordulás esélyét
adják meg, de a megfigyelt gyakoriságok ( f i ) osztályközökre vonatkoznak, ezért a
normális eloszlást kifejező előfordulási esélyeket (≅ relatív gyakoriságokat) is osztály-
közökre vonatkoztatva kell megadnunk.

• f 5∗ = n ∗ p5∗ = 100 ∗ 0,2088 = 20,88


♥ Ha a hallgatók szórakozás kiadás szerinti eloszlása illeszkedne a normális eloszlás
elméleti görbéjére, akkor a sokaság 20,88 % (0,2088-ad része) költene havonta erre a
célra 14 és 17 ezer Ft közötti összeget, azaz a mintában ≅ 21 fő esne ebbe az osztály-
közbe.
A létszámadatokat tartalmazó oszlopban talán furcsának tűnnek a tizedes pontosságú
adatok A próbafüggvény értékének pontosabb számítása érdekében nem kerekítet-
tünk. (A megfogalmazásnál azonban, ahogy az előző bekezdésben látható is, igen.)

• χ 2
egyik összetevője:
(f 6 − f 6∗ ) = (11 − 10,58)
2 2
≅ 0,017
f 6∗ 10,58

Az oszlop összesen adata = a próbafüggvény értéke.

6. Döntés a hipotézisek elfogadásáról illetve elvetéséről.


Tekintettel arra, hogy ez próba egyoldali, elég megvizsgálnunk – ahogy ezt
már többször is jeleztük – a táblabeli érték és a próbafüggvény számszerű
értékének nagyságrendi relációját:
számított (5,646) 〈 táblabeli (9,49)
Következtetésünk: a nullhipotézist elfogadjuk, az alternatív hipotézist
pedig elvetjük, azaz
♥ a vizsgált egyetem hallgatóinak szórakozási kiadás szerinti eloszlása
a megfigyelés időpontjában normálisnak tekinthető, a tapasztalati eloszlás
görbe jól közelíti az elméleti haranggörbét. Azokat a mutatókat, melyeket
csak normális eloszlás esetén használhatunk, kiszámíthatjuk, értelmezhet-
jük, alkalmazhatjuk a sokaság jellemzésére.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 273 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 274 ►

A vizsgált egyetem hallgatóinak szórakozási kiadás szerinti


eloszlása

40
előfordulások a mintában (fő)

35
30
25
20 Adatsor1
15
10
5
0
0 5 10 15 20 25
szórakozási kiadások (ezer Ft)

11.1.sz. ábra
Függetlenségvizsgálat
A próba az asszociáció mutatóinak igazságtartalmát ellenőrzi. Ezért a 7.1.
fejezetben247 található bemutató példát folytatjuk. Ott 1992 és 2003 évekre
vonatkozóan a foglalkoztatottakat egyszerre két ismérv (ágazat = minő-
ségi ismérv ill. nem = minőségi ismérv) szerint csoportosítottuk. Egy-
részt kíváncsiak voltunk arra, hogy van-e kapcsolat az ágazatok és a foglal-
koztatottak neme között. (Van-e olyan ágazat, amelyik „vonzza” férfiakat,
ill. van-e olyan, amelyik „vonzza” a nőket?) Másrészt kíváncsiak voltunk
rajta, hogy megváltozott-e a mutató értéke az eltelt évtized alatt? Most
pedig azt akarjuk ellenőrizni, hogy véletlen-e a mutatók nullától való elté-
rése, azaz valódi kapcsolat van-e az ismérvek között, vagy csak a mintavé-
tel szeszélyei miatt (pl. szélsőséges minta) kaptuk az alábbi eredményeket.
11.5.sz. tábla
A számítások eredményei
év Csuprov-mutató Cramer féle mutató
452,3966 452,3966
1992 T= ≅ 0,18 C= ≅ 0,34
4025,8 (2 − 1)(14 − 1) 4025,8 * (2 − 1)

247 Statisztika I.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 274 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 275 ►

563,328 563,328
2003 T= ≅ 0,20 C= ≅ 0,38
3922 (2 − 1)(14 − 1) 3922 * (2 − 1)

1. A hipotézisek megfogalmazása az aktuális feladattól függetlenül mindig


azonos:

H0 : Pij = Pi∗ ∗ P∗ j

H 1 : van olyan i és j, melyre Pij ≠ Pi∗ ∗ Pj∗

A nullhipotézis a függetlenséget, hiszen azt állítja, hogy a megfigyelt relatív


gyakoriságok, azonosak a függetlenséget feltételező relatív gyakoriságokkal
(= előfordulási valószínűségekkel) Az alternatív hipotézis pedig, éppen
ellenkező állításával, az összefüggést feltételezi.
A hipotézisekben szereplő betűk jelentése:
Pi∗ =
Pj∗ =
Pij = a kontingencia tábla pe-
a kontingencia tábla pe-
két ismérvváltozat remgyakorisága (oszlop-
remgyakorisága (sorvek-
együttes előfordulásá- vektor), a "j"-vel jelölt
tor), az "i"-vel jelölt is-
nak valószínűsége ismérvváltozat szerinti
mérvváltozat szerinti
előfordulás valószínűsége
előfordulás valószínűsége

4. Az elfogadási és a kritikus tartomány kijelölése:


Ha α = 5 %-os szignifikancia szinten dolgozunk, és becsléses illeszkedés-
vizsgálatot végzünk, akkor az elfogadási tartomány felső határa figyelembe
véve a szabadságfokot v = ( s − 1)(t − 1) : χ 02,95(13) = 22,4 . A megfelelő
elméleti értéket a χ 2 -táblából az 1 − α feliratú oszlopban kell kikeresni.
5. A próbafüggvény számszerű értékének meghatározása:
Erre most nincs szükség, egyszerűen átvesszük a korábban megoldott
feladatból a szükséges értékeket.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 275 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 276 ►

11.6. sz. tábla


1992
1992
a megfigyelt és a függet-
1992 függetlenséget feltételező
megne- lenséget feltételező adatok
megfigyelt adatok adatok
vezés összehasonlítása =
f ij f i. * f . j
f ij* = χ 2 összetevőinek számítá-
n
sa
I. II. III.
ágazat férfi nő össz. Férfi nő össz. férfi nő össz.
mezőgazd. 316,7 143,4 460,1 247,0103 213,0897 460,1 19,66174 22,79159 42,45332
….
összesen 2.161,3 1.864,5 4.025,8 2.161,3 1.864,5 4.025,8 209,5219 242,8746 452,3966

11.7. sz. tábla


2003 2003
2003 függetlenséget felté- a megfigyelt és a függetlensé-
megnevezés megfigyelt adatok telező adatok get feltételező adatok összeha-
f ij f i. * f . j sonlítása =
f ij* =
n χ 2 összetevőinek számítása
ágazat férfiak nők össz. férfiak nők össz. férfiak nők össz.
mezőgazd. 166,6 48,6 215,2 116,686 98,5135 215,2 21,3509 25,2895 46,6404
……..
összesen 2.126,6 1.795,4 3.922 2.126,6 1.795,4 3.922 257,879 305,45 563,328

Az 1992-re vonatkozó számítás szerint a próbafüggvény értéke: ≅452, a


2003-ra vonatkozó számítás szerint pedig: ≅ 563.
6. Döntés a hipotézisek elfogadásáról illetve elvetéséről.
Tekintettel arra, hogy ez próba is egyoldali, elég megvizsgálnunk – ahogy
ezt már többször is jeleztük is – a táblabeli érték és a próbafüggvény
számszerű értékének nagyságrendi relációját:
1992: számított (≅ 452) 〉 táblabeli (22,4)

2003: számított (≅ 563) 〉 táblabeli (22,4)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 276 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 277 ►

Így következtetésünk mindkét évben azonos: a nullhipotézist elvetjük, az


alternatív hipotézist pedig elfogadjuk, azaz
♥ 5 %-os szignifikancia-szinten állítjuk, hogy a foglalkoztatottak neme
és az ágazatok jellege között számottevő kapcsolat van, vannak olyan ága-
zatok tehát, melyek (inkább) a női és olyanok, melyek (inkább) a férfi dol-
gozókat vonzzák (alkalmazzák).

11.4. Gyakorló feladatok


1. feladat

Mintavételes eljárással vizsgáljuk egy egyetemen különböző szakokon


tanuló diákjainak teljesítményét matematikából.
11.8. sz. tábla (=10.10. sz. tábla)
a minta adatai:
villamos- gépész-
teljesítmény informatikus közgazdász
mérnökök mérnökök
% fő
- 50 30 20 34 35
51 – 60 20 20 68 88
61 – 70 10 15 34 88
71 – 80 10 10 22 35
81 – 90 6 3 11 28
91 – 4 2 11 6
összesen 80 70 180 280

A 11.8. sz. táblában foglalt adatokkal már találkozott a becslés gyakorló


feladatai között. Most az ott kiszámított eredményekre is szüksége lesz.

11.9. sz. tábla


Egy korábbi mintavétel eredményei:
villamos- gépész-
informatikus közgazdász együtt
mérnökök mérnökök
elemszám 50 35 100 100 285
átlag 65 60 65 70 66
szórás 16 18 14 12 13

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 277 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 278 ►

1. Állapítsa meg szakonként és az együttes adatra vonatkozóan is –


több különböző szignifikancia szinten is, – hogy a hallgatók a teljesít-
ményének szórása azonos-e a 11.9. sz. táblában megadott értékekkel!
2. Állapítsa meg a villamosmérnök hallgatók esetében, hogy a 80 %
feletti teljesítmény nyújtók aránya azonos-e a többi szakon azonos tel-
jesítmény nyújtok arányával! Az összehasonlítást páronként és egyetlen
próbával is végezze el!
3. Vizsgálja meg, hogy a közgazdászok teljesítmény-százalék szerinti
eloszlása normálisnak tekinthető-e!
Ha szorgalmas, a fenti adatokból még egyéb összehasonlítási lehetősége-
ket is talál, és azokat is elvégezheti.

2. feladat

A háztartások villamosenergia-fogyasztásának vizsgálatára egyik megyénk-


ben 1,4 % -os ( n = 200) EV mintát vettek. A minta adatai:

11.10. sz. tábla (=10.11. sz. tábla)


a háztartások
kiegészítő oszlop,
fogyasztás aránya a mintá-
adatok az előző évre
ban
kWh % %
– 80 5,0 7,0
81 – 100 12,5 15,0
101 – 120 20,0 25,0
121 – 160 22,5 20,0
161 – 200 20,0 18,0
201 – 300 12,5 10,0
301 – 7,5 5,0
összesen 100 100
A 11.10. sz. táblában foglalt adatokkal már találkozott a becslés gyakorló
feladatai között. Most az ott kiszámított eredményekre is szüksége lesz.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 278 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 279 ►

1. Ellenőrizze, hogy a háztartások villamosenergia-fogyasztás szerinti


eloszlása illeszkedik-e a normális eloszlás elméleti görbéjére!
2. Állapítsa meg, vannak-e olyan osztályközök (= fogyasztási kategóri-
ák), amelyekbe azonos arányú fogyasztó tartozik!
3. Igaz-e az állítás, növekedett a villamosenergia-felhasználás együttesen és kate-
góriánként is az előző évhez viszonyítva. (Az előző évre vonatkozó
megoszlási viszonyszámokat a 11.10. sz. tábla kiegészítő oszlopában
találja meg.) Az előző évben 100 elemű mintát vettek.
Az ellenőrzéseket több különböző szignifikancia-szinten is végezze el!

3. feladat

11.11. sz. tábla


Halálozások a meghaltak neme és a halál oka szerint
(Magyarország, 2003)248
a meghaltak neme
→ férfi nő összesen
a halál oka ↓
daganatos betegségek 19.063 14.999 34.062
táplálkozási és anyagcsere 1.101 1.650 2.751
keringési rendszer 31.841 37.210 69.051
légzőrendszer 3.210 2.229 5.439
emésztőrendszer 5.846 3.599 9.445
összesen 61.061 59.687 120.748

Ezekkel az adatokkal a 7. fejezetben már találkozott, ott azt a feladatot


kapta, vizsgálja meg, van-e kapcsolat a meghaltak neme és a halál oka között! Most
ellenőrizze, hogy a kapcsolat szignifikáns-e!
Munkáját egyszerűsítheti, ha a korábban kiszámított eredményeket fel-
használja.

248
Magyar statisztikai évkönyv, 2003 (KSH, 2004; 68. – 70. old.) /A legfőbb halálokokat
emeltük ki, a halálestek 88 %-át./

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 279 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 280 ►

4. feladat

11.12. sz. tábla


A Magyarországra bevándorló külföldiek száma (fő) életkoruk szerint 249
1980 2002
életkor (év)
férfi nő összesen férfi nő összesen
0 – 14 165 145 310 652 611 1.273
15 – 19 205 157 362 608 707 1.315
20 – 24 241 475 716 1.568 1.536 3.103
25 – 29 182 330 512 1.773 1.406 3.179
30 – 39 221 199 420 2.119 1.296 3.415
40 – 49 73 81 154 1.213 671 1.884
50 – 59 32 47 79 569 384 953
60 – 19 40 59 229 294 523
összesen 1.138 1.474 2.612 8.741 6.905 15.646

A 7. fejezetben már ezekkel az adatokkal is találkozott, ott azt a feladatot


kapta: vizsgálja meg, volt-e kapcsolat a bevándorlók életkora és neme között 1980-
ban ill. 2002-ben! Most új feladatokat kap.
1. Döntse el, hogy 1980-ban ill. 2002-ben azonos volt-e a bevándorló
férfiak, nők, ill. az összes bevándorló átlagos életkora, ill. életkorának
szórása! α = 2,5% ill. α = 5,0%
2. Döntse el, változott-e az eltelt évek alatt a bevándorló férfiak, nők, ill. az
összes bevándorló átlagos életkora ill. annak szórása! Szignifikancia-szint: ua.
3. Állapítsa meg, mindkét évre, mindkét nemre és a bevándorlók ösz-
szességére, igaz-e a kijelentés: életkor szerinti eloszlásuk normálisnak tekint-
hető! α = 5,0% ill. α = 10,0%
4. Állapítsa meg, vannak-e olyan életkor-kategóriák, ahol a bevándorlók
aránya azonos! Szignifikancia-szint: az általános.
5. Előző döntése alapján válaszoljon, vannak-e olyan életkor-kategóriák,
ahol a bevándorlók száma azonos!
Munkáját egyszerűsítheti, ha a korábban kiszámított eredményeket felhasználja.

249 Demográfiai évkönyv, 2003 (KSH, 2004; 90. old.) /Az ismeretlen korúak – számuk
elenyésző– nélkül./

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 280 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 281 ►

5. feladat – a gyakorló órákon a feladatokat nem mindig az eddigi részlete-


ző formában kapják meg a hallgatók, az alábbiakban erre látnak példákat.

Egy város 60 ezer 25 éven felüli lakosa közül 300 elemű EV mintát vettek az iskolai
végzettség vizsgálatára. A minta szerint a 25 éven felüli lakosok által sikeresen elvég-
zett iskolaévek átlagos száma 9,2 (szórás: 2,6 ). Számítsa ki P = 98,8% az átlagosan
elvégzett iskolai évek számát! Ellenőrizze azt feltevést, hogy a sikeresen elvégzett
iskolaévek száma a) kevesebb 10 – nél, b) több 10-nél, c) éppen 10! Vizsgálja meg,
milyen döntések születtek volna 80, 90 és 95 %-os becslési szint mellett!
Egy városban a szelektív hulladékgyűjtés bevezetését tervezik. A hulladékfajták becslésére
a város háztartásaiból 10 %-os EV mintát vettek. Az éves szilárd hulladékok meg-
oszlása (m3) a mintában:

papír műanyag textil üveg fém veszélyes szerves egyéb


162 122 40 56 24 6 246 166
Adjon intervallumbecslést 96 %-os megbízhatósággal az egyes hulladékfajták arányára!
Adjon pontbecslést a város évi összes hulladékmennyiségére!
4. Az egészségügyi kormányzat pontos adatok hiányában statisztikai becsléssel kívánja
megállapítani, hogy az orvosok hány %-a praktizál magánrendelésen. Ebből a célból
300 elemű EV mintát vettek. A mintába került orvosok közül 72 fő rendelkezett pri-
vát pacientúrával. Adjon becslést – 95,5 %-os megbízhatósággal – a privát pacientú-
rával rendelkező orvosok számára, ha ismeretes, hogy a Magyarországon dolgozó
orvosok száma ≅28.000 fő! Becsülje meg az orvosok beteglátogatással töltött havi
átlagos idejét, ha ez a mintába 53 óra 12 óra szórással! Állapítsa meg, hogy hány
elemű mintát szükséges kiválasztani ahhoz, hogy az időre vonatkozó becslés maxi-
mális hibája 1 óra legyen!
5. A háztartások egy főre jutó évi élelmiszer-kiadását 2003-ben, az egyik megyében
rétegzett kiválasztás alapján becsülték. Az 500-as mintában a városi háztartások szá-
ma 300, átlagos élelmiszer-kiadás 156 ezer Ft, 40 ezer Ft szórás mellett. A községek-
ben az átlag 120 ezer Ft, 17,5 %-os relatív szórás mellett. A megye háztartásainak 45
%-a városi. Állapítsa meg a városokra, a községekre és az egész megye egy háztartá-
sára vonatkozó átlagot! Becsülje meg mindhárom esetben az összes kiadást, ha tud-
juk, hogy a megyében 180 ezer háztartás van!
6. Egy főiskolán felmérést végeztek arra vonatkozóan, hogy a hallgatók mennyi időt
fordítanak hetente sportolásra. A kikérdezés EV mintavétellel történt. Az 1000 lány-
ból és a 700 fiúból 100 – 100 elemű mintát vettek. A minta adatai: lányok 4,2 óra (2,0
óra szórással), fiúk 8,6 óra (2,5 óra szórással). Ismert továbbá, hogy a megkérdezett
lányok között 6 óránál többet sportol 12 %, a fiúk körben ez az arány 40 %. Adjon

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 281 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 282 ►

intervallumbecslést a hallgatók egyes csoportjaira és összességére vonatkozóan is a


heti sportolási idő átlagára és szórására különböző valószínűségi szinteken! Az ered-
ményeket hasonlítsa össze, vonjon le következtetést! Adjon intervallumbecslést a
6 óránál többet sportolók arányára és számára rétegenként és együttesen is a szoká-
sos valószínűségi követelményt alkalmazva!
7. Egyik megyénkben az elmúlt évben összesen 4.500 fő ment nyugdíjba, közöttük a
férfiak aránya 40 % volt. Az átlagos szolgálati idő vizsgálatára nemenként egymástól
függetlenül 100 – 100 fős EV mintát vettek. A mintába került nők átlagos szolgálati
ideje 36 év (szórás: 12 év); a 35 évnél hosszabb szolgálati idővel rendelkezők aránya:
65 %. A férfiak adatai:
év - 15 - 20 - 25 - 30 - 35 - 40 40 -
% 3 5 7 10 15 15 45
Becsülje meg (P = 95 %) a férfiak átlagos szolgálati idejét, a 35 évnél hosszabb
szolgálati idővel rendelkezők arányát és számát; az összes nyugdíjasra vonatkozóan
ugyanezen adatokat! Számítsa ki, hogy hány elemű AR mintára lett volna szükség,
ha az átlagos szolgálati időre vonatkozó hibahatárt megtarthatjuk! Hasonlítsa össze
a férfiakra és a nőkre vonatkozó adatokat!
8. Egy fogkrém szabvány szerinti pH-értéke 7,75; a megengedett szórás 0,75. (A pH-
érték normális eloszlása feltételezhető.) A szabvány-érték meglétének ellenőrzésére
vett 25 elemű EV minta adatai: 7,25 (0,85 szórás). Írja fel a tanult hipotéziseket, el-
lenőrizzen különböző szinteken!
9. Egy bizonyos típusú személygépkocsi átlagos fogyasztása a gyártó szerint 8,5 li-
ter/100 km. (A fogyasztás normális eloszlása feltételezhető.) Az ellenőrzés céljára
vett EV minta adatai: 9,1 (2,2 szórás). Állapítsa meg, hogy a tényleges fogyasztás
nagyobb-e gyártó által garantáltnál!
10. Egy kereskedelmi vállalatnál a kártyás fizetési mód bevezetését tervezi azokban az
üzletekben, ahol ezt a vásárlók legalább 40 %-a igényli. Ennek felmérésére két üzlet-
ben kikérdezték (EV minta) a vevőket. A Kínai Áruházban 120 megkérdezett közül
41, az Angol Használtruha Áruházban pedig 150 megkérdezett közül 77 igényelné.
Bevezeti-e valamelyik üzletében ezt a fizetési módot a kereskedelmi vállalat?
11. Egy töltőgép mosóport tölt dobozokba. Hosszú hónapok tapasztalata szerint a
töltési tömeg szórása 8 gramm. (A töltési tömeg normális eloszlása feltételezhető.)
Két egymást követő napon 40 – 40 dobozt felbontottak, lemértek. Az eredmények:
1. nap: 595,5 gramm átlagos töltési tömeg, 2. nap: 603,7 gramm. Állapítsa meg,
van-e szignifikáns különbség a két napi töltési tömeg között!
12. Egy nagykereskedelmi vállalat raktárában tárolt 80 000 db dobozos üdítőital töltési
tömegének vizsgálatára 300 elemű EV mintát vettek. A minta megoszlása:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 282 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 283 ►

töltési tömeg mintabeli gyak. töltési tömeg mintabeli gyak.


gramm db gramm db
- 940 15 - 1020 63
- 960 21 - 1040 42
- 980 51 - 1060 30
- 1000 60 1060 - 18
Ellenőrizze 5 %-os szignifikancia-szinten, hogy a dobozok töltési tömeg szerinti el-
oszlása normálisnak tekinthető-e! Becsülje meg az átlagos töltési tömeget, az 1000
grammnál kisebb tömegű dobozok arányát és számát!
13. Egy benzinkútnál feljegyezték a 8 és 16 óra között érkező autók számát óránkénti
bontásban:
10 – 11 – 12 – 13 – 14 –
idő 8–9 9 – 10 15 -16
11 12 13 14 15
gépkocsi 24 32 56 32 22 28 36 46

Ellenőrizze azt az állítást, hogy óránként azonos valószínűséggel érkeznek a gépko-


csik az adott benzinkúthoz!
14. A magyar felnőtt népességet reprezentáló 1200 fős minta alapján vizsgálták a
szabadidő-eltöltési szokásokat. A minta adatai:
családdal családdal a egyedül barátokkal
eltöltés ⇒ egyéb
otthon természetben otthon szórakozóhelyen
lakóhely
Budapest 41 43 39 32 61
város 208 115 77 49 97
község 219 70 44 39 66
családi állapot
házas 278 152 63 32 107
egyedülálló 176 62 108 97 125
gyermek
van 321 185 104 72 120
nincs 147 64 56 43 88
életkor (év)
18 – 29 66 46 26 83 65
30 – 39 62 46 23 15 45

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 283 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 284 ►

40 – 49 86 61 33 14 40
50 – 59 72 44 25 13 36
60 - 167 30 57 3 42
iskolai végzettség
legfeljebb
258 102 90 60 90
8 év
középfokú 130 88 50 47 105
felsőfokú 49 45 23 11 52
Vizsgálja meg, hogy a szabadidő-eltöltésének módja mely ismérvvel
(ismérvekkel) van szignifikáns kapcsolatban!

11.5. Összefoglalás
= feltevés valamely sokasági jellemezőre vagy a soka-
hipotézis
ság eloszlására
= feltevésünk ellenőrzése egy (vagy több) minta
hipotézisellenőrzés
alapján
szükséges mert a sokasági jellemzők számítása mintából történik
1. a hipotézis felírása
2. a próbafüggvény értékének meghatározása
a munka menete 3. a táblabeli érték kikeresése (adott P → α
alapján)
4. összevetés → döntés → megfogalmazás

a hipotézis felírása mindig két hipotézissel dolgozunk


– együtt sose lehessenek igazak
követelmény
– merítsék ki az összes lehetőséget
1. nullhipotézis
fajtái: 2. ellenhipotézis = alternatívhipotézis : egyolda-
li, kétoldali
nullhipotézis pl.: H0 : x = X
egyoldalú kétoldalú
ellenhipotézis pl.:
H1 : x ≠ X H1 : x 〈 X vagy H1 : x 〉 X

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 284 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 285 ►

= a mintaelemeknek egy olyan függvénye, amelynek


próbafüggvény
eloszlása a nullhipotézis igazságát feltételezve ponto-
san ismert
1. z -próba
fajtái 2. egymintás t-próba
(csak a tankönyvben szerep- 3. kétmintás t-próba
lők) 4. F-próbák
5. χ 2 -próbák
Ha n〉100 és a szórás ismert (nem a mintából!) átlag,
arány stb. ellenőrzésére,
szabadságfoka = végtelen.
z -próba
xa − X 0
z=
σ
n
Ha n〈100 és/vagy a szórás csak a mintából ismert
átlag, arány stb. ellenőrzésére,
szabadságfoka = ( n − 1) .
egymintás t-próba
xa − X 0
t=
s
n
Két minta átlagának, arányainak stb. összehasonlítá-
sára,
szabadságfoka = ( n1 + n2 − 2) .
kétmintás t-próba
x1 − x2
t=
1 1
sd ∗ +
n1 n2
2 minta szórásának összehasonlítására,
szabadságfoka = számláló: ( n1 − 1) , nevező :
F-próbák
szórásokra
(n2 − 1) , ahol n1 〉 n2 .
s12
F= 2
s2

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 285 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 286 ►

Több átlag összehasonlítására,


szabadságfoka = számláló: (m − 1) , nevező: n − m .

variancia-analízis SK
vK
F=
SB
vB
Mintabeli és pl. szabvány szórás összehasonlítására,
χ -próbák
2 szabadságfoka = ( n − 1) .
szórásra (n − 1)s 2
χ =
2

σ2
Annak eldöntésére, illeszkedik-e egy vizsgált sokaság
eloszlása valamely ismert (legtöbbször: normális)
eloszlás típusra,
eloszlásvizsgálat szabadságfoka = (k − 1 − r ) .

(f )
2
− f i∗
χ =∑
2 i

f i∗
Az asszociációs kapcsolat szignifikáns voltának el-
döntésére,
szabadságfoka = ( s − 1)∗ (t − 1) .
függetlenségvizsgálat

χ = ∑∑
2
(f ij − f ij∗ )
2

f ij∗

Döntésünk nem lesz mindig helyes.


véletlen hiba Eredete: nem teljes körű az adatfelvétel.
Minden próba csak adott szignifikancia-szinten (1-P)
végezhető el
1. elsőfajú hiba
fajtái
2. másodfajú
A null-hipotézis igaz, mégis elvetjük.
elsőfajú hiba
Valószínűsége: α = 1 − P → α = 1 − Ψ ( z )
Az ellenhipotézist fogadjuk el.
másodfajú
Valószínűsége: β

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 286 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 287 ►

– a két hiba egymásból nem számítható ki!


fontos – a két hiba csak egymás kárára csökkenthető
– célszerű mindkettőt alacsony szinten tartani
elfogadási tartomány H 0 -ra vonatkozik, egyoldali, kétoldali
kritikus tartomány H 1 -re vonatkozik, egyoldali, kétoldali
döntés A próbafüggvény értékének és a táblabeli értékeknek
összevetése alapján.

11.6. Mintapéldák korábbi vizsgadolgozatokból

1. minta

Egy gazdaságban a juhállomány gyapjúhozamát vizsgálták. A kiválasztott


juhokra (n = 300 db fésűs merinó) vonatkozó adatok:
Ha nem a zsebszámológép statisztikai programjával dolgozik, ezt a munkatáblát
használja a becslési feladatokhoz!
gyapjúhozam juhok
kg/db
- 4,00
4,01 – 4,50
4,51 – 5,00
5,01 – 5,50
5,51 – 6,00
6,01 – 7,00
7,01 – 8,00
8,01 –
összesen

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 287 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 288 ►

Ezt a munkatáblát használja az első (1.3.) hipotézisellenőrzési feladathoz!


gyapjú-hozam juhok
kg/db %
- 4,00 5,0
4,01 – 4,50 8,3
4,51 – 5,00 9,3
5,01 – 5,50 14,0
5,51 – 6,00 15,0
6,01 – 7,00 27,0
7,01 – 8,00 15,0
8,01 – 6,3
összesen ≈ 100

A dolgozatokban gyakran nem különülnek el (= egymásra épülnek) a becslési és


hipotézisellenőrzési feladatok, ezt mutatjuk be az alábbiakban.
1.1. 95 %-os valószínűség mellett adjon becslést a juhok átlagos gyapjúhozamá-
ra ill. annak szórására!
átlag250

szórás

1.2. 98 %-os valószínűség mellett adjon becslést a 6 – 8 kg gyapjúhozamú juhok


arányára és számára, ha a kiválasztási arány 2 százalékos!
arány

létszám

250Ahogy már többször jeleztük, a vizsgán egy-egy számítás levezetéséhez ill. megfogal-
mazás leírásához nem ilyen kevés hely áll majd rendelkezésére.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 288 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 289 ►

1.3. Az általánosan használt valószínűség mellett döntse el, normálisnak tekint-


hető-e a juhok gyapjúhozam szerinti eloszlása!

1.4. Fogalmazza meg az 1.1. (átlag), 1.2. (szám) és a 1.3. feladatok kiemelt
eredményeinek jelentését!
átlag

létszám

eloszlás

2. minta
Egy tejipari vállalatnál a tejfölösdobozok töltését automata gép végzi. A dobozok névleges
töltési tömege 5 dl, a megengedett szórás 0,15 dl. A gyár egyik szállítmányából 75 elemű
EV mintát vettek. A mintában az átlagos töltési tömeg 4,95 dl volt, a szórás 0,125 dl.

feladatok:
2.1. Becsülje meg (P = 95 %) a minta adatai alapján az átlagos töltési tömegnek
és a szórásnak az intervallumát! Fogalmazza meg a kiszámított átlag (intervallum)
jelentését!
átlag szórás

2.2. Ellenőrizze (valószínűség, mint az előző feladatban), hogy az előző minta-


vétel óta történt-e változás! Az előző mintavétel elemszáma: 50, a töltősúly 4,9 dl
0,15 dl szórás mellett
1. ellenőrzés 2. ellenőrzés

megfogalmazás

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 289 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 290 ►

3. minta

Egy vidéki város szülészetén az alábbi adatokat figyelték meg:

születési hossz (cm) fiúk fő) lányok (fő)


40 – 44 3 3
44 – 48 4 5
48 – 52 36 36
52 – 56 25 25
56 – 60 14 9
összesen 82 78

feladatok:
3.1. Határozza meg (P = általánosan használt) a fiúk átlagos születési hosszát és
annak szórását! (kétoldalú becslés)

3.2. Fogalmazza meg a kiszámított adatok jelentését!

3.3. Döntse el, azonos hosszúságúak-e a fiúk és a lányok születésükkor!


a döntéshez szükséges és a lányokra vonatkozó adatok
megnevezése számítása

próbák

3.4. Fogalmazza meg az elvégzett ellenőrzés eredményét!

3.5. Ha a fiúk átlagos testhosszának intervalluma 2,2 szélességű, milyen elem-


számú minta alapján dolgozott? (P = mint eddig) Milyen megállapítást tehet a
számítás alapján?
az új elemszám megállapítás

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 290 ►


Statisztika Hipotézisellenőrzés = statisztikai próbák
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 291 ►

4. minta

Az alábbiakban egy, a gépkocsik gumiabroncsainak futásteljesítményére (km) vonatkozó


hipotézisellenőrzés adatait látja:

megfogalmazások (4.1. Egy-egy mondattal írja le mit takar a jelölés


adatok
és a hozzátartozó számadat! A számok mértékegységét is tüntesse fel!)

X = 80.000

σ = 18.000

n = 100

x = 78ezer

s = 20ezer

α = 0,05

H0 : x = X

H1 : x ≠ X

H0 : s = σ

H1 : s ≠ σ

4.2. Fejezze be az elkezdett ellenőrzést! (Ehhez végezze el a szükséges számításo-


kat!)
a döntéshez szükséges ada-
számítás rövid megfogalmazás
tok

1. döntés

2. döntés

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 291 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 292 ►

12. Az idősorok elemezése

12.1. Bevezetés
Az idősor251 olyan statisztikai sor, melyben az ismérv az idő, az ismérv-
változatok pedig különböző dátumok. Az idősorok két alapvető típusa az
állapot- és a tartam idősor. A koordináta rendszerben történő ábrázolá-
suk során, a vízszintes tengelyen rendszerint a dátumokat tüntetjük fel, a
függőleges tengelyen pedig az egyes időpontokhoz tartozó megfigyelt ada-
tokat. Ábrájuk lehet pont-, vonal- és oszlopdiagram252.
Az idősorok adatait elemezhetjük dinamikus viszonyszámokkal253,
ezek a megfigyelt adatok relatív változását mutatják. A bázis viszonyszám
(bi ) egy kiválasztott (= bázis) adathoz, a láncviszonyszám (li ) mindig az
előző adathoz hasonlítja az idősor i-edik adatát. Megoszlási viszonyszámot
(wi ) pedig csak a tartam idősorokból számíthatunk.
Mind az idősorok megfigyelt adatai, mind az azokból számított válto-
zások átlagolhatók254. A tartam idősorok számtani ( y a ) , az állapot időso-
rok pedig kronologikus ( y kr ) átlaggal jellemezhetők. Az átlagos
abszolútváltozás (d i ) a megfigyelt adatok különbségeit, az átlagos relatív-
változás (li ) pedig a láncviszonyszámokat sűríti egyetlen adatba.
Az idősorok az eddig megismert módszereken kívül további eszkö-
zökkel is elemezhetők. Ehhez az idősorok adatait összetevőikre kell bon-
tani:
• alapirányzat ( ŷij ),
• szezonhatás (s j , s ∗j ) ,
• véletlenhatás (v j , v ∗j ) ,
• ciklushatás.

251 Lásd: 1. fejezet


252 Lásd: 1. fejezet
253 Lásd: 2. fejezet
254 Lásd: 3. fejezet

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 292 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 293 ►

Az alapirányzat (= trend) az idősorban megmutatkozó tartós tendenci-


át jelenti, ami lehet

yi
• növekedés, amikor is d i = y i − y i −1 pozitív ill. li = 100 %-nál
y i −1
nagyobb;
yi
• csökkenés, amikor is d i = y i − y i −1 negatív ill. li = 100 %-nál
y i −1
kisebb;
yi
• stagnálás, amikor is d i = y i − y i −1 ≅ 0 ill. li = ≅ 1.
yi −1
A társadalmi-, gazdasági életben lezajló időbeli folyamatok igen gyakran
nem mutatnak töretlen fejlődést vagy folyamatos csökkenést. Az alapvető
tendencia feltárását azonban ez a tény nem zavarja.

A szezonhatás rendszeresen – évente vagy egy évnél is rövidebb idő-


közönként – visszatérő hatás.

Ismerete az alkalmazkodás és a jövőre vonatkozó gazdasági tervek készíté-


sekor igen fontos. Kapcsolódhat az időjárás változásához, (Nyáron több
fagylaltot, hideg üdítőitalt fogyasztunk, mint télen.) ünnepekhez, (A kará-
csonyi, húsvéti postai forgalom sokszorosa az egyébként jellemző havi
forgalomnak.), törvényi előírásokhoz (Pl.: adó befizetési határidők) stb.
A véletlenhatás előre nem látható, nem tervezhető. Oka mindig va-
lamilyen társadalmi vagy gazdasági esemény. Fontos tudnunk, hogy a vé-
letlen szót a statisztika nem a hétköznapi értelemben használja.
A ciklushatás hosszabb időközönként visszatérő hatás, a gazdasági
élet hullámzását (= konjunktúra, dekonjunktúra) jelenti. Elemzése túlmu-
tat tananyagunk keretein.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 293 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 294 ►

12.2. Trendszámítás
Az idősorokban megmutatkozó alapirányzat kimutatására két módszerrel
ismerkedünk meg:
• analitikus és
• mozgóátlagolású trendszámítás.
Az analitikus trendszámítás eredményeként valamilyen matematikából
ismert egyenlettel írjuk le a változást, adjuk meg a „kiinduló értéket” ill.
az időszakonként megmutatkozó abszolút vagy relatív változás nagyságát.
A mozgóátlagolású trendszámítás eredménye egy az eredetinél rövi-
debb idősor, melynek elemei vagy egyre nagyobbak (= növekedés) vagy
egyre kisebbek (= csökkenés), esetleg közel állandóak (= stagnálás)
12.2.1. Analitikus trendszámítás
Az időbeli változások leírására,
• ha az abszolút változások (d i ) megközelítőleg azonos nagyságúak és
kevés kivételtől eltekintve azonos előjelűek, akkor lineáris egyenletet;
• ha a relatív változások (100 − l1i ) megközelítőleg azonos nagyságúak és
kevés kivételtől eltekintve azonos előjelűek, akkor exponenciális
egyenletet számítunk.
• Ha az idősorban megmutatkozó változások egy adott időpontban elő-
jelet váltanak (szélső értéke van a függvénynek), akkor a parabola-
függvényt használjuk.
• Ha igen hosszú idősorokat kell elemeznünk, akkor gyakran alkalmaz-
zuk az un. logisztikus egyenletet.
Az analitikus trendszámítás alapvető kérdése, hogyan illesszük az egyenle-
tet a megfigyelt pontok közé. Úgy is fogalmazhatnánk, hogyan válasszuk
ki az elvileg létező végtelen lehetőség közül a legjobbat.
Ha az idősor megfigyelt adatait úgy ábrázoljuk a koordináta rendszerben, hogy a tenge-
lyeken felvett skála meglehetősen nagy léptékű, akkor jól látható, hogy a pontdiagram (= a
megfigyelt adatok alapján készítjük) pontjai közé sok-sok egyenes vagy görbe rajzolható be.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 294 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 295 ►

A lineáris és az exponenciális függvények255 (egyenletek) esetén az un.


legkisebb négyzetek módszerét256 alkalmazzuk. Azt az egyenletet tart-
juk a legjobbnak, amelyiknek pontjai legközelebb vannak a megfigyelt
pontokhoz. A döntéshez összehasonlítjuk az egyes időpontokhoz tartozó
megfigyelt és számított (= az egyenesen vagy görbén elhelyezkedő) adato-
kat, azaz képezzük ezek különbségét. A különbségek között lesznek nega-
tívak (= az egyenes vagy a görbe a megfigyelt pont fölött fut) és pozitívak
(= az egyenes vagy a görbe a megfigyelt pont alatt fut) is. Ezek összege –
hiszen egyetlen pont alapján nem hozhatunk döntést – kellően sok megfi-
gyelés esetén, nulla. Ezért nem egyszerűen a különbségekkel, hanem azok
négyzetével dolgozunk, és azt a függvényt fogadjuk el legjobbnak, ahol

∑(y i − yˆ i ) = ∑ ei2 = ∑ ( yi − β 0 − β1t i ) → min .! .


2 2

A képletben szereplő betűk jelentése:


ŷ i =
i=
yi =
ei = yi − yˆ i = az egyenesen vagy a az időszakok, időpontok
megfigyelt görbén rajta lévő adat = sorszáma,
rezidium
adat számított adat = trend- i = 1,2,3,....n
adat
A fenti meggondolást és matematikai ismereteinket felhasználva képlete-
ket257 tudunk megadni a különböző egyenlettípusok paramétereinek ki-
számításához. Első lépésben az un. normálegyenletekhez jutunk el. Majd
kétféleképpen is folytathatjuk a levezetést, dolgozhatunk:
• a ∑t i = 0 és a
• a ∑t i ≠ 0 módszerrel is.

ti = 1,2,3,...n egy segédváltozó, a dátumokat helyettesíti. Ugyanúgy kifeje-


zi az idő egységnyi lépésekkel való múlását, mint a dátumok, de lehetővé
teszi, hogy kisebb számokkal dolgozzunk, és azt, hogy az egyenletek β 0

255 A másik két megemlített egyenlettípus nem képezi tananyagunk részét, de megjegyz-
zük, hogy a parabolát ugyancsak a legkisebb négyzetek módszerével illesztik; a logisztikus
egyenlet esetén pedig az un. három-pontos illesztést alkalmazzák.
256 Természetesen egyéb módszerek is léteznek, de ez a legegyszerűbb.
257 A részletes levezetéseket megtalálják az irodalomjegyzékben felsorolt, és az Önök
által éppen olvasottnál részletesebb tankönyvekben.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 295 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 296 ►

paraméterét könnyebben értelmezhessük. (Tananyagunk csak a második-


ként megadott módszert ismerteti, a feladatok megoldása során csak azzal
dolgozunk.)
Lineáris egyenlet:
yˆ i = β 0 + β 1ti

β1 =
∑ t y − (∑ t )(∑ y )/ n
i i i i
β 0 = y − β1 * t ,
∑ t − (∑ t ) / n
2 2
i i

ahol y =
∑y i
és t =
∑t i

n n
Exponenciális egyenlet:

yˆ i = β 0 * β 1ti lg yˆ i = lg β 0 + t i ∗ lg β1 258

lg β 1 =
∑ t lg y − (∑ t )(∑ lg y )/ n
i i i i
lg β 0 = lg y − lg β 1 * t ,
∑ t − (∑ t ) / n
2 2
i i

ahol lg y =
∑ lg y i

n
A képletben szereplő betűk jelentése:
Az előző magyarázó táblában szereplő betűjeleket nem ismételtük meg.
β0 = β1 =
matematika: metszéspont az y- matematika: a kapcsolatot n=
tengelyen kifejező tényező a megfigyelések
statisztika: lásd a szöveges statisztika: lásd a szöveges darabszáma
magyarázat magyarázat

258A logaritmikus átalakítással lineáris kapcsolathoz jutottunk, s értelemszerűen alkal-


mazhatjuk a már ismert képleteket.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 296 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 297 ►

A lineáris egyenlet β 1 paramétere az átlagos abszolút változással azonos


tartalmú adat, kifejezi a vizsgált jelenség időegységre jutó állandó abszo-
lút változását (Itt a szabályos egyenesre gondolunk.), de úgyis fogalmazhatunk:
kifejezi a vizsgált jelenség időegységre jutó átlagos (Itt arra gondolunk, hogy a
társadalmi-, gazdasági életben a jelenségek kisebb-nagyobb mértékben „hullámzanak”.)
abszolút változását.

Legyen yˆ 1 = β 0 + β1t1 és yˆ 2 = β 0 + β1t 2 , valamint t 2 − t1 = 1 . Ebben az esetben:


yˆ 2 − yˆ 1 = β 1 . Ugyanerre a megoldásra jutunk a matematikából tanultak alapján.
Lineáris egyenlet esetén, a vízszintes tengelyen egységnyit lépve, a függőleges tengelyen mindig az egyenlet
meredekségének megfelelő nagyságú lépést kell megtennünk. Azaz egységnyi abszolút változáshoz
(a független változóra – a trendszámításnál ezt a szerepet az idő tölti be – vonatkoztatva),
állandó abszolútváltozás (a függő változóra – a trendszámításnál ezt a szerepet a
megfigyelt jelenség adatai töltik be – vonatkoztatva) tartozik.

Az exponenciális egyenlet β 1 paramétere az átlagos relatív változással


azonos tartalmú adat, kifejezi a vizsgált jelenség időegységre jutó állandó
relatív változását (Itt a szabályos görbére gondolunk.), de úgyis fogal-
mazhatunk: kifejezi a vizsgált jelenség időegységre jutó átlagos (Itt arra
gondolunk, – ahogy a lineáris egyenlet esetében is – hogy a társadalmi-,
gazdasági életben a jelenségek alakulása kisebb-nagyobb „kilengéseket”
mutat.) relatív változását.

Legyen yˆ 1 = β0 * β t 1
1
és yˆ 2 = β0 * β t
1
2
, valamint t 2 − t1 = 1 . Ebben az esetben:
yˆ 2 / yˆ 1 = β 1 . Exponenciális egyenlet esetén, a vízszintes tengelyen egységnyit lépve, a
függőleges tengelyen szereplő adat mindig annyiszorosára változik, ahogy azt az egyenlet
x-hez tartozó paramétere mutatja. Azaz egységnyi abszolút változáshoz (a független
változóra – a trendszámításnál ezt a szerepet az idő tölti be – vonatkoztatva), állandó
relatívváltozás (a függő változóra – a trendszámításnál ezt a szerepet a megfigyelt jelenség
adatai töltik be – vonatkoztatva) tartozik.

A β 0 paraméter jelentése a lineáris és az exponenciális egyenlet esetén


azonos, a megfigyelés előtti utolsó időpont trendadata.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 297 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 298 ►

Legyen ti = 0 , és helyettesítsük be ezt az értéket mindkét egyenletbe!


Ekkor yˆ 0 = β 0 + β1t10 = β 0 ill. yˆ 0 = β 0 * β 1 =
0
β0 . De eszünkben juthat az is,
amit matematikából tanultunk. Mind a lineáris, mind az exponenciális egyenlet β 0 259
paramétere az y –tengelyen vett metszéspontot jelenti. Abban a pontban pedig x = 0 .

BEMUTATÓ PÉLDA I.

A következőkben a Magyarországon forgalomban lévő személygépkocsik


darabszámára vonatkozó adatokat260 elemezzük a trendszámítás módsze-
rével. Először lineáris, majd exponenciális trendet is számítunk.
A számításokat EXCEL programmal végeztük. Az eredményeket a program kerekítette
egy tizedesre, de a számítások az összes tizedest megtartva történtek.

lineáris trend

12.1. sz. tábla

év yi ti t i2 t i ∗ yi ŷi ei2
1989 1.732,4 1 1 1.732,4 1.879,7 21.693,6
1990 1.944,6 2 4 3.889,2 1.930,2 207,3
1991 2.015,5 3 9 6.046,5 1.980,7 1.209,7
1992 2.058,3 4 16 8.233,2 2.031,2 732,5
1993 2.091,6 5 25 10.458,0 2.081,8 97,0
1994 2.176,9 6 36 13.061,4 2.132,3 1.992,0
1995 2.245,4 7 49 15.717,8 2.182,8 3.920,8
1996 2.254,2 8 64 18.033,6 2.233,3 436,8
1997 2.297,1 9 81 20.673,9 2.283,8 176,45
1998 2.340,0 10 100 23.400,0 2.334,3 32,1
1999 2.382,9 11 121 26.211,9 2.384,8 3,8

259 Lehet, hogy a matematika tanulmányaik során más betűjelekkel operáltak. Arról a
paraméterről van szó, amelyik független az x adattól.
260 Magyar statisztikai évkönyv 2003 (KSH – 2004. 19. old., kiemelés, ill. a KSH metodi-
ka váltása miatt az utolsó évek közölt adatait korrigáltuk.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 298 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 299 ►

2000 2.425,8 12 144 29.109,6 2.435,4 91,5


2001 2.468,7 13 169 32.093,1 2.485,9 295,2
2002 2.511,6 14 196 35.162,4 2.536,4 614,9
2003 2.554,5 15 225 38.317,5 2.586,9 1.050,6
összesen 33.499,5 120 1240 282.140,5 33.499,5 32.554,1
átlag 2.233,3 8

Megjegyzések a 12.1. sz. táblához:

• A megfigyelt adatok állapot idősort alkotnak, ennek ellenére számtani átlagot


(33.499,5 / 15 = 2.233,3) számítottuk → ez szerepel a tábla utolsó sorában. A trend-
számítás során ui. nem teszünk különbséget a különböző jellegű idősorok között.
• A t i − adatok átlaga – ahogy a közölt képletből is látható – egyszerű számtani átlag
(120 / 15 = 8). Jelentése nincs.
• A tábla összesen sorában szereplő adatok egyikének sincs statisztikai jelentése. (A
megfigyelt adatok ill. a trendadatok összege, ha tartam idősort elemeznénk jelentés-
sel bíró adat lenne.)
• ∑ y = ∑ yˆ
i i , és ez az egyenlőség minden esetben fennáll.
• Az utolsó oszlopban szereplő adat számításának okát hamarosan ismertetjük.
• A trendadatok (= az egyenesre illeszkedő adatok) is statisztikai jelentéssel bíró ada-
tok. A szürke háttérrel, vastagabb vonallal jelzett 2536,4 = ♥Ha a Magyarországon
forgalomban lévő személygépkocsik darabszáma szabályosan a lineáris egyenlet sze-
rint alakult volna, akkor 2002-ben ≅2.536.400 gépkocsit számolhattunk volna össze.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 299 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 300 ►

A Magyarországon forgalomban lévő személygépkocsik


száma (1989 - 2003)

3000

2500
g é p k o c s i ( m illió d b )
2000

1500

1000

500

0
0 5 10 15 20
évek

12.1.1. sz. ábra: megfigyelt adatok261

A Magyarországon forgalom ban lévő szem élygépkocsik


szám a (1989 - 2003)
y = 50,514x + 1829,2
3000

2500
gépkocsi (millió db)

2000

1500

1000

500

0
0 5 10 15 20
évek

12.1.2. sz. ábra: a lineáris trend adatai

261 A megfigyelt és a számított adatokat általában egyetlen ábrán szokás feltüntetni, de


ebben az esetben olyan mértékű az egybeesés, hogy a közös ábrán nem látnánk elkülö-
nülni a pontokat (= megfigyelés) és az egyenest (= számítás). Hasonlóképpen jártunk el
az exponenciális egyenletnél is. (Lásd: 12.2.1. és 12.2.2. sz. ábrák.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 300 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 301 ►

A lineáris egyenlet paramétereinek számítása:


282140,5 − 120 ∗ 33499,5 / 15
β1 = = 50,511607 ≅ 50,5 ezer db
1240 − 120 2 / 15
β 0 = 2233,3 − 8 ∗ 50,511607 = 1829,171 ≅ 1829,2 ezer db
A lineáris egyenlet:
yˆ i = 1829,2 + 50,5t i (ezer db)

A lineáris egyenlet paramétereinek jelentése:


♥ β 0 ≅ 1829,2 → Ha a Magyarországon forgalomban lévő személy-
gépkocsik száma szabályosan a lineáris trend szerint alakult volna, ak-
kor 1989-ben 1.829.200 db gépkocsi szerepelt volna a nyilvántartásban
(és a KSH adatai között).
♥ β1 ≅ 50,5 → Ha a Magyarországon forgalomban lévő személygép-
kocsik száma szabályosan a lineáris trend szerint alakult volna, akkor
évről évre 50.500 darabbal emelkedett volna az állomány, és ha a befo-
lyásoló tényezők nem változnak meg jelentősen, akkor az elkövetkező
években is ekkora abszolút változás várható. Vagy így is fogalmazha-
tunk: a magyarországi személygépkocsi állomány évente átlagosan
50.500 darabbal növekedett a vizsgált időszakban.

BEMUTATÓ PÉLDA II.


exponenciális trend

12.2. sz. tábla

év yi ti t i2 lg yi t i ∗ lg yi ŷi ei2
1989 1.732,4 1 1 3,23865 3,23865 1.889,2 24.587,4
1990 1.944,6 2 4 3,28883 6,57766 1.933,5 124,1
1991 2.015,5 3 9 3,30438 9,91315 1.978,7 1.350,7
1992 2.058,3 4 16 3,31351 13,25403 2.025,1 1.102,2
1993 2.091,6 5 25 3,32048 16,60239 2.072,5 363,4
1994 2.176,9 6 36 3,33784 20,02703 2.121,1 3.115,1

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 301 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 302 ►

1995 2.245,4 7 49 3,35129 23,45906 2.170,8 5.569,2


1996 2.254,2 8 64 3,35299 26,82394 2.221,6 1.061,3
1997 2.297,1 9 81 3,36118 30,25062 2.273,7 549,3
1998 2.340,0 10 100 3,36922 33,69216 2.326,9 171,0
1999 2.382,9 11 121 3,37711 37,14816 2.381,4 2,2
2000 2.425,8 12 144 3,38485 40,61826 2.437,2 130,3
2001 2.468,7 13 169 3,39247 44,10209 2.494,3 655,7
2002 2.511,6 14 196 3,39995 47,59931 2.552,7 1.692,2
2003 2.554,5 15 225 3,40731 51,10959 2.612,5 3.367,8
összesen 33.499,5 120 1240 50,20005 404,41610 33.491,3 43.841,9
átlag 2.233,3 8 3,34667

Megjegyzések a 12.2. sz. táblához:

• Azokat a megjegyzéseket, melyek azonosak lennének a 12.1. sz. táblánál leírtakkal,


nem ismételjük.
• A megfigyelt adatok logaritmusainak átlagát számtani átlagként számítjuk, statisztikai
jelentése nincs.
• ∑ y ≅ ∑ yˆ
i i , és ez az összefüggés minden esetben fennáll. (Bár az eltérés a
kétszeri logritmikus átalakítás miatt rendszerint nagyobb, mint amit a lineáris egyen-
let számítása során tapasztalunk.)
• Az ŷi jelölt trendadatoknak is van jelentése (és nemcsak ebben a feladatban). Pl.:
2.437,2 ezer db (szürke háttérrel és vastagabb betűvel jeleztük a 12.2. sz. táblában) = ♥
Ha a magyarországi személygépkocsik állománya szabályosan az exponenciális trend
szerint alakult volna, akkor 2000-ben 2.437.200 db gépkocsit számlálhattunk volna meg.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 302 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 303 ►

A Magyarországon forgalomban lévő személygépkocsik


száma (1989 - 2003)

3000

2500
g é p k o c s i ( m illió d b )
2000

1500

1000

500

0
0 5 10 15 20
évek

12.2.1. sz. ábra (ua.12.1.1.): megfigyelt adatok

A Magyarországon forgalom ban lévő szem élygépkocsik


szám a (1989 - 2003)
y = 1846e0,0232x
3000

2500
gépkocsi (millió db)

2000

1500

1000

500

0
0 5 10 15 20
évek

12.2.2. sz. ábra: az exponenciális trend adatai262

262 Ahogy már többször jeleztük, a számításokat az EXCEL-programmal végeztük, és ez


az exponenciális egyenlet β1 paraméterét természetes alapú logaritmussal számolja, ezért

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 303 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 304 ►

Az exponenciális trend paramétereinek számítása:


404,41610 − 120 ∗ 50,20005 / 15
lg β1 = = 0,010056 → β1 ≅ 1,0234 ↓
1240 − 120 2 / 15
102,34% → +2,34% / év
lg β 0 = 3,34667 − 8 ∗ 0,010056 = 3,266223 → β 0 ≅ 1846 ezer db

Az exponenciális trendegyenlet:

yˆ i = 1846 ∗1,0234 ti (ezer db)

Az exponenciális trendegyenlet paramétereinek jelentése:


♥ β 0 ≅ 1846 → Ha a Magyarországon forgalomban lévő személygép-
kocsik száma szabályosan az exponenciális trend szerint alakult volna,
akkor 1989-ben 1.846.000 db gépkocsi szerepelt volna a nyilvántartás-
ban (és a KSH adatai között).
♥ β1 ≅ 1,0234 → Ha a Magyarországon forgalomban lévő személy-
gépkocsik száma szabályosan az exponenciális trend szerint alakult
volna, akkor évről évre 2,34 %-kal emelkedett volna az állomány, és ha
a befolyásoló tényezők nem változnak meg jelentősen, akkor az elkö-
vetkező években is ekkora abszolút változás várható. Vagy így is fo-
galmazhatunk: a magyarországi személygépkocsi állomány átlagos nö-
vekedési üteme a vizsgált időszakban 2,34 %.
Állítsuk egymás mellé a kétféle trendszámítás eredményeit!

12.3. sz. tábla


össze-
év 1989 1990 1996 1997 2002 2003
sen
** 1732,4 1944,6 … 2254,2 2297,1 … 2511,6 2554,5 33499,5
lin. 1879,7 1930,2 2233,3 2283,8 2536,4 2586,9 33499,5
exp. 1889,2 1933,5 2221,6 2273,7 2552,7 2612,5 33491,3
** megfigyelt adat

lát más adatot az ábrára íratva. (A kitevő függvényt alkalmazva megkapjuk az általunk kiszámí-
tott β1 adatot.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 304 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 305 ►

Megfigyelhetjük, hogy az egyes évekre vonatkozó tény- (= gyűjtött) és


trendadatok kisebb-nagyobb mértékben eltérnek egymástól. Ennek egyik
oka, hogy a megfigyelt adatok nagyságát nemcsak az alapirányzat befolyá-
solja. (Ezért nem azonosak a megfigyelt és a trendadatok.) A másik ok,
hogy a változást a két számítás során nem azonos jellegűnek feltételeztük.
Az eltérést látva felmerül a kérdés, melyik egyenlettípus írja le jobban a
vizsgált jelenség, jelen esetben a magyarországi személygépkocsi állomány
időbeli alakulását. A kérdésre ugyanazzal a módszerrel – a legkisebb négy-
zetek módszerével – adhatjuk meg a választ, amivel az elvileg lehetséges
megoldások közül a legjobb lineáris ill. e legjobb exponenciális egyenletet
kiválasztottuk. A döntéshez szükséges adat a szerepel a 12.1. sz. és a 12.2.
sz. táblák utolsó oszlopában ei2 jelöléssel. Az elvégzett számítások alapján,
a lineáris egyenlet írja jobban a vizsgált változást. (lineáris ∑ e i2 =
32554,1 〈 exponenciális ∑ e i2 = 43841,9)
A két (esetleg több) egyenlettípus közötti döntést azért fontos, mert az
egyenleteket a múltban lezajló társadalmi-, gazdasági folyamatok jobb megis-
merésére, és ezáltal a jövőre vonatkozó mind tökéletesebb tervek elkészíté-
sére akarjuk felhasználni. Az előrejelzésnek természetesen szigorú szabályai
vannak. Ezek közül az egyik legfontosabb, hogy nem elég egy-egy gazdasági
jelenséget önmagában megfigyelni, és alakulását leírni. Elemezni kell a jelen-
séget befolyásoló tényezőket is, különösen azt, hogy azokban a közeljövőben
várhatóak-e lényeges változások, ha igen, akkor az előrejelzés lehetősége eset-
leg meghiúsul, vagy az elsődleges számítási eredményeket korrigálni kell stb.
12.2.2. Mozgóátlagolású trendszámítás
Az időben változó jelenségekben megmutatkozó alapirányzat kimutatásának
másik lehetséges módszere a mozgóátlagolás. A mozgóátlagolás alapvető
problémája a tagszám (= k ) meghatározása. A tagszámot úgy kell megválasz-
tani, hogy az idősorban megmutatkozó hullámzás eltűnjön, vagyis a tagszám
egy teljes periódust átfogjon. Egy teljes periódusban mindig vannak vissza-
esést ill. kiugrást mutató időszakok, és ezek rendszeresen ismétlődnek. Az
ismétlődés ritmusát megtalálni olyan idősorok esetén, melyek évekre vonatko-
zó adatokból állnak elég nehéz és hosszadalmas feladat, ezért mi is olyan idő-
sort esetén mutatjuk be a módszert, ahol a periódus egy év hosszúságú. A
levélpostai küldemények idősorát fogjuk elemezni. Ez azonban nem jelenti azt,
hogy a mozgóátlagolás ne lenne alkalmazható bonyolultabb esetekben is.263

263 Gyakori hallgatói tévedés: hónapokra (negyedévekre stb.) vonatkozó adatokból


„csak” mozgóátlagolással mutatható ki az alapirányzat; ill. az évekre vonatkozó adatokból
„csak” analitikus trendszámítással.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 305 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 306 ►

A mozgóátlagolás lényege a hullámzás eltüntetésével az alapirányzat


kimutatása. E feladat megoldásának menete:
• a tagszám (k ) megállapítása,
• a mozgóösszege kiszámítása,
• a mozgóátlagok meghatározása,
• (szükség esetén) centrírozás.
A mozgóösszeg számítása során először a tagszámnak megfelelő első k ada-
tot adjuk össze, az összeget feljegyezzük, majd elhagyva az idősor első adatát
ismét k adatot összegzünk. (Most az összeadás első eleme az idősor második
adata, utolsó eleme pedig az idősor (k + 1) -dik eleme.) És így tovább.
Abban az esetben, ha k = páratlan szám (van középső időpont), akkor
az összeget a középső időpont mellé írjuk; ha k = páros szám (nincs kö-
zépső időpont), akkor az összeget a két „középső” időpont közé írjuk. (Az
adat „lóg a levegőben".)

A mozgóátlagolás a mozgóösszegeknek a tagszámmal való osztását jelenti.


(Lényegében egyszerű számtani átlagokat számítunk.) Ezek az átlagszámok
abban az esetben, ha k = páratlan szám, a keresett trendadatokat jelentik. Ha
azonban a k = páros szám, akkor az átlagok sem tartoznak időponthoz, ez
lehetetlenné teszi az eredeti és a számított adatok összehasonlítását. A problé-
ma megoldását a centrírozás, a középre igazítás jelenti. Ez tulajdonképpen egy
újabb mozgóátlagolás, ahol a tagszám mindig kettő. Tehát páros tagszám
esetén a centrírozott adatok jelentik a trendértékeket.

A mozgóátlagolású trendszámításnak, mint módszernek a statisztikai


gyakorlat szempontjából előnyei és hátrányai is vannak. Egyik hátránya,
hogy a trendadatok sora kevesebb elemből áll, mint a megfigyelt adatok
sora. Ezt a jelenséget nevezzük adatvesztésnek. Emiatt, bár egyes szerzők
ajánlják, nagyon megfontolandó, hogy tagszám egészszámú többszöröseit
használjuk az átlagok (= a trendadatok) kiszámítására. Fontos tudni, hogy
ha a tagszám páratlan, akkor (k − 1) , ha pedig páros, akkor éppen (k ) ada-
tot vesztünk. Az adatvesztés egyik fele az idősor elején, másik fele pedig
az idősor végén jelentkezik.
Másik hátránya, hogy eredményül nem egyenletet kapunk, azaz a válto-
zás abszolút vagy relatív nagyságát nem tudjuk egyetlen adattal jellemezni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 306 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 307 ►

Ezen a gondon sokszor úgy segítenek, hogy a mozgóátlagokból trendegyen-


letet számítanak.
Harmadik hátrányos tulajdonsága, hogy alkalmazásával sokkal bonyo-
lultabbá válik az előrejelzés, (amihez az átlagos abszolút- ill. relatívválto-
zást ismerete szükséges). Természetesen, ha a mozgóátlagokból kiszámí-
tottuk az előbbiekben említett egyenletet, akkor ez a gond is megoldódik.
Kétségtelen előnye, hogy alkalmazása kevesebb matematikai ismeretet
követel, ill. segédeszközök (zsebszámológép, személyi számítógép stb.)
hiányában is könnyen megkapjuk a trendértékeket. Bár ez sem elhanya-
golható, ennél fontosabb, hogy a trendadatok nagyságát mindig csak a
környezetükben lévő megfigyelt adatok befolyásolják. Különösen
igen hosszú idősorok esetén lényeges ez a szempont.
Például egy család jelenlegi és az elkövetkező néhány hónapra várható húsfogyasztá-
sát nagyon kevéssé – sőt talán mondhatjuk azt is, hogy egyáltalán nem – befolyásolja a 10
évvel ezelőtti húsfogyasztása.

BEMUTATÓ PÉLDA

A kapuvári postahivatal levélforgalmi adatai 2001 – 2005 havi bontásban, (db)

12.4.sz. tábla
évek
hónapok
2001. 2002. 2003. 2004. 2005.
jan. 17.603 17.695 15.848 18.145 13.004
febr. 12.864 14.980 14.530 13.019 12.425
márc. 15.781 22.697 12.866 15.202 15.085
ápr. 18.570 15.691 17.665 16.393 12.814
máj. 14.973 16.414 12.492 14.274 13.349
jún. 12.632 18.176 12.265 16.470 12.588
júl. 13.811 16.245 14.548 13.500 15.391
aug. 15.869 16.200 11.261 13.461 14.054
szept. 12.994 15.924 14.859 13.190 14.182
okt. 15.636 17.902 15.864 13.480 13.865
nov. 13.944 14912 12.583 13.495 16.249
dec. 28.418 27.703 25.893 17.713 19.141
összesen 193.095 214.539 180.674 178.342 172.147

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 307 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 308 ►

Ha a 12.4. sz. tábla adatain végignézve kétféle következtetést tudunk levonni.


Szeptember és november hónapokat kivéve a 2005 egyes hónapjainak le-
vélforgalma alacsonyabb, mint 2001 azonos hónapjainak forgalma; vagyis az
idősorban megmutatkozó alapirányzat = csökkenés. Erre enged következtet-
ni az is, hogy az éves forgalmi adatok is egyre kisebbek. (Lásd: összesen sor.)
Ha egy-egy éven belül hasonlítjuk össze a havi forgalmi adatokat, ak-
kor pedig azt tapasztaljuk, hogy a februárban a januárinál mindig alacso-
nyabb a forgalom; majd egyes években már márciusban, más években
pedig csak áprilisban újra magas adatokat látunk. Az újabb visszaesést egy
nyári növekedés, majd decemberben egy kiugrás követi; vagyis a forga-
lomban szezonális ingadozást is megfigyelhetünk.
A 12.4. sz. tábla adatai alapján leírt megfigyeléseinket a 12.3. sz. ábra jól szemlélteti.
12.3. sz. ábra
Kapuvár levélforgalmi adatai 2001 - 2005

30000

25000
levélforgalom (db)

20000

15000 Adatsor1

10000

5000

0
0 10 20 30 40 50 60 70
évek / hónapok

Az idősorra jellemző alapirányzatot most (először) mozgóátlagolással ha-


tározzuk meg. A 12.5. sz. tábla az ehhez szükséges munkatábla.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 308 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 309 ►

12.5. sz. tábla


levél centrirozott
év Hónap yij mozgó öszeg mozgóátlag adat
(db) ŷij
jan. 17.603 –
2001 febr. 12.864 –
márc. 15.781 –
ápr. 18.570 –
máj. 14.973 –
jún. 12.632 193.095 16.091,25 –
júl. 13.811 193.187 16.098,92 16.095
aug. 15869 195.303 16.275,25 16.187
szept. 12.994 202.219 16.851,58 16.563
okt. 15.636 199.340 16.611,67 16.732
nov. 13.944 200.781 16.731,75 16.672
dec. 28.418 206.325 17.193,75 16.963
jan. 17.695 208.759 17.396,58 17.295
2002 febr. 14.980 209.090 17.424,17 17.410
márc. 22.697 212.020 17.668,33 17.546
ápr. 15.691 214.286 17.857,17 17.763
máj. 16.414 215.254 17.937,83 17.898
jún. 18.176 214.539 17.878,25 17.908
júl. 16.245 212.692 17.724,33 17.801
aug. 16.200 212.242 17.686,83 17.706
szept. 15.924 202.411 16.867,58 17.277
okt. 17.902 204.385 17.032,08 16.950
nov. 14.912 200.463 16.705,25 16.869
dec. 27.703 194.552 16.212,67 16.459
2003 jan. 15.848 192.855 16.071,25 16.142
febr. 14.530 187.916 15.659,67 15.865
márc. 12.866 186.851 15.570,92 15.615
ápr. 17.665 184.813 15.401,08 15.486

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 309 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 310 ►

máj. 12.492 182.484 15.207,00 15.304


jún. 12.265 180.674 15.056,17 15.132
júl. 14.548 182.971 15.247,58 15.152
aug. 11.261 181.460 15.121,67 15.185
szept. 14.859 183.796 15.316,33 15.219
okt. 15.864 182.524 15.210,33 15.263
nov. 12.583 184.306 15.358,83 15.285
dec. 25.893 188.511 15.709,25 15.534
jan. 18.145 187.463 15.621,92 15.666
2004 febr. 13.019 189.663 15.805,25 15.714
márc. 15.202 187.994 15.666,17 15.736
ápr. 16.393 185.610 15.467,50 15.567
máj. 14.274 186.522 15.543,50 15.506
jún. 16.470 178.342 14.861,83 15.203
júl. 13.500 173.201 14.433,42 14.648
aug. 13.461 172.607 14.383,92 14.409
szept. 13.190 172.490 14.374,17 14.379
okt. 13.480 168.911 14.075,92 14.225
nov. 13.495 167.986 13.998,83 14.037
dec. 17.713 164.104 13.675,33 13.837
jan. 13.004 165.995 13.832,92 13.754
2005 febr. 12.425 166.588 13.882,33 13.858
márc. 15.085 167.580 1.3.965,00 13.924
ápr. 12.814 167.965 13.997,08 13.981
máj. 13.349 170.719 14.226,58 14.112
jún. 12.588 172.147 14.345,58 14.286
júl. 15.391 –
aug. 14.054 –
szept. 14.182 –
okt. 13.865 –
nov. 16.249 –
dec. 19.141 –

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 310 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 311 ►

Megjegyzések a 12.5.sz. táblához:

• A mozgóösszegek és a mozgóátlagok oszlopok adatai nem taroznak egyik idő-


ponthoz sem. Ezt úgy szokás bemutatni, hogy az adatok két sor között szerepelnek,
táblánk azonban így nagyon terjedelmessé válna, ezért a rácsozat elhagyásával érzé-
keltetjük ezt a tény.
• Néhány mozgóösszeg = tény adat, egy–egy év teljes levélforgalmát mutatja, (Ezeket
vastagabb betűvel kiemeltük.) bár tulajdonképpen az oszlop minden további adata
éves forgalmi adat, csak ezek az „évek” nem januárral kezdődnek.
• Egy mozgóösszegre (200.781) vonatkozóan – a könnyebb megértés érdekében –
hármas-vonallal bekereteztük azokat az adatokat, melyeket össze kellett adnunk.
• A centrírozott adatok (= trendadatok) a megfigyelt adatokhoz hasonlóan egy-egy
időpontra vonatkoznak, és jelentéssel bírnak. Pl.: (szürke háttérrel, kerettel, vasta-
gabb betűvel) ♥ Ha a kapuvári posta levélforgalmában nem mutatkozna szezonális
ingadozás, akkor az alapirányzatnak (= csökkenés) megfelelően 2005. júniusában
14.286 levelet vettek volna föl.

A 12.4. és a 12.5.sz. ábrák jól szemléltetik a kétféle trendszámítási módszer


különbségét. A mozgóátlagolás adatai nem folyamatos csökkenést jelez-
nek, a lineáris trend egyenese viszont állandónak mutatják azt.
12.4. sz. ábra
Kapuvár levélforgalmi adatai 2001 - 2005

30000

25000
levélforgalom (db)

20000

15000

10000

5000

0
0 10 20 30 40 50 60 70
évek / hónapok

az ugrálást mutató vonal = megfigyelt adatok


a kisebb hullámzást mutató vonal = mozgóátlagolással számított
trendadatok

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 311 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 312 ►

12.5. sz. ábra

Kapuvár levélforgalmi adatai 2001 - 2005

y = -42,411x + 16940
30000

25000
levélforgalom (db)

20000

15000

10000

5000

0
0 10 20 30 40 50 60 70
évek / hónapok

az ugrálást mutató vonal = megfigyelt adatok


az összefüggő egyenes vonal = az EXCEL programmal
meghatározott lineáris trend

12.3. A szezonhatás vizsgálata


A szezonhatás rendszeresen – egy évnél rövidebb időközönként – visz-
szatérő hatás. Ahogy a bevezetőben említettük, kapcsolódhat például az
időjárás változásához, egyes ünnepekhez, törvényi előírásokhoz stb. Nagy-
ságának vagy mértékének ill. jellegének (= a trendtől való eltérés előjele)
kimutatásához a megfigyelt (= tény) és a számított (= alapirányzat) adatok
összehasonlítására van szükségünk. Ha a két adat különbségét ( yij − yˆ ij )
képezzük, akkor eredményül szezonális eltéréseket (s j ) ; ha azonban a
két adat hányadosát ( yij / yˆ ij ), akkor szezonindexeket (s ∗j ) kapunk.
A szezonális eltérések ill. a szezonindexek számításához a kü-
lönbségeket ill. a hányadosokat egy speciális munkatáblába szokás rendez-
ni. A munkatáblák oldalrovata tartalmazza az egymást követő periódusok
elnevezését. Ezeknek a sorszámát adjuk meg y futóindexének i -betűjével
(i = 1,2,3...n ) . A munkatáblák fejlécébe pedig a perióduson belüli szezo-
nok (= azonos jellegű eltérést mutató időpontok, időszakok) megnevezé-

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 312 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 313 ►

sét írjuk. Ezeknek a sorszámát adjuk meg y futóindexének j -betűjével


( j = 1,2,3...k ) . Így egymás alá kerülnek az azonos jellegű szezonokra szá-
mított különbségek vagy hányadosok. Ezekről látni fogjuk, hogy – általá-
ban – kisebb-nagyobb mértékben eltérnek egymástól. Ennek oka, az idő-
sor harmadik összetevőjének, a véletlenhatásnak a jelenléte. Ezt az eltérést
átlagolással szűrhetjük ki, azaz a táblában egymás alatt sorakozó, tehát
azonos jellegű szezonhoz tartozó adatokat összegezzük, majd darabszá-
mukkal elosztjuk (= egyszerű számtani átlagot számítunk).
Az előzőekben leírt átlagszámítással kapcsolatban két fontos megjegyzésünk van.

• Az osztóba n (= a megfigyelt periódusok száma) csak akkor kerülhet, ha a tényadatok-


ból egyenletet számítottunk, tehát nincs adatvesztés, és így a két adatsor azonos elem-
számú, azaz minden időponthoz tartozóan van kisebbítendőnk (vagy osztandónk) ill.
kivonandónk (vagy osztónk). Ha azonban a trendértékeket mozgóátlagolással határoz-
tuk meg, azaz van adatvesztés, akkor az átlagoláskor az osztóban (n − 1) fog szerepelni.
• A szezonindexek esetén – elméleti megfontolások alapján – lehetséges az egyszerű
számtani átlag helyett a hányadosok mértani átlagát számítani. Ez azonban már feltét-
lenül szükségessé teszi valamilyen segédeszköz használatát. (Ki tud úgymond „fejben”
pl. tizedik gyököt vonni?)
Az átlagolással kiszámított szezonális eltéréseket ill. szezonindexeket szo-
kás még korrigálni annak érdekében, hogy a különbségek összege nulla
(∑ s j = 0) , ill., hogy az indexek átlaga együtthatós formában egy egész (szá-
zalékos formában 100) legyen.
Gondoljon arra, hogy ∑y ij = ∑ yˆ ij ! Azaz, amennyivel magasabb (átlagosan) az egyik
adat a szezon hatására, annyival alacsonyabbnak (átlagosan) kell lennie a másik adatnak.
Ha pedig képezzük a kiszámított indexek (%) és a 100 % (= nincs eltérés) különbségét
és ezeket összegezzük, akkor nullát kell kapnunk. (∑ s ∗j − 100 ) = 0
A korrigálás szezonális eltérés esetén úgy történik, hogy minden még
korrigálatlan adathoz (a szezonra számított átlagos eltéréshez) hozzáadjuk
a korrekciós tényezőt, szezonindex esetén pedig minden korrigálatlan ada-
tot (a szezonra számított átlagos hányadost) elosztunk a korrekciós té-
nyezővel. Ezek (k j ill. k ∗j ) számítása mindkét esetben azonos módon törté-
nik. A még korrigálatlan átlagokat összeadjuk, majd az összeget
elosztjuk a szezonok számával. A korrekciós tényezőnek szezonális
eltérés esetén előjele is van. Ha az átlagok összege nagyobb nullánál, akkor
negatív, ha pedig az átlagok összege kisebb nullánál, akkor pozitív. (Gon-
doljon arra, mindig a nulla irányába kell elmozdulni!)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 313 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 314 ►

A szezonális eltérések azt fejezik ki, hogy különböző rendszeresen ismét-


lődő hatások következtében az egyes szezonokban átlagosan mennyivel
tér el a tényadat a trendértéktől, azaz mennyivel (hány Ft-tal, darabbal stb.)
kisebb vagy nagyobb annál. A szezonindexek pedig ugyanezt százalékos
formában adják meg. (Legalábbis megfogalmazni mindig ilyen formában –
és nem a számítás közvetlen eredményeként kapott együtthatós formában
– egyszerűbb jelentésüket.)

Az eddig elmondottak képletszerűen:


• szezonális eltérés:

sj =
∑ (y ij − yˆ ij )
+ k j , ahol k j =
∑s j

n k
(Fontos: adatvesztés esetén a nevezőben: (n-1) szerepel.)

• szezonindex:

∑ (y / yˆ ij ) ∑s ∗
j
/ k ∗j . , ahol k j =
ij
s ∗j =
n k
(Fontos: adatvesztés esetén a nevezőben: (n-1) szerepel.)
BEMUTATÓ PÉLDA

A kapuvári levélforgalomra vonatkozó adatokkal dolgozunk tovább, a


mozgóátlagolás trendadatait felhasználva. Először szezonális eltérést szá-
mítottunk. Ennek érdekében meghatároztuk a megfigyelt és a trendadatok
különbségét (= yij − yˆ ij ) , majd berendeztük azokat a 13.6. sz. táblába, ahol
az azonos szezonokra vonatkozó adatok egy-egy oszlopba egymás alá
kerültek. Ezután elvégeztük az átlagolást és a szükséges korrigálást.
12.6.a) sz. tábla
hó →
jan. febr. márc. ápr. máj. jún.
év↓
2001 – – – – – –
2002 400 -2.430 5151 -2072 -1.484 -1.556
2003 -294 -1.335 -2.749 2.179 -2.812 -2.867
2004 2.479 -2.695 -534 826 -1.232 1.267

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 314 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 315 ►

2005 -750 -1.433 1.161 -1.167 -763 -1.698


össz. 1.835 -7.893 3.029 -234 -6.290 -4.854
átlag 458,79 -1.973,26 757,27 -58,40 -1.572,47 -1.213,41
korrigált
551 -1.881 850 34 -1.480 -1.121
átlagok

12.6.b) sz. tábla

hó →
júl. aug. szept. okt. nov. dec.
év↓
2001 -2.284 -318 -3.569 -1.096 -2.728 11.455
2002 -1.556 -1.506 -1.353 952 -1.957 11.244
2003 -604 -3.924 -360 601 -2.702 10.359
2004 -1.148 -948 -1.189 -745 -542 3.876
2005 – – – – – –
össz. -5.592 -6.695 -6.472 -288 -7928 36.934
átlag -1.397,97 -1.673,74 -1.617,92 -71,9583 -1.982,08 9.233,54
korrigált
-1.305 -1.581 -1.525 21 -1.889 9.326
átlagok

Magyarázatok és megjegyzések a 12.6. a) és b) sz. táblához:

• A számításokat az EXCEL-programmal végeztük. A program az összes tizedest


megtartva (ami itt nem is látszik) dolgozott.
• A táblát terjedelme miatt helyeztük el kettéosztva.
• Az első kiemelt adat (2002. jan.) számítása:
y 2,1 − yˆ 2,1 = 17695 − 17295 = 400
• (A tábla valamennyi belső adatát (400 –tól 3.876-ig) azonos módon számítottuk ki.)
• 2001 első hat, ill. 2005 utolsó hat hónapjában az adatvesztés miatt nincsenek különb-
ség adatok.
• Az oszlopok adatainak összegzése az előjelek figyelembevételével történt, és történik
mindig.
• Az oszlopok adatainak átlagolása során – az adatvesztés miatt – néggyel osztottunk.
Pl.: május: − 7.928 / 4 = −1.982 (Az átlag a rovatban 1982,08 szerepel – ahogy
utaltunk is rá – a háttérben lévő tizedesek miatt.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 315 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 316 ►

• A korrekciós tényező számítása:

458,79 + (−1.973,26) + ... + (−1.982,08) + 9.233,54


≅ −92,6337
12
• A korrekciós tényező előjele mutatja, hogy pozitív irányban kell elmozdulni annak
érdekében, hogy az átlagok összege nulla legyen. Pl. júliusban:

− 1.397,97 + 92,6337 ≅ −1.305


A szezonális eltérések alapján az év hónapjait három csoportba oszthatjuk.
Vannak hónapok, amikor gyakorlatilag az alapirányzat érvényesül: április és
október. (A 34 és a 21 db levélnyi eltérés sokkal inkább a véletlen, mint
valamilyen visszatérő és rendszeres hatás.) Az alapirányzathoz képest keve-
sebb levelet adtak föl az ügyfelek februárban, májusban, júniusban, július-
ban, augusztusban, szeptemberben és novemberben. A legnagyobb negatív
eltérés februárban és novemberben figyelhető meg. (A nyári hónapok nega-
tív szezonális eltérései jól jelzik, hogy a város nem nyaralóhely és nem is
idegenforgalmi célpont. Egy Balaton környéki postahivatal forgalmát vizs-
gálva, egészen biztos más eredményre jutottunk volna.) Az alapirányzatnál
nagyobb forgalom jellemezte januárt, márciust és decembert. Ezek a pozitív
eltérések részben az adófizetési határidőknek, részben a karácsonyi üdvözlő-
lap feladásoknak köszönthető. A legnagyobb pozitív eltérést decemberben
tapasztaltuk, és ezt részletesebben így fogalmazhatjuk meg.
♥ Különböző rendszeresen ismétlődő hatások következtében decem-
berben a vizsgált postahivatal levélforgalma átlagosan 9.326 darabbal ma-
gasabb, mint ahogy arra az alapirányzat ismeretében számíthattunk.
Bár egy-egy élesben zajló vizsgálat során általában nem kerül sor a sze-
zonális ingadozás kétféle módszerrel való bemutatására, tankönyvünk – a
szemléltetés kedvéért – ugyanezen adatok segítségével a szezonindex szá-
mítását is közli. Először ismét a megfigyelt és a trendadatok összehasonlí-
tására került sor (= yij / yˆ ij ) , majd a hányadosokat a 12.7. sz. táblába ren-
deztük, ahol az azonos szezonhoz tartozó adatok egy-egy oszlopot alkot-
nak. Ezután elvégeztük az átlagolást és a szükséges korrigálást.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 316 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 317 ►

12.7. a) sz. tábla


hó →
jan. febr. márc. ápr. máj. jún.
év↓
2001 – – – – – –
2002 1,0231 0,8604 1,2936 0,8834 0,9171 1,0150
2003 0,9818 0,9158 0,8239 1,1407 0,8163 0,8106
2004 1,1583 0,8285 0,9661 1,0531 0,9206 1,0834
2005 0,9455 0,8966 1,0834 0,9165 0,9459 0,8811
összesen 4,1086 3,5014 4,1670 3,9937 3,5999 3,7900
átlag 1,02716 0,875342 1,041745 0,998418 0,899972 0,947505
korrigált
1,0321 0,8795 1,0467 1,0032 0,9043 0,9520
átlagok
eltérés
+3,21 -12,05 +4,67 +0,32 -9,57 -4,8
%

12.7. b) sz. tábla


hó →
júl. aug. szept. okt. nov. dec.
év↓
2001 0,8581 0,9803 0,7845 0,9345 0,8364 1,6753
2002 0,9126 0,9150 0,9217 1,0562 0,8840 1,6832
2003 0,9601 0,7416 0,9763 1,0394 0,8232 1,6669
2004 0,9217 0,9342 0,9173 0,9476 0,9614 1,2801
2005 – – – – – –
összesen 3,6525 3,5711 3,5998 3,9777 3,5050 6,3054
átlag 0,913115 0,892787 0,899957 0,994418 0,876251 1,57636
korrigált
0,9175 0,8970 0,9043 0,9992 0,8804 1,5839
átlagok
eltérés % -8,25 -10,3 -9,57 -0,08 -11,96 +58,39

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 317 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 318 ►

Magyarázatok és megjegyzések a 12.7.sz.. táblához:

• . A táblát terjedelme miatt helyeztük el kettéosztva.


• A számításokat ismét az EXCEL-program segítségével végeztük.
• Az első kiemelt adat (2002. jan.) számítása:
y2,1 / yˆ 2,1 = 17695 / 17295 = 1,0231
• (A tábla valamennyi belső adatát (1,0231 –tól 1,2801-ig) azonos módon számítottuk ki.)
• 2001 első hat, ill. 2005 utolsó hat hónapjában az adatvesztés miatt nincsenek hányados adatok.
• Az oszlopok adatainak átlagolása során – az adatvesztés miatt – néggyel osztottunk.
Pl.: május: 3,79 / 4 = 0,9475
• A korrekciós tényező számítása:

1,02716 + 0,875342 + ... + 0,876251 + 1,57636


≅ 0,995252
12
• A korrekciós tényezővel az átlag-sorban szereplő valamennyi adatot elosztottuk (a
korrigálást minden estben így kell megoldanunk), majd kerekítettünk. Pl.: július

0,913115 / 0,995252 ≅ 0,9175


A 12.7. sz. tábla adatai alapján természetesen ugyanazokat a következteté-
seket vonhatjuk le, mint előző (12.6. sz. tábla) számítások végén. Egy „fur-
csaságot” azonban megfigyelhetünk. Október hónapban (eltérő háttérrel
kiemeltük) a szezonális eltérés pozitív, a szezonindex negatív
( )
= s ∗j ∗ 100 − 100% , ez azonban nem jelent ellentmondást. Már a koráb-
biakban jeleztük, októberben tulajdonképpen nincs is szezonhatás. A lát-
szólag ellentmondó eredmény, a módszerek különbségéből adódik.
Végül példaként ismét megfogalmazzuk az egyik szezonindex jelentését.
♥ Különböző rendszeresen ismétlődő hatások következtében decem-
berben a vizsgált postahivatal levélforgalma átlagosan ≅ 58 %-kal maga-
sabb, mint ahogy arra az alapirányzat ismeretében számíthattunk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 318 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 319 ►

12.4. A véletlenhatás vizsgálata


A véletlenhatás előre nem látható, nem tervezhető. Ahogy a bevezető-
ben is írtuk, oka mindig valamilyen társadalmi vagy gazdasági esemény.

v v∗
A véletlenhatást (különbség: ij ill. index: ij ) un. maradéktagként számít-
hatjuk ki. Tekintettel arra, hogy az idősorok összetevői – ezek az alapese-
tek – összegszerűen (= additív módon) ill. szorzatszerűen (= multiplikatív
módon) kapcsolódhatnak, a még nem ismert véletlentagot kivonással ill.
osztással határozhatjuk meg.

• Additív kapcsolat esetén:

yij = yˆ ij + s j + vij → vij = yij − yˆ ij − s j = véletlen eltérés

• Multiplikatív kapcsolat esetén:


yij
yij = yˆ ij ∗ s ∗j ∗ v ∗ij → vij = = véletlen index
yˆ ij ∗ s ∗j

A különbséggel megállapított véletlentagnak ugyanaz a mértékegysége, mint


a tényadatnak és a trendadatnak, a hányadosként megállapított véletlentag-
nak pedig nincs mértékegysége (= együtthatós forma), ill. %-ká alakíthatjuk.
A véletlen eltérés a különböző nem rendszeresen ismétlődő hatások ab-
szolút nagyságát mutatja meg, ahhoz az adathoz képest, amit a trend- és a sze-
zonhatás alapján vártunk, a véletlenindex ugyanezt %-os formában adja meg.
Fontos tudnunk, és ezt a feladatok megoldása során ellenőrizni is kell,
hogy a kiszámított véletlenhatások semmiféle szabályosságot nem mutat-
hatnak, (sem előjelűk, sem abszolút nagyságuk nem lehet rendszeresen
azonos az egyes szezonokra vonatkozóan). Ha mégis szabályszerűséget
tapasztalunk, számításainkat meg kell ismételni, másféle módszerekkel.

BEMUTATÓ PÉLDA

A mozgóátlagolású trendszámítás bemutatásánál megkezdett és a szezon-


hatások számításával folytatott példánk adataival dolgozunk tovább. Meg-
határoztuk mind a véletlen eltéréseket (vij ) , mind a véletlen indexeket

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 319 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 320 ►

(v ) . Számításainkból kiemeltük a 2002-re vonatkozó eredményeket, eze-



ij

ket közöljük a 12.8. sz. táblában.

12.8. sz. tábla

2002 vij vij∗


jan. -152 0,9913
febr. -550 0,9783
márc. 4.301 1,2358
ápr. -2.106 0,8806
máj. -4 1,0142
jún. 1.389 1,0661
júl. -251 0,9947
aug. 76 1,0200
szept. 172 1,0193
okt. 931 1,0571
nov. -67 1,0041
dec. 1.918 1,0627
Példaként nézzük a júniusra vonatkozó véletlenhatások számítását és szö-
veges megfogalmazását!
v26 = 18176 − 17908 − (−1121) = 1389 db

18176
v2∗, 6 = ≅ 1,0661 → 106,61% → +6,61%
17908 ∗ 0,952

♥ Különböző nem rendszeresen ismétlődő hatások következtében


2002. júniusában a vizsgált postahivatal levélforgalma 1.389 darabbal (a
másik módszer szerint 6,61 %-kal)magasabb volt, mint ahogy azt a meg-
ismert alapirányzat és a szezonhatás alapján vártuk.

Fontos! Hasonlítsuk össze a szezonhatások és a véletlenhatások megfo-


galmazását!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 320 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 321 ►

• A szezonhatások általában vonatkoznak egy-egy szezonra, ismétlőd-


nek; a véletlenhatások konkrét dátumhoz kapcsolhatók.
• A szezonhatások csak egy összetevőhöz (= alapirányzat), a véletlenha-
tások viszont két összetevőhöz (= alapirányzat + szezonhatás) hason-
lított eltérést mutatnak.
• Egyik adat megfogalmazásában sem szerepeltek (nem is szerepelhet!) a
csökken, nő szavak, eltérésről szóltunk, írhattuk volna még pl.: júniusra
vonatkozóan, hogy 1.389 darabbal több (magasabb) vagy januárra vo-
natkozóan, hogy 152 darabbal kevesebb (alacsonyabb).

12.5. Előrejelzés
Az idősorok vizsgálatának, ahogy erről már eset szó, kettős célja van.
• A múltban lezajló folyamatok alaposabb megismerése.
• Előrejelzés készítése a jövőre vonatkozóan.
Az előrejelzések készítése azonban soha nem történhet valamiféle
automatizmus szerint. Szem előtt kell tartanunk azt a tényt, hogy az
általunk éppen vizsgált időben változó jelenségeket sok-sok tényező befo-
lyásolja. A bemutató példáinkban vizsgált postai levélforgalmat például az
is befolyásolja, hogy a megfigyelt időszakban voltak-e választások; de a
jövőben egészen biztos hatással lesz rá a számítógépek még nagyobb mér-
tékű elterjedése. (A családi levelezések is áttevődhetnek az internetre, az
elektronikus aláírás elfogadásával pedig egy sor hivatalos irat sem feltétle-
nül fog papíralapú dokumentum formájában utazni az ország egyik helyé-
ről a másikra stb.) Ezek szerint, az előrejelzés szerves része kell, hogy le-
gyen a befolyásoló tényezők vizsgálata. Ilyen jellegű elemzésekre azonban
az oktatás keretei nem nyújtnak lehetőséget. Az el nem végzett vizsgálat
szükségességét azonban a szöveges megfogalmazásban érzékeltetni tudjuk.
Az előrejelzést technikája más az analitikus és más a mozgóátlagolású
trendszámítás esetén. Ha egyenletekkel fejeztük ki az alapirányzatot,
akkor első lépésben meg kell állapítanunk az előre jelezni kívánt időhöz
tartozó t i adatot, (Továbbvezetjük a számítások során használt t i -
sorozatot.) majd ezt az adatot behelyettesítjük az egyenletbe. Így megkap-
juk a jövőre vonatkozó trendadatot.
Ha az alapirányzat kimutatására a mozgóátlagolás módszerét hasz-
náltuk, akkor több megoldás is kínálkozik az előrejelzésre. A legegysze-
rűbb eljárás a következő. A trendadatokból kiszámítjuk az átlagos abszolút

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 321 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 322 ►

változást vagy az átlagos relatív változást, s ennek további jellemző voltát


feltételezve kapjuk meg a jövőre vonatkozó trendadatot.
Természetesen, ha az idősorban szezonális ingadozást is megfigyel-
tünk, akkor elsődleges előrejelzéseinket ennek a hatásnak a nagyságát
(mértékét) kifejező adattal (szezonális eltérés vagy szezonindex) módosí-
tani kell.

BEMUTATÓ PÉLDA I.

Jelezzük előre a magyarországi személygépkocsi állomány nagyságát 2006,


2007, 2008 évekre! (Lásd: 12.1. és 12.2. sz. tábla!)
Az utolsó megfigyelt év 2003 volt. Ez a t i = 15 jelzőszámot kapta, így
2004-hez t i = 16 , 2005-höz t i = 17 és az első előrejelzendő évhez t i = 18
stb. tartozik. Ezeket behelyettesítve a személygépkocsik mennyiségének
alakulását leíró lineáris ill. exponenciális egyenletekbe, a következő adato-
kat kapjuk.
A lineáris egyenlet:
yˆ i = 1829,2 + 50,5t i (ezer db)

yˆ 2006 = 1829,2 + 50,5 ∗18 = 2738,2 ezer db

yˆ 2007 = 1829,2 + 50,5 ∗19 = 2788,7 ezer db

yˆ 2008 = 1829,2 + 50,5 ∗ 20 = 2839,2 ezer db


Az exponenciális trendegyenlet:
yˆ i = 1846 ∗1,0234 ti (ezer db)

yˆ 2006 = 1846 ∗1,023418 = 2799,3 ezer db

yˆ 2007 = 1846 ∗1,023419 = 2864,8 ezer db

yˆ 2007 = 1846 ∗1,0234 20 = 2931,8 ezer db


Jól látható, hogy a kétféle egyenlet eltérő „jóslattal” szolgál. Az exponenciá-
lis egyenlet az egyes évekre mindig nagyobb gépkocsi darabszámot mutat,
mint a lineáris. Sőt a különbség az előre jelzett adatok között egyre nő

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 322 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 323 ►

(+2,2264; +2,7; +3,3 %), ezért nem mindegy, hogy melyik egyenletet fogad-
juk el jobbnak, és használjuk. Tekintettel arra, hogy az eltérésnégyzet-összeg
a lineáris egyenletnél kisebb (32.554,1〈43.841,9), javasolt ezzel dolgozni.265
BEMUTATÓ PÉLDA II.

Jelezzük előre a vizsgált postahivatal levélforgalmát 2006 egyes hónapjaira,


azt feltételezve, hogy a levélforgalom alapirányzata az állandó abszolút
változás! (Lásd: 12.5., 12.6. és 12.7. sz. táblák.)
A mozgóátlagolású trendszámítás eredményeként kapott első trend-
adat (2002. július) 16.095, az utolsó (2005. június) 14.286 db, ezeket alapul
véve az átlagos abszolút változás:
14286 − 16095
d= ≅ −38,5 db
48 − 1
Ha ez a csökkenő tendencia folytatódik, akkor 2006 egyes hónapjaira a
következő adatok várhatók:
12.9. sz. tábla
hónap jan. febr. márc. … szept. okt. nov. dec.
ŷij 14.248 14.209 14.171 … 13.940 13.902 13.863 13.825

Ha azonban a jövőre vonatkozóan csak a 12.9.sz. táblában sorakozó ada-


tokat közölnénk a postahivatal vezetőivel, akkor nem tudnának alaposan
felkészülni az egyes hónapok csúcsforgalmára. (Pedig ez a szezonhatás
vizsgálatának célja.) Módosítsuk előre jelzésünket a szezonhatással először
abszolút, majd relatív módon!

12.10. sz. tábla


hónap jan. febr. márc. … szept. okt. nov. dec.
ŷij 14.248 14.209 14.171 … 13.940 13.902 13.863 13.825
yˆ ij + s j 14.779 12.328 15.021 … 10.834 13.923 11.974 23.151
ŷij ∗ s ∗j 14.705 12.497 14.833 … 12.606 13.891 12.204 21.897

264 2.799,2/2.738,2=1,022277→102,2%→+2,2%; stb.


265 Természetesen a számítógépek korában már könnyen mondhatjuk, célszerűbb minden lehetsé-
ges változatot végigszámolni, és a terveket (az előrejelzéseket) is több variációban elkészíteni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 323 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 324 ►

A kiemelt adatok számítása:


yˆ 2006. X . = 13902 + 21 = 13923 db

yˆ 2006. X . = 13902 ∗ 0,9992 = 13891 db

A kiemelt adatok jelentése.


♥ Abban az esetben, ha a postai levélforgalmat befolyásoló tényezők
elkövetkező időben nem változnak meg jelentős mértékben, akkor a kimu-
tatott alapirányzat és a rendszeresen ismétlődő szezonhatások figyelembe
vételével arra számíthatunk, hogy 2006. októberében a vizsgált postahiva-
talban 13.923 db levelet fognak feladni az ügyfelek (a szezonális ingado-
zást eltérés formájában számítva).266

12.6. Záró példa


Ahogy arról már esett szó, gyakori hallgatói tévedés, hogy a szezonokra
bontott idősorokból nem lehet egyenletet számolni, ezért fontosnak tart-
juk ennek bemutatását. A következőkben postai levélforgalom adatait
elemezzük mindkét tanult egyenlettípussal.
12.6.1. Lineáris egyenlet, szezonális eltérés, véletlen eltérés

12.10.sz. tábla

év hó ti yij t i2 t i yij ŷij eij eij2


2001 jan. 1 17.603 1 17.603 16.898 705 497.405
febr. 2 12.864 4 25.728 16.855 -3.991 15.930.635
márc. 3 15.781 9 47.343 16.813 -1.032 1.064.837
ápr. 4 18.570 16 74.280 16.770 1.800 3.238.205
máj. 5 14.973 25 74.865 16.728 -1.755 3.080.334
jún. 6 12.632 36 75.792 16.686 -4.054 16.432.300
júl. 7 13.811 49 96.677 16.643 -2.832 8.021.735
aug. 8 15.869 64 126.952 16.601 -732 535.613
szept. 9 12.994 81 116.946 16.558 -3.564 12.705.271
okt. 10 15.636 100 156.360 16.516 -880 774.461
nov. 11 13.944 121 153.384 16.474 -2.530 6.398.999

266 Hasonlóképpen lehet megfogalmazni a szezonindex figyelembevételével számított


adatot.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 324 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 325 ►

dec. 12 28.418 144 341.016 16.431 11.987 143.683.050


2002 jan. 13 17.695 169 230.035 16.389 1.306 1.706.151
febr. 14 14.980 196 209.720 16.346 -1.366 1.867.028
márc. 15 22.697 225 340.455 16.304 6.393 40.870.684
ápr. 16 15.691 256 251.056 16.262 -571 325.551
máj. 17 16.414 289 279.038 16.219 195 37.962
jún. 18 18.176 324 327.168 16.177 1.999 3.997.002
júl. 19 16.245 361 308.655 16.134 111 12.246
aug. 20 16.200 400 324.000 16.092 108 11.679
szept. 21 15.924 441 334.404 16.050 -126 15.755
okt. 22 17.902 484 393.844 16.007 1.895 3.590.619
nov. 23 14.912 529 342.976 15.965 -1.053 1.108.170
dec. 24 27.703 576 664.872 15.922 11.781 138.785.226
2003 jan. 25 15.848 625 396.200 15.880 -32 1.016
febr. 26 14.530 676 377.780 15.837 -1.307 1.709.464
márc. 27 12.866 729 347.382 15.795 -2.929 8.579.357
ápr. 28 17.665 784 494.620 15.753 1.912 3.657.108
máj. 29 12.492 841 362.268 15.710 -3.218 10.357.021
jún. 30 12.265 900 367.950 15.668 -3.403 11.579.197
júl. 31 14.548 961 450.988 15.625 -1.077 1.160.815
aug. 32 11.261 1.024 360.352 15.583 -4.322 18.679.690
szept. 33 14.859 1.089 490.347 15.541 -682 464.565
okt. 34 15.864 1.156 539.376 15.498 366 133.825
nov. 35 12.583 1.225 440.405 15.456 -2.873 8.252.800
dec. 36 25.893 1.296 932.148 15.413 10.480 109.822.894
2004 jan. 37 18.145 1.369 671.365 15.371 2.774 7.695.367
febr. 38 13.019 1.444 494.722 15.329 -2.310 5.333.960
márc. 39 15.202 1.521 592.878 15.286 -84 7.077
ápr. 40 16.393 1.600 655.720 15.244 1.149 1.320.855
máj. 41 14.274 1.681 585.234 15.201 -927 859.894
jún. 42 16.470 1.764 691.740 15.159 1.311 1.718.998
júl. 43 13.500 1.849 580.500 15.116 -1.616 2.613.019
aug. 44 13.461 1.936 592.284 15.074 -1.613 2.602.005
szept. 45 13.190 2.025 593.550 15.032 -1.842 3.391.720
okt. 46 13.480 2.116 620.080 14.989 -1.509 2.277.841

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 325 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 326 ►

nov. 47 13.495 2.209 634.265 14.947 -1.452 2.107.843


dec. 48 17.713 2.304 850.224 14.904 2.809 7.888.063
2005 jan. 49 13.004 2.401 637.196 14.862 -1.858 3.452.238
febr. 50 12.425 2.500 621.250 14.820 -2.395 5.734.153
márc. 51 15.085 2.601 769.335 14.777 308 94.742
ápr. 52 12.814 2.704 666.328 14.735 -1.921 3.689.426
máj. 53 13.349 2.809 707.497 14.692 -1.343 1.804.662
jún. 54 12.588 2.916 679.752 14.650 -2.062 4.251.706
júl. 55 15.391 3.025 846.505 14.608 783 613.785
aug. 56 14.054 3.136 787.024 14565 -511 261.270
szept. 57 14.182 3.249 808.374 14.523 -341 116.100
okt. 58 13.865 3.364 804.170 14.480 -615 378.624
nov. 59 16.249 3.481 958.691 14.438 1.811 3.280.035
dec. 60 19.141 3.600 1.148.460 14.396 4.745 22.519.744
össz.: 1.830 93.8797 73.810 27.870.129 938.797 0 663.101.798

Az egyenlet paramétereinek számítása és a levélforgalom alakulását leíró


lineáris egyenlet:
27870129 − 1830 ∗ 938797 / 60
β1 = = −42,4106 db
73810 − 1830 2 / 60
938797 1830
β0 = − (−42,4106) ∗ = 16940,14 db
60 60

yˆ ij = 16940 − 42,4t i (db )

A szezonális eltérés számítása:


12.11.a) sz. tábla
hó →
jan. febr. márc. ápr. máj. jún.
év↓
2001 705 -3.991 -1.032 1.800 -1.755 -4.054
2002 1.306 -1.366 6.393 -571 195 1.999
2003 -32 -1.307 -2.929 1.912 -3.218 -3.403
2004 2.774 -2.310 -84 1.149 -927 1.311
2005 -1.858 -2.395 308 -1.921 -1.343 -2.062
összesen 2.896 -11.369 2.656 2.370 -7.049 -6.208
átlag 579 -2.274 531 474 -1.410 -1.242

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 326 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 327 ►

12.11.b) sz. tábla


hó →
júl. aug. szept. okt. nov. dec.
év↓
2001 -2.832 -732 -3.564 -880 -2.530 11.987
2002 111 108 -126 1.895 -1.053 11.781
2003 -1.077 -4.322 -682 366 -2.873 10.480
2004 -1.616 -1.613 -1.842 -1.509 -1.452 2.809
2005 783 -511 -341 -615 1.811 4.745
összesen -4.632 -7.070 -6.554 -744 -6.096 41.801
átlag -926 -1.414 -1.311 -149 -1.219 8.360

A szezonális eltérések számítása most is átlagolással történt, de az osztó-


ban 5 szerepelt (az egyenletek számítása esetén nincs adatvesztés); korrigá-
lásra pedig nem volt szükség, az egyes hónapokra meghatározott átlagok
összege ui. mindössze 1 darabbal tér el a nullától.
Néhány a 12.11. sz. táblában szereplő adat számítása (Szürke háttérrel
és erősebb kerettel emeltük ki.):
y 2001.VII . − yˆ 20001.VII . = 13811 − 16643 = −2832 db

− 4632
sVII . = ≅ −926 db
5
A véletlenhatás (eltérés) számítása:

12.12.a) sz. tábla


hó →
jan. febr. márc. ápr. máj. jún.
év↓
2001 126 -1.717 -1.563 1.326 -345 -2.812
2002 727 907 5.862 -1.045 1.605 3.241
2003 -611 -611 966 -3.460 1.438 -1.808
2004 2.195 -36 -615 675 483 2.553
2005 -2.437 -121 -223 -2.395 66 -820

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 327 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 328 ►

12.12.b) sz. tábla


hó →
júl. aug. szept. okt. nov. dec.
év↓
2001 -1.906 682 -2.254 -731 -1.310 3.627
2002 1.037 1.522 1.185 2.044 166 3.420
2003 -2.161 -151 -2.908 629 515 -1.654
2004 -690 -199 -531 -1.360 -233 -5.552
2005 1.710 903 970 -467 3.030 -3.615

A kiemelt adat számítása:


v2003.I . = y2003.I . − yˆ 2003. I . − sI . = 15848 − 15880 − 579 = −611 db

♥SZÖVEGES ELEMZÉS:
A postai levélforgalom megfigyelt adatai alapján kiszámított, az alapirányza-
tot kifejező lineáris trendegyenlet szerint – ha egyéb hatások nem érvényesül-
tek volna – 2000. decemberében 16.940 (β 0 ) darab levelet adtak volna fel az
ügyfelek; ill. a levélforgalom negyedévről negyedévre ≅ 42 (β1 ) darabbal
csökkent, és ha a befolyásoló tényezőkben lényeges változás nem következik
be, akkor ekkora csökkenésre számíthatunk az elkövetkező hónapokban is.
A postai levélforgalomban – legalábbis egyes hónapokban – jelentős
szezonális eltéréseket is megfigyelhettünk, és ezek további ismétlődésére is
számíthatunk. Így például februárban a trend alatti (-2.274 db), december-
ben pedig a trend feletti (+8.360 db) forgalomra kell felkészülni.
A vizsgált időszak egyes hónapjaiban jelentős véletlenhatást is észlel-
tünk, így például 2001. februárjában a szokásosnál is kisebb volt a forga-
lom, ill. 2005. decemberében valamilyen – ezt még elemezni kell – ok mi-
att nem érvényesült olyan erősen a karácsony hatása, mint más években.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 328 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 329 ►

12.6.sz. ábra267

Kapuvár levélforgalmi adatai 2001 - 2005

y = -42,411x + 16940
30000

25000
levélforgalom (db)

20000

15000

10000

5000

0
0 10 20 30 40 50 60 70
évek / hónapok

A kiugrásokat mutató vonal = megfigyelt adatok


a negatív meredekségű egyenes = lineáris egyenlet pontjainak
halmaza

12.6.2. Exponenciális egyenlet, szezonindex, véletlen index

12.13. sz. tábla


t i ∗ lg yij yij / yˆ ij
év hó ti yij t i2 lg yij ŷij eij2

2001 jan. 1 17.603 1 4,2456 4,2456 16.511 1.191.530 1,0661


febr. 2 12.864 4 4,1094 8,2188 16.471 13.007.039 0,7810
márc. 3 15.781 9 4,1981 12,5944 16.430 420.848 0,9605
ápr. 4 18.570 16 4,2688 17,0752 16.389 4.756.628 1,1331
máj. 5 14.973 25 4,1753 20,8765 16.348 1.891.817 0,9159
jún. 6 12.632 36 4,1015 24,6088 16.308 13.512.511 0,7746
júl. 7 13.811 49 4,1402 28,9816 16.268 6.034.592 0,8490
aug. 8 15.869 64 4,2005 33,6044 16.227 128.339 0,9779

267Az ábrát az EXCEL-program grafikon szerkesztőjével készítettük, az egyenletet a


program írta fel.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 329 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 330 ►

szept. 9 12.994 81 4,1137 37,0237 16.187 10.195.556 0,8027


okt. 10 15.636 100 4,1941 41,9413 16.147 261.071 0,9684
nov. 11 13.944 121 4,1444 45,5883 16.107 4.678.370 0,8657
dec. 12 28.418 144 4,4536 53,4431 16.067 152.545.829 1,7687
2002 jan. 13 17.695 169 4,2479 55,2221 16.027 2.781.370 1,1041
febr. 14 14.980 196 4,1755 58,4572 15.988 1.015.167 0,9370
márc. 15 22.697 225 4,3560 65,3395 15.948 45.549.643 1,4232
ápr. 16 15.691 256 4,1957 67,1304 15.908 47.284 0,9863
máj. 17 16.414 289 4,2152 71,6586 15.869 296.980 1,0343
jún. 18 18.176 324 4,2595 76,6710 15.830 5.504.972 1,1482
júl. 19 16.245 361 4,2107 80,0037 15.791 206.552 1,0288
aug. 20 16.200 400 4,2095 84,1903 15.751 201.237 1,0285
szept. 21 15.924 441 4,2021 88,2431 15.712 44.779 1,0135
okt. 22 17.902 484 4,2529 93,5638 15.673 4.966.357 1,1422
nov. 23 14.912 529 4,1735 95,9913 15.635 522.213 0,9538
dec. 24 27.703 576 4,4425 106,6206 15.596 146.581.520 1,7763
2003 jan. 25 15.848 625 4,2000 104,9994 15.557 84.517 1,0187
febr. 26 14.530 676 4,1623 108,2189 15.519 977.617 0,9363
márc. 27 12.866 729 4,1094 110,9550 15.480 6.834.585 0,8311
ápr. 28 17.665 784 4,2471 118,9192 15.442 4.941.917 1,1440
máj. 29 12.492 841 4,0966 118,8023 15.404 8.478.036 0,8110
jún. 30 12.265 900 4,0887 122,6600 15.366 9.613.412 0,7982
júl. 31 14548 961 4,1628 129,0469 15.327 607.602 0,9491
aug. 32 11.261 1024 4,0516 129,6505 15.290 16.228.981 0,7365
szept. 33 14.859 1089 4,1720 137,6757 15.252 154.172 0,9743
okt. 34 15.864 1156 4,2004 142,8140 15.214 422.672 1,0427
nov. 35 12.583 1225 4,0998 143,4924 15.176 6.724.591 0,8291
dec. 36 25.893 1296 4,4132 158,8746 15.139 115.657.359 1,7104
2004 jan. 37 18.145 1369 4,2588 157,5740 15.101 9.265.393 1,2016
febr. 38 13.019 1444 4,1146 156,3539 15.064 4.180.726 0,8643
márc. 39 15.202 1521 4,1819 163,0941 15.026 30.846 1,0117
ápr. 40 16.393 1600 4,2147 168,5863 14.989 1.970.804 1,0937
máj. 41 14.274 1681 4,1545 170,3364 14.952 459.707 0,9547

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 330 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 331 ►

jún. 42 16.470 1764 4,2167 177,1011 14.915 2.418.088 1,1043


júl. 43 13.500 1849 4,1303 177,6044 14.878 1.898.978 0,9074
aug. 44 13.461 1936 4,1291 181,6794 14.841 1.904.896 0,9070
szept. 45 13.190 2025 4,1202 185,4110 14.804 2.606.342 0,8910
okt. 46 13.480 2116 4,1297 189,9657 14.768 1.658.287 0,9128
nov. 47 13.495 2209 4,1302 194,1181 14.731 1.528.102 0,9161
dec. 48 17.713 2304 4,2483 203,9180 14.695 9.110.294 1,2054
2005 jan. 49 13.004 2401 4,1141 201,5898 14.658 2.736.621 0,8871
febr. 50 12.425 2500 4,0943 204,7148 14.622 4.826.650 0,8497
márc. 51 15.085 2601 4,1785 213,1058 14.586 249.257 1,0342
ápr. 52 12.814 2704 4,1077 213,5996 14.550 3.012.355 0,8807
máj. 53 13.349 2809 4,1254 218,6488 14.514 1.356.230 0,9198
jún. 54 12.588 2916 4,1000 221,3977 14.478 3.570.670 0,8695
júl. 55 15.391 3025 4,1873 230,2997 14.442 901.058 1,0657
aug. 56 14.054 3136 4,1478 232,2768 14.406 123.894 0,9756
szept. 57 14.182 3249 4,1517 236,6490 14.370 35.457 0,9869
okt. 58 13.865 3364 4,1419 240,2314 14.335 220.622 0,9672
nov. 59 16.249 3481 4,2108 248,4388 14.299 3.801.736 1,1364
dec. 60 19.141 3600 4,2820 256,9179 14.264 23.787.319 1,3419
938.7
össz. 1.830 73810 251,1606 7641,015 921.640 668.721.998 –
97

Az egyenlet paramétereinek számítása és a levélforgalom alakulását leíró


exponenciális egyenlet:
7641,015 − 1830 ∗ 251,1606 / 60
lg β1 = = −0,001077149 → β1 = 0,9975 ↓
73810 − 1830 2 / 60
99,75% → -0,25%
251,1606 1830
lg β 0 = − (−0,001077149) ∗ = 4,218863 →≅ 16552,5 db
60 60

yˆ ij = 16552,5 ∗ 0,9975ti db

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 331 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 332 ►

A szezonindex számítása:
12.14.a) sz. tábla
hó →
jan. febr. márc. ápr. máj. jún.
év↓
2001 1,0661 0,7810 0,9605 1,1331 0,9159 0,7746
2002 1,1041 0,9370 1,4232 0,9863 1,0343 1,1482
2003 1,0187 0,9363 0,8311 1,1440 0,8110 0,7982
2004 1,2016 0,8643 1,0117 1,0937 0,9547 1,1043
2005 0,8871 0,8497 1,0342 0,8807 0,9198 0,8695
összesen 5,2776 4,3683 5,2607 5,2377 4,6356 4,6948
átlag 1,0555 0,8737 1,0521 1,0475 0,9271 0,9390
korrigált
1,0367 0,8581 1,0334 1,0289 0,9106 0,9222
átlag
% 3,6693 -14,1915 3,3389 2,8869 -8,9411 -7,7789
12.14.b) sz. tábla
hó →
júl. aug. szept. okt. nov. dec.
év↓
2001 0,8490 0,9779 0,8027 0,9684 0,8657 1,7687
2002 1,0288 1,0285 1,0135 1,1422 0,9538 1,7763
2003 0,9491 0,7365 0,9743 1,0427 0,8291 1,7104
2004 0,9070 0,8910 0,8910 0,9128 0,9161 1,2054
2005 1,0657 0,9756 0,9869 0,9672 1,1364 1,3419
összesen 4,7996 4,6094 4,6683 5,0333 4,7011 7,8027
átlag 0,9599 0,9219 0,9337 1,0067 0,9402 1,5605
korrigált
0,9428 0,9055 0,9170 0,9887 0,9234 1,5327
átlag
% -5,7186 -9,4550 -8,2985 -1,1287 -7,6551 53,2724
A szezonindexek számítása az egyszerűbb átlagolással (= az oszlopok ada-
tainak összege osztva az évek számával) történt. Az átlagok összege azon-
ban nem pontosan 12 volt, ezért korrigáltunk. Majd meghatároztuk a 100
% (= nincs szezonhatás) –tól való pozitív (= a szezon hatására a trend-
adatnál nagyobb a megfigyelt adat) és negatív (= a szezon hatására a
trendadatnál kisebb a megfigyelt adat) eltéréseket.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 332 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 333 ►

Példa az átlagolásra: július


⎛ yij ⎞
∑ ⎜⎝ yˆ ij ⎟⎠ 0,8490 + 1,0288 + ... + 1,0756 4,7996
átlag = = = ≅ 0,9599
n 5 5
Példa a korrigálásra:
• korrekciós tényező =

k ∗
=
∑s ∗
j
=
1,0555 + 0,8737 + ... + 0,9402 + 1,5605
≅ 1,01815
j
k 12
• korrigálás július =
∗ átlag 0,9599
sVII . = = = 0,9428 → 94,28% →≅ −5,72%
k ∗j 1,01815

A véletlenhatás (index) számítása:

12.15.a) sz. tábla


hó →
jan. febr. márc. ápr. máj. jún.
év↓
2001 1,0284 0,9102 0,9295 1,1013 1,0058 0,8399
2002 1,0650 1,0919 1,3772 0,9587 1,1359 1,2451
2003 0,9826 1,0911 0,8043 1,1119 0,8906 0,8655
2004 1,1590 1,0072 0,9790 1,0630 1,0484 1,1974
2005 0,8557 0,9903 1,0008 0,8560 1,0101 0,9428

12.15.b) sz. tábla


hó →
júl. aug. szept. okt. nov. dec.
év↓
2001 0,9005 1,0800 0,8754 0,9794 0,9375 1,1540
2002 1,0912 1,1359 1,1052 1,1552 1,0328 1,1589
2003 1,0067 0,8134 1,0624 1,0546 0,8979 1,1159
2004 0,9624 1,0017 0,9716 0,9232 0,9920 0,7864
2005 1,1304 1,0774 1,0762 0,9783 1,2306 0,8755

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 333 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 334 ►

Példa a véletlenindex számítására:


2003. január:


yij 15848
= v2003 .I . ∗
= = 0,9826 → 98,26% → −1,74%
yˆ ij ∗ s j 15557 ∗1,0367

♥SZÖVEGES ELEMZÉS:
A postai levélforgalom megfigyelt adatai alapján kiszámított, az alapirány-
zatot kifejező exponenciális trendegyenlet szerint – ha egyéb hatások nem
érvényesültek volna – 2000. decemberében ≅ 16.553 (β 0 ) darab levelet
adtak volna fel az ügyfelek. A levélforgalom negyedévről negyedévre ≅ -
0,25 (β1 ) %-kal csökkent, és ha a befolyásoló tényezőkben lényeges válto-
zás nem következik be, akkor ekkora csökkenésre számíthatunk az elkö-
vetkező hónapokban is.
A postai levélforgalomban – legalábbis egyes hónapokban – jelentős
szezonális eltéréseket is megfigyelhettünk, és ezek további ismétlődésére is
számíthatunk. Így például februárban a trend alatti (≅ -14,2 %), decem-
berben pedig a trend feletti (≅ +53,3 %) forgalomra kell felkészülni.
A vizsgált időszak egyes hónapjaiban jelentős véletlenhatást is észlel-
tünk, így például 2001. februárjában a szokásosnál is kisebb volt a forga-
lom (≅ -9,0 %), ill. 2005. decemberében valamilyen – ezt még elemezni
kell – ok miatt nem érvényesült olyan erősen a karácsony hatása (≅ -12,6
%), mint más években.
A 12.7. sz. ábrán a megfigyelt adatok közé illesztett exponenciális
egyenlet görbéjét láthatjuk. Az EXCEL-porgram segítségével az egyenletet
is kiírattuk az ábrára. Aki így dolgozik, annak a kitevő függvény használa-
tára is szüksége van, mert az EXCEL a természetes alapú logaritmussal
számol. (Ezért láthatunk – az előzőekben kiszámítotthoz hasonlítva – más
formátumú egyenletet az ábrán.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 334 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 335 ►

12.7.sz. ábra
Kapuvár levélforgalom 2001 - 2005

30000
y = 16552,4294e-0,0025x
25000
levélforgalom (db)

20000
Adatsor1
15000
Expon. (Adatsor1)
10000

5000

0
0 10 20 30 40 50 60 70
évek / hónapok

12.7. Gyakorló feladatok

1. feladat

A sziú indiánok lélekszáma (ember fő) az 1990-es évtizedben a következőképpen


alakult::
12.16.sz. tábla
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
19.251 19.427 19.362 19.513 19.725 20.184 20.462 20.591 20.873 21.240
1. Nevezze meg az idősor típusát!
2. Számítsa ki az idősor megfigyelt adatainak átlagát!
3. Számítsa ki az évenkénti abszolút változásokat!
4. Számítsa ki az átlagos abszolút változást (kétféleképpen)!
5. Számítsa ki az évenkénti relatív változásokat!
6. Számítsa ki az átlagos relatív változást (kétféleképpen)!
7. Számítsa ki dinamikus viszonyszámokat!
8. Az 1994 évi bázis viszonyszámra vonatkozóan mutassa be a lánc- és
bázisviszonyszámok közötti összefüggést!
9. Az 1997 évi láncviszonyszámra vonatkozóan mutassa be a lánc- és
bázisviszonyszámok közötti összefüggést!
10. Fogalmazza meg az 1995 évi lánc- és bázisviszonyszám jelentését!
11. Fogalmazza meg a kiszámított átlagok jelentését
12. Ábrázolja az idősort, készítsen pontdiagramot!
13. Számítsa ki a lineáris trend paramétereinek értékét!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 335 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 336 ►

14. Számítsa ki az exponenciális trend paramétereinek értékét!


15. Fogalmazza meg mindkét trend paramétereinek jelentését!
16. Számítsa ki minden évre a trendadatokat mindkét egyenlet-típus esetén!
17. Fogalmazza meg a egy-egy trendadat (lineáris, exponenciális)
jelentését!Magyarázza meg, miért térnek el egymástól a két egyenlet
alapján számított trendadatok!
18. Döntse el, hogy melyik egyenlettípus jellemzi jobban a sziú indiánok
létszám alakulását! Döntését természetesen indokolja is!
19. Végezzen előrejelzést 2005-re!
20. Fogalmazza meg az előre jelzett adat jelentését!
21. Nevezze meg a munkatáblák azon oszlopait, melyek összesen adata
egyenlő. Indokolja az egyenlőséget!
22. Keresse meg az utóbbi évek adatait! Csatolja azokat az eredeti idő-
sorhoz! Végezzen el minden számítást a hosszabb idősorral is!
23. Hasonlítsa össze az utóbbi évekre vonatkozó megfigyelt adatokat és
a rövidebb idősor alapján végzett előrejelzési adatait! Vonjon le követ-
keztetéseket!
2. feladat

Megfigyeltük egy vállalat dolgozóinak létszámát, majd a megfigyelt ada-


tokból kiszámítottuk mind a lineáris, mind az exponenciális egyenletet. Az
alábbi tábla ezt a három adatsort tartalmazza. Számítsa ki mindkét egyen-
let paramétereit, de ne a szokásos módon, használja fel a paraméterek je-
lentésével kapcsolatban tanultakat!
12.17. sz. tábla
év 1998 1999 2000 2001 2002 2003 2004
megfigyelt 220 238 261 277 297 325 340
lineáris 219 239 259 279 299 319 339
exponenciális 222 239 257 276 297 320 344

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 336 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 337 ►

3. feladat

12.18. sz. tábla


Építőipari tevékenység (egy régióban) millió Ft
év I. negyedév II. negyedév III. negyedév IV. negyedév
1998 3.639,7 3.662,1 3.714,9 3.765,8
1999 3.759,3 3.801,8 3.832,6 3.843,6
2000 3.803,7 3.834,9 3.881,2 3.904,8
2001 3.860,0 3.859,0 3.891,0 3.863,1
2002 3.840,0 3.867,5 3.886,2 3.888,9
2001 3.859,6 3.923,9 3.952,2 3.952,3
2004 3.891,5 3.894,1 3.906,6 3.909,2
2005 3.870,6 3.891,5 3.927,6 3.916,4
1. Számítsa ki az alapirányzatot kifejező adatokat mindhárom tanult módon!
2. Számítsa ki mindhárom estben mind a két tanult módon a szezonhatásokat!
3. Számítsa ki mindhárom estben mind a két tanult módon a véletlenhatásokat!
4. Végezzen előrejelzést!
5. Írjon szöveges elemzést!
6. Számítsa ki az átlagos abszolút- és relatív változást! (ismétlés268)
7. Számítsa ki a tanult dinamikus viszonyszámokat! (ismétlés)
8. Készítsen ábrát! (ismétlés)

12.8. Összefoglalás
idősor = olyan statisztikai sor, melyben az ismérv az idő
= mozgó sokaság, összege
1. tartam idősor
értelmes
fajtái
= álló sokaság, összege
2. állapot idősor
nem értelmes
1. viszonyszámok
2. középértékek
elemzése
3. ábrázolás
4. összetevőkre bontás

268 Ha szükséges, lapozzon vissza az 1., a 2. és a 3. fejezethez!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 337 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 338 ►

1. bázis [bi ] Mindkét típus adata-


2. lánc [li ] iból.
viszonyszámok
3. megoszlási [g i → wi ]
Csak a tartam idősor
adataiból.
– a megfigyelt adatokból [ y a ] vagy [ ykr ]
középértékek
– a változást kifejező adatokból d [ ]és/vagy [l ] i

– koordináta rendszerben ⎣pont-, vonal-, oszlopdiagram⎦


ábrázolás
– koordináta rendszeren kívül ⎣oszlop, kör stb.⎦
1. alapirányzat (trend)
2. szezonhatás
összetevők
3. véletlenhatás
4. konjunktúra hatás ⎣nem tananyag⎦

1. analitikus trendszámítás ⎣lineáris, exponenciális stb.⎦


az alapirányzat kimutatása
2. mozgóátlagolású trendszámítás
1. szezonális eltérés s j [ ]
a szezonhatás kimutatása
2. szezonindex s ∗j [ ]
1. véletlen eltérés [v ] ij

véletlen index [v ]
a véletlenhatás kimutatása ∗
2. ij

β 0 = y − β 1t
lineáris egyenlet yˆ i = β 0 + β1ti
β1 =
∑ t y − (∑ y )(∑ t )/ n
i i i i

∑ t − (∑ t ) / n
2 2
i i

lg β 0 = lg y − lg β1t
exponenciális
egyenlet
yˆ i = β 0 β 1ti
lg β1 =
∑ t lg y − (∑ lg y )(∑ t )/ n
i i i i

∑ t − (∑ t ) / n2 2
i i

t i = 1,2,3,..., n
a legjobb egyenlet
kiválasztása
legkisebb négyzetek módszere ∑e = ∑(y 2
i i − yˆ i ) min.!
2

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 338 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 339 ►

β 0 mindkét típusnál
a t i = 0 időpont (időszak), azaz a megfigyelés kezde-
te előtti időpont (időszak) trendadata
β1 lineáris
az időpontról időpontra (az időszakról időszakra)
bekövetkező abszolút változás
a paraméterek jelentése vagy így is fogalmazhatunk
átlagos abszolút változás ≅ d ( )
β1 exponenciális
az időpontról időpontra (az időszakról időszakra)
bekövetkező abszolút változás
vagy így is fogalmazhatunk
átlagos abszolút változás ≅ d ( )
az összetevőkre bontás a múlt megismerése
felhasználása a jövő előrejelzése

12.9. Mintapéldák korábbi vizsgadolgozatokból

1. minta

Egy kereskedelmi vállalat forgalmának (ezer Ft) leírására 2000-2005 év elejétől – év végé-
ig) közötti időre (negyedéves bontásban) az alábbi egyenletet találták a legjobbnak:
yˆ i = 6040 + 80t i

Egyes megfigyelt adatok időrendben:


2002. I. né. 2002. II. né. 2004. II. né. 2004. III. né.
6000 7600 8000 8900
Ismerjük továbbá az egyes negyedévekre vonatkozó korrigált szezonális eltérések (eFt)
- 600 +680 ………… -1780

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 339 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 340 ►

2.1. Fogalmazza meg az egyenlet paramétereinek, valamint a III. negyedévi


szezonindexnek a jelentését!
1. pa-
raméter
2. pa-
raméter
szezon-
index
2.2. Végezzen becslést, azaz határozza meg az alábbi időpontokra a trendada-
tokat!
1999. III. né. 2002. II. né. 2005. IV: né. 2007. II. né

2.3. Fogalmazza meg a 2002. II. negyedévére vonatkozó adat jelentését!

2.4. Számítsa ki 2.2. részfeladatban megadott időpontokra a véletlenhatást!


1999 III. né. 2002. II. né. 2005. IV: né. 2007. II. né

2.5. Fogalmazza meg a 2.4. feladatban kiszámított egyik (tetszőleges) adat jelentését!

2.6. Nevezze meg az analitikus trendszámítás és a mozgóátlagolású trendszámí-


tás közti alapvető különbséget!

Megjegyzés: a vizsgán természetesen több hely lesz a számítások és a megfogalmazások


feltüntetésére.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 340 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 341 ►

2. minta

Az egy főre jutó húsfogyasztás ( = hús + húskészítmény) (kg):

év hús
1990 75,8
1991 74,1
1992 75,2
1993 70,5
1994 69,0
1995 65,2
1996 61,9
1997 60,8
1998 63,7
1999 63,3
2000 73,2
2001 70,4
2002 75,4
összesen

2.1. Írja fel az alapirányzatot kifejező lineáris trendfüggvényt!

2.2. Fogalmazza meg a változást kifejező paraméter pontos jelentését!

2.3. Az idősor alapirányzatát kifejezendő az alábbi egyenletet is kiszámították:


yˆ i = 71,469 * 0,9948t Fogalmazza meg itt is a változást kifejező paraméter
pontos jelentését!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 341 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 342 ►

2.4. Végezzen előrejelzést!


2006

2007

2010

2.5. Mit kellett volna másképp tenniük az adatokat összegyűjtő szakembereknek,


hogy havi bontásban adhassunk előrejelzést!

2.6. Hogyan lehet előrejelzést végezni, ha az egyes hónapok eltérő jellegét is fi-
gyelembe akarjuk venni? Kétféle megoldást kérek.

3. minta

Egy hazánkba érkező külföldire jutó idegenforgalmi bevétel (USD) alakulása:


év bevétel
1990 21,7
1991 30,2
1992 36,8
1993 29,1
1994 35,8
1995 43,7
1996 56,4
1997 69,2
1998 78,4
1999 93,4
2000 110,0
2001 124,5
2002 109,7
2003 101,2
összesen

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 342 ►


Statisztika Az idősorok elemezése
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 343 ►

3.1. Írja fel az alapirányzatot kifejező exponenciális trendfüggvényt!

3.2. Fogalmazza meg a változást kifejező paraméter pontos jelentését!

3.3. Az idősor alapirányzatát kifejezendő az alábbi egyenletet is kiszámították:


yˆ i = 6,68 + 8,06 xi (∑ t i ≠ 0 )Fogalmazza meg itt is a változást kifejező
paraméter pontos jelentését!

3.4. Végezzen előrejelzést!


2006

2007

2010

4. minta

Egy gázszolgáltató vállalat bevételeiről (millió Ft) az 1998-2005 között időszakra negyed-
éves bontásban az alábbiakat ismerjük:

yˆ i = 200 * 1,024 ti (ti = 1,2,3..., n )

a korrigált szezonindexek (időrenben): 135, 95, 75,…. %

4.5. Számítsa ki a 4. szezonindexet és fogalmazza meg jelentését!

4.6. Becsülje meg a 2006 év egyes negyedéveinek várható bevételeit!


2006. I. né. 2006. II. né. 2006. III. né. 2006. IV. né.

4.7. Fogalmazza meg a becsült adatok egyikének jelentését!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 343 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 344 ►

13. Korreláció-, regresszió-számítás

13.1. Bevezetés
A korrelációszámítással már a 7. fejezetben foglalkoztunk, így a fogalom
jelentése – mennyiségi ismérvek közötti kapcsolat – már ismert. Sőt arról
is esett szó, hogy ha a megfigyelt adatokat kombinációs (korrelációs)
táblába rendezzük, akkor az elemzéshez felhasználhatjuk a vegyes kap-
( )
csolat szorossági mutatóit H , H 2 , s ezeket – a változók szerepének fel-
cserélése révén – kétféle szemléletben is kiszámíthatjuk.
Ebben a fejezetben a kapcsolat vizsgálatának további szorossági muta-
tóival ismerkedünk meg, illetve azokkal az egyenlettípusokkal, melyeket
leggyakrabban használnak a kapcsolat matematikai jellegű leírására. Ezek-
hez a számításokhoz az adatokat azonban már nem kombinációs táblába
rendezve, hanem listaszerűen adjuk meg. A kétváltozós modellekben
adat-párokat, a háromváltozósban pedig adat-hármasokat sorakoztatunk
fel egymás alatt.
A korreláció- és regresszió-számítás témakörét a szakirodalom általában
két részre tagolva – kétváltozós és többváltozós modellek – tárgyalja,
tankönyvünk is ezt a felosztást alkalmazza. A kétváltozós kapcsolatok egyik
szereplője a magyarázó változó (matematikai szóhasználattal: a független
változó, befolyásoló tényező), a másik pedig az eredményváltozó (mate-
matikai szóhasználattal: a függő változó, befolyásolt tényező). A kétválto-
zós egyenletek statisztikai felhasználásnak egyik sajátossága, hogy a válto-
zók szerepe felcserélhető. Ha a kérdést úgy tesszük fel, milyen mértékben
járult hozzá egy országban a GDP növekedéséhez a szállítási ágazat, akkor magya-
rázó változónak tekinthetjük pl. a járműállomány valamely jellemzőjét (da-
rabszámát, teherbíró-képességét stb.), és eredményváltozónak a GDP
nagyságát. A kérdést azonban fordítva is feltehetjük, milyen mértékben járult
hozzá a GDP növekedése az ország és azon belül a szállítási ágazat gépjárműállomá-
nyának növekedéséhez. Ez utóbbi esetben a GDP értéke (növekedése) a ma-
gyarázó változó, és természetesen a gépjárműállomány nagysága az ered-
ményváltozó. Így a kapcsolatot pl. lineárisnak feltételezve, két egyenletet
írhatunk fel: yˆ y x = β 0( y x ) + β1( y x ) xi ill. xˆ y x = β 0( x y ) + β1( x y ) yi és több
szorossági mutatót is. (Erről majd a későbbiekben szólunk részletesen.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 344 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 345 ►

A társadalmi-, gazdasági élet eseményeit elemezve azonban rendszere-


sen azt tapasztaljuk, hogy egy-egy vizsgált jelenség nagyságát nem egyetlen
tényező befolyásolja. Pl.: a paradicsom termésátlaga függ a felhasznált
vetőmag, növényvédő szer, műtrágya minőségétől, mennyiségétől; az eső
ill. a kiöntözött víz mennyiségétől; a napsütéses órák számától, és egyéb
időjárási tényezőktől; a földeken végzett munka mennyiségétől, az odafi-
gyeléstől (= a munka minőségétől), a kártevők elszaporodásától vagy ép-
pen hiányától stb. De hozhatunk példát az élet egészen más területéről is.
Egy család életszínvonala függ a keresők és eltartottak számától (arányá-
tól), jövedelmük nagyságától, az adózási és társadalombiztosítási elvoná-
soktól (a bruttó jövedelemből mennyi a szabadon felhasználható rész), a
család által fogyasztott javak és szolgáltatások árának változásától stb. Pél-
dáink – remélhetőleg – mindenki számára egyértelműen bizonyították,
hogy valóban szükség van több változó együttes vizsgálatára. Az ilyen
modellekben a magarázó változók száma lehet egynél több, de a különbö-
ző lehetséges tényezők modellbe való bevonásának logikai, matematikai,
számítástechnikai és pénzügyi korlátai is vannak. A többváltozós modellek
közül tananyagunk csak a háromváltozós lineáris egyenletet tartalmazza.

13.2. Kétváltozós elemzések


A matematikából ismert különböző egyenlettípusok közül elsődlegesen a
megfigyelt adatok ábrázolásának segítségével tudunk választani. Az ábrát,
egy pontdiagramot a koordinátarendszer pozitív negyedében helyezzük el.
A vízszintes tengelyen tüntetjük fel a magyarázó változó, a függőleges
tengelyen pedig az eredményváltozó értékeit.
• Ha a megfigyelt pontok közé leginkább egy egyenest tudunk illeszte-
ni, akkor a lineáris egyenlet paramétereinek kiszámítását érdemes el-
kezdeni.
• Ha a megfigyelt pontok közé leginkább egy görbét tudunk illeszteni,
akkor a célszerű újabb ábrát készíteni, ahol vagy csak az eredményvál-
tozó vagy mindkét változó logaritmusai szerepelnek. Ha a görbe így
„kiegyenesedik”, akkor vagy az exponenciális- (csak az eredményvál-
tozó megfigyelt értékeinek logaritmikus átalakítását végeztük el), vagy
a hatványkitevős (mindkét változó megfigyelt értékeinek logaritmikus
átalakítását elvégeztük) egyenlet paramétereinek kiszámítását célszerű
elvégezni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 345 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 346 ►

• Ha az ábrán a pontok vonulata egy olyan görbét mutat, melyen mini-


mum vagy maximum helyet fedezünk fel, akkor a parabola egyenlet
(= másodfokú polinom) használata indokolt.
• Ha pedig az ábrán elhelyezkedő pontok vonulata mindkét tengelyt
aszimptotikusan közelíti (többnyire intenzitási viszonyszámok meg-
figyelése esetén találkozunk ilyen ábrákkal), akkor hiperbolára kell
gondolnunk.
Természetesen az ábrák elkészítése nem kis feladat, – bár a számítógépek ebben is
segítségünkre vannak –, de semmiképpen nem felesleges tevékenység. Pl.: ha a megfigyelt
pontok alapján elkészített ábránkba beillesztjük a regressziós egyenlet vonalát, abból
további következtetéseket vonhatunk le; vagy egyszerűen ellenőrizhetjük addigi
számításainkat. (Ha pl., a görbe vagy az egyenes teljes terjedelmében a pontok fölött vagy
alatt fut, akkor biztos, hogy hibát követtünk el.)
Az egyenletekkel kapcsolatban elsőként ugyanaz a probléma merül fel,
mint amiről a trendszámítás során már szóltunk: a pontok közé illeszthető,
elvileg végtelen sok egyenes vagy görbe közül melyiket fogadjuk el a leg-
jobbnak. Most is az un. legkisebb négyzetek módszerét269 alkalmazzuk.
Azt az egyenletet fogadjuk el a kapcsolat jellemzésére legjobbnak, ame-
lyiknek pontjai legközelebb vannak a megfigyelt pontokhoz,270 azaz meg-
keressük a ∑ ( yi − yˆ i ) függvény minimum helyét. Ennek érdekében ké-
2

pezzük a függvény első deriváltját, ahol ez a nulla értéket felveszi, ott van
a minimum hely. A szükséges matematikai műveletek, és a lehetséges egy-
szerűsítések után kapjuk meg az un. normálegyenleteket. A keresett
egyenlet paramétereit közvetlenül ezekből is meghatározhatjuk, de a sta-
tisztikában inkább a képletek alkalmazása és értelmezése a szokásos meg-
oldás. A normálegyenletekből kétféle módon alakíthatunk ki képleteket.
• Az egyenletek rendezésével. Ekkor ugyanazokhoz a formulákhoz ju-
tunk, mint a trendszámításnál, csak t i helyett xi szerepel az összefüg-
gésekben.
• A másik lehetséges módszer a koordinátatengelyek x és y -val való
eltolása. Ennek következtében normálegyenleteink „rövidülnek” (=
egyes tagok „kiesnek”), és az előző módszer képleteinél egyszerűbbek-
hez jutunk.

269 Természetesen egyéb módszerek is léteznek, de ez a legegyszerűbb.


270 Lásd: 12.2.1.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 346 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 347 ►

Az exponenciális és a hatványkitevős egyenleteket – a trendszámításoz


hasonlóan – a logaritmikus átalakítás következtében lineáris összefüggés-
ként kezeljük. A parabola egyenlet megoldását a háromváltozós egyenletre
vezetjük vissza. A hiperbola egyenlet esetén pedig a reciprokképzés teszi
lehetővé a lineáris egyenlet értelemszerű alkalmazását.
Lineáris egyenlet:
yˆ i = β 0 + β1 xi

• ha nincs tengelyeltolás, és a magyarázó változó = x:

xi yi − (∑ xi )(∑ yi )/ n
β1 = ∑ β 0 = y − β1 * x ,
∑ x − (∑ x )
2 2
i i /n

ahol y =
∑y i
és x =
∑x i

n n
• tengelyeltolással, ha a magyarázó változó = x:

β1 =
∑d d x y
β 0 = y − β1 * x ,
∑d 2
x

ahol d x = ( xi − x ) és d y = ( yi − y )

Exponenciális egyenlet:

yˆ i = β 0 * β1xi → lg yˆ i = lg β 0 + xi ∗ lg β1

• ha nincs tengelyeltolás, ha a magyarázó változó = x:

lg β1 =
∑ x lg y − (∑ x )(∑ lg y )/ n
i i i i
lg β 0 = lg y − (lg β1 )* x ,
∑ x − (∑ x ) / n
2 2
i i

ahol lg y =
∑ lg y i

n
• tengelyeltolással, a magyarázó változó = x:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 347 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 348 ►

lg β1 =
∑d d x v
lg β 0 = lg y − (lg β1 )* x ,
∑d 2
x

ahol vi = lg yi és d v = (vi − v ) 271

Hatványkitevős egyenlet272:

yˆ i = β 0 * xiβ1 → lg yˆ i = lg β 0 + β1 (lg xi )

• ha nincs tengelyeltolás, ha a magyarázó változó = x:

(lg xi )(lg yi ) − (∑ lg xi )(∑ lg yi )/ n


β1 = ∑ lg β 0 = lg y − β1 * lg x ,
∑ (lg xi ) − (∑ lg xi ) / n
2 2

ahol ↓

lg y =
∑ lg y i
= v és lg x =
∑ lg x i
=u
n n
• tengelyeltolással, a magyarázó változó = x:

β1 =
∑d d u v
lg β 0 = lg y − β1 ∗ u ,
∑d 2
u

ahol ↓

vi = lg yi és d v = (vi − v ) és ui = lg xi és d u = (ui − u )

271 A segédváltozó (vi ) bevezetésére a képletek egyszerűbb felírása érdekében kerül sor.
272 Erre az egyenlettípusra bemutató példát nem talál, a részletes tárgyalás nem képezi
tananyagunk részét.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 348 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 349 ►

Parabola – egyenlet273:

yˆ i = β 0 + β1 ∗ xi + β 2 ∗ xi2 → yˆ i = β 0 + β1 ∗ x1 + β 2 ∗ x2 ,

ahol ↓

x1i = xi ( parabola ) és x2i = xi2( parab.)

Hiperbola – egyenlet274:
1
yˆ i = → zˆi = β 0 + β1 xi ,
β 0 + β 1 ∗ xi

1
ahol z i =
yi

• ha nincs tengelyeltolás, ha a magyarázó változó = x:

xi zi − (∑ xi )(∑ z i )/ n
β1 = ∑ β 0 = z − β1 * x ,
∑ xi2 − (∑ xi ) / n
2

ahol z =
∑z i
és x =
∑x i

n n
• tengelyeltolással, ha a magyarázó változó = x:

β1 =
∑d d x z

∑d 2
x
β 0 = z − β1 * x ,

d x = ( xi − x )
ahol és d z = ( yi − z )

273Részletezésére a háromváltozós egyenletnél kerül sor.


274 Erre az egyenlettípusra bemutató példát nem talál, a részletes tárgyalás nem képezi
tananyagunk részét.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 349 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 350 ►

A képletekben szereplő betűk jelentése:


β0 = β1 = n=
matematika: metszéspont az y- matematika: a kapcsolatot a megfigyelések
tengelyen kifejező tényező darabszáma
statisztika: lásd a szöveges statisztika: lásd a szöveges
magyarázat magyarázat
xi = yi u i , vi , z i = x, y, u , v, z=
a magyarázó változó az eredményváltozó segédváltozók egyszerű számtani
megfigyelt értékei megfigyelt értékei átlagok
d x , d y , du , dv , d z = ŷi =
a változók egyes értékeinek és átlaguknak regresszióérték, a kapcsolatot leíró
különbsége (= eltérése) egyenletek xi helyeken vett értékei, melyek
rajta vannak a megfigyelt pontok közé
illeszkedő egyenesen vagy görbéken

13.2.1. Lineáris kapcsolat (egyenlet)

A lineáris egyenlet β 1 paramétere a magyarázó változó egységnyi abszo-


lút változásához tartozó, és az eredményváltozóra vonatkozó abszolút
változás275. Mértékegysége a megfigyelt yi mértékegységével azonos.

(Pl.: ha a családok összes bevétele276 (ezer Ft / év) = xi és szórakozási kiadásaik összege (ezer Ft /

év) = yi , akkor β 1 megmutatja, hogy az összes bevétel ezer forintos emelkedése – pozitív kapcso-
latot feltételezve – hány ezer forinttal emeli meg szórakozási kiadásaik nagyságát.)

A lineáris egyenlet β 0 paramétere elvileg az xi = 0 helyen vett regresszió


érték, de gyakorlatilag igen kevés esetben van konkrét statisztikai jelentése.

(Előző példánkat folytatva: olyan család, amelyiknek összes bevétele a vizsgált évben
nulla, nyilván nincs; tehát β 0 paraméternek statisztikai jelentése nincs.)

275 Lásd: 12. fejezet, a lineáris trend paramétereinek jelentése.


276 Bevétel = bér + családi pótlék + ösztöndíj + kamatjövedelmek + stb.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 350 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 351 ►

BEMUTATÓ FELADAT

Néhány európai ország lakosságának születéskori várható élettartama277


(év) 2003-ban:
13.1.sz. tábla
élettartam (év)
országok d x d y d x2 d y2 dxd y ŷi ei2
xi yi
Ausztria 75,8 81,7 2,2 1,9 4,6 3,6 4,0839 81,6 0,0150
Belgium 75,1 81,1 1,5 1,3 2,1 1,7 1,8843 81,0 0,0098
Bulgária 68,6 75,3 -5,0 -4,5 25,5 20,3 22,7273 75,7 0,1230
Csehország 72,1 78,4 -1,5 -1,4 2,4 2,0 2,1706 78,5 0,0174
Dánia 74,8 79,5 1,2 -0,3 1,3 0,1 -0,3511 80,8 1,5730
Finnország 74,9 81,5 1,3 1,7 1,6 2,9 2,1269 80,8 0,4402
Franciaország 75,6 82,9 2,0 3,1 3,8 9,6 6,0498 81,4 2,2120
Görögország 75,4 80,7 1,8 0,9 3,1 0,8 1,5714 81,2 0,3004
Hollandia 76,0 80,7 2,4 0,9 5,5 0,8 2,1089 81,7 1,0857
Írország 75,2 80,3 1,6 0,5 2,4 0,2 0,7706 81,1 0,6138
Lengyelország 70,4 78,8 -3,2 -1,0 10,5 1,0 3,2594 77,1 2,7809
Magyarország 68,3 76,5 -5,3 -3,3 28,6 10,9 17,6635 75,4 1,2017
Nagy-Britannia 75,5 80,2 1,9 0,4 3,4 0,2 0,7339 81,3 1,2778
Németország 75,6 81,3 2,0 1,5 3,8 2,2 2,9231 81,4 0,0127
Norvégia 76,4 81,5 2,8 1,7 7,6 2,9 4,6706 82,1 0,3263
Olaszország 76,8 82,9 3,2 3,1 9,9 9,6 9,7648 82,4 0,2495
Portugália 73,8 80,5 0,2 0,7 0,0 0,5 0,1073 79,9 0,3237
Románia 67,6 74,9 -6,0 -4,9 36,6 24,1 29,6500 74,8 0,0052
Spanyolország 75,7 83,1 2,1 3,3 4,2 10,9 6,7702 81,5 2,5759
Svájc 77,8 83,0 4,2 3,2 17,3 10,2 13,2760 83,2 0,0500
Svédország 77,7 82,1 4,1 2,3 16,4 5,3 9,3077 83,1 1,0843
Szlovákia 69,9 77,6 -3,7 -2,2 14,0 4,9 8,2564 76,7 0,7730
Szlovénia 72,3 79,9 -1,3 0,1 1,8 0,0 -0,1290 78,7 1,4488
Törökország 66,2 70,9 -7,4 -8,9 55,4 79,3 66,2989 73,7 7,7017
összesen 1.767,5 1.915,3 0,0 0,0 262,0 203,7 215,6954 1.915,3 26,20193
szórás rez.
átlag: 73,6458 79,8041 1,091328
3,3754 2,9764 szórás:

277 Magyar statisztikai évkönyv 2003 (KSH – 2004; 554. old.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 351 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 352 ►

Megjegyzések a 13.1. sz. táblához:

• A tábla első oszlopa a megfigyelt országokat abc sorrendben tartalmazza, ennek az egyen-
let paraméterei, a kapcsolat szorossága és jellege szempontjából nincs befolyásoló szerepe.

• A feladat megoldása során a tengelyeltolásos módszerrel dolgoztunk. (Így kisebb


számokat kell feljegyeznünk, és a következő műveleteknél ismét bebillentyűzni a
zsebszámológépbe.) A módszer következménye, – és ez egy ellenőrzési pont is –
hogy ∑d = ∑d
x y = 0 , az ettől való esetleges (néhány tizednyi vagy még ki-
sebb értékű) eltérés a kerekítések következménye.
• Figyeljék meg! ∑ y = ∑ yˆ
i i Ez az egyezőség mindig fennáll, legfeljebb a kerekí-
tések miatt adódhat csekély eltérés.

• x , y = egyszerű számtani átlag, azaz x =


∑x i
és y =
∑y i

n n
• A két változó szórásának számításakor a nevezőben (n − 1) , a reziduális szórás

számításakor pedig (n − 2) szerepelt, azaz σx = ∑ (x i − x)


2

,
n −1

σy = ∑(y i − y)
2

és σe =
( yi − yˆ i )2
n −1 n−2
• A feladatot EXCEL-programmal oldottuk meg. A számítások során a számítógép az
összes tizedest megtartva dolgozott, így ha az összesen oszlop számadatait (kerekített ér-
tékek) behelyettesítjük a képletekbe, akkor a 3. – 4. tizedestől némi eltérést tapasztalunk.)
• FONTOS! Tanulja meg zsebszámológépe statisztikai programját használni, úgy
sokkal gyorsabban, a munkatábla kitöltögetése nélkül, a számok újra és újra történő
billentyűzése nélkül eredményhez juthat. Például, a SHARP ElL-531WH típusú
zsebszámológéppel így kellene dolgozni:
o Bekapcsoljuk a zsebszámológépet. ON/C
o Átállítjuk a megfelelő (lineáris egyenlet) statisztikai programra. MODE 1 1
o Bebillentyűzzük a magyarázó változó (x) első megfigyelt adatát (itt az Ausztriá-
ra vonatkozó 75,8-t), majd megnyomjuk a STO feliratú műveleti billentyűt.
o Bebillentyűzzük az eredményváltozó (y) első megfigyelt adatát (itt az Ausztri-
ára vonatkozó 81,7-t), majd megnyomjuk az M+ feliratú műveleti billentyűt.
o Az utóbbi két műveletet addig ismételgetjük (természetesen felváltva, és
mindig ebben a sorrendben), amíg az összes adat-párt be nem vittük a
zsebszámológép memóriájába.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 352 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 353 ►

o Ezután következik a eredmények és a részeredmények kinyerése. Ehhez min-


dig két műveleti billentyűt kell használnunk, és az első mindig az RCL.
ƒ β 0 paraméter ← RCL (
bemutató példánkban: 19,18329212
ƒ β1 paraméter ← RCL )
bemutató példánkban: 0,823140587
ƒ r szorossági mutató ← RCL ÷
bemutató példánkban: 0,933488779
ƒ x ← RCL 4
bemutató példánkban: 73,64583333
ƒ y ← RCL 7
bemutató példánkban: 79,80416667
ƒ A magyarázó változó szórása, nevezőben: (n − 1) RCL 5
bemutató példánkban: 3,375355591
ƒ Az eredményváltozó szórása, nevezőben: (n − 1) ← RCL 8
bemutató példánkban: 2,97635306
ƒ ∑ x ← RCL tizedespont
i
bemutató példánkban: 1767,5
ƒ ∑ xi2 ← RCL + /_
bemutató példánkban: 130431,05
ƒ ∑y i ← RCL 2
bemutató példánkban: 1915,3
ƒ ∑y 2
i ← RCL 3
bemutató példánkban: 153052,67
ƒ ∑ xy ← RCL 1
bemutató példánkban: 141269,56
ƒ n ← RCL 0
bemutató példánkban: 24
o A zsebszámológép a tengelyeltolás nélküli módszerrel dolgozik, de az aláb-
bi matematikai összefüggéseket felhasználva megkaphatjuk a tengelyeltolá-
sos módszerhez szükséges részeredményeket is.

∑x i − n ∗ x 2 = ∑ d x2

∑y i − n ∗ y 2 = ∑ d y2

∑x y i i − n ∗ x ∗ y = ∑ dxd y

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 353 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 354 ►

o A zsebszámológép segítségével az adatok egyszeri bevitelével mindkét


egyenlet – a változók szerepe felcserélve – felírható.
o A zsebszámológép segítségével a regresszió-értékeket is könnyen meghatározhatjuk.
ƒ Bebillentyűzzük a magyarázó változó azon értékét, amelyikhez a reg-
resszió-értéket meg akarjuk határozni, majd megnyomjuk a 2ndF
) billentyűket. (A zárójel-billentyű bal felső sarkában látjuk is a
szokásos statisztikai jelet.)
ƒ Ha valamennyi regresszió-értéket meg akarjuk ismerni, akkor termé-
szetesen ezt a művelet-sort minden xi érték számológépbe billen-
tyűzése mellett el kell végezni.

• megoldás tengelyeltolással, ha a magyarázó változó = x: (13.1.1. sz. ábra)

β1( y x ) =
∑d d
x y
=
215,6954
= 0,823141 ≅ 0,82 év
∑d 2
x 262

β 0( y x ) = y − β1( y x ) x = 79,80417 − 0,823141 ∗ 73,64583 = 19,18239 ≅ 19,2 év

yˆ i = 19,2 + 0,82 xi év

• megoldás tengelyeltolással, ha a magyarázó változó = y: (13.1.2. sz. ábra)

β1(x y ) =
∑d d x y
=
215,6954
= 1,05863 ≅ 1,06 év
∑d 2
y 203,7

β 0( x y ) = x − β1( x y ) y = 73,64583 − 79,80417 ∗1,05863 = −10,8372 ≅ −10,8 év

xˆi = −10,8 + 1,06 yi év

Az első egyenlet – yˆ i = 19,2 + 0,82 xi év – paramétereinek kiszámításánál


magyarázó változónak tekintettük a férfiak születéskori várható életkorát,
ennek megfelelően a
♥ β 0 paraméternek nincsen statisztikai jelentése (Egyik országban
sem szerepelt x megfigyelt értékei között nulla, vagy ahhoz nagyon közeli
érték.)
♥ β1 paraméter szerint pedig abban az országban, ahol 1 évvel több
a férfiak születéskori várható élettartama, 0,82 évvel magasabb a nők szü-
letéskori várható élettartama.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 354 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 355 ►

A második egyenlet szerint – xˆi = −10,8 + 1,06 yi év – paramétereinek


kiszámításánál magyarázó változónak tekintettük a nők születéskori várha-
tó életkorát, és ennek megfelelően a
β 0 paraméternek most nincsen statisztikai jelentése (Egyik or-
szágban sem szerepelt y megfigyelt értékei között nulla, vagy ahhoz na-
gyon közeli érték.)
♥ β1 paraméter szerint pedig abban az országban, ahol 1 évvel több a
nők születéskori várható élettartama, 1,06 évvel magasabb a férfiak szüle-
téskori várható élettartama.
Ahogy a trend-egyenesre (görbére) illeszkedő értékeknek, úgy regresz-
szió-egyenesre illeszkedő pontoknak is van statisztikai jelentése. A megfo-
galmazás azonban nem olyan egyszerű, mint a trendértékek jelentésének
leírása. A trendszámítás során a magyarázó változó (= az idő) folyamatosan
halad előre, nincs két azonos t i adat, így ha lineáris egyenlet esetén β1 ≠ 0 ,
akkor ŷi értékek mind különböznek egymástól. A regresszió-számítás so-
rán azonban a magyarázó változó értékei nem mind különböznek egymás-
tól. Egy végtelen elemszámú (vagy véges, de kellően nagy elemszámú) so-
kaság több egysége is felvehet azonos xi értéket, így az ŷi értékek sem
egyetlen sokasági egységhez tartozhatnak. Számpéldánkban ez azt jelenti,
hogy nemcsak Dániára lehet jellemző férfiak esetén a 74,8 év, mint szüle-
téskori várható élettartam, tehát a regresszió-értéket semmiképpen sem
vonatkoztathatjuk csak Dániára. A megfogalmazás tehát így helyes.
♥ Azokban az országokban, ahol a férfiak születéskori várható élet-
tartama 2003-ban 74,8 év – a lineáris regresszió szerint – a 2003-ban
világra jött nők születésükkor 80,8 éves élettartamra számíthatnak.
A bevezetőben említett és a zsebszámológép statisztikai programjának ismertetésénél
szereplő szorossági mutató(k)ra később térünk vissza.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 355 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 356 ►

Néhány európai ország férfi és női lakosásságának születéskori


várható élettartama (2003)
y = 0,8231x + 19,183
a nőkre vonatkozó adat (év) 84,0 R2 = 0,8714
82,0
80,0

78,0 Adatsor1
76,0 Lineáris (Adatsor1)
74,0
72,0

70,0
65,0 70,0 75,0 80,0

a férfiakra vonatkozó adat (év)

magyarázó változó = a férfiak születéskori várható élettartama

13.1.1. sz. ábra278

Néhány európai ország férfi és női lakosságának születéskori


várható élettartama (2003)

y = 1,0586x - 10,837
a férfiakra vonatkozó adatok

79,0
R2 = 0,8714
77,0
75,0
73,0 Adatsor1
(év)

71,0 Lineáris (Adatsor1)

69,0
67,0
65,0
70,0 75,0 80,0 85,0

a nőkre vonatkozó adatok (év)

magyarázó változó = a nők születéskori várható élettartama

13.1.2. sz. ábra

278 Az EXCEL-program minden szorossági mutatót R betűvel jelöl.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 356 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 357 ►

13.2.2. Exponenciális kapcsolat (egyenlet)

BEMUTATÓ FELADAT

13.2. sz. tábla


élettartam (év)
dx dx lg yi dv d xdv ŷi ei2
szág
or-

xi yi
1. 75,8 81,7 2,1542 4,6404 1,9122 0,0105 0,0226 81,6 0,0135
2. 75,1 81,1 1,4542 2,1146 1,9090 0,0073 0,0106 81,0 0,0137
3. 68,6 75,3 -5,0458 25,4604 1,8768 -0,0249 0,1258 75,6 0,0967
4. 72,1 78,4 -1,5458 2,3896 1,8943 -0,0074 0,0115 78,5 0,0033
5. 74,8 79,5 1,1542 1,3321 1,9004 -0,0014 -0,0016 80,7 1,5056
6. 74,9 81,5 1,2542 1,5729 1,9112 0,0094 0,0118 80,8 0,4729
7. 75,6 82,9 1,9542 3,8188 1,9186 0,0168 0,0329 81,4 2,2145
8. 75,4 80,7 1,7542 3,0771 1,9069 0,0051 0,0090 81,2 0,2917
9. 76 80,7 2,3542 5,5421 1,9069 0,0051 0,0121 81,8 1,1162
10. 75,2 80,3 1,5542 2,4154 1,9047 0,0030 0,0046 81,1 0,5909
11. 70,4 78,8 -3,2458 10,5354 1,8965 -0,0052 0,0169 77,1 3,0210
12. 68,3 76,5 -5,3458 28,5779 1,8837 -0,0181 0,0966 75,4 1,2729
13. 75,5 80,2 1,8542 3,4379 1,9042 0,0024 0,0045 81,3 1,2678
14. 75,6 81,3 1,9542 3,8188 1,9101 0,0084 0,0163 81,4 0,0125
15. 76,4 81,5 2,7542 7,5854 1,9112 0,0094 0,0260 82,1 0,3631
16. 76,8 82,9 3,1542 9,9488 1,9186 0,0168 0,0531 82,5 0,2024
17. 73,8 80,5 0,1542 0,0238 1,9058 0,0041 0,0006 79,9 0,3856
18. 67,6 74,9 -6,0458 36,5521 1,8745 -0,0272 0,1647 74,8 0,0069
19. 75,7 83,1 2,0542 4,2196 1,9196 0,0179 0,0367 81,5 2,5667
20. 77,8 83,0 4,1542 17,2571 1,9191 0,0174 0,0721 83,3 0,1059
21. 77,7 82,1 4,0542 16,4363 1,9143 0,0126 0,0512 83,2 1,2938
22. 69,9 77,6 -3,7458 14,0313 1,8899 -0,0119 0,0444 76,7 0,8910
23. 72,3 79,9 -1,3458 1,8113 1,9025 0,0008 -0,0011 78,6 1,6290
24. 66,2 70,9 -7,4458 55,4404 1,8506 -0,0511 0,3803 73,7 7,9450
Σ 1.767,5 1.915,3 0 262,04 45,6414 0,0000 1,2018 1.915,1 27,28
átl. 73,65 79,80 1,9017 rez.sz. 1,1136

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 357 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 358 ►

Megjegyzések a 13.2. sz. táblához:

• A tábla ugyanazoknak az országoknak – és ugyanazon sorrendben – a megfigyelt


adatait tartalmazza, mint a 13.1. sz.
• A számítási munkát most is az EXCEL programmal végeztük.
• A feladat megoldása során a tengelyeltolásos módszerrel dolgoztunk. A módszer
következménye, hogy ∑d = ∑d
x v = 0 , az ettől való esetleges (néhány tizednyi
vagy még kisebb értékű) eltérés a kerekítések következménye.
• Figyeljék meg! ∑ y = ∑ yˆ
i i Ez az egyezőség mindig fennáll, legfeljebb a kerekí-
tések miatt adódhat csekély eltérés. Bár az exponenciális egyenlet esetében, főleg ha
manuálisan dolgoztunk (és rendszeresen kerekítettünk) az eltérés nagyobb is lehet,
mint a lineáris egyenletnél.

• x , v = egyszerű számtani átlag, azaz x =


∑x i
és y =
∑ lg y = ∑ v
i i

n n n
• Az EXCEL program az ábrára természetes alapú logaritmust alkalmazva írja ki az
egyenletet, ezért látunk részben más számokat a 13.2.sz. ábrán és a képletek alapján
végzett számítások között. Ha össze akarjuk hasonlítani a tízes alapú logaritmust al-
kalmazó megoldást (13.2.sz. tábla) és a számítógépes megoldást, akkor az EXCEL
program kitevő függvényét kell alkalmazni.
• A korábban megnevezett (lineáris megoldás) zsebszámológép segítségével is meg-
kaphatjuk az exponenciális egyenlet paramétereit. Ekkor a MODE 1 3 progra-
mot kell választanunk. A megoldás során a zsebszámológép is a természetes alapú
logaritmusnak megfelelően írja ki β1 paraméter értékét, ezért ha a tízes alapú loga-
ritmussal számított értékre van szükségünk (értelmezni ezt tudjuk), akkor azt a kö-
vetkező billentyűsorozat segítségével kapjuk meg: RCL ) 2ndF ln =
• A zsebszámológép segítségével a regresszió-értékeket is könnyen meghatározhatjuk.
ƒ Bebillentyűzzük a magyarázó változó azon értékét, amelyikhez a reg-
resszió-értéket meg akarjuk határozni, majd megnyomjuk a 2ndF )
billentyűket.
ƒ Ha valamennyi regresszió-értéket meg akarjuk ismerni, akkor termé-
szetesen ezt a művelet-sort minden xi érték számológépbe billentyű-
zése mellett el kell végezni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 358 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 359 ►

Néhány európai ország lakosságának születéskori várható


élettartama 2003

y = 36,6414e0,0106x
a nőkre vonatkozó adatok (év)

84

82
80

78 Adatsor1
76 Expon. (Adatsor1)
74
72

70
65 70 75 80

a férfiakra vonatkozó adatok (év)

magyarázó változó = a férfiak születéskori várható élettartama279

13.2.sz. ábra

Az európai országok férfi (= magyarázó változó) és női lakóinak (= ered-


ményváltozó) születéskori várható élettartama között exponenciális kap-
csolatot feltételezve, a tengelyeltolásos módszert alkalmazva a következő
egyenlethez jutunk.

lg β1 =
∑d d x v
=
1,2018
= 0,00458619 ↓
∑d 2
x 262,0396
β1 = 1,01061605 → 101,061605% →≅ +1,06%

lg β 0 = lg y − (lg β1 ) * x =
= 1,901726 − 0,00458619 ∗ 73,64583& = 1,56397178 ↓
β 0 = 36,64137625 ≅ 36,6 év

279 A lineáris egyenletet kivéve minden esetben (exponenciális, hatványkitevős stb.) a


„görbe” kifejezést használtuk az egyenletek képére utalva. Ezzel szemben a 13.2. és
később a 13.3. ábrán a megfigyelt adatokat ábrázoló pontok közé az EXCEL-program
által illesztett vonal nem tűnik görbének. Ennek kettős oka van, egyrészt az ábra mérete,
de ennél is fontosabb a másik ok. Igen kevés adat-párral dolgoztunk az átláthatóság
(oktatási cél) érdekében.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 359 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 360 ►

yˆ i = 36,6 ∗1,0106 xi év

A lineáris egyenlet paramétereinek jelentését taglaló magyarázatunkat, és a


trendszámítással kapcsolatban tanultakat figyelembe véve: az exponenciá-
lis egyenlet
♥ β 0 paraméterének sincs statisztikai jelentése,
♥ a β1 paraméter szerint pedig abban az országban, ahol a férfiak
születéskori várható élettartama (2003) egy évvel nagyobb, az adott évben
született nők születéskori várható élettartama 1,06 %-kal magasabb.
Példaként ismét megfogalmazzuk egy regresszió-értének a jelentését
is.
♥ Azokban az országokban, ahol a férfiak születéskori várható élet-
tartama 76,8 év (így Olaszországban is), a nők születésükkor – a változók
között szabályos exponenciális kapcsolatot feltételezve – arra számíthat-
nak, hogy 82,5 évet fognak élnek.
13.2.3. Hatványkitevős kapcsolat (egyenlet)

BEMUTATÓ FELADAT

13.3.sz. tábla
élettartam (év)
lg xi du d u2 lg yi dv d u d v ŷi ei2
xi yi
75,8 81,7 1,8797 0,0130 0,0002 1,9122 0,0105 0,0001 81,6 0,0119
75,1 81,1 1,8756 0,0089 0,0001 1,9090 0,0073 0,0001 81,0 0,0073
68,6 75,3 1,8363 -0,0304 0,0009 1,8768 -0,0249 0,0008 75,6 0,0879
72,1 78,4 1,8579 -0,0088 0,0001 1,8943 -0,0074 0,0001 78,5 0,0164
74,8 79,5 1,8739 0,0072 0,0001 1,9004 -0,0014 0,0000 80,8 1,6048
74,9 81,5 1,8745 0,0078 0,0001 1,9112 0,0094 0,0001 80,8 0,4233
75,6 82,9 1,8785 0,0118 0,0001 1,9186 0,0168 0,0002 81,4 2,1713
75,4 80,7 1,8774 0,0107 0,0001 1,9069 0,0051 0,0001 81,3 0,3155
76,0 80,7 1,8808 0,0141 0,0002 1,9069 0,0051 0,0001 81,8 1,1144
75,2 80,3 1,8762 0,0095 0,0001 1,9047 0,0030 0,0000 81,1 0,6350
70,4 78,8 1,8476 -0,0191 0,0004 1,8965 -0,0052 0,0001 77,1 2,8613
68,3 76,5 1,8344 -0,0323 0,0010 1,8837 -0,0181 0,0006 75,3 1,3374
75,5 80,2 1,8779 0,0112 0,0001 1,9042 0,0024 0,0000 81,3 1,3090

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 360 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 361 ►

75,6 81,3 1,8785 0,0118 0,0001 1,9101 0,0084 0,0001 81,4 0,0160
76,4 81,5 1,8831 0,0164 0,0003 1,9112 0,0094 0,0002 82,1 0,3416
76,8 82,9 1,8854 0,0187 0,0003 1,9186 0,0168 0,0003 82,4 0,2373
73,8 80,5 1,8681 0,0014 0,0000 1,9058 0,0041 0,0000 79,9 0,3137
67,6 74,9 1,8299 -0,0368 0,0014 1,8745 -0,0272 0,0010 74,8 0,0218
75,7 83,1 1,8791 0,0124 0,0002 1,9196 0,0179 0,0002 81,5 2,5319
77,8 83,0 1,8910 0,0243 0,0006 1,9191 0,0174 0,0004 83,2 0,0539
77,7 82,1 1,8904 0,0237 0,0006 1,9143 0,0126 0,0003 83,2 1,1031
69,9 77,6 1,8445 -0,0222 0,0005 1,8899 -0,0119 0,0003 76,7 0,8292
72,3 79,9 1,8591 -0,0076 0,0001 1,9025 0,0008 0,0000 78,7 1,4529
66,2 70,9 1,8209 -0,0458 0,0021 1,8506 -0,0511 0,0023 73,6 7,1066
1.767,5 1.915,3 44,8008 0 0,0095 45,6414 0 0,0073 1915,1 25,9035
átlag: átlag: reziduális
1,8667 1,9017 szórás:1,085096
Megjegyzések a 13.3. sz. táblához:

• A tábla ugyanazoknak az országoknak – és ugyanazon sorrendben – a megfigyelt


adatait tartalmazza, mint a 13.1. sz.
• A számítási munkát most is az EXCEL programmal végeztük.
• A korábban megnevezett (lineáris megoldás) zsebszámológép segítségével is meg-
kaphatjuk a hatványkitevős egyenlet paramétereit. Ekkor a MODE 1 4 progra-
mot kell választanunk.
• A feladat megoldása során a tengelyeltolásos módszerrel dolgoztunk. A módszer
következménye, hogy ∑d = ∑d
u v = 0 , az ettől való esetleges (néhány tizednyi
vagy még kisebb értékű) eltérés a kerekítések következménye.
• Figyeljék meg! ∑ y = ∑ yˆ
i i Ez az egyezőség mindig fennáll, legfeljebb a kerekí-
tések miatt adódhat csekély eltérés.

• u,v = egyszerű számtani átlag, azaz u=


∑ u = ∑ lg x
i i
és
n n

v=
∑ v = ∑ lg y
i i

n n

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 361 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 362 ►

Néhány európai ország lakosságának születéskori várható


élettartama (2003)
a nőkre vonatkozó adatok (év)

84 y = 2,9817x 0,7646
82
80

78 Adatsor1
76 Hatvány (Adatsor1)
74
72

70
65 70 75 80

a féfiakra vonatkozó adatok (év)

magyarázó változó = a férfiak születéskori várható élettartama

13.3.sz. ábra

Az európai országok férfi (= magyarázó változó) és női lakóinak (= ered-


ményváltozó) születéskori várható élettartama között hatványkitevős kap-
csolatot feltételezve, a tengelyeltolásos módszert alkalmazva a következő
egyenlethez jutunk.

β1 =
∑d d u v
=
0,0073
= 0,764595 ≅ 0,76
∑d 2
u 0,0095

lg β 0 = lg y − β1 ∗ u = 1,9017 − 0,764595 ∗ 1,8667 = 0,474457 ↓


β 0 = 2,981652 ≅ 3 év

yˆ i = 3 ∗ xi0, 76 év

Az egyenlet
♥ β 0 paraméterének ebben az esetben sincs jelentése, (A férfiak várha-
tó élettartama minden országban lényegesen nagyobb egy évnél280.)

280 yˆ i = β 0 , ha xi = 1

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 362 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 363 ►

♥ β1 paramétere szerint pedig, amelyik országban 1 %-kal magasabb a


férfiak születéskori várható élettartama, ott a nők születéskori várható
élettartama 0,76 %-kal magasabb.

A hatványkitevős egyenlet β1 paramétere tehát nem más, mint az elaszti-


citás (= rugalmasság). Ennek általános értelmezése: az egyik változó
(pl.: az eladásra kínált áruk árának) 1 %-os változása, a másik változó (pl.:
a megvásárolt áruk mennyiségének) hány %-os változását vonja maga
után.

Általánosságban:
∆y ∆x
E (%) = : 281,
y x
ahol a törtek számlálójában a megfigyelt jelenségek abszolút változása,
a nevezőben pedig azok bázis értéke található, azaz maguk a törtek a rela-
tív változásokat fejezik ki. A rugalmasság rendkívül fontos közgazdasági
kategória, lehetővé teszi a legkülönbözőbb mértékegységű és abszolút
értékű jelenségek változásának összehasonlítását.
A mutató rendkívüli fontossága miatt a lineáris egyenlethez kapcso-
lódó számítását is meg kell ismernünk.
egyedi xi − yi adat-pár mellé:

xi
E = β1
yˆ i

ill. x − y adat-páros mellé:

x
Elin = β1
y

281 A hatványkitevős egyenlet jelöléseit alkalmazva:


β β
yˆ − yˆ1 x2 − x1 β 0 x2 − β 0 x
1 1

E= 2 : = 1
: 0,01 ≅ β1
yˆ1 x1 β 0 x1β
1

(0,01= a magyarázó változó 1%-os változása együtthatós formában)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 363 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 364 ►

A hatványkitevős egyenlet β1 paramétere és a lineáris egyenlethez kapcsolódó


rugalmassági együttható(k) között azonban alapvető különbség van. A görbe
vonalú egyenlet ívrugalmasságot ad, ezzel szemben az egyenes vonalú kapcso-
latot csak pontrugalmasságokkal tudjuk jellemezni, vagyis elméletileg annyi
különböző E-értéket tudunk meghatározni, ahány pontja van az egyenesnek.
(13.4. sz. tábla).
Az egyes országokra vonatkozó megfigyelt adatokat most a magyarázó
változó szerint növekvő sorrendben adtuk meg, így a szabályosságot is
észrevehetjük. Az alacsonyabb xi értékekhez kisebb, a magasabb xi érté-
kekhez pedig nagyobb rugalmasság tartozik, az x -átlaghoz tartozó rugal-
masság pedig (13.4. sz. tábla, vastagabb számokkal írtuk, szürke háttérrel
kiemeltük) megközelítőleg azonos a hatványkitevős egyenletből ismert
ívrugalmassággal.
x
Elin = β1 = 0,75962 ≅ β1( hatv.) = 0,764595%
y

♥ A magyarázó változó átlagához tartozó rugalmasság jelentése:


Ha az európai országok férfi lakosságának születéskor várható átlagéletko-
rának (≅ 73,7 év) környezetében 1 %-os változás történik, akkor – a válto-
zók között lineáris kapcsolatot feltételezve – arra számíthatunk, hogy a
nők születéskor várható átlagéletkorának (≅ 79,8 év) környezetében ≅ 0,76
%-os változás történik. (A kapcsolat az egységnyi rugalmasságnál kisebb.)
Hasonlóképpen lehet megfogalmazni a több kiszámított adatot. Pl.:
♥ A nők születéskori várható élettartamának (≅ 73,7 év) környezetében
≅ 0,74 %-os változásra számíthatnak azokban az országokban, ahol a férfi-
ak születéskori várható élettartamának (≅ 66,2 év) környezetében 1 %-os
változás történik. (A két élettartam között lineáris kapcsolatot feltételezve.)

13.4.sz. tábla
xi yi ŷi E (%)
66,2 70,9 73,7 0,739623
67,6 74,9 74,8 0,743633
68,3 76,5 75,4 0,745592
68,6 75,3 75,7 0,746423
69,9 77,6 76,7 0,74996

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 364 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 365 ►

70,4 78,8 77,1 0,751294


72,1 78,4 78,5 0,755726
72,3 79,9 78,7 0,756237
73,64583 79,80417 0,75962
73,8 80,5 79,9 0,760002
74,8 79,5 80,8 0,762448
74,9 81,5 80,8 0,76269
75,1 81,1 81,0 0,763173
75,2 80,3 81,1 0,763413
75,4 80,7 81,2 0,763892
75,5 80,2 81,3 0,764131
75,6 82,9 81,4 0,76437
75,6 81,3 81,4 0,76437
75,7 83,1 81,5 0,764608
75,8 81,7 81,6 0,764845
76,0 80,7 81,7 0,765319
76,4 81,5 82,1 0,76626
76,8 82,9 82,4 0,767194
77,7 82,1 83,1 0,769269
77,8 83 83,2 0,769497

13.2.4. A kétváltozós kapcsolatok szorossági mutatói


A megfigyelt változók között egyenes vonalú kapcsolatot feltételezve a
lineáris korrelációs együttható (r ) és a korrelációs index (I ) , görbe
vonalú kapcsolatot feltételezve pedig csak a korrelációs index (I )
számítására van lehetőségünk. Ezek fejezik ki a kapcsolat szorosságát.
A lineáris korrelációs együttható alapgondolata a következő.
• Ha két változó között pozitív kapcsolat van, akkor
o az egyik átlagos értékéhez a másik átlagos értéke;
o az egyik átlag feletti értékéhez, a másik átlag feletti értéke, és
o az egyik átlag alatti értékéhez a másik átlag alatti értéke tartozik.
• Ha a két változó között negatív kapcsolat van, akkor
o az egyik átlagos értékéhez a másik átlagos értéke;
o az egyik átlag alatti értékéhez a másik átlag feletti értéke, és
o az egyik átlag feletti értékéhez a másik átlag alatti értéke tartozik.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 365 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 366 ►

A fentiek alapján logikus, ha a változók értékeinek saját átlaguktól való


eltérését (d x , d y → d x d y ) használjuk a kapcsolat szorosságának kimutatá-
sára. Az eltérés szorzatok összegének előjele a kapcsolat jellegét adja
meg. Ez negatív, ha a változók „ellenkező irányban mozognak”. (Példá-
ul, ha a családok egy főre jutó jövedelmének alakulását vizsgáljuk az eltar-
tottak számának függvényében.) A kapcsolat pedig pozitív, ha a változók
„azonos irányban mozognak”. (Például, ha a szórakozási kiadások értékét
vizsgáljuk a jövedelmek nagyságának függvényében.) Határértékkel ren-
delkező mutatóhoz pedig akkor jutunk, ha az eltérés szorzatok összegét (=
az együttes szórást) annak maximális értékéhez viszonyítjuk.

r=
∑d d x y
=
∑x y i i − nx y
= β1
σx 282

∑d ∑d2
x
2
y (∑ x 2
i − nx 2
)(∑ y 2
i − ny 2
) σy

A lineáris korrelációs együttható (= r ) négyzetét determinációs együttha-


( )
tónak = r 2 nevezzük és %-os formában értelmezzük. Ez a mutató a
befolyásolás mértékét mutatja meg.

A lineáris korrelációs együttható és a determinációs együttható határérté-


kei, és azok jelentése azonos a H ill. a H 2 mutatóknál megtanultakkal. A
nulla r esetén itt is a kapcsolat hiányát az egy ill. az ahhoz közeli érték a
szoros kapcsolatot jelzi; r 2 (% ) esetén a nulla érték azt jelzi, hogy a magya-
rázó változó növekedése vagy csökkenése nincs befolyásoló hatással az
eredményváltozóra, míg a 100 % vagy az ahhoz közeli érték azt jelenti,
hogy a magyarázó változón kívüli tényezők nem nagyon befolyásolják az
eredményváltozó alakulását.

A lineáris korrelációs együttható és az abból számított determinációs


együttható sajátossága, hogy nagyságukat a változók szerepének felcserélé-
se nem befolyásolja.283
A korrelációs index (= I ) a H mutatóhoz hasonlóan a teljes szórás
(=az eredményváltozó megfigyelt értékeinek szórása) összetevőkre bontá-

282 A mutatóban szereplő betűk jelentése korábbról már ismert. A mutatónak egyéb
felírásai is ismertek.
283 Matematika: a szorzás tényezőinek sorrendje…

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 366 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 367 ►

sán (= a regresszió-értékek szórása és a rezídiumok (e = yi − yˆ i ) szórása)


alapszik. Határértékei és azok jelentése pedig az előzőekben leírtak-
kal (r ) azonos. Ugyanez igaz korrelációs index négyzetére is, melyet szin-
tén determinációs együtthatónak (= I ) nevezünk. A korrelációs indexnek
2

előjele nincs, így a kapcsolat jellegét nem mutatja meg.

I = 1−
σ e2
=
σ y2ˆ
≅ 1 −
∑ ei2 ,284 ahol
σ y2 σ y2 ∑ d y2

σe = ∑e 2
i 285
, σy =
∑d 2
y
és σ yˆ =
∑ ( yˆ i − y)
2

n−2 n −1 n −1

BEMUTATÓ FELADAT

Az előzőek folytatása (13.1., 13.2., 13.3. táblák alapján).


Lineáris kapcsolat:

r=
∑d d x y
=
215,6954 σ
= β1 x =
∑d ∑d 2
x
2
y
262 ∗ 203,7 σy
3,375356
= 0,823140587 ∗ ≅ 0,933 → r 2 ≅ 87%
2,976353

σ e2 1,0913282 σ y2ˆ 2,7783922


I = 1− = 1 − = = ≅
σ2 y
2,9763532 σ y2 2,9763532

≅ 1−
∑e 2
i
= 1−
26,2093
≅ 0,93 → I 2 ≅ 86,6%
∑d 2
y 203,7

284 A σ y2 = σ y2ˆ + σ e2 összefüggés tökéletesen csak a lineáris kapcsolat esetén érvénye-


sül.
285 σ e = reziduális szórás, a nevezőben (n − 2 ) = a szabadságfok. (A másik két szórás-
ban (n − 1) szintén a szabadságfok. Lásd: becslés)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 367 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 368 ►

Exponenciális kapcsolat:

σ e2 1,0913282 σ y2ˆ 2,801424 2


I = 1− 2 = 1− = = ≅
σ y
2,9763532 σ y2 2,9763532

≅ 1−
∑e 2
i
= 1−
27,2827
≅ 0,93 → I 2 ≅ 86,6%
∑d 2
y 203,7

Hatványkitevős kapcsolat:

σ e2 1,0850962 σ y2ˆ 2,8103782


I = 1− 2 = 1− = = ≅
σ y
2,9763532 σ y2 2,9763532

≅ 1−
∑e 2
i
= 1−
25,9035
≅ 0,931 → I 2 ≅ 86,7%
∑d 2
y 203,7

♥Az európai országok férfi és női lakóinak születéskori várható élettar-


tama (2003) közötti kapcsolatot mind a három mutató (gyakorlatilag) egyfor-
mán szorosnak jelzi. A férfiak születéskori várható élettartama erősen, ≅ 87
%-ban befolyásolja a nők születéskori várható élettartamát.286 Milyen követ-
keztetést vonhatunk le a mutatók számértékének (itt csekély) eltéréséből?
Az egyenesen (lineáris kapcsolat) és a görbéken (exponenciális, hat-
ványkitevős kapcsolat) lévő pontok nem egyforma távolságra vannak a
megfigyelt pontoktól, azaz a három egyenlet nem egyformán jól jellemzi a
kapcsolatot. A különbség jelen esetben ugyan igen kicsi, de ∑ ei2 a hat-
ványkitevős kapcsolatnál a legkisebb (≅ 25,9 ) , ezért I itt a legnagyobb
(≅ 0,931) , vagyis ha további (pl.:becslési287) feladatokat kell végeznünk,
akkor azokhoz célszerű a hatványkitevős egyenletet felhasználni.

286 A lineáris korreláció együttható jelentését így is megfogalmazhatjuk: a nők születésko-


ri várható élettartama 87 %-ban befolyásolja a férfiak születéskori várható élettartamának
alakulását (szóródását). Sőt így is fogalmazhatunk: a vizsgált változók kölcsönösen 87 %-
ban magyarázzák meg egymás alakulását (szóródását).
287 Becslési feladatokat tananyagunk azonban csak a lineáris egyenlethez kapcsolódóan tartalmaz.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 368 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 369 ►

13.2.5. Betekintés a lineáris kapcsolathoz tartozó becslési és


ipotézisellenőrzési feladatokba
Tekintettel arra, hogy a mennyiségi változók közötti kapcsolatok vizsgála-
tához sem tudunk teljes körű adatgyűjtést végezni, azaz számításainkat
szinte minden esetben mintasokaságok alapján végezzük, a paramétereket
és a regresszió-értékeket egyaránt valószínűségi változónak kell tekinte-
nünk. A valószínűségi változókról pedig tudjuk, hogy azok értéke mintáról
mintára kisebb nagyobb mértékben ingadozik, ezért célszerűnek látszik azt
az intervallumot is megismerni, melyben ezek a becsült értékek adott való-
színűség mellett megtalálhatóak. Továbbá célszerű kételkedni a kapcsolat
szignifikáns jellegében, és ellenőrizni azt.
A paraméterek és a regresszió-értékek intervallumának becslése hason-
ló módon történik, mint a számtani átlag becslése.
• Pontbecslés (= a tanult képletek alapján).
• A standardhiba kiszámítása.
• Az adott valószínűség és szabadságfok alapján a megfelelő táblabeli
érték kikeresése.
• A hibahatár kiszámítása.
• Az intervallum határaink felírása.
A standardhibák képleteinek felsorakoztatása előtt egy kis kitérőt kell
tennünk. A regresszió-értékeket ugyanis kétféle felfogásban kezelhetjük. A
férfiak és nők születéskori várható élettartamára vonatkozó többfélekép-
pen is megoldott példánkban szerepelő adat a ≅ 75 éves férfiakra vonat-
kozó életkor felfogható a környezetében elhelyezkedő értékek (Belgium
75,1 év; Dánia 74,8 év; Finnország 74,9 év; Görögország 75,4 év; Írország
75,2 év stb.) átlagának, és felfogható egyedi értéknek. Az átlagos értékek
becslése kisebb, az egyedi értékek becslése pedig nagyobb hibával végez-
hető, így a regresszió értékek becsléséhez két standardhiba képletre van
szükségünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 369 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 370 ►

A lineáris egyenlet β 0 paraméterének standardhibája:

σβ =σe
∑x 2
i
0
n∑ d 2
x

A lineáris egyenlet β1 paraméterének standardhibája:

1 σe
σβ =σe =
1
∑ d x2 ∑d 2
x

Az átlagos regresszió érték ( ŷi ) standardhibája:

1 ( xi − x )
2
σ yˆ = σ e +
i
n ∑ d x2
Az egyedi regresszió érték ( ŷi ) standardhibája:

1 ( xi − x )
2
σ yˆ = σ e + + 1 288
i
n ∑ d x2
A hibahatár – ahogy azt a becsléssekkel kapcsolatban már bemutattuk – egy
táblabeli érték és a standard hiba szorzataként számítható ki. A szükséges
tábla jelen esetben a Student-féle t-eloszlás. A becslés szabadságfoka
( v = a tábla oldalrovatában találhatjuk értékeit) = (n − m − 1) 289, tekintettel
arra, hogy a regresszió egyenleteknek két mintáról mintára ingadozó paramé-
tere (β 0 , β1 ) van. A táblában való keresésnél a becslés valószínűségének
(értékei a fejlécből olvashatók le együtthatós formában) figyelembe vétele
⎛ 1− P ⎞
ugyanúgy történik, mint az átlagok kétoldalú becslésénél, azaz ⎜ P + ⎟.
⎝ 2 ⎠

288 Az egyedi és az átlagos regresszió érték standard hibájának számítása mindössze a


négyzetgyök jel alatti „+1” tagban tér el. Ez a látszólag csekély eltérés azt eredményezi,
hogy az egyedi regresszió érték standard hibája nagyobb, az átlagos regresszió érték
standard hibája pedig kisebb a reziduális szórásnál.
289 m = az egyenlet magyarázóváltozóinak száma

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 370 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 371 ►

Az eddigiek alapján a becsült értékek intervallumának képletei:


A lineáris egyenlet β 0 paraméterének kétoldalú intervalluma:

⎡ ⎤
[β 0 ± ∆] = ⎢β 0 ± t⎛ P+1− P ⎞ ∗ σ β ⎥
⎢⎣ ⎥⎦
0
⎜ ⎟
⎝ 2 ⎠

A lineáris egyenlet β1 paraméterének kétoldalú intervalluma:

⎡ ⎤
[β1 ± ∆] = ⎢β1 ± t⎛ P+1−P ⎞ ∗ σ β ⎥
⎢⎣ ⎥⎦
1
⎜ ⎟
⎝ 2 ⎠

Az átlagos és az egyedi regresszió érték ( ŷi ) kétoldalú intervalluma:

⎡ ⎤
[ yˆ i ± ∆] = ⎢ yˆ1 ± t⎛ P+1−P ⎞ ∗ σ yˆ ⎥
⎢⎣ ⎥⎦
i
⎜ ⎟
⎝ 2 ⎠

A kapcsolat jelentősségének ellenőrzése is hasonlóan folyik, mint ahogy


azt a korábbiakban (lásd: két számtani átlag, két szórás stb. összehasonlítá-
sa) ismertettük.
A hipotézisek felírása
A megfelelő próbafüggvény kiválasztása, aktuális értékének kiszámítása.
A próbafüggvényhez illő táblából az adott ellenőrzési szinthez és adott
szabadságfokhoz tartozó érték kikeresése.
A próbafüggvény értékének és a táblabeli értéknek összehasonlítása alap-
ján döntéshozatal.
1. A kapcsolat szignifikáns voltának ellenőrzésére az alábbi két hipotézis
írjuk fel.
H 0 : β1 = 0
H 1 : β1 ≠ 0
Emlékezzünk matematikai tanulmányainkra! Ha egy függvény meredeksége = 0, akkor a
függvény a vízszintes tengellyel párhuzamosan halad, és teljesen mindegy, hogy a
független változó (= statisztikában a magyarázó változó) milyen értéket vesz fel, a függő
változó (statisztikában az eredményváltozó) értékei rendre azonosak, vagyis y teljesen
független x -től.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 371 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 372 ►

2. Az elméletben előforduló próbafüggvények közül kettővel ismerkedünk


meg, az egyik (= t − próba ) a vizsgált paraméternek a saját standard
hibájához való viszonyára alapozza a döntést, a másik (= F − próba )
pedig tulajdonképpen varianciaanalízis290, azaz az eredményváltozó
szórásnégyzetét összetevőire bontja, majd ezeket hasonlítja egymáshoz.

∑ ( yˆ − y)
2
SSR i
β1 MSR
t= F= = 1 = 1
σβ
1
MSE SSE ∑ ( y1 − yˆ1 )2
n−2 n−2
3. A szükséges tábla a próbafüggvény betűjeléből egyértelműen
leolvasható. Ha az ellenőrzést a t − próbával akarjuk megoldani, akkor az
adott valószínűségi értéket a táblában való kereséshez éppúgy át kell
alakítani (= kétoldalú próba), mint ahogy azt pl. a számtani átlagok
összehasonlításakor megtettük. (Az átalakított valószínűségi értéket pedig
együtthatós formában a Student-tábla fejlécében találjuk meg.) A
hipotézisellenőrzés szabadságfoka: (v = n − 2 ) . Ennek magyarázatát a
becsléssel kapcsolatban már leírtuk. (A szabadságfokot a nevezett tábla
oldalrovatában találjuk meg.)
Ha az ellenőrzést a F − próbával akarjuk megoldani, akkor az adott való-
színűségi értéket a táblában való kereséshez nem kell átalakítani (= egyolda-
lú próba), de ezt az értéket most a tábla címében kell keresnünk. (Lásd: 10.
és 11. fejezetek. Emlékezzen, a tábla fejlécét és oldalrovatát a számlálóra
(v1 = 1) ill. a nevezőre (v2 = n − 2 ) vonatkozó szabadságfokok foglalják el.)
4. Döntésünket tökéletesen úgy hozzuk meg, mint a korábbiakban.
• Ha a próbafüggvény számított értéke kisebb, mint a táblából kikere-
sett érték, akkor a null-hipotézist,
• ha pedig a próbafüggvény számított értéke nagyobb, mint táblából
kikeresett érték, akkor az alternatív-hipotézist fogadjuk el.

290 Tekintettel arra, hogy szinte minden tankönyv közli a képletben szereplő adatok
angol megnevezésének rövidítését, mi is közöljük Vegyük észre a számlálóban
tulajdonképpen a regresszió szórásnégyzete, a számlálóban pedig a reziduális
szórásnégyzet szerepel.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 372 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 373 ►

BEMUTATÓ FELADAT

Az előzőek folytatása (13.1. sz. tábla alapján).


A lineáris egyenlet β 0 paraméterének standardhibája:

σβ =σe
∑x 2
i
=1,091328
130431,05
= 4,97037924
0
n∑ d 2
x 24 ∗ 262

A lineáris egyenlet β1 paraméterének standardhibája:

1 σe 1,091328
σβ =σe = = = 0,067422469
1
∑ d x2 ∑d 2
x
262

A Student táblából kikeresett érték P = 95% valószínűség mellett:


−2
t 024.975 = 2,07

A lineáris egyenlet β 0 paraméterének kétoldalú intervalluma:

[β 0 ± ∆] = [19,18 ± 2,07 ∗ 4,97] ≅ [8,9〈 β 0 〈 29,5] év


A lineáris egyenlet β1 paraméterének kétoldalú intervalluma:

[β1 ± ∆] = [0,82 ± 2,07 ∗ 0,067] ≅ [0,68〈 β1 〈0,96] év


Az intervallumok határainak jelentése:
♥ A 24 elemű EV minta alapján 95 %-os valószínűséggel állíthatjuk,
hogy az európai férfiak és nők születéskori várható élettartama közötti
kapcsolatot leíró lineáris regresszió egyenlet β 0 paramétere legalább 8,9 és
legfeljebb 29,5; β1 paramétere pedig legalább 0,68 és legfeljebb 0,96 év.
De így is fogalmazhatunk:
♥ A férfiak és a nők születéskori várható élettartama között lineáris
kapcsolatot feltételezve, a 24 elemű EV minta alapján 95 %-os valószínű-
séggel állíthatjuk, hogy ha az európai férfiak születéskori várható élettar-
tama 1 évvel változik, akkor a nők születéskori várható élettartama leg-
alább 0,68 és legfeljebb 0,96 évvel változik.
A regresszió értékek intervallumai:

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 373 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 374 ►

13.5.sz. tábla
az átlagos intervallum az egyedi intervallum
σ ŷ σ ŷi
ország

i ∆ ŷi határai ∆ ŷi határai


átlagos alsó felső egyedi alsó felső
1. 0,265925 0,551495 81,0 82,1 1,12326 2,329499 79,2 83,9
2. 0,243384 0,504748 80,5 81,5 1,118138 2,318876 78,7 83,3
3. 0,406627 0,843292 74,8 76,5 1,164621 2,415276 73,2 78,1
4. 0,245939 0,510046 78,0 79,0 1,118697 2,320035 76,2 80,9
5. 0,235965 0,489361 80,3 81,2 1,116547 2,315576 78,4 83,1
6. 0,238273 0,494148 80,3 81,3 1,117037 2,316592 78,5 83,2
7. 0,258808 0,536735 80,9 81,9 1,121596 2,326049 79,1 83,7
8. 0,252211 0,523055 80,7 81,8 1,120093 2,32293 78,9 83,6
9. 0,273522 0,56725 81,2 82,3 1,125083 2,333279 79,4 84,1
10. 0,357855 0,742146 82,5 84,0 1,148502 2,381848 80,8 85,6
11. 0,246177 0,51054 80,6 81,6 1,118749 2,320144 78,8 83,4
12. 0,312265 0,647598 76,5 77,8 1,135124 2,354103 74,8 79,5
13. 0,423692 0,878682 74,5 76,3 1,170688 2,427859 73,0 77,8
14. 0,255442 0,529754 80,8 81,9 1,120824 2,324448 79,0 83,7
15. 0,258808 0,536735 80,9 81,9 1,121596 2,326049 79,1 83,7
16. 0,290002 0,601428 81,5 82,7 1,129203 2,341823 79,7 84,4
17. 0,307966 0,638682 81,8 83,0 1,133949 2,351666 80,0 84,8
18. 0,223009 0,462492 79,5 80,4 1,113881 2,310047 77,6 82,2
19. 0,464498 0,963309 73,9 75,8 1,186067 2,459752 72,4 77,3
20. 0,262304 0,543985 81,0 82,0 1,122408 2,327732 79,2 83,8
21. 0,352604 0,731255 82,4 83,9 1,146877 2,378477 80,8 85,5
22. 0,336747 0,69837 76,0 77,4 1,142101 2,368573 74,4 79,1
23. 0,240535 0,49884 78,2 79,2 1,117521 2,317598 76,4 81,0
24. 0,549188 1,138946 72,5 74,8 1,221722 2,533696 71,1 76,2
Az országok sorrendje azonos, mint a 13.1., 13.2. és 13.3. sz. táblában.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 374 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 375 ►

Az Ausztriára vonatkozó adatok számítása, jelentése:


• Átlagos:

⎡ ⎤
[ yˆ i ± ∆] = ⎢ yˆ1 ± t⎛ P+1−P ⎞ ∗ σ yˆ ⎥ ≅ [81,6 ± 2,07 ∗ 0,266] ≅ [81,6 ± 0,55]
⎣⎢ ⎦⎥
i
⎜ ⎟
⎝ 2 ⎠

♥ A 24 elemű EV minta alapján 95 %-os valószínűséggel állíthatjuk,


hogy azokban az európai országokban, ahol a férfiak születéskori élettar-
tama átlagosan 75,8 év (13.1. sz. tábla) ott a nők születéskori várható élet-
tartama – a változók között lineáris kapcsolatot feltételezve –legalább 81
és legfeljebb 82,1 év. (Az intervallum szélessége = 2 ∗ ∆ = 1,1 )

• Egyedi:

⎡ ⎤
[ yˆ i ± ∆] = ⎢ yˆ1 ± t⎛ P+1−P ⎞ ∗ σ yˆ ⎥ ≅ [81,6 ± 2,07 ∗1,123] ≅ [81,6 ± 2,33]
⎣⎢ ⎦⎥
i
⎜ ⎟
⎝ 2 ⎠

♥ A 24 elemű EV minta alapján 95 %-os valószínűséggel állíthatjuk,


hogy abban az európai országoban, ahol a férfiak születéskori élettartama
75,8 év (13.1. sz. tábla) ott a nők születéskori várható élettartama – a válto-
zók között lineáris kapcsolatot feltételezve –legalább 79,2 és legfeljebb
83,9 év. (Az intervallum szélessége = 2 ∗ ∆ = 4,7 . Jól látható tehát, hogy
az egyedi becslés intervalluma, a nagyobb standard hibának köszönhetően
– azonos becslési va-
lószínűség mellett – β1 0,82
lényegesen nagyobb.) t = = ≅ 12,24
σ β1 0,067
Ellenőrizzük 2,5;
5 ill. 10 %-os szignifikancia szinten, hogy szignifikáns-e a kapcsolat a férfi-
ak és a nők születéskori várható élettartama között az európai országok-
ban! A hipotéziseket nem ismételjük meg, hiszen azok példa-függetlenek
(állandóak).

∑ ( yˆ − y)
2
SSR i 177,5477
MSR
F= = 1 = 1 = 1 = 155,85
MSE SSE ∑ ( y1 − yˆ1 ) 26,20193
2

n−2 n−2 23

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 375 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 376 ►

a 13.3. sz. tábla kiegészítése


A nők születéskori várható élettartamára vonatkozó lineáris regresszió-
értékek szórásának mellékszámítása. (Az adatok az eredeti táblában sze-
replő sorrendben – 1. sor, 2. sor., 3. sor – kerültek feltüntetésre: Ausztria →
Törökország)
3,1442 1,4328 17,251 1,6191 0,9026 1,0658 2,5875 2,0849 3,7551
1,6366 7,1384 19,3633 2,3294 2,5875 5,1396 6,7409 0,0161 24,7663
összeg:
2,8590 11,6927 11,1366 9,5070 1,2272 37,5642
177,5477

A t − próbához kikeresett, a megadott szignifikancia-szintekhez tartozó


táblabeli értékek:
t 023,95 = 1,71 t 023,975 = 2,07 t 023,9875≈0,99 = 2,12

Az F − próbához kikeresett, a megadott szignifikancia-szintekhez tartozó


táblabeli értékek:
F01,;923 = 2,92 F01,;9523 = 4,28 F01,;975
23
= 5,75

A próbafüggvények értékei valamennyi táblából kikeresett értéknél na-


gyobbak, így minden esetben ugyanazt a döntést kell hoznunk.
H 0 : β1 = 0 → elvetve
H 1 : β1 ≠ 0 → elfogadva

♥ A 24 elemű minta alapján 2,5; 5,0 és 10,0 %-os szignifikancia-szinten


is állíthatjuk, hogy az európai országokban a férfiak és a nők születéskori
várható élettartama között nem elhanyagolható lineáris kapcsolat áll fenn.

13.3. Háromváltozós elemzések


13.3.1. Három változó regresszió-számítás
Tananyagunk, elsősorban technikai okok miatt, a többváltozós összefüggé-
sek közül csak azzal az esettel foglalkozik, amikor az eredményváltozó ( yi )
alakulását két magyarázó változó (x1 , x2 ) alakulásával hozza összefüggés-
be. A témakör további szűkítését jelenti, hogy csak a lineáris kapcsolatot
leíró egyenletet ill. az ahhoz tartozó szorossági mutatókat tárgyaljuk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 376 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 377 ►

A háromváltozós lineáris regresszió-egyenlet:


yˆ i = β 0 + β1 x1i + β 2 x2i
A képletben szereplő betűk jelentése az eddigiek alapján egyértelmű. (Lásd: 13.2.sz.
fejezet) A magyarázó változók ( x1 , x2 ) futóindexében szereplő 1 ill. 2 a változó
sorszáma, az i pedig a megfigyelések sorszáma.
A megfigyelt pontok közé ebben az esetben is a legkisebb négyzetek
módszerével illesztjük az egyenest. A parciális deriválás és a lehetséges
matematikai egyszerűsítések után most három normálegyenletet kapunk.

∑y i = nβ 0 + β1 ∑ x1i + β 2 ∑ x2i

∑x 1i yi = β 0 ∑ x1i + β1 ∑ x12i + β 2 x1i x2i

∑x 2i yi = β 0 ∑ x2i + β1 ∑ x1i x2i + β 2 x22i

A tengelyeltolás módszerét alkalmazva (


– x1i → d x1 = x1i − x1 , )
(x → d x2 = x 2 i − x 2
2i ) és (y 1 → d y = yi − y ) – a normálegyenletek így
egyszerűsödnek.

∑d d 1 y = β1 ∑ d12 + β 2 ∑ d1d 2

∑d d 2 y = β1 ∑ d1d 2 + β 2 ∑ d 22

β 0 = y − β1 x1 − β 2 x2

A harmadik „maradék-egyenlet” már képlet, logikailag azonos a kétválto-


zós egyenlet β 0 paraméterének képletével. Újabban291 szokás a másik két
„maradék-egyenlet” átrendezésével β1 és β 2 regressziós együtthatókra is
képletet292 felírni.

291 A régebbi tankönyvek kivétel nélkül az egyenletek matematikai megoldásával


dolgoznak.
292 Ennek elsősorban technikai jelentősége van. A munkatábla összesen oszlopaiban
szereplő adatokat a megfelelő műveleti jelek és a szükséges zárójelek közbeiktatásával
folyamatosan billentyűzhetjük be a zsebszámológépbe, majd az egyenlőségjel billentyű
lenyomása után azonnal megkapjuk a regressziós paraméter értékét. (Elmarad az

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 377 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 378 ►

∑d d ∑d d − ∑d d ∑d
β2 = 1 y 1 2 2 y 1
2

(∑ d d ) − ∑ d ∑ d
1 2
2 2
2 1
2

β1 =
∑d d − β ∑d d = ∑d d − β ∑d
1 y 2 1 2 2 y 2
2
2

∑d 1
2
∑d d 1 2

A háromváltozós lineáris egyenlet β 0 paraméterének statisztikai értel-


mezéséhez nem egyszerűen azt kell megvizsgálnunk, hogy a magyarázó
változók felvehetik-e és felveszik-e (a megfigyelt értékek között szerepel-e)
a nulla értéket (lásd: kétváltozós), hanem arra is figyelnünk kell, hogy meg-
történik-e ez egyszerre. Ha igen, akkor

β 0 = (x1 = x2 = 0) - helyen vett regresszióérték. Ha nem, akkor β 0 -nak


statisztikai jelentése nincs.

Az egyenlet β1 paramétere csak constans (= állandó) második magyará-


zóváltozó mellett ill. a β 2 paramétere csak constans (= állandó) első
magyarázó változó mellett lehetséges. Így β1 megmutatja, hogy az első
magyarázóváltozó egységnyi abszolút változása mekkora abszolút válto-
zást okoz az eredményváltozóban, β 2 pedig megmutatja, hogy a második
magyarázóváltozó egységnyi abszolút változása mekkora abszolút válto-
zást okoz az eredményváltozóban. (Ezért szokás parciális regressziós
együtthatónak nevezni a β1 és a β 2 paramétereket.)

egyenletek papíron való rendezgetése.) Hasonló segítséget jelentenek a képletek az


EXCEL-programmal való munkavégzés esetén is.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 378 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 379 ►

BEMUTATÓ FELADAT

13.6./1. sz. tábla


A rendszeres szociális segélyben részesülők (= 1..), az alkalmazásban állók havi nettó átlagkeresete (=
2.) és a regisztrált munkanélküliek (= 3. ) száma megyénként, 2003293
1. 2. 3.
sor-szám megye d y = yi − y d1 = x1i − x1 d 2 = x2i − x2
ezer fő ezer Ft ezer fő
1 Pest 3,1 85,6 16,8 -3,931578947 5,605263 -1,14736842
2 Fejér 2,4 87,1 13,2 -4,631578947 7,105263 -4,74736842
3 Komárom-E. 1,4 83,9 7,6 -5,631578947 3,905263 -10,3473684
4 Veszprém 2,4 79,1 12,4 -4,631578947 -0,89474 -5,54736842
5 Győr-M.-S. 0,8 86,1 8,1 -6,231578947 6,105263 -9,84736842
6 Vas 0,9 80,3 6,7 -6,131578947 0,305263 -11,2473684
7 Zala 2,2 78,9 9,8 -4,831578947 -1,09474 -8,14736842
8 Baranya 8,8 80,8 19,7 1,768421053 0,805263 1,75263158
9 Somogy 7,1 75,4 17,6 0,068421053 -4,59474 -0,34736842
10 Tolna 3,4 81,0 11,4 -3,631578947 1,005263 -6,54736842
11 Borsod-A.-Z. 33,3 79,6 53,6 26,26842105 -0,39474 35,6526316
12 Heves 5,8 80,4 13,1 -1,231578947 0,405263 -4,84736842
13 Nógrád 5,5 77,7 13,3 -1,531578947 -2,29474 -4,64736842
14 Hajdú-B. 12,9 78,3 27,9 5,868421053 -1,69474 9,95263158
15 Jász-N.-Sz. 6,7 77,0 17,9 -0,331578947 -2,99474 -0,04736842
16 Szabolcs-Sz.-B. 20,7 75,5 36,9 13,66842105 -4,49474 18,9526316
17 Bács-K. 5,5 76,3 22,1 -1,531578947 -3,69474 4,15263158
18 Békés 7,8 76,1 17,2 0,768421053 -3,89474 -0,74736842
19 Csongrád 2,9 80,8 15,7 -4,131578947 0,805263 -2,24736842
összesen 133,6 1519,9 341 0 0 0
átlag 7,031579 79,99474 17,94737

Azt feltételezve, hogy szociális segélyt azok kérnek, akik munkanélküliek


(= korábbi jövedelmüket a munkanélküli segély meg sem közelíti, vagy
nem is kapnak segélyt), ill. akik alacsony keresetből kénytelenek élni, csa-
ládot fenntartani, kerestük a kapcsolatot:

293 Magyar statisztikai évkönyv, 2003 (KSH, Budapest – 2004, 108., 109. és 175. old.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 379 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 380 ►

• a rendszeres szociális segélyben részesülők (= eredményváltozó = yi )


száma (ezer fő) és
• a nettó átlagkeresetek (ezer Ft / hó) (= első magyarázó változó = x1 )
valamint
• a regisztrált munkanélküliek száma (= ezer fő) (= második magyarázó
változó = x 2 ) között.
A számításokhoz a normálegyenletekben ill. a képletekben szereplő ada-
toknak megfelelően állítottuk össze a munkatáblát (13.6.1. és 13.6.2. sz.)
tekintettel arra, hogy a tengelyeltolásos módszert alkalmaztuk, kiszámítot-
tuk (= egyszerű számtani átlag) a megfigyelt adatok számtani középértékét.
♥ 2003-ban egy-egy magyar megyében átlagosan ≅7030 fő részesült
rendszeres szociális segélyben.
♥ 2003-ban egy-egy magyar megyében az alkalmazottak átlagosan ≅80
ezer Ft nettó átlagbért kaptak havonta.
♥ 2003-ban egy-egy magyar megyében átlagosan ≅17950 fő munka-
nélkülit tartottak nyilván.

13.6./2. sz. tábla

A 13.6./1. tábla folytatása (= a tábla jobb oldalára)294


d y2 d12 d 22 d y d1 d yd2 d1 d 2 ŷi ei2 = ( yi − yˆ i )
2

15,4573 31,4190 1,3165 -22,0375 4,5110 -6,4313 5,8848 7,7551


21,4515 50,4848 22,5375 -32,9086 21,9878 -33,7313 3,3399 0,8833
31,7147 15,2511 107,0680 -21,9928 58,2720 -40,4092 -0,2567 2,7446
21,4515 0,8006 30,7733 4,1440 25,6931 4,9634 3,3199 0,8462
38,8326 37,2742 96,9707 -38,0454 61,3647 -60,1208 -0,0609 0,7411
37,5963 0,0932 126,5033 -1,8717 68,9641 -3,4334 -0,6327 2,3491
23,3442 1,1984 66,3796 5,2893 39,3647 8,9192 1,5659 0,4021
3,1273 0,6484 3,0717 1,4240 3,0994 1,4113 8,1700 0,3969
0,00468 21,1116 0,1207 -0,3144 -0,0238 1,5961 7,0963 1,36E-05
13,1884 1,0106 42,8680 -3,6507 23,7773 -6,5818 2,5159 0,781713
690,0300 0,1558 1.271,1101 -10,3691 936,5383 -14,0734 31,2887 4,0454

294 Ahogy már többször jeleztük, a számításokat az EXCEL-program végezte, majd


kerekítettünk (négy tizedesre). (Ha az adatok összegzését ellenőrizni akarja, ezt vegye
figyelembe.)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 380 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 381 ►

1,5168 0,1642 23,4970 -0,4991 5,9699 -1,9644 3,7105 4,3658


2,3457 5,2658 21,5980 3,5146 7,1178 10,6645 4,0232 2,1808
34,4384 2,8721 99,0549 -9,9454 58,4062 -16,8671 13,9068 1,0137
0,1099 8,9684 0,0022 0,9930 0,0157 0,1419 7,1955 0,2455
186,8257 20,2027 359,2022 -61,4360 259,0526 -85,1871 20,2070 0,2431
2,3457 13,6511 17,2443 5,6588 -6,3601 -15,3429 10,0958 21,1214
0,5905 15,1690 0,5586 -2,9930 -0,5743 2,9108 6,7786 1,0432
17,0700 0,6484 5,0507 -3,3270 9,2852 -1,8097 5,4514 6,5098
1141,4412 226,3895 2.294,9274 -188,3668 1.576,4616 -255,34526 133,6000 57,6688

A számtani középértékek meghatározását követte az átlagtól való eltérések


számítása ( ∑ d y = ∑ d1 = ∑ d 2 ); majd az eltérésnégyzetek (= ezekből
meghatároztató mindegyik változó szórása), és a az eltérés szorzatok meg-
határozása.

1141,44105 7,96
y-ra: σ = ≅ 7,96efő → v = → 113,2%
18 7,03

226,38947 12,58
x1 –re: σ = ≅ 12,58eFt → v = → 15,7%
18 79,99

2294,92737 11,29
x2 –re: σ = ≅ 11,29efő → v = → 62,9%
18 17,95
A relatív szórások – az eltérő mértékegységek és jelentés miatt csak ezek
hasonlíthatók össze – nagyon különbözőek. Ha végigtekintünk a megfi-
gyelt adatokon ez mindjárt érthetővé válik. A nettó átlagkeresetek egy vi-
szonylag szűk ( T = x1max − x1min = 87,1 − 75,4 = 11,7 ) intervallumban he-
lyezkednek el, ezzel szemben a rendszeres segélyben részesülők száma egy
igen széles ( T = y max − y min = 33,3 − 0,8 = 32,5 ) intervallumban található.
(A kiszámított szórások felhasználhatóak a szorossági mutatók meghatá-
rozásához is.)
A mellékszámítások elvégzése után a képletek segítségével meghatároz-
tuk a háromváltozós lineáris regresszió-egyenlet paramétereinek értékét.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 381 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 382 ►

β2 =
∑d d ∑d d − ∑d d ∑d
1 y 1 2 2 y 1
2

=
(∑ d d ) − ∑ d ∑ d
1 2
2 2
2 1
2

(− 188,36684) ∗ (− 255,34526) − 1576,46158 ∗ 226,38947 = 0,679649 ≅ 0,68


= (− 255,34526)2 − 2294,92737 ∗ 226,38497

β1 =
∑d d
1 y − β 2 ∑ d1 d 2
=
∑d d − β ∑d
2 y 2
2
2

∑d 1
2
∑d d 1 2
=
− 188,36684 − 0,679649 ∗ (− 255,34526)
= −0,06547 ≅ −0,065
= 226,38947

1576,46158 − 0,679649 ∗ 2294,92737


= = −0,06547 ≅ −0,065
− 255,34526

β 0 = y − β1 x1 − β 2 x2 =
= 7,031579 − (−0,06547) ∗ 79,99474 − 0,679649 ∗ 17,94737 = 0,070963 ≅ 0,071

A keresett egyenlet:
yˆ i = 0,071 − 0,065 x1i + 0,68 x2i (ezer Ft)

♥ β 0 ≅ 0,071 , tekintettel arra, hogy a magyarázó változók megfigyelt


értékei között nem szerepelt 0, ennek a paraméternek ebben az egyenlet-
ben nincs statisztikai jelentése.
♥ β1 ≅ −0,065 , ha két megyében azonos a regisztrált munkanélküliek
száma (= constans a 2. magyarázó változó), akkor abban, ahol ezer forint-
tal (= egy egységgel) nagyobb a nettó havi átlagkereset 65 fővel keveseb-
ben részesülnek rendszeres szociális segélyben.
♥ β 2 ≅ 0,68 , ha két megyében azonos a nettó havi átlagkereset (=
constans az 1. magyarázó változó), akkor abban, ahol ezer fővel (= egy
egységgel) nagyobb a regisztrált munkanélküliek száma 680 fővel többen
részesülnek rendszeres szociális segélyben.
A paraméterek előjeléből arra következtethetünk – és ezt tapasztaljuk
majd a szorossági mutatók számításakor is, és ezt látjuk akkor is, ha az

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 382 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 383 ►

eredményváltozót csak az egyik ill. csak a másik magyarázóváltózóval pár-


ban ábrázoljuk (13.4. és 13.5. sz. ábrák) –, hogy a nettó átlagkereset és a
rendszeres segélyben részesülők száma között negatív kapcsolat van (= a
nettó átlagkereset növekedése a segélyt kérők és kapók számának csökke-
nését vonja maga után, és fordítva). A regisztrált munkanélküliek és a
rendszeres segélyben részesülők száma között pedig pozitív kapcsolat van
(= a regisztrált munkanélküliek számának növekedése a segélyt kérők és
kapók számának növekedését vonja maga után, és fordítva.

A rendszeres segélyben részesülők és a nettó átlagkereset


kapcsolata (2003, Magyaro.)

35 y = -0,832x + 73,591
a segélyezettek száma (ezer fő)

30 R2 = 0,1373
25

20 Adatsor1
15 Lineáris (Adatsor1)

10

0
70 75 80 85 90
nettó átlagkereset (ezer Ft/fő/fó)

13.4.sz. ábra

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 383 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 384 ►

A regisztrált munkanélküliek és a rendszeres segélyben részsülők


kapcsolata (2003, Magyaro.)
y = 0,6869x - 5,2971
35
R2 = 0,9487
rendszeres segélyben részesülők

30

25

20
(ezer fő)

Adatsor1
15
Lineáris (Adatsor1)
10

0
0 10 20 30 40 50 60
-5
regisztrált munkanélküliek (ezer fő)

13.5.sz. ábra

A vizsgált változók közötti kapcsolatot leíró egyenletbe rendre behelyette-


sítettük a magyarázó változók megfigyelt értékeit, így jutottunk a regresz-
szió-értékekhez (= ŷi ), ezek jelentéssel bíró adatok. Pl.:
♥ Azokban a megyékben, ahol a nettó átlagkereset 87.100 Ft/fő/hó és
a regisztrált munkanélküliek száma 13.200 fő – a változók között lineáris
kapcsolatot feltételezve – a rendszeres segélyben részesülők száma 3.300 fő.
A munkatábla utolsó oszlopa a rezidium-négyzeteket (= ei2 ) tartal-
mazza, ezek összegét részben egy szorossági mutató (= I), részben pedig a
kapcsolódó becslési feladatokhoz295 használjuk.

295 A háromváltozós egyenlethez kapcsolódóan ezekkel nem foglalkozunk részletesen.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 384 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 385 ►

13.3.2. Háromváltozós korreláció-számítás


A vizsgált változók kapcsolatát nemcsak egyenlettel, hanem szorossági mutatók-
kal is jellemezhetjük. A kiszámítható mutatókat három csoportba oszthatjuk:
• páronként számítottak, (mintha csak kétváltozós kapcsolatot vizsgál-
nák) = totális korrelációs együtthatók;
• páronként számítottak, az éppen nem vizsgált változók hatásának ki-
szűrésével = parciális korrelációs együtthatók;
• az összes magyarázó változó eredményváltozóra gyakorolt hatását
együtt bemutatva = többszörös korrelációs együttható.
Az első csoportba tartozó mutatók a kétváltozós lineáris korrelációs
együttható mintájára írhatók fel.

ry1 =
∑d d 1 y
ry 2 =
∑d d 2 y
r12 =
∑d d 1 2

∑d ∑d 1
2 2
y ∑d ∑d 2
2
2
y ∑d ∑d 1
2 2
2

Az r betű futóindexében azoknak a változóknak a jele szerepel, melyek között a


kapcsolatot vizsgáljuk. A jelek feltüntetési sorrendjének gyakorlatilag nincs jelentősége (a
kapcsolat kölcsönös, 13.2.4.sz. fejezet), de általában az itt alkalmazott sorrendet
használjuk.
A második csoportba tartozó mutatók csak háromváltozós esetben ha-
tározhatók meg képlettel, ha a változók száma ennél több, a mátrix-
algebrát296 kell segítségül hívnunk.
ry1 − ry 2 r12 ry 2 − ry1r12 r12 − ry1ry 2
ry1.2 = ry 2.1 = r12. y =
(1 − r )(1 − r )
2
y2
2
12 (1 − r )(1 − r )
2
y1
2
12 (1 − r )(1 − r )
2
y1
2
y2

A harmadik csoportba tartozó mutatók közül van már ismert (= I) és új is


(= R). S mert mind a két mutató négyzetgyökvonással számítható, előjelük
nincs; így a kapcsolat irányát nem, csak annak szorosságát mutatják meg.

I = 1−
σ e2
=
σ y2ˆ
≅ 1 −
∑ ei2 R=
ry21 + ry22 − 2ry1ry 2 r12
σ y2 σ y2 ∑ d y2 1 − r122

296 Nem képezi tananyagunk részét.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 385 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 386 ►

A statisztikai gyakorlatban a kapcsolatok jellemzésére valamennyi felsorolt


szorossági mutatónak a négyzetét (= determinációs együttható) is használ-
juk, általában %-ban kifejezve.

BEMUTATÓ FELADAT

A 13.3.1. fejezet bemutató példáját folytatjuk.

ry1 =
∑d d 1 y
=
∑d ∑d1
2 2
y

− 188,36684
= −0,37055 → ry21 ≅ 13,7%
226,38347 ∗1141,44105

♥ A 2003 évi nettó átlagkeresetek nagysága és a rendszeres szociális


segélyben részesülők száma között lineáris összefüggést feltételezve –
figyelmen kívül hagyva, hogy a modellben egy másik magyarázó változó is
szerepel – gyengének mondható negatív kapcsolatot tártunk fel. A vál-
tozók kölcsönösen 13,7 %-ban befolyásolják egymás alakulását (egymás
szóródását297). (Hasonlítsuk össze a β1 regressziós együtthatóval és a 13.4.
sz. ábrával!)

ry 2 =
∑d d 2 y
=
∑d ∑d2
2
2
y

1576,46158
= 0,97403 → ry21 ≅ 94,9%
2294,92737 ∗1141,44105

♥ 2003-ban a munkanélküliek száma, mint magyarázó változó és a


rendszeres szociális segélyben részesülők száma, mint eredményváltozó
között az összefüggést lineárisnak feltételezve – figyelmen kívül hagyva,
hogy a modellben egy másik magyarázó változó is szerepel – erős pozitív
kapcsolatot mutattunk ki. A változók kölcsönösen ≅95 %-ban magyaráz-

297 A zárójelben olvasható megfogalmazás az elméletileg pontosabb, de a hétköznapi


gyakorlatban nem ezt szokták használni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 386 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 387 ►

zák meg egymás alakulását.298 (Hasonlítsuk össze a β 2 regressziós együtt-


hatóval és a 13.5. sz. ábrával!)

r12 =
∑d d 1 2
=
∑d ∑d 1
2 2
2

− 255,34526
= −0,35425 → ry21 ≅ 12,5%
226,38947 ∗ 2294,92737

♥ A két magyarázó változó között lineáris összefüggést feltételez-


tünk. A számítás során – figyelmen kívül hagyva, hogy a modellben egy
másik magyarázó változó is szerepel – gyenge negatív kapcsolatot fedez-
tünk föl. A változók mindössze 12,5 %-ban befolyásolják egymás alakulá-
sát. (Lásd: 13.6.sz. ábra)
Gondoljon az elméleti közgazdaságtanban tanultakra! A munkaerőpiacon magas
munkanélküliség esetén nagy a munkaerő kínálat, ami lefelé viszi a munkaerő-áru árát.

A regiszrált munkanélküliek és a nettó átlagkereset összefüggése


(2003, Magyaro.)

88
nettó átlagkereset (ezer Ft/fő/hó)

y = -0,1113x + 81,992
86 R2 = 0,1255
84

82 Adatsor1
80 Lineáris (Adatsor1)

78

76

74
0 10 20 30 40 50 60
regisztrált munkanélküliek (ezer fő)

13.6.sz. ábra

298 Az előző és ezen szöveges megfogalmazás közötti különbségekkel akartuk


érzékeltetni, hogy nincs kötelező szabvány szöveg. A tartalom legyen igaz.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 387 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 388 ►

ry1 − ry 2 r12
ry1.2 = =
(1 − r )(1 − r )
2
y2
2
12

− 0,37055 − 0,97403 ∗ (− 0,35425)


= −0,12042 → ry21.2 ≅ 1,5%
(1 − 0,97403 )∗ (1 − (− 0,35425) )
2 2

♥ A 2003 évi nettó átlagkeresetek nagysága és a rendszeres szociális


segélyben részesülők száma között lineáris összefüggést feltételezve –
kiszűrve a modellben szereplő másik magyarázó változó hatását – még
gyengébb negatív kapcsolat mutatható ki. A változók kölcsönösen 1,5
%-ban (mondhatni, alig) befolyásolják egymás alakulását.
ry 2 − ry1r12
ry 2.1 = =
(1 − r )(1 − r )
2
y1
2
12

0,97403 − (− 0,37055) ∗ (− 0,35425)


= 0,970276 → ry22.1 ≅ 94,1%
(1 − (− 0,37055) )∗ (1 − (− 0,35425) )
2 2

♥ 2003-ban a munkanélküliek száma, mint magyarázó változó és a


rendszeres szociális segélyben részesülők száma, mint eredményváltozó
között az összefüggést lineárisnak feltételezve – kiszűrve a modellben
szereplő másik magyarázó változó hatását – erős pozitív kapcsolatot mu-
tattunk ki. A változók kölcsönösen ≅94 %-ban magyarázzák meg egymás
alakulását.299
r12 − ry1ry 2
r12. y =
(1 − r )(1 − r )
2
y1
2
y2

− 0,35424 − (− 0,37055) ∗ 0,97403


= = 0,031738 → r122 . y ≅ 0,1%
(1 − (− 0,37055) )∗ (1 − 0,97403 )
2 2

♥ A két magyarázó változó között lineáris összefüggést feltételez-


tünk. A számítás során – kiszűrve a modellben szereplő eredményváltozó
hatását – csak igen gyenge negatív kapcsolatot mutattunk ki. A változók
mindössze 0,1 %-ban befolyásolják egymás alakulását. (Gyakorlatilag line-

299 Az előző és ezen szöveges megfogalmazás közötti különbségekkel akartuk


érzékeltetni, hogy nincs kötelező szabvány szöveg. A tartalom legyen igaz.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 388 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 389 ►

áris kapcsolat nincs köztük, mondhatnánk, de ezt biztosan csak a szüksé-


ges hipotézisellenőrzés után állíthatjuk, akkor is csak egy adott
szignifikanciaszint mellett.)

σ e2
I = 1− 2 =
σ y2ˆ
≅ 1−
∑ ei2
=
σy σ y2 ∑ d y2
1,84 2 7,76 2 57,66880
= 1− 2
= 2
≅ 1− ≅ 0,97 → I 2 ≅ 95%
7,96 7,96 1141,44105

ry21 + ry22 − 2ry1ry 2 r12


R=
1 − r122

=
(− 0,37055)2 + 0,974032 − 2 ∗ (− 0,37055) ∗ 0,97403 ∗ (− 0,35425) =
1 − (− 0,35425)
2

= 0,974411 → R 2 ≅ 95%
♥ A magyarázó változók együttesen igen nagy mértékben, 95 %-ban
befolyásolják az eredményváltozó alakulását. Más tényezők mindössze 5
%-ban játszanak szerepet.
A többszörös korrelációs együtthatókban szereplő és a korábbiak-
ban300 még ki nem számított szórások:

13.7. sz. tábla (A 13.6./2.sz.tábla kiegészítése)

A regresszió-értékek szórásának mellékszámítása, ( yˆ i − y ) adatok


2

Pest
13,6288 53,1186 13,7766 50,3030 58,7406 29,8736
1,3151
1,2961 0,0042 20,3918 588,4070 11,0293 9,0501 47,2690
Csongrád Ösz.:
0,0269 173,5912 9,3895 0,0640
2,4968 1.083,7723

ŷ -ra: σ =
∑ ( yˆ i − y )i
2

=
1083,7723
= 7,7594826 ≅ 7,76
n −1 18

300 A megfigyelt változók szórásainak számítása a 13.6./2. sz. tábla alatt található meg.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 389 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 390 ►

13.3.3. Multikollinearitás
A többváltozós regressziós vizsgálatok (modellek) egyik legnagyobb prob-
lémája a multikollinearitás. A szó a magyarázó változók között fennál-
ló, és ezzel az eredetileg vizsgálandó kapcsolat többszöröződésére
utal. Jelenlétét már az un. totális korrelációs együtthatók (r12 ) is jelzik, a
parciális korrelációs együtthatók (r12. y ) pedig megerősítik. (A totális és a
parciális korrelációs együttható számértékének eltérése, néha előjeleik kü-
lönbsége301 is utal a multikollinearitásra.) Nagyságát pedig egy erre a célra
szerkesztett mutató jelzi.

(
M = R 2 − ∑ R 2 − ryi2 )
A mutató a többszörös determinációs együttható összetevőkre bontásán
alapszik. Minden újabb, a modellbe kerülő magyarázó változóra vonatko-
zóan meg tudjuk határozni, hogy mennyivel növeli R 2 értékét, ha az ak-
tuális változót utolsónak vonjuk be a vizsgálatba. Ha ezeket a hatásokat
összeadjuk, és az így kapott érték egyenlő a többszörös determinációs
együtthatóval, akkor a multikollinearitás nulla, azaz nincs jelen a modell-
ben. Ebből logikusan következik, hogy M minél nagyobb értéket vesz fel,
a magyarázó változók között fennálló kapcsolat annál jelentősebb.
A magyarázó változók közötti kapcsolat azonban nem minden esetben
zavaró. Ha az egyenletet nem akarjuk más célra felhasználni, csak adott
x1i , x2i , stb. értékek mellett az eredményváltozó meghatározására, akkor
jelenléte elviselhető, hiszen minden ŷi értékben egyformán szerepel, így
azok arányait nem torzítja.
Ha azonban a kiszámított egyenletet egy egyenletrendszer tagjaként
akarjuk használni, akkor már mindenképpen meg kell oldani kiszűrését, ha
M alapján túl nagynak ítéljük mértékét. A kiszűrés igen munka- és időigé-
nyes feladat. El kell hagynunk az egymással szoros kapcsolatban lévő ma-
gyarázóváltozók egyikét, majd minden számítást ismét el kell végezni,
hogy kiderüljön, megszűnt-e a multikollinearitás avagy sem. A változók
elhagyását pedig mindaddig kell folytatnunk, amíg M ≅ 0 .

301Ha a totális és a parciális korrelációs együttható előjele eltérő, akkor rejtett negatív
multikollinearitásról beszélünk.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 390 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 391 ►

BEMUTATÓ FELADAT

A 13.3.1. fejezetben elkezdett és a 13.3.2. fejezetben továbbvitt bemutató példáját


folytatjuk.

M = R 2 − ∑ R 2 − ryi2( )
( ) (
= 0,9744112 − 0,9744112 − (− 0,37055) − 0,9744112 − 0,974032 =
2
)
2
= 0,974411 − 0,812168 − 0,000743 = 0,136566

Példánkban a multikollinearitás nem jelentős, hisz az összhatásnak


( )
R 2 ≅ 0,95 mindössze 0,14-ed részét teszi ki.
A mutató (= M ) felbontásából jól látszik, hogy az egyik ill. a másik
magyarázó változó milyen mértékben járul hozzá a többszörös determiná-
ciós együtthatóhoz ( x1 annak lényegesen nagyobb, x2 pedig lényegesen
kisebb részét teszi ki).
13.3.4. Betekintés a háromváltozós lineáris kapcsolathoz
tartozó becslési és hipotézisellenőrzési feladatokba
A kétváltozós lineáris egyenlettel kapcsolatban már leírtuk, azok az adatok,
melyekkel a korrelációs, regressziós számításokat végezzük mintából
származók, így a regressziós paraméterek, és az ezek alapján meghatáro-
zott regresszió-értékek becsült értékek, melyek csak egy adott valószínűség
mellett igazak. Sőt a kapcsolat meglétében is kételkednünk kell, hiszen
előfordulhat, hogy szélsőséges mintából dolgoztunk. Kételkedésünkre
pedig a hipotézisellenőrzésekre alapozva kaphatunk választ, természetesen
ezt is csak adott szignifikancia-szinten.
A három- vagy még többváltozós egyenletek esetén a becslési feladatok, a
paraméterek ill. a regresszió-értékek konfidencia intervallumának kiszámí-
tása csak a mátrixalgebra302 segítségével történhet meg, így ezeket a számí-
tásokat tankönyvünk nem tartalmazza. A hipotézisellenőrzés elvégzéséhez
azonban a nevezett matematikai ismertekre nincs szükségünk, így erre
röviden kitérünk.
A hipotéziseket felírhatjuk egyenként mindegyik magyarázó válto-
zónkhoz kapcsolódóan a regressziós paraméterekre, tökéletesen ugyanúgy,

302A tanterv szerit az ehhez szükséges matematikai ismeretek a Statisztika tárgy lezárása
után kerülnek sorra.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 391 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 392 ►

mint a kétváltozós esetben, és ellenőrzésüket ugyanazon próbafüggvé-


nyekkel végezhetjük el; de tesztelhetjük a paramétereket együttesen is (=
globális F-próba).
Az egyedi tesztelések hipotézisei és próbafüggvényei:
H 0 =: β1 = 0 β1
t=
H 1 : β1 ≠ 0 σβ 1

∑ ( yˆ − y)
2
SSR i
MSR 1 1
F= = =
MSE SSE ∑ ( y1 − yˆ1 )2
n − m −1 n − m −1
A harmadik változó bevezetése következtében megváltozik a próbák sza-
badságfoka. A t-próba303 esetében: (v = n − m − 1) , az F-próba esetében pe-
dig csak a nevezőre vonatkozik a változás: (v2 = n − m − 1) .
A globális F-próba hipotézisei és próbafüggvényei:

∑ ( yˆ − y)
2
SSR i
H 0 =: β1 = β 2 = 0 MSR 2 2
F= = =
H1 : β i ≠ 0 MSE SSE ∑ ( y1 − yˆ1 )2
n − m −1 n − m −1
A hipotéziseket most csak az általunk tárgyalt háromváltozós esetre írtuk
fel, ha a magyarázó változók száma ennél több, akkor a nullhipotézis
hosszabb lesz, további paraméterek kerülnek az egyenlőségjelek közé. Az
alternatív hipotézis azonban ugyanez marad, szavakkal megfogalmazva: a
magyarázó változók között legalább egy olyat találunk, aminek értéke nem
nulla. Ez a megfogalmazás arra is figyelmezett, hogy egy „laza” próbával
van dolgunk, ami már akkor is kapcsolatot jelezhet, ha csak egyetlen (eset-
leg sokból csak egy) x -tényezővel van kapcsolatban az y − tényező.

303 Ezt a próbát – mivel tananyagunk a becslési feladatokra nem tér ki – olvasóink csak
akkor tudják elvégezni, ha a nevezőben szereplő standardhiba értékét megadja a példa
szerkesztője.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 392 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 393 ►

BEMUTATÓ FELADAT

A 13.3.1. fejezetben elkezdett, a 13.3.2. és a 13.3.3. fejezetben továbbvitt bemutató


példáját folytatjuk.
Ellenőrizzük 5 ill. 10 %-os szignifikancia szinten, hogy szignifikáns-e a
kapcsolat a rendszeres szociális segélyben részesülők száma, a netttó át-
lagkereset és a munkanélküliek száma között 2003-ban! A hipotéziseket
nem ismételjük meg, hiszen azok példa-függetlenek (állandóak).
Globális F-próba:

∑ ( yˆ − y)
2
SSR i 177,5477
MSR 2 2 2
F= = = = ≅ 54,21
SSE ∑ ( y1 − yˆ1 ) 26,20193
2
MSE
n − m −1 n − m −1 16

Az F-táblából kikeresett értékek:


F02,9;16 = 2,67 F02,95
;16
= 3,63

Döntésünk mindkét valószínűségen azonos, ui. mindkét táblabeli érték


kisebb, mint a próbafüggvény értéke.
H 0 : β1 = β 2 = 0 → elvetve
H 1 : β i ≠ 0 → elfogadva

♥ A 19 elemű minta alapján 5,0 és 10,0 %-os szignifikancia-szinten is


állíthatjuk, hogy – lineáris összefüggést feltételezve – a vizsgált magyarázó
változók közül legalább az egyik nem elhanyagolható kapcsolatban van az
eredményváltozóval.
13.3.5. Különböző, a korreláció- és regresszió-számításhoz
kapcsolódó kérdések

1. Az idősorok korrelációja.
2. A minőségi ismérvek bevonása a modellbe.
3. Diagnosztikai tesztelés.304

304 Tananyagunkban a diagnosztikai tesztelésre bemutató feladatot nem találnak (kevés


elemszámú mintákkal dolgoztunk), éppen ezért ez az anyagrész megoldandó feladat
formájában számonkérésre sem kerül.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 393 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 394 ►

1. A társadalmi, gazdasági eseményeket vizsgálva igen sok idősor áll


rendelkezésünkre. Az idősorok adatai mennyiségi jellegűek, kínálkozik
tehát a lehetőség, vizsgáljuk meg kapcsolatukat. Az ilyen esetekben azon-
ban óvatosnak kell lennünk. Előfordul ui., hogy a korrelációs együtthatók
akkor is kapcsolatot jeleznek, ill. az egyenletek regressziós paraméterei
akkor is eltérnek nullától, ha a vizsgált változók között nincs jelentős kap-
csolat. Ennek oka, hogy az általunk éppen vizsgált időben változó adato-
kat egy a modellbe be nem vont harmadik tényező azonos módon befo-
lyásolja, és ez mutatkozik meg elsődlegesen számításainkban úgy, hogy az
együtthatók kapcsolatot jeleznek.
A rejtett tényező hatását többféleképpen is kiszűrhetjük:
• Mindkét idősor adataiból kiszámítjuk az abszolút305 vagy a relatív306
változásokat. Majd ezeket az adatokat d x ill. d y adatnak tekintve ki-
számítjuk a lineáris korrelációs együtthatót. Ha ez most is jelentősen
eltér nullától, akkor gyanúnk helytelen volt, a változók között valóban
van kapcsolat.
• Mindkét idősor adataiból kiszámítjuk a változásukat jellemező trend-
egyenleteket, majd trendértékeket, végül pedig a rezidiumokat307. Ez-
után munkánkat úgy folytatjuk, mint az előző esetben.
• Kétváltozós egyenletünket háromváltozóssá alakítjuk. A harmadik
változó, azaz a második magyarázó változó az idő: t i = 1,2,3,..n . Majd
kiszámítjuk a magyarázó változók közötti parciális korrelációs együtt-
ható, ill. a multikollinearitás mérőszámát, és ezek számértékeinek is-
meretében tudjuk megmondani, hogy igazi-e a kapcsolat az eredetileg
vizsgált idősorok között.
• Diagnosztikai tesztelést végzünk, és a kapott ábránk alapján döntünk.
Természetesen a fent leírt módszereknek szigorú alkalmazási feltételei
vannak, amikről a szakkönyvekben részletesen olvashatunk.

305 d x = xi − xi −1 ill., a d y = yi − yi −1 hol xi = az egyik és yi = a másik idősor


megfigyelt adatai.
xi y
306 lx = és l y = i
xi−1 yi −1
307 e x = xi − xˆi ill. e y = yi − yˆ i , ahol x̂i = az egyik és ŷi = a másik változóra vo-
natkozó trendérték.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 394 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 395 ►

2. Mindennapi tapasztalataink gyakran azt mutatják, hogy egy-egy


mennyiségi adat nagyságát, alakulását nemcsak más mennyiségi adatok
nagysága, alakulása, hanem minőségi ismérvek is befolyásolják. Pl.: a dol-
gozók bére – statisztikai felmérések bizonyítják – azonos munkakörökben,
végzettség, gyakorlottság esetén is eltérés mutatnak nemenként (a nők
kárára). Ezért célszerű bevonni a korrelációs-regressziós számításokba
minőségi változókat is. Pl.: a férfi – nő minőségi ismérvváltozatok 0 és 1
kóddal vonhatók be. Gondot azok az esetek okoznak, amikor egy minősé-
gi ismérvnek többféle kimenetele (= ismérvváltozata van), tananyagunk
ennek a problémának a megoldására azonban nem tér ki.
3. A diagnosztikai tesztelés ábrák készítését jelenti, és ezen ábrák alap-
ján következtetések levonását a korrelációs kapcsolatokra vonatkozóan.
Alkalmazhatjuk idősorokból végzett számítások esetében és csak mennyi-
ségi változókat tartalmazó kapcsolatokra vonatkozóan is. Ábrázolásra – a
koordináta rendszerben – mindkét esetben a rezidiumok308 kerülnek (a
függőleges tengelyen), mégpedig előjeles alakban. A vízszintes tengelyen
pedig a magyarázó változó (idősorok korrelációja estén az idő) adatait
tüntetjük föl. A módszer alapján azonban csak akkor vonható le egyértel-
mű következtetés, ha meglehetősen sok változót figyeltünk meg. A
rezidium-pontok ábrái négy típusba sorolhatók.
• A pontok a vízszintes tengely mentén úgy helyezkednek el, hogy
mindkét oldalon (pozitív és negatív negyed) egy-egy az x-tengellyel
párhuzamos egyenessel határolhatók.
• A pontok egy olyan sávban helyezkednek el, mely tölcsérformát képez,
és ennek a tölcsérformának az x-tengely a szimmetria tengelye.
• A pontok egy olyan sávban helyezkednek el, mely α (0〈α 〈90 ) szög-
ben metszi a koordinátarendszer vízszintes tengelyét.
• A pontok egy parabola vonalak által határolt sávban helyezkednek el,
és ez a sáv két helyen is metszi az x-tengelyt.
Az ábrák közül az elsőként említett azt jelenti, hogy a rezidiumok függet-
lenek a vízszintes tengelyen felmért adattól. (x alacsony értékeinél is talá-
lunk pozitív és negatív, kis és nagy értékű rezidiumokat; és ugyanezt

308 ei = yi − yˆ i , ahol yi = a regressziós egyenlet eredményváltozója, ŷi = pedig a


regresszióérték.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 395 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 396 ►

mondhatjuk el x magas stb. értékeiről is.) Ebből arra következtethetünk,


hogy a változók kapcsolata valódi.
A másik három ábra problémát jelez, a rezidiumoknak ui. vagy az elő-
jele, vagy nagysága, vagy mindkettő függvénye a vízszintes tengelyen ábrá-
zolt adatnak. A jelzett probléma lehet az, hogy nem jó egyenlettípust vá-
lasztottunk, hogy nem jó illesztési módszert alkalmaztunk stb.309

BEMUTATÓ FELADAT I.

Vizsgáljuk meg a kapcsolatot a feladott postai csomag-küldemények (xi )


és a feladott táviratok ( yi ) 2001 és 2005 évi mennyiségei között!

13.8.sz. tábla
csomag távirat csomag távirat csomag távirat
év
t ezer db ezer db mozgáótl. Trend különbségek
n.é. i
xi yi x̂i ŷi xi − xˆi yi − yˆ i
2001
1 2.740 102 – –
I. dx dy d x2 d y2 dxd y
II. 2 2.737 121 – –
III. 3 2.433 114 2.760,6 109,9 -327,6 4,1 107.338,1 17,0 -1.351,45
IV. 4 3.172 104 2.725,6 108,4 446,4 -4,4 199.250,6 19,1 -1.952,89
2002
5 2.661 99 2.752,1 105,6 -91,1 -6,6 8.303,8 43,9 603,7031
I.
II. 6 2.536 112 2.784,8 101,5 -248,8 10,5 61.876,6 110,3 -2.611,88
III. 7 2.846 101 2.732,9 96,8 113,1 4,3 12.797,3 18,1 480,7813
IV. 8 3.020 84 2.677,8 91,6 342,3 -7,6 117.135,1 58,1 -2.609,66
2003
9 2.398 81 2.568,8 86,0 -170,8 -5,0 29.155,6 25,0 853,75
I.
II. 10 2.358 89 2.412,4 80,8 -54,4 8,3 2.956,6 68,1 -448,594
III. 11 2.152 79 2.288,0 79,9 -136,0 -0,9 18.496,0 0,8 119
IV. 12 2.463 64 2.156,3 89,5 306,8 -25,5 94.095,6 650,3 -7.822,13
2004
13 1.960 94 2.005,4 120,3 -45,4 -26,3 2.058,9 689,1 1.191,094
I.
II. 14 1.742 153 1.852,9 164,6 -110,9 -11,6 12.293,3 135,1 1.288,922

309 Részletesebben: az irodalomjegyzékben felsorolt vagy más szakkönyvekben.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 396 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 397 ►

III. 15 1.561 261 1.747,8 203,4 -186,8 57,6 34.875,6 3320,6 -10.761,5
IV. 16 1.834 237 1.727,6 234,0 106,4 3,0 11.315,6 9,0 319,125
2005
17 1.748 231 1.757,5 248,5 -9,5 -17,5 90,3 306,3 166,25
I.
II. 18 1.793 261 1.860,3 246,4 -67,3 14,6 4.522,6 213,9 -983,531
III. 19 1.749 269 – – – – 716.561,4 5684,6 -23.519
IV. 20 2.468 212 – – – –

Megjegyzések a 13.8. sz. táblához:

xi -vel, yi -vel jelöltük megfigyelt változókat (= csomagforgalom, táviratforgalom),


melyek között a kapcsolatot kerestük.
• Az adatokat ábrázoltuk, az egyenletet és a determinációs együtthatót az ábra alapján
az EXCEL-program adta meg. (Lásd: 13.7. sz. ábra)
• A megfigyelt adatokból mozgóátlagolású trendet számítottunk. A számítás lépéseit
EXCEL-programmal végeztük, ide csak az eredményeket, a trendadatokat x̂i és ŷi
(= centrírozott mozgóátlagok, lásd. 12. sz. fejezet) másoltuk át.
• A szürke háttérrel és a vastagabb kerettel kiemelt adatok a második korrelációszámítás „szereplői”.

Egyes postai teljesítmények kapcsolata (2001 -


2005, negyedéves bontásban, Magyaro.)

300 y = -0,1053x + 387,4842


R2 = 0,4900
felvett táviratok (ezer db)

250

200
Adatsor1
150
Lineáris (Adatsor1)
100

50

0
0 1000 2000 3000 4000
f elvett csomagok (ezer db)

13. 7. sz. ábra

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 397 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 398 ►

A megfigyelt adatokból számított regresszió egyenlet:


yˆ i = 387,5 − 0,11xi (ezer db) ill. korrelációs együttható: r ≅ −0,7 310. A számí-
tás tehát elég szoros negatív kapcsolatot sejtet a változók között. Tekintettel
azonban arra, hogy idősorokkal, ráadásul szezonális ingadozást is tartalmazó
idősorokkal dolgoztunk, további számításokat végeztünk a kapcsolat meglét-
ének ellenőrzésére. A 13. 8. sz. munkatábla utolsó három oszlopának össze-
sen adatait felhasználva ismét kiszámítottuk a lineáris korrelációs együtthatót.

r=
∑d d x y
=
− 23519
≅ −0,356 → r 2 ≅ 12,7%
∑d ∑d 2
x
2
y
766561,4 ∗ 5684,6

A mutató a kapcsolatot ugyanolyan irányúnak, de már lényegesen gyen-


gébbnek mutatja.

BEMUTATÓ FELADAT II.


csomag idő távirat
ezer db ezer db 13.9./1. sz. tábla
t i = x2i
x1i yi d1 d2 dy
2.740 1 102 421,5 -9,5 -41,4
2.737 2 121 418,5 -8,5 -22,4
2.433 3 114 114,5 -7,5 -29,4
3..172 4 104 853,5 -6,5 -39,4
2.661 5 99 342,5 -5,5 -44,4
2.536 6 112 217,5 -4,5 -31,4
2.846 7 101 527,5 -3,5 -42,4
3.020 8 84 701,5 -2,5 -59,4
2.398 9 81 79,4 -1,5 -62,4
2.358 10 89 39,4 -0,5 -54,4
2.152 11 79 -166,6 0,5 -64,4
2.463 12 64 144,5 1,5 -79,4
1.960 13 94 -358,6 2,5 -49,4

310 Az EXCEL-program a determinációs együtthatót adta meg, de a regressziós egyenes


lejtéséből, és a β1 paraméter előjeléből egyértelmű, hogy a korrelációs együttható negatív előjelű.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 398 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 399 ►

1.742 14 153 -576,6 3,5 9,6


1.561 15 261 -757,6 4,5 117,6
1.834 16 237 -484,6 5,5 93,6
1.748 17 231 -570,6 6,5 87,6
1.793 18 261 -525,6 7,5 117,6
1.749 19 269 -569,6 8,5 125,6
2.468 20 212 149,5 9,5 68,6
4.6371 210 2868 0,0 0,0 0,0
átlag:
2.318,55 10,5 143,4

13.9./2. sz. tábla (a 13.9./1. folytatása – jobb oldali oszlopok)


d12 d 22 d y2 d1 d y d2d y d1 d 2
177.620,1 90,3 1.714,0 -17.448,0 393,3 -4.003,8
175.100,4 72,3 501,8 -9.373,3 190,4 -3.556,8
13.098,8 56,3 864,4 -3.364,8 220,5 -858,4
728376,9 42,3 1.552,4 -33.625,9 256,1 -5.547,4
117.272,0 30,3 1.971,4 -15.204,8 244,2 -1.883,5
47.284,5 20,3 986,0 -6.827,9 141,3 -978,5
278.203,5 12,3 1.797,8 -22.363,9 148,4 -1.846,1
492032,1 6,3 3.528,4 -41.666,1 148,5 -1.753,6
6.312,3 2,3 3.893,8 -4.957,7 93,6 -119,2
1.556,3 0,3 2.959,4 -2.146,1 27,2 -19,7
27.738,9 0,3 4.147,4 10.725,8 -32,2 -83,3
20.865,8 2,3 6.304,4 -11.469,3 -119,1 216,7
128558,1 6,3 2.440,4 17.712,4 -123,5 -896,4
332409,9 12,3 92,2 -5.534,9 33,6 -2.017,9
573.882,0 20,3 1.3829,8 -89.087,9 529,2 -3.409,0
234.788,7 30,3 8.761,0 -45.353,9 514,8 -2.665,0
325.527,3 42,3 7.673,8 -49.980,2 569,4 -3.708,6
276.202,8 56,3 1.3829,8 -61.804,7 882,0 -3.941,6
32.4387,2 72,3 1.5775,4 -715.35,5 1067,6 -4.841,2
22335,3 90,3 4.706,.0 102.52,3 651,7 1.419,8
4303553,0 665,0 97.328,8 -453.054,4 5837,0 -40.493,5

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 399 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 400 ►

A 13.9.sz.tábla utolsó előtti sorában a vastagon szedett adatok = összesen adatok; az


utolsó sor adatai pedig az adott oszlopban szereplő adatok számtani átlagai.
A tábla összesen adatainak felhasználásával kiszámítottuk a totális, a parci-
ális és a többszörös körrelációs együtthatót, valamint a multikollinearitás
mérőszámát.

ry1 =
∑d d 1 y
=
− 453054,4
= 0,70 → ry21 ≅ 49,0%
∑d ∑d1
2 2
y
4303553 ∗ 97328,8

ry 2 =
∑d d 2 y
=
5837,0
≅ 0,73 → ry22 = 52,6%
∑d ∑d 2
2
2
y
665,0 ∗ 97328,8

r12 =
∑d d 1 2
=
− 40493,5
≅ 0,76 → r122 ≅ 57,3%
∑d ∑d
1
2 2
2
4303553,0 ∗ 665,0

ry1 − ry 2 r12
ry1.2 = =
(1 − r )(1 − r )
2
y2
2
12

− 0,700029 − 0,725535 ∗ (− 0,756939)


≅ −0,34 → ry21.2 = 11,3%
(1 − 0,725535 )(1 − (− 0,756939 ))
2 2

ry 2 − ry1r12
ry 2.1 = =
(1 − r )(1 − r )
2
y1
2
12

0,725535 − (− 0,700029 ) ∗ (− 0,756939 )


= 0,42 → ry22.1 ≅ 17,6%
(1 − (− 0,700029) )(1 − (− 0,756939) )
2 2

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 400 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 401 ►

r12 − ry1ry 2
r12. y = =
(1 − r )(1 − r )
2
y1
2
y2

− 0,756939 − (0,700029 ) ∗ 0,725535


= −0,51 → r122 . y ≅ 25,7%
(1 − (− 0,700029) )(1 − 0,725535 )
2 2

ry21 + ry22 − 2ry1ry 2 r12


R=
1 − r122
(− 0,700029)2 + 0,7255352 − 2 ∗ (− 0,700029) ∗ 0,725535 ∗ (− 0,756939) ≅
1 − (− 0,756939 )
2

≅ 0,76 → R 2 ≅ 58%

M = R 2 − ∑ (R 2 − ryi2 ) =
( ) (
0,761369 2 − 0,761369 2 − (0,700029) − 0,761369 2 − 0,725535 2 ≅ 0,44
2
)
A számítások ugyanazt mutatják, amit már az I. bemutató példában is lát-
tunk. A magyarázó változók között meglehetősen szoros kapcsolat van, a
multikollinearitás mértéke is jelentősen eltér a nullától, így nem ajánlott
ezen változók között a kapcsolatot a megtanult korrelációs, regressziós
módszerekkel elemezni, és azok eredményeiből következtéseket levonni.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 401 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 402 ►

BEMUTATÓ FELADAT III.

Vizsgáljuk meg a kapcsolatot a megfigyelt ágazat (oktatás) véletlenül kivá-


lasztott dolgozóinak (18 fő) bruttó bére ( yi , Ft ) , szolgálati ideje (x1i , év ) ,
neme (x2i , férfi = 0, nő = 1) között!

év nem br. bér 13.10.1.sz. tábla (folyt. 13.10.2.)


s.sz. x1i x2i yi d1 d2 dy d12 d 22
1. 20 0 203..825 -0,5 -0,5 13.670 0,25 0,25
2. 20 1 193.792 -0,5 0,5 3.637 0,25 0,25
3. 15 0 174.261 -5,5 -0,5 -15.894 30,25 0,25
4. 17 1 169.368 -3,5 0,5 -20.787 12,25 0,25
5. 15 0 169.500 -5,5 -0,5 -20.655 30,25 0,25
6. 12 1 149.634 -8,5 0,5 -40.521 72,25 0,25
7. 19 0 189.432 -1,5 -0,5 -723 2,25 0,25
8. 20 1 182.226 -0,5 0,5 -7929 0,25 0,25
9. 25 0 253.010 4,5 -0,5 62.855 20,25 0,25
10. 30 1 221.996 9,5 0,5 31.841 90,25 0,25
11 12 0 143.936 -8,5 -0,5 -46.219 72,25 0,25
12 15 1 141.195 -5,5 0,5 -48.960 30,25 0,25
13 10 0 137.243 -10,5 -0,5 -52.912 110,25 0,25
14 12 1 148.804 -8,5 0,5 -41.351 72,25 0,25
15 30 0 271.319 9,5 -0,5 81.164 90,25 0,25
16 32 1 268.613 11,5 0,5 78.458 132,25 0,25
17 30 0 210.839 9,5 -0,5 20.684 90,25 0,25
18 35 1 193.797 14,5 0,5 3.642 210,25 0,25
Σ 369 9 3.422.790 0 0 0 1.066,5 4,5
átl. 20,5 0,5 190.155

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 402 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 403 ►

13.10.2.sz. tábla
A 13.11. sz. tábla folytatása (jobb oldali oszlopok)
d y2 d1 d y d2d y d1 d 2 ŷi ei2
186.868.900 -6.835 -6.835 0,25 196.837,0 48.832.581,6
13.227.769 -1.818,5 1.818,5 -0,25 178.931,1 220.846.297,0
252.619.236 87.417,0 7.947,0 2,75 174.127,3 17.870,1
432.099.369 72.754,5 -10.393,5 -1,75 165.305,3 16.505.424,9
426.629.025 113.602,5 10.327,5 2,75 174.127,3 21.412.098,9
1.641.951.441 344.428,5 -20.260,5 -4,25 142.595,7 49.538.155,0
522.729 1.084,5 361,5 0,75 192.295,0 8.196.993,1
62.869.041 3.964,5 -3.964,5 -0,25 178.931,1 10.856.354,4
3.950.751.025 282.847,5 -31.427,5 -2,25 219.546,6 1.119.798.038,0
1.013.849.281 302.489,5 15.920,5 4,75 224.350,4 5.543.186,61
2.136.195.961 392.861,5 23.109,5 4,25 160.501,5 274.416.859,0
2.799.679.744 555.576,0 26.456,0 5,25 151.417,7 200.921.359,0
1.709.905.201 351.483,5 -20.675,5 -4,25 142.595,7 38.543.419,4
6.587.594.896 771.058,0 -40.582,0 -4,75 242.256,3 844.642.611,0
6.155.657.764 902.267,0 39.229,0 5,75 233.434,3 1.237.544.001,0
427.827.856 196.498,0 -10.342,0 -4,75 242.256,3 987.044.491,0
13.264.164 52.809,0 1.821,0 7,25 247.060,0 2.836.951.969,0
30.208.595.002 4.691.768 -41.970,0 8,5 3.422.790,0 8.147.406.029,0

ry1 =
∑d d 1 y
=
4691768
= 0,83 → ry21 ≅ 68,3%
∑d ∑d
1
2 2
y
1066,5 ∗ 30208595002

ry 2 =
∑d d 2 y
=
− 41970
≅ −0,11 → ry22 = 1,3%
∑d ∑d 2
2
2
y
4,5 ∗ 30208595002

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 403 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 404 ►

r12 =
∑d d 1 2
=
8,5
≅ 0,12 → r122 ≅ 1,5%
∑d ∑d
1
2 2
2
1066,5 ∗ 4,5

ry1 − ry 2 r12
ry1.2 = =
(1 − r )(1 − r )
2
y2
2
12

0,826591 − (− 0,11383) ∗ 0,122697


≅ 0,85 → ry21.2 = 72,7%
(1 − (− 0,11383) )(1 − 0,122697 )
2 2

ry 2 − ry1r12
ry 2.1 = =
(1 − r )(1 − r )
2
y1
2
12

− 0,11383 − 0,826591∗ 0,122697


= −0,39 → ry22.1 ≅ 15,0%
(1 − 0,826591 )(1 − 0,122697 )
2 2

r12 − ry1ry 2
r12. y = =
(1 − r )(1 − r )
2
y1
2
y2

0,122697 − 0,826591∗ (− 0,11383)


= 0,39 → r122 . y ≅ 15,0%
(1 − 0,826591 )(1 − (− 0,11383) )
2 2

ry21 + ry22 − 2ry1ry 2 r12


R= =
1 − r122
0,8265912 + (− 0,11383) − 2 ∗ 0,826591 ∗ (− 0,11383) ∗ 0,122697
2

1 − 0,122697 2
≅ 0,85 → R 2 ≅ 73,3%

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 404 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 405 ►

σ e2 23305,8 2
I = 1− = 1 − = 0,833267 → I 2 ≅ 70% , ahol
σ y2 42154,2 2

σe = ∑e 2
i
=
8147406029
= 23305,8 és
n − m −1 15

σy =
∑d 2
y
=
30208595002
= 42154,2
n −1 17

M = R 2 − ∑ (R 2 − ryi2 ) =
(
0,8545732 − 0,8545732 − 0,8265912 − 0,8545732 − (− 0,11383) ≅ 0,034 ) ( 2
)

β2 =
∑d d ∑d d − ∑d d ∑d
1 y 1 2 2 y 1
2

=
(∑ d d ) − ∑ d ∑ d 1 2
2 2
2 1
2

4691768 ∗ 8,5 − (− 41970) ∗ 1066,5


= 17905,9
8,52 − 4,5 ∗1066,5

β1 =
∑d d
1 y − β 2 ∑ d1 d 2
=
4691768 − (− 17905,9) ∗ 8,5
= 4541,93
∑d 1
2
1066,5
vagy

β1 =
∑d d − β ∑d
2 y 2
2
2
=
− 41970 − (− 17905,9) ∗ 4,5
= 454193
∑d d 1 2 8,5

β 0 = y − β1 x1 − β 2 x2 = 190155 − 4541,93 ∗ 20,5 − (− 17905,9) ∗ 0,5 = 105998,4

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 405 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 406 ►

yˆ i = 105998,4 + 4541,93 ∗ x1i + (− 17905,9) ∗ x2i (Ft )

A 13.10.1. és a 13.10.2. sz. táblák alapján kiszámított mutatók jelentése.


♥ Az egyenlet β 0 paraméterének, tekintettel arra, hogy olyan dolgozó,
aki 0 forint bruttó bért kapna nem volt a megfigyeltek között, nincs jelen-
tése, annak ellenére, hogy a másik magyarázóváltozó felveheti a nulla érté-
ket (= férfi), de a feltétel, hogy a két magyarázó változó egyszerre legyen
nulla, semmiképpen nem teljesül.
♥ Az egyenlet β1 (≅ 4542 ) paramétere szerint, ha két dolgozó azonos
nemű (= állandó a második magyarázó változó), akkor az, amelyik egy
évvel hosszabb ideje áll alkalmazásban ≅ 4542 forinttal több bruttó bért
kap.
♥ Az egyenlet β1 (≅ −17906 ) paramétere szerint, ha két dolgozó azo-
nos ideje áll alkalmazásban, akkor a női dolgozó bruttó bére ≅ 18.000 fo-
rinttal alacsonyabb.
♥A dolgozók szolgálati idejének hossza (x1i ) és bruttó bére ( yi ) kö-
zött – a dolgozók nemének (x2i ) , mint második magyarázó változónak a
hatását figyelmen kívül hagyva – szoros (0,83) pozitív (= a szolgálati idő
növekedése a bruttó bér növekedését vonja maga után, és fordítva) kap-
csolat figyelhető meg, a változók ≅ 68 %-ban befolyásolják egymást. Ha a
második magyarázó változó hatását kiszűrjük a kapcsolat még szorosabb-
nak mutatkozik (0,85).
♥ A dolgozók neme (x2i ) és bruttó bére ( yi ) között – a dolgozók
szolgálati idejének (x1i ) hatását figyelmen kívül hagyva igen gyenge (0,11),
negatív (a férfi dolgozók többet, a női dolgozók azonos szolgálati idő mel-
lett kevesebbet keresnek) kapcsolatot tártunk fel. A másik magyarázó vál-
tozó hatásának kiszűrése után a kapcsolat már lényegesen erősebbnek
(0,39) mutatkozik, a dolgozók neme 15 %-ban befolyásolja bruttó bérük
alakulását.
♥ A magyarázó változók között – az eredményváltozó hatásának fi-
gyelmen kívül hagyásával – a számítások gyenge, pozitív hatást jeleznek; a
zavaró hatás kiszűrése után ebben a relációban is erősebb hatást figyelhe-
tünk meg, a változók 39 %-ban befolyásolják egymást.
( )
♥ A többszörös determinációs együttható R 2 szerint a két magyarázó
változó ( (x1i ) és (x2i ) ) együtt erős hatást gyakorol az eredményváltozóra ( yi ) .

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 406 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 407 ►

A bruttó bér ≅ 73 %-ban függ a szolgálati időtől és a dolgozó nemétől. Alaku-


lásában azonban még egyéb, most nem vizsgált tényezők is szerepet játszanak.
(Ui.: R 2 〈1 ). A magyarázó változók eredményváltozóra gyakorolt együttes
hatását mutatja a kétváltozós korrelációszámítás során megismert korrelációs
( )
index (I ) mutató is. Számértéke I 2 = 70% kissé alacsonyabb, de ez az eltérő
számítási módból adódóan természetes.
♥ A vizsgált változók kapcsolatát leíró háromváltozós lineáris regresz-
szió-egyenletben igen gyenge (M ≅ 0,035) multikollinearitást tártunk fel,
ami gyakorlatilag nem zavaró.

13.4. Gyakorló feladatok

1. feladat

Vizsgálja meg van-e kapcsolat az európai országok lélekszáma311 és a tör-


vényhozás (országgyűlés) létszáma között!

13.11. sz. tábla


lélekszám a törvényhozás létszáma
sorszám ország
millió fő tagok (fő)
1. Ausztria 8,1 183
2. Belgium 10,3 150
Bosznia-
3. 4,2 56
Hercegovina
4. Csehország 10,2 200
5. Dánia 5,3 179
6. Észtország 1,3 101
7. Görögország 11,0 300
8. Litvánia 3,4 141
9. Magyarország 10,0 386
10. Németország 82,4 603
11. Spanyolország 42,7 350
12. Ukrajna 48,5 130

311 A Föld országai (Zsebvilág 2004, HVG Kiadó, Budapest 2004)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 407 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 408 ►

1. Számítsa ki mind a három tanult egyenlettípus paramétereit!


2. Számítsa ki a tanult szorossági mutatókat és determinációs
együtthatókat!
3. Válassza ki a legjobban illeszkedő egyenletet!
4. Végezze el a tanult hipotézisellenőrzéseket! (A szignifikanciaszint: 5
ill. 10 %)
5. Becsülje meg a lineáris egyenlet paramétereinek intervallumát, P =
90 % és P = 95%
6. Ábrázolja a megfigyelt adatokat, illessze közéjük a legjobbnak ta-
lált egyenlet vonalát!
7. Minden kiszámított adatnak fogalmazza meg a jelentését!

2. feladat

Néhány európai ország munkanélküliségi312 (ráta) és gazdasági növekedési


(előző évhez) adata:

13.12. sz. tábla


gazd.
m.n. gazd. növ. m.n.
ország ország növ.
% %
Albánia 18 6,1 Magyarország 5,5 2,9
Bulgária 14,3 4,8 Nagy-Britannia 5,0 2,1
Dánia 1,4 5,5 Olaszország 8,9 1,1
Finnország 2,1 9,0 Oroszország !,3 4,3
Hollandia 3,7 -0,5 Portugália 6,4 -0,3
Izland 3,3 1,6 Svédország 4,8 1,6
Szerbia és
Lengyelország 19,3 3,7 32 3
Montenegro
Szlovénia 6,4 3,2

312 A Föld országai (Zsebvilág 2004, HVG Kiadó, Budapest 2004)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 408 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 409 ►

A munkanélküliség és a gazdasági növekedés


kapcsolata (2004)

y = -0,2714x + 5,3781
10
R2 = 0,234
gazdasági növekedés az
8
előző évhez (%)
6 Adatsor1
4
Lineáris
2 (Adatsor1)
0
0 5 10 15 20
-2
m unkanélküliségi ráta (%)

13.8.sz. ábrát

A 13.12. sz. tábla adatai alapján szerkesztettük EXCEL-programmal a 13.8. sz.


ábrát, olvasson le minden információt az ábráról, és töltse ki az alábbi táblát!
sorsz. feladat megoldás
Milyen típusú egyenlet vonalát ill. képletét látja az
1.
ábrán?
Melyik változót tekintette az ábra készítője
2.
magyarázó tényezőnek? (Honnan tudhatjuk?)
Melyik változót tekintette az ábra készítője
3.
eredmény tényezőnek? (Honnan tudhatjuk?)
Természetesen itt nincs elég hely
4. Mit jelent az egyenlet β 0 paramétere? a válaszok rögzítésére, de ha a
5. Mit jelent az egyenlet β1 paramétere? vizsgán ilyen jellegű feladattal
találkozik, lesz elegendő helye.
6. Milyen szoros a kapcsolat a változók között?
Határozza meg a regresszió-értékeket! Egynek
7.
fogalmazza meg a jelentését!
8. Számítsa ki a paraméterek standard hibáját!
Végezze el a tanult statisztikai próbákat! Fo-
9.
galmazza meg eredményüket!
10. Melyik – a munka közben kiszámított – adat
szükséges ahhoz, hogy ennek és a többi tanult
egyenlettípusnak az illeszkedését összehasonlít-
hassa! (Indokolja döntését!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 409 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 410 ►

3. feladat

A 2. feladatban szereplő országokra vonatkozóan újabb adatot (= infláció,


%) vontunk be az egyenletbe. A számításokat ismét elkezdtük. A 13.14.1.
és a 13.14.2. sz. tábla eddigi eredményeinket tartalmazza.

13.14.1. sz. tábla


x1i x2i yi
ország d1 d 2 d y
sorszám m.n. gazd. növ. infláció
% % %
1. Albánia 18 6,1 3 8,7 2,9 -1,4
2. Bulgária 14,3 4,8 5,6 5,0 1,6 1,2
3. Dánia 1,4 5,5 2 -7,9 2,3 -2,4
4. Finnország 2,1 9 2 -7,2 5,8 -2,4
5. Hollandia 3,7 -0,5 2,4 -5,6 -3,7 -2,0
6. Izland 3,3 1,6 2,2 -6,0 -1,6 -2,2
7. Lengyelország 19,3 3,7 1,1 10,0 0,5 -3,3
8. Magyarország 5,5 2,9 4,7 -3,8 -0,3 0,3
9. Nagy-Britannia 5 2,1 2,8 -4,3 -1,1 -1,6
10. Olaszország 8,9 1,1 2,8 -0,4 -2,1 -1,6
11. Oroszország 8,6 4,3 12 -0,7 1,1 7,6
12. Portugália 6,4 -0,3 3,2 -2,9 -3,5 -1,2
13. Svédország 4,8 1,6 2,7 -4,5 -1,6 -1,7
14. Szerbia és Montenegró 32 3 13,4 22,7 -0,2 9,0
15. Szlovénia 6,4 3,2 5,6 -2,9 0,0 1,2
összesen 139,7 48,1 65,5 0,0 0,0 0,0
átlag 9,313333 3,206667 4,366667

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 410 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 411 ►

13.14.2.sz. tábla
sorszám d12 d 22 d y2 d1 ∗ d y d 2 ∗ d y d1 ∗ d 2 ŷi ei2
1. 75,5 8,4 1,9 -11,8718 -3,95422 25,13342 6,5 11,95392
2. 24,9 2,5 1,5 6,150222 1,965111 7,945422 5,6 0,001074
3. 62,6 5,3 5,6 18,72822 -5,42756 -18,1479 2,4 0,191914
4. 52,0 33,6 5,6 17,07156 -13,7109 -41,7892 2,6 0,34892
5. 31,5 13,7 3,9 11,03956 7,289778 20,80676 3,0 0,390034
6. 36,2 2,6 4,7 13,02889 3,481111 9,661422 2,9 0,514669
7. 99,7 0,2 10,7 -32,6231 -1,61156 4,926756 6,8 32,30898
8. 14,5 0,1 0,1 -1,27111 -0,10222 1,169422 3,4 1,577126
9. 18,6 1,2 2,5 6,757556 1,733778 4,773422 3,3 0,277619
10. 0,2 4,4 2,5 0,647556 3,300444 0,870756 4,3 2,180779
11. 0,5 1,2 58,3 -5,44511 8,345778 -0,77991 4,2 61,01936
12. 8,5 12,3 1,4 3,398889 4,091111 10,21609 3,7 0,228275
13. 20,4 2,6 2,8 7,522222 2,677778 7,251422 3,3 0,337402
14. 514,7 0,0 81,6 204,9362 -1,86689 -4,68858 9,9 12,49776
15. 8,5 0,0 1,5 -3,59311 -0,00822 0,019422 3,7 3,760569
összesen 968,2 88,2 184,4 234,4767 6,203333 27,36867 65,5 127,5884

1. Fejezze be a megkezdett számításokat! (egyenlet, szorossági mutatók,


hipotézisellenőrzés, multikollinearitás)
2. Írjon szöveges elemzést!

4. feladat
Ismét a 2. feladatban szereplő adatokkal dolgozunk. Hollandia és Portugá-
lia adatai azonban kimaradtak. (A negatív gazdasági növekedés miatt.313) A
13.13. sz. tábla egy megkezdett számítás részeredményeit tartalmazza.
1. Döntse el, milyen típusú kapcsolatot feltételezve dolgoztunk, majd folytassa a
számítást!
2. Számoljon ki mindent, amit tanult az adott egyenlettípussal kapcsolatban!
3. Végül minden adat jelentését fogalmazza meg!
13.13. sz. tábla
xi yi ui vi du dv d u2 du ∗ dv
összesen 129,6 48,9 10,9988 6,5794 0,0000 0,0000 1,8423 -0,07846

313 Emlékezzen! Matematika – logaritmusra vonatkozó szabályok.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 411 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 412 ►

13.5. Összefoglalás314
= a mennyiségi ismérvek közötti kapcsolat kimuta-
korreláció
tása szorossági mutatóval
= a mennyiségi ismérvek közötti kapcsolat kimuta-
regresszió
tása egyenletekkel

1. lineáris korrelációs együttható


kétváltozós
2. korrelációs index
1. totális korrelációs együtthatók

szorossági mutatók 2. parciális korrelációs együttha-


tók
háromváltozós
3. többszörös korrelációs együtt-
ható
4. korrelációs index (Mint előző.)
determinációs együtt- minden szorossági mutató négyzete = a befolyásolás
ható mértéke (%) [0%; 100%]

lineáris korrelációs r=
∑d d x y
=
együttható ∑d ∑d2
x
2
y

– a kapcsolat irányát (+, –)


kifejezi:
– a kapcsolat szorosságát 0〈 r 〈1( )
korrelációs index σ e2
I = 1−
σ y2
kifejezi: – a kapcsolat szorosságát (0〈 I 〈1)

314 Az összefoglalás nem minden, fejezet szövegében szereplő képletet tartalmaz, ill.
egyes esetekben a számítás nem minden lehetséges variációját.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 412 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 413 ►

Két-két változó kapcsolata a harmadik hatásának kiszűrése


nélkül.
totális korrelációs – a kapcsolat irányát (+, –)
együtthatók
kifejezik:
– a kapcsolat szorosságát 0〈 r 〈1 ( )
Képletük megszerkeszthető a lineáris korrelációs együttható
mintájára.
Két-két változó kapcsolata a harmadik hatásának kiszűrésé-
parciális korreláci- vel.
ós együtthatók
kifejezik: – a kapcsolat irányát (+, –)
– – a kapcsolat szorosságát 0〈 r 〈1 ( )
ry1 − ry 2 r12 ry 2 − ry1r12 r12 − ry1ry 2
ry1.2 = ry 2.1 = r12. y =
(1 − r )(1 − r )
2
y2
2
12 (1 − r )(1 − r )
2
y1
2
12 (1 − r )(1 − r )
2
y1
2
y2

A magyarázó változók együttes hatása az eredményváltozóra.


többszörös korre- ry21 + ry22 − 2ry1ry 2 r12
lációs együttható R=
1 − r122
kifejezi – a kapcsolat szorosságát (0〈 R 〈1)
Az egyik változó növekedése, a másik változó növekedését
pozitív kapcsolat
vonzza, és fordítva.
Az egyik változó növekedése, a másik változó csökkenését
negatív kapcsolat
vonzza, és fordítva.
0 A változók között nincs kapcsolat.
1 A változók között igen szoros a kapcsolat.
A magyarázó változó nincs hatással az eredményváltozó
0%
alakulására.
A magyarázó változó igen erős hatással van az eredményvál-
100 %
tozó alakulására.

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 413 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 414 ►

= matematikai formulával írják le a változók közötti kapcso-


egyenletek
latot
1. lineáris yˆ i = β 0 + β1 xi
2. exponenciális yˆ i = β 0 ∗ β1xi
kétváltozós 3. hatványkitevős yˆ i = β 0 ∗ xiβ1
típusai
4. parabola (nem részleteztük)
5. hiperbola (nem részleteztük)
háromváltozós 1. lineáris yˆ i = β 0 + β1 x1i + β 2 x2i

A paraméterek számítása, jelentése:


A magyarázó változó egységnyi abszolút változásához az ered-
ményváltozó β1 egységnyi abszolút változása tartozik.
kétváltozós
lineáris
β1 =
∑d d x y

∑d 2
x

A magyarázó változó egységnyi abszolút változásához az ered-


kétváltozós ményváltozó β1 egységnyi relatív változása tartozik.
exponenciá-
lis lg β1 =
∑d d x v
→ visszakeresni!
∑d 2
x

A magyarázó változó egységnyi relatív változásához az ered-


kétváltozós ményváltozó β1 egységnyi relatív változása tartozik.
hatványkite-
vős β1 =
∑d d u v

∑d 2
u

Csak akkor értelmezhető, ha x1 = 0 létezik.


lineáris exponenciális hatványkitevős
β0
lg β 0 = v − β1 * x ↓ lg β 0 = v − β1 * u ↓
β 0 = y − β1 * x
visszakeresni! visszakeresni!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 414 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 415 ►

A regressziós paraméterek parciális együtthatóként


háromváltozós lineáris
értelmezhetőek = a másik állandósága mellett.
Az első magyarázó változó egységnyi abszolút válto-
zásához az eredményváltozó β1 egységnyi abszolút
β1 változása tartozik.

β1 = ∑d d 1 y − β 2 ∑ d1d 2
∑d 1
2

A második magyarázó változó egységnyi abszolút


változásához az eredményváltozó β 2 egységnyi ab-
β2 szolút változása tartozik.

β2 =
∑d d ∑d d − ∑d d ∑d
1 y 1 2 2 y 1
2

(∑ d d ) − ∑ d ∑ d
1 2
2 2
2 1
2

Csak akkor értelmezhető, ha x1 = x2 = 0 létezik.


β0
β 0 = y − β1 * x − β 2 x 2

– Idősorok korrelációja.
– A minőségi ismérvek bevonása az egyenle-
kiegészítések
tekbe.
– Multikollinearitás.
A magyarázó változók között fennálló kapcsolat,
multikollinearitás mely torzíthatja az eredményeket.
M = R 2 − ∑ R 2 − ryi2( )
becslés = a paraméterek és a regresszió-értékek konfi-
kétváltozós lineáris dencia intervallumának meghatározása
hipotézisellenőrzés
= a magyarázó és az eredményváltozó közötti
két- és háromváltozós lineá-
kapcsolat jelentős voltának ellenőrzése
ris

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 415 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 416 ►

13.6. Mintapéldák korábbi vizsgadolgozatokból

1. minta

Egy biztosító társaság 10 üzletkötőjének az adott cégnél töltött ideje és az egy év alatt
megkötött biztosítások száma közötti kapcsolatra vonatkozó adatok:
eltöltött megkötött a magyarázó válto- az eredmény-
név eltérés-
idő biztosítás zó eltérés változó eltérés
szorzatok
A év db négyzetei négyzetei
B 1 90
C 2 100
D 3 120
E 4 150
F 5 160
G 6 180
H 7 200
I 8 190
J 9 180
K 10 200
össz. 55 1.570 82,5 15.010 1.035

1. Írja fel a lineáris regresszió egyenlet!


1. paraméter számítása: egyenlet:
2. paraméter számítása:

2. Fogalmazza meg paraméterek jelentését!


1. paraméter 2. paraméter
3. Számítsa ki, hogy milyen mértékben befolyásolják egymást a változók! Két megoldást kérek!

4. Fogalmazza meg az 1.3. feladatrészben kiszámított mutatók jelentését!

5. Milyen következtetést tud levonni az 1.3. feladatrészben kiszámított mutatók alapján

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 416 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 417 ►

6. Számítsa ki (P= 95 %), hogy „J” üzletkötő hány üzletkötésre számíthat a lineáris
regresszió egyenlet alapján

7. Indokolja meg, az 1.6. feladatrésszel kapcsolatos képlet-választását!

8. Hány %-kal változik a regresszió-érték az x= 6 év 1 %-os változása esetén?

8. Hány %-kal változik a regresszió-érték az x= 6 év 1 %-os változása esetén?

9. Miért rendkívül fontos közgazdasági mutató az 1.8. feladatrészben kiszámított adat?

10. Az itt felsorolt adatok alapján kiszámítható egy másik egyenlet típus is. Melyik? Honnan tudja
Adatok: ∑ u = 6,559763033 ∑ v = 21,8049936
∑d 2
u = 0,912110306 ∑ d d = 0,351839211
u v

11. Döntse el, hogy az 1.1.-ben vagy az 1.10. adatai alapján kiszámítható egyenlet
jellemzi-e jobban a kapcsolatot!

12. Vizsgálja meg, hogy valódi-e a kapcsolat a változók között!

13. Fogalmazza meg az 1.12.-ben elvégzett számítás eredményét!

14. Az 1.12.-ben elvégzett műveletet ábrák segítségével is megoldhatja, hogyan? (Részletezze!)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 417 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 418 ►

2. minta

Egy likőripari vállalatnál vizsgálták a palackozó gépsor óránkénti teljesítménye (ezer


palack / óra) és a selejtes palackok száma (ezer palack / nap) közti kapcsolatot. A számí-
tás során kapott regressziófüggvény: lg yˆ i = −0,0223 + 0,12 lg xi

1. Értelmezze a regressziós együtthatót!


2. Becsülje meg a 30 ezer palack / óra teljesítmény esetén várható selejtszámot!

3. minta

25 multinacionális cég adatait felhasználva vizsgálták az éves bevétel és az eredmény


nagysága közötti kapcsolatot.
A 25 cég évi összes bevétele 2126 milliárd USD, az összes eredmény 105,21 milliárd USD.
A cégek bevétele átlagosan 48,32 milliárd USD-ral, az eredmény 2,36 milliárd USD-
ral tér el az átlagostól (az eltérések négyzetes átlaga).
1 %-kal nagyobb bevételhez átlagosan 0,68 %-kal nagyobb eredmény tartozik átlagos
szinten.

1. Írja fel a lineáris regresszió-függvényt!


2. Értelmezze a regressziós együtthatót!
3. Számítsa ki és értelmezze a determinációs együtthatót!
4. Vizsgálja meg, hogy milyen szoros a kapcsolat a két ismérv között!
5. Állapítsa meg, hogy 1 milliárd USD-ral nagyobb eredményhez mennyivel nagyobb
bevétel szükséges!
6. Becsülje meg az 5 milliárd USD eredményhez szükséges bevétel nagyságát!
4. minta

30 véletlenszerűen kiválasztott négytagú aktív keresős háztartás adatai alapján vizsgálták a


jövedelem és az üdülésre fordított kiadás nagyságát.
X = 1 főre jutó jövedelem (ezer Ft)
Y = 1 főre jutó üdülési kiadás (ezer Ft)
A regressziószámításból a következő információk állnak rendelkezésre:
∑ ui = 77,1873 ∑ vi = 22,2639 ∑ d u d v = 3,4003 ∑ d u2 = 2,0633
1. Írja fel a hatványkitevős regreszió-függvényt, és értelmezze a paramétereit!
2. Minősítse az üdülésre fordított kiadás jövedelemrugalmasságát!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 418 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 419 ►

5. minta

Az egy főre jutó hazai termék (Y), az egy főre jutó nemzetgazdasági beruházás (X1) és az
egy főre jutó külföldi befektetés (X2) megyénként 1999-ben:
1 főre jutó
megye GDP beruházás külf. befekt.
ezer Ft
Baranya 783 157 66
Bács.. 713 88 45
Békés 691 96 74
Borsod… 690 174 164
Csongrád 889 146 163
Fejér 1.234 206 212
Győr… 1.204 438 368
Hajdú… 754 133 151
Heves 726 178 135
Jász… 720 103 39
Komárom 838 238 191
Nógrád 565 83 59
Pest 773 138 236
Somogy 686 138 54
Szabolcs… 567 87 32
Tolna 861 161 30
Vas 1162 233 224
Veszprém 803 140 76
Zala 901 132 69
Budapest 1.858 612 801
1. Határozza meg a háromváltozós regresszió-függvényt!
2. Értelmezze a függvény paramétereit!
3. Vizsgálja meg a kapcsolat szorosságát!
4. 1.páronkénti korrelációs együtthatókkal
5. 2.parciális korrelációs együtthatókkal
6. Írja fel a korrelációs és a variancia-kovarancia mátrixot!
7. Határozza meg és értelmezze a többszörös determinációs együtthatót!
8. Vizsgálja meg a multikollinearitást!
9. Végezze el a regresszió-függvény szignifikancia-vizsgálatát variancianalízissel!
10. Adjon konfidenciaintervallumot a regresszió-függvény paramétereire 95 %-os meg-
bízhatósági szint mellett!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 419 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 420 ►

6. minta

20 vállalkozás adatai alapján vizsgálták az egy főre jutó tárgyi eszközérték (millió Ft) = X,
és az egy főre jutó üzemi eredmény (millió Ft) =Y kapcsolatát. A lineárisnak feltételezett
kapcsolat elemzéséből az alábbi adatokat ismerjük:

x = 212,1 y = 50,6 r = 0,767 ∑d d x y = 11330,8 ∑d 2


x = 85909,8

1. Határozza meg Y-nak X szerint lineáris regresszió függvényét!

2 Fogalmazza meg az egyenlet paramétereinek jelentését!

3 Számítsa ki a determinációs együtthatót és fogalmazza meg jelentését!

4 Vizsgálja meg az átlagos tárgyi eszközérték rugalmasságát!

5. Fogalmazza meg az 1.4.-ben kiszámított mutató jelentését!

6. Milyen adatok ismeretében tudná meghatározni, hogy az Ön által kiszámított egyenlet


vagy egy másik illeszkedik-e jobban a megfigyelt adatokra!
Kétféle megoldást kérek!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 420 ►


Statisztika Korreláció-, regresszió-számítás
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 421 ►

7. minta

14, a tőzsdén jegyzett társaság adatai alapján vizsgálták a nettó árbevétel


(X) (milliárd Ft) és az adózott eredmény (Y) (milliárd Ft) kapcsolatát. Az
elvégzett számítások néhány részeredménye:
x = 69,93 y = 6,46 ∑d d x y = 1322,060∑ d x2 = 15962,93 ∑d 2
y = 140,67

1 Határozza meg Y-nak X szerint lineáris regresszió függvényét!

2. Fogalmazza meg az egyenlet paramétereinek jelentését!

3. Számítsa ki a determinációs együtthatót és fogalmazza meg jelentését!

4. Vizsgálja meg az x= 105 hely rugalmasságát!

5. Fogalmazza meg az 1.4.-ben kiszámított mutató jelentését!

6. Milyen adatok ismeretében tudná meghatározni, hogy az Ön által kiszámított egyen-


let vagy egy másik illeszkedik-e jobban a megfigyelt adatokra! Indokot is kérek.

7. Miután az egyenlet paramétereit és a regresszió-értékeket is kiszámították egy újabb szá-


mítás eredményeként a következő adatot nyerték: t = 6,5 , illetve keresték ki: t 012,975 = 2,18 .
Mit akartak ezeknek az adatoknak a segítségével elvégezni? Végezze el Ön is!

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 421 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 422 ►

Táblázatok

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 422 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 423 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 423 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 424 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 424 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 425 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 425 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 426 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 426 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 427 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 427 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 428 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 428 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 429 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 429 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 430 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 430 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 431 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 431 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 432 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 432 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 433 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 433 ►


Statisztika Táblázatok
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 434 ►

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 434 ►


Statisztika Felhasznált irodalom
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 435 ►

Felhasznált irodalom:
Fejes Ferenc – Fenyves Ferenc – Zibolen Erzsébet: Statisztika II. – távokta-
tás (Külkereskedelmi Főiskola, Budapest 1977)
Fenyves Ferenc – Horváth Gézáné dr – Koós Szabolcs: Statisztika I. –
távoktatás (Külkereskedelmi Főiskola, Budapest 1977)
Hunyadi László – Mundruczó György – Vita László: Statisztika (Aula Ki-
adó, Budapest 1996)
Hunyadi László – Vita László: Statisztika közgazdászoknak (Központi Sta-
tisztikai Hivatal, Budapest 2002)
Juhász Györgyné – Sándorné Kriszt Éva: Statisztika I távoktatással. (Távok-
tatási Universitas Alapítvány, Budapest 1997)
Juhász Györgyné – Sándorné Kriszt Éva: Statisztika távoktatással II. (Táv-
oktatási Universitas Alapítvány, Budapest 1997)
Juhász Györgyné – Sándorné Kriszt Éva: Példatár a Statisztika távoktatással
c. tankönyvhöz (Távoktatási Universitas Alapítvány, Budapest 1997)
Kerékgyártó Györgyné – Mundruczó György: Statisztikai módszerek a gaz-
dasági elemzésben (Aula Kiadó, Budapest 1996)
Korpás Attiláné: Statisztika I. (Nemzeti Tankönyvkiadó, Budapest 1996)
Korpás Attiláné: Statisztika II. (Nemzeti Tankönyvkiadó, Budapest 1996)
Köves Pál – Párniczky Gábor: Általános statisztika (Közgazdasági és Jogi
Könyvkiadó, Budapest 1975
Dr Kuchenbecker. Horst: Statistik für den praktiscen Betriebswirt (Verlag Ne-
ue Wirtschaftts-Briefe Herne, Berlin 1972)
Molnár Máténé dr – Tóth Mártonné dr: Általános statisztika példatár I.
(Nemzeti Tankönyvkiadó, Budapest 2001)
Molnár Máténé dr – Tóth Mártonné dr: Általános statisztika példatár II.
(Nemzeti Tankönyvkiadó, Budapest 2001)
Molnár Mihélyné dr: Statisztika I. – távoktatás (Széchenyi István Főiskola,
Győr 1994)
Molnár Mihélyné dr: Statisztika II. – távoktatás (Széchenyi István Főiskola,
Győr 1994)
Rappai Gábor: Üzleti statisztika Excellel (Központi Statisztikai Hivatal, Bu-
dapest 2001)
Scharnbacher. Kurt: Statistik im Betrieb (Betriebwirtschaftlicher Verlag,
Wiesbaden 1997)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 435 ►


Statisztika Felhasznált irodalom
A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 436 ►

Szarvas Beatrix – Sugár András: Példatár a Statisztika c. tankönyvhöz (Aula


Kiadó, Budapest 1996)
Tátrainé dr Körmendy E. Katalin: Statisztika I. (Universitas – Győr Kht.
2003)
Tátrainé dr Körmendy E. Katalin: Statisztika II. (Universitas – Győr Kht.
2004)
Tátrainé dr Körmendy E. Katalin: Statisztika III. – távoktatás (Széchenyi
István Főiskola, Győr 1997)
Vargha András: Matematikai statisztika (Pólya Kiadó, Budapest 2000)
Dr Vogel. Friedreich: Statistik: Aufgaben und Beispiele (R. Oldenbourg
Verlag, München – Wien 1989)

A dokumentum használata | Tartalomjegyzék | Táblázatok Vissza ◄ 436 ►

You might also like