You are on page 1of 22

ÁLATLÁNOS STATISZTIKA 1.

oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

GRAFIKUS ÁBRÁZOLÁS
Leíró statisztika

A leíró statisztika azzal foglalkozik, hogy egy adott, meghatározott elemekből álló információ-
halmazt kiértékeljen. Ezek az információk legtöbbször persze számokat jelentenek, hiszen ezek a
matematikai módszerekkel legkönnyebben kezelhető objektumok, azonban nem kell szigorúan
ezekhez ragaszkodnunk, olyan adathalmazokat is kiértékelhetünk, melyek nem számokból állnak.
Természetesen a kiértékelés mikéntjét tekintve ez utóbbi esetben a lehetőségeink korlátozottabbak.

1. Az adatok grafikus ábrázolása

Az adatok kiértékelése legegyszerűbben valamilyen grafikus formában történő megjelenítéssel


történhet. A rajzok nagyon sokfélék lehetnek, itt most a gyakrabban használt típusokat mutatjuk be.
Az adatok ábrázolásánál legtöbb esetben az adathalmazban való előfordulási arányt szokták ábrá-
zolni (relatív gyakoriság). Ennek nagyságát egy adott adat esetén úgy kaphatjuk meg, hogy az adat
előfordulási számát osztjuk az adathalmazban levő elemek számával. Ezt a relatív gyakoriságot meg
lehet adni százalékos formában is.
Ezen kívül ha sok adat van, és ezek esetleg mind különbözőek, de minket az adatok nagysága
csak bizonyos pontossággal érdekel, akkor szokás az adatokat „adatsávokba”, osztályokba osztani,
tehát nem az egyes értékeket vesszük figyelembe, hanem csak bizonyos, pl. 10-es vagy 100-as pon-
tossággal ábrázoljuk őket. Ekkor az egyes adatsávokban (osztályokban) található elemek számát
jelenítjük meg.
1.1. Oszlopdiagram (Hisztogram)
Hisztogram
Gyakorisági sor adatait általában oszlopdiagram segítségével ábrázoljuk, melynek oszlopai hé-
zag nélkül, egymás mellett helyezkednek el. A gyakoriságok arányát a megfelelő oszlopok területe-
inek aránya szemlélteti.
Nem egyenlő osztályközök alapján:
Az osztályközök többsége „h” hosszúságú, de van néha „k” hosszúságú értékköz, akkor az utób-
bihoz tartozó gyakoriságokat „k/h” tényezővel elosztjuk.( h ≠ k)
ÁLATLÁNOS STATISZTIKA 2. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

gn + 2 h
= gn + 2 ⋅
k k
n
Ha gn+1= gn+2, akkor a t1=t2
t1
t2
h h k
gn gn+1 gn+2

Hisztogram

Ebben az ábrázolási módban az adatokat mint kis pálcikákat jelenítjük meg. A pálcikák magas-
sága arányos az adat nagyságával. (A negatív adatokat lehet lefelé rajzolni.)
Nagyon gyakran előfordul, hogy nem magukat az adatokat ábrázolják a hisztogramon, hanem a
gyakoriságukat. Ebben az esetben az oszlopok alatt fel kell tüntetni, hogy melyik adathoz tartozó
relatív gyakoriságot mutatják.
A hisztogramok esetében alkalmazható vízszintes oszlop-elhelyezkedés is.

Hisztogram

0 1 2 3 4 5 6 7 8 9
ÁLATLÁNOS STATISZTIKA 3. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

Ennek hátránya, hogy kevésbé követhető az adatok egymáshoz való viszonya.


Hisztogramok esetében lehet térbeli ábrákat is készíteni:

Térbeli hisztogram

3,5

2,5

1,5

0,5

0
1 2 3 4 5 7 8 9

Ebben az esetben a térbeli ábrázolás teljesen felesleges, hiszen semmivel sem mond többet, mint
a síkbeli ábra, sőt, a térhatás eléréséhez alkalmazott technika kissé torzítja az arányokat.
A bevezetőben mondottaknak megfelelően az adatok ábrázolása nem csak a relatív gyakoriság
alapján, hanem adatsávokba osztva, az egyes tartományokba eső adatok számának ábrázolásával is
történhet.
Kumulált gyakorisági görbék

1.2. Szár-levél diagram


Százezresek Tízezresek
0 6 4 5 8 8
1 3 0 0 1 6 8 3 3 6 4 2 5 7 5
2 4 3 2 2 1 6
3 1 2 1 1 6
4 7 8 4 5 2 0 3
5 1 1 2 2
6 3 5 7 8 9 9 9 9 9 2 3
7 1 2 4 2 3
8 4 7 8 2 3 4 5 6
9 2 3 9 9 1 2
ÁLATLÁNOS STATISZTIKA 4. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

A szár-levél diagram lényege, hogy az adatsávoknak megfelelő tartományokra osztva ábrázoljuk


az adatokat, megtartva azok számértékét, és ezeket egy sajátos táblázatban tüntetjük fel. A balolda-
lon pl. a százezreseket jelöljük a táblázatban, a jobboldalra pedig azon adatok tízezreseit írjuk, ame-
lyekben az adott százezres szerepel.

A fenti táblázat első sorában pl. a 62456, 42312, 51897, 82451, 89236 adatok vannak ábrázolva.
Ezekben a százezres helyiértéken 0 áll, a tízezres helyiértéken pedig 6, 4, 5, 8, 8, amint az a táblá-
zatból is leolvasható. A táblázat negyedik sorában pl. a 315682, 326897, 318642, 315259, 368970
adatok vannak ábrázolva. Ezekben a százezres helyiértéken 3 áll, a tízezres helyiértéken pedig 1, 2,
1, 1, 6.
A szár-levél diagram 90 fokkal elforgatva hisztogramot ad, természetesen itt az oszlopok magas-
ságát a számsorok hosszúsága fogja adni. Azonban a szár-levél diagramnak a hisztogrammal szem-
ben több előnye is van. Egyrészt nem veszik el az egyes adatok számszerűségében hordozott infor-
máció és az adatok eredeti sorrendjét is (egy-egy adatsávon belül) meg lehet tartani, másrészt pedig
a hisztogram készítésekor az ábrázolás finomítása (tehát az adatsávok szűkítése) sokkal bonyolul-
tabb. Itt egyszerűen csak az adatokat kell átrendezni annak megfelelően, hogy milyen új adatsávo-
kat akarunk létrehozni. Például a fenti szár-levél diagram 50000-es finomítása a következő:

Százezresek Tízezresek
0 4 5
6 8 8
1 3 0 0 1 3 3 4 2
6 8 6 5 7 5
2 4 3 2 2 1
6
3 1 2 1 1
6
4 0 3 4 2
7 8 5
5 1 1 2 2

6 3 2 3
5 7 8 9 9 9 9 9
7 1 2 4 2 3

8 4 2 3 4
7 8 5 6
9 2 3 1 2
9 9

Természetesen a szár-levél diagramnak is megvannak a hátrányai, például ha nagyon sok adatból


áll az adathalmaz, akkor ebben az ábrázolási módban nagyon sokat kell írni.
ÁLATLÁNOS STATISZTIKA 5. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

1.3. Sokszögvonal diagram (Vonaldiagram)

Sokszögvonal-diagram

3.5

2.5

1.5

0.5

0
1 2 3 4 5 7 8 9

A sokszögvonalas ábrázolási mód hasonlít az oszlopdiagramos módszerhez. Koordináta-


rendszerben ábrázoljuk az adatsávoknak és a benne levő adatok számának (illetve az adatok nagy-
ságának) megfelelő pontokat, majd ezeket egy töröttvonallal összekötjük. Ennek az ábrázolási
módnak az az előnye, hogy kiemeli a változások mértékét, mert az összekötő vonalak meredeksége
dominál a rajzban, éppen ezért ezt valamely adat változásának szemléltetésére használják legin-
kább. Hátránya viszont az, hogy a vonalak folytonossága valamiféle folytonosságérzetet kelt a
szemlélőben, tehát azt gondolhatja, hogy a változás folyamatos volt, pl. egy kisebb értékről egy
nagyobb értékre folyamatos növekedéssel jutottunk el. Ez lehet csalóka, hiszen ha pl. minden má-
sodik évben szerzett adatokat ábrázolunk, akkor a közbenső években az előző adatsor növekedésé-
től függetlenül lehet relatív csökkenés a korábbi évek eredményéhez képest.

1.4. Kördiagram

Kördiagram

1
6%
9 2
23% 12%

8
6% 3
23%
7
6%

5 4
18% 6%
ÁLATLÁNOS STATISZTIKA 6. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

A kördiagramot általában az adatok relatív gyakoriságának ábrázolására használják. A teljes kör


jelképezi a 100%-ot, és az egyes adatok relatív gyakoriságát ábrázoló körcikkhez tartozó középpon-
ti szög arányos a relatív gyakorisággal.
Ezen a kördiagramon az előző adathalmazban szereplő adatok relatív gyakoriságát jelenítettük
meg. Az egyes értékek előfordulási gyakoriságát is szokás feltüntetni. A kördiagram előnye, hogy a
rész és egész, valamint az egyes részek egymáshoz való viszonya jól látható, viszont ha nem tüntet-
jük fel a szeletek mellett az előfordulási arányokat, akkor nehéz pontosan megbecsülni az egyes
adatok nagyságát.
Kördiagramok esetén szoktak térbeli ábrát is készíteni.

Térbeli kördiagram

1
9 6% 2
23% 12%

8
3
6%
23%
7
6%
5 4
18% 6%

Ez ugyan látványos, és szeretik az egyszerű emberek, de a perspektíva miatt nagyon nagy mér-
tékben eltorzíthatja az arányokat, ráadásul szintén a perspektíva miatt manipulációra ad lehetőséget.

1.5. Sávdiagram

Sávdiagram

0% 20% 40% 60% 80% 100%


ÁLATLÁNOS STATISZTIKA 7. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

A sávdiagramban az adatok relatív gyakoriságát egy sávon ábrázoljuk. A megjelenítésnél az


egyes részsávok hosszúsága arányos a megjelenített adat relatív gyakoriságának nagyságával.
A sávdiagram előnye, hogy a rész és egész viszonya jól látható, azonban az egyes részek egy-
máshoz való viszonya nem igazán szemléletes.
Létezik összehasonlító változatban is, amikor az egyes adatok változását egymás mellé helyezett,
függőleges helyzetű sávdiagramokon (úgynevezett halmozott oszlopdiagramokon) szemléltetik. Ha
az oszlopok magassága arányos az összmennyiséggel, akkor a szemléletesség torzul: sem az nem
látható jól, hogy az egyes mennyiségek aránya az egészhez hogyan változott, sem az, hogy a meny-
nyiségek abszolút nagysága hogyan változott.

Halmozott oszlop diagram

30

25

20

15

10

0
1 2

Az oszlopok magassága lehet egyenlő (100%-ig halmozott oszlop), ebben az esetben a százalé-
kos arány változása nyomon követhető.

100%-ig halmozott oszlop diagram

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
1 2
ÁLATLÁNOS STATISZTIKA 8. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

1.6. Gyűrűdiagram

Gyűrűdiagram

1
6%
9 2
23% 12%

8
6% 3
7 23%
6%

5 4
18% 6%

A gyűrűdiagram tulajdonképpen a kördiagram egy részlete, egy körgyűrű-sávot levágunk a kör-


diagramból. Akkor szokás használni, ha több adathalmaz összehasonlítását akarjuk megtenni, és az
egyes gyűrűkben ábrázolhatjuk a különböző adathalmazokat.

Gyûrûdiagram összehasonlítással

9 1
11% 5% 2
1 8%
9 6% 2
8 23% 12%
3
16%
14%
8
6% 3
7 23%
6%
5 4 4
7
18% 6% 19%
22%
5
5%

Ennél az összehasonlításnál nagyon zavaró lehet az, hogy az arányok változása miatt a a két
adathalmaz egy típusú adatait ábrázoló szeletkék elcsúszhatnak egymás mellől, és ez nehezen teszi
láthatóvá a változások nagyságrendjét.
ÁLATLÁNOS STATISZTIKA 9. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

1.7. Sugár (Pókháló) diagram

Sugár (Pókháló) diagram

1
8
12 2
6

4
11 3
2

0
10 4

9 5

8 7

Ezen a diagram típuson az adatok ábrázolása úgy történik, hogy ahány adat szerepel az adathal-
mazban, annyi egy pontból kiinduló félegyenest veszünk fel, melyek közül a szomszédosok egy-
forma szöget zárnak be. Minden egyes adatot a neki megfelelő félegyenesen ábrázolunk, és utána a
kapott pontokat egy törött vonallal összekötjük.
Szintén az adatok változásának szemléltetésére alkalmas, de kézzel elkészíteni kissé nehézkes.

Az adatok változásának nagysága az egyenesek meredekségéből olvasható le: minél jobban az


origó felé tart egy szakasz, annál jobban csökken az adat nagysága, és fordítva.

1.8. Dobozábra (BOX PLOT)

A box-plot ábra a kvartilisek felhasználásával készített grafikus összegzés. A mennyiségi ismérv


eloszlásának tömör jellemzését adja.
Xmin észlelt legkisebb ismérvérték
Q1 alsó kvartilis (25% - első negyed)
Me Medián (50% - Median)
Közép (Mean)
Q3 felső kvartilis (75% - harmadik negyed)
Xmax észlelt legnagyobb ismérvérték
* kieső (Outlier)
ÁLATLÁNOS STATISZTIKA 10. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

Xmin Q1 Me Mean Q3 Xmax kieső


Az ábra egy egyenesen helyezi el az öt jellemzőt oly módon, hogy a Q1, Me és Q3 felhasználá-
sával az adotok középső 50%-át a dobozba zárva tünteti fel.

1.9. Korfa (a népesség korösszetétele)


Egy adott ország népességének összetételét több szempont szerint vizsgálhatjuk. Leggyakrabban
a nemek, a kor, a nemzetiségi és a foglalkozási szerkezet szerint szokták vizsgálni. A népesedési
helyzet vizsgálatának egyszerű, ugyanakkor szemléletes és látványos eszköze a korfa. A korfa
olyan ábra, amelynek bal oldalán a férfiak, jobb oldalán a nők számának megfelelő hosszúságú víz-
szintes sávok mutatják az adott életkorú népesség számát, általában korévenként. Azért nevezik
„korfának”, mert ha az emberek szaporodási rendjébe külső tényezők nem szólnak bele (pl. nincse-
nek háborúk, minimális az egészségügyi ellátás, nincsenek születésszabályozási rendelkezések), az
ábra képe sematikus fenyőfára emlékeztet (a). Fő típusai: a növekedő, az öregedő és a csökkenő
népességre jellemző korfa. Az elnevezés egyben arra is utal, hogy az adott korfa mögött milyen
népességváltozási folyamatok húzódnak meg. A növekedő népességre jellemző korfának (a) széles
bázisa van. Jellemzően a fejlődő országoknak ilyen a korfájuk:

a.)növekvő népesség
b.)öregedő népesség
c.)csökkenő népesség

Ezekben a társadalmakban a gyerekek magas aránya számtalan problémát okozhat (és persze
legalább annyi örömet). Például a gazdasági nehézségek egyebek között a nem munkaképes korú,
eltartott fiatalok óriási számára vezethetők vissza. Az öregedő népességet megjelenítő korfa (b) a
születések számának állandóvá válását és az idősebb emberek számának viszonylagos emelkedését
jelzi. Az öregedő társadalmakban - Nyugat-Európa országaiban - például az idősek egyre nagyobb
aránya és mind magasabb koruk növelheti a gazdaság terheit; évről-évre emelkednek az összessé-
ÁLATLÁNOS STATISZTIKA 11. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

gében és a személyenként rájuk költött összegek. A legutóbbi tíz évben az egy-egy időskorúra for-
dított összeg különösen Portugáliában, Luxemburgban és Olaszországban emelkedett erőteljesen.

Katar korfája (1993) a.) Thaiföld korfája (1992), b.) Laguna Hills (California 1970)

A csökkenő népességre jellemző korfa a születési arányszámok csökkenésének következménye.


A halálozási arányszám hasonlóan alakul, mint
az öregedő társadalmakban. Néhány különleges
korfát is érdemes szemügyre vennünk. A korfák
átalakulhatnak egymásba, hiszen a népesség kor-
összetétele is változhat. Például Thaiföld korfája
a csökkenő népességre jellemző típusba sorolha-
tó, évről évre csökken a születések száma. A
korfa felső kétharmadán azonban jól megfigyel-
hető, hogy Thaiföld népessége nem is olyan ré-
gen még növekedett. Thaiföldéhez hasonló kor-
fája van azoknak az országoknak, amelyekben
éppen megkezdődött a társadalom „érése", ilyen
például Brazília, Mauritius és Szingapúr. Az Egy igazán fiatalos korfa
amerikai nyugdíjas városok korfájára (az utolsó) a fiatalok alacsony száma jellemző. Az erős be-
vándorlás egészen torz korfákat hozhat létre; ilyen például Katar (utolsó előtti korfa) és az Egyesült
Arab Emirátusok korfája. A fiatal férfi vendégmunkások nagyarányú beáramlása jócskán módosítja
a népességnek nemcsak a kor, hanem a nem szerinti összetételét is. Az első ütemben a fiatal, 25-40
éves férfiak aránya emelkedik, majd az anyagi hátteret, az egzisztenciát megteremtve a fiatal ven-
dégmunkások családjai is áttelepülnek.
ÁLATLÁNOS STATISZTIKA 12. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

Japán korfája mutatja, hogy nemcsak térben, hanem időben is változik a


korfa, és pontosan mutatja az ország népesedési állapotát, tendenciáját

Magyarország népességének korösszetétele (KSH után)


Az ország népesedési helyzetének vál-
tozása a magyar népszámlálások csak-
nem másfél évszázadot átívelő adatai
alapján vizsgálhatók, értékelhetők, ele-
mezhetők. Magyarország lakosságáról
130 éve rajzolnak korfákat, és az ábrák-
ról szinte minden leolvasható, ami az
évek során az ország népével történt.
Különösen az első népszámlálások eseté-
ben láthatók a korfákon olyan kiugró
értékek, amelyek mindenképpen magya-
rázatra szorulnak. 1910-ig az első élet-
évüket be nem töltöttek sokan voltak, azaz a korfa legalsó ága jóval hosszabb, mint a fölötte levők.
Ez az akkori magas csecsemőhalandóságra utal: a megszületett gyermekek jelentős része még első
életévének betöltése előtt meghalt.
A későbbi népszámlálások adatai mutatják, hogy az orvostudomány fejlődésével, az egészségi
ellátás javulásával arányosan évtizedről évtizedre egyre többen élték meg első születésnapjukat.
Érdekes jelenség ugyanezen népszámlálások korfáin, hogy a nullára végződő életkorokhoz kiugró
ágak tartoznak. Ennek oka nem valami tízévenként ismétlődő, meglepő demográfiai esemény. Az
állami anyakönyvezés bevezetése, a személyi okmányok megjelenése előtt a népszámláláskor –
ÁLATLÁNOS STATISZTIKA 13. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

elsősorban az idősebb életkorokba tartozók közül – magas számban a körülbelüli életkort jegyeztet-
ték be, s ez a korfán is érzékelhető. Ez a magyarázata annak, hogy a 40, 50, 60 évesek száma jóval
magasabb, mint a tőlük egy-két évvel idősebbeké vagy fiatalabbaké. Az első népszámlálás adataiból
rajzolt korfán a csaknem szabályos fenyőfa sziluettjét megtöri a 19-21 évesek magasságában látható
karcsúsodás, ami az abba az életkorba tartozók alacsonyabb számára utal. Oka, hogy a szabadság-
harc fegyveres eseményei, valamint az azt követő megtorlások miatt a férfiak családjuktól távol
éltek. A férfiak katonáskodása, rabsága, illetve bujkálása miatt lényegesen kevesebb gyermek szüle-
tett, mint az azt megelőző és követő években.
Az Európai Unió népességének korösszetétele

Az EU országok korfái
ÁLATLÁNOS STATISZTIKA 14. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

A politikai és gazdasági egységbe tömörült országok a népesség száma és a demográfiai mutatók


szempontjából változatos képet mutatnak. A legkisebb régi tagállam, Luxemburg mindössze 450
ezer főt számlál, Németországban ennél 183-szor többen: 82,5 millióan élnek. Az új tagországok
közül Málta a legkisebb, lakóinak száma 397 ezer fő, és Lengyelország a legnagyobb 38,2 millió
lakossal. Akár a régi, akár az új tagokat tekintjük, Magyarország a középmezőnybe, a 8–11 milliós
országok közé tartozik Ausztriával, Belgiummal, Csehországgal, Görögországgal, Svédországgal és
Portugáliával együtt.
A 25 korfa a tagállamok népességének nem és életkor (ötéves korcsoportok) szerinti százalékos
megoszlását ábrázolja.3 A kékek a régi, a pirosak az új tagországok korfái, amelyek saját csoportju-
kon belül a népesség nagysága szerinti sorrendben követik egymást. A férfiak arányszámai a korfák
bal oldalán, sötétebb színnel, a nôké a jobb oldalukon, világosabb színnel szerepelnek. A korfák
által lefedett terület tehát minden ország esetében ugyanakkora (100%), csak a korfák alakja más. A
fa alján a 0–4 évesek, a tetején a 95+ évesek helyezkednek el. Szabályos „karácsonyfa” vagy há-
romszög-alakot akkor kapnánk, ha mintegy száz éven keresztül évről évre (legalább) ugyanannyian
születnének, az egyidősök közül minden évben ugyanolyan arányban halnának meg, és nem lenne
vándorlás (illetve annak eredménye nem módosítaná az arányokat). Viszonylag szabályosnak
mondható Írország korfája a 20 évesek feletti tartományban, Ciprusé a 40 évesek felett, több orszá-
gé (például Dánia, Hollandia, Málta) az 50 évesek felett.

A korfa aljának összeszűkülése a születésszám


csökkenését jelzi. Ez a folyamat igen korán meg-
indult például Finnországban, Németországban,
Csehországban, Magyarországon és Szlovéniában,
s később, ám drámainak nevezhető mértékben
Olaszországban, Spanyolországban vagy Lettor-
szágban. Érdemes felfigyelni azokra az országokra,
amelyeknél úgy tűnik, befejeződött a termékeny-
ség csökkenése: az egymást követő (fiatal) nemze-
dékek létszáma stabilizálódott. Ezt láthatjuk példá-
ul Belgium, Finnország, Franciaország esetében,
sőt, Luxemburgban és Hollandiában már valame-
Olaszország korfája becsült értékek alapján 2025-ben
lyest több a 0–4 éves gyermek, mint az 5–9 éves.
Bár ehhez az eredményhez a bevándorlók is hozzájárulnak, a legfontosabb szerepet kétségkívül a
gyermekbarát társadalmi környezet és családpolitika játssza. A korfák az életkor tengelyére nem
ÁLATLÁNOS STATISZTIKA 15. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

szimmetrikusak, ez különösen a magasabb életkoroknál feltűnő. A jelenség mögött elsősorban a


nőknek a férfiakénál hosszabb várható élettartama, másodsorban a vándorlás áll, mivel a vándorlás-
ban a férfiak nagyobb arányban vettek/vesznek részt (különösen igaz volt ez a múltban). A jelentős
férfi többlethalandóságot és a nagy vándorlási veszteséget mutató országokban ezért nagyobb a nő-
többlet.(A Központi Statisztikai Hivatal adatai alapján)

2.1. Manipulációs lehetőségek az adatok grafikus megjelenítésével

Az adatok grafikus megjelenítésekor az adatsor ábrázolójának nagy lehetősége van manipulatív


módszerek kiválasztására: pusztán a megjelenítés során sugallni tud valamit az adatsorról. Szokták
mondani: statisztikai adatokkal minden be lehet bizonyítani, és az ellenkezőjét is. Nézzünk erre
néhány példát!
1. példa: A politika és az életkor
Egy vidéki városban tartott politikai rendezvényre 140 ember ment el. A résztvevők életkorát
nagyság szerint közzétették.

15 15 16 16 16 17 17 17 17 18
18 18 18 18 19 19 19 19 19 19
20 20 20 20 20 20 21 21 21 21
21 22 22 22 22 23 23 23 24 24
25 25 25 26 26 26 27 27 28 30
32 33 35 37 38 38 39 39 39 39
40 40 40 40 41 41 41 41 41 42
42 42 42 42 42 42 42 42 42 43
43 43 43 43 44 44 44 44 44 44
45 45 45 45 45 46 46 46 46 46
46 47 47 47 48 48 48 48 49 49
49 49 50 50 50 52 52 52 52 53
53 54 54 54 56 56 57 58 58 59
60 60 61 64 65 67 67 68 68 69

A jobb követhetőség érdekében összesítve közöljük, hogy az egyes életkorú emberekből hány
volt jelen a rendezvényen, a zárójel előtti szám az életkor, a zárójelben álló szám a létszám:
15 (2), 16 (3), 17 (4), 18 (5), 19 (6), 20 (6), 21 (5), 22 (4), 23 (3), 24 (2), 25 (3), 26 (3), 27 (2), 28
(1), 29 (0), 30 (1), 31 (0), 32 (1), 33 (1), 34 (0), 35 (1), 36 (0), 37 (1), 38 (2), 39 (4), 40 (4), 41 (5),
42 (10), 43 (5), 44 (6), 45 (5), 46 (6), 47 (3), 48 (4), 49 (4), 50 (3), 51 (0), 52 (4), 53 (2), 54 (3), 55
(0), 56 (2), 57 (1), 58 (2), 59 (1), 60 (2), 61 (1), 62 (0), 63 (0), 64 (1), 65 (1), 66 (0), 67 (2), 68 (2),
69 (1)
ÁLATLÁNOS STATISZTIKA 16. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

Az első statisztikus azt az eredményt kapta, hogy a fiatalokat kevésbé érdekli a politika, és az
időseket a legjobban.
Négy korcsoportra osztotta a résztvevőket:
I: 15 - 19 év közöttiek: számuk 20 fő;
II: 20 - 29 év közöttiek: számuk 29 fő;
III: 30 - 44 év közöttiek: számuk 41 fő;
IV: 45 - 69 év közöttiek: számuk 50 fő.

Az osztályokba sorolás alapján elkészítette az életkor szerinti részvételi létszám oszlopdiagram-


ját:

Oszlopdiagram osztályokkal

60
50
Darabszám

40
30
20

10
0
15-19 20-29 30-44 45-69
Életkor

A második statisztikus fejét csóválva azt mondta: Nem jó, hiszen az osztályok nem egyforma
életkori létszámról szólnak. Tehát figyelembe kell vennünk, hogy egy osztály hány évet ölel fel, és
ezzel el kell osztanunk az adatokat. Így az első osztály létszámát 5-tel, a másodikét 10-zel, a
harmadikét 15-tel, a negyedikét 25-tel osztjuk. A kapott értékeket ábrázoljuk oszlopdiagramon:

Oszlopdiagram osztályokkal

4,5
Darabszám/oszt. szél.

4
3,5
3
2,5
2
1,5
1
0,5
0
15-19 20-29 30-44 45-69
Életkor

Ebből éppen az jött ki, hogy a fiatalokat érdekli a legjobban a politika, és az időseket legkevésbé.
ÁLATLÁNOS STATISZTIKA 17. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

A harmadik statisztikus azt mondta: Egyiknek sincs igaza, hiszen a grafikonokból származó két-
féle, egymásnak ellentmondó eredmény azt mutatja, hogy rossz az osztályba sorolás. Olyan osztá-
lyokat kell keresni, ahol mindkét féle grafikonból ugyanazt az eredményt kapjuk. Mutatott is egy
példát:
Legyen a három korcsoport pl. az alábbi, ekkor az a) grafikon módosul.
I: 15 - 24 év közöttiek: számuk 40 fő;
II: 25 - 39 év közöttiek: számuk 20 fő;
III: 40 - 69 év közöttiek: számuk 80 fő.

Oszlopdiagram osztályokkal Oszlopdiagram osztályokkal

4,5 90
Darabszám/oszt. szél.

4 80
3,5 70
3 Darabszám 60
2,5 50
2 40
1,5 30
1 20
0,5 10
0 0
15-24 25-39 40-69 15-24 25-39 40-69

Életkor Életkor

Azt ugyan nem lehet eldönteni a grafikonok alapján, hogy melyik korosztályt érdekli legjobban a
politika, de az biztos, hogy a középkorúakat a legkevésbé, hiszen mindkét grafikon ezt alátámasztja.

A negyedik statisztikus azt mondta: Ne önállóan nézzük az adatokat, hanem próbáljuk meg a vá-
ros lakosságához viszonyítani. El is kérte a nyilvántartásból a lakossági létszámokat, és a követke-
zőket kapta (az első esetben figyelembe vett osztályba sorolással dolgozott):

Életkor 15-19 20-29 30-44 45-69


Lakosok összes száma 359 518 735 894
Rendezvényen részt vett 20 29 41 50
Lakosok számához viszonyított %-os arány 5,57% 5,6% 5,58% 5,59%

Ebből viszont látszik, hogy érdeklődésben nincs jelentős különbség a korosztályok között.
ÁLATLÁNOS STATISZTIKA 18. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

Megjegyzésként hozzáfűzzük a feladathoz, hogy az adatok osztályba sorolás nélkül is ábrázolha-


tóak, érdemes elgondolkodni, hogy ebből milyen következtetés vonható le:

Oszlopdiagram egyedi adatokkal

12

10

Darabszám
6

4
2

0
15

20
25

30
35
40

45
50
55
60

65
Életkor

2. példa: A városi önkormányzat és a fejlesztés

Egy népszerű fürdőhely fürdőjének látogatottsági adatait tartalmazza az alábbi táblázat:


Év 1970 1972 1976 1978 1981
Látogatószám 755 000 815 000 845 000 850 000 945 000

A városi tanácsban az ellenzék képviselője felszólal: Botrányos, hogy miközben ugrásszerűen nő


a látogatók száma, a város vezetése nem tesz semmit a komoly fejlesztések érdekében. Bizonyíték-
ként az alábbi grafikont mutatja be:

Vonaldiagram
Látogatók (ezer fő)

900

800

700
1970 1972 1976 1978 1981
Évek

Erre a város vezetése reagál: Ismerjük az adatokat, de meg kell mondjuk, nem látunk semmiféle
ugrásszerű változást, egy megfontolt, lassú növekedés érzékelhető, ami nem teszi indokolttá a
nagyarányú fejlesztéseket.
ÁLATLÁNOS STATISZTIKA 19. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

Vonaldiagram

1000

Látogatók (ezer fő)


800

600
400

200
0
1970 1972 1976 1978 1981
Évek

Az ellenzék képviselője ismét szót kap: Nézzük meg, hogy 1970-hez képest milyen nagyarányú
növekedés volt tapasztalható a látogatók létszámában %-ban kifejezve:

Bázisév: 1970, vonaldiagram

130
Látogatók aránya, %

125
120
115
110
105
100
95
1970 1972 1976 1978 1981
Évek

Erre a városi vezetés képviselője válaszol ismét: Nézzük meg, hogy az előző évhez képest mek-
kora növekedés volt az egyes években! Látható, hogy a növekedés nagyon ingadozó, sőt, csökkenő
tendenciát is mutatott sokáig, tehát ismételten nem indokolt a fejlesztés.

Bázisév: előző év, vonaldiagram


140
130
Látogatók aránya, %

120
110
100
90
80
70
1970 1972 1976 1978 1981
Évek
ÁLATLÁNOS STATISZTIKA 20. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

3. A grafikus ábrázolás a gyakorlatban

3.1. 22 településből álló kistérség népsűrűségének vizsgálata grafikus módszerrel

14

12

10

2 Std. Dev = 84,80


Mean = 87,6

0 N = 22,00
0,0 100,0 200,0 300,0 400,0
50,0 150,0 250,0 350,0 450,0

népsűrűség (fõ/km2)
A hisztogramról azt láthatjuk, hogy a települések átlagos népsűrűsége az adott kistérségben 87,6
fő/km2. (Vigyázat, nem a kistérség átlagos népsűrűsége! Lásd 1.sz. tábla) A települések többsége
(13 db) 50 fő/km2 körül található. Egyetlen település van, amely értéke 450 fő/km2 körüli értékkel
rendelkezik. A térség ismeretében eldönthető, hogy hiba csúszott-e a számításba, vagy ténylegesen
van a térségben egy nagy népsűrűségű település. (Természetesen a kistérségek nagyrésze rendelke-
zik egy nagy népsűrűségű centrummal.)

A kistérség területe, lakossága és népsűrűsége


Maximális Összesen Átlag
terület (hektár) 10284 46979 2135,4
lakosság 1998.jan.1. 44912 69256 3148,0
Népsűrűség (fő/km2) 436,7 147,4 147,4

Az elemzéseket azonban a torzítások elkerülése érdekében az ilyen esetekben a térségi centrum-


mal együtt és nélkül is el kell végezni, s csak a két eredmény együttes figyelembe vételével szabad
a következtetéseket levonni!
ÁLATLÁNOS STATISZTIKA 21. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

A megjelenítés következő lépéseként az adatsorból boxplot készül. A boxplot egy olyan ábra,
mely a leíró statisztika legfontosabb öt értékén alapszik, nevezetesen a legkisebb és legnagyobb
értékek, a negyedelők és a medián értéken. A box maga egy számegyenes mentén megjelenő, a két
negyedelő érték által határolt doboz, a medián értéknél egy törésvonallal.

A kilógó adatok megjelenítésére kétféle jelölést is láthatunk az ábrán. A belső határoló ponton
kívül eső, de a külső határoló ponton belül elhelyezkedő értékek kör szimbólummal, míg a külső
határolóponton kívüli értékek csillag szimbólummal vannak jelölve. A szimbólumok mellett az eset
azonosítója (sorszáma) is megjelenik, így lehetőség van ezek visszakeresésére.

A népsűrűség ábrázolása boxploton


500

19

400

300

200

15
7
12

100

-100
N= 22

népsûrûség (fõ/km2)
ÁLATLÁNOS STATISZTIKA 22. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2

3.2 Pareto analízis


A pareto diagramm a problémát okozó különböző tényezők jelentőségét vizsgálja, és a probléma
okainak alapos megfigyelésével és előfordulási gyakoriságának meghatározásával próbál egyfajta
arányt megállapítani.
A problémák megállapításához ad segítséget. Egy adott probléma lehetséges okairól összegyűjtött
adatokat ábrázolja, vertikálisan és horizontálisan, mennyiség és fajták szerint. E módszer alkalmas
az egyenlőtlenségek kimutatására, rámutat a legnagyobb problémára. Képessé teszi használóját pri-
oritások kialakítására. Alkalmazásnak célja a problémát generáló okok kiválasztása, azonosítása,
javítása, fejlesztési lehetőségek rangsorolása. Eszközei a hisztogram, melyben a vizsgált tényezők
csökkenő sorrendben vannak feltüntetve, valamint egy poligon, ami a tényezők halmozott arányát
mutatja százalékban. A következő vizsgálatot a saját magunk végeztük el, amelyben segítségünkre
volt a könyvtár állandó munkatársa, a könyvtáros, aki osztályozta az általunk feltárt problémákat,
amelyeket egy kérdőív formájában, kérésünkre két héten keresztül minden nap kitöltött, ebben az
időszakban benne volt a „könyvtáros néni” 2 napos betegsége is. Ennek eredménye az 1. táblázat-
ban látható.Mintavételünk a problémáról, nem teljesen pontos, hiszen rövid ideig követhettük végig
a könyvtár mindennapjait, de a „könyvtáros néni” állítása szerint az arányok megegyeznek, ha hosz-
szabb távra vetítjük a megfigyelésünk eredményét.

Az összesített eredmények táblázatban a szemléltető diagram pedig az ábrán látható.

Előfordu- Relatív Halmozott


Sorszám
lás gyakoriság gyakoriság
1 Lassú ügyintézés 97 0.2033543 0.2033543
2 Pótolhatalanság 72 0.1509434 0.3542977
3 Lassú információ áramlás 67 0.1404612 0.49475891
4 Tájékozatlan helyettes 65 0.1362683 0.63102726
5 Formanyomtatvány elavultsága 47 0.0985325 0.72955975
6 Nincs megfelelő softwear 40 0.0838574 0.81341719
7 Pontatlanság 32 0.067086 0.88050315
8 Adatvesztés 25 0.0524109 0.93291405
9 Nem biztonságos 22 0.0461216 0.97903564
10 Papíralapú nyilvántartás 10 0.0209644 1
Összesen: 477 1 -

1,2

0,8

0,6

0,4

0,2

0
1 2 3 4 5 6 7 8 9 10

Pareto diagram

You might also like