Professional Documents
Culture Documents
oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
GRAFIKUS ÁBRÁZOLÁS
Leíró statisztika
A leíró statisztika azzal foglalkozik, hogy egy adott, meghatározott elemekből álló információ-
halmazt kiértékeljen. Ezek az információk legtöbbször persze számokat jelentenek, hiszen ezek a
matematikai módszerekkel legkönnyebben kezelhető objektumok, azonban nem kell szigorúan
ezekhez ragaszkodnunk, olyan adathalmazokat is kiértékelhetünk, melyek nem számokból állnak.
Természetesen a kiértékelés mikéntjét tekintve ez utóbbi esetben a lehetőségeink korlátozottabbak.
gn + 2 h
= gn + 2 ⋅
k k
n
Ha gn+1= gn+2, akkor a t1=t2
t1
t2
h h k
gn gn+1 gn+2
Hisztogram
Ebben az ábrázolási módban az adatokat mint kis pálcikákat jelenítjük meg. A pálcikák magas-
sága arányos az adat nagyságával. (A negatív adatokat lehet lefelé rajzolni.)
Nagyon gyakran előfordul, hogy nem magukat az adatokat ábrázolják a hisztogramon, hanem a
gyakoriságukat. Ebben az esetben az oszlopok alatt fel kell tüntetni, hogy melyik adathoz tartozó
relatív gyakoriságot mutatják.
A hisztogramok esetében alkalmazható vízszintes oszlop-elhelyezkedés is.
Hisztogram
0 1 2 3 4 5 6 7 8 9
ÁLATLÁNOS STATISZTIKA 3. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
Térbeli hisztogram
3,5
2,5
1,5
0,5
0
1 2 3 4 5 7 8 9
Ebben az esetben a térbeli ábrázolás teljesen felesleges, hiszen semmivel sem mond többet, mint
a síkbeli ábra, sőt, a térhatás eléréséhez alkalmazott technika kissé torzítja az arányokat.
A bevezetőben mondottaknak megfelelően az adatok ábrázolása nem csak a relatív gyakoriság
alapján, hanem adatsávokba osztva, az egyes tartományokba eső adatok számának ábrázolásával is
történhet.
Kumulált gyakorisági görbék
A fenti táblázat első sorában pl. a 62456, 42312, 51897, 82451, 89236 adatok vannak ábrázolva.
Ezekben a százezres helyiértéken 0 áll, a tízezres helyiértéken pedig 6, 4, 5, 8, 8, amint az a táblá-
zatból is leolvasható. A táblázat negyedik sorában pl. a 315682, 326897, 318642, 315259, 368970
adatok vannak ábrázolva. Ezekben a százezres helyiértéken 3 áll, a tízezres helyiértéken pedig 1, 2,
1, 1, 6.
A szár-levél diagram 90 fokkal elforgatva hisztogramot ad, természetesen itt az oszlopok magas-
ságát a számsorok hosszúsága fogja adni. Azonban a szár-levél diagramnak a hisztogrammal szem-
ben több előnye is van. Egyrészt nem veszik el az egyes adatok számszerűségében hordozott infor-
máció és az adatok eredeti sorrendjét is (egy-egy adatsávon belül) meg lehet tartani, másrészt pedig
a hisztogram készítésekor az ábrázolás finomítása (tehát az adatsávok szűkítése) sokkal bonyolul-
tabb. Itt egyszerűen csak az adatokat kell átrendezni annak megfelelően, hogy milyen új adatsávo-
kat akarunk létrehozni. Például a fenti szár-levél diagram 50000-es finomítása a következő:
Százezresek Tízezresek
0 4 5
6 8 8
1 3 0 0 1 3 3 4 2
6 8 6 5 7 5
2 4 3 2 2 1
6
3 1 2 1 1
6
4 0 3 4 2
7 8 5
5 1 1 2 2
6 3 2 3
5 7 8 9 9 9 9 9
7 1 2 4 2 3
8 4 2 3 4
7 8 5 6
9 2 3 1 2
9 9
Sokszögvonal-diagram
3.5
2.5
1.5
0.5
0
1 2 3 4 5 7 8 9
1.4. Kördiagram
Kördiagram
1
6%
9 2
23% 12%
8
6% 3
23%
7
6%
5 4
18% 6%
ÁLATLÁNOS STATISZTIKA 6. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
Térbeli kördiagram
1
9 6% 2
23% 12%
8
3
6%
23%
7
6%
5 4
18% 6%
Ez ugyan látványos, és szeretik az egyszerű emberek, de a perspektíva miatt nagyon nagy mér-
tékben eltorzíthatja az arányokat, ráadásul szintén a perspektíva miatt manipulációra ad lehetőséget.
1.5. Sávdiagram
Sávdiagram
30
25
20
15
10
0
1 2
Az oszlopok magassága lehet egyenlő (100%-ig halmozott oszlop), ebben az esetben a százalé-
kos arány változása nyomon követhető.
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
1 2
ÁLATLÁNOS STATISZTIKA 8. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
1.6. Gyűrűdiagram
Gyűrűdiagram
1
6%
9 2
23% 12%
8
6% 3
7 23%
6%
5 4
18% 6%
Gyûrûdiagram összehasonlítással
9 1
11% 5% 2
1 8%
9 6% 2
8 23% 12%
3
16%
14%
8
6% 3
7 23%
6%
5 4 4
7
18% 6% 19%
22%
5
5%
Ennél az összehasonlításnál nagyon zavaró lehet az, hogy az arányok változása miatt a a két
adathalmaz egy típusú adatait ábrázoló szeletkék elcsúszhatnak egymás mellől, és ez nehezen teszi
láthatóvá a változások nagyságrendjét.
ÁLATLÁNOS STATISZTIKA 9. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
1
8
12 2
6
4
11 3
2
0
10 4
9 5
8 7
Ezen a diagram típuson az adatok ábrázolása úgy történik, hogy ahány adat szerepel az adathal-
mazban, annyi egy pontból kiinduló félegyenest veszünk fel, melyek közül a szomszédosok egy-
forma szöget zárnak be. Minden egyes adatot a neki megfelelő félegyenesen ábrázolunk, és utána a
kapott pontokat egy törött vonallal összekötjük.
Szintén az adatok változásának szemléltetésére alkalmas, de kézzel elkészíteni kissé nehézkes.
a.)növekvő népesség
b.)öregedő népesség
c.)csökkenő népesség
Ezekben a társadalmakban a gyerekek magas aránya számtalan problémát okozhat (és persze
legalább annyi örömet). Például a gazdasági nehézségek egyebek között a nem munkaképes korú,
eltartott fiatalok óriási számára vezethetők vissza. Az öregedő népességet megjelenítő korfa (b) a
születések számának állandóvá válását és az idősebb emberek számának viszonylagos emelkedését
jelzi. Az öregedő társadalmakban - Nyugat-Európa országaiban - például az idősek egyre nagyobb
aránya és mind magasabb koruk növelheti a gazdaság terheit; évről-évre emelkednek az összessé-
ÁLATLÁNOS STATISZTIKA 11. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
gében és a személyenként rájuk költött összegek. A legutóbbi tíz évben az egy-egy időskorúra for-
dított összeg különösen Portugáliában, Luxemburgban és Olaszországban emelkedett erőteljesen.
Katar korfája (1993) a.) Thaiföld korfája (1992), b.) Laguna Hills (California 1970)
elsősorban az idősebb életkorokba tartozók közül – magas számban a körülbelüli életkort jegyeztet-
ték be, s ez a korfán is érzékelhető. Ez a magyarázata annak, hogy a 40, 50, 60 évesek száma jóval
magasabb, mint a tőlük egy-két évvel idősebbeké vagy fiatalabbaké. Az első népszámlálás adataiból
rajzolt korfán a csaknem szabályos fenyőfa sziluettjét megtöri a 19-21 évesek magasságában látható
karcsúsodás, ami az abba az életkorba tartozók alacsonyabb számára utal. Oka, hogy a szabadság-
harc fegyveres eseményei, valamint az azt követő megtorlások miatt a férfiak családjuktól távol
éltek. A férfiak katonáskodása, rabsága, illetve bujkálása miatt lényegesen kevesebb gyermek szüle-
tett, mint az azt megelőző és követő években.
Az Európai Unió népességének korösszetétele
Az EU országok korfái
ÁLATLÁNOS STATISZTIKA 14. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
15 15 16 16 16 17 17 17 17 18
18 18 18 18 19 19 19 19 19 19
20 20 20 20 20 20 21 21 21 21
21 22 22 22 22 23 23 23 24 24
25 25 25 26 26 26 27 27 28 30
32 33 35 37 38 38 39 39 39 39
40 40 40 40 41 41 41 41 41 42
42 42 42 42 42 42 42 42 42 43
43 43 43 43 44 44 44 44 44 44
45 45 45 45 45 46 46 46 46 46
46 47 47 47 48 48 48 48 49 49
49 49 50 50 50 52 52 52 52 53
53 54 54 54 56 56 57 58 58 59
60 60 61 64 65 67 67 68 68 69
A jobb követhetőség érdekében összesítve közöljük, hogy az egyes életkorú emberekből hány
volt jelen a rendezvényen, a zárójel előtti szám az életkor, a zárójelben álló szám a létszám:
15 (2), 16 (3), 17 (4), 18 (5), 19 (6), 20 (6), 21 (5), 22 (4), 23 (3), 24 (2), 25 (3), 26 (3), 27 (2), 28
(1), 29 (0), 30 (1), 31 (0), 32 (1), 33 (1), 34 (0), 35 (1), 36 (0), 37 (1), 38 (2), 39 (4), 40 (4), 41 (5),
42 (10), 43 (5), 44 (6), 45 (5), 46 (6), 47 (3), 48 (4), 49 (4), 50 (3), 51 (0), 52 (4), 53 (2), 54 (3), 55
(0), 56 (2), 57 (1), 58 (2), 59 (1), 60 (2), 61 (1), 62 (0), 63 (0), 64 (1), 65 (1), 66 (0), 67 (2), 68 (2),
69 (1)
ÁLATLÁNOS STATISZTIKA 16. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
Az első statisztikus azt az eredményt kapta, hogy a fiatalokat kevésbé érdekli a politika, és az
időseket a legjobban.
Négy korcsoportra osztotta a résztvevőket:
I: 15 - 19 év közöttiek: számuk 20 fő;
II: 20 - 29 év közöttiek: számuk 29 fő;
III: 30 - 44 év közöttiek: számuk 41 fő;
IV: 45 - 69 év közöttiek: számuk 50 fő.
Oszlopdiagram osztályokkal
60
50
Darabszám
40
30
20
10
0
15-19 20-29 30-44 45-69
Életkor
A második statisztikus fejét csóválva azt mondta: Nem jó, hiszen az osztályok nem egyforma
életkori létszámról szólnak. Tehát figyelembe kell vennünk, hogy egy osztály hány évet ölel fel, és
ezzel el kell osztanunk az adatokat. Így az első osztály létszámát 5-tel, a másodikét 10-zel, a
harmadikét 15-tel, a negyedikét 25-tel osztjuk. A kapott értékeket ábrázoljuk oszlopdiagramon:
Oszlopdiagram osztályokkal
4,5
Darabszám/oszt. szél.
4
3,5
3
2,5
2
1,5
1
0,5
0
15-19 20-29 30-44 45-69
Életkor
Ebből éppen az jött ki, hogy a fiatalokat érdekli a legjobban a politika, és az időseket legkevésbé.
ÁLATLÁNOS STATISZTIKA 17. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
A harmadik statisztikus azt mondta: Egyiknek sincs igaza, hiszen a grafikonokból származó két-
féle, egymásnak ellentmondó eredmény azt mutatja, hogy rossz az osztályba sorolás. Olyan osztá-
lyokat kell keresni, ahol mindkét féle grafikonból ugyanazt az eredményt kapjuk. Mutatott is egy
példát:
Legyen a három korcsoport pl. az alábbi, ekkor az a) grafikon módosul.
I: 15 - 24 év közöttiek: számuk 40 fő;
II: 25 - 39 év közöttiek: számuk 20 fő;
III: 40 - 69 év közöttiek: számuk 80 fő.
4,5 90
Darabszám/oszt. szél.
4 80
3,5 70
3 Darabszám 60
2,5 50
2 40
1,5 30
1 20
0,5 10
0 0
15-24 25-39 40-69 15-24 25-39 40-69
Életkor Életkor
Azt ugyan nem lehet eldönteni a grafikonok alapján, hogy melyik korosztályt érdekli legjobban a
politika, de az biztos, hogy a középkorúakat a legkevésbé, hiszen mindkét grafikon ezt alátámasztja.
A negyedik statisztikus azt mondta: Ne önállóan nézzük az adatokat, hanem próbáljuk meg a vá-
ros lakosságához viszonyítani. El is kérte a nyilvántartásból a lakossági létszámokat, és a követke-
zőket kapta (az első esetben figyelembe vett osztályba sorolással dolgozott):
Ebből viszont látszik, hogy érdeklődésben nincs jelentős különbség a korosztályok között.
ÁLATLÁNOS STATISZTIKA 18. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
12
10
Darabszám
6
4
2
0
15
20
25
30
35
40
45
50
55
60
65
Életkor
Vonaldiagram
Látogatók (ezer fő)
900
800
700
1970 1972 1976 1978 1981
Évek
Erre a város vezetése reagál: Ismerjük az adatokat, de meg kell mondjuk, nem látunk semmiféle
ugrásszerű változást, egy megfontolt, lassú növekedés érzékelhető, ami nem teszi indokolttá a
nagyarányú fejlesztéseket.
ÁLATLÁNOS STATISZTIKA 19. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
Vonaldiagram
1000
600
400
200
0
1970 1972 1976 1978 1981
Évek
Az ellenzék képviselője ismét szót kap: Nézzük meg, hogy 1970-hez képest milyen nagyarányú
növekedés volt tapasztalható a látogatók létszámában %-ban kifejezve:
130
Látogatók aránya, %
125
120
115
110
105
100
95
1970 1972 1976 1978 1981
Évek
Erre a városi vezetés képviselője válaszol ismét: Nézzük meg, hogy az előző évhez képest mek-
kora növekedés volt az egyes években! Látható, hogy a növekedés nagyon ingadozó, sőt, csökkenő
tendenciát is mutatott sokáig, tehát ismételten nem indokolt a fejlesztés.
120
110
100
90
80
70
1970 1972 1976 1978 1981
Évek
ÁLATLÁNOS STATISZTIKA 20. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
14
12
10
0 N = 22,00
0,0 100,0 200,0 300,0 400,0
50,0 150,0 250,0 350,0 450,0
népsűrűség (fõ/km2)
A hisztogramról azt láthatjuk, hogy a települések átlagos népsűrűsége az adott kistérségben 87,6
fő/km2. (Vigyázat, nem a kistérség átlagos népsűrűsége! Lásd 1.sz. tábla) A települések többsége
(13 db) 50 fő/km2 körül található. Egyetlen település van, amely értéke 450 fő/km2 körüli értékkel
rendelkezik. A térség ismeretében eldönthető, hogy hiba csúszott-e a számításba, vagy ténylegesen
van a térségben egy nagy népsűrűségű település. (Természetesen a kistérségek nagyrésze rendelke-
zik egy nagy népsűrűségű centrummal.)
A megjelenítés következő lépéseként az adatsorból boxplot készül. A boxplot egy olyan ábra,
mely a leíró statisztika legfontosabb öt értékén alapszik, nevezetesen a legkisebb és legnagyobb
értékek, a negyedelők és a medián értéken. A box maga egy számegyenes mentén megjelenő, a két
negyedelő érték által határolt doboz, a medián értéknél egy törésvonallal.
A kilógó adatok megjelenítésére kétféle jelölést is láthatunk az ábrán. A belső határoló ponton
kívül eső, de a külső határoló ponton belül elhelyezkedő értékek kör szimbólummal, míg a külső
határolóponton kívüli értékek csillag szimbólummal vannak jelölve. A szimbólumok mellett az eset
azonosítója (sorszáma) is megjelenik, így lehetőség van ezek visszakeresésére.
19
400
300
200
15
7
12
100
-100
N= 22
népsûrûség (fõ/km2)
ÁLATLÁNOS STATISZTIKA 22. oldal
ST-GRAFIKUS_ÁBRÁZOLÁS1-2
1,2
0,8
0,6
0,4
0,2
0
1 2 3 4 5 6 7 8 9 10
Pareto diagram