You are on page 1of 59

3.

STATISTINIŲ DUOMENŲ
SUMAVIMAS IR
PATEIKIMAS
Klausimai
1. Statistinio sumavimo samprata.
2. Absoliutūs ir santykiniai dydžiai:
- Procentai ir proporcijos.
- Koeficientai.
3. Dažnių skirstiniai.
4. Grafikai.
Absoliutūs dydžiai
• Matuojami absoliučiais mato vienetais
- pvz., pervežta krovinių tonomis, gyventojų skaičius
tūkst., produkcijos apimtis mln. Lt
• Rekomenduojama naudoti analizėje kai atvejų
skaičius nėra didelis (mažiau nei 20)
- nedidelis absoliutus pokytis iššaukia didelį
procentinį pasikeitimą
- pvz., grupėje 20 žmonių, iš jų 10 vyrų ir 10 moterų
(50:50 procentų). Priėmus į grupę vieną moterį,
pasiskirstymas pagal lytį tampa 52,4 ir 47,6 procento
moterų naudai).
• Jeigu analizėje naudojate santykinius dydžius,
patartina nurodyti, koks buvo tirtas absoliutus
atvejų skaičius
Procentai ir proporcijos
Standartizuoja pirminę
informaciją
f
• Proporcija p 
N
• Procentas f
%  100
N
f – tam tikros
kategorijos atvejų
skaičius
N – visų atvejų skaičius
Koeficientai
Naudojami kai reikia parodyti
• dviejų absoliučių dydžių
(kategorijų) kiekybinius
tarpusavio santykius
f1
• tiriamo reiškinio paplitimo K 
laipsnį tam tikroje aplinkoje f2
f1 – pirmos kategorijos atvejų skaičius
f2 – antros kategorijos atvejų skaičius
Grafikai. Palyginkite:
Gamybos direktorė rodo: Aš negaliu nustatyti
45 dirbančiųjų veiklos
42 efektyvumo:
39 pardavimai svyruoja
36
per smarkiai!
S K G L R L

Rinlodaros direktorius rodo:


60

40
20
0
S K G L R L
Gamybos direktorė
Kiekybinių duomenų sumavimas

Kiekybiniai
duomenys

Variacinė Dažnių
eilutė skirstinys

Sukauptųjų
Diagrama Histograma Dažnių
santykinių
medis poligonas dažnių laužtė
Variacinė eilutė
1. Sistemina duomenis taip, kad jie atspindėtų
pagrindinius visumos bruožus
2. Duomenys išdėstomi eilės tvarka
Nuo mažiausios iki didžiausios reikšmės
• Pirminiai duomenys (buvo taip surinkti)
– 24, 26, 24, 21, 27, 27, 30, 41, 32, 38
• Variacinės eilutės duomenys
– 21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Diagrama medis
21, 24, 24, 26, 27, 27, 30, 32,
38, 41
Kiekvienas skaičius
išskaidomas į šaką ir lapą
2 144677 X
i

– Šaka yra pirmasis 3 028


– skaitmuo (skaitmenys)
Lapas yra paskutinis
4 1

skaitmuo (skaitmenys)
Diagrama medis. Kitų šakos vienetų
naudojimas
• 100-tai kaip šaka:
– Suapvaliname dešimtainius lapų skaitmenis
Šaka Lapas

• 613 bus 6 1
• 776 bus 7 8
• ...
• 1224 tampa 12 2
Dažnių skirstinys
Kas yra dažnių skirstinys?
• Tai lentelė …
• Kurioje išdėstomos kintamojo reikšmės
(arba tų reikšmių intervalai) ...
• ir atitinkami dažniai - kiekvienos reikšmės
pasikartojimų skaičius (arba kiek reikšmių
patenka į kiekvieną intervalą)
Kam naudojami dažnių skirstiniai?

• Susumuoti duomenims
• Eilutę transformuoti į geriau
suprantamą formą
• Leidžia lengvai interpretuoti
duomenis
Dažnių skirstinys:
Diskretieji duomenys
• Diskrečiųjų duomenų: galimos reikšmės
yra suskaičiuojamos
Pavyzdys: laikraščio Dienų skaičius Dažnis
skelbimų skyriaus 0 44
vadovas apklausė 1 24
200 užsakovų kiek 2 18
dienų per savaitę jie 3 16
skaito dienraščius 4 20
5 22
6 26
7 30
Iš viso 200
Diskrečiųjų duomenų grafinis vaizdavimas
Stulpelių diagrama pavyzdys
Dienų Dažnis
skaičius f
Dienraščio skaitomumas per savaitę
0 44
1 24 50
2 18 40
3 16 30
dažnis

4 20 20
5 22
10
6 26
0
7 30 0 1 2 3 4 5 6 7
Iš viso 200 Dienų skaičius
Santykinis dažnis
Kokia kiekvienos reikšmės (kategorijos) proporcija?

Skaitymo Santykinis
Dažnis
dienų skaičius dažnis
44
0 44 .22  .22
200
1 24 .12
2 18 .09 22% apklaustų
žmonių atsakė,
3 16 .08 kad jie neskaito
dienraščio
4 20 .10
5 22 .11
6 26 .13
7 30 .15
Iš viso: 200 1.00
Dažnių skirstinys:
Tolydieji duomenys
• Tolydieji duomenys: gali įgyti bet kurią reikšmę
duotajame intervale
1 Pavyzdys: Izoliacinių medžiagų gamintojas atsitiktinai
atrenka 20 žiemos sezono dienų ir užfiksuoja aukščiausią
dienos temperatūrą (F): 24, 35, 17, 21, 24, 37, 26,
46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27
(Temperatūra yra tolydusis kintamasis, kadangi gali būti
matuojama norimo tikslumo laipsniais)
2 pavyzdys: dešimties atsitiktinai atrinktų VM Sesijinių
studentų amžius, metais:
24, 26, 24, 21, 27, 27, 30, 41, 32, 38
Dažnių skirstinio sudarymas
(grupuojant lygiais intervalais)
• Išdėstyti duomenis didėjančia tvarka (sudaryti variacinę eilutę)
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
• Rasti duomenų aibės plotį R = Xmax - Xmin (skirtumą tarp didžiausios ir
mažiausios reikšmės): 41 - 21 = 20
• Nustatyti grupių skaičių (rekomenduoja formulė n = 3,3223 + logN, kur N –
bendras atvejų skaičius, bet galima nuspęsti ir be formulės:
n = 3 (dažniausiai n būna nuo 5 iki 15)
• Apskaičiuoti intervalo dydį d = (Xmax – Xmin)/n : 10 (20/3 ir suapvalinti)
• Nustatyti intervalų ribas (nuo - iki) : 15, 25, 35, 45
• Apskaičiuoti intervalų vidurius (sudėti ribas ir sumą padalinti iš 2): 20, 30, 40
• Apskaičiuoti, kiek atvejų patenka į kiekvieną intervalą
• Sudėti dažnius ir įrašyti į suminę eilutę
Dažnių skirstinys

Pirminiai duomenys: 24, 26, 24, 21, 27, 27, 30,


41, 32, 38

Intervalas Dažnis
15 bet < 25 3
25 bet < 35 5
35 bet < 45 2
10
Dažnių skirstinio lentelės pavyzdys
Pirminiai duomenys: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38

Intervalas Int.vidurys Dažnis

15 - 25 20 3
Dydis
25 - 35 30 5

35 - 45 40 2
10
Ribos (Aukštutinė + žemutinė ribos) / 2
Santykinių dažnių ir procentinių
skirstinių lentelės

Santykinių dažnių Procentinis skirstinys


skirstinys

Intervalas Prop. Intervalas %


15 - 25 0,3 15 - 25 30,0
25 - 35 0,5 25 - 35 50,0
35 - 45 0,2 35 - 45 20,0
1,0 100,0
Sukauptųjų procentinių dažnių skirstinys
Pirminiai duomenys: 24, 26, 24, 21, 27, 27, 30, 41,
32, 38

Intervalas Sukaupti
procentiniai dažniai

15 - 25 30,0
Žemutinė 25 - 35 80,0 30% + 50%
intervalo 35 - 45 100,0 80% + 20%
riba
Histograma
• Intervalų ribos atidedamos
horizontaliojoje ašyje
• dažnis – vertikaliojoje ašyje

• Stulpelių aukštis atspindi stebėjimų


skaičių kiekviename intervale
Histograma

Intervalas Dažnis
Atvejų skaičius 15 - 25 3
25 - 35 5
5 35 - 45 2
Dažnis 4 10
3 Tarp stulpelių
Santykinis
nėra tarpų
dažnis 2

Procentas 1
0 Kintamojo
0 15 25 35 45 reikšmės

Intervalo riba (rėžis)


Klausimai, kurie iškyla
grupuojant duomenis
1.Kokio dydžio turėtų būti kiekvienas
intervalas?
(kiek turėtų būti tų intervalų?)

2.Kaip nustatyti intervalų ribas?


• Dažnai atsakoma bandant, remiantis asmenine
nuomone arba patirtimi
• Siekiama sudaryti tokį dažnių skirstinį, kuris
nebūtų nei pernelyg detalus (“dantytas”), nei
per stambus
• Svarbu tinkamai pateikti duomenų
pasiskirstymo charakteringus bruožus
Keli intervalai?

• Per daug (intervalai siauri) 3.5

• Labai dantytas skirstinys, su


3
2.5

Frequency
tarpais grupėms, į kurias atvejai
2
1.5

nepatenka 1
0.5

• Aiškiai nerodo pasiskirstymo


0

4
8
12
16
20
24
28
32
36
40
44
48
52
56
60
More
dėsningumų Temperature

12

• Per mažai (intervalai platūs) 10


8

Frequency
• Pernelyg “suspaudžia” sklaidą, 6

4
pasiskirstymas įgauna blokų formą 2

• Užmaskuoja sklaidos
0
0 30 60 More

dėsningumus.
Temperature

(X axis labels are upper class endpoints)


Histograma su Excel

1
1. Pasirinkti Data/Data Analysis
2. Pasirinkti Histogram
3. Įvesti Input range
4. Pasirinkti Chart Output
5. Redaguoti išvestį.
Dažnių poligonas

Intervalas Dažnis
Atvejų skaičius
15 - 25 3
5 25 - 35 5
35 - 45 2
Dažnis 4
Santykinis 3
dažnis 2 Nesantis
Procentai 1 intervalas
0
0 10 20 30 40 50 60
Intervalo vidurys
Sukauptųjų santykinių dažnių laužtė
Sukauptieji
procentai
100%
75%
Intervalas Sukaup.%
50% 15 - 25 30%
25 - 35 80%
100%
25% 35 - 45

0%
0 15 25 35 45
Riba
Dvimačių kiekybinių duomenų grafinis
vaizdavimas
1. Sklaidos diagrama
• grafike atidedamos dviejų kiekybinių
kintamųjų visos (Xi, Yi) poros
2. Laiko eilučių grafikas
• parodo, kaip kiekybiniai duomenys kinta
laike
Sklaidos diagrama
Produkcijos 250
kiekis per Dienos
dieną sąnaudos
200
23 125
26 140 Sąnaudos
150
29 146
33 160
100
38 167
42 170
50
50 188
55 195
0
60 200 0 20 40 60 80
Produkcijos kiekis
Ryšio formos

• Tiesinis

Y Y

X X
Ryšio formos ((tęsinys)

• kreivinis

Y Y

X X
Ryšio formos (tęsinys)

• Ryšio nėra

Y Y

X X
Laiko eilučių grafikas.
Linijų diagrama
Infliacijos
Metai rodiklis
1985 3.56 6
1986 1.86
1987 3.65 %
5
1988 4.14
1989 4.82 4
1990 5.40
1991 4.21 3
1992 3.01 2
1993 2.99
1994 2.56 1
1995 2.83
1996 2.95 0
1997 2.29 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002
1998 1.56
1999 2.21 metai
2000 3.36
2001 2.85
2002 1.58
Kokybinių duomenų pateikimas
lentelėse ir grafikuose
Vienmačiai duomenys Dvimačiai duomenys

•Sumuojami dažnių •Išdėstomi


lentelėse kontingencijos lentelėse
•Grafiškai vaizduojami •Grafiškai vaizduojami
stulpelių diagramų, komponentinių
skritulinių diagramų arba stulpelių diagramų
Pareto diagramų pagalba. pagalba.
Dažnių lentelė
1. Išvardijamos kategorijos ir kategorijos atvejų skaičius
2. Dažniai gali būti absoliutūs arba santykiniai
(procentiniai)

Kategorijos
išdėstomos Magistrantai Atvejų skaičius
|||| ||||
eilutėse Apskaitos 130 |||| ||||
Ekonomikos 20
Vadybos 50
200
Stulpelių diagrama
Magistrantai
Horizontalūs Stulpelių ilgis
stulpeliai rodo dažnį
kokybiniams arba %
kintamiesiems
Vadyba

Stulpelių
Ekon. plotis
1/2 stulpelio vienodas
pločio
Apsk.

Nulinis 0 50 100 150


taškas
Galima atidėti ir Dažnis
procentus
Skritulinė diagrama
1. Parodo, kaip visi
atvejai pasiskirsto į
kategorijas Magistrantai
2. Tinka struktūros Vadyba
Ekon. 25%
vaizdavimui
10% 36°
Bėgimo bateliai:
Apsk.
65%
(360°) (10%) = 36°
Pareto diagrama

Sukauptųjų Stulpelių
Procentai santykinių dažnių vidurio taškai
Visada %
100% laužtė

Vertikaliųjų
67% Mažėjimo
tvarka
stulpelių
diagrama 33%

0%
Stulpeliai Apsk. Vadyba Ekon.
vienodo pločio
Magistrantai
Kontingencijos lentelė. Pavyzdys
Gyvena: B B N N B B N N B N
Lytis: V M M V V V M V V M
•(B=Bendrabutis, N=Ne bendrabutis; M=Moteris, V=Vyras)

Lytis
Gyvena Vyras Moteris Iš viso
Bendrabutis 4 1 5
Ne bendrabutis 2 3 5
Iš viso 6 4 10
Komponentinių stulpelių diagramos

Gyvena
Bendrabutis V
M

Ne bendrabutis V
M

0 1 2 3 4
Bar Charts, Pie Charts, Histograms, Stemplots, TimeplotsDažnis
7:34
https://www.youtube.com/watch?v=uHRqkGXX55I 
Gerai nubrėžti tie grafikai, kurie
• Tinkamai atspindi:
– Turinį (esmę)
– Statistiką
– Svarbu kompozicija
• Aiškiai, tiksliai ir efektyviai pateikia
informaciją

P.S. Atkreipkite dėmesį į grafikus spaudoje.


Ar jie visada tinkamai parinkti?
Klaidos, vaizduojant duomenis
grafiškai
Klaidingas vaizdavimas Teisingas vaizdavimas

Min darbo užm. Min. darbo užm.


1960: $1.00 $
4
1970: $1.60
2
1980: $3.10
0
1990: $3.80 1960 1970 1980 1990
The 27 Worst
Charts Of All
Time
Vietoj koeficientų – absoliutūs
skaičiai

Blogas pateikimas  Geras pateikimas


10 gavę studentai
10 gavę
Džn. studentai
300 30 %
200 
 10
0 
I II lll lV kursas l ll lll lV kursas
Klaidingas vaizdavimas
Y ašies suspaudimas

Klaidingas vaizdavimasTeisingas vaizdavimas


Pardavimai $ Pardavimai
$ ketvirčiais ketvirčiais
200 50

100 25

0 0
Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
Klaidingas
0 nebuvimas vaizdavimas
vertikaliojoje ašyje

Klaidingas vaizdavimas Teisingas vaizdavimas

Mėnesiniai $ Mėnesiniai
$ pardavimai pardavimai
45 60
42 40
39 20
36 0
J M M J S N J M M J S N
Scientific American
Kaip pataisyti?

Pirmas teiginys – 89%


Antras teiginys – 72%
• Trečias teiginys – 47%
Sprendimas?
Studentų projektas:
KLAIDINANTYS GRAFIKAI
• Atkreipkite dėmesį į spaudoje ir
internetinėje erdvėje pateikiamus
grafikus.
• Nukopijuokite ir pristatykite ppt
aplinkoje, jūsų manymu, klaidinančius,
pagrįskite savo nuomonę, patarkite,
kaip ištaisyti, kokius teisingus parinkti.

You might also like