You are on page 1of 58

Statistiki skup,

jedinice i obeleja
posmatranja

Statistika je nauni metod


kvantitativnog istraivanja masovnih
pojava koje su po svojoj prirodi
varijabilne.
Statistiki skup ( osnovni skup, populacija)
skup svih pojedinanih sluajeva na kojima se
statistika pojava posmatra.
Veliina osnovnog skupa (N), moe biti vrlo
velika ili ak beskonana.
Uzorak je posmatrani podskup osnovnog skupa,
ija veliina je oznaena sa n.

Primeri osnovnih skupova:


-

svi studenti Univerziteta u Novom Sadu


broj domainstava u Vojvodini
broj goveda u Srbiji
povrina pod penicom u Vojvodini
broj stabala ljive u Srbiji

Uzorci iz navedenih osnovnih skuova:


-

5 % svih studenata Univerziteta u Novom Sadu


500 domainstava sa teritorije Vojvodine
2 % ukupnog broja goveda u Srbiji
povrina pod penicom na kojoj je ostvaren prinos vei od 4 t/ha
broj stabala ljive sa prinosom od 20 kg / stablu

Jedinice (elementi) statistikog skupa su pojedinani sluajevi iz kojih se statistiki skup sastoji.
Jedinice statistikog skupa moraju biti istovrsne ali ne i istovetne.
Svrha posmatranja jedinica statistikog skupa je ispitivanje diferenciranosti (razliitosti) njihovih
karakteristika (odlika, osobina) i kvantitativno izraavanje uoenih razliitosti.

Obeleja statistikih jedinica su osobine po kojima


se jedinice nekog skupa razlikuju.
Primer:
Broj goveda u Srbiji osnovni skup
Jedinica osnovnog skupa svako grlo
Obeleje jedinica rasa, teina, starost grla, ...

Parametar specifino obeleje osnovnog


skupa (populacije).
Parametar uzorka specifino obeleje uzorka.
Obeleja jedinica statistikog skupa dele se na
numerika i atributivna.
Numerika obeleja - osobine koje se uoavaju, mogu
se meriti i brojano iskazati.
Atributivna obeleja - osobine koje se uoavaju, ne
mogu se meriti ve se opisno iskazuju.
Primer:
Jabuke
Numeriko obeleje prinos, duina vegetacije, visina
stabla, ..
Atributivno obeleje boja ploda, oblik ploda, oblik
krune, ...

Numerika obeleja delimo na:


- prekidna (diskretna, diskontinuirana)
- neprekidna (kontinuirana)
Prekidna obeleja- su numerika obeleja koja uzimaju samo
odreene vrednosti sa brojne prave i rezultat su prebrojavanja.
Neprekidna obeleja su numerika obeleja koja mogu uzeti
bilo koju vrednost sa brojne prave i rezultat su merenja.

Primer:
Prekidna obeleja broj ljudi, broj stabala voa, broj
grla stoke, broj automobila, ...
Neprekidna obeleja visina, teina, prinos, prirast,
utroak ubriva, ....

Statistike serije
Statisiki podaci su po pravilu mnogobrojni pa nije
mogue direktno donositi zakljuke o obelejima koja se
analiziraju.
Podaci zapisani redosledom kojim se prikupljaju pre nego
to se urede po veliini ili grupiu nazivaju se negrupisani
podaci.
Iz tog razloga se u prvom koraku statistike analize
pristupa ureivanju podataka, a svrha ureivanja je da
omogui uoavanje osnovnih karakteristika analizirane
pojave.
Ureivanjem statistikih podataka nastaju statistiki
nizovi, odnosno statistike serije. Skupovi podataka
sreuju se i prikazuju u vidu tabela i grafikona.

Prvu fazu statistikog posmatranja (analize) predstavlja prikupljanje podataka.


Statistiko posmatranje moe biti potpuno i delimino.
Potpuno posmatranje je kada se obuhvate sve jedinice u masi, a tu spadaju popisni i izvetajni metod posmatranja.
Razlika izmeu popisnog i izvetajnog posmatranja je u vremenskom odreivanju statistike mase.
Kod popisnog metoda utvruje se stanje pojave u jednom odreenom momentu koji se zove kritian momenat.

Primer: popisi stanovnitva, popis stoke,


popis industrijskih preduzea, popis zaliha
robe, ...

Izvetajni metod (tekue posmatranje) predstavlja stalno registrovanje i evidenciju dogaaja.


esto je to zakonska obaveza za odgovorna lica, a oni podatke u formi izvetaja prosleuju statistikim organima.
Statistiki zavodi sreuju dobijene podatke najee po vremenskim intervalima, a rezultat su periodini izvetaji.
Na ovaj nain promene se posmatraju kontinuirano.

Primer:
Izvetajnimetod evidencija o broju roenih,
proizvodnja kukuruza, promet mineralnih ubriva,
izvoz mesa, .....

Do podataka za analizu moemo doi i izvoenjem


eksperimenata evidentirajui njihove rezultate.
Deliminim, nepotpunim posmatranjem ne ispituju se
sve jedinice u masi, ve se na osnovu odreenog broja
izabranih jedinica donosi zakljuak o karakteristikama
cele mase.
Radi bolje preglednosti, pogotovo ako je njihov broj veliki,
podaci se grupiu u klase ili grupe i odreuje se broj podataka u
svakoj klasi odnosno grupi.
Prilikom grupisanja podataka osnovni problem je utvrivanje
kriterijuma na osnovu koga e svi podaci biti svrstani u
jednorodne grupe, koje e biti osnova dalje statistike analize. Na
ovaj nain se dobijaju razliite vrste statistikih serija.

Grupisanje podataka moe biti:


geografsko, vremensko, atributivno,
numeriko.
Geografsko grupisanje moe se izvesti na osnovu
administrativno-teritorijalne podele zemlje ili prema
nekom drugom geografskom kriterijumu ( na primer,
planinski i ravniarski krajevi).
Ovakve serije nazivaju se geografske serije podataka.
Vremensko grupisanje moe biti intervalno i
momentno. Intervalnim grupisanjem pojava se
neprekidno prati i registruje.
Momentnim grupisanjem dobijaju se podaci koji su
rezultat posmatranja pojave u odreenom momentu
vremena. Na ovaj nain se dobijaju vremenske serije
podataka.

Grupisanjem sakupljenih podataka po


atributivnim obelejima dobijaju se atri
butivne serije podataka.
Grupisanjem podataka po numerikom
obeleju nastaju numerike serije
podataka.
Rezime
Kada statistike jedinice registrujemo, prebrojimo ili izmerimo,
dobiemo brojeve koji se zovu statistiki podaci. Kada se
statistiki podaci urede po nekom kriterijumu dobijaju se
statistike serije.
Prema kriterijumu za grupisanje statistike serije delimo na:
Atributivne
Numerike
Geografske
Vremenske

UREIVANJE PODATAKA
Numerika statistika serija je niz podataka o obeleju koje se
meri i iskazuje brojevima.
Podaci zapisani redosledom kojim se prikupljaju pre nego to
se urede po veliini ili grupiu nazivaju se negrupisani podaci.
Radi bolje preglednosti, pogotovo ako je njihov broj veliki,
podaci se grupiu u klase ili grupe i odreuje se broj podataka
u svakoj klasi odnosno grupi. Grupisani numeriki podaci
nazivaju se distribucije frekvencija.
Distribucija frekvencija predstavlja tabelarno prikazivanje
podataka, gde podatke grupiemo u dve kolone tako da su u
prvoj koloni navedene uoene vrednosti obeleja, a u drugoj
koloni broj jedinica navedene vrednosti obeleja.

Distribucija frekvencija za numerike podatke sadri dva niza podataka:


vrednosti obeleja, prikazane grupnim intervalima ili pojedinanim
vrednostima i njima odgovarajui broj jedinica posmatranja.
Na osnovu toga kako je data vrednost obeleja razlikujemo dve vrste
distribucije frekvencija:
1. neintervalne kod kojih je vrednost obeleja tano navedena pojedinana
vrednost
2. intervalne kod kojih je vrednost obeleja interval koji sadri dve ili vie
pojedinanih vrednosti

Broj podataka svake navedene vrednosti obeleja ili grupe (intervala) naziva se apsolutna
frekvencija ( fi ).
Apsolutna frekvencija pokazuje koliko jedinica posmatranog skupa ima odreeni modalitet
vrednosti obeleja.
Na ovaj nain se dobija distribucija ili raspodela frekvencija.
Na osnovu apsolutne frekvencije mogu se izraunati relativne frekvencije ( pi ) i kumulativne
frekvencije (Fi ).

Relativna frekvencija (struktura) se


dobija kao kolinik apsolutne frekvencije
svake vrednosti obeleja i ukupnog
broja jedinica posmatranja.

fi
pi
N

i = 1,2, ......,k.

Na osnovu izraunatih relativnih frekvencija moe se


iskazati uee pojedinih vrednosti obeleja u ukupnom
broju jedinica posmatranja.

Uee = pi 100 (%)

Za odreene ciljeve analize potrebno je numerike serije


podataka kumuliratitako da se dobije numerika kumulativna
serija, odnosno kumulativna frekvencija.
Kumulativna frekvencija odreene vrednosti obeleja dobija se
sabiranjem apsolutnih frekvencija svih prethodnih obeleja i
apsolutne frekvencije tog obeleja.

Fi f j
j 1

i = 1,2, ......,k.

U zavisnosti od toga dali sabiranje (zbrajanje) apsolutnih


frekvencija poinjemo od prve ili od poslednje vrednosti
obeleja razlikuju se kumulacija ispod i kumulacija iznad.

Pomou kumulativnih frekvencija lake se


uoava koliki je ukupan broj jedinica
posmatranja ispod ili iznad odreene
vrednosti obeleja.
Mogu se utvrditi i kumulativne relativne
frekvencije na osnovu izraza:
i

Fi p j
r

j 1

i = 1,2, ......,k.

Primeri:
Broj odvojenih parcela zemljita kod 30 posmatranih
individualnih gazdinstava :

3 2 4 5 3 1 3 2 6
3
2 3 7 4 3 2 5 1
1 3
Xi broj dvojenih parcel 3 2 1 3 4 5 3 1
N broj individualnih
2 6
Broj odvojenih parcela:

gzdinstv

Sistematizovana serija podataka:

1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3
3 3 3 3 4 4 4 5 5 5 6 6 7

Neintervalna distribucija
frekvencija

Intervalna distribucija
frekvencija

Kada obeleje ima veliki broj razliitih


vrednosti one se grupiu u unapred
odreene intervale.
Broj i veliina (irina) intervala zavise od
broja podataka i od prirode samog obeleja.
Broj grupnih intervala (k) moe se izraunati
na osnovu izraza:

k = 1+ 3,322 N

Na osnovu broja intervala rauna se irina


intervala ( i ):

max min
i
k

Xmax i Xmin su najvea i najmanja vrednost obeleja


u seriji.

Statistiki podaci se prikazuju pomou tabela i


grafikona.Za sastavljanje tabela ne postoje
strogo utvrana pravila.
Neophodni elementi tabele su:
-naslov i podnaslovi
-izvor podataka
-prostor za sve rubrike
-dopunska objanjenja pojedinih podataka
Statistike tabele se dele na proste, sloene i
kombinovane.
Prosta tabela sadri samo jednu statistiku seriju.
Sloena tabela se sastoji iz vie istovrsnih serija za vie
perioda.
Kombinovana tabela prua podatke za dva ili vie
obeleja.

Grafiki nain prikazivanja podataka omoguava bolje uoavanje


bitnih karakteristika neke serije podataka.
Grafikoni mogu biti razliitog oblika zavisno od prirode odataka i
cilja analize.
Nedostatak grafikog prikazivanja podataka je to su manje precizni
od tabela i esto su neprikladni za prikazivanje dugih serija.

Grafiki metod daje bolji uvid u raspored podataka.


Tabelarni pristup je precizniji i objektivniji.
Kako se ovi pristupi meusobno dopunjuju,
preporuljivo je u prikazivanju podataka koristiti
obe metode.

Sreivanje i grafiko prikazivanje


kvalitativnih podataka
Distribucija (raspodela) frekvencija kvalitativnih
podataka pokazuje kako su jedinice posmatranja
rasporeene po razliitim kategorijama.
Ova distribucija sadri dva niza informacija:
kategorije (modalitete) obeleja i odgovarajui
broj jedinica posmatranja koji pripada svakoj
kategoriji.
Skupovi kvalitativnih podataka sreuju se i
prikazuju u vidu tabela i grafikona.

Primer: Anketom 100 studenata jednog fakulteta,


na pitanje gde ele da se zaposle po zavretku
studija, dobijeni su sledei odgovori:
- 44 je izjavilo da eli da radi u privatnim firmama,
- 16 je izjavilo da eli da radi u dravnim
institucijama, - 23 da radi u dravnim preduzeima,
- 17 ih je nameravalo da zapone sopstveni biznis.
Dobijene podatke srediti u vidu tabele, utvrditi
relativnu uestalost posmatranih kategorija i
kumulativne vrednosti apsolutnih i relativnih
frekvencija.

Reenje:
Najpre se definiu obeleje posmatranja (Xi ) i skup posmatranja (N).
Obeleje posmatranja vrsta zaposlenja
Skup posmatranja broj studenata

Vrsta
zaposlenja
Xi

Broj
studenata
fi

Relativna
frekvencija
pi

Uee
%

Privatne firme

44

44/100 = 0,44

44

44

0,44

Dravne institucije

16

16/100 = 0,16

16

44+16=60

1,44+0,16=0,60

Dravna preduzea

23

23/100 = 0,23

23

60+23=83

0,60+0,23=0,83

Sopstveni biznis

17

17/100 = 0,17

17

83+17=100

0,83+0,17=1,00

Ukupno

100

1,00

100

Kumulativne
frekvencije
Fi

Kumulativne
relativne
frekvencije
Fr i

Na osnovu grafikog prikaza se mogu videti


glavne karakteristike nekog skupa podataka.
Za grafiki prikaz kvalitativnih podataka
najee se koriste stubiasti ili tapiasti
dijagram (histogram pravougaonici) i
strukturni krug ili kruni dijagram (pita).
Stubiasti dijagram je grafikon koji se
sastoji od stubia ija visina predstavlja
frekvenciju posmatranih kategorija.
Kruni dijagram je krug podeljen na delove,
od kojih svaki deo predstavlja relativnu
frekvenciju ili uee odgovarajue
kategorije u posmatranom skupu.

Stubiasti
dijagram
Broj studenata
120

100

80

60
Broj studenata fi
40

20

Broj studenata
100
90
80
70
60
50
40
30
20
10
0

Broj studenata fi

Broj studenata
100
80
60
40
20
0

Broj studenata
100
90
80
70
60
50
40
30
20
10
0

Broj studenata fi

Broj studenata fi

Kruni dijagram

17%
44%

23%

Privatne firme
Dravne institucije

16%

Dravna preduzea
Sopstveni biznis

17%

44%

23%

Privatne firme
Dravne institucije
Dravna preduzea

16%

Sopstveni biznis

Sopstveni biznis ; 17

Privatne firme ; 44
Dravna preduzea; 23
Sopstveni biznis ; 17
Dravne institucije ; 16
Privatne firme ; 44
Dravna preduzea; 23

Dravne institucije ; 16

Sreivanje i grafiko prikazivanje


numerikih (kvantitativnih)
podataka
Distribucija frekvencija za numerike podatke sadri dva niza
podataka: vrednosti obeleja, prikazane grupnim intervalima ili
pojedinanim vrednostima i njima odgovarajui broj jedinica
posmatranja.
Za grafiko prikazivanje numerikih podataka najee se koriste
poligonalna linija (poligon) i stubiasti dijagram (histogram).
Poligon je linija koja spaja take ije su koordinate vrednosti
obeleja i odgovarajue frekvencije.
Histogram ine provougaonici ija je osnovica jednaka veliini
grupnog intervala, a visinu odreuje vrednost frekvencije.
Na X osu nadnose se vrednosti obeleja, a na Y osu vrednosti
frekvencije.

Prinos kukuruza (t/ha) kod 20 ispitivanih radnih organizacija


je bio:
6,8 4,8 3,1 2,1 7,6 5,8 3,2 5,6 5,6 5,5 4,5 5,7 6,7 5,6 7,8 6,6
4,9 4,6 3,7 3,9

Grupisati datu seriju podataka i grafiki je predstaviti.

Category
2.000000<x<=3.000000
3.000000<x<=4.000000
4.000000<x<=5.000000
5.000000<x<=6.000000
6.000000<x<=7.000000
7.000000<x<=8.000000

Frequency table: prinos (vezba1)


K-S d=.12726, p> .20; Lilliefors p> .20
Count Cumulative
Percent Cumul %
Count
of Valid
of Valid
1
4
4
6
3
2
20

1
5
9
15
18
20

5.00000
5.0000
20.00000 25.0000
20.00000 45.0000
30.00000 75.0000
15.00000 90.0000
10.00000 100.0000

Poligon
7

Povrsina
3

Povrsina

0
2,0-3,0

3,0-4,0

4,0-5,0

5,0-6,0

Prinos

6,0-7,0

7,0-8,0

Histogram
Histogram: prinos
K-S d=.12726, p> .20; Lil iefors p> .20
Expected Normal
7
6

Povrsina

5
4
3
2
1
0
1

5
Prinos

Za negrupisane podatke kao grafiki prikaz


koristimo dijagram stablo-list.
Kod dijagrama stablo-list svaki podatak delimo
na stablo i na list. Prvo se formira stablo u
koloni a zatim se formiranom stablu pridruuju
listovi u redovima.
Primer:

Veliina poseda trideset posmatranih individualnih


gazdinstava (ha) bila je sledea:
2,5 3,0 8,7 4,9 4,3 5,0 5,6 6,7 9,0 3,5 1,5
0,7 6,0 5,9 2,4 4,8 9,2 0,8 1,2 1,8 7,6 6,6 5,6
5,1 4,6 3,0 6,4 7,5 4,0 3,1

Grafiki predstaviti negrupisane podatke i formiranu


distribuciju frekvencija.

Dijagram stablo-list
0
1
2
3
4
5
6
7
8
9

7
2
4
0
0
0
0
5
7
0

8
5
5
0
3
1
4
6
9

8
1
6
6
6

5
8
6
7

9
6

Histogram
Histogram: velposeda
11
10
9

Broj gazdinstava

8
7
6
5
4
3
2
1
0

6
Velicina poseda

10

Poligon
1 1
1 0
9
8
7
6

B ro j g a zd in sta va

5
4
3
2
0

5
V e lic in a p o se d a

1 0

Grafiko prikazivanje
vremenskih serija

Za grafiko prikazivanje vremenskih serija najee


koristimo linijski dijagram.
Kod linijskog dijagrama na X- osu nadnosi se podela za
vremenski period (godine, meseci, kvartali, dani, i sl.),
a na Y-osu podela (skala) za posmatranu pojavu.

Primer:
Podatke o broju uslovnih grla stoke u periodu od
1999 2004.
godine grafiki predstaviti linijskim dijagramom.

Linijski dijagram

Mesene vremenske serije moemo grafiki prikazati


pomou polarnog dijagrama.
Polarni dijagram formiramo tako to se polazi od
poluprenika kruga koji odgovara prosenoj vrednosti
posmatrane pojave.
Krug se zatim deli na 12 jednakih delova( poluprenika).
Aritmetika podela (skala) koja je prilagoena brojanim
vrednostima posmatrane pojave daje se na jednom
polupreniku.

Pomou formirane skale za svaki mesec se nalazi


taka na dijagramu koja odgovara vrednosti pojave
u posmatranom mesecu.
Spajanjem taaka dobija se izlomljena linija koja
predstavlja polarni dijagram.

Primer: Podatke o potronji mleka u Vojvodini (


000 lit.)
grafiki predstaviti polarnim dijagramom.
Meseci

Potronja
mleka
1

144

157

163

170

164

158

149

147

152

10

167

11

175

12

182

Ukupno

1928

160,6 r

godine

brstjabsr

brstajabcs

1995

2516

1962

1996

3002

2237

1997

3044

2266

1998

3044

2261

1999

3245

2389

2000

3287

2430

2001

3482

2555

2002

3571

2657

2003

3598

2679

2004

3442

2632

Box-wisker

ernofvljeva lica

O k r u z i S r b ije p r e m a r e z u lt a t im a p o ljo p r iv r e d n e p r o iz v o d n je

G ra d B e o g ra d

S ev.B acki

S red .B a n a t.

S ev .B anat.

J uz.B anat

Z ap.B acki

Juz. B acki

S re m s k i

M acva.

K o lu b a r .

P odunavs.

B r a n ic e v .

S u m a d in .

P o m o ra v .

B o rs k i

Z a je c a r .

Z la t ib o r .

M o r a v ic k i

R aski

R a s in s k i

N is a v s k i

T o p lic k i

P ir o t s k i

J a b la n .

P c in js k i

f a c e /w = u k p rp s e n
e a r / le v = p p r p s e n
h a lf f a c e / h = u k p r k u k
u p f a c e /e c c = p p rk u k
lo f a c e / e c c = u k p r s e r e p
n o s e /l = p p rs e re p
m o u th /c e n t = u k p rs u n
m o u th /c u rv = p p rs u n
m o u th /l = u k p rp a s
e y e s / h = p p r in p a s
e y e s /s e p = u k p rk ro m
e y e s / s la n t = p p r in k r o m
e y e s /e c c = u k p rd e t
e y e s /l = p p rd e t
p u p ils / p o s = u k p r lu c
e y e b r o w s / h = p p r lu c
e y e b r o w s / a n g = u k p r liv
e y e b r o w s / l = p p r liv
e a r/r = u k p rp s n j
n o s e /w = p p rp s n j

3D Surface Plot (BRATISL.STA 22v*13c)


z=-1.401e6+0.592*x+0.049*y

4432727.500
4465454.500
4498182.000
4530909.000
4563636.500
4596363.500
4629091.000
4661818.000
4694545.500
4727272.500
abov

KARTOGRAM POVRINE POD CRNIM LUKOM ( ha ), 2004.


0 - 500

500 - 1.000

1.000 - 1.500
1.500 - 2.000

7
8

5
1

11

10

12

13

15

14

18

16

17

20
19

21
22

23
24
25

You might also like