You are on page 1of 123

1.

Uvod u Statistiku
pripremila Tatjana Baji

Sadraj

Znaenje pojma statistike


Populacija i uzorak
Varijable i njihova podela
Savremena statistika
k

Statistika

Statistika (nlat. statisticus od lat. stata


to znai stanje)
Re statistika ima dvojako znaenje:

U svakodnevnom ivotu, re statistika se


odnosi na numerike injenice odnosno
numerike podatke koji su sistematski
prikupljeni.
Drugo znaenje: Statistika se odnosi na
naunu disciplinu.
3

Statistika
kao nauna disciplina

Statistika je nauni metod koji se koristi


za:

prikupljanje podataka
klasifikaciju podataka
prikazivanje podataka
analizu podataka
interpretaciju podataka
i donoenje statistikih zakljuaka.
zakljuaka
4

Predmet statistikog
istraivanja

Predmet statistikog istraivanja su pojave


koje su po svojoj prirodi varijabilne.
Svaka pojava nastaje pod uticajem nekih
faktora a samo njeno ponaanje je
faktora,
uslovljeno prirodom, brojem i nainom
kombinovanja tih faktora.
faktora
Faktori koji deluju na pojavu su
varijabilni pa e i pojava pokazivati,
varijabilni,
pokazivati manje
ili vie izraen varijabilitet.

Procene i prognoze

Na osnovu statistikog posmatranja


pojava i primenom statistikih metoda
zakljuivanja donose se odluke.
Odluke donete na osnovu statistikih
metoda nazivaju se procenama i
prognozama.
prognozama

Osnovni skup ili populacija

Osnovni skup ili populacija (sciljna


populacija)
p
p
j ) sastoji
j se od elemenata ije
j
karakteristike ispitujemo ili na kojima se
pojava
j
statistiki p
posmatra.
izvesna p
Elementi osnovnog skupa moraju imati bar
jednu zajedniku osobinu koja ih svrstava u taj
skup.
Elementi osnovnog skupa mogu biti
osobe, stvari ili predmeti.
7

Uzorak

Formiranje osnovnog skupa zavisi od prirode


pojave koja se posmatra, cilja istraivanja
i raspoloivih mogunosti posmatranja.
posmatranja
Deo osnovnog skupa koji je izabran u svrhe
statistike
t ti tik analize
li naziva
i se uzorkom.
k
B j
Broj
elemenata uzorka zove se obim (veliina)
uzorka.
k
Uzorak koji u najveoj meri odraava
karakteristike osnovnog skupa jeste
8
reprezentativni uzorak.

Varijabla (promenljiva ili


obeleje)

Pojedinani elementi osnovnog skupa ili


uzorka nazivaju se elementima ili
jedinicama posmatranja.
Varijabla (promenljiva ili obeleje) je
osobina (karakteristika) koja se prouava ili
istrauje i koja podrazumeva razliite
vrednosti po jedinicama posmatranja.
Nasuprot varijabli je konstanta ija
vrednost je uvek fiksna.
9

Podela varijabli

Najvanija podela varijabli je na:

kvantitativne (numerike) varijable


kvalitativne (atributivne) ili kategorijske
varijable

Razliite vrednosti koje kvantitativna


varijabla moe uzeti,
uzeti odnosno razliiti
vidovi u kojima se kvalitativna varijabla
moe javiti
javiti, jednim imenom se nazivaju
modalitetima te varijable.

10

Opservacija
Opse acija ili podatak

Vrednost ili forma varijable koja se


odnosi na jednu jedinicu posmatranja
naziva se opservacijom ili
podatkom.
podatkom

11

Kvantitativne varijable

Varijabla koja se moe brojano izraziti


(
)
naziva se kvantitativnom (numerikom)
varijablom.
Podaci prikupljeni o kvantitativnoj varijabli
nazivaju se kvantitativnim podacima.
Kvantitativne varijable mogu biti:

prekidne (diskretne) varijable ili


neprekidne
kid
(kontinuirane)
(k ti i
) varijable.
ij bl
12

Prekidne varijable

Varijabla ije vrednosti moemo da prebrojimo


naziva se prekidno (diskretnom) varijablom.
Prekidna varijabla moe da uzima samo
izolovane vrednosti,
vrednosti najee cele brojeve
brojeve, a
ne i meuvrednosti.
Primeri prekidnih varijabli:

broj uenika u razredu


b dece
broj
d
u vrtiu

broj automobila na parkingu

13

Neprekidna varijabla

Varijabla koja moe uzeti bilo koju numeriku


vrednost u odreenom intervalu ili intervalima
jeste neprekidna (kontinuirana) varijabla.
Vrednosti neprekidnih varijabli se ne mogu
prebrojati.
Primeri neprekidnih varijabli:

vreme trajanja ispita


visina studenata
d
visina beba

14

Kvalitativne (atributivne)
ili kategorijske varijable

Varijabla koja ne moe uzeti numerike


vrednosti, ali se moe klasifikovati u dve ili
vie kategorija jeste kvalitativna
(atributivna) ili kategorijska varijabla.
Podaci prikupljeni o ovakvoj varijabli nazivaju
se kvalitativnim podacima.
podacima
Primer kvalitativnih varijabli: pol, pismenost,
zanimanje marka automobila,
zanimanje,
automobila boja kose i sl.
sl
15

Kategorije kvalitativnih
varijabli

Kategorije (modaliteti) kvalitativnih varijabli


ne odraavaju intezitet posmatrane osobine
ve samo njene razliite pojavne oblike.
Primer kategorija (modaliteta) kvalitativne
varijable pol: muki i enski, predstavljaju
samo razliite vidove javljanja ove varijable.
varijable

16

Vrste varijabli
Varijable
j
Kvantitativne

Prekidna

Kvalitativne
ili
kategorijske

Neprekidna

17

Varijable koja mogu biti i


kvalitativne i kvantitativne

Neke varijable se mogu izraziti i opisno i


numeriki.
Na primer varijabla uspeh studenata se moe
izraziti kao dovoljan,
dovoljan dobar,
dobar vrlo
dobar, izuzetno dobar i odlian, ali moe se
iskazati i brojanim ocenama 6,7,8,9 i 10.
10
Za statistiki obradu, kvantitativne varijable su
pogodnije od kvalitativnih zbog mogunosti
njihove ire matematike obrade.
18

Savremena statistika
Podrazumeva dva aspekta:
1 Teorijsku odnosno matematiku
1.
statistiku koja se bavi razvojem,
izvoenjem i dokazivanjem statistikih
teorema, formula, pravila i zakona.
2. Primenjenu
P i
j
statistiku
t ti tik koja
k j predstavlja
d t lj
primenu statistike teorije u praksi, odnosno
primenu
i
statistikih
t ti tikih tteorema, fformula,
l pravila
il
i zakona u reavanju realnih problema.
19

Statistika teorija

Statistika teorija odnosno


matematika statistika se zasniva na
teoriji verovatnoa.
Verovatnoa nekog dogaaja
predstavlja ansu pojavljivanja tog
dogaaja u uslovima neizvesnosti.
neizvesnosti

20

Primenjena statistika

Primenjena statistika se u najirem smislu


deli na dve oblasti:

Deskriptivnu ili statistiku u uem smislu


Inferencijalnu statistiku (statistiko
zakljuivanje)

Verovatnoa, koja predstavlja ansu


Verovatnoa
javljanja odreenog ishoda, upravo povezuje
ove dve oblasti statistike: deskriptivnu i
inferencijalnu statistiku.
22

Deskriptivna statistika

Deskriptivna statistika se sastoji od


metoda

prikupljanja podataka
sreivanja podataka
prikazivanja podataka i
opisivanja podataka pomou tabela,
tabela
grafikona i sumiranih pokazatelja.

23

Inferencijalna statistika

Inferencija (lat. inferre navoditi) je proces


miljenja kada se prelazi od jedne istine na
drugu istinu koja se smatra istinom zbog svoje
veze sa prvom.
Inferencijalna statistika obuhvata
statistike metode koje primenjujemo da
bismo na osnovu podataka prikupljenih iz
uzorka doli do zakljuka o karakteristikama
osnovnog skupa.
24

Teorija verovatnoa
Matematika statistika
Statistika teorija
P i
Primenjena
j
statistika
t ti tik
Deskriptivna
statistika

Inferencijalna
statistika
25

2
2. Prikupljanje
P ik lj j i sreivanje
i
j
podataka
pripremila Tatjana Baji

PRIKUPLJANJE I
SREIVANJE PODATAKA

Prikupljanje podataka
Serije podataka: strukturne serije i
vremenske serije
Apsolutne frekvencije
Relativne frekvencije
Uee

27

Prikupljanje podataka

Kada se podaci prikupe, informacije dobijene


g elementa populacije
p p
j ili uzorka,,
od svakog
zapisuje se redosledom u kojem pristiu.
Podaci zapisni redosledom kojim se
prikupljaju, pre nego to se urede po veliini
ili grupiu,
grupiu nazivaju se sirovim podacima ili
negrupisanim podacima.
Kao rezultat sreivanja prikupljenih podataka
dobijamo serije podataka.
28

Serija podataka

Serije podataka su nizovi sreenih podataka


koji prikazuju strukturu skupa u odnosu na
posmatranu varijablu ili raspodelu skupa u
prostoru, ili promenu skupa u vremenu.
U zavisnosti od vremena u kojem e biti
prikupljeni,
p
up je , serije
se je podataka
poda a a se mogu
ogu podeliti
pode
na:

strukturne serije i
vremenske serije

29

Strukturne serije podataka

Podaci prikupljeni o razliitim elementima


osnovnog skupa ili uzorka u istom
vremenskom trenutku ili u istom
vremenskom periodu nazivaju se
strukturnim serijama podataka
(podacima preseka ili uporednim podacima).
Primer: grupisani podaci o uspehu
studenata na ispitu iz Informatike u jednom
ispitnom roku
30

Vremenske serije podataka

Vremenske serije sadre podatke o istoj


jedinici osnovnog skupa ili uzorka u
razliitim vremenskim periodima.
Primer: podaci o prosenoj oceni iz
Informatike tokom deset kolskih
godina

31

Apsolutne frekvencije

Struktura jednog skupa (populacije ili uzorka)


prema datoj varijabli pokazuje kako su
modaliteti te varijable rasporeeni u skupu, tj.
koliko jedinica posmatranja otpada na svaki
modalitet varijable.
Broj jedinica koji odgovara jednom modalitetu
(kategoriji ili vrednosti) varijable jeste
frekvencija (apsolutna frekvencija) te
kategorije, odnosno vrednosti.
32

Zbir i raspodela frekvencija

Zbir frekvencija fi svih modaliteta


posmatrane varijable, u oznaci fi ,
jednaka je ukupnom broju jedinica
posmatranja (veliini uzorka odnosno
populacije).
Raspodela frekvencija pokazuje kako
su frekvencije rasporeene po razliitim
modalitetima varijable
varijable.
33

Relativne frekvencije

Odnos frekvencije (fi) izvesne kategorije ili


vrednosti varijable u odnosu na ukupan broj
jedinica tog skupa ( fi) naziva se relativna
frekvencija te kategorije, odnosno vrednosti.
Relativna frekvencija pokazuje koji deo ili
procenat sume frekvencija (ukupnog broja
jedinica posmatranja) pripada odgovarajuem
modalitetu.
modalitetu
34

Znaaj relativnih frekvencija

Relativne frekvencije poveavaju mogunost


analize statistikog skupa prikazanog u seriji
jer, u odnosu na apsolutne frekvencije,
proiruju informacije o strukturi posmatranog
skupa.
Struktura skupa izraena pomou relativnih
frekvencija omoguava poreenje sa
strukturom podskupova ili poreenje sa
strukturom slinih skupova.
35

Uee (procenat)

Relativna frekvencija moe iskljuivo uzeti


vrednost u zatvorenom intervalu [0,1].
Relativna frekvencija izraena u
procentima naziva se uee.
uee
Procentualna raspodela je raspodela
uea svih modaliteta posmatrane
varijable.
36

Primer: Populacija,
varijabla i modaliteti
Oznaimo sa:
S={s
{ 1, s2 s3,,...,, sN} p
populaciju
p
j
X varijabla
{{x1, x2 x3,,...,, xm} skup
p vrednosti ili
kategorija koje moe uzeti varijabla X

} fk je broj elemenata
k {1,2,3,..., m},
populacije S na kojima varijabla X
uzima vrednost ili se pojavljuje u formi
kategorije xk

37

Primer: Apsolutna i
relativna frekvencija

f1 +...+fm=N
broj fk se naziva apsolutna
frekvencija vrednosti ili kategorije xk
broj fk/N se naziva relativna
frekvencija vrednosti ili kategorije xk ,
a broj 100* Nk/N predstavlja broj stotih
delova populacije gde obeleje X uzima
vrednost xk odnosno uee (koje se
izraava u procentima)
38

3 T
3.
Tabelarno
b l
prikazivanje
ik i
j
podataka
pripremila Tatjana Baji

39

Statistika tabela

Statistika tabela je jedan od oblika


prikazivanja statistikih podataka ili serija
podataka u preglednoj i prikladnoj formi
koja olakava da se rezultati statistikog
istraivanja sagledaju to jasnije i
potpunije i olakava korisniku
uporeivanje podataka.
40

Forma statistike tabele


Statistiku tabelu ini odreen broj polja

j se dobijaju
j j u preseku
p
horizontalnih i
koja
vertikalnih linija.
Prve red se naziva zaglavlje, a prva
kolona pretkolona.
Pretkolona i zaglavlje tabele slue za
unoenje modaliteta varijabli i vremenskih
intervala
intervala.
41

I
Izrada
d statistike
t ti tik tabele
t b l

Svaka
S
k statistika
t ti tik ttabela
b l mora imati
i ti svojj naslov,
l
koji se stavlja iznad nje i koji treba kratko ali
d
dovoljno
lj da
d opredeli
d li sadraj
d j tabele.
t b l
Modaliteti, bilo da su u zaglavlju ili pretkoloni,
ne smeju se skraivati.
Tekst ispod
p tabele treba da sadri obavetenje
j
o izvorima podataka, osnovne definicije,
napomene
p
o uporedivosti
p
podataka
p
i druga
g
obavetenja korisna za pravilno razumevanje
42
podataka.

Podela statistikih tabela


prema sadrini

Statistike tabele po sadrini mogu biti


proste, sloene i kombinovane.
Prosta tabela sadri podatke jedne serije
(serije strukture ili vremenske serije)
serije).
Sloena statistika tabela dobija se
spajanjem vie prostih tabela koje pokazuju
razliite podatke, a pri tom su ralanjene
prema istoj varijabli i u meusobnoj su
sadrinskoj vezi.
44

Primer proste statistike


tabele
Tabela 1.1 Rezultati ispita iz Informatike u
jan-feb. roku kolske 2011/12. god.
Ocena
f
f
f/N
%
5
31
0,25
25%
6
33
0 27
0,27
27%
7
37
0,30
30%
8
14
0 11
0,11
11%
9
6
0,05
5%
10
1
0,01
,
1%
Ukupno
N=122
1
100%
Izvor podataka: Kartoni studenata predmetnog nastavnika

45

Primer sloene statistike tabele


Tabela 1.2 Rezultati ispita iz
Informatike i Matematike u junskom
ispitnom roku kolske 2010/11.
2010/11 god.
god
Informatika
Matematika
Ocena
f
%
f
%
5
20
18%
6
26%
6
28
25%
9
39%
7
31
27%
2
9%
8
19
17%
2
9%
9
14
12%
1
4%
10
2
2%
3
13%
Ukupno
114
100%
23
100%
Izvor podataka: Kartoni studenata predmetnog nastavnika

46

Kombinovane statistike
tabele

U kombinovanoj tabeli izlau se


podaci serija dobijenih ukrtanjem dve
ili vie varijabli, ije se oznake unose u
zaglavlje i pretkolonu.
Kombinovane tabele imaju veliki znaaj,
ali treba nastojati da ne bude pretrpana
i komplikovana.
47

Primer kombinovane
statistike tabele
Tabela 1.3 Prolaznost studenata u januarskofebruarskom ispitnom roku kolske 2011/12. godine
Godina
studija
I godina
II godina
III godina
Ukupno

Ukupno
k
Nije izalo
l
prijavilo ispit
na ispit

Izalo
l na
ispit

Poloilo
l l
ispit

1110
1180
1000
3290

100%
100%
100%
100%

44
167
67
278

4%
14%
7%
8%

1066
1013
933
3012

96%
86%
93%
92%

968
970
896
2834

87%
82%
90%
86%

Izvor podataka: Studentska sluba kole

48

Tabele raspodele frekvencija

Raspodele frekvencija varijabli se


prikazuju
p
j pomou
p
tabela koje
j se nazivaju
j
tabelama raspodele frekvencija
j
odnosno tabelama frekvencija.
Razlikujemo tabele frekvencija:

kvalitativnih varijabli
kvantitativnih prekidnih varijabli
kvantitativnih neprekidnih varijabli
50

Tabelarni prikaz kvalitativnih


podataka
d t k

Kvalitativni podaci se iskazuju opisno u formi


kategorija.
kategorija
Klasifikacija kategorija se vre prema
kriterijumu koji najvie odgovora prirodi same
varijable (pol: muki, enski; pismenost:
pismen nepismen; zdravstveno stanje: zdrav,
pismen,
zdrav
bolestan; i sl.) ili ciljevima istraivanja (uenici
po uspehu u koli,
koli kulture po vrstama ili po
podruju, itd.).
51

Tabela frekvencija
kvalitativnih podataka

Tabela raspodele frekvencija za


podatke sadri dva niza
kvalitativne p
informacija:

kategorije posmatrane varijable i


odgovarajui broj jedinica posmatranja koji
pripada
p
p
svakojj kategoriji.
g j

Analogno se formira i tabela raspodele


relativnih frekvencija (tabela
relativnih frekvencija).
52

Primer tabele frekvencija


kvalitativne varijable
Tabela 2.1 Vrsta zaposlenja za
koje e se studenti opredeliti
Varijabla

Kategorija

Vrsta
zaposlenja

Broj
studenata (f)

Privatni vrti

16

Dravni vrti

44

S
Sopstveni
t
i vrti
ti

23

Posao van vrtia

17

UKUPNO

Kolona
frekvencija
Frekvencija

100
53

Tabela relativnih frekvencija


kvalitativne varijable
Tabela 2.2 Raspodela zaposlenih prema nivou
stresa na poslu
Da li je posao
Relativna
Procenat
stresan
uestalost
Veoma
Malo
Nimalo

0,333
33,30%
0,467
46,70%
0,200
20,00%
Ukupno = 1,000 Ukupno = 100%

Napomena: U tabelu relativnih frekvencija mogu se


uneti i same frekvencije.

54

Tabelarno prikazivanje
kvantitativnih podataka

Tabela raspodela frekvencija za


kvantitativne podatke sadri dva niza
informacija:

vrednosti varijable
j
(prikazane izolovanim
(p
numerikim vrednostima ili grupnim intervalima) i
njima odgovarajui broj jedinica posmatranja
(frekvencije).

Kvantitativni p
podaci p
prikazani raspodelom
p
frekvencija nazivaju se grupisani podaci.
55

Problem gradiranja
kvantitativnih podataka

Ako je varijabla prekidna (diskretna)


numerike vrednosti se grupiu po veliini
(od nie vrednosti ka vioj).
Problem gradiranja numerikih podataka se
pojavljuje kod neprekidnih varijabli i kod
prekidnih sa velikim brojem modaliteta.
modaliteta

56

Primer

Populacija: svi studenti prve godine Visokih


j za vaspitae
p
kola strukovnih studija
generacija 2011/12. u Srbiji
Prekidna varijabla X: ocena iz Informatike
Uzorak: studenti prve godine Visoke kole
strukovnih studija za vaspitae-generacija
vaspitae generacija
2011/12. u apcu
{5 6 7 8 9 10} jje skup
{5,6,7,8,9,10}
k vrednosti
d
ti koje
k j varijabla
ij bl
57
X moe uzeti u realizovanom uzorku

Primer tabele frekvencija


prekidne varijable
Tabela 3.1 Rezultati ispita iz Informatike u
jan-feb. roku kolske 2011/12. god.
Ocena
f
%
5
31
25%
6
33
27%
7
37
30%
8
14
11%
9
6
5%
10
1
1%
Ukupno
122
100%
Izvor podataka: Karton studenata predmetnog nastavnika

58

Gradiranje numerikih
podataka neprekidne varijable

IInterval
t
l individualnih
i di id l ih vrednosti
d
ti jedne
j d
kvantitativne varijable u datom uzorku ili
populaciji
l iji moe
biti vei
i ili manji
ji (npr.
(
visina
i i
studenata se kree od 150 do 200cm, njihova
t l
telesna
masa od
d 50 do
d 100 kg,
k itd.).
itd )
Da bismo dobili strukturu studenata npr. po
visini ili teini
potrebno je izvriti
gradiranje
odgovarajuih vrednosti varijable, odnosno
odrediti broj grupnih intervala, pri emu

59
grupni intervali ne smeju da se poklapaju.

Grupni intervali

Grupni interval ukljuuje

sve vrednosti
neprekidne varijable

vee ili jednake od donje granice i strogo manje


od gornje granice tog intervala ili
strogo vee od donje granice i manje ili jednake
od gornje granice tog intervala.

Pri formiranju grupnih intervala preporuljivo je


poeti sa vrednou manjom od najmanje u
seriji (xmin), a zavriti
sa veom

od najvee

60
vrednosti u seriji (xmax).

Problem odreivanja broja


grupnih intervala

Postavlja se pitanje broja grupnih intervala,


odnosno njihove irine.
Pravilo je da grupni intervali budu jednaki jer
su samo tada uporedivi.
uporedivi
Vei broj grupnih intervala daje detaljniju
informaciju o sastavu skupa
skupa, dok manji broj
bolje otkriva pravilnosti o ponaanju skupa.
Treba
b zadovoljiti
d
l zahtev
h
informacije
f
i zahtev
h
61
preglednosti.

Broj grupnih intervala

Sturges-ovo pravilo je pravilo pomou


kog
se odreuje broj grupnih intervala:
K=1+3.3logN,
gde je N je ukupan broj podataka.
irina grupnog intervala (u oznaci i) se
odreuje zaokruivanjem aproksimativne irine
grupnog intervala: (xmax xmin )/K
gde je xmax najvea vrednost,
vrednost a xmin je
najmanja koju uzima neprekidna varijabla.
62

irina,, sredina i frekvencija


j
grupnog intervala

irinu (veliina) grupnog intervala je jednaka


gornje
j i donje
j granice
g
jjednog
g
razlici izmeu g
grupnog intervala.
Sredina grupnog intervala se dobija kada
se zbir donje i gornje granice jednog grupnog
intervala podeli sa 2.
2
Frekvencija grupnog intervala predstavlja
broj jedinica posmatranja koje pripadaju tom
grupnom intervalu.
63

Primer problema irine


grupnih
ih intervala
i t
l

Prema evidenciji predmetnog nastavnika iz


Informatike, na kolokvijumu odranom
3.12.2011., prikupljeni su podaci o duini
trajanja reavanja testa 50 studenata, izraenih
u minutima.
Duina
u a trajanja
aja ja testa
es a se kretala
e a a u rasponu
aspo u od
7,5 min do 32,9 min, to znai da je minimalna
vrednost u dobijenom
j
nizu negrupisanih
g p
podataka 7,5, a maksimalna 32,9.
64

Jedno reenje problema irine


grupnih intervala

Ukoliko elimo da grupiemo ove podatke u 6


grupnih
g
p
intervala jednake
j
irine,, tada je
j
aproksimativna irina grupnog intervala
(32 9-7
(32,9
7,5)/6=4,23
5)/6=4 23
i njenim zaokruivanjem na neki pogodniji broj,
za irinu grupnog intervala moemo uzeti 5.
5
Za donju granicu prvog grupnog intervala
moemo

uzeti
ti 7
7,5
5 ili neku
k prikladnu
ikl d manju
j
65
vrednost, recimo 5.

Tabela raspodele frekvencija i


procentualne raspodele
Tabela 3.2 Duina trajanja reavanja testa
Vreme ((u min)) Brojj studenata (f)
( ) Procenat ((%))
manje od 5
0
0
5-10
2
4%
10-15
3
6%
15-20
15
30%
20 2
20-25
18
8
36%
25-30
8
16%
30 35
30-35
4
8%
ukupno
50
100%

66

Znaenje zapisa grupnih


intervala iz tabele 3.2
Vreme (u min)
opisno
intervalno
manje od 5
<5
5-10
5
10
[5,10)
10-15
[10,15)
15-20
[15,20)
20-25
[20,25)
25-30
[25,30)
30 35
30-35
[30 35)
[30,35)
ukupno

Brojj
B
studenata
f
0
2
3
15
18
8
4
50

Procenat
%
0
4%
6%
30%
36%
16%
8%
100%

67

Drugi nain grupisanja


podataka
d t k neprekidne
kid
varijable
ij bl
Vreme (u min)
opisno
inte alno
intervalno
do 5
5
5-10
5
10
(5 10]
(5,10]
10-15
(10,15]
15-20
((15,20]
, ]
20-25
(20,25]
25-30
(25,30]
30-35
(30,35]
ukupno

Broj
studenata
f
0
2
3
16
17
8
4
50

Procenat
%
0
4%
6%
32%
34%
16%
8%
100%

68

4 Grafiko
4.
G fik prikazivanje
ik i
j
podataka
pripremila Tatjana Baji

73

Grafiko prikazivanje
podataka

Na osnovu grafikog prikaza jasno moemo


videti karakteristike nekog skupa podataka.
Grafiki prikaz podataka se prvenstveno
zasniva na odgovarajuem tabelarnom
prikazu podataka.
Razlikujemo:

Grafiko prikazivanje kvalitativnih podataka


G f k prikazivanje
Grafiko
k
kkvantitativnih
h podataka
d k
74

Grafiko prikazivanje
kvalitativnih podataka

Postoje dve vrste dijagrama koje se


najee koriste za grafiki prikaz
kvalitativnih podataka:

tapiasti dijagrami i
strukturni krug (pita)

75

tapiasti dijagram
tapiasti

Grafikon koji se sastoji od stubia ija


visina predstavlja frekvenciju (relativnu
frekvenciju ili uee) razliitih kategorija
naziva se tapiasti dijagram.
Kod tapiastog dijagrama na x-osu
(apcisu) se nanose razliite kategorije
kvalitativne varijable, a na y-osu
(ordinatu) nanose se frekvencije
(relativne frekvencije ili uea).
76

Primer tapiastog dijagrama za


kvalitativne podatke iz Tabele 2.2
22

77

Strukturni krug (pita)

Krug podeljen na delove


delove, od kojih svaki
deo srazmerno predstavlja relativnu
frekvenciju ili uee (procenat)
odgovarajue kategorije u osnovnom
skupu ili uzorku naziva se strukturnim
krugom.
C strukturni
Ceo
t kt i krug
k
predstavlja
d t lj veliinu
lii
uzorka ili osnovnog skupa.
Strukturni krug se moe koristiti i za
prikazivanje frekvencija

78

Primer strukturnog kruga za


kvalitativne
k lit ti
podatke
d tk iz
i Tabele
T b l 2.2
22

79

Grafiko prikazivanje
kvantitativnih podataka

Razlikujemo:

Grafiko prikazivanje kvantitativnih podataka


prekidne varijable
Grafiko prikazivanje kvantitativnih podataka
neprekidne varijable

80

Grafiko prikazivanje
podataka
d t k prekidne
kid
varijable
ij bl

Kvantitativni podaci prekidne varijable se,


kao i kvalitativni podaci
podaci, najee grafiki
prikazuju pomou:

tapiastog dijagrama i
strukturnog kruga (pite)

Kod tapiastog dijagrama prekidne varijable


na x-osu (apcisu) se nanose razliite vrednosti
varijable a na y-osu
varijable,
y osu (ordinatu) nanose se
frekvencije (relativne frekvencije ili uea). 81

Primer tapiastog dijagrama za podatke


prekidne
kid
varijable
ij bl iz
i Tabele
T b l 3.1
31

82

Primer strukturnog
strukturnog krug
kruga
a za podatke
prekidne
kid
varijable
ij bl iz
i Tabele
T b l 3.1
31

Ocene

83

Grafiko prikazivanje podataka


neprekidne
kid
varijable
ij bl

Kvantitativni podaci neprekidne varijable


se najee grafiki prikazuju pomou:

histograma
poligona i
krive raspodele frekvencija

84

Histogram

Histogram je dijagram koji se sastoji od niza


spojenih pravougaonika, ije su osnovice
(prikazane na x-osi) jednake irini grupnih
intervala, a visine (prikazane na yy-osi)
osi)
odgovaraju frekvencijama, relativnim
frekvencijama ili ueima i u zavisnosti od
toga naziva se histogram frekvencija,
histogram relativnih frekvencija ili
histogram uea.

85

Primer histograma frekvencija


za
a podatke iz
i Tabele 3.2
32

Broj stud
denata

Duina trajanja reavanja testa


20
18
16
14
12
10
8
6
4
2
0
5-10
5
10

10-15
10
15

15-20
15
20

20-25
20
25

25-30
25
30

30-35
30
35

Vremenski intervali izraeni u minutima


87

Poligon

Poligon je dijagram koji se dobija spajanjem


j su koordinate sredine g
grupnih
p
taaka ije
intervala i odgovarajue frekvencije
p j j
sredina vrhova
intervala,, odnosno spajanjem
susednih pravougaonika histograma
j
frekvencija.
Sredina grupnog intervala se dobija kada
se zbir donje i gornje granice jednog grupnog
intervala podeli sa 2.
93

Primer poligona frekvencija


za podatke iz Tabele 3.2

Broj stud
denata

Duina trajanja izrade testa


20
18
16
14
12
10
8
6
4
2
0
7,5

12,5

17,5

22,5

27,5

32,5

Sredine grupnih vremenskih intervala izraenih u minutima


94

Kriva frekvencija

Kada raspolaemo dugakom serijom


podataka, sa poveanjem broja grupnih
intervala (i smanjenjem njihove irine),
poligon frekvencija na kraju postaje
glatka, kontinuirana kriva.
Dobijena kriva linija naziva se krivom
raspodele frekvencija ili jednostavno
krivom frekvencija.
frekvencija
95

Primer krive frekvencija

96

5 Numerike
5.
deskriptivne mere
5 1 Mere centralne tendencije
5.1
pripremila Tatjana Baji

Uvod

Statistike serije strukture i vremenske


serije, date u vidu tabela ili grafikih prikaza,
slue statistikoj analizi kao polazna osnova za
istraivanje pravilnosti i zakonitosti posmatranih
pojava.
Prisustvo
sus o mnotva
o a numerikih
u e
poda
podataka,
a a, bez
be
obzira na njihovu ureenost, priinjava tekoe
up
pogledu
g
dobijanja
j j jedinstvene,
j
, jasne,
j
,
koncizne i celovite predstave o pojavi koju
110
posmatramo.

Pokazatelji raspodele
frekvencija

Raspodele frekvencija pruaju iroku


mogunost za otkrivanje karakteristika
skupova, analizu njihove strukture i unutranjih
odnosa.
odnosa
Raspodele frekvencija nastojimo da numeriki
opiemo sa jednom ili veim
eim brojem
b ojem
karakteristinih vrednosti koje bi pruile
to vie informacija o skupu i reprezentovale
skup.
111

Numerike deskriptivne
p
mere

Pokazatelji raspodele frekvencija izraeni

numerikim karakteristinim vrednostima


nazivaju se numerike
deskriptivne mere ili
(samo) deskriptivne mere.
U zavisnosti da li se analizira raspodela
j populacije
p p
j ili raspodela
p
frekvencija
frekvencija uzorka, pokazatelji raspodele
frekvencija reprezentuju populaciju ili uzorak,
odnosno pripisuju se celom skupu (populaciji)
112
ili uzorku.

Parametri skupa i
statistike uzorka

Deskriptivne mere koje se odnose na sve


jjedinice osnovnog
g skupa
p (p
(populacije)
p
j )
nazivaju se parametrima skupa odnosno
p
parametrima.
Deskriptivne mere koje se odnose na
uzorak nazivaju se statistike uzorka
odnosno statistike.
113

Podela numerikih
deskriptivnih mera

Numerike deskriptivne mere svrstavamo


u sledee grupe:

mere centralne tendencije raspodele


frekvencija (srednje vrednosti)
mere disperzije (rasprenosti)
mere oblika raspodele
pozicione mere

114

Srednja vrednost kao mera


centralne tendencije

Raspodele
R
d l ffrekvencija
k
ij prvenstveno
t
otkrivaju
tk i j
tendenciju grupisanja pojedinih vrednosti
varijable
ij bl oko
k vrednosti
d
ti karakteristine
k kt i ti za
posmatrani skup.
Varijabilnost vrednosti varijable namee
potrebu za merenjem centralne vrednosti
varijable.
Srednja
j vrednost,, kao p
pokazateljj centralne
tendencije vrednosti varijable, predstavlja
115
meru centralne tendencije.

Podela srednjih vrednosti

U zavisnosti
i
ti od
d posmatrane
t
pojave
j
i od
d naina
i
grupisanja podataka u raspodeli frekvencija,
razmatramo
t
ttrii razliite
liit mere centralne
t l
tendencije raspodele odnosno srednje
vrednosti
d
ti :

aritmetiku sredinu (prosek)


medijana i
modus

Aritmetika sredina se izraunava, a medijana i


moda se odreuju na osnovu poloaja u seriji.116

Aritmetika sredina skupa


negrupisanih podataka

Aritmetika sredina skupa (ili prosek) se


dobija kada se zbir svih vrednosti varijable
podeli njihovim brojem:

gde su x1,..., xN realizovane vrednosti


posmatrane varijable
p
j
nad skupom.
p
je realizovan parametar skupa.

119

Aritmetika sredina uzorka


negrupisanih podataka

Aritmetika sredina negrupisanih


podataka (svaki podatak se javlja samo
jedanput) uzorka veliine n:

gde su x1,..., xn realizovane vrednosti


posmatrane varijable nad uzorkom.
j realizovana
je
li
statistika
t ti tik uzorka.
k
120

Ponderisana aritmetika
sredina

U praksi se ee susreemo sa
grupisanim podacima u vidu raspodele
frekvencija.
Aritmetika
t et a sredina
s ed a g
grupisanih
up sa
podataka
podata a
naziva se ponderisana aritmetika
sredina
s
ed a je
jer se ssve
e vrednosti
ed os varijable
a jab e ((xi)
u skupu ili uzorku uzimaju onoliko puta
koliko se one jjavljaju,
j j , tj.
j ponderiu
p
se
njihovim frekvencijama (fi).

121

Izraunavanje ponderisane
aritmetike
sredine

Ponderisana aritmetika sredina skupa je:

Ponderisana
P
d i
aritmetika
it
tik sredina
di
uzorka
k
obima n je:

122

P d i grupisani
Podaci
i
i u intervale
i t
l

Ako je raspored frekvencija dat u vidu


k grupnih intervala,
intervala aritmetika
sredina skupa, kao i uzorka,
izraunava se kao ponderisana
aritmetika sredina sredinjih
vrednosti grupnih intervala.
intervala

123

Aritmetika sredina podataka


g pisanih u inte
grupisanih
intervale
ale

Aritmetika sredina skupa je:

Aritmetika
i
ik sredina
di
uzorka
k obima
b
n je:

gde je x sredina,
sredina a f frekvencija intervala
intervala.
124

Primer
Tabela 5
5.1
1 Vreme koje studenti svakodnevno
provedu u putovanju
Vreme (u min.) Broj studenata (f)

Sredina intervala (x/)

fx/

manje od 0

0-10

20

10-20

15

135

20-30

25

150

30-40

35

140

40-50

45

90

Ukupno

1
=
N

25
k

i =1

535
f i xi =
= 21,40 min
25

535

125

Vana osobina aritmetike sredine

Vana osobina aritmetike sredine je da


izravnava apsolutne varijacije vrednosti
varijable.
Aritmetika sredina uspeno reprezentuje
one raspodele kod kojih najveu
frekvenciju imaju one vrednosti varijable
koje su najblie aritmetikoj sredini.
128

Nedostatak aritmetike
sredine

Ekstremne
Ek
t
vrednosti
d
ti su one vrednosti
d
ti
varijable, koje ekstremno odstupaju od ostalih
vrednosti.
d
ti
Ako u skupu ili uzorku ima ekstremnih
vrednosti, aritmetika sredina moe dati
iskrivljenu sliku, posebno ako raspodela
frekvencija nije simetrina.

Za serije
j ije
j vrednosti varijable
j
znatno
odstupaju od aritmetike sredine kaemo da
132
imaju veliku rasprenost ili disperziju.

Medijana

Medijana je ona vrednost varijable koja se


nalazi u sredini serije podataka koji su
rangirani u rastuem poretku (od najmanje
vrednosti ka najveoj) ili u opadajuem
poretku (od najvee vrednosti ka najmanjoj).
Medijana
ed ja a de
deli su
sumu
u svih
s
frekvencija
e e c ja na
ad
dva
a
jednaka dela, tako da jedna polovina
obuhvaenih sluajeva
j
ima manju,
j , a druga
g
polovina veu vrednost od medijane.
133

Izraunavanje medijane
1.

2
2.

Podaci se rangiraju od najnie vrednosti ka


j
j i na tajj nain se obrazuje
j serija
j
najvioj
rangiranih podataka: x1 < x2 <...< xN.
Ako je broj podataka u seriji,
seriji N,
N

neparan, onda je medijana jednaka vrednosti


sredinjeg lana rangiranih podataka;
paran broj, onda se ona izraunava kao
aritmetika sredina dva sredinja podatka u seriji.
134

Odreivanje medijane kada je


broj podataka u seriji neparan

Ako je N neparan broj, tada srednji lan


g niza vrednosti varijable
j
deli ovajj niz
ureenog
na dva jednaka dela.
Primer: U nizu podataka o starosti nastavnika
u jednoj koli koji su poreani po veliini:
25 26,
25,
26 36,
36 48,
48 51
medijana e biti 36 jer se ta vrednost nalazi u
sredini
di i ove serije.
ij
135

Odreivanje medijane kada je


broj podataka u seriji paran
Ako je broj lanova serije rangiranih
podataka, N, paran, u njemu postoje dva
srednja lana pa se za medijanu uzima
njihova aritmetika sredina.
Primer: Za niz rangiranih podataka:
18 19,
18,
19 20,
20 22,
22 24,
24 26
medijana e biti aritmetika sredina vrednosti
20 i 22,
22 odnosno
d
2
21.

136

Znaajne osobine medijane

Medijana odreuje centar histograma, pri


emu se polovina vrednosti nalazi levo od
medijane, a druga polovina desno od nje.
Na medijanu ne utiu ekstremne vrednosti
vrednosti,
te se kod serije podataka koja sadri
ekstremne vrednosti
vrednosti, medijana pokazuje kao
bolja mera centralne tendencije od
aritmetike sredine.
sredine
141

Modus

Modus potie od francuske rei mode koja


oznaava predmet koji je najpopularniji ili
najei.
Modus (moda,
(moda mod ili modalna
vrednost) je vrednost varijable koja u
posmatranoj seriji ima najveu frekvenciju.
frekvenciju
Odatle, modus predstavlja najzastupljeniju
vrednost
d
t u seriji
iji podataka.
d t k
142

Nedostatak modusa kao


mere centralne tendencije

Mogue je da jedna serija podataka ili


nema modusa ili ima vie od jednog
modusa, dok ta ista serija e imati samo
jednu aritmetiku sredinu i samo jednu
medijanu.
Na primer
primer, serija podataka u kojoj se
svaka vrednost varijable pojavljuje
samo jedanput
jedanput, nema modusa.
modusa
143

Podela serija podataka


prema broju modusa

Serija podataka u kojoj se:

samo jedna vrednost javlja sa najveom


frekvencijom, ima samo jedan modus
unimodalna serija
dve vrednosti javljaju sa istom (najveom)
frekvencijom, ima dva modusa bimodalna
serija
vie od dve vrednosti u seriji podataka javljaju
sa istom (najveom)

frekvencijom, ima vie


od
dva modusa multimodalna serija
144

Primer: Serija podataka


koja nema modus

Visine sedam sluajno izabranih


studentkinja su 160, 175, 168, 172,
158, 180, 163 centimetara.
Poto se svaka vrednost u ovoj seriji
javlja samo jedanput, ova serija nema
modus.
modus

145

Primer serije podataka


sa jednim
j d i modusom
d
Tabela 5.3 Rezultati ispita iz Informatike u
jan feb roku kolske 2011/12.
jan-feb.
2011/12 god.
god
Ocena
f
5
31
6
33
7
37
8
14
9
6
10
1
Ukupno
122

Modus je ocena 7 jer ima najveu frekvenciju.


146

Primer serije
j sa dva modusa
Tabela 5.4 Godine starosti sluajno
izabranih studenata
Godine starosti

Broj studenata (f)

19

20

21

22

23

25

29

30

1
=10

Ova serija podataka


ima dva modusa: 21
i 22 jer obe
vrednosti se javljaju
sa (najviom)
frekvencijom koja
iznosi 2.

147

Modus kao mera centralne


tendencije kvalitativnih serija

Za razliku od ostalih srednjih vrednosti,


aritmetike sredine i medijane
medijane, koje se
raunaju odnosno vezane su iskljuivo
za numerike podatke, modus se u
izvesnom smislu moe koristiti i kao
mera centralne tendencije kvalitativnih
serija.
148

Primer odreivanja
j modusa
za kvalitativne podatke
Tabela 5.5 Status studenata koji su lanovi studentskog parlamenta
Status studenta

Broj studenata (f)

student prve godine studija

student druge godine studija

godine studija
j
student tree g

5
=10

Poto se kategorija student tree godine


pojavljuje najee od ostalih kategorija, ona je
modus
d ove serije
ij podataka.
d k
149

P i
Primena
modusa
d

Modus je pogodan pokazatelj raspodele


frekvencija za unimodalne serije i to
naroito ako je frekvencija modalne
vrednosti velika.
U takvim sluajevima modus je tipina
vrednost koja pokazuje u pravom smislu
centralnu tendenciju posmatrane serije.
152

O bi
Osobina
modusa
d

Sve dok je frekvencija modalne vrednosti


maksimalna na veliinu modusa ne utiu:

promene frekvencija
f k
ij varijable
ij bl
kao ni promene frekvencije ekstremnih
vrednosti.
ednosti

Odatle, modus se moe odrediti i u


sluajevima
l j i
kad
k d frekvencije
f k
ij ekstremnih
k t
ih
vrednosti varijable nisu poznate ali se zna
d su im
da
i frekvencije
f k
ij male.
l
153

Prednost modusa u odnosu na


aritmetiku
it
tik sredinu
di

Modus se ree primenjuje od aritmetike


sredine ali je za neka statistika istraivanja
pogodniji, jer daje potpuniju informaciju o
tendenciji okupljanja vrednosti varijable oko
srednje vrednosti.
Primer: pri ispitivanju uslova stanovanja,
stanovanja
bolji pokazatelj je veliina stambene povrine
koju koristi najvei broj stanovnika nego
prosena povrina po jednom stanovniku. 154

Zadaci za vebu

Zadatak 1.1 Na osnovu podataka o starosti


nastavnika u jednoj koli: 36,
36 26,
26 51,
51 25,
25 48,
48
odrediti aritmetiku sredinu i medijanu
skupa.
Zadatak 1.2 Na osnovu podataka o starosti
studenata u jednoj koli: 18,
18 20,
20 26,
26 24,
24 22,
22
19, odrediti aritmetiku sredinu i medijanu
skupa.
skupa
155

Zadatak 2.1 Na osnovu podataka datih u


sledeoj tabeli odrediti aritmetiku sredinu i
modu skupa.
Tabela 2.1 Rezultati ispita iz Informatike u
junskom ispitnom roku kolske 2010/11. god.
Ocena
f
6
28
7
31
8
19
9
14
10
2
Ukupno
94

156

Zadatak 2.2 Na osnovu podataka datih u


sledeoj tabeli odrediti aritmetiku sredinu i
modu skupa.
Tabela 2.2 Rezultati ispita iz Informatike u
jan.-febr. ispitnom roku kolske 2011/12. god.
Ocena
f
6
33
7
37
8
14
9
6
10
1
Ukupno
91

157

Zadatak 2.3 Na osnovu podataka datih u


sledeoj tabeli odrediti aritmetiku sredinu i
modu skupa.
Tabela 2.3 Rezultati ispita iz Informatike u
jan.-febr. roku kolske 2010/11. god.
Ocena
f
6
41
7
44
8
17
9
4
10
1
Ukupno
107

158

Zadatak 2.4 Na osnovu podataka datih u


sledeoj tabeli odrediti aritmetiku sredinu i
modu skupa.
Tabela 2.4 Rezultati ispita iz Informatike u
junskom ispitnom roku kolske 2009/10. god.
Ocena
f
6
39
7
34
8
20
9
11
10
4
Ukupno
108

159

Zadatak 3.1 Na osnovu podataka datih u


sledeoj tabeli odrediti aritmetiku sredinu
skupa.
Tabela 3.1 Duina trajanja reavanja testa
Vreme (u min.)

Broj studenata (f)

manje od 5

5-10

10-15

15-20

15

20-25
20
25

18

25-30

30-35

4
Ukupno

50
160

Zadatak 3.2 Na osnovu podataka datih u


sledeoj tabeli odrediti aritmetiku sredinu
skupa.
Tabela 3.2
3 2 Visine 200 novoroenadi
Visina beba (u cm)
f
manje od 40
0
40-43
2
43-46
43
46
7
46-49
40
49-52
87
52-55
58
55-58
5
58-61
1
Ukupno
200

161

You might also like