Professional Documents
Culture Documents
Uvod U Statistiku
Uvod U Statistiku
Uvod u Statistiku
pripremila Tatjana Baji
Sadraj
Statistika
Statistika
kao nauna disciplina
prikupljanje podataka
klasifikaciju podataka
prikazivanje podataka
analizu podataka
interpretaciju podataka
i donoenje statistikih zakljuaka.
zakljuaka
4
Predmet statistikog
istraivanja
Procene i prognoze
Uzorak
Podela varijabli
10
Opservacija
Opse acija ili podatak
11
Kvantitativne varijable
Prekidne varijable
13
Neprekidna varijabla
14
Kvalitativne (atributivne)
ili kategorijske varijable
Kategorije kvalitativnih
varijabli
16
Vrste varijabli
Varijable
j
Kvantitativne
Prekidna
Kvalitativne
ili
kategorijske
Neprekidna
17
Savremena statistika
Podrazumeva dva aspekta:
1 Teorijsku odnosno matematiku
1.
statistiku koja se bavi razvojem,
izvoenjem i dokazivanjem statistikih
teorema, formula, pravila i zakona.
2. Primenjenu
P i
j
statistiku
t ti tik koja
k j predstavlja
d t lj
primenu statistike teorije u praksi, odnosno
primenu
i
statistikih
t ti tikih tteorema, fformula,
l pravila
il
i zakona u reavanju realnih problema.
19
Statistika teorija
20
Primenjena statistika
Deskriptivna statistika
prikupljanja podataka
sreivanja podataka
prikazivanja podataka i
opisivanja podataka pomou tabela,
tabela
grafikona i sumiranih pokazatelja.
23
Inferencijalna statistika
Teorija verovatnoa
Matematika statistika
Statistika teorija
P i
Primenjena
j
statistika
t ti tik
Deskriptivna
statistika
Inferencijalna
statistika
25
2
2. Prikupljanje
P ik lj j i sreivanje
i
j
podataka
pripremila Tatjana Baji
PRIKUPLJANJE I
SREIVANJE PODATAKA
Prikupljanje podataka
Serije podataka: strukturne serije i
vremenske serije
Apsolutne frekvencije
Relativne frekvencije
Uee
27
Prikupljanje podataka
Serija podataka
strukturne serije i
vremenske serije
29
31
Apsolutne frekvencije
Relativne frekvencije
Uee (procenat)
Primer: Populacija,
varijabla i modaliteti
Oznaimo sa:
S={s
{ 1, s2 s3,,...,, sN} p
populaciju
p
j
X varijabla
{{x1, x2 x3,,...,, xm} skup
p vrednosti ili
kategorija koje moe uzeti varijabla X
} fk je broj elemenata
k {1,2,3,..., m},
populacije S na kojima varijabla X
uzima vrednost ili se pojavljuje u formi
kategorije xk
37
Primer: Apsolutna i
relativna frekvencija
f1 +...+fm=N
broj fk se naziva apsolutna
frekvencija vrednosti ili kategorije xk
broj fk/N se naziva relativna
frekvencija vrednosti ili kategorije xk ,
a broj 100* Nk/N predstavlja broj stotih
delova populacije gde obeleje X uzima
vrednost xk odnosno uee (koje se
izraava u procentima)
38
3 T
3.
Tabelarno
b l
prikazivanje
ik i
j
podataka
pripremila Tatjana Baji
39
Statistika tabela
j se dobijaju
j j u preseku
p
horizontalnih i
koja
vertikalnih linija.
Prve red se naziva zaglavlje, a prva
kolona pretkolona.
Pretkolona i zaglavlje tabele slue za
unoenje modaliteta varijabli i vremenskih
intervala
intervala.
41
I
Izrada
d statistike
t ti tik tabele
t b l
Svaka
S
k statistika
t ti tik ttabela
b l mora imati
i ti svojj naslov,
l
koji se stavlja iznad nje i koji treba kratko ali
d
dovoljno
lj da
d opredeli
d li sadraj
d j tabele.
t b l
Modaliteti, bilo da su u zaglavlju ili pretkoloni,
ne smeju se skraivati.
Tekst ispod
p tabele treba da sadri obavetenje
j
o izvorima podataka, osnovne definicije,
napomene
p
o uporedivosti
p
podataka
p
i druga
g
obavetenja korisna za pravilno razumevanje
42
podataka.
45
46
Kombinovane statistike
tabele
Primer kombinovane
statistike tabele
Tabela 1.3 Prolaznost studenata u januarskofebruarskom ispitnom roku kolske 2011/12. godine
Godina
studija
I godina
II godina
III godina
Ukupno
Ukupno
k
Nije izalo
l
prijavilo ispit
na ispit
Izalo
l na
ispit
Poloilo
l l
ispit
1110
1180
1000
3290
100%
100%
100%
100%
44
167
67
278
4%
14%
7%
8%
1066
1013
933
3012
96%
86%
93%
92%
968
970
896
2834
87%
82%
90%
86%
48
kvalitativnih varijabli
kvantitativnih prekidnih varijabli
kvantitativnih neprekidnih varijabli
50
Tabela frekvencija
kvalitativnih podataka
Kategorija
Vrsta
zaposlenja
Broj
studenata (f)
Privatni vrti
16
Dravni vrti
44
S
Sopstveni
t
i vrti
ti
23
17
UKUPNO
Kolona
frekvencija
Frekvencija
100
53
0,333
33,30%
0,467
46,70%
0,200
20,00%
Ukupno = 1,000 Ukupno = 100%
54
Tabelarno prikazivanje
kvantitativnih podataka
vrednosti varijable
j
(prikazane izolovanim
(p
numerikim vrednostima ili grupnim intervalima) i
njima odgovarajui broj jedinica posmatranja
(frekvencije).
Kvantitativni p
podaci p
prikazani raspodelom
p
frekvencija nazivaju se grupisani podaci.
55
Problem gradiranja
kvantitativnih podataka
56
Primer
58
Gradiranje numerikih
podataka neprekidne varijable
IInterval
t
l individualnih
i di id l ih vrednosti
d
ti jedne
j d
kvantitativne varijable u datom uzorku ili
populaciji
l iji moe
biti vei
i ili manji
ji (npr.
(
visina
i i
studenata se kree od 150 do 200cm, njihova
t l
telesna
masa od
d 50 do
d 100 kg,
k itd.).
itd )
Da bismo dobili strukturu studenata npr. po
visini ili teini
potrebno je izvriti
gradiranje
odgovarajuih vrednosti varijable, odnosno
odrediti broj grupnih intervala, pri emu
59
grupni intervali ne smeju da se poklapaju.
Grupni intervali
sve vrednosti
neprekidne varijable
od najvee
60
vrednosti u seriji (xmax).
uzeti
ti 7
7,5
5 ili neku
k prikladnu
ikl d manju
j
65
vrednost, recimo 5.
66
Brojj
B
studenata
f
0
2
3
15
18
8
4
50
Procenat
%
0
4%
6%
30%
36%
16%
8%
100%
67
Broj
studenata
f
0
2
3
16
17
8
4
50
Procenat
%
0
4%
6%
32%
34%
16%
8%
100%
68
4 Grafiko
4.
G fik prikazivanje
ik i
j
podataka
pripremila Tatjana Baji
73
Grafiko prikazivanje
podataka
Grafiko prikazivanje
kvalitativnih podataka
tapiasti dijagrami i
strukturni krug (pita)
75
tapiasti dijagram
tapiasti
77
78
79
Grafiko prikazivanje
kvantitativnih podataka
Razlikujemo:
80
Grafiko prikazivanje
podataka
d t k prekidne
kid
varijable
ij bl
tapiastog dijagrama i
strukturnog kruga (pite)
82
Primer strukturnog
strukturnog krug
kruga
a za podatke
prekidne
kid
varijable
ij bl iz
i Tabele
T b l 3.1
31
Ocene
83
histograma
poligona i
krive raspodele frekvencija
84
Histogram
85
Broj stud
denata
10-15
10
15
15-20
15
20
20-25
20
25
25-30
25
30
30-35
30
35
Poligon
Broj stud
denata
12,5
17,5
22,5
27,5
32,5
Kriva frekvencija
96
5 Numerike
5.
deskriptivne mere
5 1 Mere centralne tendencije
5.1
pripremila Tatjana Baji
Uvod
Pokazatelji raspodele
frekvencija
Numerike deskriptivne
p
mere
Parametri skupa i
statistike uzorka
Podela numerikih
deskriptivnih mera
114
Raspodele
R
d l ffrekvencija
k
ij prvenstveno
t
otkrivaju
tk i j
tendenciju grupisanja pojedinih vrednosti
varijable
ij bl oko
k vrednosti
d
ti karakteristine
k kt i ti za
posmatrani skup.
Varijabilnost vrednosti varijable namee
potrebu za merenjem centralne vrednosti
varijable.
Srednja
j vrednost,, kao p
pokazateljj centralne
tendencije vrednosti varijable, predstavlja
115
meru centralne tendencije.
U zavisnosti
i
ti od
d posmatrane
t
pojave
j
i od
d naina
i
grupisanja podataka u raspodeli frekvencija,
razmatramo
t
ttrii razliite
liit mere centralne
t l
tendencije raspodele odnosno srednje
vrednosti
d
ti :
119
Ponderisana aritmetika
sredina
U praksi se ee susreemo sa
grupisanim podacima u vidu raspodele
frekvencija.
Aritmetika
t et a sredina
s ed a g
grupisanih
up sa
podataka
podata a
naziva se ponderisana aritmetika
sredina
s
ed a je
jer se ssve
e vrednosti
ed os varijable
a jab e ((xi)
u skupu ili uzorku uzimaju onoliko puta
koliko se one jjavljaju,
j j , tj.
j ponderiu
p
se
njihovim frekvencijama (fi).
121
Izraunavanje ponderisane
aritmetike
sredine
Ponderisana
P
d i
aritmetika
it
tik sredina
di
uzorka
k
obima n je:
122
P d i grupisani
Podaci
i
i u intervale
i t
l
123
Aritmetika
i
ik sredina
di
uzorka
k obima
b
n je:
gde je x sredina,
sredina a f frekvencija intervala
intervala.
124
Primer
Tabela 5
5.1
1 Vreme koje studenti svakodnevno
provedu u putovanju
Vreme (u min.) Broj studenata (f)
fx/
manje od 0
0-10
20
10-20
15
135
20-30
25
150
30-40
35
140
40-50
45
90
Ukupno
1
=
N
25
k
i =1
535
f i xi =
= 21,40 min
25
535
125
Nedostatak aritmetike
sredine
Ekstremne
Ek
t
vrednosti
d
ti su one vrednosti
d
ti
varijable, koje ekstremno odstupaju od ostalih
vrednosti.
d
ti
Ako u skupu ili uzorku ima ekstremnih
vrednosti, aritmetika sredina moe dati
iskrivljenu sliku, posebno ako raspodela
frekvencija nije simetrina.
Za serije
j ije
j vrednosti varijable
j
znatno
odstupaju od aritmetike sredine kaemo da
132
imaju veliku rasprenost ili disperziju.
Medijana
Izraunavanje medijane
1.
2
2.
136
Modus
145
Primer serije
j sa dva modusa
Tabela 5.4 Godine starosti sluajno
izabranih studenata
Godine starosti
19
20
21
22
23
25
29
30
1
=10
147
Primer odreivanja
j modusa
za kvalitativne podatke
Tabela 5.5 Status studenata koji su lanovi studentskog parlamenta
Status studenta
godine studija
j
student tree g
5
=10
P i
Primena
modusa
d
O bi
Osobina
modusa
d
promene frekvencija
f k
ij varijable
ij bl
kao ni promene frekvencije ekstremnih
vrednosti.
ednosti
Zadaci za vebu
156
157
158
159
manje od 5
5-10
10-15
15-20
15
20-25
20
25
18
25-30
30-35
4
Ukupno
50
160
161