You are on page 1of 203

STATISTIKA

ZA
PRAVNIKE

Prof.dr.sc. Nihada Mujić


Mr.sc. Jelena Legčević
Mr.sc. Martina Mikrut

Sveučilište Josipa Jurja Strossmayera


Pravni fakultet u Osijeku
Godina 2009
STATISTIKA
ZA
PRAVNIKE

Autori:
Prof.dr.sc. Nihada Mujić
Mr.sc. Jelena Legčević
Mr.sc. Martina Mikrut

Recenzenti:
Prof.dr.sc. Ivana Barković
Prof.dr.sc. Jasna Horvat

Lektorica:
Nataša Balaban, prof.

ISBN 978-953-6072-47-7

2
Sadržaj
1. Pojam i predmet proučavanja statistike
2. Izvori podataka i metode prikupljanja podataka
3. Faze rada statističke metode
4. Statističko tabeliranje
5. Grafičko prikazivanje nominalnih i redoslijednih
nizova
6. Relativni brojevi kvalitativnih nizova
7. Numerički nizovi
8. Grafičko prikazivanje numeričkih nizova
9. Srednje vrijednosti
10. Aritmetička sredina
11. Medijan
12. Mod
13. Mjere disperzije
14. Standardizirano obilježje
15. Analiza vremenskih nizova
16. Indeksna metoda
17. Individualni indeksi stalne baze
18. Verižni indeksi
19. Preračunavanje individualnih indeksa
20. Srednje vrijednosti vremenskih nizova
21. Skupni indeksi
22. Linearni trend
23. Regresija i korelacija
24. Metoda uzoraka
3
4
“Statistički način mišljenja
jednog će
dana za svakodnevni život
građana postati jednako
neophodan
kao znanje čitanja i pisanja.”

H.G.Wells (1866. – 1946.)

5
Definicija statistike

 Preko 100 definicija pojma “statistika”

 “Nijedna definicija ne znači mnogo


tako dugo dok nismo proučili ono na
čemu radimo – a tada je svaka
definicija gotovo nepotrebna”;
Mainland

 Statistika je znanstvena disciplina


koja se bavi prikupljanjem, analizom
i tumačenjem podataka masovnih
pojava

 U svakodnevnom govoru, riječ statistika


koristi se i za već prikupljenje i uređene
podatke, brojčane pokazatelje, koji su
objavljeni u obliku tablica, grafikona i sl.

6
Statistika u svakodnevnom
životu

Pojam statistike ne odnosi se isključivo na


statističke podatke, već uz način proučavanja
pojava koje nas okružuju, a u svakodnevnom
životu susrećemo se s njom kroz:

 Prosjek ocjena
 Stopu inflacije
 Postotak porasta nezaposlenih
 Prosječnu starost stanovnika RH
 ...

7
Podjela statistike
 Deskriptivna statistika

Temelji se na potpunom obuhvatu


statističkog skupa, koristi brojčane
(numeričke) i grafičke metode kako bi
opisala populaciju (N)
 mjere centralne tendencije, mjere
disperzije, mjere asimetrije, mjere
zaobljenosti...

 Inferencijalna statistika

Temelji se na dijelu (uzorku (n)) jedinica


izabranih iz statističkog skupa, radi
donošenja zaključaka o parametrima
populacije
 procjene parametara, testiranje
hipoteza, neparametrijski testovi
(hi-kvadrat test)...
8
Predmet proučavanja statistike

 Varijacije (različitost, promjenjivost) i


kovarijacije (sličnost, povezanost,
međuovisnost) podataka koji prikazuju
različite pojave u prirodi i društvu ili su
rezultat mjerenja

 Zakonitosti koje se javljaju u masovnim


pojavama

 Masovne pojave su skupine istovrsnih,


ali ujedno i varijabilnih elemenata koje
imaju jedno ili više zajedničkih svojstava i
nazivamo ih statističkom masom ili
statističkim skupom

9
Definiranje statističkog skupa

 Statistički skup potrebno je definirati:

 ŠTO: Pojmovno

 GDJE: Prostorno

 KADA: Vremenski
 u jednom trenutku
 u intervalu

 Opseg statističkog skupa je broj njegovih


elemenata

 Skup može biti konačan (jer ima konačan


opseg) i beskonačan (jer ima beskonačno
mnogo članova)

10
Elementi statističkog skupa

 Sastav statističkog skupa ovisi o


pojedinačnom slučaju – ovisi o
pojavama koje se istražuju

STATISTIČKA STATISTIČKA
JEDINICA MASA

1.) osoba 1.) stanovništvo, studenti


2.) stvar 2.) knjige,vozila
3.) ustanove i poduzeća 3.) bolnice, sudovi, škole
4.) usluge 4.) u zdravstvu,
5.) događaji 5.) rođenje, nezgode
6.) djelovanje 6.) krivična djela,
djela socijalne zaštite

11
Statističko obilježje

 Svojstvo po kojemu jedinice statističkog


skupa međusobno nalikuju i međusobno
se razlikuju (npr. spol, dob, visina,
ocjene...)

 Statističko obilježje naziva se i varijabla

 Pojavljuje se u različitim oblicima ili


stupnjevima

 Obilježja mogu biti:


 KVALITATIVNA (izražavaju se opisno)
 KVANTITATIVNA (izražavaju se
brojčano)

12
Statističko obilježje

Kvalitativna obilježja mogu biti:


Nominalna
Atributivna (spol, zanimanje)
Geografska (mjesto rođenja, mjesto
studiranja)
Redoslijedna (ocjena, školska sprema,
stupanj zadovoljstva studiranjem)

Kvantitativna (numerička) obilježja


mogu biti:
Prekidna ili diskontinuirana (broj
studenata na godini, broj počinjenih kaznenih
djela)
Neprekidna ili kontinuirana (visina,
težina, duljina, cijena)

13
14
Podaci prema izvoru

 Podaci su osnova svake statističke analize


 Pribavljanje podataka ovisi o cilju i
predmetu istraživanja, prirodi pojava,
raspoloživim resursima...

Prema izvoru, podatke dijelimo na:


 Sekundarni podaci: podaci prikupljeni u
skladu s nekim ciljem i na određen način,
opseg i vrsta ne izviru neposredno iz potreba
danog istraživanja

 Primarni podaci: podaci koji se prikupljaju


u skladu s ciljem istraživanja, za sve članove
skupa ili dio njih

15
Sekundarni podaci

 Sekundarni podaci su u pravilu lako


dostupni, a njihovo pribavljanje nije
povezano uz velike troškove, no ponekad
su nedovoljni

 Mogu biti interni i eksterni:

INTERNI EKSTERNI
PODACI PODACI

-Statistički uredi
-Zavodi za
-Računovodstvo
istraživanje
- Referada
tržišta
- Knjižnica
-Državne
...
institucije
...
16
Primarni podaci
 Metode prikupljanja podataka dijele se na:
 Osobno– F2F (uz pomoć papirnatog upitnika
PAPI ili računala CAPI)
 Telefonsko (uz pomoć računala CATI)
 Poštansko (klasična pošta ili fax)
 Internet (web, mail, chat, …)
 Opažanja (mjerenje)

 Ili ovisno o tome gdje se anketira npr.


 Upitnicima u kućanstvu
 Anketiranje na centralnoj lokaciji...

 Za sve metode i mjesta postoje prednosti i


nedostatci, potreban je odabir metode s
najpovoljnijim odnosom uloženog i dobivenog

17
18
Faze rada statističke metode

 Statističko promatranje

 Grupiranje ili klasifikacija

 Statistička analiza

 Tumačenje rezultata

19
Statističko promatranje

S obzirom na vrijeme:
Periodično
Jednokratno
Tekuće

S obzirom na obuhvat:
Sveobuhvatno (iscrpno)
Reprezentativno (uzorak)

20
Grupiranje ili klasifikacija

 Uređivanje izvornih podataka na temelju


utvrđenog pravila

 Veliki broj podataka uređuje se


grupiranjem prema određenom pravilu
razvrstavanja podataka

 Broj podataka u jednoj grupi naziva se


frekvencijom grupe, koja može biti
apsolutna ili relativna

 Zbroj svih frekvencija čini opseg skupa

21
Grupiranje ili klasifikacija

 Formiranje grupa:
Iscrpno
Isključivo

 Raspoređivanje podataka u
grupe ili razrede koji mogu biti:
Jednaki ili nejednaki
Zatvoreni ili otvoreni

22
Statistička analiza

 Uređivanjem izvornih
podataka na temelju utvrđenog
pravila kreira se statistički niz

 Statistički niz = suma


frekvencija svih grupa statističkog
skupa,čine ga grupe poredane po
određenom principu...

23
Vrste statističkih nizova
(skupova):

Vrste statičkih nizova s obzirom na


grupiranje:

 NEGRUPIRANI Xi: X1, X2, X3,..., XN


 GRUPIRANI statističke tablice

a) Negrupirani statistički niz - podaci su zapisani


slijedom kojim su i prikupljani

Xi: X1, X2, X3,...., XN


studenti prema ocjeni iz statistike:
5, 5, 5, 5, ..., 5

24
b) Grupirani statistički niz
podaci se prikazuju u tablicama distribucije
frekvencija

STATISTIČKE SKUPINE
- modaliteti obilježja (redovi)

FREKVENCIJE
- broj jedinica modaliteta obilježja
(stupci)

Broj
Spol studenata
xi fi
M 40
Ž 60
Ukupno 100

25
Statistički nizovi

Vrste statičkih nizova s obzirom na


obilježje:

 NOMINALNI NIZ - prema veličini


frekvencija, abecedno,nomenklaturno

 REDOSLIJEDNI NIZ – prema


intenzitetu

 NUMERIČKI NIZ – prema


vrijednosti num. obilježja

 VREMENSKI NIZ – kronološki

26
Tumačenje rezultata

 Statistički ispravno

 U skladu s pravilima struke

 Nužno izbjeći manipulaciju


rezultatima

27
28
Statističko tabeliranje

 Postupak svrstavanja podataka u tablice


prema određenom pravilu

 Cilj tabeliranja je olakšati praćenje i


analizu podataka

 Tablice mogu biti izvještajne (veliki broj


redova i stupaca, kao tablice DZS-a) i
analitičke (u pravilu manjih dimenzija)

29
Elementi statističke tablice

Naslov tablice:

Z A G L A V LJ E Ukupno

P
Brojčani dio tablice: Z
R
E Ø prosjek B

T I

S
… ne raspolaže se R

T N
- nema podatka I S
U
T
P ( ) nepotpun podatak
U
A
C
* ispravljen podatak P
A
C

Ukupno ZBIRNI RED (sume


stupaca)

Izvor
: 30
Vrste statističkih tablica

 Vrste statističkih tablica su

 Jednostavne tablice: samo jedna pojava,


jedan statistički niz kada je grupiranje
provedeno prema jednom obilježju
 Skupne ili složene tablice: dva ili više
statističkih nizova grupiranih prema jednom
obilježju
 Kombinirane tablice: jedan statistički niz
promatran prema dva ili više obilježja.
Sadrži i zbirni red i zbirni stupac

31
Grafičko
prikazivanje
nominalnih i
redoslijednih
nizova
32
Grafičko prikazivanje

 Grafički prikazani statistički podaci razumljiviji


su i pregledniji u odnosu na njihovo
predstavljanje tablicom

 Veća preglednost grafičkog prikaza i snaga


prvog vizualnog utiska o karakteristikama
promatrane pojave prednosti su grafičkih
prikaza

 Danas se grafički prikazi konstruiraju pomoću


računalnih programa koji
u sebi sadrže predefinirana
načela opisne statistike
Skupine grafičkih prikaza

Grafički je moguće prikazati jedan ili


više kvalitativnih nizova

 Skupine grafičkih prikaza:

 Površinski grafikoni

 Linijski grafikoni

 Kartogrami

34
Površinski grafikoni

 podaci se prikazuju površinama


geometrijskih likova, površine likova su
upravno razmjerne brojevima koji se tim
površinama prikazuju

 Jednostavni stupci (P = a * b)

 Razdijeljeni (strukturni) stupci

 Dvostruki stupci

 Površina kvadrata (P = a²)

35
Površinski grafikoni

Površina kruga (P = r²π)


Površina polukruga
Varzarov znak ( RBK ili RBS
)
(baza= nazivnik odnosa ,
visina= rel. broj)
Histogram

36
Linijski grafikoni

 Koriste se za prikazivanje nizova

a) NUMERIČKIH (kontinuirani i
diskontinuirani)
b) VREMENSKIH (trenutačni i
intervalni)

 Apscisa - A.M. za obilježje


 Ordinata - A.M. za frekvenciju

37
Kartogrami

 Grupiranje jedinica prema


geografskom obilježju gdje sve
grupe zajedno predstavljaju
cjelovito geografsko područje

 VRSTE:

 Dijagramske karte
 Piktogrami
 Statističke karte

38
Grafičko prikazivanje
redoslijednih nizova

 Grupiranje se vrši na isti način kao


i grupiranje prema nominalnom
obilježju s tim da je redoslijed
modaliteta ili grupa uvijek određen
rangom intenziteta obilježja koji
pojedina grupa predstavlja, i to
polazeći od najnižeg prema
najvišem ili obratno

39
40
Relativni brojevi

 RELATIVNI BROJ je logičan izraz mjerenja


kada se neka veličina mjeri drugom
veličinom (nazivnik=baza usporedbe)

 Ova posljednja veličina postaje time mjera


za veličinu koja se uspoređuje (mjeri)

 Zadatak relativnih brojeva je:

 Brojčano izraziti odnose među pojavama

 Omogućiti i olakšati usporedbu

41
Vrste relativnih brojeva

1. Relativni brojevi strukture


(D/C)
proporcije, postoci, promili
(p, %, ‰)

2. Relativni brojevi dinamike


(indeksi)
bazni, verižni
individualni, skupni

3. Relativni brojevi koordinacije


(RBK)
42
Relativni brojevi strukture

 Ako se stavi u odnos broj elemenata dijela


skupa prema broju elemenata u skupu,
dobiva se relativan broj koji se zove
PROPORCIJA tog dijela u skupu
 Proporciju označavamo s p
 Budući da je dio uvijek manji od cjeline,
onda je: 0<p<1
 Relativna frekvencija modaliteta ai je omjer
apsolutne frekvencije fi tog modaliteta i
zbroja apsolutnih frekvencija N:

f (ai ) dio
p(ai )   i  1,2,3,..., k
N cjelina
k
N   f (ai )
i 1
43
Svojstva

 Relativne frekvencije su upravno


proporcionalne apsolutnim frekvencijama
 Relativne frekvencije se radi lakšeg
tumačenja množe sa sto (%) ili sa tisuću
(‰)

0 < fi < N ... fi=N


0 < pi <N ... pi=1
0 < Pi <N ... Pi=100

 Ekstremni slučajevi:
 Dio pojave koji se uspoređuje = 0, tada je i p=0
 Dio pojave koji se uspoređuje = C (cjelina), tada je
p=1

44
Kutno sto, vodoravno sto,
okomito sto
Analiziranje podataka u kombiniranoj tablici
relativnim brojevima strukture:
vodoravno 100, okomito 100, kutno 100

Primjer 1.

Upisani studenti na stručni i sveučilišni studij prema


spolu i načinu strudiranja u ak. g. 2008./2009

Upisani
studenti Studenti Studentice Ukupno

Redovni 36.681 44.721 81.402

Izvanredni 8.180 16.360 24.540

Ukupno 44.861 61.081 105.942

Izvor: Statistički ljetopis 2009., str.467

45
Kutno sto
stavljanje u odnos svih brojeva u tablici prema
ukupnoj statističkoj masi

Upisani
studenti Studenti Studentice Ukupno

Redovni 36.681 44.721 81.402

Izvanredni 8.180 16.360 24.540

Ukupno 44.861 61.081 105.942

Upisani
studenti Studenti Studentice Ukupno

Redovni 34,62 42,21 76,84


+
Izvanredni 7,72 15,44 23,16

Ukupno 42,34 57,66 100,00

46
Vodoravno sto
stavljanje u odnos svih brojeva u tablici prema
vrijednostima iz zbirnog stupca

Upisani
studenti Studenti Studentice Ukupno

Redovni 36.681 44.721 81.402

Izvanredni 8.180 16.360 24.540

Ukupno 44.861 61.081 105.942

Upisani
studenti Studenti Studentice Ukupno

Redovni 45,06 54,94 100,00

Izvanredni 33,33 66,67 100,00

Ukupno 42,34 57,66 100,00

47
Okomito sto
stavljanje u odnos svih brojeva u tablici prema
vrijednostima iz zbirnog reda

Upisani
studenti Studenti Studentice Ukupno

Redovni 36.681 44.721 81.402

Izvanredni 8.180 16.360 24.540

Ukupno 44.861 61.081 105.942

Upisani
studenti Studenti Studentice Ukupno

Redovni 81,77 73,22 76,84


+
Izvanredni 18,23 26,78 23,16

Ukupno 100,00 100,00 100,00

48
Relativni brojevi dinamike

 Nazivaju se INDEKSI

 Pokazuju odnos između stanja jedne te iste


pojave ili skupine pojava na različitim
mjestima ili u različitim vremenskim
razdobljima

 Vrste indeksa:
 individualni (dinamika jedne pojave)
 skupni (odnosi stanja heterogene
skupine pojava)

49
Relativni brojevi koordinacije

 Koristi se za uspoređivanje dvije pojave (P1 i P2),


npr. broja studenata prema broju nastavnika,
broj optuženih u odnosu na broj prijavljenih ...
 Izračunavaju se stavljanjem u odnos frekvencije
pojave koja se uspoređuje, s frekvencijom pojave
prema kojoj se provodi usporedba
 RBK se grafički prikazuje površinskim grafikonom
Varzarovim znakom

P1 1 P2
RBK= =
P2 RBK P1

50
51
Numerički niz
 Numerički nizovi konstruiraju se uređenjem
vrijednosti kvantitativnih varijabli

 Vrste:
- NUMERIČKI KONTINUIRANI NIZOVI
- NUMERIČKI DISKONTINUIRANI NIZOVI

 GRUPIRANJE – raščlanjivanje statističkog


skupa prema modalitetima obilježja

 Grupiranje podataka:
 ISKLJUČIVO

 ISCRPNO

52
Numerički niz

DISTRIBUCIJA FREKVENCIJA =
skup: (xi,fi) gdje je k
fi=N
i=1

N - broj jedinica statističkog skupa


i=1,2,...,k
k – broj modaliteta obilježja
xi – vrijednosti modaliteta obilježja
 f(i) APSOLUTNA FREKVENCIJA
 p(i) RELATIVNA FREKVENCIJA

53
Numerički niz

 Pojedinačni par u distribuciji frekvencija


predstavlja NUMERIČKU GRUPU, tj. broj jednakih
vrijednosti modaliteta obilježja varijable x

Broj
jedinica Distribucija
modaliteta frekvencije
Obilježje obilježja
(xi) (fi)
X1 f1 (x1, f1)
Modaliteti
obilježja
X2 f2 (x2, f2)
... ... ...

Xk fk (Xk, fk)

fi = N

54
Sturgesovo pravilo

 za određivanje broja razreda k za N podataka


k  1 + 3,3 log N

 Uobičajeni broj k numeričkih grupa kreće se


od 5 do 15 (maximalno 25)
 Ako su razredi jednaki, širina im se
aproksimativno određuje diobom raspona
varijacija i broja razreda:

ΔX = Xmax-Xmin = RV
k k

55
Granice razreda

1.) NOMINALNE GRANICE (zadane)


 za izračunavanje parametara
diskontinuiranog numerickog niza

2.) PRAVE GRANICE (“popravljene”)


 za izračunavanja parametara kontinuiranog
numerickog niza
 crtanje kontinuiranog numerickog niza

3.) PRECIZNE GRANICE


 samo za crtanje diskontinuiranih numerickih
nizova

56
Formiranje razreda kod
kontinuiranog n.o.

 PRAVILO:
PRAVILO
Gornja granica prethodnog razreda jednaka je
donjoj granici idućeg razreda

Formiranje razreda kod


diskontinuiranog n.o.

 PRAVILO:
PRAVILO
Donja granica idućeg razreda za 1 jedinicu
je veća od gornje granice prethodnog
razreda

57
Veličina razreda

 Oznaka za veličinu razreda je “i”

 i = L1i +1 – L1i i = 1,2,...k

 VELIČINA RAZREDA – od donje granice


idućeg razreda oduzmemo donju granicu
prethodnog razreda

58
Razredna sredina

 za kontinuirane i diskontinuirane nizove

xi=L1i+L2i
2

 RAZREDNA SREDINA – jednaka je


poluzbroju donje (L1) i gornje (L2) prave
granice i-tog razreda

59
Korigirane frekvencije

 Ako su veličine razreda međusobno


različite, podijeliti originalne
frekvencije pripadajućim veličinama
razreda ili njima proporcionalnim
vrijednostima

 Frekvencije se obavezno korigiraju:

 za crtanje poligona frekvencija


 za crtanje histograma
 pri izračunavanju moda

60
Korigirane frekvencije

 Fc = apsolutne korigirane frekvencije

fc= fi
i

 Pc = relativne korigirane frekvencije

pc= pi
i

61
Grafičko
prikazivanje
numeričkih
nizova
62
Grafičko prikazivanje
numeričkih nizova

Numerički nizovi prikazuju se slijedećim


vrstama grafikona:

 LINIJSKIM GRAFIKONOM
poligon frekvencija

 specifičnim vrstama POVRŠINSKOG


GRAFIKONA
Histogram

S-L dijagram

63
1. Linijski grafikon

POLIGON FREKVENCIJA
(MNOGOKUTNIK)
- distribucija frekvencija (ili kretanje
neke pojave) se prikazuje linijama
- ako je prethodno nacrtan histogram:
polovice vrhova stupaca (tj. sredine
razreda Xi) spojiti linijama

- ucrtana linija:
 oblik distribucije frekvencija

- površina ispod linije:


 ukupan broj elemenata statističkog
skupa ili opseg stat. skupa

64
 os X – vrijednost numeričkog
obilježja izraženog sredinom
razreda (xi )

 os Y – frekvencija:
- apsolutna (fi),
- relativna (pi),

 za razrede nejednakih veličina:


- korigirati frekvencije!
- aps. korigirana (fc)
- rel. korigirana (pc)

65
2. Površinski grafikon

 grafikon kontura stupaca


 stupci se crtaju bez razmaka
 visina pravokutnika – frekvencija
( fi, fc, pi, pc )
 baza pravokutnika – veličina razreda
 površina svih pravokutnika jednaka je
zbroju apsolutnih frekvencija, tj. relativnih
frekvencija (1 ili 100 ili 1000)

66
Grafičko prikazivanje
kumulativnih nizova

 Kumulativni nizovi se UVIJEK


tvore od originalnih vrijednosti

 KN “manje od”
X : gornja granica promatranog razreda
Y: frekvencija kumulativnog niza

 KN “više od”
X: donja granica promatranog razreda
Y: frekvencija kumulativnog niza

67
Srednje
vrijednosti

68
Vrste srednjih vrijednosti

 Srednje vrijednosti ili mjere centralne


tendencije

 Vrste srednjih vrijednosti:

1. POTPUNE SREDNJE VRIJEDNOSTI


2. POLOŽAJNE SREDNJE VRIJEDNOSTI
3. SPECIFIČNE SREDNJE VRIJEDNOSTI

69
Potpune srednje vrijednosti

 Aritmetička sredina – ( A.S.) X


 aritmetička sredina relativnih brojeva
strukture – P
 aritmetička sredina relativnih brojeva
koordinacije – R
 Harmonijska sredina – H
 Geometrijska sredina – G
 Aritmetička sredina aritmetičkih sredina
X

70
Položajne srednje vrijednosti

 medijan – Me (ordinalni niz)


 mod - Mo (nominalni niz, ordinalni niz)

Specifične srednje vrijednosti


 momenti distribucije frekvencija

71
Osnovne značajke srednjih
vrijednosti

 Utjecaj ekstremnih obilježja na srednje


vrijednosti

 Utjecaj frekvencija u distribuciji frekvencija


na srednje vrijednosti

 Utjecaj svih obilježja koja su različita od


srednje vrijednosti na tu srednju vrijednost

 Odnos promatrane srednje vrijednosti i


drugih obilježja

72
Zahtjevi srednjih vrijednosti

 Mogućnost utvrđivanja srednje vrijednosti


objektivnim računskim pravilom na
jedinstven način

 Srednja vrijednost mora biti sadržana


između najmanje i najveće vrijednosti
obilježja

 Ako su sve srednje vrijednosti obilježja


jednake, i srednja vrijednost mora biti
jednaka toj vrijednosti

73
Aritmetička
sredina

74
Aritmetička sredina
(MEAN), X, x

 prosjek
 N-ti dio totala

 vrijednosti N.O. osnovnog skupa


(N – broj jedinica osnovnog skupa)
X1,X2,Xi,...XN i=1,2,...,N

 vrijednosti N.O. uzorka


(n – broj jedinica uzorka)
x1,x2,xi,...xn i=1,2,...n

75
Aritmetička sredina
osnovnog skupa

suma vrijednosti num.


obilježja osnovnog skupa Total
X= =
broj jedinica osnovnog skupa N

Aritmetička sredina
uzorka

suma vrijednosti num.


obilježja uzorka total
x= =
broj jedinica uzorka n

76
Jednostavna
aritmetička sredina

 Jednostavna, neponderirana A.S.


osnovnog skupa
 Koristi se za negrupirani niz podataka

Ako obiježje X od N elemenata ima vrijednosti


mjerene na svakom elementu:

X: X1,X2,X3,...XN
k

X1+X2+X3+...+Xk
 Xi
i 1
X= =
N N

77
Ponderirana, vagana
aritmetička sredina

 A.S. vagana frekvencijama


 Koristi se za grupirani niz podataka

Ako je zabilježeno k modaliteta obilježja,


podaci predstavljaju distribuciju frekvencija
sa:

 fiXi
i 1
f1X1+ f2X2+ f3X3+ ... + fkXk
X= =
f1 + f2 + f3 + ... + fk k

 fi
i 1

78
Ponderirana aritmetička
sredina relativnih frekvencija

 Relativne i apsolutne frekvencije


su upravno proporcionalne!
 X: X1,X2,Xi, ... , Xk

i= 1,2, ..., k
 p: p1,p2, pi, ..., pk

i=1,2, ..., k

 piXi
i 1
p1X1 + p2X2 + piXi+ ... +pkXk
X= = k
f1 + f2 + f3 + ... + fk
 pi
i 1

79
Svojstva aritmetičke sredine

1. svojstvo
Algebarski zbroj odstupanja originalnih
vrijednosti numeričkog obilježja od
aritmetičke sredine jednak je nuli
Σ(Xi – X) = 0

2. svojstvo
Zbroj kvadrata odstupanja originalnih
vrijednosti numeričkog obilježja od
aritmetičke sredine jednak je minimumu
Σ(Xi – X)2 = min.

80
3. svojstvo
Aritmetička sredina uvijek se nalazi
između najmanje i najveće vrijednosti
numeričkog obilježja varijable Xi
Xmin  X  Xmax

4.svojstvo
Ako je vrijednost numeričke varijable Xi
jednaka konstanti c, aritmetička sredina
te varijable jednaka je konstanti c.
X=c

X1 = X2 = ... = Xk = c

5. svojstvo
Aritmetička sredina je sklona ekstremima

81
Medijan

82
Medijan

 Medijan (Me) je srednja pozicijska


vrijednost numeričkog obilježja ili
redoslijednog obilježja

 Medijan je srednja vrijednost redoslijednog


ili numeričkog obilježja koja elemente
osnovnog skupa (statističkog niza)
dijeli na dva jednaka dijela, tako da se
u jednom dijelu nalaze elementi koji
imaju vrijednost obilježja manju ili
jednaku Me ,a u drugom dijelu se
nalaze elementi koji imaju vrijednost
obilježja jednaku ili veću od Me

83
Određivanje medijana
Određivanje medijana moguće je kod:
 Individualnog numeričkog obilježja
 Redoslijednog numeričkog obilježja
 Diskontinuiranog numeričkog obilježja i=1

Izračunavanje medijana
Medijan se izračunava kod:
 Kontinuiranog numeričkog obilježja
 Diskontinuiranog numeričkog obilježja gdje
su razredi različiti od 1

Grafičko određivanje medijana


Medijan se može grafički odrediti uz pomoć:
 Kumulativnog niza “manje od”
 Kumulativnog niza “manje od” i
kumulativnog niza “više od”

84
Određivanje medijana
za individualne vrijednosti

Ako je broj elemenata u skupu:

a) NEPARAN N=(2k+1) onda je Me=k+1


b) PARAN N=2k onda je Me= polusuma
dva srednja elementa

POSTUPAK:
 vrijednosti obilježja poredati po veličini
 odrediti centralnu jedinicu

85
Izračunavane Me kod
grupiranih vrijednosti

 Medijan se ne može odrediti nego se


mora izračunati prilikom:
 Kontinuiranog numeričkog obilježja
 Diskontinuiranog numeričkog obilježja

kada je i>1

 jer nije poznata vrijednost NO za svaki


element, odnosno statističku jedinicu

POSTUPAK:

KORAK 1: Formirati kumulativni niz


KORAK 2: Naći N/2
KORAK 3: Odrediti medijalni razred

86
KORAK 4a: Uvrstiti podatke u formulu za
korištenje kumulativnog niza “manje od”

Me= l1 + N/2 - fi *i


fmed

l1 – donja granica medijalnog razreda

fi – zbroj frekvencija odozgo prema dolje


do medijalnog razreda

i – veličina medijalnog razreda

fmed – originalna frekvencija medijalnog


razreda

87
KORAK 4b: Uvrstiti podatke u formulu za
korištenje kumulativnog niza “više od”

Me= l2 - N/2 - fi


*i
fmed

l2 – gornja granica medijalnog razreda

fi – zbroj frekvencija odozgo prema dolje


do medijalnog razreda

i – veličina medijalnog razreda

fmed – originalna frekvencija medijalnog


razreda

88
Grafičko određivanje
medijana

Aritmetičko
mjerilo za
frekvencije

N/2

Aritmetičko
Me mjerilo za
obilježje
89
Uporaba medijana

 Kod redoslijednog obilježja medijan je


prihvatljivija mjera od aritmetičke sredine

 Za vrlo asimetrične distribucije, te


distribucije s ekstremno visokim i/ili niskim
krajnjim vrijednostima

 Za distribucije s otvorenim razredima


gdje procjena donje odnosno gornje
granice bitno utječe na aritmetičku sredinu

90
Mod
91
MOD (Mo)

 Mod je vrijednost redoslijednog ili


numeričkog obilježja koja se najčešće
javlja u statističkom nizu

 Mod je vrijednost obilježja oko koje se


elementi statističkog skupa najgušće
gomilaju

 Mod dijeli distribuciju frekvencija na


lijevu (rastuću-uzlaznu) i desnu
(opadajuću-silaznu) stranu

92
Utvrđivanje moda

 Mod se utvrđuje ako su jedinice


numeričkog obilježja grupirane u razrede
veličine 1, tada je modalna vrijednost,
vrijednost razreda koji ima najveću
frekvenciju

Primjer:
Ocjena Br.
na ispitu studenata

1 12
2 18
3 31
4 11
5 9
 81
93
Izračunavanje moda

 Mod se izračunava kada su elementi


statističkog skupa (niza) grupirani prema:
 diskontinuirnom numeričkom
obilježju s razredima i>1
 kontinuiranom numeričkom
obilježju

 Kod distribucija koje su grupirane u


razrede nejednakih veličina,
izračunavanju moda prethodi korigiranje
frekvencija: fi
fc=
i

94
 Na temelju određenog Mo razreda (b)
te dva susjedna razreda: lijevog (a) i
desnog (c), izračunava se vrijednost
Mo

Mo  l1 
 b  a
i
 b  a   (b  c )

l1 – donja granica modalnog razreda

b – frekvencija modalnog razreda (najveća


frekvencija)

a – frekvencija razreda ispred Mo razreda

c – frekvencija razreda iza Mo razreda

i – veličina modalnog razreda


95
U distribuciji frekvencija može postojati:

 jedna Mo vrijednost - UNIMODALNA


DISTRIBUCIJA
 dvije Mo vrijednosti - BIMODALNA
DISTRIBUCIJA
 više Mo vrijednosti - MULTIMODALNA
DISTRIBUCIJA

 Grafički se Mo može odrediti kada se na


krivulji distribucije frekvencija (poligon
frekvencija) pronađe najveća ordinata (ili
tjeme) iz kojeg se spušta okomica na
apscisu, gdje se potom pročita vrijednost Mo

96
Nedostaci i prednosti Mo
 NEDOSTACI
 ovisan je načinu formiranja razreda
 nema smisla ako se distribucija približava
pravokutnoj
 sporan je kod bimodalne ili multimodalne
distribucije

 PREDNOSTI
 kod distribucija s ekstremno malim ili velikim
vrijednostima NO Me i x imaju težnju njihovom
približavanju, pri čemu će primicanje Me biti
značajno manje od primicanja x
 Mo neće imati tu tendenciju jer ga određuje
najveća frekvencija

97
Mjere disperzije
98
Mjere disperzije

 Osim značajke distribucije frekvencija


dane u srednjoj vrijednosti, nastaje
potreba za drugom značajkom distribucije
frekvencija koja će izražavati stupanj
varijabilnosti vrijednosti obilježja

 Ta se značajka zove MJERA DISPERZIJE


ili MJERA RASPRŠENOSTI

99
Mjere disperzije

 Osim značajke distribucije frekvencija


dane u srednjoj vrijednosti, nastaje
potreba za drugom značajkom distribucije
frekvencija koja će izražavati stupanj
varijabilnosti vrijednosti obilježja

 Ta se značajka zove MJERA DISPERZIJE


ili MJERA RASPRŠENOSTI

100
 Mjere disperzije mogu biti:
 apsolutne (istorodne distribucije)
 relativne (raznorodne distribucije)

APSOLUTNE M.D. RELATIVNE M.D.

Raspon varijacija Koeficijent


varijacije
Interkvartil
Koeficijent
Kvartilna devijacija kvartilne
devijacije
Srednje apsolutno
odstupanje

Varijanca

Standardna
devijacija

101
Apsolutne mjere
disperzije
 prikladne za uspoređivanje disperzije
samo istorodnih distribucija

Raspon varijacija
Interkvartil
Kvartilna devijacija
Srednje apsolutno odstupanje
Varijanca
Standardna devijacija

102
1. Raspon varijacije (R)
 ili raspon disperzije je gruba informacija o
veličini disperzije između najveće i najmanje
vrijednosti numeričkog obilježja

R= Xmax- Xmin

 Raspon varijacije za distribucije frekvencija s


razredima određuje se kao razlika gornje
granice posljednjeg i donje granice
prvog razreda, ili izračunavanjem razlike
razrednih sredina posljednjeg i prvog
razreda

 Nepouzdana mjera disperzije jer promatra


razliku između ekstremnih vrijednosti, a ne
uzima u obzir raspoređivanje ostalih
podataka
103
2. Interkvartil (Iq)

 KVANTILI – vrijednosti NO koje niz uređen po veličini


dijele na q jednakih dijelova
 KVARTILI – niz uređen po veličini dijele na 4 jednaka
dijela
Q1 – prvi ili donji kvartil

Me – drugi kvartil ili medijan


Q3 – treći ili gornji kvartil

104
Donji kvartil (Q1) – je vrijednost
redosljednog ili numeričkog obilježja, koja
sve elemente u distribuciji frekvencija
dijeli na ¼ (25%) elemenata koji imaju
vrijednost obilježja jednaku ili manju od
vrijednosti donjeg kvartila i na ¾ (75%)
elemenata koji imaju vrijednost obilježja
jednaku ili veću od donjeg kvartila

 Gornji kvartil (Q 3 ) – je vrijednost


redosljednog ili numeričkog obilježja koja
sve elemente u distribuciji frekvencija
dijeli na ¾ (75%) elemenata koji imaju
vrijednost obilježja jednaku ili manju od
gornjeg kvartila i na ¼ (25%) elelmenata
koji imaju vrijednost obilježja jednaku ili
veću od gornjeg kvartila 105
Iq predstavlja raspon između Q3 i Q1

IQ = Q3-Q1

25% 25%
Q1 Me Q3

N/4 N/2 3N/4

50% elemenata

Izražen je u jedinicama u kojima je izraženo i


obilježje
Što je interkvartil brojčano manji to će polovica
svih elemenata statističkog skupa biti više
nagomilana oko Me, a to znači da će disperzija biti
manja i obratno
106
Q1 i Q3 za grupirane vrijednosti
izračunavaju se prema
formulama:
 Prvi kvartil Q1

N
  f1
Q1  l1  4 i
fQ1

 Treći kvartil Q3
3N
  f1
Q3  l1  4 i
fQ3

N – ukupan broj elemenata


L1 – donja granica kvartilnog razreda
fi – suma frekvencija KN “m.o.” do kvartilnog razreda
fQ – originalna frekvencija kvartilnog razreda
i – veličina kvartilnog razreda
107
3. Kvartilna devijacija
Q 3  Q1
 Rang polu-interkvartila Q
2

4. Srednje apsolutno
odstupanje

 prosječna veličina odstupanja


pojedinačnih rezultata (bez obzira na
smjer odstupanja) N

x i X
Za negrupirane vrijednosti MAD  i 1

f i xi  X
Za grupirane vrijednosti MAD  i 1
k

f i 1
i

108
5. Varijanca (ơ²)

 je aritmetička sredina kvadrata odstupanja


vrijednosti numeričkog obilježja od x za...

Za individualne vrijednosti:
X: x1, x2, ...,xN

2  2
 ( xi  x )2
2  2 
N
Za grupirane vrijednosti:
X: x1, x2, ...,xN

f: f1, f2, ..., fN

2  2
 f i ( xi  x )2
2  2 
 fi
109
6. Standardna devijacija (ơ)

 je drugi korijen iz varijance, standardno


odstupanje od prosjeka

  2

110
Relativne mjere
disperzije
 prikladne i za uspoređivanje disperzije
raznorodnih distribucija

Koeficijent varijacije
Koeficijent kvartilne devijacije

111
1. Koeficijent varijacije

 relativna mjera disperzije i služi za uspoređivanje varijabilnosti različitih pojava i


svojstava

 Postotni omjer standardne devijacije i aritmetičke sredine


V  100
X

112
2. Koeficijent kvartilne
devijacije
Disperzija središnjih 50% jedinica

Q3  Q1
Može biti u intervalu od 0 do 1

V Q
Q3  Q1

113
Standardizirano
obilježje
Standardizirano obilježje
 Odstupanja originalnih vrijednosti
numeričkog obilježja od aritmetičke
sredine u raznorodnim distribucijama
frekvencija izračunavaju se s pomoću
standardiziranog obilježja:

 Izračunata odstupanja vrijednosti num.


obilježja od aritmetičke sredine su izražena
u jedinicama standardnih devijacija, te je
na taj način osigurana mogućnost
usporedbe za raznorodne distribucije

115
Svojstva standardiziranog
obilježja

 aritmetička sredina standardiziranog


obilježja jednaka je nuli
 standardna devijacija standardiziranog
obilježja je jednaka 1

Pravilo Čebiševa
 Standardizirana varijabla može poprimiti
i pozitivne i negativne vrijednosti
 One će rijetko odstupati od aritmetičke
sredine za više od +3

-3 -2 -  2 3
116
116
Pravilo Čebiševa
Za zvonolike distribucije
(posebice normalne distribucije):
+1 približno 68% podataka,
+2 približno 95% podataka
(najmanje 75% svih podataka),
+3 približno 99,7% podataka
(najmanje 88,89% svih podataka).

oko

oko

oko
117
Analiza
vremenskih
nizova
118
Vremenski nizovi
 su nizovi istovrsnih podataka
prikupljenih u uzastopnim
vremenskim razmacima ili
trenucima
 namjena analize VN je promatrati
vremenski razvoj pojava, tražiti
zakonitosti pojava i predviđati dalji
razvoj pojava
ZADATAK DINAMIČKE ANALIZE:
 ispitati promjene pojava kao funkciju
vremena
y = f(t)

119
PROBLEM:
 utvrđivanje homogenosti
podataka tijekom promatranog
razdoblja

KOMPONENTE:
 trend komponenta
 ciklička komponenta
 sezonska komponenta
 slučajna komponenta

sistematske, determinističke komp. –


kovarijacije pojave koje se daju izraziti
nekom funkcijom vremena
120
Formiranje vremenskih
nizova

 Vremenski niz je skup kronološki


uređenih veličina koje su odraz
razine intenziteta neke pojave u
izabranim vremenskim točkama
ili intervalima

 Dvije vrste vremenskih nizova:


INTERVALNI i TRENUTAČNI

121
Intervalni vremenski niz

 Pojave s jednim smjerom kretanja


 Intervalno promatranje čijim
grupiranjem nastaje INTERVALNI
NIZOVI

 Intervali promatranja: godina,


mjesec, tjedan, dan, sezona,
školska (akademska) godina,
kazališna ili športska sezona i sl.
 Vremenski intervalni nizovi imaju
svojstvo kumulativnosti

122
Trenutačni vremenski niz

 Pojave s dva smjera kretanja

 Promatraju se u presjeku vremena ili


određenom trenutku ("kritičnom
trenutku"), a nizanjem rezultata takvih
promatranja formirat će se TRENUTAČNI
VREMENSKI NIZ

 Frekvencije trenutačnog vremenskog


niza nemaju svojstvo kumulativnsti

123
Usporedivost frekvencija
vremenskoga niza

 Pojmovna i prostorna definicija ne


smiju se mijenjati
 Jednakost intervala vremena
promatranja
 Ako su vremenska razdoblja
različita, potrebno je korigirati
frekvencije prije uspoređivanja
 Kod trenutačnih vremenskih nizova
razmaci između vremenskih točaka
promatranja nisu bitni za usporedbu
frekvencija
124
Grafičko prikazivanje
vremenskih nizova

Površinski Linijski
INTERVALNI
grafikon grafikon

TRENUTAČNI

Linijski
grafikon

125
Intervalni vremenski niz
a) površinski (pomoću stupaca)
 izgledom i konstrukcijom nalikuje
histogramu
 na X-osi se nanosi vremensko razdoblje
svakog člana vremenskog niza
 na Y-osi se unosi član vremenskog niza za
određeno razdoblje (uz napomenu da
mjerilo na ordinati mora UVIJEK
započinjati s 0)

NAPOMENA: ako razdoblja nisu jednaka


potrebno ih je svesti na zajedničko
razdoblje, a na ordinatu nanositi korigirane
vrijednosti članova vremenskog niza

126
b) linijski

 na X-osi se ucrtava sredina


vremenskog razdoblja
 na Y-osi se unosi određena vrijednost
pripadajućeg člana vremenskog niza,
odnosno korigirana vrijednost ako se
radi o različitim razdobljima

 linijski grafikon pokazuje SMJER i


INTENZITET promjene pojave u
jednom rasponu vremena
 postupnim zbrajanjem članova
vremenskog INTERVALNOG NIZA
odozgo prema dolje, nastaje
kumulativni vremenski niz
127
Trenutačni vremenski niz

samo LINIJSKIM GRAFIKONOM


 na X-os - trenutak promatranja
 na Y-os - pripadajući član vremenskog niza
(frekvenciju- koja je UVIJEK originalna)

 podizanje ordinate na onom mjestu apscise


koje odgovara trenutku promatranja pojave
 jakost apsolutne promjene – strmina
lin.graf.
 razlika dvije susjedne ordinate- apsolutna
promjena pojave u dva trenutka
promatranja
 mogući prekidi (i vodoravni i okomiti)
aritmetičkog mjerila 128
Grafičko uspoređivanje
vremenskih nizova

 Dva se VN mogu usporediti


linijskim grafikonom s
aritmetičkim mjerilom samo ako
su:

a) izražena u istim jedinicama


mjere
b) približnih brojčanih vrijednosti
c) odnose se na isto vremensko
razdoblje

129
Indeksna
metoda
Indeksi

 relativni brojevi dinamike koji


pokazuju relativan odnos između dva ili
više stanja jedne te iste pojave na dva
različita mjesta ili u dva različita
vremenska intervala

 pomoću indeksnih brojeva mogu se


analizirati i trenutačni i intervalni
vremenski nizovi

131
Podjela indeksa

 Prema obuhvatu promatranih pojava:

a) individualni indeksi
 S obzirom na bazu usporedbe:
a) indeksi stalne i
b) indeksi promjenjive baze

b) skupni ili grupni indeksi


a) indeksi cijena
b) indeksi količina
c) indeksi vrijednosti

132
Individualni
indeksi
stalne baze
133
Individualni indeksi
stalne baze
 Dinamika samo jedne pojave pomoću
indeksnih brojeva kroz nekoliko
vremenskih razdoblja
 Baznim indeksima izražavaju se relativne
varijacije između dva stanja istog VN,
od kojih je jedna pojava bazna veličina
Yt

It =

Yb
 Vrijednost kvocjenta pokazuje koliko
jedinica uspoređenih pojava odgovara
svakoj jedinici baznog stanja

134
 POSTUPAK:
1. Izabiranje baze usporedbe:
 Jedan član vremenskog niza
 kod određivanja stalne baze, treba izabrati
reprezentativan član (npr. najčešći član u
nizu), a ne najnižu ili najvišu vrijednost u
nizu
 Neka druga vrijednost:
 Veličina promatrane pojave iz proteklog
vremenskog razdoblja koje nije obuhvaćeno
intervalom promatranja
 AS vrijednosti pojave kada su varijacije
pojave znatne (u oba smjera); baza
usporedbe – prosjek varijacija vremenskog
niza

2. Svi članovi originalnog VN se stavljaju u odnos


prema izabranoj bazi usporedbe

3. Kvocjente pomnožiti sa 100 (radi tumačenja)


135
Pokazatelji

Yt
Koeficijent promjene
Yb

Yt
*100= It Indeks promjene
Yb

It – 100 = St Stopa promjene


(+ rast, - pad)

136
Ako je:

Yt = Yb It=100

Yt > Yb It>100

Yt < Yb It<100

It je uvijek pozitivan

137
Individualni indeksi
na bazi srednje vrijednosti
promatrane pojave

 uspoređivanje dva ili više VN


mjerenih raznorodnim obilježjima
 grafički se prikazuju i površinskim i
linijskim grafikonima
 baza usporedbe – srednja vrijednost
promatrane pojave

Yi
I yi = *100
Y

i=1,2,...,N
138
Pravila za indekse
na stalnoj bazi

 Niz originalnih vrijednosti VN upravno je


proporcionalan nizu indeksa na stalnoj
bazi
 Prikazuju se uglavnom površinskim
grafikonima (ordinata-indeksi u artm.
mjerilu; ishodište = 100 na ordinati)
 Grafikon se čita u odnosu na bazu
 Usporedba varijacija različitih VN, ako svi
VN imaju jednaku bazu
 Izražavaju relativne promjene VN,
neovisne o sustavima i brojčanim
razinama mjerenja u kojima su izražene
originalne vrijednosti originalnih VN
139
Individualni indeksi
s promjenjivom bazom
(verižni ili lančani
indeksi)
140
Verižni ili lančani indeksi

 ako Y1, Y2, Y3, ... Yn, predstavljaju frekvencije


nekog vremenskog niza ,i potrebito je saznati
kako se pojava mjenjala iz razdoblja u
razdoblje, koriste se VERIŽNI ILI LANČANI
INDEKSI
 to su indeksi na PROMJENJIVOJ BAZI ,a
dobiju se dijeljenjem svakog člana vremenskog
niza prethodnim članom te množenjem
dobivenog rezultata sa 100
 svaka originalna vrijednost javlja se kao:
- tekuća vrijednost koja se uspoređuje
- baza uspoređivanja
 iznimke: prva i posljednja orig. vrijednost VN
- prva orig. vrij.–samo baza uspoređivanja
- posljednja orig.vrij.–samo kao tekuća vrij. 141
Verižni indeksi ne mogu biti negativne
veličine, jer su frekvencije vremenskog
niza uvijek pozitivne

Za verižne indekse vrijede sljedeće


relacije:
relacije

 Yt > Y t-1 Vt > 100


 Yt < Y t-1 Vt < 100
 Yt = Y t-1 Vt = 100

 Verižni indeks Vt pokazuje koliko jedinica pojave


u vremenu t dolazi na svakih 100 jedinica u
vremenu t-1
 Govori o relativnoj promjeni neke pojave uvijek u
odnosu na pojavu iz prethodnog perioda.
Intenzitet promjene izražen u postotku dobije se
kao razlika indeksa Vt i veličine 100 ( St=Vt-100 )

142
Grafičko prikazivanje
verižnih indeksa

 specifična vrsta linijskog grafikona


 promjenjiva baza verižnih indeksa zahtjeva
prikazivanje svakog verižnog indeksa
posebnom linijom
 ishodište apscise (koja označava vrijeme)
je na ordinati označeno vrijednošću 100
 verižni indeksi >100: od apscise prema
vrhu ordinate, unutar ili u sredini intervala
jedne godine
 verižni indeksi < 100: od apscise prema
nižim vrijednostima ordinate
 nagib ucrtane linije – intenzitet relativne
promjene
143
Preračunavanje
individualnih
indeksa
144
Preračunavanje baznih
indeksa u verižne

- postupnim dijeljenjem baznih


indeksa (*100)
- kao da je riječ o originalnim
frekvencijama VN

145
Preračunavanje verižnih
u bazne
ako je bazno razdoblje prvo u nizu–
postupnim množenjem:

I t-1 * Vt
It =
100

t=2,3,..., N

ako bazno razdoblje nije prvo u nizu


- bazni indeks za razdoblja koja prethode
baznom:

I t-1 * Vt
It = ; kada je t > b
100

It
I t-1 = *100 ; kada je t < b
V t

I t = 100 ; kada je t = b
146
Srednje vrijednosti
vremenskih
nizova
147
Srednje vrijednosti
vremenskih nizova
 neke pojave su statičkog karaktera
 nemaju opću razvojnu tendenciju
 analiziraju se statičnim srednjim
vrijednostima

 VRSTE:

- AS intervalnog VN
- kronološka sredina trenutačnog VN
- geometrijska sredina
(upotrebljava se u analizi intervalnog i
trenutačnog VN)

148
Kronološka sredina

 Vremenski trenutačni niz je


sastavljen od frekvencija čije se
vrijednosti u pravilu ne mogu
zbrajati te iz toga proizlazi da se za
VTN ne bi mogla izračunati srednja
vrijednost

 Stoga se VTN transformira u IVN te


se pomoću kronološke sredine
računa srednja vrijednost

149
Geometrijska sredina -
srednja vrijednost verižnih
indeksa
(prosječan tempo promjene)

Primjena:
a) u analizi VN negrupiranih i
grupiranih podataka (“prosječan
tempo promjene”)
b) kao srednja vrijednost
numeričkih nizova za nizove sa
asimetričnim rasporedom
podataka

150
Jednostavna, neponderirana
geometrijska sredina

Za N individualnih vrijednosti varijable X


(numeričkog ili vremenskog niza):

G  N x1x 2 x 3 ...x N
N
G  N  xi , xi  0 za svaki xi
i 1

rješava se  log xi
logaritmiranjem: log G 
i 1
N

Logaritam geometrijske sredine jednak je


aritmetičkoj sredini logaritama promatrane
varijable, odnosno, aritmetičke sredine
logaritama elemenata vremenskog niza ili
numeričkog niza.

151
Vagana, ponderirana
geometrijska sredina
Podaci grupirani u distribuciju
frekvencija:
k
N   fi
f1 f2 f3 fN
G  x1 x 2 x 3 ...x N
N
,
i 1
k

 f logi xi k
log G  i 1
, N   fi
N i 1

ne računa se za nizove koji sadrže


vrijednost 0
na njenu veličinu utjecati će
vrijednost svih elemenata
promatranoga niza
manja je od aritmetičke sredine
istoga niza (osim u slučajevima kada su
sve vrijednosti promatranoga niza 152

međusobno jednake)
Skupni
indeksi
153
Skupni indeksi

 Skupnim indeksima se mjeri dinamika


skupine pojava ili se utvrđuju varijacije
heterogene skupine pojava na različitim
mjestima (npr. potrošnja, izvoz,
uvoz,industrijska proizvodnja )

 Najčešće se dinamika heterogenih pojava


prati kroz vrijednosni način izražavanja

 Razlikujemo:
-    skupni indeksi količina
-   skupni indeksi cijena
-    skupni indeks vrijednosti

154
Simboli

• p0 = cijene baznoga razdoblja

• p1 = cijene izvještajnoga razdoblja

• q0 = količine baznoga razdoblja

• q1 = količine izvještajnoga razdoblja

• p0q0 = ponder vrijednosti baznoga

razdoblja

• p1q1 = ponder vrijednosti izvještajnoga


razdoblja

155
Zapamtiti kod izračunavanja
skupnih indeksa

 Sve nizove koji su zadani svesti na


istu bazu (stalnu ili promjenjivu)

 Indekse na stalnoj bazi svesti na


isto bazno razdoblje

156
Linearni
trend
157
Trend

 Ovisno o karakteru čimbenika


koji djeluju u vremenu na neku
pojavu, vremenski niz čine
slijedeće komponente:

a) trend ili osnovna tendencija


kretanja neke pojave kroz
vrijeme
b) sezonske oscilacije, koje se
pojavljuju unutar jedne godine
c) ciklične komponente
d) slučajne komponente, koje čine
slučajni, teško predvidivi
događaji

158
Metode utvrđivanja trenda

Za utvrđivanje trenda mogu se


primijeniti:

- neparametrijske i

- parametrijske metode

159
Neparametrijske metode

- ne rezultiraju matematičkom
jednadžbom trenda.

- dobra prethodnica parametrijskim


metodama

 metoda prostom rukom


 metoda poluprosjeka
 metoda pomičnih prosjeka

Prednost: jednostavno izračunavanje


Nedostatak: ne postojanje trend
vrijednosti za početna i završna
razdoblja niza;
osjetljivost aritmetičke sredine na
ekstremne vrijednosti

160
Parametrijske metode

 Najčešća: metoda najmanjih


kvadrata

Izračunava se jednadžba linije kod


koje će suma odstupanja između
originalnih vrijednosti vremenskog
niza i utvrđenih trend podataka biti
jednaka nuli (model linearnog trenda
jednak je modelu jednostavne
linearne regresije)

161
Metoda najmanjih kvadrata

 izračunava se jednadžba linije kod koje će


suma odstupanja između originalnih
vrijednosti vremenskog niza i utvrđenih
trend podataka biti jednaka 0
 Označe li se podaci sa Yi, a trend podatke
sa Yci, te primjeni li se metoda najmanjih
kvadrata, vrijedi sljedeće:
N

 (Y  Y
i 1
i ci ) 0

 Nadalje vrijedi sljedeće:

 i ci  min imun
( Y
i 1
 Y ) 2

162
Da bi se uočila tendencija razvoja
pojave dobro je:

imati što veći vremenski niz (više frekvencija)

grafički prikazati pojavu – gdje se iz približnog


izgleda nacrtane funkcije donosi sud o mogućem
obliku osnovne tendencije razvoja ili tipu trenda

Ako su promatranja po:

- jednakim intervalima i
- ako su prve diferencije frekvencija približno
konstantne (u apsolutnom izrazu)

osnovna tendencija je linearna,


linearni trend je polinom prvog
stupnja f(x) = a+bx
163
Linearni trend

Jednadžba linearnog trenda je jednadžba


pravca:
Yci=a+bx , i=1,2,...k

gdje su:
Yci – zavisna varijabla (trend vrijednosti)

Xi – oznaka za vrijeme (nezavisna varijabla)


parametar a – vrijednost trenda u ishodištu
parametar b – koeficijent smjera pravca, te
kazuje koliko se pojava mijenja u
jedinici vremena

164
 Kada se izračunava linearni trend kojemu
je ishodište u prvoj godini vremenskog
niza, parametri se izračunavaju na sljedeći
način:

parametar b: parametar a:
N N

x y i i  x  yi
a  y  bx
b i 1
N
i 1
N

x
i 1
2
i  x  xi
i 1

Suma trend vrijednosti mora biti jednaka


sumi originalnih vrijednosti promatranog
niza

165
 Izračunavanje parametara a i b za jednadžbu
linearnog trenda može se pojednostaviti tako da
se ishodište jednadžbe premjesti u sredinu
čitavog promatranog razdoblja

 Formule za izračunavanje parametara a i b su sljedeće:

 xi yi N

y i
b i 1
N
a i 1
y
x
i 1
2
i N

166
Preračunavanje godišnjih
jednadžbi u kraća vremenska
razdoblja
Trend se može izračunati i za vremenske
nizove u kojima su podaci dati u
vremenskim razdobljima koja nisu godišnje
vrijednosti – npr. u polugodištima,
kvartalima, mjesecima i dr.

Pri preračunavanju godišnje jednadžbe


trenda u trend s kraćim vremenskim
razdobljima treba paziti da li se radi o
trenutačnom ili intervalnom vremenskom
nizu

167
A)TRENUTAČNI NIZ –
preračunavanje godišnje jednadžbe u
mjesečnu
parametar “a” ostaje jednak godišnjem
ukoliko se nije promijenilo ishodište
jednadžbe

b
Yci  a  x i , i  1,2,..., N
12

B) INTERVALNI NIZ –
preračunavanje godišnje jednadžbe u
mjesečnu

a b
Yci   xi , i  1,2,..., N
12 144

168
Regresija
i korelacija
169
Korelacija

 utvrđivanje međusobne povezanosti


pojava koje se proučavaju te na osnovi
jedne pojave predviđaju promjene i
zbivanja u drugoj pojavi

POVEZANOST MEĐU POJAVAMA


MOŽE BITI
 uzročno-posljedična

(regresijski model y=a+bx)


y=a+bx
 korelativna

(korelacijski model x=f(y) ili y=f(x))


y=f(x)

170
Uzročno - posljedična
povezanost

 jednostavna

- jedan uzrok jedna posljedica

 složena

- jedan uzrok - više posljedica


- više uzroka - jedna posljedica
- više uzroka i više posljedica

171
Korelativna povezanost

 pojava postoji kada promjene u


jednoj i drugoj pojavi mogu postojati
paralelno ,a da jedno nisu uzrok
drugima

 proučavanjem korelativnih odnosa ne


utvrđuju se uzročno-posljedični odnosi
,ali se pridonosi boljem razumjevanju
pojava i događaja koje istražujemo i
njihovom boljem predviđanju

172
 indikator povezanosti između pojava
je KOEFICIJENT KORELACIJE ili
KOEFICIJENT ASOCIJACIJE između
varijabli

 pokazuje smjer i intenzitet


povezanosti između promatranih,
registriranih i mjerenih pojava

 koef. korelacije vrlo rijetko ukazuje


na uzročno-posljedičnu povezanost,a
puno češće ukazuje na korelativni
odnos između promatranih pojava
173
Korelacijska analiza

1. Utvrđivanje postojanja veze između


pojava ili varijabli (A i B)
2. Utvrđivanje intenziteta i smjera
povezanosti među varijablama
3. Utvrđivanje oblika veze među
varijablama - funkcionalna
4. Utvrđivanje jakosti veze među
pojavama - stohastička
(statistička)

174
Linearna korelacija

 postoji kada je porast jedne pojave


(Y) praćen linearnim porastom ili
padom druge pojave

 DIJAGRAM RASIPANJA (scatter


diagram) – pruža informacije o
obliku, smjeru i jakosti veze

 UKUPNA VARIJANCA= PROTUMAČENI


DIO + NEPROTUMAČENI DIO

175
Koeficijent determinacije
(r2)

protumačeni dio odstupanja


Koeficijent determinacije=
ukupna odstupanja

Kako je r2 dan u drugom


stupnju češće se koristi
PEARSONOV KOEFICIJENT
KORELACIJE (r)

r = ±1

(mjera jakosti samo za LINEARNU korelaciju)

176
 kod tumačenja koeficijenta
korelacije (r) treba imati u vidu da
je nastao iz koeficijenta
determinacije (r2), te da npr.
r=0,70 znači r2=0,49, da je tek 50
% ukupnih odstupanja objašnjivo s
promatrane dvije pojave

177
Krivolinijska

 kada se veza među pojavama


najbolje ilustrira krivom linijom
 prva orjentacija o krivolinijskoj
regresiji se dobiva preko dijagrama
rasipanja na temelju kojeg se
odlučuje koja se matematička krivulja
najbolje prilagođuje nacrtanim
originalnim vrijednostima.Jakost
krivolinijske veze mjeri se INDEKSOM
KORELACIJE  (ro)

178
Odnos koeficijenta
determinacije i koeficijenta
linearne korelacije
r 2
r Tumačenje

0 0 odsutnost
korelacije
0,00-0,25 0,00-0,50 slaba
korelacija
0,25-0,64 0,50-0,80 korelacija
srednje jakosti

0,64-1,00 0,80-1,00 čvrsta


korelacija
1 1 potpuna
(perfektna)
korelacija
179
Parcijalna korelacija

 koristi se u slučaju utvrđivanja


povezanosti između dviju pojava,
eliminirajući utjecaj npr. neke
treće zajedničke varijable

 KORELACIJA RANGA
 jakost veze između pojava
promatranih po redoslijednom
obilježju mjeri se koeficijentom
korelacije ranga

180
 Postupak izračunavanja:

1) upare se vrijednosti redoslijednog


obilježja za svaku statističku jedinicu
2) jednom obilježju odredi se rang i poreda
ga se po redoslijedu – drugo obilježje
mu se pridružuje ne rasparujući
prethodno stvorene parove
3) ako se u nizu pojavi više jednakih
vrijednosti njihovi se rangovi zbroje i
podijele s brojem pojavljivanja, te se
tako izračunana vrijednost pridružuje
jednakim članovima niza

181
4) najniži rang pripada najnižoj vrijednosti

obilježja, najviši rang najvišoj


vrijednoati obilježja
5) izračuna se di=xri – yri kao razlika
ranga za svaku statističku jedinicu
6) izračuna se kvadrat razlika di2

182
Nedostaci:

 nije osobito precizna mjera


 primjenom ovog koeficijenta
korelacije ne mogu se izračunati
ostali pokazatelji kao što su
koeficijent regresije, koeficijent
determinacije, jednadžba analize
varijance, jednadžba regresije.

183
Opis
Opis koeficijenata
koeficijenata korelacije
korelacije
prema
prema jačini
jačini veze
veze

Koeficijent Tumačenje
korelacije

0,00–0,10 Nema povezanosti

0,11-0,25 Jako slaba veza

0,26-0,40 Slaba veza

0,41-0,50 Srednje jaka veza

0,51-0,75 Jaka veza

0,76-0,90 Veoma jaka veza

0,91-1,00 Izuzetno jaka veza


184
Korelacijsko-regresijska
analiza

REGRESIJA
KORELACIJA • omogućava sagledavanje
• ispitivanje veze i zavisnosti očekivane vrijednosti zavisno
između dvije pojave ili promjenjive veličine na osnovi
promjenjive veličine vrijednosti nezavisno
promjenjive veličine
Pokazatelji:
•koeficijent korelacije Pokazatelji:
•koeficijent determinacije • jednadžba regresije
•koeficijent nedeterminacije • standardna pogreška procjene
regresije

185
Analiza regresijskih modela
Osnovicu za analizu reprezentativnosti regresijskih
modela čine sljedeći statistički pokazatelji i
metode:
 Rezidualna odstupanja
 Relativna rezidualna odstupanja
 Standardizirana odstupanja
 Koeficijent determinacije
 Koeficijent korelacije
 Standardna greška regresije
 Analiza varijance (ANOVA)
 Testiranje razine signifikantnosti regresijskih koeficijenata
 Određivanje intervala povjerenja regresijskih koeficijenata
 Određivanje intervala povjerenja prognoziranih vrijednosti
 Testiranje razine signifikantnosti koeficijenta korelacije

186
Koeficijent multiple
determinacije R2 i koeficijent
multiple korelacije R

 Koristi se prosudbu valjanosti i


primjenjivosti modela višestruke
regresije

187
Metoda
uzoraka
188
 ORIGINALNE, EMPIRIJSKE,
OPAŽENE DISTRIBUCIJE su
formirane grupiranjem opažanja ili
elemenata skupa prema nekom obilježju.

 TEORIJSKE DISTRIBUCIJE
očekivane distribucije u skladu s našim
iskustvom ili na temelju teorijskih postavki.
Pretpostavljamo ih u nekom statističkom
modelu ili ih postavljamo kao hipotezu koju
treba ispitati.
Pojavljuju se u funkciji distribucije
vjerojatnosti

189
Teorijske distribucije
diskontinuirane slučajne
varijable

 1. BINOMNA DISTRIBUCIJA

 2. POISSONOVA DISTRIBUCIJA

190
1. BINOMNA DISTRIBUCIJA

 najjednostavnija teorijska distribucija


 distribucija za alternativna obilježja

2. POISSONOVA
DISTRIBUCIJA
 koristi se za opis rijetkih događaja, tj.
događaja s malom vjerojatnošću (br. kvarova
strojeva:mjesečni (tjedni), broj dolazaka po
min. , broj ˇpadovaˇračunala u jednom
mjesecu)

191
Teorijske distribucije
kontinuirane slučajne
varijable

 najpoznatije:

1) NORMALNA (GAUSSOVA) DISTRIBUCIJA


2) STUDENTOVA (t) DISTRIBUCIJA
3) HI-KVADRAT DISTRIBUCIJA
4) F DISTRIBUCIJA

192
1. Normalna (gaussova)
distribucija

 Ima oblik zvona


 Unimodalna je
 Proteže se od - do + 
 Simetrična je, pa je 3=0
 Mjera zaobljenosti je 4=3
 Egzaktan oblik normalne krivulje bit će
poznat ako su poznate arit.sred. i
stand.devij.

193
2. Studentova (t) distribucija

 Kod uzoraka koji broje više od 30


jedinica približava se oblikom i
svojstvima normalnoj distribuciji
 Kod n<30 razvučena je po apscisi (u
odnosu na normalnu)

194
3. F distribucija

 Odnos dviju varijanci

4 . Hi-kvadrat distribucija

 Primjenjuje se kada treba donijeti odluku o


signifikantnosti razlika između stvarnih
(opaženih) i teorijskih (očekivanih)
frekvencija
 Može zauzeti vrijednosti od 0 do 

195
Osnovni skup i uzorak

 Populacija (odluka, koje jedinice


sudjeluju u populaciji )

 Okvir uzorka (popis jedinica, iz


kojeg se izabiru jedinice u uzorak
npr.popis zaposlenih, lista
pretplatnika )

196
Zadaća metode uzoraka

1. Na osnovi uzorka procijene


karakteristike osnovnog skupa

2. Na osnovi podataka donosi se


odluka o prihvaćanju, odnosno
odbacivanju hipoteze koja se
odnosi na neku karakteristiku
osnovnog skupa

197
Koraci u procesu izabiranja
uzorka

1. Određivanje populacije
2. Izabiranje primjerenog okvira
uzorka
3. Izabiranje plana uzorka (metode
za izbor uzorka )
4. Određivanje potrebne veličine
uzorka

198
Vrste planova uzorka

1. UZORCI BEZ PRIMJENE


VJEROJATNOSTI

 Prigodni uzorci
 Namjerni uzorci
 Kvotni uzorci

199
2. UZORCI UZ PRIMJENU
VJEROJATNOSTI

 Jednostavni slučajni uzorak


 Stratificirani uzorak
proporcionalan
neproporcionalan
 Uzorak skupina
sustavan
područni

200
Pitanja:
nmujic@pravos.hr
legcevic@pravos.hr
mmikrut@pravos.hr

201
Literatura:
1. Kazmier, Leonard J.: Business Statistics. McGraw-Hill, 2004.
2. Neufeld, J. L.: Learning Business Statistics with Microsoft Excel,
Prentice Hall, New Jersey, 1997.
3. Newbold, Paul / Carlson, William L. / Thorne, Betty M.: Statistics for
Business and Economics. Prentice-Hall, 2002.
4. Petz, Boris: Osnovne statističke metode za nematematičare. Slap,
Jastrebarsko, 2004.
5. Sekulić, Branko et al.: Primjena matematike za ekonomiste.
Informator, Zagreb 1996.
6. Spiegel, Murray R. / Stephens, Larry J.: Statistics. McGraw-Hill, 1999.
7. Studenmund, A. H.: Using Econometrics: A Practical Guide,
HarperCollins Publishers Inc., New York, 1996.
8. Šošić, I.: Pregled formula iz statistike, Mikrorad, Zagreb
9. Šošić, Ivan / Serdar, Vladimir: Uvod u statistiku. Školska knjiga,
Zagreb, 2002.
10. Šošić, Ivan: Primijenjena statistika. Školska knjiga, Zagreb, 2004.
11. Šošić, Ivan: Zbirka zadataka iz statistike. Mikrorad, Zagreb, 1998.
12. Wonnacott, Thomas H. / Wonnacott, Ronald J.: Introductory
Statistics. Wiley, 1990.

Sve tekuće informacije bit će objavljene na


www.pravos.hr

202
Literatura:
Internet:

1. http://www.efos-statistika.com/
2. HyperStat Online (David M. Lane)
3. Statistics: Power from Data! (Statistics Canada)
4. Introductory Statistics: Concepts, Models and
Applications (David W. Stockburger)
5. Introduction to Probability (Charles M. Grinstead, J.
Laurie Snell)
6. Virtual Laboratories in Probability and Statistics
7. The R Project for Statistical Computing

Sve tekuće informacije bit će objavljene na


www.pravos.hr

203

You might also like