You are on page 1of 86

UMARSKI FAKULTET SARAJEVO

Katedra za uredivanje uma


umarska biometrika
Mr. Azra Cabaravdic, dipl.ing.

UMARSKA BIOMETRIKA

Numericki primjeri

Sarajevo, 2003

Sadraj
UVOD
I.

DESKRIPTIVNA STATISTIKA

Uredivanje statistickih skupova


Graficko prikazivanje statistickih skupova
Mjere centralne tendencije
Mjere varijacije
Mjere oblika distribucije frekevencija

II.

TEORIJSKI RASPOREDI
Normalni raspored
Binomski raspored

III.

REGRESIONA ANALIZA
Linearna regresija
Krivolinijska regresija
Viestruka regresija
Neto korelacije
Korelacija ranga

IV.

TEORIJA UZORAKA
Distribucije statistika uzoraka
Intervalne ocjene parametara osnovnog skupa
Statisticki testovi

UVOD

Pojam biometrika nastao je kao sloenica od bios- ivjeti i metrein- mjeriti.


Zar* naziva biometrikom (biostatistikom) statisticke metode primjenjive na
bioloke probleme. Pojam umarska biometrika odnosi se na skup statistickih
metoda primjenjivih na izucavanje biolokih pojava (procesa) u umarstvu.
Predmet istraivanja umarske biometrike
Predmet biometrijskog istraivanja su masovne pojave. Masovne pojave u
umarstvu predstavljaju skupovi stabala umskog drveca, umskih sastojina, biotskog
svijeta ume (divljac, insekti) i sl.
Radi uocavanja zakonitosti koje se javljaju u prirodi, vre se opaanja masovnih
pojava i registruju njihove manifestacije.
Osnovni zadaci umarske biometrike su:
1. Istraivanje metoda prikupljanja, obrade, prikazivanja i interpretacije
numerickih podataka masovnih pojava,
2. Ocjena vjerovatnoce pojave odredenog opaanja (dogadaja),
3. Postavljanje teorijske osnove za projektovanje istraivanja i experimenata.
Prikupljeni podaci o manifestacijama istraivane masovne pojave analiziraju se
odgovarajucim naucnim statistickim metodama.
U umarstvu se najcece vri istraivanje jedne masovne pojave, uzajamni odnosi
dviju ili vie masovnih pojava, te istraivanje karakteristika osnovnih skupova na
osnovu uzoraka.
Podjela statistickih metoda
Za analiziranje navedenih pojava koriste se :
- deskriptivna statistika,
- regresiona analiza i
- teorija uzoraka.
Osnovni pojmovi
Osnovni pojmovi koji se javljaju u umarskoj biometrici su:
statisticki skup,
bioloki objekat (elemenat statistickog skupa),
varijabla (statisticko obiljeje, varijabilno obiljeje).
Kada se istraivana pojava okarakterie pojmovno, prostorno i vremenski,
govori se o statistickom skupu. Statisticki skup predstavlja skup istovrsnih biolokih
objekata koji se medusobno razlikuju u odnosu na ispitivanu karakteristiku (osobinu,
obiljeje, atribut, varijablu) na odredenom podrucju u odredenom vremenskom
okviru.
Bioloke objekte (elemente statistickog skupa) u umarstvu najcece predstavljaju
stabla, dijelovi stabala (debla, kronje, listovi, cetine, cvjetovi, iarke), skupine
stabala, elementarne povrine (experimentalne povrine - ogledne plohe, povrine
odredene velicine: 1 ha, 1 ar i sl.), biljke, gljive, insekti, divljac.
Karakteristika istraivane pojave, koja se moe razlikovati od jednog biolokog
objekta do drugog, u ovom ce radu biti oznacena pojmom varijabla.

Stabla se npr. medusobno razlikuju u mnogobrojinim karakteristikama koje


variraju - varijablama (taxonomskoj pripadnosti vrsti, starosti, debljini, visini, duini
debla, izgledu kore, boji kore, debljini kore, duini kronje, obliku kronje,
horizontalnoj projekciji kronje, ukupnoj biomasi, biomasi dijelova stabala,
prisustvu/odsustvu deformacija bolesti i insekata i sl). Skupine stabala mogu varirati
po prosjecnoj starosti, smjesi vrsta, omjeru smjese vrsta, ukupnoj zapremini drvne
mase, prosjecnoj visini, prosjecnoj temeljnici i sl.
Elementarne povrine u okviru umskog gazdinstva variraju po prisustvu/odsustvu
drvenastih biljnih vrsta, sastavu biljne zajednice, smjesi drvenastih biljnih vrsta,
omjeru te smjese, prosjecnim velicinama debljine, visine, zapremine stabala, stupnju
pokrivenosti tla kronjama stabala, velicini biomase, biodiverzitetu i sl.
Mnogo je razlicitih varijabli koje su predmet istraivanja u umarstvu, stoga se
izvodi klasifikacija varijabli.
Tipovi biolokih podataka
Klasifikacija varijabli zasniva se na vrsti varijable. Osnovna podjela varijabli je
na:
- kvantitativne (numericke) i
- kvalitativne (atributivne, opisne).
Kvantitativne varijable izraavaju se numericki (brojem). Mogu biti neprekidne
(kontinuirane) i prekidne (diskontinuirane, diskretne). Primjeri neprekidnih varijabli
su debljine, visine, zapremine stabala, duine debala, duine kroanja, povrine
horizontalnnih projekcija kroanja po jedinici povrine i sl. Primjeri prekidnih
varijabli su broj stabala po jedinici povrine, broj deformacija po stablu, broj insekata
po jedinici lisne povrine ili po stablu, broj insekata po klopki, broj divljaci po jedinici
povrine i sl.
Kvalititivne varijable izraavaju se opisno. Primjeri kvalitativnih varijabli su:
pripadnost vrsti, pripadnost kategoriji, tip tla, oblik debla stabla, izgled kore, boja
kore, boja lica, cetina, oblik lica, cetina i sl.
Na razlicite varijable primjenjuju se razlicite statisticke procedure. Vrsta
statistickih procedura zavisi od skale varijable.
Skale podataka
Radi lake preglednosti ustanovljene su sljedece skale:
- nominalna skala,
- ordinalna (skala ranga, redna) skala,
- metricke skale:
- intervalna skala,
- apsolutna (omjerna) skala.
Nominalna skala
Nominalna skala upotrebljava se za analizu kvalitativnih varijabli. Varijabla moe
biti npr. vrsta drveca. Tada razlicite vrste drveca sacinjavaju skalu. Slui za
svrstavanje objekata (stabala) u klase (kategorije).

Ordinalna skala
Ordinalna skala (redna)(skala ranga) se upotrebljava kad je potrebno rangirati
objekte, odnosno klasificirati rang objekta pri cemu skala kvantificira objekte tako da
su manji ili veci jedan od drugog po ispitivanoj varijabli (uzgojno-tehnicka
klasifikacija stabala, tehnicka klasifikacija stabala, razvojni stupanj sastojine).
Metricke skale
Metricke skale odnose na numericka varijable. Mogu biti: intervalna skala i
apsolutna skala.
Intervalna skala
Intervalna skala predstavlja skalu s jednakim razlikama izmedu parova podataka,
ali nula tacka je proizvoljna (npr. prosjecna temperatura experimentalne povrine).
Apsolutna skala
Apsolutna skala je slicna intervalnoj skali, ali na ovoj skali postoji fizicka oznaka
nula tacke. Kako se mogu analizirati omjeri mjerenja, ova skala nosi naziv i mjerna
skala (npr. teina, zapremina). Mjerna skala ukazuje na tacnu razliku izmedu
objekata.
Ponekad podaci s ordinalne, intervalne ili apsolutne skale mjerenja mogu biti
registrovani u kategorijama nominalne skale.
Takode je prakticno, gdje god je moguce, podatke ordinalne skale izraziti
intervalnom ili apsolutnom skalom.
Skala varijable je presudna za statisticku analizu koja treba biti primjenjena.
Najcece se u umarstvu vri proucavanje masovnih pojava cije su manifestacije
numericke neprekidne varijable metricke skale (Primjer 1).

Primjer 1
U sastojini smrce u Han Pijesku 1990 godine, izvreno je mjerenje velicina
taxacionih elemenata stabala, i to: prsnog promjera stabla ( X 1e ) i visine stabla ( X 2e )
te je izvedena velicina zapremine stabla ( X3e ).
Za 132 stabla (bioloka objekta)

({O , O ,....O
1

132

} {O e e = 1,132})

registrovani su podaci o velicinama prsnih promjera (varijable X 1e ).


Tabela 1. Baza podataka
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

X1e
(cm)
16,1
11,0
19,0
24,4
24,0
26,8
6,2
16,5
23,5
12,0
14,1
8,8
8,0
12,6
13,6
6,6
14,7
15,6
18,4
15,8
16,0
15,8
24,8
17,3
16,7
15,0
28,1
22,3
30,2
14,3

e
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

X1e
(cm)
26,4
9,2
20,5
22,4
27,8
17,3
14,9
21,3
15,7
21,7
10,1
13,2
9,7
15,8
17,4
18,7
14,7
14,9
24,9
15,7
24,3
9,1
20,0
20,8
23,6
25,4
17,0
20,7
12,1
18,7

e
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90

X1e
(cm)
16,9
26,5
22,7
13,2
24,4
17,3
25,0
8,8
24,8
10,1
15,0
32,9
20,2
10,3
20,6
15,8
15,0
19,9
21,1
16,1
16,0
19,7
20,4
17,2
15,6
28,3
13,4
21,0
21,5
17,5

e
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120

X1e
(cm)
17,6
10,9
17,0
12,8
16,1
27,7
7,4
18,4
25,1
16,4
16,0
11,6
19,2
16,1
20,2
17,8
18,5
10,1
14,8
17,7
17,5
19,1
20,1
20,3
25,9
23,2
8,9
16,9
17,9
18,0

e
121
122
123
124
125
126
127
128
129
130
131
132
131
132

X1e
(cm)
15,0
17,4
12,1
24,2
25,2
26,8
11,8
15,0
19,0
12,5
11,3
25,9
11,3
25,9

u Tabeli 1

Tabela 2. Pregled simbola u upotrebi


Simbol
Oe
Xi
Xe
X ie
X iet

Naziv simbola

teta

N
K
d
[Li Di ]

fi
ki
(Xi , f i

ST
X
Ci
Me
Mo
H
G
RV
Q
P
dx
2x
x
KQ
RD
KVx
Ze
H
J
3
4
Cij

)
Sigma
Iks bar

Sigma
Sigma

Alfa
Alfa

Znacenje simbola
Objekat
Numericka vrijednost i-tog obiljeja
Numericka vrijednost e-tog objekta
Numericka vrijednost i-tog obiljeja e-tog objekta
Numericka vrijednost i-tog obiljeja e-tog objekta u
t trenutku
Broj podataka u skupu
Broj intervala
Duina intervala
Lijeva i desna granica i-tog intervala
Apsolutna frekvencija i-tog intervala
Redni broj i-tog intervala
Distribucija apsolutnih frekvencija
Suma
Sredinja tacka
Prosjecna velicina, prosjek, aritmeticka sredina
Jedinicna cijena
Medijana
Modus, mod
Harmonijska sredina
Geometrijska sredina
Razmak varijacije
Kvartilna devijacija
10-90 percentilni razmak
Srednje apsolutno odstupanje
Varijansa
Standardna devijacija
Koeficijent interkvartilne devijacije
Relativna devijacija
Koeficijent varirijacije
Standardizirana varijabla
Index biodiverziteta
Relativni diverzitet
Asimetrija
Spljotenost
Kovarijansa

S12. 2

Rezidualna varijansa

S1. 2

Standardna greka regresije


Determinacija
Koeficijent korelacije

ro
ro

Spirmanov koeficijent korelacije


Tablicna vijednost F distribucije

rs
F0. 05, 1, 2

Aritmeticka sredina osnovnog skupa

XO
2O

n
A(X )

Varijansa osnovnog skupa


omega

D 2 (X)
D(X)
Xu
p
q
t, n

Standardna devijacija aritmetickih sredina uzoraka


Aritmeticka sredina uzorka
Propocija ostvarenja
Proporcija neostvarenja
Tablicna vrijednost t distribucije

f it
2

Broj uzoraka
Broj elemenata (podataka) u uzorku
Aritmeticka sredina aritmetickih sredina uzoraka
Varijansa aritmetickih sredina uzoraka

hi

Teorijska frekvencija
Hi kvadrat

DESKRIPTIVNA STATISTIKA
Uredivanje statistickih skupova
Zadatak 1.
Statisticki skup varijable X1e (prsni promjer (cm)) predstavljen u Tabeli 1. urediti u:
a) rastuci niz,
b) distribuciju neintervalnih frekvencija,
c) distribuciju intervalnih frekvencija (apsolutno, relativno, procentualno,
kumulativno, relativno kumulativno).
Rjeenje:
a) Formiranje rastuceg niza je prvi korak uredivanja statistickog skupa. Omogucava
uvid u brojnost skupa i u velicine minimalne i maximalne numericke vrijednosti u
statistickom skupu. Rastuci niz predstavlja numericki ureden niz podataka tako da
je svaki naredni podatak veci ili jednak prethodnom:
X e X e +1 .
Rastucim nizom obuhvaceni svi podaci uredeni pocevi od minimalnog
maximalnog podatka:

do

X Xe X+ .

Tabela 3. Rastuci niz:


6,2 <6,6 <7,4 <8,0 <8,8 =8,8 <8,9 <9,1 <9,2 <9,7 <10,1 =10,1 =10,1 <10,3
<10,9 <11,0 <11,3 <11,6 <11,8 <12,0 <12,1 =12,1 <12,5 <12,6 <12,8 <13,2 =13,2 <13,4
<13,6 <14,1 <14,3 <14,7 =14,7 <14,8 <14,9 =14,9 <15,0 =15,0 =15,0 =15,0 =15,0 <15,6
=15,6 <15,7 =15,7 <15,8 =15,8 =15,8 =15,8 <16,0 =16,0 =16,0 <16,1 =16,1 =16,1 =16,1
<16,4 <16,5 <16,7 <16,9 =16,9 <17,0 =17,0 <17,2 <17,3 =17,3 =17,3 <17,4 =17,4 <17,5
=17,5 <17,6 <17,7 <17,8 <17,9 <18,0 <18,4 =18,4 <18,5 <18,7 =18,7 <19,0 =19,0 <19,1
<19,2 <19,7 <19,9 <20,0 <20,1 <20,2 =20,2 <20,3 <20,4 <20,5 <20,6 <20,7 <20,8 <21,0
<21,1 <21,3 <21,5 <21,7 <22,3 <22,4 <22,7 <23,2 <23,5 <23,6 <24,0 <24,2 <24,3 <24,4
=24,4 <24,8 =24,8 <24,9 <25,0 <25,1 <25,2 <25,4 <25,9 =25,9 <26,4 <26,5 <26,8 =26,8
<27,7 <27,8 <28,1 <28,3 <30,2 <32,9
Rastucim nizom obuhvaceni svi podaci uredeni pocevi od minimalnog
X = 6, 2cm do maximalnog podatka X + = 32,9cm :
X = 6,2 X e X + = 32,9 .

b) Distribucija (raspodjela) neintervalnih frekvencija (broja ponavljanja) (X v , n v ) je


ureden statisticki skup kod kojeg se za svaku numericku varijantu ( X v ) u skupu
registruje broj ponavljanja te varijante (frekvencija) ( n v ). Distribucija
neintervalnih ferkvencija prikazuje se tabelarno:
Tabela 4. Distribucija neintervalnih frekvencija
Xv
6,2
6,6
7,4
8,0
8,8
8,9
9,1
9,2
9,7
10,1
10,3
10,9
11,0
11,3
11,6
11,8
12,0
12,1
12,5
12,6
12,8
13,2
13,4
13,6
14,1
14,3
14,7
14,8
14,9
15,0
15,6
15,7
15,8
16,0
16,1
16,4

nv
1
1
1
1
2
1
1
1
1
3
1
1
1
1
1
1
1
2
1
1
1
2
1
1
1
1
2
1
2
5
2
2
4
3
4
1

Xv
16,5
16,7
16,9
17,0
17,2
17,3
17,4
17,5
17,6
17,7
17,8
17,9
18,0
18,4
18,5
18,7
19,0
19,1
19,2
19,7
19,9
20,0
20,1
20,2
20,3
20,4
20,5
20,6
20,7
20,8
21,0
21,1
21,3
21,5
21,7
22,3

nv
1
1
2
2
1
3
2
2
1
1
1
1
1
2
1
2
2
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1

Xv
22,4
22,7
23,2
23,5
23,6
24,0
24,2
24,3
24,4
24,8
24,9
25,0
25,1
25,2
25,4
25,9
26,4
26,5
26,8
27,7
27,8
28,1
28,3
30,2
32,9

nv
1
1
1
1
1
1
1
1
2
2
1
1
1
1
1
2
1
1
2
1
1
1
1
1
1
132

10

c) Distribucija intervalnih frekvencija se odnosi na ureden statisticki skup kod kojeg


se podaci, radi preglednosti svrstavaju u intervale (Li Di ) .
Broj intervala (K) odreduje se pomocu formule:
log N
K = 1+
= 1 + 3,3 log N ,
log 2
pri cemu se K zaokruuje na cijeli broj dajuci prednost susjednom neparnom cijelom
broju.
U naem primjeru je:

K = 1 + 3,3 log 132 = 7 .

Duina intervala (d) predstavlja razmak izmedu gornje i donje granice intervala.
Duina intervala se odreduje po formuli:
X+ X
d=
.
K
Prakticno je da duina intervala bude izraena cijelim brojem.
32,9 6,2
U naem primjeru je:
d=
= 3,34 4 cm .
8
Donja granica prvog interva la (L1 ) i gornja granica posljednjeg intervala (Dk )
treba da obuhvati sve podatke:
L1 X X e X + D k .
U naem primjeru je:
L1 6, 2 Xe 32,9 Dk .
Donja granica prvog intervala treba da je manja ili jednaka najmanjoj numerickoj
varijanti X :
L1 X .
U naem primjeru je:
L1 = 6 X = 6,2 .
Ostale donje granice intervala odreduju se po formuli:
L i = Li1 + d .
U naem primjeru je:
L 2 = 6 + 4 = 10 ,
L 3 = 10 + 4 = 14 ,
L 4 = 14 + 4 = 18
...
Gornje granice intervala odreduju se po formuli:
Di = L i + ( d 0,1) .
U naem primjeru je:
D 2 = 6 + (4 0,1) = 9,9
D3 = 10 + (4 0,1) = 13,9
D 4 = 14 + (4 0,1) = 17,9
...

11

Interval se aproksimira intervalnim obiljejem (X i ) koje se racuna po formuli:


L + Di
Xi = i
.
2
6 + 9,99&
U naem primjeru je:
X1 =
=8
2
10 + 13,99&
X2 =
= 12
2
14 + 17,99&
X3 =
= 16
2
....
Distribucija intervalnih apsolutnih frekvencija
Kada se za definirane intervale registruje broj podataka cija se numaricka
vrijednost nalazi u intervalu formira se intervalna distribucija apsolutnih frekvencija
(Xi , fi ) (Tabela 3). Suma frekvencija (fi ) intervalno uredene distribucije apsolutnih
frekvencija iznosi ukupan broj podataka N:
K

=N.

i =1

Tabela 5. Intervalno uredenje statistickog skupa

(Li Di )
6-9,9
10-13,9
14-17,9
18-21,9
22-25,9
26-29,9
30-34

Xi
8
12
16
20
24
28
32

frekvencije
IIIII IIIII
IIIII IIIII IIIII IIII
IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII I
IIIII IIIII IIIII IIIII IIIII II
IIIII IIIII IIIII IIIII IIIII
IIIII III
II

U naem primjeru je:

fi
10
19
46
27
20
8
2
132

= 132 .

i =1

Distribucija intervalnih kumulativnih frekvencija

Distribucija intervalnih kumulativnih frekvenc ija X i , Fi+ je ureden statisticki


skup kod koga se u svakom narednom intervalu kumuliraju (sabiraju) apsolutne
frekvencije predhodnih:
i

Fi+ = f j .
j =1

U naem primjeru je:

F1+ = f j = f 1 = 10 ,
j=1

12

F2+ = f j = f1 + f 2 = 10 + 19 = 29 ,
j=1

F3+ = f j = f1 + f 2 + f 3 = 10 + 19 + 46 = 75 ,
j =1

...
Distribucija intervalnih kumulativnih frekvencija X i , Fi je ureden statisticki
skup kod koga se u svakom narednom intervalu oduzimaju apsolutne frekvencije
predhodnih uzimajuci da se prvom intervalu dodjeljuje ukupan broj podataka N.
U naem primjeru je:
F1 = N = 132 ,

F2 = F1 f i = 132 10 = 122 ,

i 1
2

F3 = F2 f i = 122 19 = 103 ,

i =1

...
Distribucija intervalnih relativnih kumulativnih frekvencija X i , RFI je ureden
statisticki skup kod koga se relativne kumulativne frekvencije odreduju po
formuli:
F
RFi = i .
N
10
U naem primjeru je:
RF1+ =
= 0,07
132
29
RF2+ =
= 0,22
132
75
RF3+ =
= 0,57
132
...
odnosno
132
RF1 =
=1
132
122
RF2 =
= 0,92
132
103
RF3 =
= 0,78 .
132

Distribucija intervalnih relativnih frekvencija (Xi , ri ) je ureden statisticki skup kod


koga se relativne frekvencije intervala odreduju po formuli:
f
ri = i .
N
10
U naem primjeru je:
r1 =
= 0,076
132
19
r2 =
= 0,144
132
46
r3 =
= 0,348 .....
132

13

Suma relativnih frekvencija iznosi 1:


K

= 1.

i =1

U naem primjeru je:

= 1.

i =1

Distribucija intervalnih procentualnih frekvencija (Xi , pi ) je ureden statisticki


skup kod koga procentualne frekvencije odreduju po formuli:
f
p i = 100 ri = 100 i .
N
10
U naem primjeru je:
p i = 100
= 7,58
132
19
p 2i = 100
= 14,39
132
46
p 3 = 100
= 34,85
132
...
Suma procentualnih frekvencija iznosi 100 :
K

= 100 .

i =1

U naem primjeru je:

= 100 .

i =1

Tabela 6. Distribucije intervalnih apsolutnih, kumulativnih, relativnih kumulativnih,


relativnih i procentualnih frekvencija

L i Di

Xi

fi

6-9,9
10-13,9
14-17,9
18-21,9
22-25,9
26-29,9
30-34

8
12
16
20
24
28
32

10
19
46
27
20
8
2
132

Fi+
10
29
75
102
122
130
132

RFi+
0,07
0,22
0,57
0,77
0,92
0,98
1,00

Fi
132
122
103
57
30
10
2

RFi
1,00
0,92
0,78
0,43
0,23
0,07
0,01

ri
0,076
0,144
0,348
0,205
0,152
0,061
0,015
1,000

pi
7,58
14,39
34,85
20,45
15,15
6,06
1,52
100

14

Graficko prikazivanje distribucija frekvencija


Zadatak 2.
Distribucije frekvencija Tabele 4. predstaviti graficki i to::
a) distribuciju intervalnih apsolutnih frekvencija (Xi , f i ) - poligonom,
b) distribuciju intervalnih apsolutnih frekvencija (Xi , f i ) - histogramom,
c) distribucije intervalnih kumulativnih frekvencija - poligonom,
Koristeci graficki prikaz s dvije ose, predstaviti poligonima:
d) distribucije intervalnih kumulativnih K+ i intervalnih relativnih
kumulativnih frekvencija i
distribucije intervalnih kumulativnih K- i intervalnih relativnih
kumulativnih frekvencija.
e) distribucije intervalnih apsolutnih i intervalnih relativnih frekvencija i
distribucije intervalnih apsolutnih i intervalnih procentualnih frekvencija.
Rjeenje:
a) Poligon apsolutnih frekvencija je linijski grafikon kod koga se u koordinatnom
sistemu linijski poveu tacke (Xi , f i ) .

fi
50
45
40
35
30
25
20
15
10
5
0
0

12

16

Grafik 1. Poligon apsolutnih frekvencija

20

24

28

32

36

40

Xi(cm)

15

b) Histogram frekvencija predstavlja povrinski poligon koji formira se tako to se


duina intervala koristi kao osnovica provaouganika ciju visina predstavlja apsolutna
frekvencija intervala.
fi
50

45

40

35

30

25

20

15

10

0
6-9,9

10-13,9

14-17,9

18-21,9

Grafik 2. Histogram apsolutnih frekvencija

22-25,9

26-29,9

30-34

Xi(cm)

16

c) Kumulante F+ i F- predstavljaju linijske poligone. Formiraju se tako da se:


- Kod kumulante F+ linijski poveu tacke Di , FI+ i
- Kod kumulane F- linijski poveu tacke L i , Fi .

N
140

120

100

F+
F80

60

40

20

0
0

10

Grafik 3. Kumulane F+ i F-

15

20

25

30

35

40

Xi(cm)

17

d) Koristeci graficki prikaz s dvije y-ose moguce je predstaviti dva tipa distribucije
frekvencija intervalno uredenog statistickog skupa. Pri tome se mogu koristiti
kombinacije linijskog i povrinskog grafikona.
Primjeri.

F+

RF+

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0

140
120
100
80
60
40
20
0
6

12

16

20

24

28

32

F+
RF+

Xi(cm)

Grafik 4. Distribucije kumulativnih F+ i relativnih kumulativnih frekvencija RF+

F-

RF-

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0

140
120
100
80
60
40
20
0
8

12

16

20

24

28

32

34

Xi(cm)

Grafik 5. Distribucije kumulativnih F- i relativnih kumulativnih frekvencija RF-

FRF-

18

f
50

r
0,4

45

0,35

40
0,3
35
0,25

30
25

0,2

20

f
r

0,15

15
0,1
10
0,05

5
0

0
2

12

16

20

24

28

32

38

Xi(cm)

Grafik 6. Distribucije apsolutnih i relativnih frekvencija

50

40

45

35

40
30
35
25

30
25

20

20

15

15
10
10
5

5
0

0
2

12

16
20
Xi(cm)

24

28

Grafik 7. Distribucije apsolutnih i procentualnih frekvencija

32

38

f
p

19

Zadatak 3.
Na terenu je registrovano prisustvo razlicitih vrsta drveca:
Tabela 7. Prisustvo vrsta
Vrsta drveca
Fagus
Abies
Picea
Quercus
Fraxinus
Acer

Oznaka
A
B
C
D
E
F

Frekvencije
44
12
28
8
2
3

Distribuciju frekvencija predstaviti graficki.


Rjeenje:
Kako se u zadatku radi o podacima nominalne skale, ilustrativan je histogram
frekvencija koji pokazuje distribuciju frekvencija kategorija.
f

50
40
30
20
10
0
A

Grafik 8. Histogram frekvencija


Radi uocavanja procentualne zastupljenosti pojedinih vrsta drveca u
posmatranom skupu koristi se kruni dijagram strukturni krug:
E F
D 2% 3%
8%

A
46%
C
29%

B
12%

Grafik 9. Strukturni krug

20

Zadatak 4.
Izvrena je uzgojna klasifikacija 132 stabla za dvije razlicite vrste drveca A i B.
Distribucije frekvencija u uzgojnim klasama su sljedece:
Tabela 8. Uzgojna klasifikacija stabala
Frekvencije
A
18
59
42
13

Uzgojna klasa
I
II
III
IV

B
12
38
46
36

Distribucije frekvencija predstaviti graficki.


Rjeenje:
Kada se analiziraju distribucije frekvencija dva razlicita skupa
istorodnih objekata moe se koristiti uporedni histogram frekvencija. Pri tome se
frekvencije pojedinih intervala (kategorija) razlicitih skupova prikazuju uporedo.
U zadatku se radi o varijabli ordinalne skale pe se na x-osi nalaze
kategorije ranga.

60

50

40
A
B

30

20

10

0
I

II

Grafik 10. Uporedni histogram frekvencija

III

IV

21

Zadatak 5.
U periodu 12.05.-08.09. 2000 vrena su registrovanja brojnosti potkornjaka:
Tabela 9. Ulov potkornjaka
12.05.00 19.05.00. 26.05.00. 02.06.00. 09.06.00. 16.06.00. 23.06.00. 30.06.00. 07.07.00.
1722
874
237
354
800
470
197
69
363
14.07.00. 21.07.00. 28.07.00. 04.08.00. 11.08.00. 18.08.00. 25.08.00. 01.09.00. 08.09.00.
86

30

61

90

38

91

70

77

Distribuciju frekvencija predstaviti graficki.


Rjeenje:
Za graficko prikazivanje vremenskih serija mogu se koristiti linijski i
povrinski dijagrami. Pri tome se na x-osu nanose periodi (datumi) registrovanja
pojave.
f

1800

1600

1400

1200

1000

800

600

400

200

12
.05
.0
19 0
.05
.00
26 .
.05
.0
02 0.
.06
.0
09 0.
.06
.0
16 0.
.06
.00
23 .
.06
.0
30 0.
.06
.00
07 .
.07
.0
14 0.
.07
.0
21 0.
.07
.0
28 0.
.07
.00
04 .
.08
.0
11 0.
.08
.0
18 0.
.08
.00
25 .
.08
.0
01 0.
.09
.0
08 0.
.09
.00
.

Grafik 11. Brojnost potkornjaka u periodu 12.05.-08.09.2001

70

22

Zadatak 6.
U sektorima od po 45 u odnosu na stajalite posmatraca, u toku jednog dana,
registrovana je pojava ptica. Registrovani su podaci:
Tabela 10. Pojava ptica
Sektor
0-45
45-90
90-135
135-180
180-225
225-270
270-315
315-360

Frekvencija
66
29
9
10
14
146
290
201

Distribuciju frekvencija predstaviti graficki.


Rjeenje:
Kod graficke predstave distribucija frekvencija koje se odnose na
registraciju pojave u pojedinim sektorima moe se koristiti polarni dijagram. Pri tome
se na ose polarnog dijagrama (ose sektora) nanose pripadne frekvencije.

0-45
300
315-360

250
200

45-90

150
100
270-315

225-270

Grafik 12. Polarni dijagram

50
0

90-135

135-180

23

Pozicione mjere centralne tendencije


Zadatak 7.
Za statisticki skup varijable X1e iz Tabele 1 odrediti pozicione mjere centralne
tendencije:
a) sredinju tacku,
b) medijanu,
c) modus.
Rjeenje:

a) Sredinja tacka ST predstavlja sredite geometrijske dui X , X + :


X + X+
.
2
Kako je u naem primjeru X = 6, 2cm i X + = 32,9cm , to je sredinja tacka:
6, 2 + 32,9
ST =
= 19,55cm .
2
Znaci, sredite geometrijske dui (6,2;32,9) je 19,55 cm.
ST =

b) Medijana M e je poziciona mjera centralne tendencije. Medijana dijeli posmatrani


statisticki skup na dva jednakobrojna podskupa. Odreduje se kada je statisticki skup
ureden u rastuci (ili opadajuci) niz.
Kod statistickog skupa s neparnim brojem podataka medijana je vrijednost iz
skupa koja se nalazi na poziciji:
N +1
, tj.
2
M e = X N+1 .
2

Kod statistickog skupa s parnim brojem podataka potrebno je odrediti prvi i drugi
centralni podatak:
Xc
- prvi centralni podatak,
X c +1
- drugi centralni podatak,
pri cemu je:
c=

N
.
2

Medijana je tada:

X c + X c +1
.
2
U naem primjeru je X c = 16,4cm i X c +1 = 16,5cm , pa je medijana:
16,4 + 16,5
Me =
= 16, 45cm .
2
Me =

Znaci, polovina podataka u skupu ima vrijednost manju od 16,45cm, dok su


vrijednosti druge polovine skupa vece od 16,45cm.

24

c) Modus M o je poziciona mjera centralne tendencije koja pokazuje koja se


numericka varijanta najcece javlja u statistickom skupu. Moe se lako odrediti kod
uredenog rastuceg niza ili neintervalno uredene distribucije frekvencija, pri cemu se
registruje numericka varijanta koja se najcece javlja (najveca frekvencija).
Na osnovu Tabele 2. utvrdeno je da je modus 15,0 cm, tj.
M o = 15,0cm .
Znaci, u analiziranom statistickom skupu najcece se javlja numericka varijanta
15,0 cm.
Zadatak 8.
Za intervalno uredenu distribuciju apsolutnih frekvencija (Tabele 4) izracunati:
a) medijanu,
b) percentile 10%,35% i 90% , decil D 2 i kvartile Q1, Q2 , Q3 ,
c) modus.

Rjeenje:
a) Kod intervalno uredene distribucije frekvencija medijana M e se dobije iz formule:
N +1
FMe 1
M e = L Me + d 2
f Me
pri cemu je:
L Me lijeva (nia) granica medijanskog intervala,
d
irina medijanskog intervala,
N
broj svih podataka u skupu,
FMe 1 kumulativna frekvencija u predmedijanskom intervalu,
f Me
frekvencija u medijanskom intervalu.
Medijanski interval predstavlja interval u kome se nalazi N/2-ti podatak.
Za na primjer, koritenjem Tabele 4. odredujemo medijanski interval posmatrajuci
kumulantu K+ i registrujuci interval u koji pada 132/2=61 podatak. To je interval (1417,9). Zatim izracunavamo medijanu:
132 + 1
29
M e = 14 + 4 2
= 17,26cm .
46
Znaci, 50 % stabala (61 stablo) ima prsni promjer manji od 17,26 cm.
c) Percentili, decili i kvartili su pozicione mjere centralne tendencije kojima se
odreduju vrijednosti koje skup dijele na podskupove cija brojnost odgovara
odabranom procentu, desetom dijelu ili cetvrtini posmatranog skupa. Kod intervalno
uredene distribucije frekvencija percentil je:

25

(N + 1)
Fp 1
100
P = L p + d p
,
fp
gdje je:
P - percentil,
L p - lijeva granica percentilnog intervala,
d p - duina percentilnog intervala,
Fp 1 - kumulativna frekvencija u pred-percentilnom intervalu,
f p - apsolutna frekvencija percentilnog intervala.

Prvo je potrebno odrediti poziciju percentila P (P ):


( N + 1)
P (P ) =
.
100
U naem primjeru, za deseti percentil P10 kojim se skup brojno dijeli na
podskupove u kojima se nalazi 10% podataka vrijednosti manjih od desetog
percentila i 90% podataka vrijednosti vecih od desetog percentila, pozicija percentila
je:
10(132 + 1)
P (P10 ) =
= 13,3 ,
100
odnosno percentilni interval je interval u kome se nalazi 13,3 (14-ti) podatak.
Posmatrajuci kumulativnu distribuciju frekvencija uocavamo da se 14-ti podatak
nalazi u intervalu :
P10 (10,13.9] .
Koritenjem Tabele 4 izracunavamo 10-ti percentil P10 :
10(132 + 1)
10
100
P10 = 10 + 4
= 10,69cm
19
Znaci, 0% podataka u skupu ima vrijednost manju od 10,69cm.
Za 35-ti percentil P35 :
35(132 + 1)
P (P35 ) =
= 46,55 ? F3+ =75 ? P35 (14,17.9]
100
35(132 + 1)
29
100
P35 = 14 + 4
= 15,52cm
46
Znaci, 35% podataka u skupu ima vrijednost manju od 15,52cm.
Za 90-ti percentil P 90 :
90(132 + 1)
P (P90 ) =
= 119,7 ? F5+ =122? P90 (22,25.9]
100
90(132 + 1)
102
100
P90 = 22 + 4
= 25,54cm
20
Znaci, 90% podataka u skupu ima vrijednost manju od 25,54cm.

26

Decili predstavljaju vrijednosti koje skup brojno dijele na desete dijelove. Mogu biti
izraeni i kao percentili.
Drugi decil D 2 ustvari predstavlja 20-ti percentil P20 .
U naem primjeru je:
20(132 + 1)
P (D 2 ) = P(P20 ) =
= 26,6 ? F2+ =29? P20 (10,13.9]
100
20(132 + 1)
10
100
D 2 = P20 = 10 + 4
= 13,49cm
19
Znaci, 20% podataka u skupu ima vrijednost manju od 13,49cm.

Kvartili predstavljaju vrijednosti koje skup brojno dijele na 25% dijelove. Mogu
biti izraeni i kao percentili. Npr. Q1 je ustvari 25-ti percentil, tj. P25 . Unaem
primjeru se odreduje kao:
25(132 + 1)
P (Q 1 ) = P(P25 ) =
= 33,25 ? F3+ =75? P25 (14,17.9]
100
25(132 + 1)
29
100
Q 1 = P25 = 14 + 4
= 14,37cm
46
Znaci, prvi kvartil je 14,37cm, tj. 25% podataka u skupu ima vrijednost manju od
14,37 cm.
Drugi kvartil Q 2 = P50 = M e :

50(132 + 1)
= 66,5 ? F3+ =75? P50 (14,17.9 ]
100
50(132 + 1)
29
100
Q 2 = P50 = 14 + 4
= 17,26cm
46
Znaci, drugi kvartil je 17,26cm, tj. 50% podataka u skupu ima vrijednost manju od
17,26 cm.
P (Q 2 ) = P(P50 ) = M e =

Za treci kvartil je Q3 = P75 :


75(132 + 1)
P (Q 3 ) = P(P75 ) =
= 99,75 ? F4+ =102? P75 (18, 21.9]
100
75(132 + 1)
75
100
Q 3 = P75 = 18 + 4
= 21,67 cm
27
Znaci, treci kvartil je 21,67cm, tj. 75% podataka u skupu ima vrijednost manju od
21,67 cm.

27

c) Kod intervalno uredene distribucije frekvencija modus M o se odreduje po formuli:


f Mo f Mo 1
M o = L Mo + l Mo
.
(f Mo f Mo1 ) + (fMo f Mo+1 )
pri cemu je :
L Mo = lijeva ( nia ) granica modalnog intervala
d Mo
= irina modalnog intervala
f Mo 1 = apsolutna frekvencija u predmodalnom intervalu
f Mo
= apsolutna frekvencija u modalnom intervalu
f Mo +1 = apsolutna frekvencija u postmodalnom intervalu
Modalni interval je interval s najvecom apsolutnom frekve ncijom f imax , to je naem
slucaju:
f imax =46,
pa je modus:
46 19
M o = 14 + 4
= 16,35cm
(46 19 ) + (46 27)
Znaci, u datoj distribuciji frekvencija najcece se javlja podatak 16,35 cm, tj. najveci
broj stabala ima ve licinu prsnog promjera 16,35 cm.
(Napomena:
Kod intervalno urednih distribucija frekvencija potrebno ja proanalizirati i graficki
prikaz distribucije apsolutnih frekvencija.
Ukoliko se na grafickom prikazu uocava jedan najvii vrh zakljucujemo da je
distribucija frekvencija unimodalna i izracunavamo modus.
Ukoliko se na grafickom prikazu uocava dva dominantna vrha zakljucujemo da je
distribucija frekvencija bimodalna i zakljucujemo da je modus neizvjestan.
Ukoliko se na grafickom prikazu uocava vie dominantnih vrhova zakljucujemo da
je distribucija frekvencija polimodalna i zakljucujemo da je modus neizvjestan.)

28

Racunske (izvedene) mjere centralne tendencije


Aritmeticka sredina
Zadatak 9.
Za statisticki skup varijable X1e iz Tabele 1 izracunati aritmeticku sredinu.
Rjeenje:
a) Aritmeticka sredina negrupisanih podataka predstavlja kolicnik sume svih podataka
i ukupnog broja podataka:
N

X=

Xe
e =1

U naem primjeru je:


X=

16,1 + 11,0 + 19,0 + ... + 25,9 + 11,3 + 25,9


= 17, 25cm
132

Znaci, aritmeticka sredina negrupisanih podataka prsnih promjera iznosi 17,25 cm.

Zadatak 10.
Za intervalno uredenu distribuciju apsolutnih frekvencija iz Tabele 4 izracunati
aritmeticku sredinu.
Rjeenje:
a) Aritmeticka sredina intervalno uredene distribucije apsolutnih frekvencija se
racuna po formuli:
X=

1 k
fiXi .
N i=1

Moe se koristiti i distribucija relativnih frekvencija pri cemu je aritmeticka sredina


suma proizvoda intervalnog obiljeja i relativnih frekvencija:
k

X = ri X i .
i =1

29

Tabela broj 11. Proracun aritmeticke sredine

Xi

fi

ri

Xifi

X i ri

8
12
16
20
24
28
32

10
19
46
27
20
8
2
132

0,076
0,144
0,348
0,205
0,152
0,061
0,015

80
228
736
540
480
224
64
2352

0,61
1,73
5,58
4,09
3,64
1,70
0,48
17,82

X=

1
2352 = 17,82cm
132

X = 17,82cm
Znaci, aritmeticka sredina intervalno grupisanih podataka iznosi 17,82 cm.

Ponderisana aritmeticka sredina


Zadatak 11
Na medustovaritu se nalazi nekoliko vrsta drvnih sortimenata bukve s razlicitim
cijenama po m:
Tabela 12. Pregled sortimentinh zaliha na medjustovaristu
Sortiment
F
L1
L2
I
II
III
VS
Kolicina (m)
14
16
21
24
33
48
64
Cijena (KM) 246
196
141
101
85
61
56
Izracunati prosjecnu cijenu sortimenata na medustovaritu.
Rjeenje:
Kako se radi o izracunavanju aritmeticke sredine za vie podskupova, koristi se tzv.
ponderisna aritmeticka sredina:
N

X=

P X
i

i =1
N

P
i =1

P1X1 + P2 X 2 + ... + PN X N
,
P1 + P2 + ... + PN

gdje su Pi - ponderi (teine) aritmeticke sredine pojedinih podskupova Xi .


U ovom slucaju aritmeticka sredina je:
X=

14 * 246 + 16 *196 + 21* 141 + 24 *101 + 33 * 85 + 48 * 61 + 64 * 56


= 96,74KM
14 + 16 + 21 + 24 + 33 + 48 + 64

30

Znaci, prosjecna cijena drvnih sortimenata na stovaritu iznosi 96,74 KM.


Kvadratna sredina
Zadatak 12.
Za statisticki skup varijable X1e iz Tabele 1. izracunati jednostavnu kvadratnu
sredinu.

Rjeenje:
Kvadratna sredina negrupisanih podataka predstavlja kvadratni korijen aritmeticke
sredine sume kvadrata podataka:
N

K=

K=

X
e=1

2
e

16,12 + 11,02 + ... + 25,9 2


=
132

45942,6
= 18,66cm
132

Znaci, kvadratna sredina negrupisanih podataka prsnih promjera iznosi 18,66 cm.
Zadatak 13.
Za intervalno uredenu distribuciju apsolutnih frekvencija iz Tabele 4 izracunati
kvadratnu sredinu (prsni promjer srednjeg stabla po temeljnici).
Rjeenje:
Kvadratna sredina intervalno uredene distribucije apsolutnih frekvencija se racuna
po formuli:

K=

1 k
fiXi2

N i=1

Tabela broj 13: Proracun kvadratne sredine

Xi

fi

8
12
16
20
24
28
32

10
19
46
27
20
8
2
132

K=

f i Xi

640
2736
11776
10800
11520
6272
2048
45792

1
45792 = 18,63cm
132

Kvadratna sredina intervalno grupisanih podataka iznosi 18,63 cm.


U umarstvu se na ovaj nacin racuna tzv. prsni promjer srednjeg stabla po temeljnici.

31

Harmonijska sredina
Zadatak 14.
Tri radnika, pri istim uslovima rada, izvode kresanje grana. Za kresanje grana
jednog stabla utroe razlicito vrijeme i to:
Radnik
Vrijeme (minuta)

I
10,4

II
16,6

III
12,3

a) Odrediti prosjecno utroeno vrijeme za kresanje grana jednog stabala.


b) Uz pretpostavku da je razlicit broj radnika vrio kresanje grana:
Broj radnika
Vrijeme (minuta)

4
10,4

12
11,6

15
15,1

5
9,9

izracunati prosjecno utroeno vrijeme za kresanje grana jednog stabla.


Rjeenje:

1
a) Kada se varijabla posmatrane pojave izraava reciprocnom vrijednocu
Xe
koristi se harmonijska sredina H.
U ovom slucaju koristi se jednostavna harmonijska sredina H:
H=

N
.
1

e =1 X e
N

U naem primjeru je:


H=

3
3
=
= 12,62 min
1
1
1
0
,
24
+
+
10,4 16,6 12,3

Prosjecno utroeno vrijeme za kresanje grana jednog stabla je 12,62 minuta.


c) Ovdje se radi o sloenoj harmonijskoj sredini jer je vrijednost X i javlja f i puta:

H=

N
.
fi

i =1 X i
k

U naem primjeru je:


H=

4 + 12 + 15 + 5
36
=
= 12,34 min
4
12
15
5
2
,
92
+
+
+
10,4 11,6 15,1 9,9

U ovom slucaju, prosjecno utroeno vrijeme za kresanje grana jednog stabla je 12,34
minuta.

32

Geometrijska sredina
Zadatak 15.
Godinja proizvodnja pilanskih trupaca u jednom preduzecu umarstva bila je:
Godina
Proizvodnja (u 000 m3)

1996 1997 1998


7,8
8,9
11,3

1999 2000 2001


12,8 13,9 14,9

Odrediti prosjecnu godinju proizvodnju pilanskih trupaca.


Rjeenje:
Kako se ovdje proizvodnja mijenja priblino po zakonu geometrijske progresije, za
izracunavanje prosjecne proizvodnje koristi se geometrijska sredina.
Prosjecna godinja proizvodnju pilanskih trupaca racuna se po formuli za jednostavnu
geometrijsku sredinu G:
N

G = N Xi
e =1

Radi jednostavnosti izracunavanja geometrijske sredine, potrebno je izvriti


logaritmiranje predhodne jednacine:
N

log G =

log X
i +1

U naem primjeru je:


log 7,8 + log 8,9 + log 11,3 + log 12,8 + log 13,9 + log 14,9
log G =
= 0,53
6
G= antilog (logG)
Prosjecna proizvodnja pilanskih trupaca je:
G=1,29m .

33

Mjere varijacije
Razmak varijacije
Zadatak 16
Izracunati razmak varijacije statistickog skupa iz Tabele 1.
Rjeenje:
Razmak varijacije statistickog skupa RVx predstavlja razliku izmedu najvece i
najmanje numericke vrijednosti u skupu:
RVx = ( X+ X )
RVx = (32,9 6,2) = 28,7cm
Razmak varijacije statistickog skupa iznosi 28,7 cm.

Kvartilna devijacija
Zadatak 17.
Izracunati kvartilnu devijaciju intervalnih frekvencija iz Tabele 4.
Rjeenje:
Kvartilna devijacija distribucije intervalnih frekvencija Q je definirana sljedecom
formulom:
Q Q1
Q= 3
,
2
gdje su Q1 i Q 3 prvi i treci kvartil u skupu.
U naem primjeru je:
Q=

21,67 14,37
= 3,65cm .
2

Znaci, kvartilna devijacija u analiziranom skupu je 3,65 cm.

10-90 percentilni razmak


Zadatak 18.
Izracunati 10-90 percentilni razmak intervalnih frekvencija iz Tabele 4.
Rjeenje:
10-90 percentilni razmak distribucije intervalnih frekvencija P je
definiran formulom:
P = P90 P10 ,
gdje su P90 i P10 deseti i devedeseti percentil u skupu.
U naem slucaju je:
P = 25,54 10,69 = 14,85cm
Znaci, 10-90 percentilni razmak u analiziranoj distribuciji frekvencija je 14,85 cm.

34

Srednje apsolutno odstupanje


Zadatak 19.
Izracunati :
a) Srednje apsolutno odstupanje statistickog skupa iz Tabele 1,
b) Srednje apsolutno odstupanje distribucije intervalnih frekvencija iz Tabele 4.
Rjeenje:
a) Srednje apsolutno odstupanje statistickog skupa je aritmeticka sredina
apsolutnih vrijednosti odstupanja podataka od aritmeticke sredine:
dx =

1 N
Xe X
N e =1

U naem slucaju:
dx =

1
( 16,1 17,25 + 11,0 17, 25 + ... + 25,9 17,25 ) = 570,66 = 4,32cm
N
132

Srednje apsolutno odstupanje statistickog skupa iznosi 4,32 cm.


b) Srednje apsolutno odstupanje distribucije intervalnih frekvencija:
dx =

1 k
fi Xi X
N i=1

Tabela broj 14: Proracun srednjeg apsolutnog odstupanja

Xi

fi Xi X

fi

8
12
16
20
24
28
32

10
19
46
27
20
8
2
132

98,2
110,5
83,6
58,9
123,6
81,5
28,4
584,7

1
584,7 = 4,4cm
132
Znaci, srednje apsolutno odstupanje u analiziranom skupu je 4,4 cm.
dx =

35

Varijansa
Zadatak 20.
Izracunati:
a) Varijansu i standardnu devijaciju statistickog skupa iz Tabele 1,
b) Varijansu i standardnu devijaciju distribucije intervalnih frekvencija iz Tabele
4.
Rjeenje:
a) Varijansa statistickog skupa je aritmeticka sredina kvadrata odstupanja
podataka od aritmeticke sredine:
1 N
2
2
x = (X e X ) .
N e=1
U navedenom primjeru je:
1
2x =
(16,1 17,25)2 + (11,0 17, 25)2 + ... + (25,9 17,25)2 = 3971,29 = 30,08
N
132

Varijansa analiziranog statistickog skupa iznosi 30,08.


Standardna devijacija je kvadratni korijen varijanse:
2

x = 2x =

1 N
(X e X )
N e=1

x = 30,08 = 5,48 cm
Standardna devijacija statistickog skupa iznosi 5,48 cm. Znaci, prosjecno
odstupanje podataka od njhove aritmeticke sredine iznosi 5,48 cm.
b) Varijansa intervalno uredene distribucije frekvencija se racuna po formuli:
x =
2

1 k
2
f i (X i X ) po def.

N i =1

Standardna devijacija intervalno uredene distribucije frekvencija se racuna po


formuli:

1 k
2
f i (X i X ) po def.

N i =1

x = x 2 =

Pored ovog nacina, varijansa odnosno standardna devijacija mogu se racunati i


pomocu tzv. radnih formula:
x 2 =

1 k
fi X i 2 X 2

N i=1

x = x =
2

odnosno,

1 k
f i Xi 2 X 2

N i =1

36

x =
2

k
1 k
2
( f i X i X f i X i )
N i=1
i =1

x = x =
2

k
1 k
2
( f i X i X f i X i )
N i=1
i =1

Tabela broj 15. Proracun mjera varijabiliteta

Xi

Xi X

fi

8
12
16
20
24
28
32

10
19
46
27
20
8
2
132

fi Xi X

-98,2
-110,5
-83,6
58,9
123,6
81,5
28,4

98,2
110,5
83,6
58,9
123,6
81,5
28,4
584,7

f i (X i X)
964,0
643,2
152,1
128,5
764,3
829,4
402,2
3883,6

U navedenom primjeru je:


-

po definiciji:
x =
2

1
3883,6 = 29, 42
132

x = 29,42 = 5,42cm

po radnim formulama:

x =
2

1
45792 17,82 2 = 29,42
132

x = 29,42 = 5,42cm
x =
2

1
( 45792 17,82 2352) = 29, 42
132

x = 29,42 = 5,42cm

37

Ponderisana varijansa
Zadatak 21:
Za tri ogledne plohe ( o = 1,3) zasada smrce (A, B i C) iste starosti odredeni su:

NO

A
412,0

B
386,0

C
432,0

Xo

14,2

15,4

13,6

2o

18,2

20,2

24,1

gdje su:
N O - broj stabala o-te ogledne plohe,
X o - aritmeticka sredina prsnih promjera stabala o-te ogledne ploha,
2o - varijansa prsnih promjera stabala o-te ogledne ploha.
Izracunati aritmeticku sredinu prsnih promjera i varijansu zajednickog skupa svih
zasada.

Rjeenje:
Kako se radi o tri podskupa jednog zajednickog skupa, koriste se sljedece formule:
- aritmeticka sredina zajednickog skupa:

varijansa zajednickog skupa:

X=

1 K
NoXo
N o=1

X=

1 K
NoXo
N o=1

( )

2x = 2 + 2 tj.
2x =

1 K
1 K
2
2
N

+
N o (X o )2 (X )

o o

N o =1
N o=1

U naem slucaju je:


X=

1
17670 = 14,36 cm,
1230

( ) =
2

1
2573,66 = 20,92 ,
1230

1
2
2
=
254522, 20 14,36 = 0,55 , pa je
1230

2x = 20,92 + 0,55 = 21, 47

38

Dakle, unutarnja varijansa (aritmeticka sredina varijansi zasada) iznosi 20,92.


Vanjska varijansa (prosjecni kvadrat odstupanja aritmetickih sredina zasada od
zajednicke aritmeticke sredine) iznosi 0,55.
Opca varijansa skupa zasada iznosi

21,47.

Varijansa bi- varijantnog obiljeja


Zadatak 22.
U jednom zasadu smrce registrovano je prisustvo/odsustvo bolesti (deformacija)
stabala. Kod 120 stabala utvrdeno je prisustvo bolesti, dok kod 200 stabala nije
utvrdeno prisustvo bolesti.
Odrediti prosjecno prisustvo bolesti, te varijansu i standardnu devijaciju.
Rjeenje:
Prisustvo/odsustvo osobine (pojave) na objektu se definira kao bi- varijantna
varijabla, pri cemu se prisustvo bolesti pojave oznacava s X e = 1 , a odsustvo pojave s
Xe = 0 .
Prosjecno prisustvo osobine (pojave) u skupu se racuna po formuli:
1 n
X = Xe .
N e =1
Varijansa bi- varijantne varijable racuna se po formuli:
2x = pq
pri cemu je:
p - broj objekata s prisustvom pojave:
N

p=

X
e=1

q - broj objekata s odsustvom pojave:


q =1 p .
U navedenom primjeru je:
120
X=
= 0,375 .
320
Prosjecna prisustvo bolesti u zasadu 0,375.
2x = 0,23
Varijansa prisustva bolesti u zasadu je 0,23.
= 0,48
Standardna devijacija prisustva bolesti u zasadu je 0,48.

39

Standardizacija varijable
Zadatak 23:
a) Izvriti transformaciju intervalnog obiljeja X i Tabele 7 u standardiziranu
varijablu Zi ,
b) Formulirati novi statisticki skup standardizirane varijable,
c) Izracunati aritmeticku sredinu, varijansu i standardnu devijaciju standardizirane
distribucije frekvencija.
Rjeenje:
a) Standardizirana varijabla je nova promjenjiva koja se dobije transformacijom
originalnih podataka po formuli:
Zi =

Xi X
.
x

U naem slucaju su:


X = 17,82cm
x = 5,42cm
pa formiramo distribuciju standardizirane varijable:
Tabela 16. Standardizirana distribucija frekvencija.

Xi

fi
8
12
16
20
24
28
32

10
19
46
27
20
8
2
132

Zi

f i ZI

-1,81
-1,07
-0,34
0,40
1,14
1,88
2,62

-18,10
-20,38
-15,42
10,86
22,79
15,02
5,23
0

f i (Zi Z)

32,76
21,86
5,17
4,37
25,98
28,19
13,67
132

b) Novi skup standardizirane varijable definiramo kao Z Zi i = 1, k .

c) Iz Tabele 7 izracunavamo:
Z=

0
= 0,
132

2z =

132
=1.
132

40

Relativne mjere varijacije


Interkvartilna devijacija
Zadatak 24:
Izracunati koeficijent interkvartilne devijacije distribucije intervalnih frekvencija iz
Tabele 4.
Rjeenje:
Koeficijent interkvartilne devijacije intervalno uredene distribucije
frekvencija je:
Q Q1
KQ = 3
100 .
Q1 + Q3
U navedenom primjeru je:
21,67 14,37
KQ =
100 = 22,25% .
21,67 + 14,37

Relativna devijacija
Zadatak 25:
Izracunati:
a) Relativnu devijaciju statistickog skupa iz Tabele 1,
b) Relativnu devijaciju distribucije intervalnih frekvencija iz Tabele 4.
Rjeenje:
a) Relativna devijacija statistickog skupa RD je srednje apsolutno odstupanje
izraeno u procentima aritmeticke sredine:
RD =

d
100 .
X

U navedenom primjeru je:


RD =

4,32
100 = 25,04%
17,25

Relativna devijacija statistickog skupa iznosi 25,04% .


b) Relativna devijacija intervalno uredene distribucije frekvencija je:
d
RD = x 100 .
X
U navedenom primjeru je:
4,4
100 = 24,69% .
17,82
Znaci, relativna devij acija u analiziranom skupu je 24,69%.
RD =

41

Koeficijent varijacije
Zadatak 26:
Izracunati:
a) Koeficijent varijacije statistickog skupa iz Tabele 1,
b) Koeficijent varijacije distribucije intervalnih frekvencija iz Tabele 4.

Rjeenje:
a) Koeficijent varijacije KV je standardna devijacija izraena u procentima
aritmeticke sredine. Pomocu varijacionog koeficijenta utvrduje se u kom
stepenu varira neka osobina.

KVx =

x
100 %
X

U primjeru neuredenog statistickog skupa koeficijent varijacije je:


KVx =

5,48
= 0,3177 = 31,77%
17,25

Koeficijent varijacije neuredenog statistickog skupa iznosi 31,77%.

b) U primjeru intervalno uredenog statistickog skupa je:


KV =

5,42
= 0,3041 = 30, 41% .
17,82

Koeficijent varijacije intervalno uredenog statistickog skupa iznosi 31,77%.

42

Index biodiverziteta
Zadatak 27.
Koristeci podatke iz Tabele 17., odrediti:
a) Shannonov index biodiverziteta,
b) Relativni diverzitet.
Tabela 17. Shannonov index biodiverziteta
Vrsta

Frekvencija

Fagus
Abies
Picea
Quercus
Fraxinus
Acer

44
12
28
8
2
3
97

pi

log (pi )

0,4536
0,1237
0,2887
0,0825
0,0206
0,0309

-0,3433
-0,9076
-0,5396
-1,0837
-1,6857
-1,5097

p i log (p i )
-0,1557
-0,1123
-0,1558
-0,0894
-0,0348
-0,0467
-0,5946

Rjeenje:
a) Shannonov index biodiverziteta predstavlja mjeru varijacije izmedu kategorija i
racuna se po formuli:
k

H = p i log (p i )
i =1

U navedenom primjeru je:

H = 0,59

b) Relativni diverzitet (homogenitet) predstavlja proporciju izmedu prisutnog


diverziteta i maximalno moguceg diverziteta. Kod skupa sa jednakim
frekvencijama u svim kategorijama, relativni diverzitet je jedanak jedan.
Racuna po formuli:
J =

H
,
Hmax

pri cemu je:


Hmax = log (k ) .
U navedenom primjeru je:

Hmax = log (6 ) = 0,78


0,59
J =
= 0,76
0,78
Znaci, u posmatranoj umi sve vrste drveca nisu homogeno zastupljene, nego su neke
vrste zastupljenije od drugih.

43

Mjere oblika distribucija frekvencija


Asimetrija
Zadatak 28.
Za distribuciju apsolutnih frekvencija iz zadataka 1.c) izracunati mjeru asimetrije.
Rjeenje:
Asimetrija distribucije frekvencija 3 se racuna po formuli:

3 =

3
x3

gdje je 3 tzv. Momenat treceg reda.


1 k
3 = f i (Xi X )
N i =1

Tabela broj 18. Proracun asimetrije


Xi
8
12
16
20
24
28
32

fi
10
19
46
27
20
8
2
132

f i (X i X)
-9464,4
-3742,1
-276,5
280,4
4724,7
8444,3
5704,6
5671,1
3

1
5671,1 = 42,96
132
42,96
3 =
= 0,27
5,423
3 =

Data distribucija frekvencija ima pozitivnu (desnu) srednju asimetriju.


(Napomena:
Moguci slucajevi asimetrije:
3 = 3 - simetricna distribucija frekvencija;

3 < 3 - negativan (lijeva) asimetrija (X M e Mo )


3 > 3 - pozitivna (desna) asimetrija (X M e Mo )

44

Spljotenost
Zadatak 29.
Za distribuciju apsolutnih frekvencija iz zadataka 1.c) izracunati mjeru spljotenosti.
Rjeenje:
Spljotenost a 4 se racuna po formuli:

4 =

4
,
x4

gdje je 44 tzv. momenat cetvrtog reda:


1 k
fi (Xi X )
N i=1

4 =

Tabela broj 19. Proracun spljotenosti

fi

8
12
16
20
24
28
32

10
19
46
27
20
8
2
132
4 =

f i (X i X)
92923,2
21772,2
502,7
611,8
29207,5
85978,8
80901,7
311898,0
4

Xi

1
311898 = 2362,86
132

4 =

2362,86
= 2,73
5,42 4

Data distribucija frekvencija je spljotena.


(Napomena:
Moguci slucajevi:
4 =3 - distribucija frekvencija normalno spljotena;
4 <3 - distribucija frekvencija spljotena (iroka);
4 >3 - distribucija frekvencija izduena (uska).)

45

TEORIJSKI RASPOREDI
Normalni (Gaussovog) raspored
Zadatak 30.
Za ispitivanu distribuciju frekvencija prsnih promjera odabrati model teorijskog
rasporeda (provjeriti uvjete za primjenu modela normalnog (Gaussovog) rasporeda).
Navesti model vjerovatnoce odabranog teorijskog rasporeda.
Navesti opci model vjerovatnoce odabranog standardiziranog teorijskog rasporeda.
Rjeenje:
Radi izbora odgovarajuceg teoretskog rasporeda potrebno je utvrditi tip varijable:
neprekidna ili prekidna. U ovom primjeru varijabla je neprekidna, numericka.
Nadalje, za empirijske distribucije frekvencija neprekidne numericke varijable
potrebno je provjeriti odnos medijane, modusa i aritmeticke sredine, te velicine
koeficijenata asimetrije i spljotenosti.
Ukoliko je empirijska distribucija frekvencija neprekidne numericke varijable, te
Me = Mo = X ,
3 = 0 i
4 = 3
za modeliranje analizirane empirijske distribucije frekvencija bira se normalni
(Gaussov) teorijski raspored.
U ovom slucaju:
M e = M o = X ? 17,26 16,35 17,82 ,

3 = 0 ? 3 = 0,27 0 ,
4 = 3 ? 4 = 2,73 3 .
Kako se ispitivana distribucija frekvencija odnosi na numericko, neprekidno
obiljeje, a uz to i priblino zadovoljava navedene uvjete, odabran je teorijski model
normalnog (Gaussovog) rasporeda.
Model vjerovatnoce normalnog rasporeda je:
f (X i ) =

1
2

1 X X
i
2 x

U konkretnom slucaju,

f (Xi ) =

1 X i 17 ,82

5 , 42

1 2
e
2

Opci model vjerovatnoce standardiziranog normalnog rasporeda je:


f (Zi ) =

1 2 Z2
e
.
2

46

Zadatak 31.
Za transformirani standardizirani normalni raspored iz zadatka 10.:
a) odrediti teorijske frekvencije ispitivane distribucije frekvencija metodom ordinata,
b) nacrtati poligon empirijskih i teorijskih frekvencija,
c) odrediti teorijske frekvencije ispitivane distribucije frekvencija metodom
povrina.
Rjeenje:
a) Kod odredivanja teorijskih frekvencija ispitivane distribucije frekvencija
metodom ordinata koriste se utablicene ordinate standardizirane normalne krive
(Tablica 1). Za izracunate vrijednosti standardiziranog obiljeja:
Zi =

Xi X
x

u Tablici ocitavaju se vrijednosti f (Zi ) .


Dalje je
f it =

Nd
f ( Zi ) .
x

[f it ] predstavlja cjelobrojnu zaokruenu vrijednost

f it .

Tabela 20. Proracun teorijskih frekvencija metodom ordinata

Xi
8
12
16
20
24
28
32

fi
10
19
46
27
20
8
2
132

Zi
-1,81
-1,07
-0,34
0,40
1,14
1,88
2,62

f (Zi )
0,0775
0,2251
0,3765
0,3683
0,2083
0,0681
0,0129

f it

[f it ]

7,55
21,91
36,65
35,85
20,28
6,63
1,25

8
22
37
36
21
7
2

130,12

132

47

b)
f
50
45
40
35
30
25
20
15
10
5
0
0

12

16

20

24

28

32

36

40

X (cm)

Grafikon 13. Empirijska i teorijska Gaussova distribucija frekvencija


c) Kod odredivanja teorijskih frekvencija ispitivane distribucije frekvencija metodom
povrina koriste se utablicene povrine ispod standardizirane normalne krive
(Tablica2):
Za Zi <0 ?
P (Zi )k =0,5- P (Zi ) ;
Za Zi >0 ?
P (Zi )k = P (Zi ) -0,5;
f it = Pi N .
Tabela 21. Proracun teorijskih frekvencija metodom povrina

Xi
6
8
12
16
20
24
28
32
34

fi

Zi

10
19
46
27
20
8
2
132

P (Zi )

P (Zi )k

Pi

f it

[f it ]

-2,18
-1,81
-1,07
-0,34
0,4
1,14
1,88

0,0146
0,0351
0,1423
0,3669
0,6554
0,8729
0,9699

0,4854
0,4649
0,3577
0,1331
0,1554
0,3729
0,4699

0,0205
0,1072
0,2246
0,2885
0,2174
0,0971
0,0257

2,71
14,15
29,65
38,08
28,70
12,82
3,39

3
14
30
38
29
13
4

2,62
2,99

0,9956
0,9986

0,4956
0,4986

0,0030
0,9840

0,40
129,88

1
132

127,19

132

48

Zadatak 32.
Pretpostavljajuci model standardiziranog normalnog rasporeda:
a) odrediti vjerovatnocu da stablo ima prsni promjer:
- veci od 30 cm,
- manji od 10 cm;
b) odrediti vjerovatnocu da stablo ima prsni promjer izmedu 15 cm i 25 cm;
c) odrediti prsni promjer d tako da je P(di>d)=0,95;
d) odrediti prsni promjer stabla iznad kojeg se nalazi 10 % najdebljih stabala u
sastojini.
Rjeenje:
a) Za X e = 30cm
30 17,82
= 2,25
5, 42
P (Z 2,25) = 1 0,9878 = 0,0122
Traena vjerovatnoca iznosi 1,22%. Znaci da u analiziranom skup u stabala 1,22%
ili dva stabla imaju prsni promjer veci od 30 cm.
Zi =

Za X e = 10cm
10 17,82
= 1, 44
5,42
P (Z 1, 44) = P(Z 1,44 ) = 1 0,9251 = 0,0749
Traena vjerovatnoca iznosi 7,49%. Znaci da u analiziranom skupu stabala 7,49%
ili deset stabala imaju prsni promjer manji od 10 cm.
Zi =

b) Za X1 = 15cm
X 2 = 25cm

Z1 = 0,5200
Z2 = 1,3247

P ( 0,5200 Z 1,3247) = P(1,3247 ) [1 P( 0,5200 = )] = 0,9066 1 + 0,6985 = 0,6051


Traena vjerovatnoca je 60,51%. Znaci da u analiziranom skupu stabala 60,51% ili
80 stabala ima prsni promjer izmedu 15 i 25 cm.
c)

P (Z Zi ) = 0,95 ?

Zi = 1,64
X i = Zi x + X
X i = 26,73cm
Znaci, u analiziranom skupu stabala 5% stabala ima prsni promjer veci od 26,73 cm.
P (Z Z1 ) = 0,90 ?

Z1 = 1,28
X i = Zi x X
X1 = 24,76cm
Znaci, u analiziranom skupu stabala 10% najdebljih stabala ima prsni promjer iznad
24,76 cm.
d)

49

Binomni raspored
Zadatak 33.
U rasadniku je ispitivano preivljavanje 75 skupina od po 8 sadnica koje su tretirane
hemijskim sredstvom:

Xi

fi
0
1
2
3
4
5
6
7
8

21
26
19
6
2
0
1
0
0
75

a) odabrati model teorijskog rasporeda,


b) izracunati teorijske frekvencije rasporeda,
c) graficki predstaviti empirijsku i teorijsku distribuciju frekvencija.
Rjeenje:
a) U ovom slucaju radi se o numerickoj prekidnoj varijabli, stoga je potrebno
provjeriti koji teorijski raspored za prekidne varijable najbolje odgovara analiziranoj
empirijskoj distribuciji frekvencija.
Ukoliko ispitivana distribucija frekvencija zadovoljava uvjete:
1) varijabla prekidna,
X
2) 0
1
n
X
3) 2 X 1
n

odabire se binomni teorijski raspored.


Kod analizirane distribucije frekvencija je:
1) varijabla prekidna,
1,28
2) 0
1
8
3) 1,34 1,07 ,
to upucuje na zakljucak da analiziranom empirijskom rasporedu odgovara model
teorijskog binomnog rasporeda.

50

b) Odredivanje teorijskih frekvencija


X=

f X
f
i

96
= 1,28
75
X
p =
n
1, 28
p =
= 0,16
8
X=

P(X) se dobije ocitanjem iz Tablica i odnosi se na vjerovatnocu slucajeva za koje


je X=0, 1, 2, 3...
fi se dobije mnoenjem vjerovatnoce P(X) s brojem podataka:

fi = P(X )N .

[f it ] predstavlja cjelobrojnu vrijednost

fi .

Tabela 22. Proracun teorijskih frekvencija binomnog rasporeda

Xi

fi

P (X)

fi

[f it ]

0
1
2
3
4
5
6
7

21
26
19
6
2
0
1
0

0,2479
0,3777
0,2518
0,0959
0,0228
0,0035
0,0003
2E-05

18,591
28,329
18,886
7,1946
1,7130
0,2610
0,0249
0,0014

19
28
19
7
2
0
0
0

4E-07

3E-05

75

75

51

c)
30

25

20

fe
ft

15

10

0
0

Grafik 14. Empirijska i teorijska binomna distribucija frekvencija

52

REGRESIONA ANALIZA
Linearna regresija (korelacija)
Zadatak 34.
Provjerite, na osnovu dijagrama rasipanja tacaka i strucnog razmatranja, da li postoji
korelaciona veza izmedu prsnog promjera i visine stabala (X1e , X 2e ) za 30 stabala
datih u Tabeli 2.
Na osnovu podataka o velicinama koreliranih varijabli (X1e , X2 e ) za 30 stabala iz
Tabele 2. odaberite model regresije.

Tabela 23. Regresiona analiza

(X1e )

(X 2e )

1
2
3

6,2
30,2
6,8

10,5
34,5
8,5

4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

21,2
8,3
15,8
10,2
22,4
11,4
16,3
12,5
23,5
12,6
16,5
18,4
24,4
14,1
17,3
19,6
22,6
14,7
19,4
22,3
23,5
20,1
26,8
28,1
24,7
26,6
24,8

24,5
10,5
14,0
11,5
22,0
10,0
17,0
12,0
25,5
10,0
15,0
18,5
26,0
12,5
16,0
22,0
22,0
15,5
18,5
24,5
27,0
19,0
32,5
35,5
23,5
30,0
28,0

53

X2 (m)
40

35

30

25

20

15

10

0
0

10

Grafik 15. Oblak rasipanja tacaka

15

20

25

30

35 X1 (cm)

54

Zadatak 35.
Izracunajte parametre linearnog regresijskog modela metodom najmanjih kvadrata.
Rjeenje:
Regresijski model:

X 2e = f (X1e )

Linearni regresijski model:

X 2e = a + bX1e
Parametar a naziva se konstanta regresije.
Parametra b naziva se koeficijent regresije.
Metod najmanjih kvadrata
Analogno racunanju varijanse za jednu varijablu, kojom su minimizirani kvadrati
odstupanja od prosjeka, odreduje se model linearne regresije tako da se suma kvadrata
pojedinacnih odstupanja od pravca minimizira:
X 2e = (X2e a bX1e )2 = min
Koeficijenti a i b se odreduju tako da suma kvadrata odstupanja od pravca bude
minimalna po metodu najmanjih kvadrata.
Za odredivanje minimuma, uzimamo parcijalne izvode po a i b i izjednacavamo ih s
nulom. Parcijalni izvodi po a i b su:

X 2e = a + bX1e = F(a , b )
F
= 2( X 2e a bX1e )( 1) = 0
a
X 2e + a 1 + b X1e = 0

na + b X1e = X2 e ? I

F
= 2( X 2e a bX1e )( X1e ) = 0
b
X1e X2e + a X1e + b X12e = 0

a X1e + b X12e = X1eX 2e

? II

Na ovaj nacin se izvodi sistem normalnih jednacina (I i II), cijim se rjeavanjem


odreduju parametri a i b:
n

na + b X1e = X2 e
e =1

e =1

e =1

e =1

e =1

a X1e + b X1e 2 = X1e X2e

55

Proracun parametara linearne regresije


Koristeci jedan od poznatih matematickih nacina rjeavanja sistema dvije linearne
jednacine s dvije nepoznate odreduju se numericke vrijednosti parametara a i b. U
ovom radu navodimo nekoliko primjera odredivanja parametara a i b.
I Gaussov metod eliminacije

30a + 561,30b = 596,50


561,30a + 11719,13b = 12563,65
30II + (561,30) I
30a + 561,30b = 596,50
(30 * 11719,13 (561,30 ) )b = 12563,65 * 30 596,50 * 561,30
2

Iz druge slijedi
uvrstimo u prvu

b = 1,15
i dobijemo

a = 1,68

II Normirani Gaussov metod


30a + 561,30b = 596,50 30
561,30a + 11719,13b = 12563,65

561,30

a 18,71b = 19,88
a + 20,88b = 22,38
2,17b = 2,50
b = 1,15
a = 22,38 20,88 *1,15 = 1,68

III Pomocu determinanti


Determinanta sistema
N

n
=

1e

e =1

e =1
N

1e

= n X X1e
e=1
e =1

2
e1

2
1e

e =1

30
561,30
=
= 30 11719,13 561,30 2 = 36516,21
561,30 11719,13

56

Determinanta uz konstantu regresije a


N

(a ) =

X
e =1

X1e X2e
e =1

(a ) =

2e

1e

e =1
N

X12e

e =1

e =1

= X2e X X1e X2e X1e


e =1

e =1

2
e1

e =1

561,30
561,30
= 561,30 11719,13 12563,65 561,30 = 61515,70
12563,65 11719,13
Konstanta regresija a
(a ) 61515,70
=
= 1,68

36516, 21
Determinanta uz koeficijent regresije b
N

(b) =

e =1
N

1e

e =1

1e

2e

X 2e

e =1

e =1

e =1

= n X1eX 2e X1e X2e

e =1

30
596,50
(b) =
= 30 12563,65 561,30 596,50 = 42094,05
561,30 12563,65
Koeficijent regresije b
(b ) 42094,05
=
= 1,15

36516,21

IV Pomocu kovarijanse:

(X

X1e )(X2 e X2e )

(X X1e )(X 2e X2e )


n
= 1e
2
2
(X1e X1e )
(X1e X1e )
n
X 2e = a + bX 1e
1e

C
b = 122 =
1

a = X 2e bX1e

U datom primjeru je:


b=

1403,10
= 1,15
1217,21

a = 19,88 1,15 18,71 = 1,68

57

Po odredivanju parametara izraavamo model linerane regresije:

X 2e = 1,68 + 1,15X1e
Koeficijent regresije b=1,15 znaci da s porastom prsnog promjera za 1 cm, visina
raste za 1,15 m.

Standardna greka regresije


Zadatak 36.
Na osnovu podataka o velicinama koreliranih varijabli (X1e , X2 e ) za 30 stabala iz
Tabele 2, izracunajte standardnu greku linearne regresije.
Rjeenje:
Standardne greke linearne regresije predstavlja prosjecno odstupanje empirijskih od
procjenjenih vrijednosti.
Proracun standardne greke linearne regresije vri se:
-

po definiciji:

(X
n

s 2.1 = s 2. 1 =
2

s 2.1 = s 22. 1 =

e =1

2e

X 2e

n
149,88
= 4,99 = 2,23m
30

Znaci da visine stabala prosjecno odstupaju 2,23 m od procjenjenih visina.

Determinacija
Zadatak 37.
Na osnovu podataka o velicinama koreliranih varijabli (X1e , X2 e ) za 30 stabala,
izracunajte jacinu korelacione veze.
Interpretirajte izracunati pokazatelj.
Rjeenje:
Jacina veze izraava se determinacijom ? 2 .
2 =

22

22
1617,46 / 30
2 =
= 0,91
1767,34 / 30
Znaci, u konkretnom slucaju, modelom linearne regresije, variranje u visini
objanjava se sa 91 % variranjem prsnih promjera, a ostatak (7%) se odnosi na druge
neobuhvacene faktore.

58

Koeficijent korelacije
Zadatak 38.
Odrediti stupanj meduzavisnosti prsnih promjera i visina.
Rjesenje:
Meduzavisnost se izraava koeficijentom korelacije ? , koji predstavlja kvadratni
korijen iz determinacije ( ? 2 ).
Izracunava se iz:
= 2

U navedenom slucaju je:

= 0,91 = 0,96 ,
to ukazuje na vrlo visok stupanj korelacije izmedu prsnih promjera i visina stabala.

59

Krivolinijska regresija (korelacija)


Parametri modela krivolinjske regresije
Zadatak 39.
Za podatake o velicinama koreliranih varijabli (X1e , X2 e ) za 20 stabala datih u
Tabeli X , koristeci modele krivolinijske regresije odredite:
- parametre modela,
- standardnu greku regresije,
- determinaciju i
- index korelacije.
Tabela 24. Krivolinijska regresija - polinom drugog stupnja

X 2e

X 12e

X1e X 2e

X 31e

X 14e

X 12e X 2e

X1e

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

16,50 14,30 272,25 235,95


4492,1
74120,1
3893,2
17,40 15,40 302,76 267,96
5268
91663,6
4662,5
16,10 15,90 259,21 255,99
4173,3
67189,8
4121,4
17,50 17,60 306,25 308,00
5359,4
93789,1
5390
18,40 19,70 338,56 362,48
6229,5 114622,9
6669,6
15,80 15,30 249,64 241,74
3944,3
62320,1
3819,5
18,50 18,80 342,25 347,80
6331,6 117135,1
6434,3
15,60 13,30 243,36 207,48
3796,4
59224,1
3236,7
19,00 17,50 361,00 332,50
6859
130321
6317,5
15,40 12,20 237,16 187,88
3652,3
56244,9
2893,4
20,20 21,10 408,04 426,22
8242,4 166496,6
8609,6
14,70 15,50 216,09 227,85
3176,5
46694,9
3349,4
20,40 22,60 416,16 461,04
8489,7 173189,1
9405,2
14,10 12,90 198,81 181,89
2803,2
39525,4
2564,6
20,60 22,80 424,36 469,68
8741,8 180081,4
9675,4
13,60 14,00 184,96 190,40
2515,5
34210,2
2589,4
21,50 22,80 462,25 490,20
9938,4 213675,1
10539,3
13,60 10,50 184,96 142,80
2515,5
34210,2
1942,1
14,70 11,20 216,09 164,64
3176,5
46694,9
2420,2
23,50 23,20 552,25 545,20
12977,9 304980,1
12812,2
347,10 336,60 6176,41 6047,70 112683,24 2106388,5 111345,62

Rjeenje:
Krivolinijsku regresiju moemo izraziti polinomom k-tog stupnja:
k

X*2e = b0 + b jX1je .
j =1

Polinom drugog stupnja:


2
X2e = b0 + b1X1e + b2 X1e

X*2e
15,8
17
15,2
17,2
18,4
14,8
18,5
14,5
19,2
14,2
20,7
13,2
21
12,3
21,2
11,5
22,4
11,5
13,2
24,7
336,6

60

Sistem normalnih jednacina za polinom drugog stupnja:

e =1

e =1

na + b X 1e + c X 1e =
n

X
e =1

2e

a X 1e + b X 1 e + c X 1e =
2

e =1
n

e =1
n

e =1
n

a X 1e + b X 1 e + c X 1 e =
2

e =1

e =1

e =1

e=1

1e

X
e =1

Proracun parametara modela:


-

Gausov metod eliminacije

20a + 347,10b + 6176, 41c = 336,600


347,10a + 6176, 41b + 112683,24c = 6047,700
6176,41a + 112683,24b + 2106388,50c = 111345,622
20a + 347,10b + 6176, 41c = 336,600
20 II + ( 347,10 )I Aa + Cc = D
20 III + ( 6176, 41)I Eb + Fc = K
A = 20 6176,41 347,102
C = 20 112683, 24 347,10 6176,41
E = 20 112683,24 6176,41 347,10
F = 20 2106388,50 6176,412
20a + 347,10b + 6176, 41c = 336,600
Aa + Cc = D
IIIA IIE (FA CE )c = AK DE
c = 0,02
b = 2,01
a = 12,44

X 2e
2

1e

X 2e

61

Normirani Gausov metod eliminacije


20a + 347,10b + 6176,41c = 336,600 / 20
347,10a + 6176,41b + 112683,24c = 6047,700 / 347,10
6176,41a + 112683,24b + 2106388,50c = 111345,622 / 6176,41
a 17,36 b 308,82c = 16,830 I
a + 17,79b + 324,64c = 17, 424 II
a + 18, 24b + 341,04c = 18,028 III
I + II 0,44 b + 15,82c = 0,594 / 0,44
I + III 0,89b + 32,22c = 1,198 0,89
b 36,01c = 1,351
b + 36, 23c = 1,347
0,22c = 0,004
c = 0,02
b = 1,198 32,22 0,02 = 2,01
a = 18,028 341,04 0,02 18,24 2,01 = 12, 44

Dakle, odgovarajuca jednacina regresije polinoma drugog stupnja je:


2
X2e = 12,44 + 2,01X1e 0,02X1e

Standardna greka krivolinijske regresije


-po definiciji

(X
n

e =1

s 2.1 = s 2.1 =
2

2e

X
2e

n
40,36
= 2,02 = 1,42 m
20

s 2.1 = s 22.1 =

Determinacija ? 2
- po definiciji

(X
n

=
2

e =1
n

(X
e =1

2 =

2e

2 /n
X
2e

2e

X 2e / n

278,72 / 20
= 0,87
319,08 / 20

22.1
22

ili

62

-pomocu rezidualne varijanse:


s2
2
= 1 2.21
2
40,36 / 20
2
=1
= 0,87
319,08 / 20
U konkretnom slucaju, krivolinijskom korelacionom vezom (polinomom drugog
stupnja) promjene u visini objanjavaju se sa 93 % promjenama u prsnom precniku, a
ostatak (7%) se duguje drugim neobuhvacenim faktorima.
Index korelacije ?
-po definiciji

= 2

= 0,87 = 0,93

Viestruka regresija
Parametri modela viestruke linerane regresije
Zadatak 40:
Na osnovu podataka o velicinama koreliranih varijabli ( X1e , X2e , X3e ) (prsni
promjer, visina, volumen stabla) za 30 stabala datih u Tabeli Y, odredite model
viestruke (multiple) linearne regresije tj. odredite parametre funkcije izravnanja
( X 3e = f (X1e , X2e ) ) metodom najmanjih kvadrata.
Rjeenje:
Model viestruke (muliple) regresije X 3e = f (X1e , X2e ) odnosi se na

X3e = + * X1e + * X 2e
Sistem normalnih jednacina za proracun parametara jednacine viestruke regresije

N + ( X1e ) + ( X2e ) = ( X3e )


e =1

e =1

e =1

e =1

e =1

e =1

e =1

e =1

e =1

( X1e ) + ( X1e ) + ( X1eX 2e ) = ( X1e X3e )


2

e =1

e =1

( X2e ) + ( X1e * X2 e ) + ( X2e 2 ) = ( X2 e X3e )

63

Tabela broj 25. Viestruka regresija

e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

X1e

X 2e

16,12 14,93
10,98 10,54
18,98 18,53
24,41 27,60
24,00 26,81
26,82 32,55
6,21
8,82
16,47 15,33
23,46 25,79
11,98 11,19
14,07 12,86
8,81
9,48
7,99
9,20
12,56 11,61
13,63 12,48
6,56
8,87
14,71 13,47
15,57 14,34
18,41 17,74
15,78 14,56
15,98 14,78
15,75 14,53
24,76 28,28
17,25 16,25
16,72 15,62
15,00 13,75
28,07 35,37
22,25 23,63
30,20 40,49
14,26 13,03
507,78 532,41

X3e
0,15
0,05
0,25
0,62
0,58
0,88
0,01
0,16
0,53
0,06
0,10
0,03
0,02
0,07
0,09
0,01
0,11
0,13
0,23
0,14
0,14
0,14
0,65
0,18
0,16
0,12
1,05
0,44
1,38
0,10
8,55

X32e
0,02
0,00
0,06
0,38
0,34
0,77
0,00
0,02
0,28
0,00
0,01
0,00
0,00
0,00
0,01
0,00
0,01
0,02
0,05
0,02
0,02
0,02
0,42
0,03
0,03
0,01
1,09
0,19
1,92
0,01
5,75

X1e X 3e

X12e

2,35 259,88
0,52 120,55
4,75 360,42
15,06 596,06
13,90 576,16
23,54 719,11
0,08
38,62
2,57 271,20
12,49 550,36
0,72 143,62
1,34 197,95
0,24
77,59
0,18
63,76
0,86 157,70
1,18 185,81
0,09
43,03
1,61 216,46
2,03 242,57
4,15 338,90
2,14 248,93
2,26 255,36
2,13 248,14
16,10 613,17
3,13 297,61
2,74 279,59
1,74 225,02
29,35 788,14
9,77 495,22
41,81 911,80
1,42 203,21
200,25 9725,93

X 2e X 3e
2,17
0,50
4,64
17,02
15,53
28,57
0,11
2,39
13,73
0,67
1,23
0,26
0,20
0,80
1,08
0,13
1,47
1,87
4,00
1,98
2,09
1,96
18,39
2,95
2,56
1,60
36,97
10,37
56,06
1,29
232,60

X 22e
223,01
111,04
343,31
761,52
718,58
1059,34
77,86
234,89
665,03
125,19
165,45
89,78
84,56
134,70
155,63
78,71
181,36
205,67
314,73
211,93
218,39
211,15
799,61
264,22
243,95
189,08
1251,04
558,57
1639,58
169,86
11487,72

X1e X 3e
2,35
0,52
4,75
15,06
13,90
23,54
0,08
2,57
12,49
0,72
1,34
0,24
0,18
0,86
1,18
0,09
1,61
2,03
4,15
2,14
2,26
2,13
16,10
3,13
2,74
1,74
29,35
9,77
41,81
1,42
200,25

64

I nacin: Normiranje jednadbi - Gausov metod eliminacije


30 + 507,8 + 532, 4 = 8,6 30
507,8 + 9725,9 + 10474,6 = 200,3 / 507,8
532,4 + 10474,6 + 11487,7 = 232,6 532,4
16,925 17,747 = 0,285 I
+ 19,154 + 20,628 = 0,7394 II
+ 19,674 + 21,577 = 0,437 III
I + II 2,228 + 2,881 = 0,109 / 2,228
I + III 2,748 + 3,829 = 0,152 2,748
1,293 = 0,049
+ 1,394 = 0,055
0,100 = 0,006
= 0,061
= 0,055 1,394 * 0,061 = 0,03
= 0,437 19,674 * (0,03) 21,577 * 0,061 =0,29
X 3e = 0,29 0,03X1e + 0,061X2e

II nacin : pomocu determinanti (Kramerovo pravilo)

12
C12

C12
2
= 1222 C12
2
2

() =

C13
C23

C12
= 22C13 C12C 23
22

( ) =

12
C12

C13
= 12C23 C12C13
C23

12 =

1
(X1e X1e )2
n

12 =

1
(X1e X1e )2
n

12 =

1
(X1e X1e )2
n

C12 =

1
(X1e X1e )(X2 e X2e )
n

65

C13 =

1
(X1e X1e )(X3e X3e )
n

C23 =

1
(X2e X 2e )(X3e X3e )
n

()

( )

= X 3 X 1 X 2

37,71 48,77
= 37,71 * 67,97 48,772 = 184,74
48,77 67,97

() =

1,85 48,77
= 1,85 * 67,97 2,69 * 48,77 = 5,64
2,69 67,97

( ) =

37,71 1,85
= 37,71 * 2,69 48,77 * 1,85 = 11,37
48,77 2,69
=

5,64
= 0,03
184,74
11,37
= 0,06
184,74

= 0,28 0,03 *16,92 0,06 * 17,75 = 0,29

X 3e = 0, 29 0,03X1e + 0,061X 2e

66

Standardna greka viestruke linearne regresije


Zadatak 41.
Na osnovu podataka o velicinama koreliranih varijabli ( X1e , X2e , X3e ) za 30
stabala, za viestruku linearnu regresiju odredite standardnu greku regresije.
Rjeenje:
Proracun standardne greke viestruke regresije vri se pomocu formule:

(X
n

s 3. 12 =

3e

X
3e

e =1

U nasem slucaju:
s 3. 12 = 0,0011
s 3. 12 = 0,0332m 3

Znaci, prosjecno odstupanje zapremina stabala od ravni definirane prsnim promjerom


i visinom stabala je 0,0332 m.

Determinacija
Zadatak 42.
Na osnovu podataka o velicinama koreliranih varijabli ( X1e , X2e , X3e ) za 30
stabala, za viestruku linearnu regresiju odredite mjere jacine krivolinijske regresije :
determinaciju i index korelacije.
Rjeenje:
Proracun jacine viestruke korelacije vri se
s 23.12
0,0011
2
3.12 = 1 2 = 1
= 0,9902
0,1105
3

3.12 = 23.12 = 0,9902 = 0,9951

Komentar: U konkretnom slucaju, viestrukom korelacionom vezom promjene u


volumenu stabla objanjavaju se sa 99,02 % promjenama u prsnom promjeru i visini ,
a ostatak (0,98%) se duguje drugim neobuhvacenim faktorima.

67

Neto korelacije
Modeli neto regresija
Zadatak 43.
Odrediti modele neto regresije za zavisnost volumena stabala (X3e ) od prsnog
promjera (X1e ) i visine stabala (X 2e ) .
Rjeenje:
Model viestruke linearne regresije:

X 3e = + X1e + X2e
X 3e = 0,29 0,03X1e + 0,06X 2e

Modeli parcijalnih linearnih regresija odnose se na:

(1) X 3. 12 = + X1e + X2e

X 3. 12 = 0,29 0,03X1e + 0,06 * 17,75


X 3e = 1,35 0,03X1e

(2) X 3. 21 = + X1e + X 2e

X 3. 12 = 0,29 0,03 * 16,92 + 0,06X 2e e


X 3. 12 = 50,99 + 0,06 X2e

68

Neto korelacije
Zadatak 44.
Odrediti parcijalne korelacije izmedu volumena stabala (X3e ) i prsnog promjera
(X1e ) i visine stabala (X 2e ) ,pomocu determinanti (koeficijenata parcijalnih
korelacija).
Rjeenje:
Korelaciona matrica

1 r12 r13
R = r21 1 r 23
r31 r32 1
rij =

Cij
i j

(X X )(X X )
(X X ) (X X )
ie

ie

je

je

ie

ie

je

je

1463,10
= 0,9632
1131,34 * 2039,11

r12 =

55,5221
= 0,9067
1131,34 * 3,31
80,85
=
= 0,9835
2039,11 * 3,31

r13 =
r23

Korelaciona matrica:

0,9632 0,9067
1

R = 0,9632
1
0,9835
0,9067 0,9835
1
Determinanta korelacione matrice:

det R = 1

1
0,9835
0,9632 0,9835
0,9632
1
0,9632
+ 0,9067
= 0,0007
0,9835
1
0,9067
1
0,9067 0,9835

Minori:

69

M11 =

1
r32

r32
2
= 1 r32
1

M11 =

1
0,9835
= 1 0,9835 2 = 0,0327
0,9835
1

M 22 =

1
0,9067
= 1 0,9067 2 = 0,1778
0,9067
1

M 33 =

1
0,9632
= 1 0,96322 = 0,0720
0,9632
1

Algebarski kofaktori:
R ij = ( 1) M ij
i+ j

R11 = 0,0327
R 22 = 0,1778
R 33 = 0,0720
Parcijalne korelacije
rij. k =

R ij
R iiR jj

R13 =0,0406
R11 =0,0327
R 33 =0,0720
r13. 2 =

1R13
1 * 0,0406
=
= 0,8371
R11R 33 0,0327 * 0,0720

R 23 =-0,1100
R 22 =0,1778
r23. 1 =

1R 23
1* 0,11
=
= 0,9720
0,1778
R 22R 33

70

Tabela 25. Koeficijenti parcijalnih korelacija

A = (X1e X1e ), B = (X 2 e X 2e ), C = (X 3e X 3e )

X1e
X 2e
X3e A
B
C
A
B
C
AB
16,12 14,93 0,15 -0,81 -2,81 -0,14
0,65
7,91 0,02
2,27
10,98 10,54 0,05 -5,95 -7,21 -0,24
35,36
51,97 0,06
42,87
18,98 18,53 0,25
2,06 0,78 -0,03
4,24
0,61 0,00
1,61
24,41
27,6 0,62
7,49 9,85 0,33
56,08
97,00 0,11
73,75
24,00 26,81 0,58
7,08 9,06 0,29
50,09
82,07 0,09
64,12
26,82 32,55 0,88
9,89 14,8 0,59
97,82 219,06 0,35 146,38
6,21
8,82 0,01 -10,71 -8,92 -0,27 114,74
79,62 0,07
95,58
16,47 15,33 0,16 -0,46 -2,42 -0,13
0,21
5,86 0,02
1,11
23,46 25,79 0,53
6,53 8,04 0,25
42,69
64,66 0,06
52,54
11,98 11,19 0,06 -4,94 -6,56 -0,22
24,42
43,01 0,05
32,41
14,07 12,86 0,10 -2,86 -4,88 -0,19
8,16
23,85 0,04
13,95
8,81
9,48 0,03 -8,12 -8,27 -0,26
65,90
68,42 0,07
67,15
7,99
9,20 0,02 -8,94 -8,55 -0,26
79,94
73,13 0,07
76,45
12,56 11,61 0,07 -4,37 -6,14 -0,22
19,08
37,71 0,05
26,83
13,63 12,48 0,09 -3,29 -5,27 -0,20
10,85
27,79 0,04
17,37
6,56
8,87 0,01 -10,37 -8,88 -0,27 107,46
78,77 0,07
92,00
14,71 13,47 0,11 -2,21 -4,28 -0,18
4,90
18,32 0,03
9,47
15,57 14,34 0,13 -1,35 -3,41 -0,15
1,83
11,60 0,02
4,60
18,41 17,74 0,23
1,48 -0,01 -0,06
2,20
0,00 0,00
-0,01
15,78 14,56 0,14 -1,15 -3,19 -0,15
1,32
10,17 0,02
3,66
15,98 14,78 0,14 -0,95 -2,97 -0,14
0,89
8,81 0,02
2,81
15,75 14,53 0,14 -1,17 -3,22 -0,15
1,38
10,34 0,02
3,77
24,76 28,28 0,65
7,84 10,53 0,37
61,41 110,89 0,13
82,52
17,25 16,25 0,18
0,33 -1,49 -0,1
0,11
2,23 0,01
-0,49
16,72 15,62 0,16 -0,21 -2,13 -0,12
0,04
4,53 0,01
0,44
15,00 13,75 0,12 -1,93 -4,00 -0,17
3,71
15,97 0,03
7,69
28,07 35,37 1,05 11,15 17,62 0,76 124,28 310,58 0,58 196,46
22,25 23,63 0,44
5,33 5,89 0,15
28,38
34,66 0,02
31,36
30,20 40,49 1,38 13,27 22,74 1,10 176,09 517,33 1,21 301,82
14,26 13,03 0,10 -2,67 -4,71 -0,19
7,13
22,22 0,03
12,59
507,78 532,41 8,55
1131,34 2039,11 3,31 1463,10

AC

BC

0,11
1,41
-0,07
2,48
2,08
5,86
2,92
0,06
1,62
1,11
0,54
2,09
2,35
0,95
0,65
2,81
0,39
0,21
-0,09
0,17
0,14
0,18
2,86
-0,03
0,02
0,33
8,48
0,82
14,59
0,50
55,52

0,39
1,71
-0,03
3,27
2,66
8,77
2,43
0,31
1,99
1,47
0,93
2,13
2,25
1,33
1,04
2,40
0,75
0,53
0,00
0,48
0,43
0,48
3,85
0,15
0,26
0,68
13,40
0,91
25,01
0,88
80,85

Korelacija ranga
Spearmanov koeficijent korelacije ranga
Zadatak 45.
Dva sumarska inzinjera ocijenila su kvalitet deset razlicitih stabala hrasta koristeci
skalu od 1 do 100.
Ocjene za pojedina stabla predstavljena su u Tabeli 26:

71

Tabela 26. Ocjena kvaliteta stabala


Osoba A
Bodovi

Osoba B
Bodovi

Rang
17
24
27
19
37
44
56
35
72
88

1
3
4
2
6
7
8
5
9
10

Rang
17
15
30
16
38
44
70
41
68
91

Razlike
3
1
4
2
5
7
9
6
8
10

-2
2
0
0
1
0
-1
-1
1
0

Provjeriti postoji li, uz vjerovatnocu od 95%, statisticki znacajna razlika izvedenih


ocjena izmedju ova dva sumarska inzinjera.
Rjesenje:
Posto je kvalitet stabala ocijenjen na osnovu skale ranga, za ocjenu signifikantnosti
razlike koristi se tzv. Spirmanov (Spearman) koeficijent korelacije ranga:
rs = 1

6 d 2i

n n2 1

U nasem slucaju je:


rs = 1

6 *12
= 0,927 .
10(100 1)

Dobijenu vrijednost poredimo s tablicnom vrijednoscu datoj u Tabeli kriticnih


vrijednosti Sprimanovog koeficijenta korelacije ranga :

rT = 0,564 .
Uocava se da je izracunata vrijednost Spirmanovog koeficijenta korelacije ranga
veca od kriticne vrijednosti, te zakljucujemo da je korelacija statisticki znacajna, tj. da
postoji znacajna povezanost izmedju nacina ocjenjivanja ova dva sumarska inzinjera.

72

Distribucije statistika uzoraka


Zadatak 46.
Pretpostavimo da osnovni skup cini pet stabala s visinama: 37, 42, 55, 50 i 46 m.
a) Koliko ima razlicitih uzoraka od po dva stabla? Koji su to uzorci? Odrediti
aritmeticku sredinu visine osnovnog skupa. Odrediti procjenu aritmeticke sredine
visine osnovnog skupa koristeci aritmeticke sredine visina uzoraka. Izracunati
standardnu greku aritmeticke sredine visine koristeci procjenu sredine uzorcima.
b) Koliko ima razlicitih uzorka od po cetiri stabla? Koji su to uzorci? Odrediti
standardnu greku aritmeticke sredine visine u ovom slucaju.
c) Uporediti standardne greke aritmeticke sredine visine pri navedene dvije
velicine uzoraka.
Rjeenje:
a) Broj mogucih uzoraka bez ponavljanja elemenata u uzorku velicine n
N
N!
CnN = =
n n!( N n )!
Broj mogucih uzoraka velicine n=2:
N=5 ; n=2;
C 52 =

5!
5 * 4 * 3 * 2 *1
5 * 4 * 3! 5 * 4
=
=
=
= 10
2!*(5 2)! ( 2 * 1) * (3 * 2 * 1)
2 * 3!
2

Moguci uzorci od po dva stabla u uzorku i njihove aritmeticke sredine visina:


37,42 X1 = 39,5m
37,55 X 2 = 46,0m
37,50 X 3 = 43,5m
37,46 X 4 = 41,5m
42,55 X 5 = 48,5m
42,50 X 6 = 46,0m
42,46 X 7 = 44,0m
55,50 X 8 = 52,5m
55,46 X 9 = 50,5m
50,46 X10 = 48,0 m
Aritmeticka sredina osnovnog skupa (X O ) :
1
XO =
N

X
e =1

73

Aritmeticka sredina visine skupa od pet stabala:


XO =

37 + 42 + 55 + 50 + 46
= 46,0m
5

Procjena aritmeticke sredine osnovnog skupa uzorcima (A(X )) :


1
A (X ) = X u
u =1
XO =

39,5 + 46,0 + 43,5 + 41,5 + 48,5 + 46,0 + 44,0 + 52,5 + 50,5 + 48,0
= 46,0m
10

Varijansa sredina uzorka D2 (X ) :


D (X ) =
2

1 2
2
X u (X O )

u =1

Tabela 27. Proracun statistika uzorka uzoraka od po dva stabla


Xu
X u2
39,5
46,0
43,5
41,5
48,5
46,0
44,0
52,5
50,5
48,0
460,0

1560,2
2116,0
1892,2
1722,2
2352,2
2116,0
1936,0
2756,2
2550,2
2304,0
21305,5

D 2 (X) = 2130;55 46,02 = 14,55


Standardna devijacija aritmeticke sredine visine uzorka D(X) :
D (X ) = D 2 (X )

D(X) = 3,81m
b) Broj mogucih uzoraka velicine n=4:
C 54 =

5!
5 * 4!
=
=5
4!*1!
4!

74

Tabela 28. Moguci uzorci

(Xi i = 1, 2,3, 4)
37, 42, 55, 50
37, 55, 50, 46
37, 42, 50, 46
37, 42, 55, 46
42, 55, 50, 46

Xi2

Xi

46,00 2116,00
47,00 2209,00
43,75 1914,06
45,00 2025,00
48,25 2328,06
230,00 10592,10

Varijansa aritmeticke sredine visine uzorka stabala sacinjenog od aritmetickih


sredina mogucih uzoraka od po cetiri stabla:

( )

1
230,00
D X = 10592,10
= 2,42
5
5
Standardna devijacija aritmeticke sredine visine uzorka D(X) :
D(X) = 1,56m
2

c) to je veci uzorak, ocekuje se manji varijabilitet izmedu svih mogucih procjena


uzorcima.

Procjene parametara osnovnog skupa pomocu uzorka


Interval povjerenja aritmeticke sredine osnovnog skupa
Zadatak 47.
Premjerom 24 probne povrine velicine 1 ha u sastojini velicine 90 ha, utvrdene su
sljedece velicine zalihe krupne drvne mase po ha :
316,7 304,4 315,3
236 301,4 174,6 151,9 266,5 269,1 306,8 193,4 209,2
186,7 313,4 316,5 308,5 189,3 220,7 254,9
197 189,6 186,9 211,5 248,9
a) Odrediti interval povjerenja, uz vjerovatnocu od 95 %, za:
1) prosjecnu zalihu sastojine,
2) totalnu zalihu sastojine,
3) totalnu vrijednost zalihe drvne mase sastojine ako je 1m drvne mase vrijedi
220 KM,
b) Odrediti velicinu uzorka za tacnost procjene od 5%.

75

Rjeenje:
a) Za ocjenu intervala povjerenja potrebno je izracunati statistike uzorka.
Tabela 29.

Proracun statistika uzorka

Xi

Xi2

316,73 100317,89
304,4
92659,36
315,25
99382,56
235,98
55686,56
301,41
90847,99
174,58
30478,18
151,92
23079,69
266,48
71011,59
269,06
72393,28
306,77
94107,83
193,42
37411,30
209,16
43747,91
186,7
34856,89
313,44
98244,63
316,52 100184,91
308,48
95159,91
189,31
35838,28
220,72
48717,32
254,92
64984,21
197,03
38820,82
189,59
35944,37
186,94
34946,56
211,5
44732,25
248,93
61966,14
5869,24 1505520,43
Intervala povjerenja
X u Zc D (X u ) X o X u + ZcD (X u )

D(Xu ) =
-

u
- standardna greka aritmeticke sredine uzoraka
n

za n<30:
Xo = Xu t

o
n
1
N
n

76

Xu =

Xu =

5869,24
= 244,55m 3 / ha
24

( X)
X n 1

u =

u =

2
i

n 1

5869,24 2
24 1 = 3051,65 = 55,24m 3 / ha
24 1

1505520,43

D(Xu ) =

x
55,24
=
= 11,27 m 3 / ha
n
24

t 0.05, 23 = 2,068

95% interval povjerenja za prosjecnu zalihu drvne mase sastojine


244,55 2,068

55, 24
24
55,24
24
1
< X O < 244,55 + 2,068
1
90
90
24
24
224,59 m/ha < X O < 264,51 m/ha

b) 95% interval povjerenja za totalnu zalihu drvne mase sastojine


X T = NX ? X T = 90 * 244,55 = 2209,5m 3
2u T = N2

N n 2u
?
N n

2u T = 902

90 24 3051,65
= 755283,38 ? X = 869,07 m3
T
90
24

2209,5 2,068 * 869,07 < X T < 2209,5 + 2,068 * 869,07

20212,26 m < X T < 23806,74 m

c) 95% interval povjerenja za vrijednost totalne zalihe drvne mase sastojine


X * = X TC ?
*XT = XT C ?

X* = 2209,5 * 220 = 4842090KM


*X = 869,07 * 220 = 191195, 45KM
T

4842090 2,068 *191195,45 < X* < 4842090 + 2,068 *191195,45

77

444669,81 KM < X* < 5237482,19 KM


Zapaa se da najveca moguca razlika procjene zalihe od 4842090 KM od stvarne
vrijednosti zalihe, na bazi uzorka navedene velicine, iznosi 395392,19 KM (8%).
d) Potrebna velicina uzorka
n=
KV =

4 * (KV)2
E2

u
55,24
100 ? KV =
*100 = 22,59
X
244,55

E = 5%

n=

4 * 22,59 2
52

82

Zadatak 48.
Premjerom debljina 19 stabala obuhvacenih uzorkom ( stopa izbora 0,125) na
oglednoj plohi, dobijene su sljedece statistike :
X u = 32,3cm
u = 7,9cm
Ocijenite uz vjerovatnocu od 95 %:
a) Interval povjerenja aritmeticke sredine osnovnog skupa,
b) Interval povjerenja standardne devijacije osnovnog skupa,
Rjesenje:
a) Ocjena intervala povjerenja aritmeticke sredine osnovnog skupa
Xo = Xu t

o
n
1
N
n

stopa izbora=

XU = 32,3 2,101

n
N

7,9
1 0,125
19

X +O = 35,86cm
X O = 28,73cm
Na bazi statistickog uzorka ,uz vjerovatnocu od 95 % procjenjujem da se
aritmeticka sredina osnovnog skupa krece u intervalu od 28,73 cm do 35,86 cm.

78

b) Ocjena intervala povjerenja standardne devijacije osnovnog skupa


u Zc D ( u ) o X u + Zc D ( u )

D(u ) =

2u
2n

u
n
1
N
2n
7,9
o = 7,9 2,101
1 0,125
2 *19
+o = 10,42cm
o = u t

o = 5,38cm
Na bazi statistickog uzorka ,uz vjerovatnocu od 95 % procjenjujem da se
standardna devijacija osnovnog skupa krece u intervalu od 5,38 cm do 10,42 cm.

Statisticki testovi
t-test
Zadatak 49.
Na terenu su testirani uticaji dva razlicita feromona PH i IP. Pri tome su dnevno
registrovane brojnosti ulovljenih potkornjaka:
PH
IP

4960 524 1290 892 2240


2760 296 777 457 2840

3480 2320 2560 625 4300 3440 2540


2960 1640 1524 107 2000 2220 2060

Testirati znacajnost razlika ulova potkornjaka razlicitim feromonima.


Rjeenje:
H0: 1 = 2 (test parova)
(Nema statisticki znacajne razlike izmedu prosjecnih ulova pri upotrebi dva
feromona uz vjerovatnocu od 95%.)
U ovom slucaju koristi se t-test parova:

t=

d
,
sd

pri cemu je:

sd =

d 2j

2
(
dj )

n
n * (n 1)

Izracunata t- vrijednost se poredi s tablicnom t- vrijednoscu iz Tablica t-distribucije na


osnovu odabrane vjerovatnoce i velicine uzorka.

4500
4400

79

Tabela 30. Proracun vrijednosti za test parova


PH

IP

4960
524
1290
892
2240
3480
2320
2560
625
4300
3440
2540
4500
33671

2760
296
777
457
2840
2960
1640
1524
107
2000
2220
2060
4400
24041

t=

dj

2200
228
513
435
-600
520
680
1036
518
2300
1220
480
100
9630

d 2j
4840000
51984
263169
189225
360000
270400
462400
1073296
268324
5290000
1488400
230400
10000
14797598

740,77
= 3,35
221,65

t 0.05,(1), n 1 ? t 0.05,(1),12 = 1,78

Zakljucak: Hipoteza se ne prihvata.


Znaci, postoje statisticki znacajna razlika izmedu prosjecnog ulova potkornjaka s dva
ispitivana feromona uz vjerovatnocu od 95%, odnosno nivo rizika od 5%.

80

Zadatak 50.
Dati su prosjecne visine, varijanse i velicine dva uzorka iz sastojina smrce:
X1 = 22 m, 12 = 12 , n1 =9 i
X2 = 18 m, 22 = 15 , n 2 =11.
Testirati razliku prosjecnih visina uzoraka uz vjerovatnocu od 95 %. Napisati
zakljucak.
Rjeenje:
H O : X1 = X2 (test nezavisnih uzoraka)
(Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka dviju razlicitih
sastojina uz vjerovatnocu od 95%.)
Testiranje razlike izmedu dvije aritmeticke sredine
t=

X1 X 2
sX X
1

s X1 X2 =

s12 s 22
12 15
+
? s X1 X2 =
+
= 2,09m
n1 n 2
9 11
t=

22 18
= 1,91
2,09

t 0.05,(2 ), n1 +n 2 ? t 0.05,( 2), 20 = 2,09


t < t 0.05,(2 ), n1 +n 2

Hipoteza se ne odbacuje.
Zakljucak: Ne postoje statisticki znacajne razlike izmedu prosjecnih visina u
razlicitim sastojinama smrce.)
Zadatak 51.
Provjeriti da li se varijansa Uzorka 1 statisticki znacajno razlikuje od varijanse
Uzorka 2 uz vjerovatnocu od 95 %, pri cemu su:
n 1 = 16 ; 12 = 25 ,
n 2 = 11 ; 22 = 10 .
Rjesenje:
U ovom slucaju primjenjuje se F-test, pri cemu se izracunata vrijednost
F = 12 / 22
F = 25 / 10 = 2,5
poredi s tablicnom vrijednoscu iz Tablica F distibucije
F*(n 1 , n 2 )0, 05
F * (15, ;10) 0,05 = 2,85

Kako je F < F * zakljucujemo da nema statisticki znacajne razlike izmedju varijansi


ovih uzoraka.

81

Viestruka poredenja
Slucajni blok sistem analiza varijanse
Zadatak 52.
Registrovane su visine stabala tri razlicite provenijencije aria.

X1
21,08
22,89
20,03
20,18
18,08

X2
24,63
23,98
19,77
18,81
17,48

X3
20,31
22,05
24,78
18,58
21,50

Provjeriti postoje li statisticki znacajne razlike u visinama stabala razlicitih


provenijencija uz vjerovatnocu od 95%.
H O : X1 = X 2 = X3

Rjeenje:

(Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka tri razlicite
provenijencije aria uz vjerovatnocu od 95%.)
Tabela 31. Jednostruka analiza varijanse
ANOVA
Izvori varijacije
Izmedu grupa
Unutar grupa
Ukupno

SK
2,4608
73,9393
76,4001

df
2
12
14

PK

1,2304
6,1616

0,1997

P-value
0,8217

F0 .05,2

3,8853

F0.05, 2 = 3,8853

F=0,1997< F0.05, 2 = 3,8853


Hipoteza se ne odbacuje.
Zakljucak:
Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka tri razlicite
provenijencije aria uz vjerovatnocu od 95%.

82

Zadatak 53.
Postavljen je slucajni blok plan radi testiranja razlicitih provenijencija aria. Pri
tome su registrovane prosjecne visine provenijencija u blokovima:
Provenijencija(P) / Blok
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10

I
14,50
19,33
16,25
18,75
17,20
21,75
17,50
19,70
13,83
17,33

II
21,75
20,00
19,60
18,25
20,33
24,83
18,88
19,50
16,25
19,83

III
20,60
20,00
20,25
14,50
20,00
22,00
25,17
19,13
23,17
21,00

Provjeriti razlike u prosjecnim visinama razlicitih provenijencija aria zasadenih u


tri razlicita bloka.
Rjeenje:
H O : X1 = X 2 = X3
(Nema statisticki znacajnih razlika izmedu prosjecnih visina blokova uz vjerovatnocu
od 95%.)
H O : P1 = P2 = ..... = P10
(Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka deset razlicitih
provenijencija aria uz vjerovatnocu od 95%.)
Tabela 32. Dvostruka analiza varijanse
ANOVA
Izvori varijacije
Sk
df
Provenijencije
65,423
9
Blokovi
48,572
2
Greka
101,49 18
Total
215,48 29

PK
7,2692
24,286
5,6383

F
P-value
1,2893 0,3078
4,3073 0,0296

F crit
2,4563
3,5546

Provenijencije
Fprovenijencija < Fprovenijencija , crit

Hipoteza se ne odbacuje.
Zakljucak:
Nema statisticki znacajnih razlika izmedu prosjecnih visina uzoraka deset razlicitih
provenijencija aria uz vjerovatnocu od 95%.

83

Blokovi:
Fblokova > Fblokova ,crit
Hipoteza se ne prihvata.
Zakljucak:
Postoje statisticki znacajne razlike izmedu prosjecnih visina
vjerovatnocu od 95%.

blokova

uz

U ovom slucaju pristupa se multipom testu i to t-testu najmanjih znacajnih razlika


(NZR):
Tabela 33. Visestruka poredjenja prosjecnih visinaa blokova (NZR)
Blok I
I

Blok J
Razlika Prosjeka (I-J) Signifikantnost
II
-2,3080(*)
,048
III
-2,9680(*)
,013
II
I
2,3080(*)
,048
III
-,6600
,558
III
I
2,9680(*)
,013
II
,6600
,558
* Razlika prosjeka je signifikantna na nivou od 0,05.

Znaci, uz vjerovatnocu od 95% postoje statisticki signifikantne razlike izmedju


prosjecnih visina blokova i to:
prvog i drugog bloka i
prvog i treceg bloka.

84

Test saglasnosti teorijskih i empirijskih frekvencija


2-test.
Zadatak 54.
Za distribucije frekvencija date u Tabeli provjeriti hipotezu o saglasnosti empirijske
distribucije frekvencija i teoretske Gaussove distribucije frekvencija .
Rjeenje:
H O : Nema statisticki znacajnih razlika izmedu empirijske distribucije frekvencija i
teoretske Gaussove distribucije frekvencija uz vjerovatnocu od 95%.

=
2

(fi fit )2
f it

Tabela 34. Proracun vrijednosti za 2-test.


fi
[f it ]

(f i fit )2 / f it

10

0,50

19

22

0,40

46

37

2,18

27

36

2,25

20

21

0,04

0,14

130

130

5,54

2 = 6,5388
02.05, 6 = 12,59

2 = 6,5388 < 02.05, 6 = 12,59


Hipoteza se ne odbacuje.
Zakljucak:
Nema statisticki znacajnih razlika izmedu empirijske distribucije frekvencija i
teoretske Gaussove distribucije frekvencija uz vjerovatnocu od 95%.

85

Ocjena znacajnosti koeficijenta regresije.


Zadatak 55.
U zadatku P iz dijela regresiona analiza ustanovljena je:
- regresija
X 2e = 1,68 + 1,15X1e ,
- rezidalna varijansa:
s 22.1 = 4,99
- ukupna varijansa:
22 = 59,91.
- broj parova podataka:
n=30.
Provjeriti signifikantnost regresije uz vjerovatnocu od 95%..
Rjesenje:
Signifikantnost regresije moze se provjeriti t-testom i to poredeci izracunatu
vrijednost t:
b
t=
,
SE b
s 22.1
22
s tablicnom vrijednoscu t za odabranu vjerovatnocu i za (n-2) stupnjeva slobode.
SEb =

U nasem slucaju je:


4,99
= 0,29
59,91
1,15
t=
= 3,95 .
0,29

SEb =

Poredjenjem dobijene vrijednosti s tablicnom za 28 stupnjeva slobode i vjerovatnocu


od 95% od 2,048 uocava se da je dobijena t- vrijednost veca od tablicne te zakljucuje
da postoji statisticki znacajna regresija izmedju prsnog promjera i visine stabala.

You might also like