# Biometrika i planiranje istraživanja na životinjama

1 UVOD............................................................................................................................................................................. 1
1.1 PODACI I VARIJABLE.................................................................................................................................................. 1
1.2 PRIKAZ PODATAKA.................................................................................................................................................... 3
1.2.1 Grafički prikazi ................................................................................................................................................. 3
1.2.2 Numeričke metode za opis kvantitativnih podataka.......................................................................................... 3
1.2.3 Simboli .............................................................................................................................................................. 3
1.2.4 Aritmetička srednja vrijednost:......................................................................................................................... 4
1.2.5 Varijanca uzorka: ............................................................................................................................................. 4
1.2.6 Standardna devijacija uzorka ........................................................................................................................... 5
1.2.7 Uvodni SAS primjer .......................................................................................................................................... 5
1.3 ZAKLJUČCI O POPULACIJAMA NA TEMELJU UZORAKA................................................................................................ 6
1.4 SLUČAJNE VARIJABLE I NJIHOVE RASPODJELE ........................................................................................................... 6
1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable.................................................................................. 7
1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable............................................................................ 8
1.5 FUNKCIJE SLUČAJNE VARIJABLE.............................................................................................................................. 14
1.5.1 Neke statistike i njihove raspodjele................................................................................................................. 15
1.5.2 Stupnjevi slobode ............................................................................................................................................ 16
1.6 ZAKLJUČIVANJE O POPULACIJI NA TEMELJU UZORAKA............................................................................................ 16
1.7 PROCJENA PARAMETARA......................................................................................................................................... 16
1.7.1 Procjena srednje vrijednosti populacije ......................................................................................................... 17
1.7.2 Procjena varijance u normalnoj populaciji .................................................................................................... 17
1.8 PROVJERA HIPOTEZA............................................................................................................................................... 17
1.8.1 P-vrijednost..................................................................................................................................................... 18
1.8.2 Statistička i praktična značajnost ................................................................................................................... 19
1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere..................................................................... 19
2 JEDNOSTAVNA LINEARNA REGRESIJA........................................................................................................... 21
2.1 UVOD...................................................................................................................................................................... 21
2.2 PROCJENA PARAMETARA Β
0
I Β
1
............................................................................................................................... 23
2.3 OSTATAK I SVOJSTVA OSTATKA............................................................................................................................... 24
2.4 PROSJECI I VARIJANCE PROCJENITELJA.................................................................................................................... 24
2.5 STUDENTOVA T-PROVJERA I INTERVAL POUZDANOSTI PROCJENE PARAMETARA...................................................... 25
2.6 INTERVAL POUZDANOSTI ZA Β
1
................................................................................................................................ 26
2.7 INTERVALI POUZDANOSTI ZAVISNE VARIJABLE ....................................................................................................... 26
2.8 RAŠČLANJENJE UKUPNE VARIJABILNOSTI ................................................................................................................ 28
2.8.1 Veza između suma kvadrata............................................................................................................................ 29
2.9 PROVJERA HIPOTEZA - F- PROVJERA........................................................................................................................ 30
2.10 KOEFICIJENT DETERMINACIJE (R
2
) ........................................................................................................................ 31
2.11 SAS PRIMJER ZA JEDNOSTAVNU LINEARNU REGRESIJU.......................................................................................... 32
3 KOEFICIJENT KORELACIJE................................................................................................................................ 34
3.1 PROCJENA KOEFICIJENTA KORELACIJE..................................................................................................................... 35
4 VEKTORI I MATRICE ............................................................................................................................................. 36
4.1 TIPOVI I SVOJSTVA MATRICA................................................................................................................................... 36
4.1.1 Operacije s matricama i vektorima: ............................................................................................................... 37
5 JEDNOSTAVNA REGRESIJA U MATRIČNOM PRIKAZU............................................................................... 40
6 MULTIPLA REGRESIJA.......................................................................................................................................... 43
6.1 DVIJE NEZAVISNE VARIJABLE.................................................................................................................................. 43
6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza ................................................................................. 45
6.2 PARCIJALNE I STUPNJEVITE EKSTRA SUME KVADRATA ............................................................................................ 46
6.3 SAS PRIMJER ZA MULTIPLU REGRESIJU ................................................................................................................... 47
6.4 KRIVOLINIJSKA REGRESIJA DRUGOG STUPNJA ......................................................................................................... 48
6.4.1 SAS primjer za kvadratnu regresiju................................................................................................................ 49
6.5 MOGUĆE POTEŠKOĆE KOD UPOTREBE REGRESIJE .................................................................................................... 50
6.5.1 Analiza ostataka i narušenost pretpostavki modela........................................................................................ 51

6.5.2 Loša opažanja................................................................................................................................................. 52
6.5.3 Multikolinearnost............................................................................................................................................ 52
6.6 IZGRADNJA MODELA I KRITERIJI ZA IZBOR MODELA................................................................................................. 53
7 JEDNOSTRUKA ANALIZA VARIJANCE............................................................................................................. 54
7.1 MODEL JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA........................................................................ 55
7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti: ......................................................................... 56
7.1.2 Postavljanje hipoteza i F-provjera ................................................................................................................. 57
7.2 USPOREDBA SREDNJIH VRIJEDNOSTI POJEDINIH GRUPA ........................................................................................... 59
7.2.1 Najmanja značajna razlika (LSD) .................................................................................................................. 59
7.2.2 Tukey provjera (HSD)..................................................................................................................................... 59
7.3 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA .............................................................. 60
7.4 MODEL SA SLUČAJNIM UTJECAJIMA GRUPA............................................................................................................. 61
7.5 INTRAKLASNA KORELACIJA..................................................................................................................................... 63
7.6 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE SA SLUČAJNIM UTJECAJIMA ....................................................... 64
8 NAČELA PLANIRANJA POKUSA.......................................................................................................................... 65
8.1 POKUSNA JEDINICA I TRETMANI .............................................................................................................................. 66
8.2 PONAVLJANJA I POKUSNA GREŠKA .......................................................................................................................... 66
8.3 POTREBAN BROJ PONAVLJANJA ............................................................................................................................... 67
9 POTPUNO SLUČAJNI POKUSNI PLAN................................................................................................................ 68
10 BLOKOVI U ANALIZI VARIJANCE.................................................................................................................... 70
10.1 SLUČAJNI BLOK PLAN (POTPUNI) ........................................................................................................................... 70
10.1.1 Raščlanjenje ukupne sume kvadrata............................................................................................................. 71
10.1.2 Postavljanje hipoteza i F-provjera ............................................................................................................... 72
10.1.3 SAS primjer za slučajni blok plan................................................................................................................. 73
10.1.4 SAS primjer s više pokusnih jedinica po kombinaciji blok x tretman ........................................................... 74
11 'CHANGE-OVER' POKUSNI PLANOVI .............................................................................................................. 77
11.1 JEDNOSTAVNI 'CHANGE-OVER' PLAN...................................................................................................................... 77
11.2 'CHANGE-OVER' PLAN KADA POSTOJI UTJECAJ RAZDOBLJA.................................................................................... 78
11.2.1 SAS primjer za ‘change-over’ plan s utjecajem razdoblja ........................................................................... 79
11.3.1 SAS primjer za latinski kvadrat..................................................................................................................... 82
11.4 CHANGE OVER PLAN POSTAVLJEN KAO VIŠE LATINSKIH KVADRATA...................................................................... 84
12 FAKTORIJALNI POKUS........................................................................................................................................ 85
12.1 SAS PRIMJER ZA FAKTORIJALNI POKUS ................................................................................................................. 88
13 HIJERARHIJSKI POKUSNI PLANOVI ............................................................................................................... 90
13.1 SAS PRIMJER ZA HIJERARHIJSKI PLAN ................................................................................................................... 92
14 POKUSNI PLANOVI SA KAVEZIMA I PREGONIMA..................................................................................... 94
15 DVOSTRUKI BLOKOVI......................................................................................................................................... 96
16 SPLIT PLOT POKUSNI PLAN............................................................................................................................. 100
16.1 FAKTOR A (GLAVNI FAKTOR) KAO SLUČAJNI BLOK PLAN .................................................................................... 100
16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi ............................................................ 101
16.2 FAKTOR A (GLAVNI FAKTOR) KAO POTPUNO SLUČAJNI PLAN .............................................................................. 103
16.2.1 SAS primjer: Glavne jedinice u potpuno slučajnom planu......................................................................... 104
17 ANALIZA KOVARIJANCE.................................................................................................................................. 106
17.1 POTPUNO SLUČAJNI POKUSNI PLAN SA KOVARIJABLOM....................................................................................... 106
1
1 Uvod
1.1 Podaci i varijable
Podaci:
- materijal s kojim statističar radi
- prikupljaju se mjerenjem, brojanjem ili opažanjem
- Primjeri: skup težina teladi, količina mlijeka u laktaciji, muški ili ženski spol, plava ili
zelena boja očiju

Pokus ili eksperiment:
– Proces sakupljanja, opažanja ili mjerenja podataka

Varijabla
– Označava skup podataka
– Poprima različite vrijednosti
• vrijednosti varijable pokazuju varijabilnost
– Primjeri: težina, količina mlijeka, spol, boja očiju

Podaci su vrijednosti koje varijabla poprima.
- težina od 200 kg, ili količina mlijeka od 20 kg.

VARIJABLE
KVALITATIVNE
(ATRIBUTIVNE, KATEGORIČKE).

KVANTITATIVNE
(NUMERIČKE)
NOMINALNE ORDINALNE DISKRETNE KONTINUIRANE

VARIJABLE

A) kvantitativne (numeričke)
- čije se vrijednosti prikazuju brojevima, a razlike između brojeva imaju numeričko značenje
- težina životinja, broj mladih u leglu, temperatura, vrijeme
a) diskretne
- konačna ili beskonačna
- prebrojiva, mjeri sa cijelim ili prirodnim brojevima
- broj mladih u leglu ili broj jaja
2
b) kontinuirane
- poprima beskonačno mnogo vrijednosti
- njene vrijednosti mjere se realnim brojevima
- količina mlijeka ili težina

B) kvalitativne (atributivne, kategoričke)
- podaci su im opisni
- boja očiju ili da li je životinja bolesna ili nije
a) nominalne
- ne može se reći da je jedna kategorija veća ili manja od druge
- boja očiju ili kože
b) ordinalne
- kod kojih se kategorije mogu poredati po veličini
- ocjene lakoće telenja

Zašto podaci, mjerenja, opažanja

• Mjerenja ili opažanja nam pomažu u zaključivanju o nekoj pojavi
• Pitanje je i koji je uzrok da je neka krava bolja
– Da li možemo ‘izmjeriti’ i taj uzrok
– Da li možemo reći da će uslijed nekog zahvata krava biti ‘bolja’
– Na primjer: ako damo kravi mineralni dodatak da li će dati više mlijeka? Kako ćemo
to zaključiti?
• Zaključak:
– Rekapitulacija stanja
– Koristiti i u budućim situacijama

Koliko smo sigurni da je naš zaključak korektan?

• Točnost i preciznost zaključaka ovise o broju podataka (količini informacija), kvaliteti
podataka, reprezentativnosti podataka
• Često donosimo zaključak uz neku vjerojatnost

Statističke metode

• Načini na koje dolazimo do zaključaka koristeći podatke
• Uključuju sakupljanje, organiziranje, tabeliranje, analizu, interpretaciju, opis i prezentaciju
podataka
• Uključuju pažljivo i precizno definiranje problema (postavljanje cilja), donošenje pravilnog
zaključka koji pomaže odgovoriti na postavljeno pitanje ili cilj

Biometrika (Biostatisika), a posebno statističke metode uključuju dva glavna pristupa u donošenju
zaključaka:
1. Opis nekog skupa podataka (opisna statistika)
2. Izbor uzoraka iz većeg skupa podataka (populacije, izvora podataka) i korištenje tih uzoraka za
zaključak o toj populaciji (populacijama)

3
1.2 Prikaz podataka
1.2.1 Grafički prikazi
Primjer: Histogram:
-raspodjela frekvencija nekog skupa podataka
- podaci se svrstavaju u razrede
- prikazuje broj opažanja u pojedinom razredu
- prava ili relativna frekvencija

1 1
5
8 8
6
12
16
12
7 7
8
2
5
2
0
2
4
6
8
10
12
14
16
190 200 210 220 230 240 250 260 270 280 290 300 310 320 330
Sredine razreda
B
r
o
j

t
e
l
a
d
i

Slika 1-1: Histogram težine teladi u dobi od 7 mjeseci (n=100)

1.2.2 Numeričke metode za opis kvantitativnih podataka
NUMERIČKE OPISNE MJERE
A) Mjere centralne tendencije
- Aritmetička srednja vrijednost
- Medijan
- Mode
B) Mjere varijabilnosti
- Raspon
- Varijanca
- Standardna devijacija
- Koeficijent varijabilnosti
C) Mjere relativnog položaja
- Percentili
- z-vrijednost

1.2.3 Simboli
Σ
i
= veliko grčko slovo sigma = oznaka za sumu
i = 1 do n
Suma n brojeva:
Σ
i
y
i
= y
1
+ y
2
+.....+ y
n
Σ
i
y
2
i
= y
2
1
+ y
2
2
+.....+ y
2
n

Suma produkata dva niza brojeva:
Σ
i
x
i
y
i
= x
1
y
1
+ x
2
y
2
+.....+ x
n
y
n

4

Primjer:

y y
1
y
2
y
3

2 4 6
x x
1
x
2
x
3

3 6 7

Σ
i
y
i
= y
1
+ y
2
+ y
3
= 2 + 4 +6 = 12
Σ
i
y
2
i
= y
2
1
+ y
2
2
+ y
2
3
= 2
2
+ 4
2
+6
2
= 56
Σ
i
x
i
y
i
= x
1
y
1
+ x
2
y
2
+ x
3
y
3
= (3)(2) + (6)(4) +(7)(6) = 72

1.2.4 Aritmetička srednja vrijednost:
n
y
y
i
i ∑
=

Svojstva aritmetičke srednje vrijednosti:
1.
( )

= −
i
i
y y 0

2.
( )

= −
i
i
y y minimum
2

drugim riječima ( ) ( )
∑ ∑
− < −
i
i
i
i
a y y y
2 2
, za bilo koji broj a.

1.2.5 Varijanca uzorka:

Ako se i prosjek izračunava iz istog uzorka kao
y
(tj. ako je nepoznat prosjek populacije)
1
) (
2
2

=

n
y y
s
i
i

Ako je od prije poznat prosjek populacije u i NE računa se iz istog uzorka:
n
y
s
i
i ∑

=
2
2
) ( u

- Varijanca je prosječno kvadrirano odstupanje od prosjeka

( )
n
y
y y y
i
i
i
i
i
i
2
2 2
) (

∑ ∑
− = −

5
1.2.6 Standardna devijacija uzorka
2
s s =

prosječno odstupanje od prosjeka

1.2.7 Uvodni SAS primjer
Pogledajmo rješavanje primjera o uzorku težine teladi koristeći SAS software. Na detaljna
objašnjenja upotrebe programa čitaoca upućujem na iscrpnu SAS literaturu, dio koje može vidjeti u
popisu literature na kraju ove knjige. Ovdje možemo samo ukratko spomenuti da se svaki SAS
program sastoji od dva dijela: 1) DATA step, koji služi za unos ili kreiranje skupa podataka za koji
se želi napraviti analiza, i 2) PROC step, koji služi za analizu podataka. Treba još reći da SAS
software daje mogućnost obrade podataka i bez pisanja programa sa instrukcijama, tj. koristeći i
birajući ponuđene opcije za željenu analizu. Međutim, pisanje programa daje korisniku veće
mogućnosti i znanje o korištenju programa bez obzira na kompjutersku platformu. SAS ima tri
osnovna prozora: Program prozor (PGM) u koji se upisuje program, Ispis prozor (OUT) u kojem
korisnik može vidjeti ispis i LOG prozor u kojem se može provjeriti detalje o provedbi programa i
moguće greške. Vratimo se primjeru o težinama teladi. Izmjereni su slijedeći podaci 20 teladi:

SAS program:

INPUT tezina @@;
DATALINES;
260 260 230 280 290 280 260 270 260 300
280 290 260 250 270 320 320 250 320 220
;
PROC MEANS DATA = telad N MEAN MIN MAX VAR STD CV ;
VAR tezina;
RUN;

Objašnjenje: SAS naredbe pisat ćemo uvijek velikim slovima da ih istaknemo, makar to u programu
nije potrebno, tj. program jednako tretira i velika i mala slova. Imena koja sam korisnik daje
varijablama i drugim oznakama pisat ćemo malim slovima. Naredba DATA definira ime datoteke
koja će sadržavati podatke, a ovdje je telad ime datoteke. Naredba INPUT definira ime varijable, a
naredba DATALINES govori da slijede podaci. Ovdje je varijabla tezina. SAS treba podatke
varijabli u kolonama, pa se u pravilu podaci i pišu u kolone. Na primjer,

INPUT tezina;
DATALINES;
260
260

220
;
učitava podatke varijable tezina. Podaci se mogu pisati i jedan za drugim u redu ako se koristi
oznaka @@ kod naredbe INPUT. SAS čita podatke jedan po jedan i sprema ih u kolonu. Program
koristi proceduru MEANS. Da bi označili da je to ime procedure treba napisati PROC MEANS.
DATA = telad, definira za koju datoteku će se računati statistike. Slijedi popis statistika koje
tražimo: N = broj podataka, MEAN = aritmetička srednja vrijednost, MIN = minimum, MAX =
maksimum, VAR = varijanca, STD= standardna devijacija, CV = koeficijent varijacije. Naredba
VAR definira varijablu (tezina) koja će se analizirati.
6

SAS ispis:

Analysis Variable: TEZINA

N Mean Minimum Maximum Variance Std Dev CV
-------------------------------------------------------------
20 273.5 220 320 771.31579 27.77257 10.1545
-------------------------------------------------------------

SAS ispis prikazuje ime varijable koja će se analizirati (Analysis varijabla: TEZINA), a zatim
opisnu statistiku.

1.3 Zaključci o populacijama na temelju uzoraka

• Populacija:
– Skup jedinki koje imaju neka zajednička svojstva od interesa
– Izvor podataka

• Parametri:
– Opisni pokazatelji populacije
– Obično nepoznate vrijednosti
– Primjer: prosjek populacije
• Koliki je prosjek količine mlijeka u laktaciji?

• Uzorak:
– Skup jedinki (podataka) izabran iz populacije
– Služi za procjenu i (ili) zaključivanje o populaciji.
– Vjerodostojnost procjene i zaključaka o populaciji je veća:
• ako je uzorak dobar predstavnik populacije
• uzorak mora biti slučajno izabran

• Statistike:
– Numerički opisni pokazatelji uzorka (eng. statistics)
– Mogu se izračunati iz uzoraka
– Primjer: aritmetička srednja vrijednost uzorka

• Statistički zaključci na temelju uzoraka su podložni greški
• Donose se uz neku vjerojatnost
• Kako odrediti vjerojatnost?
– Definiranjem slučajne varijable i matematičkih modela raspodjele vjerojatnosti

1.4 Slučajne varijable i njihove raspodjele
Slučajna varijabla:

• Matematički pojam, govori kako se opažanju pridružuje numerička vrijednost
• Vrijednost koju varijabla poprima smatra se slučajnim procesom (događajem)
– Na primjer: izmjerimo tele i vidimo da je teško 180 kg. Međutim ne znamo zašto baš
ima 180 kg.
7
– Barem dio te vrijednosti zato smatramo slučajnim
• Slučajna varijabla poprima određenu numeričku vrijednost s određenom vjerojatnosti

y je oznaka za varijablu
y
i
predstavlja vrijednost i-tog opažanje
- određeno opažanje: y
1
, y
2

y ≤ y
0
su sve vrijednosti koje su manje ili jednake od y
0

Slučajne varijable

Kontinuirana (neprekidna)
- sve vrijednosti u nekom intervalu
- realni brojevi
- težina teladi starih 6, bilo koja vrijednost
u intervalu od 160 do 260 kg, recimo
180.0 ili 191.23456

Diskretna (prekidna)
- poprima samo određeni broj vrijednosti u
nekom intervalu
- NE sve vrijednosti
- često cijeli brojevi
- broj latica u cvijetu, broj mladih u leglu

Vrijednost varijable y
- numerički događaj
- ima određenu vjerojatnost da se dogodi
Raspodjela vjerojatnosti slučajne varijable y:
- tablica, grafikon ili formula koji pokazuje vjerojatnost da y poprimi određenu vrijednost

Raspodjela vjerojatnosti slučajne varijable

• Raspodjela vjerojatnosti slučajne varijable s konačnim ili prebrojivim vrijednostima je raspodjela
frekvencija
• Raspodjela vjerojatnosti se često može prikazati formulom (funkcijom)
– Matematički model prave raspodjele frekvencija
– Procjena prave raspodjele frekvencija
– Funkcija slučajne varijable: p(y) ili f(y)
• Raspodjela = distribucija

Očekivanje (prosjek) i varijanca slučajne varijable
- pokazatelji položaja i varijabilnosti
Očekivanje (prosjek): E(y) = µ
y
Varijanca: Var(y) = σ
2
y

2
= E[(y – µ
y
)
2
] = E[y
2
] – µ
y
2

(Sjetite se da je varijanca prosječno kvadrirano odstupanje od prosjeka)

1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable
- tabelarni ili grafički prikaz ili formula koja daje vjerojatnost p(y) za svaku moguću vrijednost
varijable y.

Uvjeti:
1. O ≤ p(y) ≤ 1
2. Σ
(svi y)
p(y) =1
8

Primjeri diskretnih varijabli

• Binarna varijabla
– samo dva moguća rezultata neke pojave
– DA i NE ili 0 i 1 bolestan – zdrav i sl

• Binomna varijabla
– Broj povoljnih pokušaja (y) u ukupno n pokušaja
– U pojedinačnom pokušaju moguća samo dva rezultata
• broj ženske teladi u 4 telenja, broj bijelih praščića u leglu

Binomna raspodjela
- raspodjela vjerojatnosti y povoljnih opažanja (pokušaja) u ukupno n pokušaja
- broj ženske teladi u 4 telenja
- broj bijelih praščića u leglu

Raspodjela vjerojatnosti od y:
- određena parametrom p i brojem pokušaja n:
y n y
q p
y
n
y p

|
|
.
|

\
|
= ) (

(y = 0,1,2,,...., n)

p = vjerojatnost povoljnog rezultata u pojedinačnom opažanju (pokušaju) (vjerojatnost
elementarnog događaja). q = 1 – p = vjerojatnost nepovoljnog rezultata

Oblik raspodjele vjerojatnosti ovisi o p:
- binomna raspodjela je simetrična kada je p = 0.5
- asimetrična u svim ostalim slučajevima

0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6 7 8
broj povoljnih pokušaja
fre
kve
nci
ja
A)
0
0.1
0.2
0.3
0.4
0 1 2 3 4 5 6 7 8
broj povoljnih pokušaja
fre
kve
nci
ja
B)

Slika 1-2: Binomna raspodjela (n = 8) za dva slučaja A) p=0.5 i B) p = 0.2
Primjer

1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable
Kontinuirana slučajna varijabla:

• Poprima neprebrojivo mnogo vrijednosti
• Nemoguće je pridružiti vjerojatnost za svaki pojedinačni numerički događaj
9
– Teoretski vrijednost kontinuirane varijable je točka, a matematički točka nema
dimenzije
– Vjerojatnost da slučajna varijabla poprimi neku određenu vrijednost je jednaka nuli

• VAŽNO:
– promatrati vjerojatnost da varijabla y poprima vrijednosti u nekom intervalu
– vjerojatnost se pridružuje numeričkom događaju koji se odnosi na neki interval

- vrijednosti koje se pridružuju pojedinom mjerenju zavise od preciznosti mjerenja
- ako npr. preciznost na 1 kg, tada izmjera od 220 kg znači sve mjere od 219.5 do 220.5 kg
- pošto se radi o intervalu ==> događaj ima vjerojatnost

Funkcija vjerojatnosti gustoće
– Gustoća = podsjetnik da govorimo o vjerojatnosti u intervalima
– Funkcija gustoće = model prave (nepoznate) raspodjele frekvencije

Svojstva funkcije gustoće:
1. f(y
i
) ≥ 0
2. P(–∝ ≤ y ≤ +∝) = 1
(vjerojatnost da se dogodi bilo koji y je jednaka 1)

1.4.2.1 NORMALNA RASPODJELA

- model raspodjele relativnih frekvencija u mnogim pojavama.
- normalnu raspodjelu slijede mnogi pokazatelji koji se koriste za statističko zaključivanje.
- normalna krivulja = Gaussova krivulja
- oblik zvona.

Slika 1-3: Normalna (Gaussova) krivulja
Položaj i oblik normalne krivulje je određen sa dva parametra µ i σ
2
(prosjek i varijanca)

Funkcija gustoće je:

|
.
|

\
|

=
2
2
1
2
2
1
) (
σ
u
πσ
y
e y f

-∝ < y < +∝

e = baza prirodnog logaritma (e = 2.71828...)
π = 3.14...

y je normalna slučajna varijabla => y ∼ N (µ,σ
2
)
10

- Visina i raspršenost krivulje ovisi o varijanci σ
2

- Povećanje σ
2
dovodi da krivulja smanjuje visinu i više je raširena.

0
0.1
0.2
0.3
0.4
-4 -3 -2 -1 0 1 2 3 4
Frr
ekv
en
cija
σ = 1
σ = 1.5

Slika 1-4: Normalne krivulje sa standardnim devijacijama σ = 1 i σ = 1.5

Vjerojatnost da se slučajno izabrana jedinka (s nekom vrijednosti y) nalazi u intervalu (y
1
, y
2
) je
jednaka površini ispod normalne krivulje ograničena vrijednostima y
1
i y
2
. (Uzima se da je
ukupna površina 1 ili 100%)
Ova vjerojatnost je jednaka proporciji jedinki s vrijednostima između y
1
i y
2

Primjer: Vjerojatnost da y bude između 170 i 210
P(y
1
≤ y ≤ y
2
) = P(170 ≤ y ≤ 210)

u = 200
y
1
= 170
y
2
= 210

Slika 1-5: Površina ispod normalne krivulje ograničena vrijednostima 170 i 210

Primjer:
Vjerojatnost da y < 230
u = 200
0
y = 230

Slika 1-6: Normalna krivulja sa µ = 200 i σ = 20

Standardizacija normalnih krivulja

11
• Budući da oblik krivulje ovisi samo o varijanci (odnosno stanardnoj devijaciji σ), sve
normalne krivulje se mogu standardizirati tj. prevesti u standardnu normalnu krivulju
• Standardizacija: slučajna normalna varijabla y se izrazi u jedinicama standardne devijacije:

σ
u −
=
y
z

Standardna normalna krivulja je takva normalna krivulja kojoj je prosjek 0 i standardna devijacija 1
=> µ = 0 i σ = 1

Često se za standardnu normalnu varijablu piše:
z ∼ Z ili z ∼ N(0, 1)

Funkcija gustoće standardne normalne varijable je:
| |
2
2
1
2
1
) (
z
e z f

=
π

0
95%
-1
1.96 1.96 1

Slika 1-7: Standardna normalna krivulja (µ = 0 i σ
2
= 1)

• Površina ispod standardne normalne krivulje ograničena s dvije vrijednosti standardne
normalne varijable z
1
i z
2
, predstavlja vjerojatnost da varijabla poprime vrijednosti između ta
dva broja. (opet se utima da je ukupna površina jednaka jedan (ili 100%): P(–∞≤ z ≤ +∞) =
1
• Također: P(–1.96 ≤ z ≤ 1.96) = 0.95

Praktična vrijednost standardizacije je u tome što za pronalaženje površine ispod krivulje
ograničenu nekim intervalom koristimo samo jednu krivulju. Podsjetimo se da je površina ispod
krivulje u nekom intervalu (y
1
, y
2
) odgovara vjerojatnosti da slučajna varijabla y poprima
vrijednosti u tom intervalu. Matematički površina ispod krivulje je jednaka određenom integralu
funkcije gustoće. Kako ne postoji eksplicitna formula za taj integral, služimo se tablicama (bilo iz
knjige ili kompjuterskog programa). Pošto je moguće sve normalne krivulje svesti na standardnu,
potrebno je imati samo jednu tablicu. Naime vjerojatnost da y poprima vrijednosti između y
1
i y
2
je:
P(y
1
≤ y ≤ y
2
) = P(z
1
≤ z ≤ z
2
)

gdje su
σ
u −
=
1
1
y
z i
σ
u −
=
2
2
y
z

12
Primjer
z
y
0 1.5
u=200 y
0
=230

Slika 1-8: Prikaz normalne i standardne normalne krivulje. Prikazane su dvije skale: originalna skala y
i standardna normalna skala z. Vrijednost varijable y
0
= 230 odgovara vrijednosti z
0
= 1.5.

210 200 170
.5 0 1.5
z
y

Slika 1-9: Površina ispod krivulje između 170 i 210.

Koliki je prosjek odabranih životinja?
z
s
= prosjek z vrijednosti za koje vrijedi z > z
0
, tj. z vrijednosti većih od z
0
.
Za standardnu normalnu krivulju vrijedi:
P
z f
z
S
) (
0
=

p = površina ispod standardne normalne krivulje za z>z
0
,
f(z
0
) = ordinata za vrijednost z
0
.
Ordinata je:

π 2
) (
2
0
2
1
0
z
e
z f

=
-vrijednost funkcije za danu vrijednost z.
13

z
0
z
0
z
S

P
f(z)
f(z
0
)

Slika 1-10 Prosjek odabranih z vrijednosti. f(z
0
) = ordinata krivulje za z = z
0
, P je površina, odnosno
vjerojatnost P(z>z
0
) i z
S
je prosjek vrijednosti većih od z
0
.
Primjer:

Neka su z
1
, z
2
,…, z
v
standardne normalne varijable sa µ = 0 i σ = 1.

Slučajna varijabla
χ
2
= Σ
j
z
2
j

ima hi kvadrat raspodjelu sa v stupnjeva slobode.
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
0 5 10 15 20
v=2
v=6
v=10
χ2
f (χ2)

Slika 1.11 Funkcija gustoće χ
2
varijabli sa stupnjevima slobode v = 2, v = 6 i v = 10

Nagib i oblik raspodjele ovisi o stupnju slobode

1.4.2.3 STUDENTOVA (T) RASPODJELA

Neka je z normalna slučajna varijabla sa µ = 0 i σ = 1 i χ
2
stupnjevima slobode. Varijabla definirana sa:
v
z
t
2
χ
=

je slučajna varijabla s t-raspodjelom.

14

stupnjevi slobode v = 16
stupnjevi slobode v = 2

Slika 1-12: Funkcija gustoće t slučajnim varijablama sa stupnjevima slobode 16 i 2.
Studentova t raspodjela je po obliku slična normalnoj samo što sa smanjenjem stupnjeva slobode
krivulja postaje više razvučenija (deblja) prema repovima (Slika 1.13).
Kada stupnjevi slobode idu prema beskonačnosti, t raspodjela prelazi u normalnu..

1.4.2.4 F-RASPODJELA

Neka su χ
2
1
i χ
2
2
hi-kvadrat slučajne varijable sa stupnjevima slobode v
1
i v
2
. I neka su χ
2
1
i χ
2
2

2
2
2
1
2
1
v
v
F
χ
χ
=

slučajna varijabla sa F-raspodjelom
Oblik F raspodjele ovisi o stupnjevima slobode

Slika 1.13 Funkcije gustoće F raspodjela sa stupnjevima slobode: a) v
1
=2 i v
2
= 6; b) v
1
=6 i v
2
= 10; c)
v
1
=10 i v
2
=20
1.5 Funkcije slučajne varijable
• Slučajne varijable: varijable čije vrijednosti mjerimo, opažamo (težina, količina mlijeka –
normalne slučajne varijable)
• Funkcije tih varijabli iz uzoraka koje zovemo statistike (primjer: aritmetička srednja
vrijednost)

0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0 1 2 3 4 5
F
f(F)
v1=2; v2=6
v1=10; v2=20
v1=6; v2=10
15

Statistike (engl. statistics)
• Numerički opisni pokazatelji izračunati iz uzorka
• Funkcije slučajne varijable => i same su slučajne varijable
• Primjeri:
y
i s
2
su statistike
• Imaju poznate teoretske raspodjele
– => moguća procjena vjerojatnosti sa kojom se određena vrijednost statistike
pojavljuje
– => koriste se za donošenje zaključaka o populaciji

1.5.1 Neke statistike i njihove raspodjele

1.5.1.1 RASPODJELA SREDNJIH VRIJEDNOSTI UZORAKA , SREDIŠNJI GRANIČNI TEOREM

Ako se slučajno izabiru uzorci veličine n iz neke populacije sa srednjom vrijednosti µ i varijancom
σ
2
i kada je n dovoljno velik, raspodjela srednjih vrijednosti uzoraka može se predočiti normalnom
funkcijom gustoće sa prosjekom
µ =
y
u

i standardnom devijacijom
n
y
σ
σ =
.
y
σ
= standardna greška procijene prosjeka populacije
ili samo standardna greška
y
u

Slika 1-14: Raspodjela srednjih vrijednosti uzoraka

y
σ se može procijeniti standardnom greškom uzorka
n
s
s
y
=

1.5.1.2 NEKE STATISTIKE KOJE NEMAJU NORMALNU RASPODJELU

2
2
2
2
) (
) 1 (
σ σ

=

i
y y
s n

ima hi-kvadrat raspodjela sa v = (n–1) stupnjevima slobode, ako je y normalna varijabla.

16
Statistika
n
s
y
t
2
u −
=
imai studentovu t raspodjelu sa (n–1) stupnjeva slobode, ako je y normalna
varijabla.

Neke statistike imaju F raspodjelu.

1.5.2 Stupnjevi slobode
• Broj nezavisnih opažanja povezanih sa procjenom varijance, odnosno s izračunavanjem
• Ukupan broj opažanja manje broj parametara korištenih u izračunavanju tog prosjeka
• Na primjer: u izračunu varijance uzorka stupnjevi slobode su (n–1)

Stupnjevi slobode u izračunu varijance uzorka
• Varijanca uzorka je prosječno kvadrirano odstupanje od aritmetičke srednje vrijednosti
• Postoji (n–1) nezavisnih opažanja jer smo već s istim opažanjima izračunali aritmetičku
srednju vrijednost
• Dakle, prosjek kvadriranih odstupanja dobije se dijeljenjem sume kvadrata sa (n–1)

1.6 Zaključivanje o populaciji na temelju uzoraka
1. Procjena svojstava populacije
(procjena parametara)
2. provjera hipoteza o populaciji

1.7 Procjena parametara
Procjene parametara:

Jedinstveni procjenitelj:
- pravilo ili formula koja govori kako
izračunati procjenu iz uzorka
procjena = broj koji izračunamo
Intervalni procjenitelj
-formula koja govori kao izračunati
interval procjene
- intervalna procijena = izračunati interval

Svojstva jedinstvenih procjenitelja:
- statistika (funkcija slučajne varijable)
- izračunat iz uzorka
- mora biti nepristran: očekivanje od procjenitelja je jednako pravom parametru
- odstupanje procjenitelja od prave vrijednsoti parametra mora imati najmanju varijancu
- ima poznatu raspodjelu statistike uzorka
(engl. sampling distribution).

Npr. prema centralnom graničnom teoremu raspodjela prosjeka uzorka će biti približno normalna za
velike uzorke ( n > 30), sa srednjom vrijednosti µ i standardnom devijacijom
n / σ

17
1.7.1 Procjena srednje vrijednosti populacije
Jedinstveni procjenitelj od µ je
y

Svojstava:
Očekivanje od aritmetičkog prosjeka je jedanko prosjeku populacije
- odstupanja ) ( y y
i
− imaju najmanju varijancu ) ( y y Var
i
− = min.
-
y
ima normalnu raspodjelu sa µ i
n
y
σ
σ =
Statistika
y
y
z
σ
u −
=
ima standardnu normalnu raspodjelu

1.7.2 Procjena varijance u normalnoj populaciji
Nepristrani procjenitelj varijance populacije (σ
2
) je varijanca uzorka:
1
) (
2
2

=

n
y y
s
i
i

Ukoliko je y normalna varijabla sa prosjekom µ i varijancom σ
2
2
2
2
) 1 (
σ
χ
s n −
=

2
) 2 / 1 (
2
2
2
2 /
2
) 1 ( ) 1 (
α α
χ
σ
χ

≤ ≤
− s n s n

1.8 Provjera hipoteza
Hipoteza: tvrdnja o jednoj ili više populacija.

Istraživačka hipoteza

Statistička hipoteza

Nul hipoteza (H
0
)
- nepromijenjeno stanje, nepostojeća razlika
- hipoteza koju provjeravamo
Alternativna hipoteza (H
1
)
- promijenjeno stanje, postojeća
razlika
– obično je identična istraživačkoj
- sama se po sebi ne može
provjeravati, nego se koristi provjera
nul hipoteze.

18
Provjera hipoteza:
- na temelju informacija iz uzorka
- rezultira u jednoj od dvije odluke:
1. odluka da se H
0
odbaci
2. odluka da se H
0
ne odbaci, jer uzorak nije dao dovoljno dokaza da bi se H
0
odbacila.
- H
0
i H
1
, se uvijek postavljaju tako da isključuju jedna drugu
0
, pretpostavljamo da je H
1
točna.
- u zaključivanju koristimo zakone vjerojatnosti

Općenito, lakše je dokazati da je neka hipoteza lažna nego da je točna
- prihvaćanje H
0
ne znači da je ona točna, nego da uzorak ne daje dovoljno dokaza da je H
0

lažna.
- prihvaćamo H
0
sve dok nije prikupljeno dovoljno dokaza koji je obaraju

Koraci u provjeri hipoteza:

1) Definiramo H
0
i H
1

2) Odredimo α (razinu značajnosti)
3) Izračunamo procjenu parametra
4) Odredimo statistiku za provjeru i njezinu raspodjelu kada vrijedi H
0
i izračunamo njenu
vrijednost iz uzorka
5) Odredimo kritičnu vrijednost, kritično područje
6) Usporedimo izračunatu vrijednost statistike za provjeru sa kritičnim vrijednostima i donosimo
zaključak.

Prikaz razine značajnosti, kritične vrijednosti i kritičnog područja poznate raspodjele

z
α/2
-
α/2
α/2
razina
značajnosti = α
kritično
područje
kritično
područje
0
kritična
vrijednost

1.8.1 P-vrijednost
Drugi način da se odluči o prihvaćanju ili odbijanju nul hipoteze H
0
, je da se utvrdi vjerojatnost da
0
vrijedi. Ta vjerojatnost
obično se označava kao P vrijednost i predstavlja opaženu razinu značajnosti. Mnogi kompjuterski
statistički programi daju P vrijednost i ostavljaju istraživaču da sam odluči o prihvaćanju ili
odbijanju H
0
. Može se reći da se H
0
odbacuje uz vjerojatnost pogreške koja je jednaka P
vrijednosti. P vrijednost se može koristiti i kada je razina značajnosti unaprijed određena. Za
zadanu razinu značajnosti α, ako je P vrijednost manja od α, H
0
se odbacuje uz α razinu
značajnosti.
19

1.8.2 Statistička i praktična značajnost
Statistička značajnost ne mora uvijek značiti da istraživanje ima i praktičnu značajnost. Na primjer,
pretpostavimo pokus s upotrebom aditiva u hrani koji je povećao dnevni prirast u tovu junadi za 20
g. Ovo povećanje je relativno malo i najvjerojatnije nema ni praktično ni ekonomsko značenje.
Međutim uz dovoljno velik uzorak i takvo povećanje se može pokazati statistički značajno.
Također, razlike između populacija mogu imati praktično značenje, ali zbog malih uzoraka razlika
se nje pokazala statistički značajna u uzorcima.
Potreban je oprez u upotrebi riječi značajan. Pojam statistička značajnost vrijedi samo za uzorak.
Tako se može reći: “postoji značajna razlika između prosjeka uzoraka”, što znači da njihova
izračunata razlika vodi do izračunate P vrijednosti dovoljno male da možemo odbaciti H
0
. Ali treba
izbjegavati izraze kao “prosjeci populacije su značajno različiti”, jer prosjeci populacije mogu biti
samo praktično različiti, dakle oni su različiti ili nisu različiti. Potpuno je pogrešan izraz:
“alternativna hipoteza H
1
je da su prosjeci dviju populacije značajno različite”, jer alternativna
hipoteza znači samo razliku, a prihvaćanje alternativne hipoteze putem statističke provjere ne znači
automatski i praktičnu značajnost.

1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere
Kod zaključivanja na temelju uzorka moguća su dva pogrešna zaključka:
a) tip I greška = odbacivanje nul hipoteze H
0
, a da je zapravo H
0
istinita
b) tip II greška = ne odbacivanje H
0
, a da je zapravo H
0
lažna.

Istinita (prava) situacija

H
0
točno H
0
nije točno
Nije odbačena H
0

Korektno prihvaćanje
P = 1–α
Tip II greška
P = β
O
d
l
u
k
a

s
t
a
t
i
s
t
i
č
k
e

p
r
o
v
j
e
r
e

Odbačena H
0

Tip I greška
P = α
Korektno odbijanje
P = 1 – β

1 – β = snaga provjere

Način kontrole (smanjenja vjerojatnosti) tip I i tip II greške:
- povećati uzorak
- smanjiti varijancu
- povećati utjecaj (engl. effect size)
snagu provjere treba razmatrati kod planiranja pokusa
- kada je uzorak već određen, ne može se istovremeno smanjiti i α i β
- obično se nastoji smanjiti tip I greška (α)
- postavi α= 0.05 i u većini slučajeva se ne obazire na β.

Vjerojatnost tip I greške (α, P-vrijednost):
- poznata ili se lako izračuna
- postavlja ju sam istraživač kao razinu značajnosti
Vjerojatnost tip II greške (β):
- često teško izračunati
- mora se pretpostaviti neka raspodjela ako je H
1
točno i na temelju te raspodjele pokušati
odrediti β
20

Raspodjela ako
vrijedi H
1

u
0

β
α
Snaga provjere
Raspodjela ako
vrijedi H
0

Kritično područje
u
1

Slika 1-15: Vjerojatnost greške tipa I i II
Snaga provjere:
- veća snaga provjere (ili analogno mali β, jer snaga je jednaka 1– β) je važna u slučaju kada
ne odbacujemo nul hipotezu
- ako provjera ima malu snagu i nije odbačena nul hipoteza, zaključak je sumnjiv i velika je
šansa da radimo tip II grešku
- obično ne donosimo zaključke o jednakosti dva ili više parametara baš zbog često velike
vjerojatnosti β, odnosne male snage (1 – β)

Snaga provjere može se odrediti ako pretpostavimo nekoliko specifičnih alternativnih hipoteza sa
različitim parametrima

21
2 Jednostavna linearna regresija
2.1 Uvod
Mjerenja više varijabli
Pitanja:
- kakav utjecaj imaju varijable jedna na drugu
- da li postoji funkcijska veza između varijabli

Primjer:
- kako promjena vanjske temperature za jedan stupanj utječe na promjenu konverziju hrane
- kako promjena razine proteina u hrani utječe na promjenu dnevnog prirasta.

Regresija
- uključuje skup statističkih procedura kojima se izvode zaključci o vezi između varijabli
- proučava statističku vezu između varijabli na taj način da se jedna varijabla definira kao
zavisna varijabla, a ostale kao nezavisne varijable
- kako promjena nezavisnih varijabli utječe na promjenu zavisne varijable
zavisna varijabla = y (konverzija hrane)
nezavisne varijable = x (temperatura)

Statistički model:
y = β
0
+ β
1
x + ε

y = zavisna varijabla (slučajna)
x = nezavisna varijabla (fiksna)
β
0
, β
1
= regresijski koeficijenti (parametri)
ε = slučajna greška

ε = slučajna neprotumačena odstupanja
- zbog individualnih razlika između životinja ili različite okoline, greške kod mjerenja i sl.,

Statistički model: matematički model koji sadrži ε
- kada bi opseg prsa točno opisao težinu
y = β
0
+ β
1
x

Model regresije se odnosi na parove opažanja (x
1
,y
1
),(x
2
,y
2
),...,(x
n
,y
n
)
Prema modelu svaki y
i
se može prikazati:
y
i
= β
0
+ β
1
x
i
+ ε
i
i = 1,.....n

Odnosno,
y
1
= β
0
+ β
1
x
1
+ ε
1
y
2
= β
0
+ β
1
x
2
+ ε
2
............
y
n
= β
0
+ β
1
x
n
+ ε
n

22

Očekivanje zavisne varijable y za zadani x je E(y|x) i predstavlja pravac.
E(y
i
| x
i
) = β
0
+ β
1
x
i
= pravac

y
E(y|x)
*
*
*
*
*
*
*
*
*
* (x
i
,y
i
)
ε
i
x

Slika 2-1: Pravac linearne regresije. Zvjezdicama su prikazana prava mjerenja (x
i
,y
i
), Pravac E(y|x) je
očekivanje zavisne varijable, ε
i
je odstupanje mjerenja od očekivanja
Objašnjenje parametara jednostavne regresije
β
0
= odsječak na y osi, vrijednost (E(y| x
i
=0)
β
1
= govori o nagibu pravca, to je promjena ∆E(y| x) koja odgovara promjeni vrijednosti varijable x
za jedinicu (∆x=1).

E(y
i
|x
i
) = β
0
+ β
1
x
i
β
0
β
1
x
y
β
1
∆x=1

Slika 2-2: Objašnjenje parametara obične linearne regresije

x x
y
x
y
a) b)
x
y
c)

Slika 2-3: a) pozitivna regresija, β
1
> 0; b) negativna regresija, β
1
< 0,
c) regresija nije jasno utvrđena, β
1
= 0
23

2.2 Procjena parametara β
0
i β
1

1) izabrati slučajni uzorak
2) izmjeriti y i x

Broj životinje 1 2 3 ... n
Opseg prsa (x) x
1
x
2
x
3
... x
n

Težina (y) y
1
y
2
y
3
... y
n

Cilj: pronaći krivulju koja će ‘najbolje‘ opisati dani skup podataka; pronaći procjenitelje parametara
β
0
i β
1
.
Procjenitelji parametara:
0
ˆ
β i
1
ˆ
β ili b
0
i b
1
.
E(y
i
|x
i
) se procjenjuje sa:
i i
x b b y
1 0
ˆ + =

= procijenjeni pravac (krivulja) regresije, procijenjeni model

Ostatak:
i i i
y y e ˆ − =
Svako opažanje u uzorku se može napisati:
y
i
= b
0
+ b
1
x
i
+ e
i
i = 1,.....n
i i i
y y e ˆ − =
\$ y
i
\$ y
*
*
*
*
* *
*
*
*
* y
i
y
x

Slika 2-4: Procijenjeni pravac jednostavne linearne regresije.
Pravilo:
- pronaći procjenitelje b
0
i b
1
, da vrijedi:
( ) min ˆ
2 2
∑ ∑
= = −
i
i
i
i i
e y y

(ostaci moraju biti što manji)

OST
i
i
SS e

=
2

24
Procjenitelji b
1
i b
0
:
x b y b
SS
SS
b
xx
xy
1 0
1
− =
=

Gdje su:
( )( ) y y x x SS
i
i
i xy
− − =

= suma produkata y i x
( )
2

− =
i
i xx
x x SS
n = veličina uzorka

2.3 Ostatak i svojstva ostatka
Podsjetite se da je greška pravog modela (modela populacije):
ε
i
= y
i
–E(y
i
|x
i
)
Ostatak je odstupanje vrijednosti zavisne varijable od regresijskog pravca procijenjenog iz uzorka:
i i i
y y e ˆ − =
Dakle, Ostatak = greška procijenjenog pravca (procijenjenog modela)
( )
2
ˆ

− =
i
i i OST
y y SS

Prosjek kvadrata ostatka (varijanca procijenjenog modela):
2
2

= =
n
SS
s MS
OST
OST
(n–2) = stupnjevi slobode.
MS
OST
= s
2
je procjena σ
2
= Var (ε).

Stupnjevi slobode:
n – (broj parametara koje treba procijeniti za dotičnu sumu kvadrata)

• Skraćeni način računanja:
xx
xy
yy OST
SS
SS
SS SS
2
) (
− =

2.4 Prosjeci i varijance procjenitelja
Svojstva procjenitelja:
E(b
1
) = β
1
xx
b
SS
b Var
2
2
1
1
) (
σ
σ = =

Ako y normalan onda b
1
normalan

Podsjetimo se: varijanca greške: Var(ε
i
) = σ
2
.
25
Nepristrani procjenitelj varijance σ
2
je:
( )
OST
OST
i
i i
MS
n
SS
y y
n
s =

= −

=

2
ˆ
2
1
2 2

MS
OST
Skraćeni način računanja sume kvadrata za ostatak:
xx
xy
yy OST
SS
SS
SS SS
2
) (
− =

Standardna greška regresijskog modela:
2
2

= =
n
SS
OST
s s

Var(b
1
) možemo procijeniti sa:
xx
b
SS
s
s
2
2
1
=

Standardna greška procjenitelja b
1
je:
xx
b
SS
s
s
2
1
=

2.5 Studentova t-provjera i interval pouzdanosti procjene parametara
Provjera hipoteza o nagibu pravca regresije:
H
0
: β
1
= 0
H
1
: β
1
≠ 0
H
0
: regresije nema, nagib regresije je nula, pravac regresije je horizontalan.
H
1
: regresija postoji, nagib nije horizontalan

Statistika za provjeru:
1
0
1
b
s
b
t

=

Uz H
0
, statistika t ima t raspodjelu sa (n–2) stupnjeva slobode

Odbacujemo H
0
ako je izračunata statistika |t| “velika”. Za α razinu značajnosti odbacujemo H
0
ako
|t| ≥ t
α/2,(n–2)
.
b
1
β
1
= 0
t
α/2 -t
α/2 0
t

Slika 2-5: Teoretska distribucija procjenitelja b
1
i skala odgovarajuće t statistike

26

2.6 Interval pouzdanosti za β
1

Možemo pisati da je za 100(1–α)% interval pouzdanosti
1
2 , 2 1 b n
s t b

±
α

Za 95% interval pouzdanosti (IP)
1
2 , 025 . 0 1 b n
s t b

±

t
α/2,n–2
= kritična vrijednost
xx b
SS s s
2
1
=
= standardna greška procjenitelja b
1
.

2.7 Intervali pouzdanosti zavisne varijable
Procjena prosjeka populacije za danu vrijednost x
0

E[y|x
0
] = β
0
+ β
1
x
0
.

Procjenitelj:
0 1 0 0
ˆ x b b y + =
.
( )

+ =
xx
i
SS
x x
n
y Var
2
2
) 0
1
ˆ ( σ
Standardna greška:
( )

+ =
xx
i
y
SS
x x
n
s s
2
2
ˆ
1
0

Interval pouzdanosti:
2 , 025 . 0 ˆ 0
0
ˆ

±
n y
t s y

Predviđanje buduće vrijednosti varijable y na temelju dane vrijednosti x
0
.
y|x
0
= β
0
+ β
1
x
0
+ ε
0
.

Procjenitelj:
0 1 0 , 0
ˆ x b b y
NOVI
+ =
.

Varijanca procjenitelja:
( )

+ + =
xx
i
NOVI
SS
x x
n
y Var
2
2
) , 0
1
1 ˆ ( σ

Standardna greška predviđenih novih vrijednosti zavisne varijable za danu vrijednost x
0
je:
( )

+ + =
xx
i
y
SS
x x
n
s s
NOVI
2
2
ˆ
1
1
, 0
.

27
Interval pouzdanosti za nova opažanja uz razinu značajnosti α = 0.05 je:
2 , 025 . 0 ˆ , 0
,
ˆ

±
n y NOVI
t s y
NOVI i

Intervali pouzdanosti za više x vrijednosti:

Prosjek populacije:
p n p y i
pF s y
i

±
, , ˆ
ˆ
α

Nova opažanja:
p n p NOVI y i
pF s y
i

±
, , , ˆ
ˆ
α

Gdje su:
F = granična vrijednost F raspodjele za p i (n–p) stupnjeva slobode
p = broj parametara
n = broj opažanja
α = vjerojatnost da je barem jedan interval nekorektan.

550
600
650
700
750
212 214 216 218 220 222
Opseg trupa (cm)
T
e
ž
i
n
a

(
k
g
)

Slika -6: Površine pouzdanosti za prosjeke populacije za dane vrijednosti x ( ___ )i nova opažanja (......)
28

2.8 Raščlanjenje ukupne varijabilnosti
Regresijskim modelom nastoji se objasniti što veći dio varijabilnosti zavisne varijable.

*
*
*
raspodjela
y
*
*
*
*
*
*
*
*
x
y y
i
oko
raspodjela
(A)
(B)
y y
i
ˆ oko

y

Slika 2-7: Raspodjela varijabilnosti oko prosjeka i procijenjenog pravca regresije.
(B) mjeren sa sumom kvadrata za ostatak:

( )
2
ˆ

− =
i
i i OST
y y SS

(A) mjeren sa ukupnom sumom kvadrata:
( )
2

− =
i
i i UKUP
y y SS

Tri izvora varijabilnosti:

1.Varijabilnost opisana modelom
- protumačena varijabilnost, mjeri se sumom kvadrata za regresiju (SS
REG
).
2. Ukupna varijabilnost zavisne varijable
- varijabilnost oko y , mjeri se ukupnom sumom kvadrata. (SS
UKUP
)
3. Neprotumačena varijabilnost
- varijabilnost oko yˆ
, mjeri se sumom kvadrata za ostatak (SS
OST
).
*
*
*
*
*
*
*
*
*
*
*
*
y
x

29
Jak linearan trend: SS
OST
<< SS
UKUP

*
*
*
*
*
*
*
*
*
*
*
*
y
x

Slab linearan trend: SS
OST
≈ SS
UKUP

Vrijedi
) ˆ ( ) ˆ ( ) ( y y y y y y
i i i i
− + − = −
)
*
*
*
*
*
*
*
*
y
x
y y
i

\$ y y −
y y
i
− \$
\$ y
y
*
y
i

Slika 2-8: Prikaz mjerenja y kao odstupanja od prosjeka i procijenjenog pravca

Može se pokazati da vrijedi:
( ) ( ) ( )
2 2 2
ˆ ˆ
∑ ∑ ∑
− + − = −
i
i i
i
i
i
i
y y y y y y
SS
UKUP
= SS
REG
+ SS
OST

1) SS
UKUP
= SS
yy
2)
xx
xy
REG
SS
SS
SS
2
) (
=
3)
xx
xy
yy OST
SS
SS
SS SS
2
) (
− =

Na slična način kao što se raščlanjuju sume kvadrata, tako se raščlanjuju i stupnjevi slobode:

(n–1) = 1 + (n–2) (stupnjevi slobode)
ukupno = regresija + ostatak
30
Ukupani stupnjevi slobode:
- gubi se 1 stupanj slobode u procijeni aritmetičke srednje vrijednosti
Stupnjevi slobode ostatka:
- gube se 2 stupnja slobode u procijeni β
0
i β
1
.
Stupanj slobode za regresiju:
- treba 1 stupanj slobode za procjenu β
1
.

1
REG
REG
SS
MS =
2 −
=
n
SS
MS
OST
OST

Ovi izračunati prosjeci kvadrata koriste se u provjeri hipoteza.

2.9 Provjera hipoteza - F- provjera
Hipoteze:
H
0
: β
1
= 0 nema regresije
H
1
: β
1
≠ 0 regresija postoji

Statistika za provjeru:
OST
REG
MS
MS
F =

Ovdje je:
1
MS
REG
= =
REG
SS

2
MS
OST
=

=
n
SS
OST

F statistika ima F-raspodjelu sa stupnjevima slobode 1 i (n–2) ukoliko vrijedi H
0
.

Za α razinu značajnosti odbacujemo H
0
ako je izračunata vrijednost F ekstremnija od kritične
vrijednosti F raspodjele (F > F
α,1,n–2
)

f (F
1, n-2 )
F
α,1,n -2
F
1,n -2

Slika 2.9 F raspodjela i kritična vrijednost za stupnjeve slobode 1 i (n – 2). Izraz F
α,1,n–2
predstavlja
kritičnu vrijednost F raspodjele
31
Korisno je izračune i provjeru upisati u ANOVA tablicu (tablicu analize varijance)

ANOVA tablica
Izvor SS df MS F
Regresija SS
REG
1 MS
REG
F = MS
REG
/ MS
OST
Ostatak SS
OST
n–2 MS
OST

Ukupno SS
UKUP
n–1

Analiza varijance je podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih
izvora.

2.10 Koeficijent determinacije (R
2
)
- Proporcija varijabilnosti protumačenog modelom u odnosu na ukupnu varijabilnost:
UKUP
OST
UKUP
REG
SS
SS
SS
SS
R − = = 1
2

Poprima vrijednosti od 0 do 1: 1 0
2
≤ ≤ R
Mjera valjanosti modela
“Dobar” model
UKUP REG
SS SS ≈
“Loš” model
UKUP OST
SS SS ≈
“Dobar model” znači da je
1
2
≈ R

32

2.11 SAS primjer za jednostavnu linearnu regresiju

Primjer: Procijenite pravac linearne regresije težine na opseg grudi krava prema slijedećem uzorku:

Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg prsa (x): 214 215 216 217 219 221

SAS program:

DATA krave;
INPUT tezina opseg;
DATALINES;
641 214
633 215
651 216
666 217
688 219
680 221
;
PROC REG;
MODEL tezina = opseg / ;
RUN;
QUIT;
*ili;

PROC GLM;
MODEL tezina =opseg / ;
RUN;
QUIT;

Objašnjenje: Koristi se procedura GLM ili procedura REG. Naredba MODEL tezina = opseg znači
da je zavisna varijabla tezina, a nezavisna opseg.

SAS ispis:
Analiza varijance

Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 1927.52941 1927.52941 16.642 0.0151
Error 4 463.30392 115.82598
C Total 5 2390.83333

Root MSE 10.76225 R-square 0.8062
Dep Mean 659.83333 Adj R-sq 0.7578
C.V. 1.63106

Parameter Estimates

Parameter Standardna T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -974.049020 400.54323178 -2.432 0.0718
OPSEG 1 7.529412 1.84571029 4.079 0.0151
33

Objašnjenje: Prvo je dana ANOVA tablica: izvor (Source), stupnjevi slobode (DF), sume kvadrata
(Sum of Squares), prosjek kvadrata (Mean Square), F vrijednost (F value) i P vrijednost (Prob>F).
Izvori varijabilnosti su Regresija (Model), Ostatak (Error) i Ukupno (C Total). Vidljivo je da je
F = 16.642 sa P vrijednosti = 0.0151, što znači da je koeficijent regresije u uzorku značajno različit
od nule. Ispod ANOVA tablice dane su standardna greška regresijskog modela (Root MSE) =
10.76225 i koeficijent determinacije (R-square) = 0.8062. Ispod podnaslova Parameter Estimates,
možemo vidjeti procijene parametara sa standardnim greškama i t provjerom da su procjenitelji
značajno različiti od nule. Ovdje je b
0
(INTERCEP) = 974.046020 sa standardnom greškom
(Standard error) = 400.54323178, a b
1
(opseg) = 7.529412 sa standardnom greškom 1.84571029.
Izračunata t statistika je 4.079, s P vrijednosti (Prob > |T|) = 0.0151, što pokazuje da je b
1
značajno
različit od nule.

630
640
650
660
670
680
690
700
214 216 218 220 222
Opseg prsa (cm)
T
e
ž
i
n
a

(
k
g
)

Slika 2-10: Regresija težine krava na opseg prsa

34
3 Koeficijent korelacije
Korelacija:
- mjera jakosti linearne veze između dvije varijable
- relativna mjera
- poprima vrijednosti između -1 i 1
- x i y su slučajne varijable sa zajedničkom bivarijatnom raspodjelom
-Varijable zajednički variraju
- Ne mora nužno postojati uzročno-posljedična veza

(Pozor: Regresija: uzročno-posljedična veza x i y, x = nezavisna, y = zavisna varijabla)

Koeficijent korelacije:
2 2
y x
xy
σ σ
σ
ρ =

σ
2
y
= Var(y)
σ
2
x
=Var(x)
σ
xy
= Cov(x, y) = kovarijanca između x i y
x i y su slučajne normalne varijable.

Kovarijanca:
- zajedničko variranje dvije slučajne varijable
- apsolutna mjera veze
- ako su varijable nezavisne => Cov(x, y) = 0
Korelacija je kovarijanca standardiziranih varijabli x i y

- Korealcija ρ može biti pozitivna ili negativna.
Korelacija ρ = 1 ili ρ = –1 znači idealnu linearnu vezu
ρ = 0 znači da veza ne postoji.

35
x
x
x
x
y
x
y
x
a)
x
b)
x
c)
x
d)
x
x
y
x
y

Slika 3-1 a) pozitivna korelacija, b) negativna korelacija, c) korelacija ne postoji d) veza između
varijabli postoji ali nije linearna

3.1 Procjena koeficijenta korelacije
Procjenitelj koeficijenta korelacije je koeficijent korelacije uzorka:
yy xx
xy
SS SS
SS
r =

SS
xx
( )
2

− =
i
i xx
x x SS
SS
yy
( )
2

− =
i
i yy
y y SS
SS
xy
= suma produkata y i x
( )( ) y y x x SS
i
i
i xy
− − =

n = veličina uzorka

36
4 Vektori i matrice
Matrica je skup brojeva koji su po nekom kriteriju svrstani u redove i kolone:
2 x 3 2 x 3
32 31
22 21
12 11
1 2
1 1
3 1
a a
a a
a a

=

= A
2 x 3 2 x 3
32 31
22 21
12 11
2 1
3 1
1 2
b b
b b
b b

=

= B

Često pišemo: A = {a
ij
}
3x2

Vektor:
jedna kolona ili jedan red
1 x 2
2
1

= b

4.1 Tipovi i svojstva matrica
- isti broj kolona i redova.
Simetrična matrica:
- vrijedi a
ij
= a
ji
.

2 x 2
2 1
1 2

= C

Dijagonalna matrica
- kvadratna matrica takva da je a
ij
= 0 za svaki i ≠ j
2 x 2
2 0
0 2
D

=

Jedinična matrica:
- dijagonalna matrica
a
ii
= 1

=

=
1 0 0
0 1 0
0 0 1
,
1 0
0 1
3 2
I I

Nul matrica je matrica čiji su svi članovi jednaki nuli. Nul vektor je vektor čiji su članovi jednaki
nuli.
37

=

=
0
0
0
0 ,
0 0
0 0
0

Matrica čiji su svi članovi jednaki 1, obično se označava sa J. Vektor čiju su svi članovi jednaki 1
obično se označava sa 1.

=

=
1
1
1
,
1 1
1 1
1 J

Transponirana matrica:
- matrica kojoj su kolone zamijenjene s redovima

=
1 1 3
2 1 1
' A

4.1.1 Operacije s matricama i vektorima:

Zbrajanje matrica
=

+ +
+ +
+ +
= +
33 33 31 31
22 22 21 21
12 12 11 11
b a b a
b a b a
b a b a
B A

2 x 3
1 3
4 2
4 3
2 1 1 2
3 1 1 1
1 3 2 1

=

+ − +
+ +
+ +
= + B A

Množenje matrica s brojem
2 x 3
2 4
2 2
6 2
2

= A

Množenje matrice s matricom
- broj kolona prve matrice mora biti jednak broju redova druge matrice,
- broj elemenata u redu prve matrice mora biti jednak broju redova druge matrice

Općenito:
A = {a
ik
}ima dimenzije r x c
B = {b
kj
}ima dimenziju c x s
produkt AB= {c
ij
} ima dimenziju r x s:
c
ij
= ∑
=
c
1 k
kj ik
b a

Primjer: Izračunaj AC ako je:
38
2 x 3 2 x 3
32 31
22 21
12 11
1 2
1 1
3 1
a a
a a
a a

=

= A
i
2 x 2 2 x 2
22 21
12 11
2 1
1 2
c c
c c

= C

+ +
+ +
+ +
=
22 32 21 31 21 32 11 31
22 22 21 21 21 22 11 21
22 12 21 11 21 12 11 11
c * a c * a c * a c * a
c * a c * a c * a c * a
c * a c * a c * a c * a
AC

2 3
0 3
3 3
7 5
2 * 1 1 * 2 1 * 1 2 * 2
2 * 1 1 * 1 1 * 1 2 * 1
2 * 3 1 * 1 1 * 3 2 * 1
x

=

− −
+ +
+ +
= AC

Primjer 2:
1 x 2
2
1

= b
. Izračunaj Ab

1 x 3 1 x 3
0
3
7
1 * 1 2 * 2
2 * 1 1 * 1
2 * 3 1 * 1

=

+
+
= Ab

- umnožak transponiranog vektora i samog vektora
- predstavlja sumu kvadrata elemenata vektora.

Neka je vektor
1 nx
n
2
1
y
...
y
y

= y

| |

=

=
i
2
i
n
2
1
n 2 1
y
y
...
y
y
y .. y y y y'

Inverzna matrica neke matrice C je matrica C
-1
takva da je C
-1
C = I i CC
-1
= I

Sustav linearnih jednadžbi može prikazati matrično.
Primjer: Sustav jednadžbi s dvije nepoznanice
2a
1
+ a
2
= 5
a
1
– a
2
= 1

39

=
2
1
a
a
a

=
1 1
1 2
X

=
1
5
y

Xa = y | X
–1

X
–1
Xa = X
–1
y
a = X
–1
y

=

=

=

1
2
1
5
3 / 2 3 / 1
3 / 1 3 / 1
1
5
1 1
1 2
1
2
1
a
a

X’Xa = X’y
(X’X)
–1
(X’X)a = (X’X)
–1
X’y
broj nepoznanica

40
5 Jednostavna regresija u matričnom prikazu
skalarni model regresije:
y
i
= β
0
+ β
1
x
i
+ ε
i
i = 1,.....n

Definirajmo vektore i matrice

=
n
y
y
y
...
2
1
y

=
n
x
x
x
1
... ...
1
1
2
1
X

=
1
0
β
β
β

=
n
ε
ε
ε
...
2
1
ε

y = vektor opažanja zavisne varijable
X = matrica opažanja nezavisnih varijabli
β = vektor parametara
ε = vektor greški

y = Xβ + ε

Prosjek od y :

( ) Xβ y =

+
+
+
=

=
n n
x
x
x
y E
y E
y E
E
1 0
2 1 0
1 1 0
2
1
...
) (
...
) (
) (
β β
β β
β β

Varijanca od y je:
Var(y) = σ
2
I

Procijenjeni model :
Xb y = ˆ

y y e ˆ − = = vektor ostataka
b = vektor procjenitelja

=
1
0
b
b
b i

=
n
2
1
e
...
e
e
e
(X’X)b = X’y

41
b = (X’X)
–1
X’y

=
∑ ∑

i
i
i
i
i
i
x x
x n
2
X X'

=

i
i i
i
i
y x
y
y X'

− +
=

xx xx
xx x
SS SS
x
SS
x
SS
x
n
1
1
) (
2
1
X X'

Očekivanje i varijanca su:
E(b) = β

= ) ( =
1 − 2
) ( ) , (
) , ( ) (
) Var(
1 1 0
1 0 0
b Var b b Cov
b b Cov b Var
X X' b σ

Ukoliko koristimo s
2
tada je varijanca vektora b jednaka:

s
2
(b) = s
2
(X'X)
–1

Vektor procijenjenih vrijednosti zavisne varijable je:
( ) y X X X X Xb y
1
' ' ˆ

= =

Ostatak je definiran sa:
y - y e ˆ =

( )
2
i
i REG
y yˆ ) ˆ ( )' ˆ ( SS

− = − − = y y y y
( )
2
i
i OST
yˆ y ) ˆ ( )' ˆ ( SS

− = − − = y y y y
( )
2
i
i UKUP
y y ) ( )' ( SS

− = − − = y y y y

Primjer: Napišite procijenjeni model regresije težine na opseg grudi krava koristeći matrice i
vektore. Mjerenja 6 krava dana su u slijedećoj tablici:

Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg prsa (x): 214 215 216 217 219 221

42
Vektor y i matrica X su:

=
680
688
666
651
633
641
y i

=
221 1
219 1
217 1
216 1
215 1
214 1
X
Prva kolona matrice X sadrži broj 1 jer procjenjujemo odsječak na osi y, b
0
. Kada uvrstimo X i y,
model je:

+

=

6
5
4
3
2
1
1
0

2211 1
219 1
217 1
216 1
215 1
214 1
680
688
666
651
633
641

e
e
e
e
e
e
b
b

+ ⋅ +
+ ⋅ +
+ ⋅ +
+ ⋅ +
+ ⋅ +
+ ⋅ +
=
6 1 0
5 1 0
4 1 0
3 1 0
2 1 0
1 1 0
221
219
217
216
215
214
e b b
e b b
e b b
e b b
e b b
e b b

43
6 Multipla regresija
Multipla regresija:
- regresija koja ima dvije ili više nezavisnih varijabli
- regresija koja ima tri ili više parametara
Ciljevi:
1. Pronaći model (funkciju) koja najbolje opisuje zavisnost zavisne varijable o nezavisnim
varijablama. Odnosno odrediti parametre.
2. Predviđanje vrijednosti zavisne varijable na temelju novih mjerenja nezavisnih varijabli
3. Proučiti važnost nezavisnih varijabli, odnosno procijeniti da li su sve ili samo neke nezavisne
varijable važne u modelu. To je izgradnja optimalnog modela.

Podaci:

y x
1
x
2
... x
p

y
1
x
11
x
21
... x
p1

y
2
x
12
x
22
... x
p2

. . . .
. . . .
y
n
x
1n
x
2n
... x
pn

Model:
y
i
= β
0
+ β
1
x
1i
+ β
2
x
2i
+ ... + β
p–1
x
(p–1)i
+ ε
i
i = 1,...,n

y
i
= opažanja zavisne varijable
x
1i
,x
2i
,......,x
(p–1)i
= opažanja nezavisnih varijabli
β
0
, β
1
, β
2
,......, β
p–1
= regresijski koeficijenti (parametri)
ε
i
= ‘greška’, model nije egzaktan, slučajna odstupanja, neprotumačena, zbog jedinke ili mjerenja

6.1 Dvije nezavisne varijable
Model:
y
i
= β
0
+ β
1
x
1i
+ β
2
x
2i
+ ε
i
i = 1,...,n

y
i
= opažanja zavisne varijable y
x
1i
i x
2i
= opažanja nezavisnih varijabli x
1
i x
2

β
0
, β
1
, β
2
= regresijski koeficijenti (parametri)
ε
i
= greška modela

Model procijene (procijenjena krivulja) je:
i i i
x b x b b y
2 2 1 1 0
ˆ + + =
i = 1,...,n

44
Ostatak:
)] x b x b (b - [y yˆ y e
2i 2 1i 1 0 i i i i
+ + = − =

b
0
, b
1
i b
2
= procjenitelji parametara

Model matrično:
y = Xβ + ε

y = vektor zavisne varijable
β = vektor parametara
X = matrica konstanti
ε = vektor greški sa prosjekom E(ε) = 0 i varijancom Var(ε) = σ
2
I

=
n
y
y
y
...
2
1
y

=
n n
x x
x x
x x
2 1
22 12
21 11
1
... ... ...
1
1
X

=
2
1
0
β
β
β
β

=
n
ε
ε
ε
...
2
1
ε

Procijenjeni model je:
Xb y = ˆ

=
2
1
0
b
b
b
b

=
n
e
e
e
...
2
1
e

uvjet da Σ
i
e
2
i
= e’e = min.
e’e parcijalno derivira po b i izjednači s nulom.
X’Xb = X’y

b = (X’X)
–1
X’y

=
n 2 n 1
22 12
21 11
n 2 22 12
n 1 12 11
x x 1
... ... ...
x x 1
x x 1
x ... x x
x ... x x
1 ... 1 1
X X'

=
∑ ∑ ∑
∑ ∑ ∑
∑ ∑
i
i
i
i i
i
i
i
i i
i
i
i
i
i
i
i
i
x x x x
x x x x
x x n
2
2 2 1 2
2 1
2
1 1
2 1

=

=

i
i i 2
i
i i 1
i
i
n
2
1
n 2 22 21
n 1 12 11
y x
y x
y
y
...
y
y
x ... x x
x ... x x
1 ... 1 1
y X'

Primjer

45
Ostatak:
y y e ˆ − =

SS
OST
= e'e
Varijanca σ
2
procjenjuje se sa
OST
OST
MS
p n
SS
s =

=
2

n–p = stupnjevi slobode.
Općenito: stupnjevi slobode = n – (broj parametara u modelu).
Drugi korijen iz procjene varijance:
2
s s =

standardna greška regresijskog modela.

Svojstva procjenitelja:
E(b) = β
Var(b) = σ
2
(X’X)
–1

Ukoliko se koristi varijanca procijenjena iz uzorka tada je varijanca:
s
2
(b) = s
2
(X’X)
–1

Provjera hipoteze H
0
: β
i
= 0
Statistika za provjeru:
) (
i
i
b s
b
t =

) ( ) s(b
2
i i
b s =
Kritična vrijednost t raspodjele određuje se prema razini značajnosti α i stupnju slobode
n –p, gdje je p = broj parametara.
p = 3 pa su stupnjevi slobode jednak n–3.

6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza
( )
2
ˆ ) ˆ ( )' ˆ (

− = − − =
i
i REG
y y SS y y y y

( )
2
ˆ ) ˆ ( )' ˆ (

− = − − =
i
i OST
y y SS y y y y

( )
2
) ( )' (

− = − − =
i
i UKUP
y y SS y y y y

SS
UKUP
= SS
REG
+ SS
OST

Stupnjevi slobode:
n–1 = (p–1) + (n–p)

n = broj životinja i p je broj parametara

Hipoteze:
46
H
0
: β
2
= ... = β
p
= 0
H
1
: barem jedan β
i
≠ 0, i = 1 do p–1

Ako nul hipoteza vrijedi tada kvocijent
OST
REG
MS
MS
F =

ima F-raspodjelu sa (p–1) i (n–p) stupnjeva slobode, gdje je p broj parametara u modelu.
Za α razinu značajnosti odbacujemo H
o
ako
F
α,p–1,n–3
( F > F
α,p–1,n–3
).
ANOVA tablica
Izvor SS df MS = SS/df F
Regresija SS
REG
p–1 MS
REG
F=MS
REG
/SS
OST
Ostatak SS
OST
n–p MS
OST
Ukupno SS
UKUP
n–1

Koeficijent multiple determinacije je:
UKUP
OST
UKUP
REG
SS
SS
SS
SS
R − = = 1
2

0 ≤ R
2
≤ 1

6.2 Parcijalne i stupnjevite ekstra sume kvadrata
SS
REG
se može raščlaniti na sume kvadrate za odgovarajuće parametre u modelu
Provjerava se važnost pojedinih parametara
Primjer: Puni model (sve varijable uključene u model).
y = β
0
+ β
1
x
1
+ β
2
x
2
+ β
3
x
3
+ ε

Reducirani modeli (podskupovi punog modela):
y = β
0
+ β
1
x
1
+ β
2
x
2
+ ε
y = β
0
+ β
1
x
1
+ β
3
x
3
+ ε
y = β
0
+ β
2
x
2
+ β
3
x
3
+ ε
y = β
0
+ β
1
x
1
+ ε
y = β
0
+ β
2
x
2
+ ε
y = β
0
+ β
3
x
3
+ ε
y = β
0
+ ε

Broj parametara ↓ ⇒ SS
REG
↓ SS
OST

Broj parametara ↑ ⇒ SS
REG
↑ SS
OST

Provjera opravdanosti parametara β
3
i β
4
u punom modelu je:
Općenito:
) (
). ( ) (
_
_ _
PUNI PUNI OST
REDUCIRANI PUNI PUNI OST REDUCIRANI OST
p n SS
p p SS SS
F

− −
=

47
Ovdje je:
p
REDUCIRANI
= broj parametara u reduciranom modelu.
p
PUNI
= broj parametara u punom modelu
SS
OST_PUNI
/ (n–p
PUNI
) = MS
OST_PUNI
= prosjek kvadrata ostatka punog modela

6.3 SAS primjer za multiplu regresiju

Primjer: Procijenite regresiju težine na opseg grudi i visina do grebena 6 mladih bikova. Podaci su
slijedeći:

Bik: 1 2 3 4 5 6 7
Težina, kg (y) 480 450 480 500 520 510 500
Opseg, cm (x
1
): 175 177 178 175 186 183 185
Visina, cm (x
2
): 128 122 124 128 131 130 124

SAS program:

DATA bikovi;
INPUT tezina opseg visina;
DATALINES;
480 175 128
450 177 122
480 178 124
500 175 128
520 186 131
510 183 130
500 185 124
;
PROC GLM;
MODEL tezina=opseg visina ;
RUN;
QUIT;

SAS ispis:

Dependent Variable: tezina

Sum of
Source DF Squares Mean Square F Value Pr > F
Model 2 2727.655201 1363.827601 9.78 0.0288
Error 4 558.059085 139.514771
Corrected Total 6 3285.714286

R-Square Coeff Var Root MSE tezina Mean
0.830156 2.403531 11.81164 491.4286

Source DF Type I SS Mean Square F Value Pr > F
opseg 1 1400.983103 1400.983103 10.04 0.0339
visina 1 1326.672098 1326.672098 9.51 0.0368

Source DF Type III SS Mean Square F Value Pr > F
opseg 1 616.426512 616.426512 4.42 0.1034
48
visina 1 1326.672098 1326.672098 9.51 0.0368

Standard
Parameter Estimate Error t Value Pr > |t|
Intercept -495.0140313 225.8696150 -2.19 0.0935
opseg 2.2572580 1.0738674 2.10 0.1034
visina 4.5808460 1.4855045 3.08 0.0368

6.4 Krivolinijska regresija drugog stupnja
Model:
y
i
= β
0
+ β
1
x
i
+ β
2
x
2
i
+ ε
i
i = 1,...,n

y
i
= opažanja zavisne varijable y
x
i
= opažanja nezavisne varijable x
β
0
, β
1
, β
2
= regresijski koeficijenti (parametri)
ε
i
= greška modela,

kvadratna regresija = multipla regresija sa dvije nezavisne varijable x i x
2
,

Model procijene (parabola):
i i i i
e x b x b b y ˆ
2 2 1 1 0
+ + + =
i = 1,...,n

Matrično model se piše:
y = Xβ + ε

=
n
y
y
y
...
2
1
y

=
2
2
2 2
2
1 1
1
... ... ...
1
1
n n
x x
x x
x x
X

=
3
1
0
β
β
β
β

=
n
ε
ε
ε
...
2
1
ε

Model procijene:
Xb y = ˆ

Ostatak:
y y e ˆ − =

=
2
1
0
b
b
b
b

=
n
e
e
e
...
2
1
e

Vektor procjena parametara izračuna se iz izraza:
b = (X’X)
–1
X’y

Provjera hipoteza:

H
0
: β
1
= ... = β
p–1
= 0
H
1
: barem jedan β
i
≠ 0, i = 1 do (p–1)

49
Ako nul hipoteza vrijedi tada kvocijent
OST
REG
MS
MS
F =

ima F-raspodjelu sa 2 i (n–3) stupnjeva slobode.

Primarni cilj analize:
- da li je β
2
potreban u modelu
- odnosno da li je model kvadratne regresije valjan.
Hipoteza:
H
0
: β
2
= 0
t- provjera:
) (
2
2
b s
b
t =

Procijenjene varijance i kovarijance za b
0
, b
1
i b
2
su;:
s
2
(b) = s
2
(X’X)
–1

6.4.1 SAS primjer za kvadratnu regresiju
SAS program za primjer s rastom purana je slijedeći.

SAS program:

DATA purani;
INPUT tezina dan @@;
DATALINES;
44 1 66 7 100 14 150 21 265 28 370 35 455 42 605 49 770 56
;
PROC GLM;
MODEL tezina=dan dan*dan/ ;
RUN;
QUIT;

Objašnjenje: Koristimo proceduru GLM. Naredba MODEL tezina = dan dan*dan znači da je zavisna
varijabla tezina, a nezavisne dan kao linearna komponenta i dan*dan kao kvadratna komponenta.

SAS ispis:

Dependent Variable: TEZINA
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 523870.39532 261935.19766 1246.82 0.0001
Error 6 1260.49357 210.08226
Corrected Total 8 525130.88889

R-Square C.V. Root MSE TEZINA Mean
0.997600 4.617626 14.494215 313.88889

Source DF Type I SS Mean Square F Value Pr > F
DAN 1 497569.66165 497569.66165 2368.45 0.0001
DAN*DAN 1 26300.73366 26300.73366 125.19 0.0001

Source DF Type III SS Mean Square F Value Pr > F
DAN 1 859.390183 859.390183 4.09 0.0896
DAN*DAN 1 26300.733664 26300.733664 125.19 0.0001

T for H0: Pr > |T| Std Error of
Parameter Estimate Parameter=0 Estimate
INTERCEPT 38.85551791 3.15 0.0197 12.31629594
DAN 2.07249024 2.02 0.0896 1.02468881
DAN*DAN 0.19515458 11.19 0.0001 0.01744173

0
100
200
300
400
500
600
700
800
0 20 40 60
Dob u danima
T
e
ž
i
n
a

(
g
)

Slika 6-1: Mjerene (•) i procijenjene (-) vrijednosti težine zago

6.5 Moguće poteškoće kod upotrebe regresije
Mogući problemi kod regresije mogu se pojaviti zbog
1) Neka opažanja su ‘loša’. Pod ‘lošim’ podacima misli se na opažanja koja su neuobičajeno
ekstremna.
2) greške modela nemaju konstantnu varijancu
3) greške modela nisu nezavisne
4) greške modela nisu normalno distribuirane
5) Nelinarnost
6) Jedna ili više važnih nezavisnih varijabli nisu uključeni u model
7) Model sadrži previše nezavisnih varijabli
8) Multikolinearnost. Multikolinearnost je pojava kad postoji korelacija između nezavisnih
varijabli.

Mogu dovesti do:
- upotrebe krivog modela,
- lošeg procjene regresije,
- krivog zaključka
- nepreciznosti procjene parametara zbog velike varijance.

6.5.1 Analiza ostataka i narušenost pretpostavki modela
i i i
y y e
ˆ
− =

*
*
*
*
*
*
*
*
*
*
*
0
( )
x y\$
e

Model OK
Raspršenost ostatka slučajna
Varijanca konstantna
Nema ekstremnih podataka.

*
*
*
*
*
*
*
*
*
*
*
*
0
e
( ) x y\$

Nelinearnost. ????Potreban x
i
2
ili x
i
3
u modelu. ???? logaritamska, eksponencijalna funkcija

*
*
*
*
*
*
*
*
*
*
*
0
( )
x y\$
e

Zavisnost ostataka (autokorelacija)

*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
0
( )
x y\$
e

Varijanca nije homogena. Potrebne su transformacije ili x ili y varijable.
Moguća je i upotreba različite strukture varijance koja će definirati nehomogenost.

Normalnost ostataka. Nenormalnost dovodi u pitanje valjanost
F ili t provjere.
??? poopćeni linearni model (engl. 'generalized linear models')

6.5.2 Loša opažanja
‘loša’ = neuobičajeno ekstremna opažanja

*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
x
i x
i
y
y
*
*
*
*
4
5
3
2
1
*

Slika -2 Prikaz ekstremnih vrijednosti u analizi regresiji Ekstremne vrijednosti su zaokružene i označene
brojevima: a) ekstremi u odnosu na x su: 3, 4 i (5), b) ekstremi u odnosu na y su: 1, 2 i 4, c) ekstremi koji
imaju utjecaja na procjenu regresije su: 2, 4 i (5)

6.5.3 Multikolinearnost
Postoji značajna i visoka korelacija između nezavisnih varijabli
Nezavisne varijable su skoro linearno zavisne
Varijanca procjenitelja velika
Problem multiokolinearnosti može se riješiti:
a) ispuštanjem problematičnih opažanja
b) ako se iz nekoliko koreliranih nezavisnih varijabli definira jedna
c) ispuštanjem nepotrebnim varijabli iz modela
d) korištenjem drugih statističkim metoda ('Ridge' regresija ili 'Principal Components')

6.6 Izgradnja modela i kriteriji za izbor modela
a) Koeficijent determinacije(R
2
)
Dodavanje nove varijable ==> povećanje R
2

? dodavanje kojih varijabli značajno povećava R
2

OST
)
Dodavanje nove varijable obično se smanjuje MS
OST
.
!!!! opasnost da se izabere preveliki model.

c) Parcijalne F-provjere
Značajnost pojedine varijable u modelu.
??? optimalan model. Kolinearnost (varijable gledane posebno mogu izgledati važne, a ukupni
model može biti vrlo neprecizan)

c ) Cp kriterij ('Conceptual Predictive Criterion')
- Uspoređuje se model kandidat sa 'pravim' modelom

e) AIC (Akaike Information Criteria)

7 Jednostruka analiza varijance
Cilj:
- da li postoji razlika prosjeka više populacija
- provjera razlika aritmetičkih prosjeka uzoraka izabranih iz više populacija.

Zavisna varijabla:
- mjerenja ili opažanja
Nezavisna varijabla:
- grupa (ili način klasificiranja), često kažemo i tretmani (grupe predstavljaju populacije)

- kvalitativna, ili kategorička varijabla
- faktor

Da li postoji utjecaj grupa na opažanja???

Primjer1 :
Utjecaj različite hranidbe na prirast u tovu.
Sakupljanje podataka, odnosno organiziranje pokusa:
Odredit ćemo grupe životinja slučajnim izborom, različito ih tretirati i izračunati srednje vrijednosti
grupa.
(Izabrati ćemo slučajni uzorak i slučajno primijeniti tretmane (napraviti grupe) na uzorak).

Primjer 2: Da li postoji razlika u mliječnosti krava simentalske pasmine između tri županije.
Sakupljanje podataka, odnosno plan pokusa:
– Izabrati ćemo slučajne uzorke iz županija
– Županije su definicije grupa (različitih populacija)

Pitanja?
1. Procijeniti prosjeke grupa i ukupnu srednju vrijednost,
2. Da li postoji utjecaj grupe, tj. da li su prosjeci pojedinih grupa različiti
• (Da li su aritmetičke srednje vrijednosti uzoraka grupa značajno različiti)

Odgovoriti na pitanje da li postoji utjecaj grupe, tj. da li su srednje vrijednosti pojedinih grupa
dovoljno različite da ih možemo smatrati značajno različitim.
(Značajna razlika => u smislu da možemo u velikom broju takvih ponovljenih pokusa
očekivati razliku.)

Odgovor na ova pitanja može dati statistička procedura koja se zove analiza varijance.

Analiza varijance:
- podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih izvora.
- da li je protumačena varijabilnost (varijabilnost između prosjeka grupa) značajna u odnosu
na neprotumačenu varijabilnost (unutar grupa)

Modeli analize varijance prema broju nezavisnih (kategoričkih) varijabli:
- jednostruka
- dvostruka, itd.
7.1 Model jednostruke analize varijance s fiksnim utjecajima
Pretpostavka je da postoji fiksni utjecaj, tj. utjecaj grupe je isti na svaku jedinku u toj grupi

Neka je broj grupa (tretmana) = a
Grupe ili tretmani = slučajni uzorci iz odgovarajućih populacija
Po svakom tretmanu n mjerenja.
ukupno N = (n a) jedinica je podijeljeno u a grupa veličine n.

Mjera varijabilnosti između grupa je varijabilnost prosjeka grupa
Mjera varijabilnosti unutar grupa je varijabilnost između pojedinih mjerenja unutar grupe

Model:
y
ij
= µ + τ
i
+ ε
ij
i = 1,.....,a j = 1,...,n

y
ij
= opažanje jedinice j u grupi i (tretmanu i)
µ = ukupni prosjek
τ
i
= fiksni utjecaji grupe ili tretmana i
ε
ij
= greška modela sa N(0, σ
2
)

Nezavisna varijabla τ :
- poprima vrijednosti različitih grupa (tretmana)
- kategorička varijabla, često se zove faktor
- prema modelu faktor ima utjecaj na vrijednosti zavisne varijable y

Prosjeci populacija procjenjuju se aritmetičkim prosjecima grupa.

Model procijene:
i i ij
y τ u u ˆ ˆ ˆ ˆ + = =
i = 1,.....,a j = 1,...,n

ijednost srednja vr ukupna na procijenje ˆ = u

i grupe utjecaj ni procijenje ˆ =
i
τ

i grupe prosjek ni procijenje ˆ =
i
u
i ij ij
y e uˆ − = = ostatak u uzorcima, neprotumačen modelom

y
ij
= j-to mjerenje u i-toj grupi

Grupa
G1 G2 G3
y
11
y
21
y
31

y
12
y
22
y
32

y
13
y
23
y
33

y
14
y
24
y
34

y
15
y
25
y
35

7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti:
Izvori varijabilnosti:
a) ukupna varijabilnost (varijabilnost opažanja bez obzira u kojoj su grupi),
b) varijabilnost opažanja unutar svake grupe i
c) varijabilnost između prosjeka grupa

Podsjetimo se da je varijanca uzorka pokazatelj varijabilnosti tog uzorka:
( )
( )
1 1
var
2
2
2
2

=

= =

n
n
y
y
n
y y
s
i
i
i
i
i
i

Također,
( )
( )

− = −
i
i
i
i
i
i
n
y
y y y
2
2 2
= suma kvadrata korigirana na srednju vrijednost (SS).

Mjere izvora varijabilnosti

• Ukupna varijabilnost => (SS
UKUP
• Varijabilnost između grupa => (SS
TRT
) = Suma kvadrata između grupa (tretmana)
= Suma kvadrata za grupe (tretmane)
• Varijabilnost unutar grupa => (SS
OST
) = Suma kvadrata unutar grupa

SS
TRT
= Suma kvadrata između grupa (tretmana) = Suma kvadrata za grupe (tretmane)
SS
OST
grešku
SS
UKUP

Može se pokazati da vrijedi:

SS
UKUP
= SS
TRT
+ SS
OST

Stupnjevi slobode (ukupno) = stupnjevi slobode (grupa) + stupnjevi slobode (ostatak)
(N–1) = (a–1) + (N–a)
N = ukupan broj mjerenja, a = broj tretmana.

Oznake prosjeka:
i
j
ij
i
n
y
y

= .
= prosjek grupe i
..
N
y
y
ij
i j
∑∑
= = prosjek svih opažanja
N = ukupan broj opažanja

∑ ∑
− =
i j
ij UKUP
y y SS
2
..) (

∑ ∑ ∑
− = − =
i
i i
i j
i TRT
y y n y y SS
2 2
..) . ( ..) . (

∑ ∑
− =
i j
i ij OST
y y SS
2
.) (

Kratki način računanja:
1) Ukupna suma
Σ
i
Σ
j
y
ij

2) Korekcija za srednju vrijednost
( )
( )
opazanja broj ukupni
suma ukupna
2
2
= =
∑∑
N
y
C
i j
ij

∑ ∑
− =
i j
ij UKUP
C y SS
2
= Suma svih kvadriranih opažanja minus C
4) Suma kvadrata za grupe (tretmane)
( )
C
n
y
SS
i
i
j
ij
TRT
− =

2
= Suma
( )
grupi u opažanja broj
suma grupe

2
za svaku grupu minus C
SS
OST
= SS
UKUP
– SS
TRT

prosjek kvadrata = SS/ stupnjevi slobode

MS
TRT
= SS
TRT
/(a–1)
MS
OST
= SS
OST
/(N–a)

7.1.2 Postavljanje hipoteza i F-provjera

H
0
: τ
1
= τ
2
=... = τ
a
, nema utjecaja grupa
H
1
: τ
i
≠ τ
i’
za barem jedan par (i,i’), razlika između grupa postoji

Hipoteza se može i ovako postaviti:

H
0
: µ
1
= µ
2
=... = µ
a
, prosjeci populacija su isti,
H
1
: µ
i
≠ µ
i’
za barem jedan par (i,i’) prosjeci populacija nisu isti.

F – provjerom pšrovjeravamo:
- da li je varijabilnost mjerenja potpuno slučajna ili je uvjetovana i nekim sistematskim utjecajem
(grupom ili tretmanom)
- da li je varijabilnost između grupa (između prosjeka grupa) značajna u odnosu na
varijabilnost unutar grupa
- da li su prosjeci grupa ili utjecaji grupa značajno različiti
OST
TRT
MS
MS
F =

ima F raspodjelu sa (a–1) i (N–a) stupnjeva slobode, ukoliko vrijedi H
0
.

:
- Odbacujemo H
0
ako F > F
α,(a–1),(N–a)
, tj. ako je izračunata statistika F iz uzorka veća od kritične
vrijednosti

F
α,(a-1),(N-a)

F F

Slika 7-1: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunatimanji od F kritično,
tj. F < F
α,a–1,N–a
,H
0
ne odbacujemo.

F
α,(a-1),(N-a)

F F

Slika 7-2: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunativeći od F kritočno, tj. F > F
α,a–
1,N–a
,H
0
odbacujemo uz α razinu značajnosti.

Radi preglednosti izračuni i provjera se može napisati u tablicu analize varijance

ANOVA tablica:
Izvor SS df MS = SS/df F
Grupa SS
TRT
a–1 MS
TRT
MS
TRT
/MS
OST
Ostatak SS
OST
N–a MS
OST

Ukupno SS
UKUP
N–1

7.2 Usporedba srednjih vrijednosti pojedinih grupa
F-provjerom provjeravamo da li postoji razlika između tretmana.
Ako se H
0
ne odbaci:
- nije potrebno dublje analizirati problem,
- (!!!mogućnost tip II greške)
Ako se H
0
odbaci:
- ? koji tretman je utjecao na to
- između kojih tretmana je utvrđena značajna razlika.
- da li je µ
i
≠ µ
i’
za tretmane i i'

7.2.1 Najmanja značajna razlika (LSD)
Cilj: utvrditi najmanju razliku koja će biti značajna i usporediti razlike svih parova srednjih
vrijednosti tretmana sa tom vrijednošću.
|
|
.
|

\
|
+ =

'
, 2 / '
1 1
i i
OST a N ii
n n
MS t LSD
α

Procedura:
1.F-provjera (H
0
: µ
1
=..........= µ
a
, H
1
: µ
i
≠ µ
i’
za barem jedan par i,i’)
2. Ukoliko H
1
ii’
za sve parove ii’.
3. Zaključujemo µ
i
≠ µ
i’
ako
' ' ii i i
LSD y y ≥ −

F provjera mora prethoditi LSD da osiguramo razinu značajnosti α za bilo koji broj usporedbi.

Prednost LSD provjere:
- vrlo vjerojatno da će pronaći razliku između srednjih vrijednosti (ako postoje)
- ima nisku razinu tip II greške
Loša strana:
- pokazuje često razlike kada i nisu
- visoka razina tip 1 greške

7.2.2 Tukey provjera (HSD)
t
OST
a N a
n
MS
q HSD

=
, , α
q statistika ima Q raspodjelu (iz tablica); n
t
je broj opažanja po grupi

Zaključujemo
, ako
' ' ' ii i i i i
HSD y y ≥ − ≠ u u
.

Vjerojatnost da se napravi greška tip I je jednaka α, tj razina α vrijedi za cijelu proceduru, tj. za sve
parove srednjih vrijednosti
Za nejednaki broj opažanja po grupi:
) (
1
1
2
N
n
N
a
n
i
i
t

=

Prednost Tukey provjere:
- ne toliko pogrešnih zaključaka kao LSD,
Loša strana:
- ima više pogrešnih µ
i
= µ
j
zaključaka.
7.3 SAS primjer jednostruke analize varijance s fiksnim utjecajima
Primjer: Postavljen je pokus u svrhu provjere razlika tri smjese u dnevnom prirastu prasadi. Tri
smjese su označene s TR
1
, TR
2
i TR
3
. Podaci su dani u slijedećoj tablici:

TR
1
TR
2
TR
3

270 290 290

300 250 340

280 280 330

280 290 300

270 280 300 Ukupno

SAS program:

DATA pigs;
INPUT smjesa \$ prirast @@;
DATALINES;
TR1 270 TR2 290 TR3 290
TR1 300 TR2 250 TR3 340
TR1 280 TR2 280 TR3 330
TR1 280 TR2 290 TR3 300
TR1 270 TR2 280 TR3 300
;
PROC GLM DATA = pigs;
CLASS smjesa;
MODEL prirast = smjesa ;
LSMEANS smjesa / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

Dependent Variable: prirast
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 3640.0000 1820.0000 6.13 0.0146
Error 12 3560.0000 296.6667
Corrected Total 14 7200.0000

R-Square Coeff Var. Root MSE prirast Mean
0.505556 5.939315 17.224014 290.00000

Least Squares Means

prirast Standard LSMEAN
smjesa LSMEAN Error Pr > |t| Number
TR1 280.000000 7.702813 0.0001 1
TR2 278.000000 7.702813 0.0001 2
TR3 312.000000 7.702813 0.0001 3

Least Squares Means for effect smjesa
Pr > |t| for H0: LSMean(i)=LSMean(j)

i/j 1 2 3
1 0.9816 0.0310
2 0.9816 0.0223
3 0.0310 0.0223
7.4 Model sa slučajnim utjecajima grupa
Grupa ili tretman slučajna varijabla sa nekom raspodjelom.
Slijedeće dvije slike prikazuju razlike između modela s fiksnim i modela sa slučajnim utjecajima:

Slika 7-3: Prikaz izvora varijabilnosti fiksnog modela jednostruke analize varijance:
Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .

Slika 7-4: Prikaz izvora varijabilnosti slučajnog modela jednostruke analize varijance:
Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .

Fiksni model:
• Mali (konačan) broj grupa
• Utjecaj grupe definiran i fiksan
• Varijabilnost između grupa nije objašnjena teoretskom raspodjelom

Slučajni model
• Velik (beskonačan) broj grupa
• Utjecaj pojedine grupe (prosjek) je slučajna varijabla
• Varijabilnost između grupa je objašnjena teoretskom raspodjelom

Model jednostruke analize varijance:
y
ij
= µ + τ
i
+ ε
ij
i = 1, 2, ... j = 1,...,n

y
ij
= Opažanje jedinice j u grupi i
µ = ukupni prosjek
τ
i
= slučajni utjecaji grupe ili tretmana i
ε
ij
= slučajna greška
Pretpostavke modela:

τ
i
= slučajna varijabla sa prosjekom E(τ
i
) = 0 i varijancom Var(τ
i
) = σ
2
τ

ε
ij
= slučajna greška sa prosjekom E(ε
ij
) = 0 i homogenom varijancom σ
2

σ
2
τ
i σ
2
= komponente varijance.

τ
i
i ε
ij
su nezavisni, tj.
Cov(τ
i
, ε
ij
) = 0
Iz pretpostavki slijedi
y
i
∼ N(0, σ
2
τ
+ σ
2
) varijanca opažanja sadrži komponente varijanci
Cov(y
ij
, y
ij’
) = σ
2
τ

Cov(τ
i
, y
ij
) = σ
2
τ

- kovarijanca između opažanja unutar jedne grupe je jednaka varijanci između grupa.

Ciljevi:
1. Provjera hipoteza
2. Procjena komponenti varijance
3. Predviđanje τ
1
,.., τ
a
.

Hipoteze: da li postoji varijabilnost između tretmana:
H
0
: σ
2
τ
= 0
H
1
: σ
2
τ
≠ 0

Ukoliko vrijedi H
0
:
=> varijanca grupa jednaka je nuli
=> grupe su jednake jer nema varijabilnosti između njih

F provjera:
OST
TRT
MS
MS
F =

ako vrijedi H
0
2
τ
= 0, i F = 1.

ANOVA tablica

Izvor SS df MS = SS/df E(MS)
Grupa SS
TRT
a–1 MS
TRT
σ
2
+ n σ
2
τ

Ostatak SS
OST
N–a MS
OST
σ
2

Ukupno SS
UKUP
N–1

U tablicu je dobro upisati i očekivanja prosjeka kvadrata, E(MS)

Pošto je
E(MS
OST
) = σ
2

E(MS
TRT
) = σ
2
+ n σ
2
τ

63
mogu se iz Anova tablice procijeniti komponente varijance koristeći jednakosti:
2 2 2 2
ˆ ˆ ) (
τ τ
σ σ σ σ n MS n MS E
TRT TRT
+ = ⇒ + =

2 2
ˆ ) ( σ σ = ⇒ =
OST OST
MS MS E

Iz tog slijedi:
OST
MS =
2
ˆ σ

) - (
ˆ
2
n
MS MS
OST TRT
=
τ
σ

parametara procijene su ˆ i ˆ
2 2
τ
σ σ

n = broj opažanja po grupi

Predviđanje srednjih vrijednosti odnosno utjecaja tretmana (primijetite da su različite od
aritmetičkih prosjeka zbog komponenti varijanci):
.. ˆ y = u
) ˆ . ( ˆ
. ,
u τ
τ
− =
i y i
y b
i

( )
( )
i i
i i
y
n y Var
y Cov
b
i
/
,
2 2
2
. ,
σ σ
σ τ
τ
τ
τ
+
= =
ako su varijance poznate
i
y
n
b
i
/ ˆ ˆ
ˆ
2 2
2
. ˆ ,
σ σ
σ
τ
τ
τ
+
=
ako se varijance isto procjenjuju iz uzoraka

7.5 Intraklasna korelacija
Korelacija između opažanja unutar grupe.
) ( ) (
) , (
' , ,
' , ,
j i j i
j i j i
t
y Var y Var
y y Cov
= ρ

Kovarijanca između opažanja unutar grupa jednaka komponenti varijance između grupa:
Cov(y
ij
,y
ij'
) = Var (τ
i
) = σ
τ
2

Varijanca bilo kojeg opažanja ij je:
Var(y
ij
) = σ
τ
2
+ σ
2

Intraklasna korelacija:
2 2
2
σ σ
σ
ρ
τ
τ
+
=
t

Procjena iz uzorka:
2 2
2
ˆ ˆ
ˆ
σ σ
σ
τ
τ
+
=
t
r

64
7.6 SAS primjer jednostruke analize varijance sa slučajnim utjecajima

Primjer: Mjerena je koncentracija progesterona kod 8 svinja s ciljem da se procijeni varijabilnost
unutar i između svinja, odnosno da se utvrdi da li je varijabilnost između svinja značajna.
Koncentracija progesterona je mjerena tri puta na svakoj svinji. Podaci su u slijedećoj tablici.

Svinja
Mjerenje 1 2 3 4 5 6 7 8
1 5.3 6.6 4.3 4.2 8.1 7.9 5.5 7.8
2 6.3 5.6 7.0 5.6 7.9 4.7 4.6 7.0
3 4.2 6.3 7.9 6.6 5.8 6.8 3.4 7.9

SAS program:

DATA sow;
INPUT sow prog @@;
DATALINES;
1 5.3 1 6.3 1 4.2 2 6.6 2 5.6 2 6.3
3 4.3 3 7.0 3 7.9 4 4.2 4 5.6 4 6.6
5 8.1 5 7.9 5 5.8 6 7.9 6 4.7 6 6.8
7 5.5 7 4.6 7 3.4 8 7.8 8 7.0 8 7.9
;
PROC MIXED DATA=sow METHOD = REML;
CLASS sow ;
MODEL prog = / SOLUTION DDFM = SATTERTH;
RANDOM sow / SOLUTION;
RUN;

SAS ispis:

Covariance Parameter Estimates

Cov Parm Estimate
sow 0.5571
Residual 1.4937

Solution for Fixed Effects

Standard
Effect Estimate Error DF t Value Pr > |t|
Intercept 6.1375 0.3632 7 16.90 <.0001

Solution for Random Effects

Std Err
Effect sow Estimate Pred DF t Value Pr > |t|
sow 1 -0.4599 0.5475 5.49 -0.84 0.4360
sow 2 0.0154 0.5475 5.49 0.03 0.9785
sow 3 0.1386 0.5475 5.49 0.25 0.8093
sow 4 -0.3542 0.5475 5.49 -0.65 0.5437
sow 5 0.5963 0.5475 5.49 1.09 0.3216
sow 6 0.1738 0.5475 5.49 0.32 0.7626
sow 7 -0.8647 0.5475 5.49 -1.58 0.1698
sow 8 0.7547 0.5475 5.49 1.38 0.2216

65
8 Načela planiranja pokusa
Pokus (eksperiment):
- planirano istraživanje u svrhu dobivanja novih činjenica ili potvrde odnosno osporavanja
rezultata prijašnjih pokusa

Istraživanje se može prikazati u nekoliko koraka:
1. Opis problema (uvod)
2. Postavljanje cilja (hipoteze)
- usko, specifično, dalji rad slijedi iz toga
- pitanje na koje treba odgovoriti
- hipoteza koju treba provjeriti
- utjecaj koji treba procijeniti

3. Postavljanje pokusnog plana (design)
- što treba učiniti, materijal i metode
4. Sakupljanje podataka
- prema pokusno planu
5. Analiza (Rezultati i rasprava)
6. Donošenje zaključka
- odgovor na postavljeni cilj
- jasan i koncizan

U pokusnom planu treba definirati:
- Tretmani (populacije)
- Pokusna jedinica
- Jedinica uzorka (opažanje)
- Ponavljanja
- Pokusna greška

Pokusni plan:
- Način na koji se primjenjuju tretmani na pokusne jedinice
- Postavlja ga istraživač
- Unutar okvira plana mora postojati slučajnost primjene tretmana

Statistički model:
- Slijedi pokusni plan
- Pomaže pri provjeri statističkih hipoteza
- Pomaže pri donošenju zaključaka
- Sastoji se od tri dijela:
- prosjeci (očekivanja)
- disperzija (varijance i kovarijance)
- definirane raspodjele
Često prikazan matematičkom formulom

66
8.1 Pokusna jedinica i tretmani
Pokusna jedinica
- jedinica materijala na koje se primjenjuju tretmani
- jedna jedinka, npr. životinja
- ili grupa jedinki kao što je 10 pilića u jednom kavezu
Tretman
- procedura čiji utjecaj će biti mjeren i uspoređivan s drugim utjecajima
- primjer: razina hranidbe, način primjene insekticida
- određivanje populacije za koje će se donositi zaključci

Utjecaj tretmana se mjeri na jedinici uzorka
Faktor: grupa tretmana koji predstavljaju vrijednosti jedne kategoričke nezavisne varijable.

Jedinica uzorka:
- može biti jednaka pokusnoj jedinici
- može biti dio pokusne jedinice

8.2 Ponavljanja i pokusna greška
Ponavljanja:
- kada se tretmani primjenjuju više puta na više pokusnih jedinca
- omogućuju procjenu pokusne greške
- više ponavljanja povećava preciznost pokusa jer se time smanjuju standardne greške
tretmana

Pokusna greška (engl. experimental error):
- mjera neprotumačene varijabilnosti koja postoji između opažanja na pokusnim jedinicama
MS
OST
, s
2
, MS
E

- prosjek kvadrata između pokusnih jedinica
- prosjek kvadrata unutar tretmana (grupa).
Procjena pokusne greške je potrebna:
- za provjeru značajnosti razlika pojedinih utjecaja
- za procjenu intervala povjerenja srednjih vrijednosti

Količina informacija:
2
s
n
I =

Kontrola pokusne greške
(kontrola varijabilnosti između pokusnih jedinica)
Pokusna greška se može smanjiti:
1. Izborom pokusnog materijala sa što manjom varijabilnosti među pokusnim jedinicama
2. Poboljšanjem provedbe pokusa dajući slične uvjete pokusnim jedinicama
3. Izborom odgovarajućeg statističkog plana
67
Na točnu procjenu pokusne greške utječe:
- slučajnost izbora pokusnog materijala
- slučajnost primjene tretmana na pokusne jedinice
Izvori varijabilnost pokusne greške:
- varijabilnost između pokusnih jedinica koju se ne može objasniti
- postoji varijabilnost zbog pomanjkanja uniformnosti u provedbi pokusa.

Preciznost pokusnih planova
• Na preciznost pokusa utječe:
– izbor i homogenost pokusnog materijala
– izbor i razine tretmana
– kontrola pokusne greške
– broj ponavljanja

8.3 Potreban broj ponavljanja
Ovisi o:
- varijabilnosti uzorka
- željenoj razlici između prosjeka tretmana
- preciznosti pokusa
- broju tretmana
- razini vjerojatnosti sa kojom želimo biti sigurni da nismo pogriješili u zaključivanju (razina
značajnosti)

Potreban broj ponavljanja:
( )
2
2
2 /

δ
β α
z z
r
+

z
α/2
= vrijednost na apscisi standardne normalne raspodjele određen sa α/2 vjerojatnosti tipa 1
greške
z
β
= vrijednost na apscisi standardne normalne krivulje određen sa β vjerojatnosti tipa 2 greške
τ = željena razlika koju želimo utvrditi
σ
2
= pokusna greška, odnosno varijanca pokusnih jedinca kad ne bi bilo utjecaja tretmana.

68
9 Potpuno slučajni pokusni plan
Svojstva:
- tretmani se dodjeljuju slučajno na pokusne jedinice
- pokusne jedinice izabrane su slučajno iz populacije
jednostruka analiza varijance = jednofaktorska analiza varijance.
Koristi se:
- kada su pokusne jedinice homogene.

Primjer:

Utjecaj tri različite hranidbe na prirast u tovu.
Prvo treba definirati sakupljanje podataka, odnosno napraviti plan pokusa:
Izabrat ćemo slučajni uzorak i slučajno primijeniti tretmane na uzorak (definirati grupe)
Izabrali smo 15 junadi i različito ih hranili.(tretirali).

69
Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima
Tretmani
T1 T2 T3
June Mjerenje June Mjerenje June Mjerenje
2 1170 1 1090 3 1290
6 1200 4 1050 5 1340
9 1180 8 1080 7 1330
12 1180 10 1090 11 1300
15 1170 14 1080 13 1300

Shema:
Broj životinje 1 2 3 4 5 6 7 8
Tretman T2 T1 T3 T2 T3 T1 T3 T2

Broj životinje 9 10 11 12 13 14 15

Tretman T1 T2 T3 T1 T3 T2 T1

Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima:

Tretmani
T1 T2 T3
Broj Mjerenje Broj Mjerenje Broj Mjerenje
2 y
11
1 y
21
3 y
31

6 y
12
4 y
22
5 y
32

9 y
13
8 y
23
7 y
33

12 y
14
10 y
24
11 y
34

15 y
15
14 y
25
13 y
35

70
10 Blokovi u analizi varijance
Unaprijed je poznato da će neke pokusne jedinice, iako tretirane jednako, ponašati različito
- teže životinje će imati drugačiji prirast nego lakše
- mjerenje na isti dan će biti sličnija nego ona u različitim danima

Pokusni plan:
- pokusne jedinice se klasificiraju i prema tim poznatim izvorima varijabilnosti
- smanjuje se pokusna greška

10.1 Slučajni blok plan (potpuni)
Pokusne jedinice uz tretmane mogu grupirati i prema drugom poznatim izvoru varijabilnosti u
blokove
- npr. na temelju početne težine, kondicije, pasmine, spolu, stadij laktacije, legla, itd.
Blokovi:
- grupe koje služe da se protumači još jedan dio varijabilnosti
- njihova provjera obično nije od primarnog interesa
Cilj grupiranja u blokove:
- da su jedinice unutar blokova slične tako da je varijabilnost između njih uglavnom zbog
različitih tretmana

Karakteristike slučajnog blok plana su:
- imamo a tretmana i b blokova. Svaki tretman se javlja u svakom bloku i to samo jedanput
- način kako se tretmani primjenjuju na životinje u pojedinom bloku je potpuno slučajan
- dvostruka analiza varijance (dvostruka klasifikacija) - dva načina klasificiranja pokusnih
jedinica: prema bloku i tretmanu

Primjer:
- 3 tretmana
- 4 bloka prema početnoj težini
- u svakom bloku 3 životinje na koje slučajno primjenjujemo tretmane
- ukupno 12 životinja u pokusu

Blok Životinje
I 1,2,3
II 4,5,6,
III 7,8,9
IV 10,11,12

Shema pokusnog plana:

71

Blokovi

I II III IV
Br. 1 (T3) br. 4 (T1) br. 7 (T3) br. 10 (T3)
Br. 2 (T1) br. 5 (T2) br. 8 (T1) br. 11 (T2) Br. životinje (Tretman)
Br. 3 (T2) br. 6 (T3) br. 9 (T2) br. 12 (T1)

Rezultati mjerenja:

Blokovi

I II III IV
T1
y
11
y
12
y
13
y
14

T2 y
21
y
22
y
23
y
24

T
r
e
t
m
a
n

T3 y
31
y
32
y
33
y
34

y
ij
= mjerenje tretmana i u bloku j.

Model:
y
ij
= µ + τ
i
+ β
j
+ ε
ij
i = 1,.....,a j = 1,...,b

y
ij
= opažanje pokusne jedinice za tretman i u bloku j
µ, = ukupna srednja vrijednost
τ
i
= fiksni utjecaji grupe (tretmana)
β
j
= fiksni utjecaji blokova
ε
ij
- slučajni neprotumačeni utjecaj N(0, σ
2
) = interakcija blok x tretman

SS
UKUP
= SS
TRT
+ SS
BLK
+ SS
OST

Stupnjevi slobode su:
(ba–1) = (a–1) + (b–1) + (a–1)(b–1)

Također je
(a–1)(b–1) = (ab–a–b+1)

Jednostruka ANOVA:
SS
UKUP
= SS
TRT
+ SS'
OST
Dvostruka ANOVA:
SS
UKUP
= SS
TRT
+ SS
BLK
+ SS
OST

SS'
OST
= SS
BLK
+ SS
OST

SS
OST
: suma kvadrata za ostatak kod dvostruke ANOVA-e (pokusna greška kod slučajnog blok
plana)

SS'
OST
: suma kvadrata za ostatak kod jednostruke ANOVA-e
72
Smanjenje SS ostatka => veća preciznost slučajnog blok plana u utvrđivanju eventualnih razlika
tretmana

∑∑
− =
i j
ij UKUP
y y SS
2
..) (
∑ ∑∑
− = − =
i
i
i j
i TRT
y y b y y SS
2 2
..) . ( ..) . (

∑ ∑∑
− = − =
i
j
i j
j BLK
y y a y y SS
2 2
..) . ( ..) . (

∑∑
+ − − =
i j
j i ij OST
y y y y SS
2
..) . . (

1) Ukupna suma = Σ
i
Σ
j
y
ij

2) Korekcijski faktor za srednju vrijednost:
( )
( )
opazanja broj ukupni
suma ukupna
2
2
= =
∑∑
ab
y
C
i j
ij

3) SS
UKUP
= Σ
i
Σ
j
y
ij
2
– C
4)
( )
C
b
y
SS
i
j
ij
TRT
− =

2

5)
( )
C
a
y
SS
j
i
ij
BLK
− =

2

6) SS
OST
= SS
UKUP
– SS
TRT
– SS
BLK

Prosjeci kvadrata = MS = SS/df
MS
BLK
= SS
BLK
/ (b–1),
MS
TRT
= SS
TRT
/ (a–1),
MS
OST
= SS
OST
/[(a–1)(b–1)]

10.1.2 Postavljanje hipoteza i F-provjera
H
0
: τ
1
= τ
2
=... = τ
a
, nema utjecaja tretmana
H
1
: τ
i
≠ τ
i’
za barem jedan par (i,i’), razlika između tretmana postoji

F statistika
OST
TRT
MS
MS
F =

ima F raspodjelu sa stupnjevima slobode (a–1) i (a–1)(b–1) ukoliko vrijedi H
0

Za α razinu značajnosti odbacujemo H
o
ako
F > F
α,(a–1),(a–1)(b–1)

Provjera za blokove:
- obično nije od primarnog interesa
- analogna kao i za tretmane.

73
Anova tablica:

Izvor SS df MS F
Blokovi SS
BLK
b–1 MS
BLK
F=MS
BLK
/MS
OST
Tretmani SS
TRT
a–1 MS
TRT
F=MS
TRT
/MS
OST
Ostatak SS
OST
(a–1)(b–1) MS
OST

Ukupno SS
UKUP
ab–1

10.1.3 SAS primjer za slučajni blok plan

Primjer: Cilj pokusa je bio utvrditi utjecaj primjene tri tretmana (T
1
, T
2
i T
3
) na prosječni dnevni
prirast u tovu junadi. Junad je podijeljena u četiri bloka prema početnoj težini. U svakom su bloku
dakle tri životinje na koje su slučajno dodijeljeni tretmani. Ukupno je bilo 12 životinja u pokusu.
Radi lakšeg praćenja napravimo tablicu s podacima, prosjecima i sumama po tretmanima i
blokovima:

Blokovi
I II III IV
T
1
826 865 795 850
T
2
827 872 721 860
T
3
753 804 737 822

SAS program:

DATA steer;
INPUT trt blok \$ prirast @@;
DATALINES;
1 I 826 1 II 865 1 III 795 1 IV 850
2 I 827 2 II 872 2 III 721 2 IV 860
3 I 753 3 II 804 3 III 737 3 IV 822
;
PROC GLM DATA = steer;
CLASS blok trt;
MODEL prirast = blok trt/ ;
LSMEANS trt / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS output:

Dependent Variable: prirast
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 5 24734.0000 4946.8000 8.08 0.0122
Error 6 3672.0000 612.0000
Corrected Total 11 28406.0000

R-Square Coeff Var Root MSE prirast Mean
0.870732 3.050386 24.7386 811.000

74
Source DF Type III SS Mean Square F Value Pr > F
blok 3 18198.0000 6066.0000 9.91 0.0097
trt 2 6536.0000 3268.0000 5.34 0.0465

Least Squares Means

prirast Standard LSMEAN
trt LSMEAN Error Pr > |t| Number
1 834.000000 12.369317 0.0001 1
2 820.000000 12.369317 0.0001 2
3 779.000000 12.369317 0.0001 3

Least Squares Means for effect trt
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: prirast

i/j 1 2 3
1 0.7165 0.0456
2 0.7165 0.1246
3 0.0456 0.1246

10.1.4 SAS primjer s više pokusnih jedinica po kombinaciji blok x tretman

Primjer: Pretpostavimo opet da je cilj pokusa bio utvrditi utjecaj primjene tri tretmana (T
1
, T
2
i T
3
)
na prosječni dnevni prirast u tovu junadi. Opet ćemo koristiti 4 bloka, međutim ovaj puta imamo na
raspolaganju 8 životinja po svakom bloku. Ukupno u cijelom pokusu ima 4×3×2 = 24 životinje.
Tretmani su primijenjeni na životinje u bloku slučajno. Tablica sa rezultatima mjerenja na kraju
pokusa je slijedeća:

Blokovi
Tretmani I II III IV
T
1

826
806
864
834
795
810
850
845
T
2

827
800
871
881
729
709
860
840
T
3

753
773
801
821
736
740
820
835

SAS program za primjer s junadi i dvije pokusne jedinice po kombinaciji blok x tretman je
slijedeći. Dva pristupa će biti pokazana: blokovi definirani kao fiksni koristeći GLM proceduru i
blokovi definirani kao slučajni koristeći MIXED proceduru.

SAS program:

DATA prirast;
INPUT trt blok \$ prirast @@;
DATALINES;
1 I 826 1 I 806 1 II 864 1 II 834
1 III 795 1 III 810 1 IV 850 1 IV 845
75
2 I 827 2 I 800 2 II 871 2 II 881
2 III 729 2 III 709 2 IV 860 2 IV 840
3 I 753 3 I 773 3 II 801 3 II 821
3 III 736 3 III 740 3 IV 820 3 IV 835
;
PROC GLM DATA = prirast;
CLASS blok trt;
MODEL prirast = blok trt blok*trt/;
LSMEANS trt / STDERR PDIFF ADJUST=TUKEY;
LSMEANS blok*trt / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS ispis GLM procedure za fiksne blokove:

Dependent Variable: prirast

Sum of
Source DF Squares Mean Square F Value Pr > F
Model 11 49929.83333 4539.07576 25.81 <.0001
Error 12 2110.00000 175.83333
Corrected Total 23 52039.83333

R-Square Coeff Var Root MSE prirast Mean
0.959454 1.638244 13.26022 809.4167

Source DF Type III SS Mean Square F Value Pr > F
blok 3 33816.83333 11272.27778 64.11 <.0001
trt 2 8025.58333 4012.79167 22.82 <.0001
blok*trt 6 8087.41667 1347.90278 7.67 0.0015

Least Squares Means

prirast Standard LSMEAN
trt LSMEAN Error Pr > |t| Number
1 828.750000 4.688194 <.0001 1
2 814.625000 4.688194 <.0001 2
3 784.875000 4.688194 <.0001 3

Least Squares Means for Effect trt
t for H0: LSMean(i)=LSMean(j) / Pr > |t|
Dependent Variable: prirast

i/j 1 2 3
1 0.1251 <.0001
2 0.1251 0.0020
3 <.0001 0.0020

Least Squares Means

prirast Standard
blok trt LSMEAN Error Pr > |t|
I 1 816.000000 9.376389 <.0001
I 2 813.500000 9.376389 <.0001
I 3 763.000000 9.376389 <.0001
II 1 849.000000 9.376389 <.0001
II 2 876.000000 9.376389 <.0001
II 3 811.000000 9.376389 <.0001
76
III 1 802.500000 9.376389 <.0001
III 2 719.000000 9.376389 <.0001
III 3 738.000000 9.376389 <.0001
IV 1 847.500000 9.376389 <.0001
IV 2 850.000000 9.376389 <.0001
IV 3 827.500000 9.376389 <.0001

PROC MIXED DATA = prirast;
CLASS blok trt;
MODEL prirast = trt/;
RANDOM blok blok*trt;
RUN;

SAS ispis MIXED procedure za slučajne blokove:

Covariance Parameter
Estimates

Cov Parm Estimate

blok 1654.06
blok*trt 586.03
Residual 175.83

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
trt 2 6 2.98 0.1264

Least Squares Means

Stand
Effect trt Est Error DF t Val Pr>|t| Alpha Lower Upper
trt 1 828.75 24.1247 6 34.35 <.0001 0.05 769.72 887.78
trt 2 814.62 24.1247 6 33.77 <.0001 0.05 755.59 873.66
trt 3 784.87 24.1247 6 32.53 <.0001 0.05 725.84 843.91

Differences of Least Squares Means

Stand
Effect tr_tr Est Error DF t Val Pr > |t| Adjustment Adj P Alpha

trt 1 2 14.125 18.3569 6 0.77 0.4708 Tukey-Kramer 0.7339 0.05
trt 1 3 43.875 18.3569 6 2.39 0.0540 Tukey-Kramer 0.1174 0.05
trt 2 3 29.750 18.3569 6 1.62 0.1562 Tukey-Kramer 0.3082 0.05

Differences of Least Squares Means

Effect trt _trt Lower Upper Lower Upper
trt T1 T2 -30.7927 59.0427 . .
trt T1 T3 -1.0427 88.7927 . .
trt T2 T3 -15.1677 74.6677 . .

77
11 'Change-over' pokusni planovi
11.1 Jednostavni 'change-over' plan
Svojstva:
- svi tretmani se primjenjuju na svaku životinju (subjekt)
- a mjerenja na svakom od n subjekata
- mjerenja a odgovaraju tretmanima
- redoslijed primjene tretmana je slučajan
- pokusna jedinica NIJE subjekt (životinja)
- pokusna jedinica JE jedno mjerenje na životinji
- protumačeni izvori varijabilnosti:
- subjekti i tretmani

Razdoblje Subjekt 1 Subjekt 2 Subjekt 3 … Subjekt n
1 T2 T1 T2 … T3
2 T1 T3 T3 … T2
3 T3 T2 T1 … T1

Model:
y
ij
= µ + τ
i
+ SUB
j
+ ε
ij
i = 1,.....,a j = 1,...,n

y
ij
= Opažanje životinje (subjekta) j u za tretman i
µ = ukupni prosjek
τ
i
= fiksni utjecaj tretmana i
SUB
j
= slučajni utjecaj životinje (subjekta) j
ε
ij
– slučajna greška

Kada imamo rezultate mjerenja obično pišemo:

Subjekt
Tretman 1 2 ......... n
T1 y
11
y
12
.... y
1n

T2 y
21
y
22
.... y
2n
..........................

Ta y
31
y
32
.... y
an

Izvori varijabilnosti
SS
UKUP
= SS
SUB
+ SS
UNUTAR SUBJEKTA

SS
UNUTAR SUBJEKTA
= SS
TRT
+ SS
OST

SS
UKUP
= SS
SUB
+ SS
TRT
+ SS
OST

78
stupnjevi slobode:
(na–1) = (n–1) + (a–1) + (n–1)(a–1)

∑∑
− =
i j
ij UKUP
y y SS
2
..) (

∑ ∑∑
− = − =
i
j
i j
j SUB
y y a y y SS
2 2
..) . ( ..) . (
∑ ∑∑
− = − =
i
i i
i j
i TRT
y y n y y SS
2 2
..) . ( ..) . (

∑∑
− =
i j
j ij UNUTAR
y y SS
2
SUBJEKTA
) . (

∑∑
+ − − =
i j
ji i ij OST
y y y y SS
2
..) . . (

MS = SS/df:
MS
TRT
= SS
TRT
/ (a–1)
MS
OST
= SS
OST
/[(a–1)(n–1)]

ANOVA tablica:

Izvor SS df MS F
Između subj. SS
SUB
n–1 MS
SUB

Unutar subj. SS
UNUTAR
n(a–1) MS
UNUTAR

Tretmani SS
TRT
a–1 MS
TRT
MS
TRT
/MS
OST

Ostatak SS
OST
(n–1)(a–1) MS
OST

Hipoteze:
H
0
: τ
1
= τ
2
=... = τ
a
, nema utjecaja grupa
H
1
: τ
i
≠ τ
i’
za barem jedan par (i,i’), razlika između grupa postoji

F statistika:
OST
TRT
MS
MS
F =

11.2 'Change-over' plan kada postoji utjecaj razdoblja
omogućava i provjeru utjecaja redoslijeda primjene tretmana.
Model:
y
ijk
l
= µ + τ
i
+ β
k
+ SUB(β)
jk
+ t
l
+ ε
ijk
l

i = 1 do a; j = 1 do n
k
, k = 1 do b; l = 1 do a

Gdje su:
y
ijk
l
= opažanje ijkl
µ = ukupni prosjek korigiran na sve utjecaje
τ
i
= utjecaj tretmana i
β
k
= utjecaj bloka k, blok može na primjer biti redoslijed primjene pojedinog tretmana
SUB(β)
jk
= slučajni utjecaj životinje (subjekta) j unutar bloka k sa prosjekom 0 i varijancom σ
2
g

t
l
= utjecaj razdoblja l
ε
ijk
l
= slučajna greška s prosjekom 0 i varijancom σ
2

79
a = broj tretmana i razdoblja, b = broj blokova, je n
k
= broj životinja unutar bloka k. n = Σ
k
n
k
=
ukupan broj životinja

ANOVA tablica:
Izvor varijabilnosti SS df MS = SS / df F

Blokovi SS
BLK
b–1 MS
BLK
MS
BLK
/MS
SUB

Subjekt unutar bloka SS
SUB
Σ
k
(n
k
–1) MS
SUB

Razdoblje SS
t
a–1 MS
t
MS
t
/MS
OST

Tretmani SS
TRT
a–1 MS
TRT
MS
TRT
/MS
OST

Ostatak SS
OST
(a–1)(Σ
k
n
k
– 2) MS
OST

Ukupno SS
UKUP

k
n
k
– 1

Provjera tretmana:

Provjera blokova
OST
TRT
MS
MS
F =

F =
) ( BLOK SUBJ
BLOK
MS
MS

11.2.1 SAS primjer za ‘change-over’ plan s utjecajem razdoblja

Primjer: Ispitivan je utjecaj dva tretmana na proizvodnju mlijeka kod krava. Primijenjen je 'change-
over' plan, tj. na svaku kravu primijenjena su oba tretmana. Pokus je proveden u 3. i 4. mjesecu
laktacije. Redoslijed tretmana kod svake krave utvrđen je slučajno. Na kraju pokusa dobivene su
slijedeće prosječne dnevne količine mlijeka u kg:

BLOK I

Razdoblje Tretman Krava 1 Krava 4 Krava 5 Krava 9 Krava 10
1 1 31 34 43 28 25
2 2 27 25 38 20 19

BLOK II
Razdoblje Tretman Krava 2 Krava 3 Krava 6 Krava 7 Krava 8
1 2 22 40 40 33 18
2 1 21 39 41 34 20

SAS program:

DATA Cows;
INPUT period trt order cow milk @@;
DATALINES;
1 1 1 1 31 1 2 2 2 22
2 2 1 1 27 2 1 2 2 21
1 1 1 4 34 1 2 2 3 40
2 2 1 4 25 2 1 2 3 39
1 1 1 5 43 1 2 2 6 40
2 2 1 5 38 2 1 2 6 41
1 1 1 9 28 1 2 2 7 33
2 2 1 9 20 2 1 2 7 34
1 1 1 10 25 1 2 2 8 18
2 2 1 10 19 2 1 2 8 20
;
80
PROC MIXED ;
CLASS trt cow period order;
MODEL milk = order trt period;
RANDOM cow(order) ;
RUN;

SAS ispis:

Covariance Parameter
Estimates

Cov Parm Estimate
cow(order) 75.4000
Residual 1.5250

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
order 1 8 0.11 0.7527
trt 1 8 37.90 0.0003
period 1 8 29.51 0.0006

Least Squares Means

Standard
Effect trt Estimate Error DF t Value Pr > |t|
trt 1 31.6000 2.7735 8 11.39 <.0001
trt 2 28.2000 2.7735 8 10.17 <.0001

Differences of Least Squares Means

Standard
Effect trt _trt Estimate Error DF t Value Pr > |t|
trt 1 2 3.4000 0.5523 8 6.16 0.0003

Differences of Least Squares Means

trt 1 2 Tukey-Kramer 0.0003

Značajke:
- tretmani se primjenjuju na blokove na dva različita načina, tj. u kolone i redove.
- svaka kolona i svaki red predstavljaju kompletni blok sa primjenjenim svim tretmanima
- tri protumačena izvora varijabilnosti
- kolone, redovi i tretmani
- pojedino opažanje je samo u jednoj koloni, jednom redu i podliježe samo jednom tretmanu
- pretpostavka da nema interakcije
- r = broj tretmana, kolona i redova
- ukupan broj mjerenja = r
2

81
Primjer:
- blokovi utjecaj životinje i razdoblje
- na istu životinju se primjenjuju svi tretmani u različitim razdobljima
- latinski kvadrat => 'change-over' plan.

Primjer: r = 4

Životinje
Razdoblja 1 2 3 4
1 T1 T2 T3 T4
2 T2 T3 T4 T1

3 T3 T4 T1 T2.
4 T4 T1 T2 T3

y
ij(k)
= mjerenje u i - tom redu (periodu), j - toj koloni (životinji), sa primijenjenim k -tim
tretmanom:

Životinje
Razdoblja 1 2 3 4
1 y
11(1)
y
12(2)
y
13(3)
y
14(4)

2 y
21(2)
y
22(3)
y
23(4)
y
24(1)
3 y
31(3)
y
32(4)
..y
33(1)
..y
34(2)
.
4 y
41(4)
y
42(1)
y
43(2)
y
44(3)

Statistički model:
y
ij(k)
= µ + RED
i
+ KOL
j
+ τ
(k)
+ ε
ij(k)

i,j,k = 1,...,r

y
ij(k)
= opažanje ij(k)
µ = srednja vrijednost korigirana na sve utjecaje
RED
i
= fiksni utjecaj i reda
KOL
j
= fiksni utjecaj j kolone
τ
(k)
= fiksni utjecaj tretmana k
ε
ij(k)
- ostatak slučajni N(0, σ
2
)

SS
UKUP
= SS
RED
+ SS
KOL
+ SS
TRT
+ SS
OST

stupnjevi slobode:
r
2
– 1 = (r–1) + (r–1) + (r–1) + (r–1)(r–2)

∑∑
− =
i j
k ij UKUP
y y SS
2
) (
..) (

− =
i
i RED
y y r SS
2
..) . (

− =
i
j KOL
y y r SS
2
..) . (

− =
i
k TRT
y y r SS
2
..) (

( )
∑∑
+ − − − =
i j
k j i ij OST
y y y y y SS .. 2 . .

82
Kratki način računanja:
1) Ukupna suma = Σ
i
Σ
j
y
ij(k)
= y..
2) Korekcijski faktor za srednju vrijednost:

( )
( )
opazanja broj ukupni
suma ukupna
2
2
2
) (
= =
∑∑
r
y
C
i j
k ij

3) SS
UKUP
= Σ
i
Σ
j
(y
ij(k)
)
2
– C
4)
( )
C
r
y
SS
i
j
ijk
RED
− =

2

5)
( )
C
r
y
SS
j
i
k ij
KOL
− =

2
) (

6)
( )
C
r
y
SS
k
i j
k ij
TRT
− =

∑∑
2
) (

7) SS
OST
= SS
UKUP
– SS
A
– SS
B
– SS
TRT

MS
RED
= SS
RED
/ (r–1),
MS
KOL
= SS
KOL
/ (r–1),
MS
TRT
= SS
TRT
/ (r–1),
MS
OST
= SS
OST
/[(r–1)(r–2)]

Hipoteze:
H
0
: τ
1
= τ
2
=... = τ
a
, nema utjecaja tretmana
H
1
: τ
i
≠ τ
i’
za barem jedan par (i,i’), razlika između tretmana postoji

OST
TRT
MS
MS
F =

ANOVA tablica

Izvor SS df MS F
Redovi SS
RED
r–1 MS
RED
MS
RED
/MS
OST
Kolone SS
KOL
r–1 MS
KOL
MS
KOL
/MS
OST
Tretmani SS
TRT
r–1 MS
TRT
MS
TRT
/ MS
OST
Ostatak SS
OST
(r–1)(r–2) MS
OST

Ukupno SS
UKUP
r
2
–1

11.3.1 SAS primjer za latinski kvadrat
Cilj pokusa je bio utvrditi utjecaj dodavanja 4 različita dodataka (A, B, C i D) na uzimanje sijena
kod tovne junadi. Pokus je proveden kao latinski kvadrat: na 4 životinje u 4 razdoblja.

83
June
Razdoblje 1 2 3 4
1 10.0(B) 9.0(D) 11.1(C) 10.8(A)
2 10.2(C) 11.3(A) 9.5(D) 11.4(B)
3 8.5(D) 11.2(B) 12.8(A) 11.0(C)
4 11.1(A) 11.4(C) 11.7(B) 9.9(D)

SAS program:

DATA a;
INPUT period steer suppl \$ hay @@;
DATALINES;
1 1 B 10.0 3 1 D 8.5
1 2 D 9.0 3 2 B 11.2
1 3 C 11.1 3 3 A 12.8
1 4 A 10.8 3 4 C 11.0
2 1 C 10.2 4 1 A 11.1
2 2 A 11.3 4 2 C 11.4
2 3 D 9.5 4 3 B 11.7
2 4 B 11.4 4 4 D 9.9
;
PROC GLM;
CLASS period steer suppl;
MODEL hay = period steer suppl;
LSMEANS suppl / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS ispis:

Dependent Variable: hay
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 9 17.09562500 1.89951389 13.12 0.0027
Error 6 0.86875000 0.14479167
Corrected Total 15 17.96437500

R-Square Coeff Var Root MSE hay Mean
0.951640 3.562458 0.380515 10.68125

Source DF Type III SS Mean Square F Value Pr > F
period 3 1.48187500 0.49395833 3.41 0.0938
steer 3 3.59187500 1.19729167 8.27 0.0149
suppl 3 12.02187500 4.00729167 27.68 0.0007

Least Squares Means

hay Standard LSMEAN
suppl LSMEAN Error Pr > |t| Number
A 11.5000000 0.1902575 <.0001 1
B 11.0750000 0.1902575 <.0001 2
C 10.9250000 0.1902575 <.0001 3
D 9.2250000 0.1902575 <.0001 4

Least Squares Means for Effect suppl
t for H0: LSMean(i)=LSMean(j) / Pr > |t|
Dependent Variable: hay
84

i/j 1 2 3 4
1 0.4536 0.2427 0.0006
2 0.4536 0.9411 0.0019
3 0.2427 0.9411 0.0030
4 0.0006 0.0019 0.0030

11.4 Change over plan postavljen kao više latinskih kvadrata
B B
A 1 2 3 A 1 2 3
1 a b c 1 a b c
2 b c d 2 b c d

3 c d a 3 c d a

Model:
y
ij(k)m
= µ + KV
m
+ A(KV)
im
+ B(KV)
jm
+ T
(k)
+ ε
ij(k)m

i,j,k = 1,...,r; m = 1,...,b
gdje su:
y
ij(k)m
= opažanje ij(k)m
µ = ukupni prosjek korigiran na sve utjecaje
KV
m
RED(KV)
im
= fiksni utjecaj reda i unutar kvadrata m
KOL(KV)
jm
, = fiksni utjecaj kolone j unutar kvadrata m
τ
(k)
= fiksni utjecaj tretmana k
ε
ij(k)m
= slučajna greška sa prosjekom 0 i varijancom σ
2

r = broj tretmana, i broj redova i kolona unutar kvadrata

ANOVA tablica:
Izvor df
Tretman b–1
Ostatak (Pokusna greška) b(r–1)(r–2)+(b–1)(r–1)
Ukupno b r
2
–1

F-provjera:
OST
TRT
MS
MS
F =

85
12 Faktorijalni pokus
- kada imamo dva ili više faktora koji se proučavaju u isto vrijeme.
- sve kombinacije faktora se provjeravaju međusobno

Interakcija:
- različiti utjecaj razina jednog faktora na razine drugog faktora
Glavni utjecaji:
- utjecaji svakog faktora gledajući samo po sebi
Protumačeni izvori varijabilnosti:
- faktor 1, faktor 2, …., interakcije između faktora

Primjer:
- pokus sa dva faktora:
prvi faktor = količina proteina (3 razine)
drugi faktor = vrsta proteinskih krmiva u obroku krava (dva krmiva)
- pojedinoj kravi u pokusu dodjeljuje se jedna od 6 kombinacija krmivo x količina.
- 3 × 2 faktorijalni pokus, tj. tri razine prvog faktora i 2 razine drugog faktora

Upotreba:
- kada malo znamo o faktorima
- potrebno je istražiti sve moguće kombinacije da se vidi koja od njih je najpovoljnija
- također je moguće istražiti interakcije između faktora, tj. da li je razlika između razina
jednog faktora ista ili različita u razinama drugih faktora.
Pokusni plan:
- potpuno slučajni
- kombinacije razina faktora se slučajno dodjeljuju pokusnim jedinicama

Pretpostavimo dva faktora A i B
- faktor A => a razina
- faktor B => b razina
- broj pokusnih jedinica po svakoj kombinaciji = n
- ukupno ima nab pokusnih jedinica podijeljenih u ab grupa (kombinacija faktora A i B)
- skup tretmana se sastoji od ab mogućih kombinacija razina faktora

Model faktorijalnog pokusa je:
y
ijk
= µ + A
i
+ B
j
+(AB)
ij
+ ε
ijk

y
ijk
= k-to opažanje za razinu i faktora A i razinu j faktora B
µ = ukupni prosjek
A
i
= fiksni utjecaj razine i faktora A
B
j
= fiksni utjecaj razine j faktora B
(AB)
ij
= fiksni utjecaj interakcije razine ij faktora A i B
ε
ijk
- neprotumačeni utjecaj, slučajan sa N(0, σ
2
)

Primjer: dva faktora A i B i obadva imaju dvije razine
- 2 × 2 faktorijalni plan

86
Kombinacije razine faktora A i B

Faktor B
Faktor A B
1
B
2

A
1
A
1
B
1
A
1
B
2

A
2
A
2
B
1
A
2
B
2

Ukupno ima četiri kombinacije razina faktora

Shema faktorijalnog plana sa mjerenjima y
ijk

A
1
A
2

B
1
B
2
B
1
B
2

y
111
y
121
y
211
y
221

y
112
y
122
y
212
y
222

... ... ... ...
y
11n
y
12n
y
21n
y
22n

SS
UKUP
= SS
A
+ SS
B
+ SS
AB
+ SS
OST

stupnjevi slobode
(abn–1) = (a–1) + (b–1) + (a–1)(b–1) + ab(n–1)

∑ ∑ ∑
− =
i j k
ijk UKUP
y y SS
2
...) (

∑ ∑ ∑ ∑
− = − =
i
i
i j k
i A
y y bn y y SS
2 2
...) .. ( ...) .. (

∑ ∑∑ ∑
− = − =
i
j
i j k
j B
y y an y y SS
2 2
...) . . ( ...) . . (

B A
i j
ij AB
SS SS y y n SS − − − =
∑∑
2
...) . (

∑∑ ∑
− =
i j k
ij ijk OST
y y SS
2
.) (

∑∑ ∑
− =
i j k
ij ijk OST
y y SS
2
.) (

Sume kvadrata se mogu izračunati i kratkim načinom:
1) Ukupna suma = Σ
i
Σ
j
Σ
k
y
ijk
= y...
2) Korekcijski faktor za srednju vrijednost:
( )
( )
opazanja broj ukupni
suma ukupna
2
2
= =
∑∑ ∑
abn
y
C
i j k
ij

3) SS
UKUP
= Σ
i
Σ
j
Σ
k
(y
ijk
)
2
– C
4)
( )
C
nb
y
SS
i
j k
ijk
A
− =

∑ ∑
2

87
5)
( )
C
na
y
SS
j
i k
ijk
B
− =

∑∑
2

6)
( )
C SS SS
n
y
SS
B A
i j
k
ijk
AB
− − − =
∑∑

2

7) SS
OST
= SS
UKUP
– SS
A
– SS
B
– SS
AB

MS
A
= SS
A
/ (a–1)
MS
B
= SS
B
/ (b–1)
MS
AB
= SS
AB
/ (a–1)(b–1)
MS
OST
= SS
OST
/[ab(n–1)]

ANOVA tablica

Izvor SS df MS=SS/df F
A SS
A
a–1 MS
A
MS
A
/MS
OST (2)
B SS
B
b–1 MS
B
MS
B
/MS
OST (3)
AB SS
AB
(a–1)(b–1) MS
AB
MS
AB
/MS
OST (1)
Ostatak SS
OST
ab(n–1) MS
E

Ukupno SS
UKUP
abn–1

(1) F-provjera za interakciju
(2) F-provjera za faktor A (ukoliko nema interakcije)
(3) F-provjera za faktor B (ukoliko nema interakcije)

Ukoliko je interakcija značajna provjera za glavne utjecaje nema smisla.

A1
A1
A2
A2
0.40
0.45
0.50
0.55
0.60
0.65
0.70
0.75
B1 B2
Razine faktora B
P
r
i
r
a
s
t

(
k
g
)

Slika 12-1: Prikaz interakcije 2 × 2 faktorijalnog pokusa.

88
12.1 SAS primjer za faktorijalni pokus

Primjer: Istraživan je utjecaj dodavanja dva vitamina (I i II) u krmivo na prosječni dnevni prirast kod
svinja. Primijenjeni su dvije razine vitamina I (0 i 40 mg) i dvije razine vitamina II (0 i 5 mg).
Izabrano je 20 životinja. Na njih su slučajnim izborom primijenjene 4 kombinacije vitamina I i II.
Izmjereni su slijedeći dnevni prirasti:

Vitamin I 0 mg 4mg
Vitamin II 0 mg 5 mg 0 mg 5 mg
0.585 0.567 0.473 0.684
0.536 0.545 0.450 0.702
0.458 0.589 0.869 0.900
0.486 0.536 0.473 0.698
0.536 0.549 0.464 0.693

SAS program:

DATA prirast;
INPUT vitI vitII prirast @@;
DATALINES;
1 1 0.585 2 1 0.473
1 1 0.536 2 1 0.450
1 1 0.458 2 1 0.869
1 1 0.486 2 1 0.473
1 1 0.536 2 1 0.464
1 2 0.567 2 2 0.684
1 2 0.545 2 2 0.702
1 2 0.589 2 2 0.900
1 2 0.536 2 2 0.698
1 2 0.549 2 2 0.693
;
PROC GLM;
CLASS vitI vitII;
MODEL prirast= vitI vitII vitI*vitII;
LSMEANS vitI*vitII / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS ispis:

Dependent Variable: prirast
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 3 0.14521095 0.04840365 4.39 0.0196
Error 16 0.17648360 0.01103023
Corrected Total 19 0.32169455
R-Square Coeff Var Root MSE prirast Mean
0.451394 17.81139 0.10502 0.58965

Source DF Type III SS Mean Square F Value Pr > F
vitI 1 0.05191805 0.05191805 4.71 0.0454
vitII 1 0.06418445 0.06418445 5.82 0.0282
vitI*vitII 1 0.02910845 0.02910845 2.64 0.1238

Least Squares Means
89
vit vit Standard LSMEAN
I II prirast LSMEAN Error Pr > |t| Number
1 1 0.52020000 0.04696855 0.0001 1
1 2 0.55720000 0.04696855 0.0001 2
2 1 0.54580000 0.04696855 0.0001 3
2 2 0.73540000 0.04696855 0.0001 4

Least Squares Means for effect vitI*vitII
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: prirast

i/j 1 2 3 4
1 0.9433 0.9799 0.0238
2 0.9433 0.9981 0.0701
3 0.9799 0.9981 0.0506
4 0.0238 0.0701 0.0506

90
13 Hijerarhijski pokusni planovi
- Uzorci se biraju u dva ili više koraka.
- dvo-, tro- ili više hijerarhijski planovi

Primjer :
- 3 razine faktora A
- 3 razine faktora B unutar razina faktora A
- slučajni uzorak unutar razina B

A 1 2 3

6 7 44 8 4 4

6 7 44 8 44

6 7 44 8 44

B 1 2 3 4 5 6 7 8 9
y
111
y
121
y
131
y
141
y
151
y
161
y
171
y
181
y
191

y
112
y
122
y
132
y
142
y
152
y
162
y
172
y
182
y
192

y
11n
y
12n
y
13n
y
14n
y
15n
y
16n
y
17n
y
18n
y
19n

Statistički model:
y
ijk
= µ + A
i
+ B(A)
ij
+ ε
ijk

i = 1,....,a; j = 1,....,b; n = 1,......,n

y
ijk
= k-to opažanje za razinu i faktora A i razinu j faktora B
µ = ukupni prosjek korigiran na sve utjecaje,
A
i
= utjecaj i razine faktora A
B(A)
ij
= utjecaj razine j faktora B unutar razine i faktora A
ε
ijk
- ostatak, slučajni N(0, σ
2
)

- razine faktora B nezavisne između različitih razina faktora A.

SS
UKUP
= SS
A
+ SS
B(A)
+ SS
Unutar B

stupnjevi slobode:
(abn–1) = (a–1) + (b–1) + a(b–1) + ab(n–1)

∑∑ ∑
− =
i j k
ijk UKUP
y y SS
2
...) (

∑ ∑∑ ∑
− = − =
i
i
i j k
i A
y y bn y y SS
2 2
...) .. ( ...) .. (

∑∑ ∑∑ ∑
− = − =
i j
i ij
i j k
i ij A B
y y n y y SS
2 2
) (
..) . ( ..) . (

∑∑ ∑
− =
i j k
ij ijk B UNUTAR
y y SS
2

.) (

91
Skraćeni način računanja:
1) Ukupna suma: Σ
i
Σ
j
Σ
k
y
ijk

2) Korekcijski faktor za srednju vrijednost:
( )
( )
opazanja broj ukupni
suma ukupna
2
2
= =
∑∑ ∑
abn
y
C
i j k
ij

3) SS
UKUP
= Σ
i
Σ
j
Σ
k
(y
ijk
)
2
– C
4)
( )
C
nb
y
SS
i
j k
ijk
A
− =

∑ ∑
2

5)
( )
C SS
n
y
SS
A
i j
k
ijk
A B
− − =
∑∑

2
) (

6) SS
Unutar B
= SS
UKUP
– SS
A
– SS
B(A)

ANOVA tablica:

Izvor SS df MS=SS/df
A SS
A
a–1 MS
A
B unutar A SS
B(A)
a(b–1) MS
B(A)
Unutar B SS
Unutar B
ab(n–1) MS
Unutar B

Ukupno SS
UKUP
abn–1

Utjecaj 'Unutar B' je neprotumačeni utjecaj ili ostatak.

Očekivanja prosjeka kvadrata (E(MS)) ovise da li su utjecaji A i B fiksni ili slučajni:

E(MS) (A fix i B fix) (A fix i B sluč.) (A sluč. i B sluč.)
E(MS
A
)
E(MS
B(A)
)
E(MS
Untr B
)
σ
2
+ Q(A)
σ
2
+ Q(B(A))
σ
2

σ
2
+ n σ
2
B
+ Q(A)
σ
2
+ n σ
2
B

σ
2

σ
2
+ n σ
2
B
+ nb σ
2
A

σ
2
+ n σ
2
B

σ
2

n = broj razina unutar B
Q = neki fiksni, izračunati broj

Definicija pokusne greške, a time i F provjera ovisi da li su utjecaji (faktori) fiksni ili slučajni.
Najčešće je B slučajan:
- pokusna greška za provjeru utjecaja A je: MS
B(A)
- pokusna greška za utjecaj B je: MS
Unutar B
.
F-statistika za utjecaj A:
) ( A B
A
MS
MS
F =

F-statistika za utjecaj B:
UnutarB
A B
MS
MS
F
) (
=

92
13.1 SAS primjer za hijerarhijski plan

Primjer: Cilj pokusa je bio utvrditi utjecaj majki i očeva na varijabilnost porodne težine prasadi.
Upotrijebljen je hijerarhijski plan: Slučajno je izabrano 4 nerasta, po svakom nerastu dvije krmače i
po svakoj krmači dva praseta. Podaci, zajedno sa sumama i kvadratima po nerastovima i krmačama,
prikazani su u slijedećoj tablici:

Nerast Krmača Prase Težina
1 1 1 1.2
1 1 2 1.2
1 2 3 1.2
1 2 4 1.3
1 3 5 1.1
1 3 6 1.2
2 4 7 1.2
2 4 8 1.2
2 5 9 1.1
2 5 10 1.2
2 6 11 1.2
2 6 12 1.1
3 7 13 1.2
3 7 14 1.2
3 8 15 1.3
3 8 16 1.3
3 9 17 1.2
3 9 18 1.2
4 10 19 1.3
4 10 20 1.3
4 11 21 1.4
4 11 22 1.4
4 12 23 1.3
4 12 24 1.3

SAS program za MIXED proceduru:

DATA pig;
INPUT boar sow piglet por_tezina @@;
DATALINES;
1 1 1 1.2 1 1 2 1.2 1 2 1 1.2
1 2 2 1.3 1 3 1 1.1 1 3 2 1.2
2 1 1 1.2 2 1 2 1.2 2 2 1 1.1
2 2 2 1.2 2 3 1 1.2 2 3 2 1.1
3 1 1 1.2 3 1 2 1.2 3 2 1 1.3
3 2 2 1.3 3 3 1 1.2 3 3 2 1.2
4 1 1 1.3 4 1 2 1.3 4 2 1 1.4
4 2 2 1.4 4 3 1 1.3 4 3 2 1.3
;
PROC MIXED DATA=pig METHOD = TYPE3;
CLASS boar sow;
MODEL por_tezina = / DDFM = KENWARDROGER;
RANDOM boar sow(boar)/S;
RUN;

93

SAS ispis MIXED procedure

Type 3 Analysis of Variance

Sum of
Source DF Squares Mean Square Expected Mean Square
boar 3 0.093333 0.031111 Var(Residual)+2Var(sow(boar))+6Var(boar)
sow(boar) 8 0.040000 0.005000 Var(Residual)+2Var(sow(boar))
Residual 12 0.020000 0.001667 Var(Residual)

Error
Source Error Term DF F Value Pr > F
boar MS(sow(boar)) 8 6.22 0.0174
sow(boar) MS(Residual) 12 3.00 0.0424
Residual . . . .

Covariance Parameter
Estimates

Cov Parm Estimate
boar 0.004352
sow(boar) 0.001667
Residual 0.001667

Solution for Random Effects

Std Err
Effect boar sow Estimate Pred DF t Value Pr > |t|
boar 1 -0.02798 0.04239 3.96 -0.66 0.5456
boar 2 -0.05595 0.04239 3.96 -1.32 0.2579
boar 3 3.26E-15 0.04239 3.96 0.00 1.0000
boar 4 0.08393 0.04239 3.96 1.98 0.1195
sow(boar) 1 1 -0.00357 0.03390 7.87 -0.11 0.9187
sow(boar) 1 2 0.02976 0.03390 7.87 0.88 0.4060
sow(boar) 1 3 -0.03690 0.03390 7.87 -1.09 0.3085
sow(boar) 2 1 0.01508 0.03390 7.87 0.44 0.6684
sow(boar) 2 2 -0.01825 0.03390 7.87 -0.54 0.6051
sow(boar) 2 3 -0.01825 0.03390 7.87 -0.54 0.6051
sow(boar) 3 1 -0.02222 0.03390 7.87 -0.66 0.5308
sow(boar) 3 2 0.04444 0.03390 7.87 1.31 0.2268
sow(boar) 3 3 -0.02222 0.03390 7.87 -0.66 0.5308
sow(boar) 4 1 -0.01151 0.03390 7.87 -0.34 0.7431
sow(boar) 4 2 0.05516 0.03390 7.87 1.63 0.1430
sow(boar) 4 3 -0.01151 0.03390 7.87 -0.34 0.7431

94
14 Pokusni planovi sa kavezima i
pregonima
Pojedinačni tretman životinja:
Blok
I II
T
2

T
1

T
1

T
2

T
1

T
2

T
1

T
2

4 životinja po svakom bloku i na njih slučajno primijenimo 2 tretmana.

ANOVA tablica:

Izvor Stupnjevi slobode
Blok (b–1) = 1
Tretman (a–1) = 1
Blok x tretman (b–1)(a–1) = 1
Ostatak (Greška) ab(n–1)= 4
Ukupno (abn–1)= 7

Često je nemoguće životinje tretirati pojedinačno
cijeli kavez (boks, pregon) je pokusna jedinica.

Blok
I II
T
1

T
1

T
2

T
2

T
2

T
2

T
1

T
1

2 životinje u svakom kavezu
po 2 kaveza u bloku
na svaki kavez u bloku je slučajno primijenjen tretman

ANOVA tablica:

Izvor Stupnjevi slobode
Blok (b–1) = 1
Tretman (a–1) = 1
Pokusna greška = Blok × tretman (b–1)(a–1) = 1
Ostatak ab(n–1)= 4
Ukupno (abn–1)= 7

Pokusna greška za tretman ovdje je jednaka interakciji blok × tretman
95
pokusna jedinica je kavez (kombinacija blok × tretman)
Interakcija blok × tretman provjerava se ostatkom

Linearni model takvog plana je:
y
ijk
= µ + τ
i
+ β
j
+ δ
ij
+ ε
ijk

i = 1,......,a; a = broj tretmana
j = 1,......,b; b = broj blokova
k = 1,.....,n; n = broj ponavljanja

Gdje su:
y
ijk
= opažanje k za tretman i u bloku j
µ, = ukupni prosjek
τ
i
= fiksni utjecaj tretmana i
β
j
= fiksni utjecaj bloka j
δ
ij
= slučajna greška između pokusnih jedinica za provjeru tretmana s prosjekom 0 i varijancom σ
2
δ
,
(interakcija tretman x blok)
ε
ij
= slučajna greška unutar pokusne jedinice s prosjekom 0 i varijancom σ
2

Hipoteze:
H
0
: τ
1
= τ
2
=... = τ
a
, nema utjecaja tretmana
H
1
: τ
i
≠ τ
i’
za barem jedan par (i,i’), razlika između tretmana postoji

Očekivanja od MS:
E(MS
pok gr
) σ
2
+ n σ
2
δ

E(MS
OST
) σ
2

96
15 Dvostruki blokovi
Primjer: 3 tretmana, 2 spol, 4 bloka prema početnoj težini
(8 blokova, 4 bloka unutar spola)
Ukupno trebamo 3×2×4=24 životinje.

Moguća shema plana pokusa:

Muški Ženke
Blok I
T1
T2
T3
Blok II
T2
T1
T3
Blok V
T3
T2
T1
Blok VI
T1
T2
T3
Blok III
T1
T3
T2
Blok IV
T2
T1
T3
Blok VII
T2
T1
T3
Blok VIII
T3
T2
T1

broj spolova, s = 2,
broj blokova unutar spola: b = 4,
broj tretmana: a = 3.

Izvor Stupnjevi slobode
Blok (2b–1) = 7
Spol (s–1) = 1
Blok unutar spola s(b–1) = 6
Tretman (a–1) = 2
Blok x tretman (2b–1)(a–1) = 14
Spol x tretman (s–1)(a–1) = 2
Ostatak s(b–1)(a–1) = 12
Ukupno (abs–1) = 23

Pokusni plan i statistički model ovisi da li se neki utjecaj definira kao blok ili tretman
97
Primjer:
3 tretmana (a = 3)
2 pasmine (p = 2)
4 Bloka (broj laktacije, b = 4)

Pokusni plan 1): Pasmina kao blok
- zanima nas najveća preciznost provjere utjecaja tretmana

Pasmina A

Pasmina B

Lakt. I
T1
T2
T3
Lakt. II
T2
T1
T3
Lakt. I
T3
T2
T1
Lakt. II
T1
T2
T3
Lakt. III
T1
T3
T2
Lakt. IV
T2
T1
T3
Lakt. III
T2
T1
T3
Lakt. IV
T3
T2
T1

ANOVA tablica je:

Izvor Stupnjevi slobode
Pasmina (p–1)= 1
Laktacija unutar pasmine p(b–1)= 6
Tretman (a–1)= 2
Pasmina × tretman (p–1)(a–1)= 2
Ostatak p(b–1)(a–1)= 2
Ukupno (abp–1)= 23

Pokusni plan 2): Pasmina kao tretman
faktorijalni plan (2 × 3), postavljenih u slučajni blok plan (laktacije)
preciznija provjera utjecaja pasmine i pasmina × tretman

Lakt. I Lakt. II Lakt. III Lakt. IV
A T1
B T2
B T3
A T2
B T1
A T3
B T3
A T2
A T1
A T1
B T2
A T3
A T1
B T3
B T2
A T2
B T1
A T3
A T2
A T1
B T3
A T3
B T2
B T1

A i B su pasmine

98
ANOVA tablica:

Izvor Stupnjevi slobode
Laktacija (b–1)= 3
Pasmine (p–1)= 1
Tretman (a–1)= 2
Pasmina × tretman (p–1)(a–1)= 2
Ostatak (b–1)[(p–1)+(a–1)+(p–1)(a–1)] = 15
Ukupno (abp–1)= 23

Pokusni plan 3):
a) grupiramo prema laktaciji u četiri bloka;.
b) blokove podijelimo u dva boksa i u svaki od njih slučajno rasporedimo jednu pasminu;
c) na svaku pasminu unutar bloka primijenimo slučajno tretmane.

Split plot plan
- Dvije ‘vrste’ pokusnih jedinica:
- pasmina unutar laktacije
- tretman unutar pasmine unutar laktacije
- Dvije različite pokusne greške

Lakt. I Lakt. II
Pasmina A
T1
T2
T3
Pasmina B
T2
T1
T3
Pasmina B
T3
T2
T1
Pasmina A
T1
T2
T3
Lakt. III Lakt. IV
Pasmina B
T1
T3
T2
Pasmina A
T2
T1
T3
Pasmina A
T2
T1
T3
Pasmina B
T3
T2
T1

ANOVA tablica:

Izvor Stupnjevi slobode
Laktacija (b–1)= 3
Pasmine (p–1)= 1
Greška a (Laktacija × Pasmina) (b–1)(p–1)= 3
Glavni plot (b–1)+(p–1)+(b–1)(p–1) = 7

Tretman (a–1) = 2
Pasmina × tretman (p–1)(a–1) = 2
Greška b p(a–1)(b–1) = 12

Ukupno (abp–1) = 23

Izbor plana ovisi o:
- mogućnosti smještaja
- željenoj preciznosti pokusa za pojedine faktore
99

Redoslijed preciznosti pokusa za pojedine faktore:

Plan 1 Plan 2 Plan 3
Tretman 1 3 2
Pasmina 3 1 2
Pasmina × Trtetman 3 1 1

100
16 Split plot pokusni plan
Značajke:
- pokusni materijal podjeli u više glavnih jedinica (plotovi) na koje se apliciraju razine nekog
faktora, a zatim se cijele jedinice podijele u podjedinice (split plotovi) na koje se primjenjuju
razine drugog faktora

- plan može uključiti jedan ili više potpuno slučajni, slučajni blok plan ili latinski kvadrat koji
se primjenjuju na jedinice ili podjedinice

- tretmani se dodjeljuju slučajno u dvije stepenice:
1. razine faktora A slučajno na glavne jedinice (plotove)
2. razine faktora B se slučajno na svaku podjedinicu (subplotove)

Split plot plan se može koristiti:
1. kada jedan faktor zahtjeva više pokusnog materijala nego neki drugi faktor.
- u poljskim ili laboratorijskim pokusima.
- pripreme zemlje (A) varijetet (B)
2. Kada se jedan faktor primjenjuje kasnije. Taj faktor se primjenjuje na subjedinice (faktor B).
3. Varijabilnost između cijelih jedinica se očekuje da će biti veća nego ona između subjedinica.
4. Ako je veća preciznost potrebna za jedan od faktora. Taj faktor se primjenjuje na subjedinice
(faktor B).

16.1 Faktor A (glavni faktor) kao slučajni blok plan

Blok 1 Blok 2 Blok 3
B
2
B
2
B
1
B
2

B
1
B
2
B
1
B
1

B
2
B
1
B
2
B
1

B
1
B
1
B
2
B
1

B
2
B
1
B
2
B
2

B
1
B
2
B
1
B
2

A
4
A
1
A
2
A
3

A
2
A
1
A
4
A
3

A
1
A
2
A
4
A
3

Model:
y
ijk
= µ + Blok
k
+ A
i
+ δ
ik
+ B
j
+(AB)
ij
+ ε
ijk

i = 1,....,a; j = 1,....,b ; k = 1,......,n

y
ijk
= k-to opažanje za razinu i faktora A i razinu j faktora B
µ = ukupni prosjek korigiran na sve utjecaje
Blok
k
= utjecaj bloka
A
i
= utjecaj faktora A
B
j
= utjecaj faktora B
(AB)
ij
= utjecaj interakcije A × B
101
δ
ik
= cijeli plot greška N(0, σ
2
t
) = interakcija Blok
k
× A
i

ε
ijk
= split plot greška N(0, σ
2
)

Također je µ
ij
= A
i
+ B
j
+(AB)
ij
= prosjek ij-te A x B kombinacije.

a = broj razina tretmana A
b = broj razina tretmana B
n = broj blokova (ponavljanja)

Cijeli plot greška i split plot greška su nezavisni.

Primjer:
a = 4, b = 2, n = 3
ANOVA tablica

Izvor Stupnjevi slobode
Blok (n–1) = 2
Tretmani A (a–1) = 3
Cijeli plot
greška
(n–1)(a–1) = 6
Tretmani B (b–1) = 1
A x B (a–1)(b–1)= 3
Split plot greška a(b–1)(n–1) = 8
Ukupno (abn–1)= 23

F provjera za faktor A:
geska plot Cijeli
MS
MS
F
A
=
Cijeli plot pokusna greška je prosjek kvadrata za interakcija blok × A.

F-provjera za faktor B:
greska plot Split
MS
MS
F
B
=
Split plot greška je prosjek kvadrata ostatka.

F-provjera za interakciju A × B:
greska plot Split
MS
MS
F
AxB
=

16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi
SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na
mliječnost krava je slijedeći. Načini tretiranja pašnjaka primijenjeni su na glavne jedinice kao
slučajni blok plan.
102

SAS program:

DATA spltblk;
INPUT blok past min milk @@;
DATALINES;
1 4 2 30 1 4 1 29 1 1 2 27 1 1 1 25
1 2 1 26 1 2 2 28 1 3 2 26 1 3 1 24
2 2 1 32 2 2 2 37 2 1 2 30 2 1 1 31
2 4 1 34 2 4 2 37 2 3 1 33 2 3 2 32
3 1 2 34 3 1 1 31 3 2 1 30 3 2 2 31
3 4 2 36 3 4 1 38 3 3 1 33 3 3 2 32
;
PROC MIXED DATA = spltblk;
CLASS blok past min;
MODEL milk =past min past*min / DDFM = KENWARDROGER;
RANDOM blok blok*past/;
LSMEANS past min past*min / DIFF ADJUST=TUKEY ;
RUN;

SAS ispis:

Covariance Parameter
Estimates

Cov Parm Estimate
blok 12.7431
blok*past 1.0486
Residual 2.2500

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
past 3 6 5.46 0.0377
min 1 8 3.63 0.0932
past*min 3 8 0.86 0.4981

Least Squares Means

Standard
Effect past min Estimate Error DF t Value Pr > |t|

past 1 29.6667 2.2298 2.51 13.30 0.0022
past 2 30.6667 2.2298 2.51 13.75 0.0020
past 3 30.0000 2.2298 2.51 13.45 0.0021
past 4 34.0000 2.2298 2.51 15.25 0.0015
min 1 30.5000 2.1266 2.09 14.34 0.0041
min 2 31.6667 2.1266 2.09 14.89 0.0038
past*min 1 1 29.0000 2.3124 2.9 12.54 0.0013
past*min 1 2 30.3333 2.3124 2.9 13.12 0.0011
past*min 2 1 29.3333 2.3124 2.9 12.69 0.0013
past*min 2 2 32.0000 2.3124 2.9 13.84 0.0010
past*min 3 1 30.0000 2.3124 2.9 12.97 0.0012
past*min 3 2 30.0000 2.3124 2.9 12.97 0.0012
past*min 4 1 33.6667 2.3124 2.9 14.56 0.0008
past*min 4 2 34.3333 2.3124 2.9 14.85 0.0008
103

Differences of Least Squares Means

Standard
Effect past min _past _min Estimate Error DF t Value Pr>|t| Adjust Adj P
past 1 2 -1.0000 1.2038 6 -0.83 0.4379 Tuk-Kr 0.8385
past 1 3 -0.3333 1.2038 6 -0.28 0.7911 Tuk-Kr 0.9918
past 1 4 -4.3333 1.2038 6 -3.60 0.0114 Tuk-Kr 0.0427
past 2 3 0.6667 1.2038 6 0.55 0.5997 Tuk-Kr 0.9421
past 2 4 -3.3333 1.2038 6 -2.77 0.0325 Tuk-Kr 0.1135
past 3 4 -4.0000 1.2038 6 -3.32 0.0159 Tuk-Kr 0.0587
min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932
past*min 1 1 1 2 -1.3333 1.2247 8 -1.09 0.3080 Tuk-Kr 0.9425
past*min 1 1 2 1 -0.3333 1.4829 11.5 -0.22 0.8261 Tuk-Kr 1.0000
past*min 1 1 2 2 -3.0000 1.4829 11.5 -2.02 0.0669 Tuk-Kr 0.5207
past*min 1 1 3 1 -1.0000 1.4829 11.5 -0.67 0.5134 Tuk-Kr 0.9955
past*min 1 1 3 2 -1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955
past*min 1 1 4 1 -4.6667 1.4829 11.5 -3.15 0.0088 Tuk-Kr 0.1407
past*min 1 1 4 2 -5.3333 1.4829 11.5 -3.60 0.0039 Tuk-Kr 0.0792
past*min 1 2 2 1 1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955
...
...
past*min 3 1 3 2 -222E-18 1.2247 8 -0.00 1.0000 Tuk-Kr 1.0000
past*min 3 1 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217
past*min 3 1 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868
past*min 3 2 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217
past*min 3 2 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868
past*min 4 1 4 2 -0.6667 1.2247 8 -0.54 0.6011 Tuk-Kr 0.9988

16.2 Faktor A (glavni faktor) kao potpuno slučajni plan

B
2
B
2
B
1
B
2
B
1
B
2
B
1
B
1

B
1
B
1
B
2
B
1
B
2
B
1
B
2
B
2

A
4
A
1
A
2
A
3
A
2
A
1
A
4
A
3

Model:
y
ijk
= µ + A
i
+ δ
ik
+ B
j
+(AB)
ij
+ ε
ijk

i = 1,....,a; j = 1,....,b ; k = 1,......,n

ANOVA tablica

Izvor Stupnjevi slobode
Tretman A (a–1) = 3
Cijeli plot
greška
a(n–1) = 8
Tretman B (b–1) = 1
A × B (a–1)(b–1)= 3
Split plot greška a(b–1)(n–1) = 8
Ukupno (abn–1)= 23

104

F provjera za A:
geska plot Cijeli
MS
MS
F
A
=

Cijeli plot pokusna greška je prosjek kvadrata između plotova.
F-provjera za B:
greska plot Split
MS
MS
F
B
=

Split plot greška je prosjek kvadrata ostatka.

F-provjera za interakciju A × B:
greska plot Split
MS
MS
F
AxB
=

16.2.1 SAS primjer: Glavne jedinice u potpuno slučajnom planu
SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na
mliječnost krava kada su tretmani pašnjaka primijenjeni na glavne jedinice kao potpuno slučajni
plan.

SAS program:

DATA splt;
INPUT plot pas min milk @@;
DATALINES;
1 4 2 30 1 4 1 29 2 1 2 27 2 1 1 25
3 2 1 26 3 2 2 28 4 3 2 26 4 3 1 24
5 2 1 32 5 2 2 37 6 1 2 30 6 1 1 31
7 4 1 34 7 4 2 37 8 3 1 33 8 3 2 32
9 1 2 34 9 1 1 31 10 2 1 30 10 2 2 31
11 4 2 36 11 4 1 38 12 3 1 33 12 3 2 32
;
PROC MIXED DATA = splt;
CLASS plot pas min;
MODEL milk =pas min pas*min / DDFM = KENWARDROGER;
RANDOM plot(pas) /;
LSMEANS pas min pas*min / DIFF ADJUST=TUKEY ;
RUN;

SAS ispis:

Covariance Parameter
Estimates

Cov Parm Estimate
plot(pas) 13.7917
Residual 2.2500

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
pas 3 8 0.80 0.5302
min 1 8 3.63 0.0932
pas*min 3 8 0.86 0.4981
105

Least Squares Means

Standard
Effect pas min Estimate Error DF t Value Pr > |t|
pas 1 29.6667 2.2298 8 13.30 <.0001
pas 2 30.6667 2.2298 8 13.75 <.0001
pas 3 30.0000 2.2298 8 13.45 <.0001
pas 4 34.0000 2.2298 8 15.25 <.0001
min 1 30.5000 1.1562 9.2 26.38 <.0001
min 2 31.6667 1.1562 9.2 27.39 <.0001
pas*min 1 1 29.0000 2.3124 9.2 12.54 <.0001
pas*min 1 2 30.3333 2.3124 9.2 13.12 <.0001
pas*min 2 1 29.3333 2.3124 9.2 12.69 <.0001
pas*min 2 2 32.0000 2.3124 9.2 13.84 <.0001
pas*min 3 1 30.0000 2.3124 9.2 12.97 <.0001
pas*min 3 2 30.0000 2.3124 9.2 12.97 <.0001
pas*min 4 1 33.6667 2.3124 9.2 14.56 <.0001
pas*min 4 2 34.3333 2.3124 9.2 14.85 <.0001

Differences of Least Squares Means

Stand
Effect past min _pas _min Estimate Error DF t Pr>|t| Adj Adj P
pas 1 2 -1.0000 3.1535 8 -0.32 0.7593 Tuk-Kr 0.9881
pas 1 3 -0.3333 3.1535 8 -0.11 0.9184 Tuk-Kr 0.9995
pas 1 4 -4.3333 3.1535 8 -1.37 0.2067 Tuk-Kr 0.5469
pas 2 3 0.6667 3.1535 8 0.21 0.8379 Tuk-Kr 0.9964
pas 2 4 -3.3333 3.1535 8 -1.06 0.3214 Tuk-Kr 0.7231
pas 3 4 -4.0000 3.1535 8 -1.27 0.2403 Tuk-Kr 0.6053
min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932

106
17 Analiza kovarijance
Karakteristike:
- kategoričke + numeričke nezavisne varijable
- numerička varijabla = kovarijabla (kovarijanta)

Analiza kovarijance se koristi za:
- kontrolu pokusne greške i povećanja preciznosti
- korigiranje prosjeka tretmana na temelju nezavisne varijable
- procjena izgubljenih podataka
- procjena razlika nagiba krivulja između tretmana

17.1 Potpuno slučajni pokusni plan sa kovarijablom
- Za korigiranje prosjeka tretmana
- Kontrola pokusne greške
- Povećanje preciznosti

Model:
y
ij
= β
0
+ β
1
x
ij
+ τ
i
+ ε
ij
i = 1,.....,a j = 1,...,n

Gdje su:
y
ij
= Opažanje jedinice j u grupi i (tretmanu i)
β
0
= odsječak na y osi
β
1
= regresijski koeficijent
x
ij
= kontinuirana nezavisna varijabla sa prosjekom µ
x

τ
i
= fiksni utjecaj grupe ili tretmana i
ε
ij
= slučajna greška

Ukupni prosjek: µ = β
0
+ β
1
µ
x
,
Prosjek grupe i: µ
i
= β
0
+ β
1
µ
x
+ τ
i
. µ
x
= prosjek kovarijable x.

Pretpostavke su slijedeće:
1) kovarijabla je fiksna i nezavisna od tretmana
2) greške su nezavisne jedna od druge
3) greška ima normalnu raspodjelu sa prosjekom 0 i homogenom varijancom.

107
