You are on page 1of 117

Biometrika i planiranje istraživanja na životinjama

Miroslav Kapš
tel: 239-3949
e-mail: mkaps@agr.hr
1 UVOD ............................................................................................................................................................................. 1
1.1 PODACI I VARIJABLE .................................................................................................................................................. 1
1.2 PRIKAZ PODATAKA .................................................................................................................................................... 3
1.2.1 Grafički prikazi ................................................................................................................................................. 3
1.2.2 Numeričke metode za opis kvantitativnih podataka.......................................................................................... 3
1.2.3 Simboli .............................................................................................................................................................. 3
1.2.4 Aritmetička srednja vrijednost:......................................................................................................................... 4
1.2.5 Varijanca uzorka: ............................................................................................................................................. 4
1.2.6 Standardna devijacija uzorka ........................................................................................................................... 5
1.2.7 Uvodni SAS primjer .......................................................................................................................................... 5
1.3 ZAKLJUČCI O POPULACIJAMA NA TEMELJU UZORAKA ................................................................................................ 6
1.4 SLUČAJNE VARIJABLE I NJIHOVE RASPODJELE ........................................................................................................... 6
1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable.................................................................................. 7
1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable ............................................................................ 8
1.5 FUNKCIJE SLUČAJNE VARIJABLE .............................................................................................................................. 14
1.5.1 Neke statistike i njihove raspodjele................................................................................................................. 15
1.5.2 Stupnjevi slobode ............................................................................................................................................ 16
1.6 ZAKLJUČIVANJE O POPULACIJI NA TEMELJU UZORAKA ............................................................................................ 16
1.7 PROCJENA PARAMETARA ......................................................................................................................................... 16
1.7.1 Procjena srednje vrijednosti populacije ......................................................................................................... 17
1.7.2 Procjena varijance u normalnoj populaciji.................................................................................................... 17
1.8 PROVJERA HIPOTEZA ............................................................................................................................................... 17
1.8.1 P-vrijednost..................................................................................................................................................... 18
1.8.2 Statistička i praktična značajnost ................................................................................................................... 19
1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere..................................................................... 19
2 JEDNOSTAVNA LINEARNA REGRESIJA ........................................................................................................... 21
2.1 UVOD ...................................................................................................................................................................... 21
2.2 PROCJENA PARAMETARA Β0 I Β1 ............................................................................................................................... 23
2.3 OSTATAK I SVOJSTVA OSTATKA............................................................................................................................... 24
2.4 PROSJECI I VARIJANCE PROCJENITELJA .................................................................................................................... 24
2.5 STUDENTOVA T-PROVJERA I INTERVAL POUZDANOSTI PROCJENE PARAMETARA ...................................................... 25
2.6 INTERVAL POUZDANOSTI ZA Β1 ................................................................................................................................ 26
2.7 INTERVALI POUZDANOSTI ZAVISNE VARIJABLE ....................................................................................................... 26
2.8 RAŠČLANJENJE UKUPNE VARIJABILNOSTI ................................................................................................................ 28
2.8.1 Veza između suma kvadrata............................................................................................................................ 29
2.9 PROVJERA HIPOTEZA - F- PROVJERA ........................................................................................................................ 30
2.10 KOEFICIJENT DETERMINACIJE (R2) ........................................................................................................................ 31
2.11 SAS PRIMJER ZA JEDNOSTAVNU LINEARNU REGRESIJU .......................................................................................... 32
3 KOEFICIJENT KORELACIJE ................................................................................................................................ 34
3.1 PROCJENA KOEFICIJENTA KORELACIJE..................................................................................................................... 35
4 VEKTORI I MATRICE ............................................................................................................................................. 36
4.1 TIPOVI I SVOJSTVA MATRICA ................................................................................................................................... 36
4.1.1 Operacije s matricama i vektorima: ............................................................................................................... 37
5 JEDNOSTAVNA REGRESIJA U MATRIČNOM PRIKAZU............................................................................... 40

6 MULTIPLA REGRESIJA.......................................................................................................................................... 43
6.1 DVIJE NEZAVISNE VARIJABLE .................................................................................................................................. 43
6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza ................................................................................. 45
6.2 PARCIJALNE I STUPNJEVITE EKSTRA SUME KVADRATA ............................................................................................ 46
6.3 SAS PRIMJER ZA MULTIPLU REGRESIJU ................................................................................................................... 47
6.4 KRIVOLINIJSKA REGRESIJA DRUGOG STUPNJA ......................................................................................................... 48
6.4.1 SAS primjer za kvadratnu regresiju................................................................................................................ 49
6.5 MOGUĆE POTEŠKOĆE KOD UPOTREBE REGRESIJE .................................................................................................... 50
6.5.1 Analiza ostataka i narušenost pretpostavki modela........................................................................................ 51
6.5.2 Loša opažanja................................................................................................................................................. 52
6.5.3 Multikolinearnost............................................................................................................................................ 52
6.6 IZGRADNJA MODELA I KRITERIJI ZA IZBOR MODELA................................................................................................. 53
7 JEDNOSTRUKA ANALIZA VARIJANCE ............................................................................................................. 54
7.1 MODEL JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA ........................................................................ 55
7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti: ......................................................................... 56
7.1.2 Postavljanje hipoteza i F-provjera ................................................................................................................. 57
7.2 USPOREDBA SREDNJIH VRIJEDNOSTI POJEDINIH GRUPA ........................................................................................... 59
7.2.1 Najmanja značajna razlika (LSD) .................................................................................................................. 59
7.2.2 Tukey provjera (HSD)..................................................................................................................................... 59
7.3 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA .............................................................. 60
7.4 MODEL SA SLUČAJNIM UTJECAJIMA GRUPA ............................................................................................................. 61
7.5 INTRAKLASNA KORELACIJA ..................................................................................................................................... 63
7.6 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE SA SLUČAJNIM UTJECAJIMA ....................................................... 64
8 NAČELA PLANIRANJA POKUSA.......................................................................................................................... 65
8.1 POKUSNA JEDINICA I TRETMANI .............................................................................................................................. 66
8.2 PONAVLJANJA I POKUSNA GREŠKA .......................................................................................................................... 66
8.3 POTREBAN BROJ PONAVLJANJA ............................................................................................................................... 67
9 POTPUNO SLUČAJNI POKUSNI PLAN................................................................................................................ 68

10 BLOKOVI U ANALIZI VARIJANCE.................................................................................................................... 70


10.1 SLUČAJNI BLOK PLAN (POTPUNI) ........................................................................................................................... 70
10.1.1 Raščlanjenje ukupne sume kvadrata............................................................................................................. 71
10.1.2 Postavljanje hipoteza i F-provjera ............................................................................................................... 72
10.1.3 SAS primjer za slučajni blok plan................................................................................................................. 73
10.1.4 SAS primjer s više pokusnih jedinica po kombinaciji blok x tretman ........................................................... 74
11 'CHANGE-OVER' POKUSNI PLANOVI .............................................................................................................. 77
11.1 JEDNOSTAVNI 'CHANGE-OVER' PLAN...................................................................................................................... 77
11.2 'CHANGE-OVER' PLAN KADA POSTOJI UTJECAJ RAZDOBLJA .................................................................................... 78
11.2.1 SAS primjer za ‘change-over’ plan s utjecajem razdoblja ........................................................................... 79
11.3 LATINSKI KVADRAT............................................................................................................................................... 80
11.3.1 SAS primjer za latinski kvadrat..................................................................................................................... 82
11.4 CHANGE OVER PLAN POSTAVLJEN KAO VIŠE LATINSKIH KVADRATA...................................................................... 84
12 FAKTORIJALNI POKUS........................................................................................................................................ 85
12.1 SAS PRIMJER ZA FAKTORIJALNI POKUS ................................................................................................................. 88
13 HIJERARHIJSKI POKUSNI PLANOVI ............................................................................................................... 90
13.1 SAS PRIMJER ZA HIJERARHIJSKI PLAN ................................................................................................................... 92
14 POKUSNI PLANOVI SA KAVEZIMA I PREGONIMA ..................................................................................... 94

15 DVOSTRUKI BLOKOVI......................................................................................................................................... 96

16 SPLIT PLOT POKUSNI PLAN............................................................................................................................. 100


16.1 FAKTOR A (GLAVNI FAKTOR) KAO SLUČAJNI BLOK PLAN .................................................................................... 100
16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi ............................................................ 101
16.2 FAKTOR A (GLAVNI FAKTOR) KAO POTPUNO SLUČAJNI PLAN .............................................................................. 103
16.2.1 SAS primjer: Glavne jedinice u potpuno slučajnom planu ......................................................................... 104
17 ANALIZA KOVARIJANCE .................................................................................................................................. 106
17.1 POTPUNO SLUČAJNI POKUSNI PLAN SA KOVARIJABLOM ....................................................................................... 106
1 Uvod

1.1 Podaci i varijable


Podaci:
- materijal s kojim statističar radi
- prikupljaju se mjerenjem, brojanjem ili opažanjem
- Primjeri: skup težina teladi, količina mlijeka u laktaciji, muški ili ženski spol, plava ili
zelena boja očiju

Pokus ili eksperiment:


– Proces sakupljanja, opažanja ili mjerenja podataka

Varijabla
– Označava skup podataka
– Poprima različite vrijednosti
• vrijednosti varijable pokazuju varijabilnost
– Primjeri: težina, količina mlijeka, spol, boja očiju

Podaci su vrijednosti koje varijabla poprima.
- težina od 200 kg, ili količina mlijeka od 20 kg.

VARIJABLE

KVALITATIVNE KVANTITATIVNE
(ATRIBUTIVNE, KATEGORIČKE). (NUMERIČKE)

NOMINALNE ORDINALNE DISKRETNE KONTINUIRANE

VARIJABLE

A) kvantitativne (numeričke)
- čije se vrijednosti prikazuju brojevima, a razlike između brojeva imaju numeričko značenje
- težina životinja, broj mladih u leglu, temperatura, vrijeme
a) diskretne
- konačna ili beskonačna
- prebrojiva, mjeri sa cijelim ili prirodnim brojevima
- broj mladih u leglu ili broj jaja
1
b) kontinuirane
- poprima beskonačno mnogo vrijednosti
- njene vrijednosti mjere se realnim brojevima
- količina mlijeka ili težina

B) kvalitativne (atributivne, kategoričke)


- podaci su im opisni
- boja očiju ili da li je životinja bolesna ili nije
a) nominalne
- ne može se reći da je jedna kategorija veća ili manja od druge
- boja očiju ili kože
b) ordinalne
- kod kojih se kategorije mogu poredati po veličini
- ocjene lakoće telenja

Zašto podaci, mjerenja, opažanja

• Mjerenja ili opažanja nam pomažu u zaključivanju o nekoj pojavi


• Pitanje je i koji je uzrok da je neka krava bolja
– Da li možemo ‘izmjeriti’ i taj uzrok
– Da li možemo reći da će uslijed nekog zahvata krava biti ‘bolja’
– Na primjer: ako damo kravi mineralni dodatak da li će dati više mlijeka? Kako ćemo
to zaključiti?
• Zaključak:
– Rekapitulacija stanja
– Koristiti i u budućim situacijama

Koliko smo sigurni da je naš zaključak korektan?

• Točnost i preciznost zaključaka ovise o broju podataka (količini informacija), kvaliteti


podataka, reprezentativnosti podataka
• Često donosimo zaključak uz neku vjerojatnost

Statističke metode

• Načini na koje dolazimo do zaključaka koristeći podatke


• Uključuju sakupljanje, organiziranje, tabeliranje, analizu, interpretaciju, opis i prezentaciju
podataka
• Uključuju pažljivo i precizno definiranje problema (postavljanje cilja), donošenje pravilnog
zaključka koji pomaže odgovoriti na postavljeno pitanje ili cilj

Biometrika (Biostatisika), a posebno statističke metode uključuju dva glavna pristupa u donošenju
zaključaka:
1. Opis nekog skupa podataka (opisna statistika)
2. Izbor uzoraka iz većeg skupa podataka (populacije, izvora podataka) i korištenje tih uzoraka za
zaključak o toj populaciji (populacijama)

2
1.2 Prikaz podataka
1.2.1 Grafički prikazi
Primjer: Histogram:
-raspodjela frekvencija nekog skupa podataka
- podaci se svrstavaju u razrede
- prikazuje broj opažanja u pojedinom razredu
- prava ili relativna frekvencija

16
16
14 12 12
12
Broj teladi

10 8 8 8
8 7 7
6
6 5 5
4 2 2
2 1 1
0
190 200 210 220 230 240 250 260 270 280 290 300 310 320 330
Sredine razreda

Slika 1-1: Histogram težine teladi u dobi od 7 mjeseci (n=100)

1.2.2 Numeričke metode za opis kvantitativnih podataka


NUMERIČKE OPISNE MJERE
A) Mjere centralne tendencije
- Aritmetička srednja vrijednost
- Medijan
- Mode
B) Mjere varijabilnosti
- Raspon
- Varijanca
- Standardna devijacija
- Koeficijent varijabilnosti
C) Mjere relativnog položaja
- Percentili
- z-vrijednost

1.2.3 Simboli

Σ = veliko grčko slovo sigma = oznaka za sumu


i
i = 1 do n
Suma n brojeva:
Σ y =y
i + y2 +.....+ yn
i 1
Suma kvadrata n brojeva:
Σyi
2
= y21 + y22 +.....+ y2n
i
Suma produkata dva niza brojeva:
Σ xy = x y
i i i 1 1 + x2y2 +.....+ xnyn

3
Primjer:

y y1 y2 y3
2 4 6

x x1 x2 x3
3 6 7

Σ y = y + y + y = 2 + 4 +6 = 12
i i 1 2 3

Σ y = y + y + y = 2 + 4 +6 = 56
i
2
i
2
1
2
2
2
3
2 2 2

Σ x y = x y + x y + x y = (3)(2) + (6)(4) +(7)(6) = 72


i i i 1 1 2 2 3 3

1.2.4 Aritmetička srednja vrijednost:

y=
∑y i i
n

Svojstva aritmetičke srednje vrijednosti:


1. ∑ (y − y) = 0
i i

2. ∑ ( y − y ) = minimum
i i
2

drugim riječima ∑ (y
i i − y) <
2
∑ (yi i − a)
2
, za bilo koji broj a.

1.2.5 Varijanca uzorka:

Ako se i prosjek izračunava iz istog uzorka kao y (tj. ako je nepoznat prosjek populacije)

s 2
=
∑( y i i − y )2
n −1

Ako je od prije poznat prosjek populacije µ i NE računa se iz istog uzorka:

s =
2 i i ∑
( y − µ )2
n

- Varijanca je prosječno kvadrirano odstupanje od prosjeka

Suma kvadriranih odstupanja od srednje vrijednosti (korigirana suma kvadrata) =


(∑ y ) 2

∑( y i i − y) = 2
∑y 2
i i
− i i
n

4
1.2.6 Standardna devijacija uzorka

s = s2
prosječno odstupanje od prosjeka

1.2.7 Uvodni SAS primjer

Pogledajmo rješavanje primjera o uzorku težine teladi koristeći SAS software. Na detaljna
objašnjenja upotrebe programa čitaoca upućujem na iscrpnu SAS literaturu, dio koje može vidjeti u
popisu literature na kraju ove knjige. Ovdje možemo samo ukratko spomenuti da se svaki SAS
program sastoji od dva dijela: 1) DATA step, koji služi za unos ili kreiranje skupa podataka za koji
se želi napraviti analiza, i 2) PROC step, koji služi za analizu podataka. Treba još reći da SAS
software daje mogućnost obrade podataka i bez pisanja programa sa instrukcijama, tj. koristeći i
birajući ponuđene opcije za željenu analizu. Međutim, pisanje programa daje korisniku veće
mogućnosti i znanje o korištenju programa bez obzira na kompjutersku platformu. SAS ima tri
osnovna prozora: Program prozor (PGM) u koji se upisuje program, Ispis prozor (OUT) u kojem
korisnik može vidjeti ispis i LOG prozor u kojem se može provjeriti detalje o provedbi programa i
moguće greške. Vratimo se primjeru o težinama teladi. Izmjereni su slijedeći podaci 20 teladi:

SAS program:

DATA telad;
INPUT tezina @@;
DATALINES;
260 260 230 280 290 280 260 270 260 300
280 290 260 250 270 320 320 250 320 220
;
PROC MEANS DATA = telad N MEAN MIN MAX VAR STD CV ;
VAR tezina;
RUN;

Objašnjenje: SAS naredbe pisat ćemo uvijek velikim slovima da ih istaknemo, makar to u programu
nije potrebno, tj. program jednako tretira i velika i mala slova. Imena koja sam korisnik daje
varijablama i drugim oznakama pisat ćemo malim slovima. Naredba DATA definira ime datoteke
koja će sadržavati podatke, a ovdje je telad ime datoteke. Naredba INPUT definira ime varijable, a
naredba DATALINES govori da slijede podaci. Ovdje je varijabla tezina. SAS treba podatke
varijabli u kolonama, pa se u pravilu podaci i pišu u kolone. Na primjer,

INPUT tezina;
DATALINES;
260
260

220
;
učitava podatke varijable tezina. Podaci se mogu pisati i jedan za drugim u redu ako se koristi
oznaka @@ kod naredbe INPUT. SAS čita podatke jedan po jedan i sprema ih u kolonu. Program
koristi proceduru MEANS. Da bi označili da je to ime procedure treba napisati PROC MEANS.
DATA = telad, definira za koju datoteku će se računati statistike. Slijedi popis statistika koje
tražimo: N = broj podataka, MEAN = aritmetička srednja vrijednost, MIN = minimum, MAX =
maksimum, VAR = varijanca, STD= standardna devijacija, CV = koeficijent varijacije. Naredba
VAR definira varijablu (tezina) koja će se analizirati.

5
SAS ispis:

Analysis Variable: TEZINA

N Mean Minimum Maximum Variance Std Dev CV


-------------------------------------------------------------
20 273.5 220 320 771.31579 27.77257 10.1545
-------------------------------------------------------------

SAS ispis prikazuje ime varijable koja će se analizirati (Analysis varijabla: TEZINA), a zatim
opisnu statistiku.

1.3 Zaključci o populacijama na temelju uzoraka

• Populacija:
– Skup jedinki koje imaju neka zajednička svojstva od interesa
– Izvor podataka

• Parametri:
– Opisni pokazatelji populacije
– Obično nepoznate vrijednosti
– Primjer: prosjek populacije
• Koliki je prosjek količine mlijeka u laktaciji?

• Uzorak:
– Skup jedinki (podataka) izabran iz populacije
– Služi za procjenu i (ili) zaključivanje o populaciji.
– Vjerodostojnost procjene i zaključaka o populaciji je veća:
• ako je uzorak dobar predstavnik populacije
• uzorak mora biti slučajno izabran

• Statistike:
– Numerički opisni pokazatelji uzorka (eng. statistics)
– Mogu se izračunati iz uzoraka
– Primjer: aritmetička srednja vrijednost uzorka

• Statistički zaključci na temelju uzoraka su podložni greški


• Donose se uz neku vjerojatnost
• Kako odrediti vjerojatnost?
– Definiranjem slučajne varijable i matematičkih modela raspodjele vjerojatnosti

1.4 Slučajne varijable i njihove raspodjele


Slučajna varijabla:

• Matematički pojam, govori kako se opažanju pridružuje numerička vrijednost


• Vrijednost koju varijabla poprima smatra se slučajnim procesom (događajem)
– Na primjer: izmjerimo tele i vidimo da je teško 180 kg. Međutim ne znamo zašto baš
ima 180 kg.

6
– Barem dio te vrijednosti zato smatramo slučajnim
• Slučajna varijabla poprima određenu numeričku vrijednost s određenom vjerojatnosti

y je oznaka za varijablu
yi predstavlja vrijednost i-tog opažanje
- određeno opažanje: y1, y2
y ≤ y0 su sve vrijednosti koje su manje ili jednake od y0

Slučajne varijable

Kontinuirana (neprekidna) Diskretna (prekidna)


- sve vrijednosti u nekom intervalu - poprima samo određeni broj vrijednosti u
- realni brojevi nekom intervalu
- težina teladi starih 6, bilo koja vrijednost - NE sve vrijednosti
u intervalu od 160 do 260 kg, recimo - često cijeli brojevi
180.0 ili 191.23456 - broj latica u cvijetu, broj mladih u leglu

Vrijednost varijable y
- numerički događaj
- ima određenu vjerojatnost da se dogodi
Raspodjela vjerojatnosti slučajne varijable y:
- tablica, grafikon ili formula koji pokazuje vjerojatnost da y poprimi određenu vrijednost

Raspodjela vjerojatnosti slučajne varijable

• Raspodjela vjerojatnosti slučajne varijable s konačnim ili prebrojivim vrijednostima je raspodjela


frekvencija
• Raspodjela vjerojatnosti se često može prikazati formulom (funkcijom)
– Matematički model prave raspodjele frekvencija
– Procjena prave raspodjele frekvencija
– Funkcija slučajne varijable: p(y) ili f(y)
• Raspodjela = distribucija

Očekivanje (prosjek) i varijanca slučajne varijable


- pokazatelji položaja i varijabilnosti
Očekivanje (prosjek): E(y) = µy
Varijanca: Var(y) = σ2y =σ2 = E[(y – µy)2] = E[y2] – µy2
(Sjetite se da je varijanca prosječno kvadrirano odstupanje od prosjeka)

1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable


- tabelarni ili grafički prikaz ili formula koja daje vjerojatnost p(y) za svaku moguću vrijednost
varijable y.

Uvjeti:
1. O ≤ p(y) ≤ 1

2. Σ (svi y) p(y) =1

7
Primjeri diskretnih varijabli

• Binarna varijabla
– samo dva moguća rezultata neke pojave
– DA i NE ili 0 i 1 bolestan – zdrav i sl

• Binomna varijabla
– Broj povoljnih pokušaja (y) u ukupno n pokušaja
– U pojedinačnom pokušaju moguća samo dva rezultata
• broj ženske teladi u 4 telenja, broj bijelih praščića u leglu

Binomna raspodjela
- raspodjela vjerojatnosti y povoljnih opažanja (pokušaja) u ukupno n pokušaja
- broj ženske teladi u 4 telenja
- broj bijelih praščića u leglu

Raspodjela vjerojatnosti od y:
- određena parametrom p i brojem pokušaja n:
n
p ( y ) =   p y q n − y
 y
(y = 0,1,2,,...., n)

p = vjerojatnost povoljnog rezultata u pojedinačnom opažanju (pokušaju) (vjerojatnost


elementarnog događaja). q = 1 – p = vjerojatnost nepovoljnog rezultata

Oblik raspodjele vjerojatnosti ovisi o p:


- binomna raspodjela je simetrična kada je p = 0.5
- asimetrična u svim ostalim slučajevima

A) B)
0.3 0.4
fre 0.25 fre
kve 0.2 kve 0.3
nci nci
0.15 0.2
ja ja
0.1
0.1
0.05
0 0
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
broj povoljnih pokušaja broj povoljnih pokušaja

Slika 1-2: Binomna raspodjela (n = 8) za dva slučaja A) p=0.5 i B) p = 0.2


Primjer

1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable


Kontinuirana slučajna varijabla:

• Poprima neprebrojivo mnogo vrijednosti


• Nemoguće je pridružiti vjerojatnost za svaki pojedinačni numerički događaj

8
– Teoretski vrijednost kontinuirane varijable je točka, a matematički točka nema
dimenzije
– Vjerojatnost da slučajna varijabla poprimi neku određenu vrijednost je jednaka nuli

• VAŽNO:
– promatrati vjerojatnost da varijabla y poprima vrijednosti u nekom intervalu
– vjerojatnost se pridružuje numeričkom događaju koji se odnosi na neki interval

Primjer: težina teladi


- vrijednosti koje se pridružuju pojedinom mjerenju zavise od preciznosti mjerenja
- ako npr. preciznost na 1 kg, tada izmjera od 220 kg znači sve mjere od 219.5 do 220.5 kg
- pošto se radi o intervalu ==> događaj ima vjerojatnost

Funkcija vjerojatnosti gustoće


– Gustoća = podsjetnik da govorimo o vjerojatnosti u intervalima
– Funkcija gustoće = model prave (nepoznate) raspodjele frekvencije

Svojstva funkcije gustoće:


1. f(yi) ≥ 0
2. P(–∝ ≤ y ≤ +∝) = 1
(vjerojatnost da se dogodi bilo koji y je jednaka 1)

1.4.2.1 NORMALNA RASPODJELA

- model raspodjele relativnih frekvencija u mnogim pojavama.


- normalnu raspodjelu slijede mnogi pokazatelji koji se koriste za statističko zaključivanje.
- normalna krivulja = Gaussova krivulja
- oblik zvona.

Slika 1-3: Normalna (Gaussova) krivulja

Položaj i oblik normalne krivulje je određen sa dva parametra µ i σ2 (prosjek i varijanca)

Funkcija gustoće je:


 1  y −µ  2 
1 − 2  σ  
   
f ( y) = e
2πσ 2

-∝ < y < +∝

e = baza prirodnog logaritma (e = 2.71828...)


π = 3.14...

y je normalna slučajna varijabla => y ∼ N (µ,σ2)


9
- Visina i raspršenost krivulje ovisi o varijanci σ2
- Povećanje σ2 dovodi da krivulja smanjuje visinu i više je raširena.

0.4
σ=1
σ = 1.5
Frr 0.3
ekv
en
cija 0.2

0.1

0
-4 -3 -2 -1 0 1 2 3 4

Slika 1-4: Normalne krivulje sa standardnim devijacijama σ = 1 i σ = 1.5

Vjerojatnost da se slučajno izabrana jedinka (s nekom vrijednosti y) nalazi u intervalu (y1, y2) je
jednaka površini ispod normalne krivulje ograničena vrijednostima y1 i y2. (Uzima se da je
ukupna površina 1 ili 100%)
Ova vjerojatnost je jednaka proporciji jedinki s vrijednostima između y1 i y2

Primjer: Vjerojatnost da y bude između 170 i 210


P(y1 ≤ y ≤ y2) = P(170 ≤ y ≤ 210)

y1 = 170 y2 = 210

µ = 200

Slika 1-5: Površina ispod normalne krivulje ograničena vrijednostima 170 i 210

Primjer:
Vjerojatnost da y < 230

µ = 200 y0 = 230

Slika 1-6: Normalna krivulja sa µ = 200 i σ = 20

Standardizacija normalnih krivulja

10
• Budući da oblik krivulje ovisi samo o varijanci (odnosno stanardnoj devijaciji σ), sve
normalne krivulje se mogu standardizirati tj. prevesti u standardnu normalnu krivulju
• Standardizacija: slučajna normalna varijabla y se izrazi u jedinicama standardne devijacije:

y−µ
z=
σ

Standardna normalna krivulja je takva normalna krivulja kojoj je prosjek 0 i standardna devijacija 1
=> µ = 0 i σ = 1

Često se za standardnu normalnu varijablu piše:


z ∼ Z ili z ∼ N(0, 1)

Funkcija gustoće standardne normalne varijable je:


f ( z) =
1
e
[− z ]
1 2
2

1.96 -1 0 1 1.96

95%

Slika 1-7: Standardna normalna krivulja (µ = 0 i σ2 = 1)

• Površina ispod standardne normalne krivulje ograničena s dvije vrijednosti standardne


normalne varijable z1 i z2, predstavlja vjerojatnost da varijabla poprime vrijednosti između ta
dva broja. (opet se utima da je ukupna površina jednaka jedan (ili 100%): P(–∞≤ z ≤ +∞) =
1
• Također: P(–1.96 ≤ z ≤ 1.96) = 0.95

Praktična vrijednost standardizacije je u tome što za pronalaženje površine ispod krivulje


ograničenu nekim intervalom koristimo samo jednu krivulju. Podsjetimo se da je površina ispod
krivulje u nekom intervalu (y1, y2) odgovara vjerojatnosti da slučajna varijabla y poprima
vrijednosti u tom intervalu. Matematički površina ispod krivulje je jednaka određenom integralu
funkcije gustoće. Kako ne postoji eksplicitna formula za taj integral, služimo se tablicama (bilo iz
knjige ili kompjuterskog programa). Pošto je moguće sve normalne krivulje svesti na standardnu,
potrebno je imati samo jednu tablicu. Naime vjerojatnost da y poprima vrijednosti između y1 i y2 je:
P(y1 ≤ y ≤ y2) = P(z1 ≤ z ≤ z2)

gdje su
y1 − µ y2 − µ
z1 = i z2 =
σ σ

11
Primjer

µ=200 y0=230 y

0 1.5 z

Slika 1-8: Prikaz normalne i standardne normalne krivulje. Prikazane su dvije skale: originalna skala y
i standardna normalna skala z. Vrijednost varijable y0 = 230 odgovara vrijednosti z0 = 1.5.

170 200 210 y

1.5 0 .5 z

Slika 1-9: Površina ispod krivulje između 170 i 210.

Koliki je prosjek odabranih životinja?


zs = prosjek z vrijednosti za koje vrijedi z > z0, tj. z vrijednosti većih od z0.
Za standardnu normalnu krivulju vrijedi:
f ( z0 )
zS =
P
p = površina ispod standardne normalne krivulje za z>z0,
f(z0) = ordinata za vrijednost z0.
Ordinata je:
− 1 z 02
e 2
f ( z0 ) =

-vrijednost funkcije za danu vrijednost z.

12
f(z)

P
f(z0)

z0 zS z
0

Slika 1-10 Prosjek odabranih z vrijednosti. f(z0) = ordinata krivulje za z = z0, P je površina, odnosno
vjerojatnost P(z>z0) i zS je prosjek vrijednosti većih od z0.

Primjer:

1.4.2.2 HI KVADRAT RASPODJELA

Neka su z1, z2,…, zv standardne normalne varijable sa µ = 0 i σ = 1.

Slučajna varijabla

χ2 = Σz j
2
j

ima hi kvadrat raspodjelu sa v stupnjeva slobode.


f (χ 2)
0.50
0.45
0.40 v =2
0.35
0.30
0.25
v =6
0.20
0.15 v =10
0.10
0.05
0.00 χ2
0 5 10 15 20

Slika 1.11 Funkcija gustoće χ2 varijabli sa stupnjevima slobode v = 2, v = 6 i v = 10

Nagib i oblik raspodjele ovisi o stupnju slobode

1.4.2.3 STUDENTOVA (T) RASPODJELA

Neka je z normalna slučajna varijabla sa µ = 0 i σ = 1 i χ2 hi-kvadrat slučajna varijabla sa v


stupnjevima slobode. Varijabla definirana sa:
z
t=
χ2 v
je slučajna varijabla s t-raspodjelom.

13
stupnjevi slobode v = 16
stupnjevi slobode v = 2

Slika 1-12: Funkcija gustoće t slučajnim varijablama sa stupnjevima slobode 16 i 2.

Studentova t raspodjela je po obliku slična normalnoj samo što sa smanjenjem stupnjeva slobode
krivulja postaje više razvučenija (deblja) prema repovima (Slika 1.13).
Kada stupnjevi slobode idu prema beskonačnosti, t raspodjela prelazi u normalnu..

1.4.2.4 F-RASPODJELA

Neka su χ21 i χ22 hi-kvadrat slučajne varijable sa stupnjevima slobode v1 i v2. I neka su χ21 i χ22
nezavisni. Tada je:
χ12 v1
F= 2
χ 2 v2
slučajna varijabla sa F-raspodjelom
Oblik F raspodjele ovisi o stupnjevima slobode
f(F)
1.0 v1=2; v2=6
0.9
0.8 v1=10; v2=20
0.7
0.6 v1=6; v2=10
0.5
0.4
0.3
0.2
0.1
0.0 F
0 1 2 3 4 5

Slika 1.13 Funkcije gustoće F raspodjela sa stupnjevima slobode: a) v1=2 i v2 = 6; b) v1=6 i v2 = 10; c)
v1=10 i v2 =20

1.5 Funkcije slučajne varijable


• Slučajne varijable: varijable čije vrijednosti mjerimo, opažamo (težina, količina mlijeka –
normalne slučajne varijable)
• Funkcije tih varijabli iz uzoraka koje zovemo statistike (primjer: aritmetička srednja
vrijednost)

14
Statistike (engl. statistics)
• Numerički opisni pokazatelji izračunati iz uzorka
• Funkcije slučajne varijable => i same su slučajne varijable
• Primjeri: y i s2 su statistike
• Imaju poznate teoretske raspodjele
– => moguća procjena vjerojatnosti sa kojom se određena vrijednost statistike
pojavljuje
– => koriste se za donošenje zaključaka o populaciji

1.5.1 Neke statistike i njihove raspodjele

1.5.1.1 RASPODJELA SREDNJIH VRIJEDNOSTI UZORAKA , SREDIŠNJI GRANIČNI TEOREM

Ako se slučajno izabiru uzorci veličine n iz neke populacije sa srednjom vrijednosti µ i varijancom
σ2 i kada je n dovoljno velik, raspodjela srednjih vrijednosti uzoraka može se predočiti normalnom
funkcijom gustoće sa prosjekom
µy = µ
i standardnom devijacijom
σ
σy = .
n
σ y = standardna greška procijene prosjeka populacije
ili samo standardna greška

µ y
Slika 1-14: Raspodjela srednjih vrijednosti uzoraka

σ y se može procijeniti standardnom greškom uzorka


s
sy =
n

1.5.1.2 NEKE STATISTIKE KOJE NEMAJU NORMALNU RASPODJELU

( n − 1) s 2
=
∑ ( y − y)
i
2

σ2 σ2
ima hi-kvadrat raspodjela sa v = (n–1) stupnjevima slobode, ako je y normalna varijabla.

15
y−µ
Statistika t = imai studentovu t raspodjelu sa (n–1) stupnjeva slobode, ako je y normalna
s2
n
varijabla.

Neke statistike imaju F raspodjelu.

1.5.2 Stupnjevi slobode


• Broj nezavisnih opažanja povezanih sa procjenom varijance, odnosno s izračunavanjem
prosjeka kvadrata
• Ukupan broj opažanja manje broj parametara korištenih u izračunavanju tog prosjeka
kvadrata
• Na primjer: u izračunu varijance uzorka stupnjevi slobode su (n–1)

Stupnjevi slobode u izračunu varijance uzorka


• Varijanca uzorka je prosječno kvadrirano odstupanje od aritmetičke srednje vrijednosti
• Postoji (n–1) nezavisnih opažanja jer smo već s istim opažanjima izračunali aritmetičku
srednju vrijednost
• Dakle, prosjek kvadriranih odstupanja dobije se dijeljenjem sume kvadrata sa (n–1)

1.6 Zaključivanje o populaciji na temelju uzoraka


1. Procjena svojstava populacije
(procjena parametara)
2. provjera hipoteza o populaciji

1.7 Procjena parametara


Procjene parametara:

Jedinstveni procjenitelj: Intervalni procjenitelj


- pravilo ili formula koja govori kako -formula koja govori kao izračunati
izračunati procjenu iz uzorka interval procjene
procjena = broj koji izračunamo - intervalna procijena = izračunati interval

Svojstva jedinstvenih procjenitelja:


- statistika (funkcija slučajne varijable)
- izračunat iz uzorka
- mora biti nepristran: očekivanje od procjenitelja je jednako pravom parametru
- odstupanje procjenitelja od prave vrijednsoti parametra mora imati najmanju varijancu
- ima poznatu raspodjelu statistike uzorka
(engl. sampling distribution).

Npr. prema centralnom graničnom teoremu raspodjela prosjeka uzorka će biti približno normalna za
velike uzorke ( n > 30), sa srednjom vrijednosti µ i standardnom devijacijom σ / n

16
1.7.1 Procjena srednje vrijednosti populacije
Jedinstveni procjenitelj od µ je y
Svojstava:
Očekivanje od aritmetičkog prosjeka je jedanko prosjeku populacije
- odstupanja ( y i − y ) imaju najmanju varijancu Var ( yi − y ) = min.
σ
- y ima normalnu raspodjelu sa µ i σ y =
n
Statistika
y−µ
z= ima standardnu normalnu raspodjelu
σy

1.7.2 Procjena varijance u normalnoj populaciji


Nepristrani procjenitelj varijance populacije (σ2) je varijanca uzorka:

s =
2 ∑
i
( yi − y ) 2
n −1
Ukoliko je y normalna varijabla sa prosjekom µ i varijancom σ2, tada je:
( n − 1) s 2
χ2 =
σ
2

slučajna varijabla sa hi-kvadrat raspodjelom.

( n − 1) s 2 ( n − 1) s 2
≤σ ≤
2

χ α2 / 2 χ (21−α / 2 )

1.8 Provjera hipoteza


Hipoteza: tvrdnja o jednoj ili više populacija.

Istraživačka hipoteza

Statistička hipoteza

Nul hipoteza (H0) Alternativna hipoteza (H1)


- nepromijenjeno stanje, nepostojeća razlika - promijenjeno stanje, postojeća
- hipoteza koju provjeravamo razlika
– obično je identična istraživačkoj
- sama se po sebi ne može
provjeravati, nego se koristi provjera
nul hipoteze.

17
Provjera hipoteza:
- na temelju informacija iz uzorka
- rezultira u jednoj od dvije odluke:
1. odluka da se H0 odbaci
2. odluka da se H0 ne odbaci, jer uzorak nije dao dovoljno dokaza da bi se H0 odbacila.
- H0 i H1, se uvijek postavljaju tako da isključuju jedna drugu
- kada odbacujemo H0, pretpostavljamo da je H1 točna.
- u zaključivanju koristimo zakone vjerojatnosti

Općenito, lakše je dokazati da je neka hipoteza lažna nego da je točna


- prihvaćanje H0 ne znači da je ona točna, nego da uzorak ne daje dovoljno dokaza da je H0
lažna.
- prihvaćamo H0 sve dok nije prikupljeno dovoljno dokaza koji je obaraju

Koraci u provjeri hipoteza:

1) Definiramo H0 i H1
2) Odredimo α (razinu značajnosti)
3) Izračunamo procjenu parametra
4) Odredimo statistiku za provjeru i njezinu raspodjelu kada vrijedi H0 i izračunamo njenu
vrijednost iz uzorka
5) Odredimo kritičnu vrijednost, kritično područje
6) Usporedimo izračunatu vrijednost statistike za provjeru sa kritičnim vrijednostima i donosimo
zaključak.

Prikaz razine značajnosti, kritične vrijednosti i kritičnog područja poznate raspodjele

razina
značajnosti = α

α/2 α/2

- 0 zα/2
kritično kritična kritično
područje vrijednost područje

1.8.1 P-vrijednost
Drugi način da se odluči o prihvaćanju ili odbijanju nul hipoteze H0, je da se utvrdi vjerojatnost da
izračunata vrijednost statistike za provjeru pripada distribuciji kada H0 vrijedi. Ta vjerojatnost
obično se označava kao P vrijednost i predstavlja opaženu razinu značajnosti. Mnogi kompjuterski
statistički programi daju P vrijednost i ostavljaju istraživaču da sam odluči o prihvaćanju ili
odbijanju H0. Može se reći da se H0 odbacuje uz vjerojatnost pogreške koja je jednaka P
vrijednosti. P vrijednost se može koristiti i kada je razina značajnosti unaprijed određena. Za
zadanu razinu značajnosti α, ako je P vrijednost manja od α, H0 se odbacuje uz α razinu
značajnosti.
18
1.8.2 Statistička i praktična značajnost
Statistička značajnost ne mora uvijek značiti da istraživanje ima i praktičnu značajnost. Na primjer,
pretpostavimo pokus s upotrebom aditiva u hrani koji je povećao dnevni prirast u tovu junadi za 20
g. Ovo povećanje je relativno malo i najvjerojatnije nema ni praktično ni ekonomsko značenje.
Međutim uz dovoljno velik uzorak i takvo povećanje se može pokazati statistički značajno.
Također, razlike između populacija mogu imati praktično značenje, ali zbog malih uzoraka razlika
se nje pokazala statistički značajna u uzorcima.
Potreban je oprez u upotrebi riječi značajan. Pojam statistička značajnost vrijedi samo za uzorak.
Tako se može reći: “postoji značajna razlika između prosjeka uzoraka”, što znači da njihova
izračunata razlika vodi do izračunate P vrijednosti dovoljno male da možemo odbaciti H0. Ali treba
izbjegavati izraze kao “prosjeci populacije su značajno različiti”, jer prosjeci populacije mogu biti
samo praktično različiti, dakle oni su različiti ili nisu različiti. Potpuno je pogrešan izraz:
“alternativna hipoteza H1 je da su prosjeci dviju populacije značajno različite”, jer alternativna
hipoteza znači samo razliku, a prihvaćanje alternativne hipoteze putem statističke provjere ne znači
automatski i praktičnu značajnost.

1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere


Kod zaključivanja na temelju uzorka moguća su dva pogrešna zaključka:
a) tip I greška = odbacivanje nul hipoteze H0, a da je zapravo H0 istinita
b) tip II greška = ne odbacivanje H0, a da je zapravo H0 lažna.

Istinita (prava) situacija

H0 točno H0 nije točno

Korektno prihvaćanje Tip II greška


statističke

Nije odbačena H0
provjere

P = 1–α P=β
Odluka

Tip I greška Korektno odbijanje


Odbačena H0 P=α P=1–β

1 – β = snaga provjere

Način kontrole (smanjenja vjerojatnosti) tip I i tip II greške:


- povećati uzorak
- smanjiti varijancu
- povećati utjecaj (engl. effect size)
snagu provjere treba razmatrati kod planiranja pokusa
- kada je uzorak već određen, ne može se istovremeno smanjiti i α i β
- obično se nastoji smanjiti tip I greška (α)
- postavi α= 0.05 i u većini slučajeva se ne obazire na β.

Vjerojatnost tip I greške (α, P-vrijednost):


- poznata ili se lako izračuna
- postavlja ju sam istraživač kao razinu značajnosti
Vjerojatnost tip II greške (β):
- često teško izračunati
- mora se pretpostaviti neka raspodjela ako je H1 točno i na temelju te raspodjele pokušati
odrediti β
19
Raspodjela ako
vrijedi H0

µ0 Raspodjela ako
vrijedi H1

Snaga provjere

µ1
Kritično područje

Slika 1-15: Vjerojatnost greške tipa I i II

Snaga provjere:
- veća snaga provjere (ili analogno mali β, jer snaga je jednaka 1– β) je važna u slučaju kada
ne odbacujemo nul hipotezu
- ako provjera ima malu snagu i nije odbačena nul hipoteza, zaključak je sumnjiv i velika je
šansa da radimo tip II grešku
- obično ne donosimo zaključke o jednakosti dva ili više parametara baš zbog često velike
vjerojatnosti β, odnosne male snage (1 – β)

Snaga provjere može se odrediti ako pretpostavimo nekoliko specifičnih alternativnih hipoteza sa
različitim parametrima

20
2 Jednostavna linearna regresija

2.1 Uvod
Mjerenja više varijabli
Pitanja:
- kakav utjecaj imaju varijable jedna na drugu
- da li postoji funkcijska veza između varijabli

Primjer:
- kako promjena vanjske temperature za jedan stupanj utječe na promjenu konverziju hrane
- kako promjena razine proteina u hrani utječe na promjenu dnevnog prirasta.

Regresija
- uključuje skup statističkih procedura kojima se izvode zaključci o vezi između varijabli
- proučava statističku vezu između varijabli na taj način da se jedna varijabla definira kao
zavisna varijabla, a ostale kao nezavisne varijable
- kako promjena nezavisnih varijabli utječe na promjenu zavisne varijable
zavisna varijabla = y (konverzija hrane)
nezavisne varijable = x (temperatura)

Statistički model:
y = β 0 + β1 x + ε

y = zavisna varijabla (slučajna)


x = nezavisna varijabla (fiksna)
β0 , β1 = regresijski koeficijenti (parametri)
ε = slučajna greška

ε = slučajna neprotumačena odstupanja


- zbog individualnih razlika između životinja ili različite okoline, greške kod mjerenja i sl.,

Statistički model: matematički model koji sadrži ε


Deterministički model: NE sadrži ε
- kada bi opseg prsa točno opisao težinu
y = β 0 + β1 x

Model regresije se odnosi na parove opažanja (x1,y1),(x2,y2),...,(xn,yn)


Prema modelu svaki yi se može prikazati:
yi = β0 + β1xi + εi i = 1,.....n

Odnosno,
y1 = β0 + β1x1 + ε1
y2 = β0 + β1x2 + ε2
............
yn = β0 + β1xn + εn

21
Očekivanje zavisne varijable y za zadani x je E(y|x) i predstavlja pravac.
E(yi| xi) = β0 + β1xi = pravac

y
E(y|x)

*
*
* *
*
* εi
*

* * (xi,yi )

Slika 2-1: Pravac linearne regresije. Zvjezdicama su prikazana prava mjerenja (xi,yi), Pravac E(y|x) je
očekivanje zavisne varijable, εi je odstupanje mjerenja od očekivanja

Objašnjenje parametara jednostavne regresije


β0 = odsječak na y osi, vrijednost (E(y| xi=0)
β1 = govori o nagibu pravca, to je promjena ∆E(y| x) koja odgovara promjeni vrijednosti varijable x
za jedinicu (∆x=1).

E(yi |xi) = β 0 + β1xi


y

β1 β1

β0

∆x=1 x

Slika 2-2: Objašnjenje parametara obične linearne regresije

y a) b) c)
x
y y

x x x

Slika 2-3: a) pozitivna regresija, β1 > 0; b) negativna regresija, β1 < 0,


c) regresija nije jasno utvrđena, β1 = 0

22
2.2 Procjena parametara β0 i β1
1) izabrati slučajni uzorak
2) izmjeriti y i x

Broj životinje 1 2 3 ... n


Opseg prsa (x) x1 x2 x3 ... xn
Težina (y) y1 y2 y3 ... yn

Cilj: pronaći krivulju koja će ‘najbolje‘ opisati dani skup podataka; pronaći procjenitelje parametara
β 0 i β1 .
Procjenitelji parametara: β̂ 0 i βˆ1 ili b0 i b1.
E(yi|xi) se procjenjuje sa:
yˆ i = b0 + b1 xi
= procijenjeni pravac (krivulja) regresije, procijenjeni model

Ostatak:
ei = yi − yˆ i
Svako opažanje u uzorku se može napisati:
yi = b0 + b1xi + ei i = 1,.....n

y y$
* *
y$ i *
*
* * ei = yi − yˆi
*
* * yi
*

x
Slika 2-4: Procijenjeni pravac jednostavne linearne regresije.

Metoda najmanjih kvadrata:


Pravilo:
- pronaći procjenitelje b0 i b1, da vrijedi:
∑i ( yi − yˆ i )2 = ∑i ei2 = min
(ostaci moraju biti što manji)

∑i ei2 =SS OST = Suma kvadrata ostatka

23
Procjenitelji b1 i b0 :
SS xy
b1 =
SS xx
b0 = y − b1 x

Gdje su:
SS xy = ∑ (x i i − x )( y i − y )
= suma produkata y i x
∑ (x − x)
2
SS xx = i i

= suma kvadrata od x
n = veličina uzorka

2.3 Ostatak i svojstva ostatka


Podsjetite se da je greška pravog modela (modela populacije):
εi = yi –E(yi|xi)
Ostatak je odstupanje vrijednosti zavisne varijable od regresijskog pravca procijenjenog iz uzorka:
ei = yi − yˆ i
Dakle, Ostatak = greška procijenjenog pravca (procijenjenog modela)
Suma kvadrata za ostatak:
∑ ( y − yˆ )
2
SSOST = i i i

Prosjek kvadrata ostatka (varijanca procijenjenog modela):


SS
MSOST = s 2 = OST
n−2
(n–2) = stupnjevi slobode.
MSOST = s2 je procjena σ2 = Var (ε).

Stupnjevi slobode:
n – (broj parametara koje treba procijeniti za dotičnu sumu kvadrata)

• Skraćeni način računanja:


( SS xy ) 2
SSOST = SS yy −
SS xx

2.4 Prosjeci i varijance procjenitelja


Svojstva procjenitelja:
E(b1) = β1
σ2
Var(b1 ) = σ b21 =
SS xx
Ako y normalan onda b1 normalan

Podsjetimo se: varijanca greške: Var(εi) = σ2.

24
Nepristrani procjenitelj varijance σ2 je:
1 SSOST
s2 =
n−2
∑(y
i i − yˆ i ) =
2

n−2
= MSOST
MSOST =prosjek kvadrata za ostatak
Skraćeni način računanja sume kvadrata za ostatak:
( SS xy ) 2
SSOST = SS yy −
SS xx

Standardna greška regresijskog modela:


SSOST
s = s2 = n −2

Var(b1) možemo procijeniti sa:


s2
sb21 =
SS xx
Standardna greška procjenitelja b1 je:
s2
sb =
1
SS xx

2.5 Studentova t-provjera i interval pouzdanosti procjene parametara


Provjera hipoteza o nagibu pravca regresije:
H0: β1 = 0
H1: β1 ≠ 0
H0: regresije nema, nagib regresije je nula, pravac regresije je horizontalan.
H1: regresija postoji, nagib nije horizontalan

Statistika za provjeru:
b −0
t= 1
sb1
Uz H0, statistika t ima t raspodjelu sa (n–2) stupnjeva slobode

Odbacujemo H0 ako je izračunata statistika |t| “velika”. Za α razinu značajnosti odbacujemo H0 ako
|t| ≥ tα/2,(n–2).

β1 = 0 b1

-tα/2 0 tα/2 t
Slika 2-5: Teoretska distribucija procjenitelja b1 i skala odgovarajuće t statistike

25
2.6 Interval pouzdanosti za β1

Možemo pisati da je za 100(1–α)% interval pouzdanosti


b1 ± tα 2,n − 2 sb1
Za 95% interval pouzdanosti (IP)
b1 ± t0.025, n − 2 sb1

tα/2,n–2 = kritična vrijednost


sb1 = s 2 SS xx = standardna greška procjenitelja b1.

2.7 Intervali pouzdanosti zavisne varijable


Procjena prosjeka populacije za danu vrijednost x0
E[y|x0] = β0 + β1x0.

Procjenitelj: yˆ 0 = b0 + b1 x0 .

2 1 (xi − x )2 
Var ( yˆ 0 ) = σ  + 
n SS xx 
Standardna greška:
 1 ( x − x )2 
s yˆ 0 = s 2  + i 
n SS xx 

Interval pouzdanosti:
yˆ 0 ± s yˆ 0 t0.025, n − 2

Predviđanje buduće vrijednosti varijable y na temelju dane vrijednosti x0.


y|x0 = β0 + β1x0 + ε0.

Procjenitelj:
yˆ 0, NOVI = b0 + b1 x0 .

Varijanca procjenitelja:
 1 (xi − x )2 
Var ( y0, NOVI ) = σ 1 + +
ˆ 2

 n SS xx 
Standardna greška predviđenih novih vrijednosti zavisne varijable za danu vrijednost x0 je:
 1 (xi − x )2 
s yˆ0, NOVI = s 1 + +
2
.
 n SS xx 

26
Interval pouzdanosti za nova opažanja uz razinu značajnosti α = 0.05 je:
yˆ 0, NOVI ± s yˆ i , NOVI t0.025,n − 2

Intervali pouzdanosti za više x vrijednosti:

Prosjek populacije:
yˆ i ± s yˆ i pFα , p , n − p

Nova opažanja:
yˆ i ± s yˆ i , NOVI pFα , p ,n − p
Gdje su:
F = granična vrijednost F raspodjele za p i (n–p) stupnjeva slobode
p = broj parametara
n = broj opažanja
α = vjerojatnost da je barem jedan interval nekorektan.

750

700
Težina (kg)

650

600

550
212 214 216 218 220 222
Opseg trupa (cm)

Slika -6: Površine pouzdanosti za prosjeke populacije za dane vrijednosti x ( ___ )i nova opažanja (......)

27
2.8 Raščlanjenje ukupne varijabilnosti
Regresijskim modelom nastoji se objasniti što veći dio varijabilnosti zavisne varijable.

y * raspodjela
* ŷ y i oko yˆ
*
(B)
* *
raspodjela
y *
*
*

y i oko y *

(A) *
*

Slika 2-7: Raspodjela varijabilnosti oko prosjeka i procijenjenog pravca regresije.


(B) mjeren sa sumom kvadrata za ostatak:
∑ ( y − yˆ )
2
SSOST = i i i

(A) mjeren sa ukupnom sumom kvadrata:


∑ (y − y )
2
SSUKUP = i i i

Tri izvora varijabilnosti:

1.Varijabilnost opisana modelom


- protumačena varijabilnost, mjeri se sumom kvadrata za regresiju (SSREG).
2. Ukupna varijabilnost zavisne varijable
- varijabilnost oko y , mjeri se ukupnom sumom kvadrata. (SSUKUP)
3. Neprotumačena varijabilnost
- varijabilnost oko ŷ , mjeri se sumom kvadrata za ostatak (SSOST).

y
* *
* * *
* *
* *
* *
*

28
Jak linearan trend: SSOST << SSUKUP

y
* *
* *
* * *
* *
* *
*

x
Slab linearan trend: SSOST ≈ SSUKUP

2.8.1 Veza između suma kvadrata


Vrijedi
( yi − y ) = ( yi − yˆ i ) + ( yˆ i − y ) )
yi y$
y *
* *
y i − y$
yi − y *
*
* y$ − y
y
*
*
*

Slika 2-8: Prikaz mjerenja y kao odstupanja od prosjeka i procijenjenog pravca

Može se pokazati da vrijedi:


∑i ( yi − y ) = ∑i ( yˆ i − y ) + ∑i ( yi − yˆ i )
2 2 2

SSUKUP = SSREG + SSOST

Kratki način računanja suna kvadrata:


1) SSUKUP = SSyy
( SS xy ) 2
2) SS REG=
SS xx
( SS xy ) 2
3) SSOST = SS yy −
SS xx

Na slična način kao što se raščlanjuju sume kvadrata, tako se raščlanjuju i stupnjevi slobode:

(n–1) = 1 + (n–2) (stupnjevi slobode)


ukupno = regresija + ostatak

29
Ukupani stupnjevi slobode:
- gubi se 1 stupanj slobode u procijeni aritmetičke srednje vrijednosti
Stupnjevi slobode ostatka:
- gube se 2 stupnja slobode u procijeni β0 i β1.
Stupanj slobode za regresiju:
- treba 1 stupanj slobode za procjenu β1.

Dijeljenjem suma kvadrata sa odgovarajućim stupnjevima slobode dobijemo prosjeke kvadrata:


SS REG
Prosjek kvadrata za regresiju: MS REG =
1
SSOST
Prosjek kvadrata za ostatak: MSOST =
n−2
Ovi izračunati prosjeci kvadrata koriste se u provjeri hipoteza.

2.9 Provjera hipoteza - F- provjera


Hipoteze:
H0: β1 = 0 nema regresije
H1: β1 ≠ 0 regresija postoji

Statistika za provjeru:
MS REG
F=
MS OST

Ovdje je:
SS REG
MS REG = = prosjek kvadrata za regresiju
1
SSOST
MSOST = = prosjek kvadrata ostatka
n−2

F statistika ima F-raspodjelu sa stupnjevima slobode 1 i (n–2) ukoliko vrijedi H0.

Za α razinu značajnosti odbacujemo H0 ako je izračunata vrijednost F ekstremnija od kritične


vrijednosti F raspodjele (F > Fα,1,n–2)

f (F 1, n-2 )

F 1,n -2
F α,1,n -2

Slika 2.9 F raspodjela i kritična vrijednost za stupnjeve slobode 1 i (n – 2). Izraz Fα,1,n–2 predstavlja
kritičnu vrijednost F raspodjele

30
Korisno je izračune i provjeru upisati u ANOVA tablicu (tablicu analize varijance)

ANOVA tablica
Izvor SS df MS F
Regresija SSREG 1 MSREG F = MSREG / MSOST
Ostatak SSOST n–2 MSOST
Ukupno SSUKUP n–1

Analiza varijance je podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih
izvora.

2.10 Koeficijent determinacije (R2)


- Proporcija varijabilnosti protumačenog modelom u odnosu na ukupnu varijabilnost:
SS REG SS OST
R2 = = 1−
SS UKUP SS UKUP

2
Poprima vrijednosti od 0 do 1: 0 ≤ R ≤ 1
Mjera valjanosti modela
“Dobar” model SS REG ≈ SSUKUP
“Loš” model SS OST ≈ SSUKUP

“Dobar model” znači da je


R2 ≈1

31
2.11 SAS primjer za jednostavnu linearnu regresiju

Primjer: Procijenite pravac linearne regresije težine na opseg grudi krava prema slijedećem uzorku:

Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg prsa (x): 214 215 216 217 219 221

SAS program:

DATA krave;
INPUT tezina opseg;
DATALINES;
641 214
633 215
651 216
666 217
688 219
680 221
;
PROC REG;
MODEL tezina = opseg / ;
RUN;
QUIT;
*ili;

PROC GLM;
MODEL tezina =opseg / ;
RUN;
QUIT;

Objašnjenje:Koristi se procedura GLM ili procedura REG. Naredba MODEL tezina = opseg znači
da je zavisna varijabla tezina, a nezavisna opseg.

SAS ispis:
Analiza varijance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 1927.52941 1927.52941 16.642 0.0151
Error 4 463.30392 115.82598
C Total 5 2390.83333

Root MSE 10.76225 R-square 0.8062


Dep Mean 659.83333 Adj R-sq 0.7578
C.V. 1.63106

Parameter Estimates
Parameter Standardna T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -974.049020 400.54323178 -2.432 0.0718
OPSEG 1 7.529412 1.84571029 4.079 0.0151

32
Objašnjenje: Prvo je dana ANOVA tablica: izvor (Source), stupnjevi slobode (DF), sume kvadrata
(Sum of Squares), prosjek kvadrata (Mean Square), F vrijednost (F value) i P vrijednost (Prob>F).
Izvori varijabilnosti su Regresija (Model), Ostatak (Error) i Ukupno (C Total). Vidljivo je da je
F = 16.642 sa P vrijednosti = 0.0151, što znači da je koeficijent regresije u uzorku značajno različit
od nule. Ispod ANOVA tablice dane su standardna greška regresijskog modela (Root MSE) =
10.76225 i koeficijent determinacije (R-square) = 0.8062. Ispod podnaslova Parameter Estimates,
možemo vidjeti procijene parametara sa standardnim greškama i t provjerom da su procjenitelji
značajno različiti od nule. Ovdje je b0 (INTERCEP) = 974.046020 sa standardnom greškom
(Standard error) = 400.54323178, a b1 (opseg) = 7.529412 sa standardnom greškom 1.84571029.
Izračunata t statistika je 4.079, s P vrijednosti (Prob > |T|) = 0.0151, što pokazuje da je b1 značajno
različit od nule.

700
690
680
Težina (kg)

670
660
650
640
630
214 216 218 220 222

Opseg prsa (cm)

Slika 2-10: Regresija težine krava na opseg prsa

33
3 Koeficijent korelacije

Korelacija:
- mjera jakosti linearne veze između dvije varijable
- relativna mjera
- poprima vrijednosti između -1 i 1
- x i y su slučajne varijable sa zajedničkom bivarijatnom raspodjelom
-Varijable zajednički variraju
- Ne mora nužno postojati uzročno-posljedična veza

(Pozor: Regresija: uzročno-posljedična veza x i y, x = nezavisna, y = zavisna varijabla)

Koeficijent korelacije:
σ xy
ρ=
σ x2σ 2y
σ2y = Var(y)
σ2x =Var(x)
σxy = Cov(x, y) = kovarijanca između x i y
x i y su slučajne normalne varijable.

Kovarijanca:
- zajedničko variranje dvije slučajne varijable
- apsolutna mjera veze
- ako su varijable nezavisne => Cov(x, y) = 0
Korelacija je kovarijanca standardiziranih varijabli x i y

- Korealcija ρ može biti pozitivna ili negativna.


Korelacija ρ = 1 ili ρ = –1 znači idealnu linearnu vezu
ρ = 0 znači da veza ne postoji.

34
y
a) y
b)

x x

x x

x x

y
c) x

y
d) x

x x

x x

Slika 3-1 a) pozitivna korelacija, b) negativna korelacija, c) korelacija ne postoji d) veza između
varijabli postoji ali nije linearna

3.1 Procjena koeficijenta korelacije


Procjenitelj koeficijenta korelacije je koeficijent korelacije uzorka:
SS xy
r=
SS xx SS yy
SSxx = suma kvadrata od x
∑ (x − x)
2
SS xx = i i

SSyy = suma kvadrata od y


∑ (y − y)
2
SS yy = i i

SSxy = suma produkata y i x


SS xy = ∑ (x i i − x )( y i − y )
n = veličina uzorka

35
4 Vektori i matrice

Matrica je skup brojeva koji su po nekom kriteriju svrstani u redove i kolone:


 a 11 a 12  1 3
A = a 21 a 22  
= 1 1
   
a 31 a 32  3x 2 2 − 1 3x 2
 b11 b12  2 1
B =  b 21 b 22  =  1 3
   
 b 31 b 32  3x 2  1 2 3x 2

Često pišemo: A = {aij}3x2

Vektor:
jedna kolona ili jedan red
1
b= 
 2  2 x1

4.1 Tipovi i svojstva matrica


Kvadratna matrica:
- isti broj kolona i redova.
Simetrična matrica:
- kvadratna matrica
- vrijedi aij = aji.

2 1
C= 
1 2 2 x 2

Dijagonalna matrica
- kvadratna matrica takva da je aij = 0 za svaki i ≠ j
2 0
D= 
0 2 2 x 2

Jedinična matrica:
- dijagonalna matrica
aii = 1
1 0 0 
1 0   
I2 =   , I 3 =  0 1 0
 0 1  0 0 1

Nul matrica je matrica čiji su svi članovi jednaki nuli. Nul vektor je vektor čiji su članovi jednaki
nuli.

36
 0
 0 0  
0=  , 0 =  0
 0 0  0

Matrica čiji su svi članovi jednaki 1, obično se označava sa J. Vektor čiju su svi članovi jednaki 1
obično se označava sa 1.
1
1 1
J=  , 1 = 1

1 1
1

Transponirana matrica:
- matrica kojoj su kolone zamijenjene s redovima
1 1 2 
A' =  
3 1 − 1

4.1.1 Operacije s matricama i vektorima:

Zbrajanje matrica
 a11 + b11 a12 + b12 
A + B = a 21 + b 21 a 22 + b 22  =
 
a 31 + b 31 a 33 + b33 

1 + 2 3 + 1  3 4

A + B = 1+1 1 + 3 = 2 4
   
2 + 1 − 1 + 2  3 1 3x 2

Množenje matrica s brojem


2 6

2A = 2 2
 
4 − 2 3x 2

Množenje matrice s matricom


- broj kolona prve matrice mora biti jednak broju redova druge matrice,
- broj elemenata u redu prve matrice mora biti jednak broju redova druge matrice

Općenito:
A = {aik}ima dimenzije r x c
B = {bkj}ima dimenziju c x s
produkt AB= {cij} ima dimenziju r x s:


c
cij = a b
k =1 ik kj

Primjer: Izračunaj AC ako je:

37
 a 11 a 12  1 3
   c c12  2 1 
A = a 21 a 22 = 1 1 C =  11
    i
c 21 c 22  2 x 2 1 2 2 x 2
a 31 a 32  3x 2 2 − 1 3x 2

 a 11 * c11 + a 12 * c 21 a 11 * c 21 + a 12 * c 22 
AC = a 21 * c11 + a 22 * c 21 a 21 * c 21 + a 22 * c 22 
 
a 31 * c11 + a 32 * c 21 a 31 * c 21 + a 32 * c 22 
1 * 2 + 3 * 1 1 * 1 + 3 * 2  5 7 
AC = 1 * 2 + 1 * 1 1 * 1 + 1 * 2  = 3 3
2 * 2 − 1 * 1 2 * 1 − 1 * 2 3 0
3x2

Primjer 2:
1 
b =   . Izračunaj Ab
 2  2 x1

1 *1 + 3 * 2  7 

Ab = 1 *1 + 1 * 2  =  3
   
2 * 2 − 1 *1 3x1 0 3x1

Kvadratni oblik:
- umnožak transponiranog vektora i samog vektora
- predstavlja sumu kvadrata elemenata vektora.

Neka je vektor
 y1 
y 
y =  2
 ... 
 
 y n  nx1
Kvadratni oblik je:
 y1 
y 
y' y = [y1 y2 .. y n ] 2  = ∑i y i2 = suma kvadriranih članova vektora
 ... 
 
y n 

Inverzna matrica neke matrice C je matrica C-1 takva da je C-1C = I i CC-1 = I

Sustav linearnih jednadžbi može prikazati matrično.


Primjer: Sustav jednadžbi s dvije nepoznanice
2a1 + a2 = 5
a1 – a2 = 1

38
a  2 1 5
a =  1 X =   y= 
a 2   1 − 1 1

Xa = y | X–1
X–1Xa = X–1y
a = X–1y

−1
 a1  2 1 5 1 / 3 1 / 3 5 2
a  =  1 − 1 1 = 1 / 3 − 2 / 3 1 = 1 
 2         

Normalne jednadžbe definirane su sa:


X’Xa = X’y
(X’X)–1(X’X)a = (X’X)–1X’y
Normalne jednadžbe pogodne su za rješavanje sustava jednadžbi kada je broj jednadžbi veći nego
broj nepoznanica

39
5 Jednostavna regresija u matričnom prikazu

skalarni model regresije:


yi = β0 + β1xi + εi i = 1,.....n

Definirajmo vektore i matrice

ε1 
 y1   1 x1  ε 
y  1 x 
y =  2 X= 2 β 
β =  0
ε =  2
 ...  ... ...   ... 
     β1   
 yn  1 xn  ε n 

y = vektor opažanja zavisne varijable


X = matrica opažanja nezavisnih varijabli
β = vektor parametara
ε = vektor greški

y = Xβ + ε

Prosjek od y :

 E ( y1 )   β 0 + β1 x1 
 E ( y )  β + β x 
E (y ) =  2 
= 0 1 2
= Xβ
 ...   ... 
   
 E ( y n )  β 0 + β1 x n 

Varijanca od y je:

Var(y) = σ2I

Procijenjeni model :
yˆ = Xb

e = y − yˆ = vektor ostataka
b = vektor procjenitelja
 e1 
e 
b 
b =  0 i e =  
2
b
 1  ... 
 
e n 
Normalne jednadžbe:
(X’X)b = X’y

40
Rješenje jednadžbe za b je:
b = (X’X)–1X’y

 n
X' X = 
∑ x  i i


 i xi ∑ x  i i
2


X' y = 
∑ y  i i

 ∑ x y 
i i i

1 x2 x 
 + − 
n SS x SS xx 
( X' X ) = 
−1

− x 1 
 SS xx SS xx 

Očekivanje i varijanca su:


E(b) = β
 Var (b0 ) Cov (b0 , b1 )
Var( b) = σ 2 ( X' X ) −1 = 
Cov (b0 , b1 ) Var (b1 ) 
Ukoliko koristimo s2 tada je varijanca vektora b jednaka:

s2(b) = s2(X'X)–1

Vektor procijenjenih vrijednosti zavisne varijable je:


yˆ = Xb = X (X ' X ) X ' y
−1

Ostatak je definiran sa:


e = y - yˆ

Sume kvadrata:

SS REG = ( yˆ − y )' ( yˆ − y ) = ∑i (ŷ i − y )


2

SSOST = ( y − yˆ )' ( y − yˆ ) = ∑i (y i − ŷ )
2

SS UKUP = ( y − y )' ( y − y ) = ∑i (y i − y )
2

Primjer:Napišite procijenjeni model regresije težine na opseg grudi krava koristeći matrice i
vektore. Mjerenja 6 krava dana su u slijedećoj tablici:

Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg prsa (x): 214 215 216 217 219 221

41
Vektor y i matrica X su:

 641 1 214
633 1 215
   
 651 1 216
y=  i X= 
666 1 217
688 1 219
   
680 1 221

Prva kolona matrice X sadrži broj 1 jer procjenjujemo odsječak na osi y, b0. Kada uvrstimo X i y,
model je:
 641 1 214   e1   b0 + b1 ⋅ 214 + e1 
633 1 215  e   b + b ⋅ 215 + e 
     2  0 1 2

 651 1 216  b0   e3   b0 + b1 ⋅ 216 + e3 


 =  +  = 
666 1 217   b1  e4  b0 + b1 ⋅ 217 + e4 
688 1 219   e5   b0 + b1 ⋅ 219 + e5 
       
680 1 2211  e6   b0 + b1 ⋅ 221 + e6 

42
6 Multipla regresija

Multipla regresija:
- regresija koja ima dvije ili više nezavisnih varijabli
- regresija koja ima tri ili više parametara
Ciljevi:
1. Pronaći model (funkciju) koja najbolje opisuje zavisnost zavisne varijable o nezavisnim
varijablama. Odnosno odrediti parametre.
2. Predviđanje vrijednosti zavisne varijable na temelju novih mjerenja nezavisnih varijabli
3. Proučiti važnost nezavisnih varijabli, odnosno procijeniti da li su sve ili samo neke nezavisne
varijable važne u modelu. To je izgradnja optimalnog modela.

Podaci:

y x1 x2 ... xp
y1 x11 x21 ... xp1
y2 x12 x22 ... xp2
. . . .
. . . .
yn x1n x2n ... xpn

Model:
yi = β0 + β1x1i + β2x2i + ... + βp–1x(p–1)i + εi i = 1,...,n

yi = opažanja zavisne varijable


x1i ,x2i ,......,x(p–1)i = opažanja nezavisnih varijabli
β0 , β1 , β2 ,......, βp–1 = regresijski koeficijenti (parametri)
εi = ‘greška’, model nije egzaktan, slučajna odstupanja, neprotumačena, zbog jedinke ili mjerenja

6.1 Dvije nezavisne varijable


Model:
yi = β0 + β1x1i + β2x2i + εi i = 1,...,n

yi = opažanja zavisne varijable y


x1i i x2i = opažanja nezavisnih varijabli x1 i x2
β0 , β1 , β2 = regresijski koeficijenti (parametri)
εi = greška modela

Model procijene (procijenjena krivulja) je:


yˆ i = b0 + b1 x1i + b2 x2i i = 1,...,n

43
Ostatak:
e i = y i − ŷ i = [y i - (b 0 + b1x1i + b 2 x 2i )]

b0 , b1 i b2 = procjenitelji parametara

Model matrično:
y = Xβ + ε

y = vektor zavisne varijable


β = vektor parametara
X = matrica konstanti
ε = vektor greški sa prosjekom E(ε) = 0 i varijancom Var(ε) = σ2I

 y1  ε1 
y   1 x11 x 21  β0  ε 
β =  β1 
1 x x 22 
y =  2 X=  ε =  2
 
12
 ...  ... ... ...   ... 
     β 2   
 yn   1 x1n x2n  ε n 

Procijenjeni model je:


yˆ = Xb

 e1 
b0  e 
b =  b1  e =  2
   ... 
b2   
en 
Procjena parametara: Metoda najmanjih kvadrata:

uvjet da Σ
2
i e i = e’e = min.
e'e = suma kvadrata ostataka.
e’e parcijalno derivira po b i izjednači s nulom.
Normalne jednadžbe:
X’Xb = X’y

b = (X’X)–1X’y
 1 1 ... 1  
 1 x 11 x 21   n ∑x 1i ∑x 2i

x 22  =  
i i

X' X =  x 11 x 12 ... x 1n  
1 x 12
... ... ... 
 ∑x i 1i ∑x i
2
1i ∑x x
i 1i 2 i 
 2 
 x 12 x 22 ... x 2 n     ∑x i 2i ∑x x
i 1i 2i ∑x i 2i 
 1 x 1n x 2n 
y 
 1 1 ... 1   1   ∑iy i 
y  
X' y =  x 11 x 12 ... x 1n   2  =  ∑ix 1i y i 
 ... 
 x 21 x 22 ... x 2 n    ∑ix 2i y i 
y n 

Primjer

44
Ostatak:
e = y − yˆ
Suma kvadrata za ostatak je:
SSOST = e'e
Varijanca σ2 procjenjuje se sa
SS
s 2 = OST = MSOST
n− p
n–p = stupnjevi slobode.
Općenito: stupnjevi slobode = n – (broj parametara u modelu).
Drugi korijen iz procjene varijance:
s = s2
standardna greška regresijskog modela.

Svojstva procjenitelja:
E(b) = β
Var(b) = σ2(X’X)–1
Ukoliko se koristi varijanca procijenjena iz uzorka tada je varijanca:
s2(b) = s2(X’X)–1

Provjera hipoteze H0: βi = 0


Statistika za provjeru:
b
t= i
s(bi )

s(bi ) = s 2 (bi )

Kritična vrijednost t raspodjele određuje se prema razini značajnosti α i stupnju slobode


n –p, gdje je p = broj parametara.
p = 3 pa su stupnjevi slobode jednak n–3.

6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza


Sume kvadrata:

∑ ( yˆ − y )
2
SS REG = ( yˆ − y )' ( yˆ − y ) = i i

= ( y − yˆ )' ( y − yˆ ) = ∑ ( y − yˆ )
2
SSOST i i

= ( y − y )' ( y − y ) = ∑ ( y − y )
2
SSUKUP i i

SSUKUP = SSREG + SSOST


Stupnjevi slobode:
n–1 = (p–1) + (n–p)

n = broj životinja i p je broj parametara

Hipoteze:

45
H0: β2 = ... = βp = 0
H1 : barem jedan βi ≠ 0, i = 1 do p–1

Ako nul hipoteza vrijedi tada kvocijent


MS REG
F=
MSOST
ima F-raspodjelu sa (p–1) i (n–p) stupnjeva slobode, gdje je p broj parametara u modelu.
Za α razinu značajnosti odbacujemo Ho ako
Fα,p–1,n–3 ( F > Fα,p–1,n–3).
ANOVA tablica
Izvor SS df MS = SS/df F
Regresija SSREG p–1 MSREG F=MSREG/SSOST
Ostatak SSOST n–p MSOST
Ukupno SSUKUP n–1

Koeficijent multiple determinacije je:


SS REG SS OST
R2 = = 1−
SSUKUP SSUKUP
0 ≤ R2 ≤ 1

6.2 Parcijalne i stupnjevite ekstra sume kvadrata


SSREG se može raščlaniti na sume kvadrate za odgovarajuće parametre u modelu
Provjerava se važnost pojedinih parametara
Primjer: Puni model (sve varijable uključene u model).
y = β0 + β1x1 + β2x2 + β3x3 + ε

Reducirani modeli (podskupovi punog modela):


y = β0 + β1x1 + β2x2 + ε
y = β0 + β1x1 + β3x3 + ε
y = β0 + β2x2 + β3x3 + ε
y = β0 + β1x1 + ε
y = β0 + β2x2 + ε
y = β0 + β3x3 + ε
y = β0 + ε

Broj parametara ↓ ⇒ SSREG ↓ SSOST ↑


Broj parametara ↑ ⇒ SSREG ↑ SSOST ↓

Provjera opravdanosti parametara β3 i β4 u punom modelu je:


Općenito:
( SSOST _ REDUCIRANI − SSOST _ PUNI ) ( pPUNI − pREDUCIRANI ).
F=
SSOST _ PUNI ( n − pPUNI )

46
Ovdje je:
pREDUCIRANI = broj parametara u reduciranom modelu.
pPUNI = broj parametara u punom modelu
SSOST_PUNI / (n–pPUNI) = MSOST_PUNI = prosjek kvadrata ostatka punog modela

6.3 SAS primjer za multiplu regresiju

Primjer: Procijenite regresiju težine na opseg grudi i visina do grebena 6 mladih bikova. Podaci su
slijedeći:

Bik: 1 2 3 4 5 6 7
Težina, kg (y) 480 450 480 500 520 510 500
Opseg, cm (x1): 175 177 178 175 186 183 185
Visina, cm (x2): 128 122 124 128 131 130 124

SAS program:

DATA bikovi;
INPUT tezina opseg visina;
DATALINES;
480 175 128
450 177 122
480 178 124
500 175 128
520 186 131
510 183 130
500 185 124
;
PROC GLM;
MODEL tezina=opseg visina ;
RUN;
QUIT;

SAS ispis:

Dependent Variable: tezina

Sum of
Source DF Squares Mean Square F Value Pr > F
Model 2 2727.655201 1363.827601 9.78 0.0288
Error 4 558.059085 139.514771
Corrected Total 6 3285.714286

R-Square Coeff Var Root MSE tezina Mean


0.830156 2.403531 11.81164 491.4286

Source DF Type I SS Mean Square F Value Pr > F


opseg 1 1400.983103 1400.983103 10.04 0.0339
visina 1 1326.672098 1326.672098 9.51 0.0368

Source DF Type III SS Mean Square F Value Pr > F


opseg 1 616.426512 616.426512 4.42 0.1034

47
visina 1 1326.672098 1326.672098 9.51 0.0368

Standard
Parameter Estimate Error t Value Pr > |t|
Intercept -495.0140313 225.8696150 -2.19 0.0935
opseg 2.2572580 1.0738674 2.10 0.1034
visina 4.5808460 1.4855045 3.08 0.0368

6.4 Krivolinijska regresija drugog stupnja


Model:
yi = β0 + β1xi + β2x2i + εi i = 1,...,n

yi = opažanja zavisne varijable y


xi = opažanja nezavisne varijable x
β0, β1, β2 = regresijski koeficijenti (parametri)
εi = greška modela,

kvadratna regresija = multipla regresija sa dvije nezavisne varijable x i x2,

Model procijene (parabola):


yˆ i = b0 + b1 x1i + b2 x2i + ei i = 1,...,n

Matrično model se piše:


y = Xβ + ε
 y1 
ε1 
 1 x1 x12  β0  ε 
y   
y =  2 X=
1 x2 x 22  β =  β1  ε =  2
 ...  ... ... ... 
   ... 
     β 3   
 yn   1 x n x n2  ε n 

Model procijene:
yˆ = Xb
Ostatak:
e = y − yˆ
 e1 
b0  e 
b =  b1  e =  2
 ... 
b2   
en 
Vektor procjena parametara izračuna se iz izraza:
b = (X’X)–1X’y

Provjera hipoteza:

H0: β1 = ... = βp–1 = 0


H1: barem jedan βi ≠ 0, i = 1 do (p–1)

48
Ako nul hipoteza vrijedi tada kvocijent
MS REG
F=
MS OST
ima F-raspodjelu sa 2 i (n–3) stupnjeva slobode.

Primarni cilj analize:


- da li je β2 potreban u modelu
- odnosno da li je model kvadratne regresije valjan.
Hipoteza:
H0: β2 = 0
t- provjera:
b2
t=
s (b2 )
Procijenjene varijance i kovarijance za b0, b1 i b2 su;:
s2(b) = s2(X’X)–1

6.4.1 SAS primjer za kvadratnu regresiju

SAS program za primjer s rastom purana je slijedeći.

SAS program:

DATA purani;
INPUT tezina dan @@;
DATALINES;
44 1 66 7 100 14 150 21 265 28 370 35 455 42 605 49 770 56
;
PROC GLM;
MODEL tezina=dan dan*dan/ ;
RUN;
QUIT;

Objašnjenje:Koristimo proceduru GLM. Naredba MODEL tezina = dan dan*dan znači da je zavisna
varijabla tezina, a nezavisne dan kao linearna komponenta i dan*dan kao kvadratna komponenta.

SAS ispis:

Dependent Variable: TEZINA


Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 523870.39532 261935.19766 1246.82 0.0001
Error 6 1260.49357 210.08226
Corrected Total 8 525130.88889

R-Square C.V. Root MSE TEZINA Mean


0.997600 4.617626 14.494215 313.88889

Source DF Type I SS Mean Square F Value Pr > F


DAN 1 497569.66165 497569.66165 2368.45 0.0001
DAN*DAN 1 26300.73366 26300.73366 125.19 0.0001

49
Source DF Type III SS Mean Square F Value Pr > F
DAN 1 859.390183 859.390183 4.09 0.0896
DAN*DAN 1 26300.733664 26300.733664 125.19 0.0001

T for H0: Pr > |T| Std Error of


Parameter Estimate Parameter=0 Estimate
INTERCEPT 38.85551791 3.15 0.0197 12.31629594
DAN 2.07249024 2.02 0.0896 1.02468881
DAN*DAN 0.19515458 11.19 0.0001 0.01744173

800
700
600
Težina (g)

500
400
300
200
100
0
0 20 40 60
Dob u danim a

Slika 6-1: Mjerene (•) i procijenjene (-) vrijednosti težine zago

6.5 Moguće poteškoće kod upotrebe regresije


Mogući problemi kod regresije mogu se pojaviti zbog
1) Neka opažanja su ‘loša’. Pod ‘lošim’ podacima misli se na opažanja koja su neuobičajeno
ekstremna.
2) greške modela nemaju konstantnu varijancu
3) greške modela nisu nezavisne
4) greške modela nisu normalno distribuirane
5) Nelinarnost
6) Jedna ili više važnih nezavisnih varijabli nisu uključeni u model
7) Model sadrži previše nezavisnih varijabli
8) Multikolinearnost. Multikolinearnost je pojava kad postoji korelacija između nezavisnih
varijabli.

Mogu dovesti do:


- upotrebe krivog modela,
- lošeg procjene regresije,
- krivog zaključka
- nepreciznosti procjene parametara zbog velike varijance.

50
6.5.1 Analiza ostataka i narušenost pretpostavki modela

ei = yi − yˆ i

*
* * * *
0 *
* *
* * *

x ( y$ )

Model OK
Raspršenost ostatka slučajna
Varijanca konstantna
Nema ekstremnih podataka.

e
*
* *
* *
* *
0 *
* *
* *

x ( y$ )
Nelinearnost. ????Potreban xi2 ili xi3 u modelu. ???? logaritamska, eksponencijalna funkcija

* ** *
* *
0 *
* * *
*

x ( y$ )

Zavisnost ostataka (autokorelacija)

51
e *
* *
*
* * * *
0 *
* * * *
*
*
*
x ( y$ )

Varijanca nije homogena. Potrebne su transformacije ili x ili y varijable.


Moguća je i upotreba različite strukture varijance koja će definirati nehomogenost.

Normalnost ostataka. Nenormalnost dovodi u pitanje valjanost


F ili t provjere.
??? poopćeni linearni model (engl. 'generalized linear models')

6.5.2 Loša opažanja


‘loša’ = neuobičajeno ekstremna opažanja

2
y *
1
* 3 y
* 5
*
* * *
*
* * * *
* 4 * *
* * * * *
*
*
* * *

xi xi
Slika -2 Prikaz ekstremnih vrijednosti u analizi regresiji Ekstremne vrijednosti su zaokružene i označene
brojevima: a) ekstremi u odnosu na x su: 3, 4 i (5), b) ekstremi u odnosu na y su: 1, 2 i 4, c) ekstremi koji
imaju utjecaja na procjenu regresije su: 2, 4 i (5)

6.5.3 Multikolinearnost
Postoji značajna i visoka korelacija između nezavisnih varijabli
Nezavisne varijable su skoro linearno zavisne
Varijanca procjenitelja velika
52
Problem multiokolinearnosti može se riješiti:
a) ispuštanjem problematičnih opažanja
b) ako se iz nekoliko koreliranih nezavisnih varijabli definira jedna
c) ispuštanjem nepotrebnim varijabli iz modela
d) korištenjem drugih statističkim metoda ('Ridge' regresija ili 'Principal Components')

6.6 Izgradnja modela i kriteriji za izbor modela


a) Koeficijent determinacije(R2)
Dodavanje nove varijable ==> povećanje R2
? dodavanje kojih varijabli značajno povećava R2

b) Prosjek kvadrata ostatka (MSOST)


Dodavanje nove varijable obično se smanjuje MSOST.
!!!! opasnost da se izabere preveliki model.

c) Parcijalne F-provjere
Značajnost pojedine varijable u modelu.
??? optimalan model. Kolinearnost (varijable gledane posebno mogu izgledati važne, a ukupni
model može biti vrlo neprecizan)

c ) Cp kriterij ('Conceptual Predictive Criterion')


- Uspoređuje se model kandidat sa 'pravim' modelom

e) AIC (Akaike Information Criteria)

53
7 Jednostruka analiza varijance

Cilj:
- da li postoji razlika prosjeka više populacija
- provjera razlika aritmetičkih prosjeka uzoraka izabranih iz više populacija.

Zavisna varijabla:
- mjerenja ili opažanja
Nezavisna varijabla:
- grupa (ili način klasificiranja), često kažemo i tretmani (grupe predstavljaju populacije)

- kvalitativna, ili kategorička varijabla


- faktor

Da li postoji utjecaj grupa na opažanja???

Primjer1 :
Utjecaj različite hranidbe na prirast u tovu.
Sakupljanje podataka, odnosno organiziranje pokusa:
Odredit ćemo grupe životinja slučajnim izborom, različito ih tretirati i izračunati srednje vrijednosti
grupa.
(Izabrati ćemo slučajni uzorak i slučajno primijeniti tretmane (napraviti grupe) na uzorak).

Primjer 2: Da li postoji razlika u mliječnosti krava simentalske pasmine između tri županije.
Sakupljanje podataka, odnosno plan pokusa:
– Izabrati ćemo slučajne uzorke iz županija
– Županije su definicije grupa (različitih populacija)

Pitanja?
1. Procijeniti prosjeke grupa i ukupnu srednju vrijednost,
2. Da li postoji utjecaj grupe, tj. da li su prosjeci pojedinih grupa različiti
• (Da li su aritmetičke srednje vrijednosti uzoraka grupa značajno različiti)

Odgovoriti na pitanje da li postoji utjecaj grupe, tj. da li su srednje vrijednosti pojedinih grupa
dovoljno različite da ih možemo smatrati značajno različitim.
(Značajna razlika => u smislu da možemo u velikom broju takvih ponovljenih pokusa
očekivati razliku.)

Odgovor na ova pitanja može dati statistička procedura koja se zove analiza varijance.

Analiza varijance:
- podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih izvora.
- da li je protumačena varijabilnost (varijabilnost između prosjeka grupa) značajna u odnosu
na neprotumačenu varijabilnost (unutar grupa)

Modeli analize varijance prema broju nezavisnih (kategoričkih) varijabli:


- jednostruka
- dvostruka, itd.

54
7.1 Model jednostruke analize varijance s fiksnim utjecajima
Pretpostavka je da postoji fiksni utjecaj, tj. utjecaj grupe je isti na svaku jedinku u toj grupi

Neka je broj grupa (tretmana) = a


Grupe ili tretmani = slučajni uzorci iz odgovarajućih populacija
Po svakom tretmanu n mjerenja.
ukupno N = (n a) jedinica je podijeljeno u a grupa veličine n.

Mjera varijabilnosti između grupa je varijabilnost prosjeka grupa


Mjera varijabilnosti unutar grupa je varijabilnost između pojedinih mjerenja unutar grupe

Model:
yij = µ + τi + εij i = 1,.....,a j = 1,...,n

yij = opažanje jedinice j u grupi i (tretmanu i)


µ = ukupni prosjek
τi = fiksni utjecaji grupe ili tretmana i
εij = greška modela sa N(0, σ2)

Nezavisna varijabla τ :
- poprima vrijednosti različitih grupa (tretmana)
- kategorička varijabla, često se zove faktor
- prema modelu faktor ima utjecaj na vrijednosti zavisne varijable y

Prosjeci populacija procjenjuju se aritmetičkim prosjecima grupa.

Model procijene:
yˆ ij = µˆ i = µˆ + τˆi i = 1,.....,a j = 1,...,n

µˆ = procijenjena ukupna srednja vrijednost


τˆi = procijenjeni utjecaj grupe i
µˆ i = procijenjeni prosjek grupe i
eij = yij − µ̂i = ostatak u uzorcima, neprotumačen modelom

yij = j-to mjerenje u i-toj grupi

Grupa
G1 G2 G3
y11 y21 y31
y12 y22 y32
y13 y23 y33
y14 y24 y34
y15 y25 y35

55
7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti:
Izvori varijabilnosti:
a) ukupna varijabilnost (varijabilnost opažanja bez obzira u kojoj su grupi),
b) varijabilnost opažanja unutar svake grupe i
c) varijabilnost između prosjeka grupa

Podsjetimo se da je varijanca uzorka pokazatelj varijabilnosti tog uzorka:


(∑ y ) 2

∑ (y i − y)
2
∑y 2
i i
− i i
n
var = s 2
= i
=
n −1 n −1
(∑ y ) 2

Također, ∑ (y
i i − y) = ∑ y
2 2
i i
− i i
n
= suma kvadrata korigirana na srednju vrijednost (SS).

Mjere izvora varijabilnosti

• Ukupna varijabilnost => (SSUKUP) = Ukupna suma kvadrata


• Varijabilnost između grupa => (SSTRT) = Suma kvadrata između grupa (tretmana)
= Suma kvadrata za grupe (tretmane)
• Varijabilnost unutar grupa => (SSOST) = Suma kvadrata unutar grupa
= Suma kvadrata za ostatak

SSTRT = Suma kvadrata između grupa (tretmana) = Suma kvadrata za grupe (tretmane)
SSOST = Suma kvadrata unutar grupa = suma kvadrata za ostatak = suma kvadrata za pokusnu
grešku
SSUKUP = Ukupna suma kvadrata

Može se pokazati da vrijedi:

SSUKUP = SSTRT + SSOST

Stupnjevi slobode (ukupno) = stupnjevi slobode (grupa) + stupnjevi slobode (ostatak)


(N–1) = (a–1) + (N–a)
N = ukupan broj mjerenja, a = broj tretmana.

Oznake prosjeka:

yi . =
∑ j
yij
= prosjek grupe i
ni
∑∑ i j
y
ij
y.. = = prosjek svih opažanja
N
N= ukupan broj opažanja

56
Sume kvadrata:
SSUKUP = ∑i ∑ j ( yij − y..) 2

SSTRT = ∑i ∑ j ( yi . − y..) 2 = ∑i ni ( yi . − y..) 2


SS OST = ∑i ∑ j ( y ij − y i .) 2

Kratki način računanja:


1) Ukupna suma

ΣΣyi j ij
2) Korekcija za srednju vrijednost

C=
(∑ ∑ y )
i j ij
2

=
(ukupna suma)2
N ukupni broj opazanja
3) Ukupna (korigirana) suma kvadrata
SSUKUP = ∑i ∑ j yij 2 − C = Suma svih kvadriranih opažanja minus C
4) Suma kvadrata za grupe (tretmane)
(∑ y ) 2
(suma grupe )2
∑ j ij
SS TRT = − C = Suma za svaku grupu minus C
i
ni broj opažanja u grupi
5) Suma kvadrata za ostatak
SSOST = SSUKUP – SSTRT

Dijeljenjem suma kvadrata s odgovarajućim stupnjevima slobode dobiju se prosjeci kvadrata:


prosjek kvadrata = SS/ stupnjevi slobode

Prosjek kvadrata za tretmane:


MSTRT = SSTRT/(a–1)
Prosjek kvadrata za ostatak:
MSOST = SSOST/(N–a)

7.1.2 Postavljanje hipoteza i F-provjera

H0: τ1 = τ2 =... = τa , nema utjecaja grupa


H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između grupa postoji

Hipoteza se može i ovako postaviti:

H0: µ1 = µ2 =... = µa , prosjeci populacija su isti,


H1: µi ≠ µi’ za barem jedan par (i,i’) prosjeci populacija nisu isti.

57
F – provjerom pšrovjeravamo:
- da li je varijabilnost mjerenja potpuno slučajna ili je uvjetovana i nekim sistematskim utjecajem
(grupom ili tretmanom)
- da li je varijabilnost između grupa (između prosjeka grupa) značajna u odnosu na
varijabilnost unutar grupa
- da li su prosjeci grupa ili utjecaji grupa značajno različiti
MS TRT
F=
MS OST
ima F raspodjelu sa (a–1) i (N–a) stupnjeva slobode, ukoliko vrijedi H0.

:
- Odbacujemo H0 ako F > Fα,(a–1),(N–a), tj. ako je izračunata statistika F iz uzorka veća od kritične
vrijednosti

F F
Fα,(a-1),(N-a)

Slika 7-1: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunatimanji od F kritično,

tj. F < Fα,a–1,N–a,H0 ne odbacujemo.

F F
Fα,(a-1),(N-a)

Slika 7-2: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunativeći od F kritočno, tj. F > Fα,a–
1,N–a,H0 odbacujemo uz α razinu značajnosti.

Radi preglednosti izračuni i provjera se može napisati u tablicu analize varijance

ANOVA tablica:
Izvor SS df MS = SS/df F
Grupa SSTRT a–1 MSTRT MSTRT/MSOST
Ostatak SSOST N–a MSOST
Ukupno SSUKUP N–1

58
7.2 Usporedba srednjih vrijednosti pojedinih grupa
F-provjerom provjeravamo da li postoji razlika između tretmana.
Ako se H0 ne odbaci:
- nije potrebno dublje analizirati problem,
- (!!!mogućnost tip II greške)
Ako se H0 odbaci:
- ? koji tretman je utjecao na to
- između kojih tretmana je utvrđena značajna razlika.
- da li je µi ≠ µi’ za tretmane i i'

7.2.1 Najmanja značajna razlika (LSD)


Cilj: utvrditi najmanju razliku koja će biti značajna i usporediti razlike svih parova srednjih
vrijednosti tretmana sa tom vrijednošću.
1 1 
LSDii ' = tα / 2, N −a MSOST  + 
 ni ni ' 
Procedura:
1.F-provjera (H0: µ1 =..........= µa , H1: µi ≠ µi’ za barem jedan par i,i’)
2. Ukoliko H1 tada se računa LSDii’ za sve parove ii’.
3. Zaključujemo µi ≠ µi’ ako yi − yi ' ≥ LSDii '

F provjera mora prethoditi LSD da osiguramo razinu značajnosti α za bilo koji broj usporedbi.

Prednost LSD provjere:


- vrlo vjerojatno da će pronaći razliku između srednjih vrijednosti (ako postoje)
- ima nisku razinu tip II greške
Loša strana:
- pokazuje često razlike kada i nisu
- visoka razina tip 1 greške

7.2.2 Tukey provjera (HSD)

MSOST
HSD = qα , a , N − a
nt
q statistika ima Q raspodjelu (iz tablica); nt je broj opažanja po grupi

Zaključujemo µi ≠ µi ' ako yi − yi ' ≥ HSDii ' , .

Vjerojatnost da se napravi greška tip I je jednaka α, tj razina α vrijedi za cijelu proceduru, tj. za sve
parove srednjih vrijednosti
Za nejednaki broj opažanja po grupi:

nt =
1
(N −
∑n i
2
i
)
a −1 N

Prednost Tukey provjere:


- ne toliko pogrešnih zaključaka kao LSD,
Loša strana:
- ima više pogrešnih µi = µj zaključaka.

59
7.3 SAS primjer jednostruke analize varijance s fiksnim utjecajima
Primjer:Postavljen je pokus u svrhu provjere razlika tri smjese u dnevnom prirastu prasadi. Tri
smjese su označene s TR1, TR2 i TR3. Podaci su dani u slijedećoj tablici:

TR1 TR2 TR3


270 290 290
300 250 340
280 280 330
280 290 300
270 280 300 Ukupno

SAS program:

DATA pigs;
INPUT smjesa $ prirast @@;
DATALINES;
TR1 270 TR2 290 TR3 290
TR1 300 TR2 250 TR3 340
TR1 280 TR2 280 TR3 330
TR1 280 TR2 290 TR3 300
TR1 270 TR2 280 TR3 300
;
PROC GLM DATA = pigs;
CLASS smjesa;
MODEL prirast = smjesa ;
LSMEANS smjesa / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

Dependent Variable: prirast


Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 3640.0000 1820.0000 6.13 0.0146
Error 12 3560.0000 296.6667
Corrected Total 14 7200.0000

R-Square Coeff Var. Root MSE prirast Mean


0.505556 5.939315 17.224014 290.00000

Least Squares Means


Adjustment for multiple comparisons: Tukey

prirast Standard LSMEAN


smjesa LSMEAN Error Pr > |t| Number
TR1 280.000000 7.702813 0.0001 1
TR2 278.000000 7.702813 0.0001 2
TR3 312.000000 7.702813 0.0001 3

Least Squares Means for effect smjesa


Pr > |t| for H0: LSMean(i)=LSMean(j)

i/j 1 2 3
1 0.9816 0.0310
2 0.9816 0.0223
3 0.0310 0.0223

60
7.4 Model sa slučajnim utjecajima grupa
Grupa ili tretman slučajna varijabla sa nekom raspodjelom.
Slijedeće dvije slike prikazuju razlike između modela s fiksnim i modela sa slučajnim utjecajima:

Slika 7-3: Prikaz izvora varijabilnosti fiksnog modela jednostruke analize varijance:
Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .

Slika 7-4: Prikaz izvora varijabilnosti slučajnog modela jednostruke analize varijance:
Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .

Fiksni model:
• Mali (konačan) broj grupa
• Utjecaj grupe definiran i fiksan
• Varijabilnost između grupa nije objašnjena teoretskom raspodjelom

Slučajni model
• Velik (beskonačan) broj grupa
• Utjecaj pojedine grupe (prosjek) je slučajna varijabla
• Varijabilnost između grupa je objašnjena teoretskom raspodjelom

Model jednostruke analize varijance:


yij = µ + τi + εij i = 1, 2, ... j = 1,...,n

yij = Opažanje jedinice j u grupi i


µ = ukupni prosjek
τi = slučajni utjecaji grupe ili tretmana i
εij = slučajna greška

61
Pretpostavke modela:

τi = slučajna varijabla sa prosjekom E(τi) = 0 i varijancom Var(τi) = σ2τ


εij = slučajna greška sa prosjekom E(εij) = 0 i homogenom varijancom σ2

σ2τ i σ2 = komponente varijance.

τi i εij su nezavisni, tj.


Cov(τi , εij) = 0
Iz pretpostavki slijedi
yi ∼ N(0, σ2τ + σ2) varijanca opažanja sadrži komponente varijanci
Cov(yij , yij’) = σ2τ
Cov(τi , yij) = σ2τ
- kovarijanca između opažanja unutar jedne grupe je jednaka varijanci između grupa.

Ciljevi:
1. Provjera hipoteza
2. Procjena komponenti varijance
3. Predviđanje τ1,.., τa.

Hipoteze: da li postoji varijabilnost između tretmana:


H0: σ2τ = 0
H1: σ2τ ≠ 0

Ukoliko vrijedi H0:


=> varijanca grupa jednaka je nuli
=> grupe su jednake jer nema varijabilnosti između njih

F provjera:
MSTRT
F=
MSOST
ako vrijedi H0 tada je σ2τ = 0, i F = 1.

ANOVA tablica

Izvor SS df MS = SS/df E(MS)


Grupa SSTRT a–1 MSTRT σ2 + n σ2τ
Ostatak SSOST N–a MSOST σ2
Ukupno SSUKUP N–1

U tablicu je dobro upisati i očekivanja prosjeka kvadrata, E(MS)

Pošto je
E(MSOST) = σ2
E(MSTRT) = σ2 + n σ2τ

62
mogu se iz Anova tablice procijeniti komponente varijance koristeći jednakosti:
E ( MSTRT ) = σ 2 + nσ τ2 ⇒ MSTRT = σˆ 2 + nσˆτ2
E ( MSOST ) = σ 2 ⇒ MSOST = σˆ 2
Iz tog slijedi:
σ̂ 2 = MSOST
( MSTRT - MSOST )
σˆ τ2 =
n
σˆ i σˆτ su procijene parametara
2 2

n = broj opažanja po grupi

Predviđanje srednjih vrijednosti odnosno utjecaja tretmana (primijetite da su različite od


aritmetičkih prosjeka zbog komponenti varijanci):
µˆ = y..
τˆi = bτ , y i . ( yi . − µˆ )
Cov (τ i , yi ) σ2
bτ , yi . = = 2 τ2 ako su varijance poznate
Var ( yi ) σ τ + σ / ni
σˆτ2
bτ , yˆi . = 2 ako se varijance isto procjenjuju iz uzoraka
σˆτ + σˆ 2 / ni

7.5 Intraklasna korelacija


Korelacija između opažanja unutar grupe.
Cov( yi , j , yi , j ' )
ρt =
Var ( yi , j )Var ( yi , j ' )

Kovarijanca između opažanja unutar grupa jednaka komponenti varijance između grupa:
Cov(yij,yij') = Var (τi) = στ2

Varijanca bilo kojeg opažanja ij je:


Var(yij) = στ2 + σ2

Intraklasna korelacija:
σ2
ρt = 2 τ 2
στ + σ

Procjena iz uzorka:
σˆτ2
rt = 2
σˆτ + σˆ 2

63
7.6 SAS primjer jednostruke analize varijance sa slučajnim utjecajima

Primjer: Mjerena je koncentracija progesterona kod 8 svinja s ciljem da se procijeni varijabilnost


unutar i između svinja, odnosno da se utvrdi da li je varijabilnost između svinja značajna.
Koncentracija progesterona je mjerena tri puta na svakoj svinji. Podaci su u slijedećoj tablici.

Svinja
Mjerenje 1 2 3 4 5 6 7 8
1 5.3 6.6 4.3 4.2 8.1 7.9 5.5 7.8
2 6.3 5.6 7.0 5.6 7.9 4.7 4.6 7.0
3 4.2 6.3 7.9 6.6 5.8 6.8 3.4 7.9

SAS program:

DATA sow;
INPUT sow prog @@;
DATALINES;
1 5.3 1 6.3 1 4.2 2 6.6 2 5.6 2 6.3
3 4.3 3 7.0 3 7.9 4 4.2 4 5.6 4 6.6
5 8.1 5 7.9 5 5.8 6 7.9 6 4.7 6 6.8
7 5.5 7 4.6 7 3.4 8 7.8 8 7.0 8 7.9
;
PROC MIXED DATA=sow METHOD = REML;
CLASS sow ;
MODEL prog = / SOLUTION DDFM = SATTERTH;
RANDOM sow / SOLUTION;
RUN;

SAS ispis:

Covariance Parameter Estimates

Cov Parm Estimate


sow 0.5571
Residual 1.4937

Solution for Fixed Effects

Standard
Effect Estimate Error DF t Value Pr > |t|
Intercept 6.1375 0.3632 7 16.90 <.0001

Solution for Random Effects

Std Err
Effect sow Estimate Pred DF t Value Pr > |t|
sow 1 -0.4599 0.5475 5.49 -0.84 0.4360
sow 2 0.0154 0.5475 5.49 0.03 0.9785
sow 3 0.1386 0.5475 5.49 0.25 0.8093
sow 4 -0.3542 0.5475 5.49 -0.65 0.5437
sow 5 0.5963 0.5475 5.49 1.09 0.3216
sow 6 0.1738 0.5475 5.49 0.32 0.7626
sow 7 -0.8647 0.5475 5.49 -1.58 0.1698
sow 8 0.7547 0.5475 5.49 1.38 0.2216

64
8 Načela planiranja pokusa

Pokus (eksperiment):
- planirano istraživanje u svrhu dobivanja novih činjenica ili potvrde odnosno osporavanja
rezultata prijašnjih pokusa

Istraživanje se može prikazati u nekoliko koraka:


1. Opis problema (uvod)
- općenito, dosadašnja istraživanja
2. Postavljanje cilja (hipoteze)
- usko, specifično, dalji rad slijedi iz toga
- pitanje na koje treba odgovoriti
- hipoteza koju treba provjeriti
- utjecaj koji treba procijeniti

3. Postavljanje pokusnog plana (design)


- što treba učiniti, materijal i metode
4. Sakupljanje podataka
- prema pokusno planu
5. Analiza (Rezultati i rasprava)
6. Donošenje zaključka
- odgovor na postavljeni cilj
- jasan i koncizan

U pokusnom planu treba definirati:


- Tretmani (populacije)
- Pokusna jedinica
- Jedinica uzorka (opažanje)
- Ponavljanja
- Pokusna greška

Pokusni plan:
- Način na koji se primjenjuju tretmani na pokusne jedinice
- Postavlja ga istraživač
- Unutar okvira plana mora postojati slučajnost primjene tretmana

Statistički model:
- Slijedi pokusni plan
- Pomaže pri provjeri statističkih hipoteza
- Pomaže pri donošenju zaključaka
- Sastoji se od tri dijela:
- prosjeci (očekivanja)
- disperzija (varijance i kovarijance)
- definirane raspodjele
Često prikazan matematičkom formulom

65
8.1 Pokusna jedinica i tretmani
Pokusna jedinica
- jedinica materijala na koje se primjenjuju tretmani
- jedna jedinka, npr. životinja
- ili grupa jedinki kao što je 10 pilića u jednom kavezu
Tretman
- procedura čiji utjecaj će biti mjeren i uspoređivan s drugim utjecajima
- primjer: razina hranidbe, način primjene insekticida
- određivanje populacije za koje će se donositi zaključci

Utjecaj tretmana se mjeri na jedinici uzorka


Faktor: grupa tretmana koji predstavljaju vrijednosti jedne kategoričke nezavisne varijable.

Jedinica uzorka:
- može biti jednaka pokusnoj jedinici
- može biti dio pokusne jedinice

8.2 Ponavljanja i pokusna greška


Ponavljanja:
- kada se tretmani primjenjuju više puta na više pokusnih jedinca
- omogućuju procjenu pokusne greške
- više ponavljanja povećava preciznost pokusa jer se time smanjuju standardne greške
tretmana

Pokusna greška (engl. experimental error):


- mjera neprotumačene varijabilnosti koja postoji između opažanja na pokusnim jedinicama
kada bi one bile tretirane jednako, odnosno kad nema utjecaja tretmana
MSOST , s2 , MSE
- prosjek kvadrata za ostatak
- prosjek kvadrata između pokusnih jedinica
- prosjek kvadrata unutar tretmana (grupa).
Procjena pokusne greške je potrebna:
- za provjeru značajnosti razlika pojedinih utjecaja
- za procjenu intervala povjerenja srednjih vrijednosti

Količina informacija:
n
I= 2
s

Kontrola pokusne greške


(kontrola varijabilnosti između pokusnih jedinica)
Pokusna greška se može smanjiti:
1. Izborom pokusnog materijala sa što manjom varijabilnosti među pokusnim jedinicama
(slučajnost izbora mora biti zadovoljena)
2. Poboljšanjem provedbe pokusa dajući slične uvjete pokusnim jedinicama
3. Izborom odgovarajućeg statističkog plana

66
Na točnu procjenu pokusne greške utječe:
- slučajnost izbora pokusnog materijala
- slučajnost primjene tretmana na pokusne jedinice
Izvori varijabilnost pokusne greške:
- varijabilnost između pokusnih jedinica koju se ne može objasniti
- postoji varijabilnost zbog pomanjkanja uniformnosti u provedbi pokusa.

Preciznost pokusnih planova


• Na preciznost pokusa utječe:
– izbor i homogenost pokusnog materijala
– izbor i razine tretmana
– kontrola pokusne greške
– broj ponavljanja

8.3 Potreban broj ponavljanja


Ovisi o:
- varijabilnosti uzorka
- željenoj razlici između prosjeka tretmana
- preciznosti pokusa
- broju tretmana
- razini vjerojatnosti sa kojom želimo biti sigurni da nismo pogriješili u zaključivanju (razina
značajnosti)

Potreban broj ponavljanja:

r≥
( )
zα / 2 + z β
2σ 2
δ 2

zα/2 = vrijednost na apscisi standardne normalne raspodjele određen sa α/2 vjerojatnosti tipa 1
greške
zβ = vrijednost na apscisi standardne normalne krivulje određen sa β vjerojatnosti tipa 2 greške
τ = željena razlika koju želimo utvrditi
σ2 = pokusna greška, odnosno varijanca pokusnih jedinca kad ne bi bilo utjecaja tretmana.

67
9 Potpuno slučajni pokusni plan

Svojstva:
- tretmani se dodjeljuju slučajno na pokusne jedinice
- pokusne jedinice izabrane su slučajno iz populacije
jednostruka analiza varijance = jednofaktorska analiza varijance.
Koristi se:
- kada su pokusne jedinice homogene.

Primjer:

Utjecaj tri različite hranidbe na prirast u tovu.


Prvo treba definirati sakupljanje podataka, odnosno napraviti plan pokusa:
Izabrat ćemo slučajni uzorak i slučajno primijeniti tretmane na uzorak (definirati grupe)
Izabrali smo 15 junadi i različito ih hranili.(tretirali).

68
Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima
Tretmani

T1 T2 T3

June Mjerenje June Mjerenje June Mjerenje

2 1170 1 1090 3 1290

6 1200 4 1050 5 1340

9 1180 8 1080 7 1330

12 1180 10 1090 11 1300

15 1170 14 1080 13 1300

Shema:
Broj životinje 1 2 3 4 5 6 7 8
Tretman T2 T1 T3 T2 T3 T1 T3 T2

Broj životinje 9 10 11 12 13 14 15
Tretman T1 T2 T3 T1 T3 T2 T1

Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima:

Tretmani
T1 T2 T3
Broj Mjerenje Broj Mjerenje Broj Mjerenje
2 y11 1 y21 3 y31
6 y12 4 y22 5 y32
9 y13 8 y23 7 y33
12 y14 10 y24 11 y34
15 y15 14 y25 13 y35

69
10 Blokovi u analizi varijance

Unaprijed je poznato da će neke pokusne jedinice, iako tretirane jednako, ponašati različito
- teže životinje će imati drugačiji prirast nego lakše
- mjerenje na isti dan će biti sličnija nego ona u različitim danima

Pokusni plan:
- pokusne jedinice se klasificiraju i prema tim poznatim izvorima varijabilnosti
- smanjuje se pokusna greška

10.1 Slučajni blok plan (potpuni)


Pokusne jedinice uz tretmane mogu grupirati i prema drugom poznatim izvoru varijabilnosti u
blokove
- npr. na temelju početne težine, kondicije, pasmine, spolu, stadij laktacije, legla, itd.
Blokovi:
- grupe koje služe da se protumači još jedan dio varijabilnosti
- njihova provjera obično nije od primarnog interesa
Cilj grupiranja u blokove:
- da su jedinice unutar blokova slične tako da je varijabilnost između njih uglavnom zbog
različitih tretmana

Karakteristike slučajnog blok plana su:


- imamo a tretmana i b blokova. Svaki tretman se javlja u svakom bloku i to samo jedanput
- način kako se tretmani primjenjuju na životinje u pojedinom bloku je potpuno slučajan
- dvostruka analiza varijance (dvostruka klasifikacija) - dva načina klasificiranja pokusnih
jedinica: prema bloku i tretmanu

Primjer:
Stimulansi na rast junadi
- 3 tretmana
- 4 bloka prema početnoj težini
- u svakom bloku 3 životinje na koje slučajno primjenjujemo tretmane
- ukupno 12 životinja u pokusu

Blok Životinje
I 1,2,3
II 4,5,6,
III 7,8,9
IV 10,11,12

Shema pokusnog plana:

70
Blokovi

I II III IV

Br. 1 (T3) br. 4 (T1) br. 7 (T3) br. 10 (T3)


Br. životinje (Tretman) Br. 2 (T1) br. 5 (T2) br. 8 (T1) br. 11 (T2)
Br. 3 (T2) br. 6 (T3) br. 9 (T2) br. 12 (T1)

Rezultati mjerenja:

Blokovi

I II III IV

T1 y11 y12 y13 y14


Tretman

T2 y21 y22 y23 y24


T3 y31 y32 y33 y34

yij = mjerenje tretmana i u bloku j.

Model:
yij = µ + τi + βj + εij i = 1,.....,a j = 1,...,b

yij = opažanje pokusne jedinice za tretman i u bloku j


µ, = ukupna srednja vrijednost
τi = fiksni utjecaji grupe (tretmana)
βj = fiksni utjecaji blokova
εij - slučajni neprotumačeni utjecaj N(0, σ2) = interakcija blok x tretman

10.1.1 Raščlanjenje ukupne sume kvadrata

Sume kvadrata:
SSUKUP = SSTRT + SSBLK + SSOST
Stupnjevi slobode su:
(ba–1) = (a–1) + (b–1) + (a–1)(b–1)

Također je
(a–1)(b–1) = (ab–a–b+1)

Jednostruka ANOVA:
SSUKUP = SSTRT + SS'OST
Dvostruka ANOVA:
SSUKUP = SSTRT + SSBLK + SSOST

SS'OST = SSBLK + SSOST

SSOST : suma kvadrata za ostatak kod dvostruke ANOVA-e (pokusna greška kod slučajnog blok
plana)

SS'OST : suma kvadrata za ostatak kod jednostruke ANOVA-e

71
Smanjenje SS ostatka => veća preciznost slučajnog blok plana u utvrđivanju eventualnih razlika
tretmana

Sume kvadrata:
SSUKUP = ∑i ∑ j ( y ij − y..) 2

SSTRT = ∑i ∑ j ( yi . − y..) 2 = b∑i ( yi . − y..) 2

SS BLK = ∑i ∑ j ( y. j − y..) 2 = a ∑i ( y. j − y..) 2


SSOST = ∑i ∑ j ( yij − yi . − y. j + y..) 2

Kratki način računanja suma kvadrata:

1) Ukupna suma = i j yij ΣΣ


2) Korekcijski faktor za srednju vrijednost:

C=
(∑ ∑ y )
i j ij
2

=
(ukupna suma)2
ab ukupni broj opazanja

3) SSUKUP = ΣΣy i j ij
2
–C
(∑ y ) 2

4) SS TRT = ∑i
j ij
−C
b
(∑ y ) 2

5) SS BLK = ∑ j
ij
i
−C
a
6) SSOST = SSUKUP – SSTRT – SSBLK

Prosjeci kvadrata = MS = SS/df


MSBLK = SSBLK/ (b–1),
MSTRT = SSTRT/ (a–1),
MSOST = SSOST/[(a–1)(b–1)]

10.1.2 Postavljanje hipoteza i F-provjera


H0: τ1 = τ2 =... = τa , nema utjecaja tretmana
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji

F statistika
MS TRT
F=
MS OST
ima F raspodjelu sa stupnjevima slobode (a–1) i (a–1)(b–1) ukoliko vrijedi H0

Za α razinu značajnosti odbacujemo Ho ako


F > Fα,(a–1),(a–1)(b–1)

Provjera za blokove:
- obično nije od primarnog interesa
- analogna kao i za tretmane.

72
Anova tablica:

Izvor SS df MS F
Blokovi SSBLK b–1 MSBLK F=MSBLK/MSOST
Tretmani SSTRT a–1 MSTRT F=MSTRT/MSOST
Ostatak SSOST (a–1)(b–1) MSOST
Ukupno SSUKUP ab–1

10.1.3 SAS primjer za slučajni blok plan

Primjer: Cilj pokusa je bio utvrditi utjecaj primjene tri tretmana (T1, T2 i T3) na prosječni dnevni
prirast u tovu junadi. Junad je podijeljena u četiri bloka prema početnoj težini. U svakom su bloku
dakle tri životinje na koje su slučajno dodijeljeni tretmani. Ukupno je bilo 12 životinja u pokusu.
Radi lakšeg praćenja napravimo tablicu s podacima, prosjecima i sumama po tretmanima i
blokovima:

Blokovi
I II III IV
T1 826 865 795 850
T2 827 872 721 860
T3 753 804 737 822

SAS program:

DATA steer;
INPUT trt blok $ prirast @@;
DATALINES;
1 I 826 1 II 865 1 III 795 1 IV 850
2 I 827 2 II 872 2 III 721 2 IV 860
3 I 753 3 II 804 3 III 737 3 IV 822
;
PROC GLM DATA = steer;
CLASS blok trt;
MODEL prirast = blok trt/ ;
LSMEANS trt / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS output:

Dependent Variable: prirast


Sum of Mean
Source DF Squares Square F Value Pr > F
Model 5 24734.0000 4946.8000 8.08 0.0122
Error 6 3672.0000 612.0000
Corrected Total 11 28406.0000

R-Square Coeff Var Root MSE prirast Mean


0.870732 3.050386 24.7386 811.000

73
Source DF Type III SS Mean Square F Value Pr > F
blok 3 18198.0000 6066.0000 9.91 0.0097
trt 2 6536.0000 3268.0000 5.34 0.0465

Least Squares Means


Adjustment for Multiple Comparisons: Tukey

prirast Standard LSMEAN


trt LSMEAN Error Pr > |t| Number
1 834.000000 12.369317 0.0001 1
2 820.000000 12.369317 0.0001 2
3 779.000000 12.369317 0.0001 3

Least Squares Means for effect trt


Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: prirast

i/j 1 2 3
1 0.7165 0.0456
2 0.7165 0.1246
3 0.0456 0.1246

10.1.4 SAS primjer s više pokusnih jedinica po kombinaciji blok x tretman

Primjer:Pretpostavimo opet da je cilj pokusa bio utvrditi utjecaj primjene tri tretmana (T1, T2 i T3)
na prosječni dnevni prirast u tovu junadi. Opet ćemo koristiti 4 bloka, međutim ovaj puta imamo na
raspolaganju 8 životinja po svakom bloku. Ukupno u cijelom pokusu ima 4×3×2 = 24 životinje.
Tretmani su primijenjeni na životinje u bloku slučajno. Tablica sa rezultatima mjerenja na kraju
pokusa je slijedeća:

Blokovi
Tretmani I II III IV

826 864 795 850


T1
806 834 810 845

827 871 729 860


T2
800 881 709 840

753 801 736 820


T3
773 821 740 835

SAS program za primjer s junadi i dvije pokusne jedinice po kombinaciji blok x tretman je
slijedeći. Dva pristupa će biti pokazana: blokovi definirani kao fiksni koristeći GLM proceduru i
blokovi definirani kao slučajni koristeći MIXED proceduru.

SAS program:

DATA prirast;
INPUT trt blok $ prirast @@;
DATALINES;
1 I 826 1 I 806 1 II 864 1 II 834
1 III 795 1 III 810 1 IV 850 1 IV 845

74
2 I 827 2 I 800 2 II 871 2 II 881
2 III 729 2 III 709 2 IV 860 2 IV 840
3 I 753 3 I 773 3 II 801 3 II 821
3 III 736 3 III 740 3 IV 820 3 IV 835
;
PROC GLM DATA = prirast;
CLASS blok trt;
MODEL prirast = blok trt blok*trt/;
LSMEANS trt / STDERR PDIFF ADJUST=TUKEY;
LSMEANS blok*trt / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS ispis GLM procedure za fiksne blokove:


Dependent Variable: prirast

Sum of
Source DF Squares Mean Square F Value Pr > F
Model 11 49929.83333 4539.07576 25.81 <.0001
Error 12 2110.00000 175.83333
Corrected Total 23 52039.83333

R-Square Coeff Var Root MSE prirast Mean


0.959454 1.638244 13.26022 809.4167

Source DF Type III SS Mean Square F Value Pr > F


blok 3 33816.83333 11272.27778 64.11 <.0001
trt 2 8025.58333 4012.79167 22.82 <.0001
blok*trt 6 8087.41667 1347.90278 7.67 0.0015

Least Squares Means


Adjustment for Multiple Comparisons: Tukey

prirast Standard LSMEAN


trt LSMEAN Error Pr > |t| Number
1 828.750000 4.688194 <.0001 1
2 814.625000 4.688194 <.0001 2
3 784.875000 4.688194 <.0001 3

Least Squares Means for Effect trt


t for H0: LSMean(i)=LSMean(j) / Pr > |t|
Dependent Variable: prirast

i/j 1 2 3
1 0.1251 <.0001
2 0.1251 0.0020
3 <.0001 0.0020

Least Squares Means

prirast Standard
blok trt LSMEAN Error Pr > |t|
I 1 816.000000 9.376389 <.0001
I 2 813.500000 9.376389 <.0001
I 3 763.000000 9.376389 <.0001
II 1 849.000000 9.376389 <.0001
II 2 876.000000 9.376389 <.0001
II 3 811.000000 9.376389 <.0001

75
III 1 802.500000 9.376389 <.0001
III 2 719.000000 9.376389 <.0001
III 3 738.000000 9.376389 <.0001
IV 1 847.500000 9.376389 <.0001
IV 2 850.000000 9.376389 <.0001
IV 3 827.500000 9.376389 <.0001

PROC MIXED DATA = prirast;


CLASS blok trt;
MODEL prirast = trt/;
RANDOM blok blok*trt;
LSMEANS trt / DIFF ADJUST=TUKEY;
RUN;

SAS ispis MIXED procedure za slučajne blokove:


Covariance Parameter
Estimates

Cov Parm Estimate

blok 1654.06
blok*trt 586.03
Residual 175.83

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
trt 2 6 2.98 0.1264

Least Squares Means

Stand
Effect trt Est Error DF t Val Pr>|t| Alpha Lower Upper
trt 1 828.75 24.1247 6 34.35 <.0001 0.05 769.72 887.78
trt 2 814.62 24.1247 6 33.77 <.0001 0.05 755.59 873.66
trt 3 784.87 24.1247 6 32.53 <.0001 0.05 725.84 843.91

Differences of Least Squares Means

Stand
Effect tr_tr Est Error DF t Val Pr > |t| Adjustment Adj P Alpha

trt 1 2 14.125 18.3569 6 0.77 0.4708 Tukey-Kramer 0.7339 0.05


trt 1 3 43.875 18.3569 6 2.39 0.0540 Tukey-Kramer 0.1174 0.05
trt 2 3 29.750 18.3569 6 1.62 0.1562 Tukey-Kramer 0.3082 0.05

Differences of Least Squares Means

Adj Adj
Effect trt _trt Lower Upper Lower Upper
trt T1 T2 -30.7927 59.0427 . .
trt T1 T3 -1.0427 88.7927 . .
trt T2 T3 -15.1677 74.6677 . .

76
11 'Change-over' pokusni planovi

11.1 Jednostavni 'change-over' plan


Svojstva:
- svi tretmani se primjenjuju na svaku životinju (subjekt)
- a mjerenja na svakom od n subjekata
- mjerenja a odgovaraju tretmanima
- redoslijed primjene tretmana je slučajan
- pokusna jedinica NIJE subjekt (životinja)
- pokusna jedinica JE jedno mjerenje na životinji
- protumačeni izvori varijabilnosti:
- subjekti i tretmani

Razdoblje Subjekt 1 Subjekt 2 Subjekt 3 … Subjekt n


1 T2 T1 T2 … T3
2 T1 T3 T3 … T2
3 T3 T2 T1 … T1

Model:
yij = µ + τi + SUBj + εij i = 1,.....,a j = 1,...,n

yij = Opažanje životinje (subjekta) j u za tretman i


µ = ukupni prosjek
τi = fiksni utjecaj tretmana i
SUBj = slučajni utjecaj životinje (subjekta) j
εij – slučajna greška

Kada imamo rezultate mjerenja obično pišemo:

Subjekt
Tretman 1 2 ......... n
T1 y11 y12 .... y1n
T2 y21 y22 .... y2n
..........................
Ta y31 y32 .... yan

Izvori varijabilnosti
Sume kvadrata :
SSUKUP = SSSUB + SSUNUTAR SUBJEKTA
SSUNUTAR SUBJEKTA = SSTRT + SSOST

SSUKUP = SSSUB + SSTRT + SSOST

77
stupnjevi slobode:
(na–1) = (n–1) + (a–1) + (n–1)(a–1)

Sume kvadrata su:


SSUKUP = ∑i ∑ j ( yij − y..) 2
SS SUB = ∑i ∑ j ( y. j − y..) 2 = a ∑i ( y. j − y..) 2

SSTRT = ∑ ∑ ( y . − y..) = ∑ n ( y . − y..)


i j i
2
i i i
2

SSUNUTAR SUBJEKTA = ∑i ∑ j ( yij − y. j ) 2

SSOST = ∑i ∑ j ( yij − yi . − y. ji + y..) 2

MS = SS/df:
MSTRT = SSTRT/ (a–1)
MSOST = SSOST/[(a–1)(n–1)]

ANOVA tablica:

Izvor SS df MS F
Između subj. SSSUB n–1 MSSUB
Unutar subj. SSUNUTAR n(a–1) MSUNUTAR
Tretmani SSTRT a–1 MSTRT MSTRT/MSOST
Ostatak SSOST (n–1)(a–1) MSOST

Hipoteze:
H0: τ1 = τ2 =... = τa , nema utjecaja grupa
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između grupa postoji

F statistika:
MSTRT
F=
MSOST

11.2 'Change-over' plan kada postoji utjecaj razdoblja


omogućava i provjeru utjecaja redoslijeda primjene tretmana.
Model:
yijkl = µ + τi + βk + SUB(β)jk + tl + εijkl
i = 1 do a; j = 1 do nk, k = 1 do b; l = 1 do a

Gdje su:
yijkl = opažanje ijkl
µ = ukupni prosjek korigiran na sve utjecaje
τi = utjecaj tretmana i
βk = utjecaj bloka k, blok može na primjer biti redoslijed primjene pojedinog tretmana
SUB(β)jk = slučajni utjecaj životinje (subjekta) j unutar bloka k sa prosjekom 0 i varijancom σ2g
tl = utjecaj razdoblja l
εijkl = slučajna greška s prosjekom 0 i varijancom σ2

78
a = broj tretmana i razdoblja, b = broj blokova, je nk = broj životinja unutar bloka k. n = Σknk =
ukupan broj životinja

ANOVA tablica:
Izvor varijabilnosti SS df MS = SS / df F
Blokovi SSBLK b–1 MSBLK MSBLK/MSSUB
Subjekt unutar bloka SSSUB Σk(nk–1) MSSUB
Razdoblje SSt a–1 MSt MSt/MSOST
Tretmani SSTRT a–1 MSTRT MSTRT/MSOST
Ostatak SSOST (a–1)(Σknk – 2) MSOST
Ukupno SSUKUP aΣknk – 1

Provjera tretmana: Provjera blokova

MSTRT MS BLOK
F= F=
MS SUBJ ( BLOK )
MSOST

11.2.1 SAS primjer za ‘change-over’ plan s utjecajem razdoblja

Primjer: Ispitivan je utjecaj dva tretmana na proizvodnju mlijeka kod krava. Primijenjen je 'change-
over' plan, tj. na svaku kravu primijenjena su oba tretmana. Pokus je proveden u 3. i 4. mjesecu
laktacije. Redoslijed tretmana kod svake krave utvrđen je slučajno. Na kraju pokusa dobivene su
slijedeće prosječne dnevne količine mlijeka u kg:

BLOK I
Razdoblje Tretman Krava 1 Krava 4 Krava 5 Krava 9 Krava 10
1 1 31 34 43 28 25
2 2 27 25 38 20 19

BLOK II
Razdoblje Tretman Krava 2 Krava 3 Krava 6 Krava 7 Krava 8
1 2 22 40 40 33 18
2 1 21 39 41 34 20

SAS program:

DATA Cows;
INPUT period trt order cow milk @@;
DATALINES;
1 1 1 1 31 1 2 2 2 22
2 2 1 1 27 2 1 2 2 21
1 1 1 4 34 1 2 2 3 40
2 2 1 4 25 2 1 2 3 39
1 1 1 5 43 1 2 2 6 40
2 2 1 5 38 2 1 2 6 41
1 1 1 9 28 1 2 2 7 33
2 2 1 9 20 2 1 2 7 34
1 1 1 10 25 1 2 2 8 18
2 2 1 10 19 2 1 2 8 20
;

79
PROC MIXED ;
CLASS trt cow period order;
MODEL milk = order trt period;
RANDOM cow(order) ;
LSMEANS trt/ DIFF ADJUST=TUKEY ;
RUN;

SAS ispis:

Covariance Parameter
Estimates

Cov Parm Estimate


cow(order) 75.4000
Residual 1.5250

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
order 1 8 0.11 0.7527
trt 1 8 37.90 0.0003
period 1 8 29.51 0.0006

Least Squares Means

Standard
Effect trt Estimate Error DF t Value Pr > |t|
trt 1 31.6000 2.7735 8 11.39 <.0001
trt 2 28.2000 2.7735 8 10.17 <.0001

Differences of Least Squares Means

Standard
Effect trt _trt Estimate Error DF t Value Pr > |t|
trt 1 2 3.4000 0.5523 8 6.16 0.0003

Differences of Least Squares Means

Effect trt _trt Adjustment Adj P


trt 1 2 Tukey-Kramer 0.0003

11.3 Latinski kvadrat


Značajke:
- tretmani se primjenjuju na blokove na dva različita načina, tj. u kolone i redove.
- svaka kolona i svaki red predstavljaju kompletni blok sa primjenjenim svim tretmanima
- tri protumačena izvora varijabilnosti
- kolone, redovi i tretmani
- pojedino opažanje je samo u jednoj koloni, jednom redu i podliježe samo jednom tretmanu
- pretpostavka da nema interakcije
- r = broj tretmana, kolona i redova
- ukupan broj mjerenja = r2

80
Primjer:
- blokovi utjecaj životinje i razdoblje
- na istu životinju se primjenjuju svi tretmani u različitim razdobljima
- latinski kvadrat => 'change-over' plan.

Primjer: r = 4

Životinje
Razdoblja 1 2 3 4
1 T1 T2 T3 T4
2 T2 T3 T4 T1
3 T3 T4 T1 T2.
4 T4 T1 T2 T3

yij(k) = mjerenje u i - tom redu (periodu), j - toj koloni (životinji), sa primijenjenim k -tim
tretmanom:

Životinje
Razdoblja 1 2 3 4
1 y11(1) y12(2) y13(3) y14(4)
2 y21(2) y22(3) y23(4) y24(1)
3 y31(3) y32(4)..y33(1)..y34(2).
4 y41(4) y42(1) y43(2) y44(3)

Statistički model:
yij(k) = µ + REDi + KOLj + τ(k) + εij(k)
i,j,k = 1,...,r

yij(k) = opažanje ij(k)


µ = srednja vrijednost korigirana na sve utjecaje
REDi = fiksni utjecaj i reda
KOLj = fiksni utjecaj j kolone
τ(k) = fiksni utjecaj tretmana k
εij(k) - ostatak slučajni N(0, σ2)

Sume kvadrata:
SSUKUP = SSRED + SSKOL + SSTRT + SSOST

stupnjevi slobode:
r2 – 1 = (r–1) + (r–1) + (r–1) + (r–1)(r–2)

Sume kvadrata:
SSUKUP = ∑∑
i j
( yij ( k ) − y..) 2

SS RED = r ∑ ( y . − y..)
i i
2

SS KOL = r ∑ ( y. − y..)
i j
2

SSTRT = r ∑ ( y − y..)
i k
2

SSOST = ∑∑
i j
(yij − yi . − y. j − yk + 2 y..)

81
Kratki način računanja:

1) Ukupna suma = i j yij(k) = y.. ΣΣ


2) Korekcijski faktor za srednju vrijednost:

C=
(∑ ∑ y )
i j ij ( k )
2

=
(ukupna suma)2
r2 ukupni broj opazanja

3) SSUKUP = Σ Σ (y i j ij(k))
2
–C

4) SS RED = ∑i
(∑ y ) j ijk
2

−C
r

5) SS KOL = ∑ j
(∑ y ) i ij ( k )
2

−C
r

6) SSTRT = ∑k
(∑∑ y ) − C i j ij ( k )
2

r
7) SSOST = SSUKUP – SSA – SSB – SSTRT

MSRED = SSRED/ (r–1),


MSKOL = SSKOL/ (r–1),
MSTRT = SSTRT/ (r–1),
MSOST = SSOST/[(r–1)(r–2)]

Hipoteze:
H0: τ1 = τ2 =... = τa , nema utjecaja tretmana
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji

MSTRT
F=
MSOST

ANOVA tablica

Izvor SS df MS F
Redovi SSRED r–1 MSRED MSRED/MSOST
Kolone SSKOL r–1 MSKOL MSKOL/MSOST
Tretmani SSTRT r–1 MSTRT MSTRT/ MSOST
Ostatak SSOST (r–1)(r–2) MSOST
Ukupno SSUKUP r2–1

11.3.1 SAS primjer za latinski kvadrat

Cilj pokusa je bio utvrditi utjecaj dodavanja 4 različita dodataka (A, B, C i D) na uzimanje sijena
kod tovne junadi. Pokus je proveden kao latinski kvadrat: na 4 životinje u 4 razdoblja.

82
June
Razdoblje 1 2 3 4
1 10.0(B) 9.0(D) 11.1(C) 10.8(A)
2 10.2(C) 11.3(A) 9.5(D) 11.4(B)
3 8.5(D) 11.2(B) 12.8(A) 11.0(C)
4 11.1(A) 11.4(C) 11.7(B) 9.9(D)

SAS program:

DATA a;
INPUT period steer suppl $ hay @@;
DATALINES;
1 1 B 10.0 3 1 D 8.5
1 2 D 9.0 3 2 B 11.2
1 3 C 11.1 3 3 A 12.8
1 4 A 10.8 3 4 C 11.0
2 1 C 10.2 4 1 A 11.1
2 2 A 11.3 4 2 C 11.4
2 3 D 9.5 4 3 B 11.7
2 4 B 11.4 4 4 D 9.9
;
PROC GLM;
CLASS period steer suppl;
MODEL hay = period steer suppl;
LSMEANS suppl / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS ispis:

Dependent Variable: hay


Sum of
Source DF Squares Mean Square F Value Pr > F
Model 9 17.09562500 1.89951389 13.12 0.0027
Error 6 0.86875000 0.14479167
Corrected Total 15 17.96437500

R-Square Coeff Var Root MSE hay Mean


0.951640 3.562458 0.380515 10.68125

Source DF Type III SS Mean Square F Value Pr > F


period 3 1.48187500 0.49395833 3.41 0.0938
steer 3 3.59187500 1.19729167 8.27 0.0149
suppl 3 12.02187500 4.00729167 27.68 0.0007

Least Squares Means


Adjustment for Multiple Comparisons: Tukey

hay Standard LSMEAN


suppl LSMEAN Error Pr > |t| Number
A 11.5000000 0.1902575 <.0001 1
B 11.0750000 0.1902575 <.0001 2
C 10.9250000 0.1902575 <.0001 3
D 9.2250000 0.1902575 <.0001 4

Least Squares Means for Effect suppl


t for H0: LSMean(i)=LSMean(j) / Pr > |t|
Dependent Variable: hay

83
i/j 1 2 3 4
1 0.4536 0.2427 0.0006
2 0.4536 0.9411 0.0019
3 0.2427 0.9411 0.0030
4 0.0006 0.0019 0.0030

11.4 Change over plan postavljen kao više latinskih kvadrata


I kvadrat II kvadrat
B B
A 1 2 3 A 1 2 3
1 a b c 1 a b c
2 b c d 2 b c d
3 c d a 3 c d a

Model:
yij(k)m = µ + KVm + A(KV)im + B(KV)jm+ T(k) + εij(k)m
i,j,k = 1,...,r; m = 1,...,b
gdje su:
yij(k)m = opažanje ij(k)m
µ = ukupni prosjek korigiran na sve utjecaje
KVm = utjecaj kvadrata m
RED(KV)im = fiksni utjecaj reda i unutar kvadrata m
KOL(KV)jm, = fiksni utjecaj kolone j unutar kvadrata m
τ(k) = fiksni utjecaj tretmana k
εij(k)m = slučajna greška sa prosjekom 0 i varijancom σ2
r = broj tretmana, i broj redova i kolona unutar kvadrata
b = broj kvadrata

ANOVA tablica:
Izvor df
Kvadrati (blokovi) b–1
Redovi unutar kvadrata b(r–1)
Kolone unutar kvadrata b(r–1)
Tretman b–1
Ostatak (Pokusna greška) b(r–1)(r–2)+(b–1)(r–1)
Ukupno b r2–1

F-provjera:
MSTRT
F=
MSOST

84
12 Faktorijalni pokus

- kada imamo dva ili više faktora koji se proučavaju u isto vrijeme.
- sve kombinacije faktora se provjeravaju međusobno

Interakcija:
- različiti utjecaj razina jednog faktora na razine drugog faktora
Glavni utjecaji:
- utjecaji svakog faktora gledajući samo po sebi
Protumačeni izvori varijabilnosti:
- faktor 1, faktor 2, …., interakcije između faktora

Primjer:
- pokus sa dva faktora:
prvi faktor = količina proteina (3 razine)
drugi faktor = vrsta proteinskih krmiva u obroku krava (dva krmiva)
- pojedinoj kravi u pokusu dodjeljuje se jedna od 6 kombinacija krmivo x količina.
- 3 × 2 faktorijalni pokus, tj. tri razine prvog faktora i 2 razine drugog faktora

Upotreba:
- kada malo znamo o faktorima
- potrebno je istražiti sve moguće kombinacije da se vidi koja od njih je najpovoljnija
- također je moguće istražiti interakcije između faktora, tj. da li je razlika između razina
jednog faktora ista ili različita u razinama drugih faktora.
Pokusni plan:
- potpuno slučajni
- kombinacije razina faktora se slučajno dodjeljuju pokusnim jedinicama

Pretpostavimo dva faktora A i B


- faktor A => a razina
- faktor B => b razina
- broj pokusnih jedinica po svakoj kombinaciji = n
- ukupno ima nab pokusnih jedinica podijeljenih u ab grupa (kombinacija faktora A i B)
- skup tretmana se sastoji od ab mogućih kombinacija razina faktora

Model faktorijalnog pokusa je:


yijk = µ + Ai + Bj +(AB)ij + εijk

yijk = k-to opažanje za razinu i faktora A i razinu j faktora B


µ = ukupni prosjek
Ai = fiksni utjecaj razine i faktora A
Bj = fiksni utjecaj razine j faktora B
(AB)ij = fiksni utjecaj interakcije razine ij faktora A i B
εijk - neprotumačeni utjecaj, slučajan sa N(0, σ2)

Primjer: dva faktora A i B i obadva imaju dvije razine


- 2 × 2 faktorijalni plan

85
Kombinacije razine faktora A i B
Faktor B
Faktor A B1 B2
A1 A1B1 A1B2
A2 A2B1 A2B2

Ukupno ima četiri kombinacije razina faktora

Shema faktorijalnog plana sa mjerenjima yijk


A1 A2
B1 B2 B1 B2
y111 y121 y211 y221
y112 y122 y212 y222
... ... ... ...
y11n y12n y21n y22n

Sume kvadrata:

SSUKUP = SSA + SSB+ SSAB+ SSOST

stupnjevi slobode
(abn–1) = (a–1) + (b–1) + (a–1)(b–1) + ab(n–1)

Sume kvadrata:
SSUKUP = ∑i ∑ j ∑k ( y ijk − y...) 2

SS A = ∑i ∑ j ∑k ( y i .. − y...) 2 = bn ∑i ( y i .. − y...) 2
SS B = ∑∑ ∑ ( y. . − y...) = an ∑ ( y. . − y...)
i j k j
2
i j
2

SS AB = n ∑ ∑ ( y . − y...) − SS − SS
i j ij
2
A B

SSOST = ∑ ∑ ∑ ( y − y .)
i j k ijk ij
2

SSOST = ∑ ∑ ∑ ( y − y .)
i j k ijk ij
2

Sume kvadrata se mogu izračunati i kratkim načinom:

1) Ukupna suma = i j k yijk = y... ΣΣΣ


2) Korekcijski faktor za srednju vrijednost:

C=
(∑ ∑ ∑ y )i j k ij
2

=
(ukupna suma)2
abn ukupni broj opazanja

3) SSUKUP = Σ Σ Σ (y i j k ijk)
2
–C

4) SS A = ∑i
(∑ ∑ y ) − Cj k ijk
2

nb

86
5) SS B = ∑ j
(∑ ∑ y )
i k ijk
2

−C
na

6) SS AB = ∑∑
(∑ y )
k ijk
2

− SS A − SS B − C
i j
n
7) SSOST = SSUKUP – SSA – SSB – SSAB

Prosjeci kvadrata
MSA = SSA/ (a–1)
MSB = SSB/ (b–1)
MSAB = SSAB/ (a–1)(b–1)
MSOST = SSOST/[ab(n–1)]

ANOVA tablica

Izvor SS df MS=SS/df F
A SSA a–1 MSA MSA/MSOST (2)

B SSB b–1 MSB MSB/MSOST (3)

AB SSAB (a–1)(b–1) MSAB MSAB/MSOST (1)

Ostatak SSOST ab(n–1) MSE


Ukupno SSUKUP abn–1

(1) F-provjera za interakciju


(2) F-provjera za faktor A (ukoliko nema interakcije)
(3) F-provjera za faktor B (ukoliko nema interakcije)

Ukoliko je interakcija značajna provjera za glavne utjecaje nema smisla.

A2
0.75
0.70
0.65
Prirast (kg)

0.60 A2
0.55
0.50 A1
A1
0.45
0.40
B1 B2
Razine faktora B

Slika 12-1: Prikaz interakcije 2 × 2 faktorijalnog pokusa.

87
12.1 SAS primjer za faktorijalni pokus

Primjer: Istraživan je utjecaj dodavanja dva vitamina (I i II) u krmivo na prosječni dnevni prirast kod
svinja. Primijenjeni su dvije razine vitamina I (0 i 40 mg) i dvije razine vitamina II (0 i 5 mg).
Izabrano je 20 životinja. Na njih su slučajnim izborom primijenjene 4 kombinacije vitamina I i II.
Izmjereni su slijedeći dnevni prirasti:

Vitamin I 0 mg 4mg
Vitamin II 0 mg 5 mg 0 mg 5 mg
0.585 0.567 0.473 0.684
0.536 0.545 0.450 0.702
0.458 0.589 0.869 0.900
0.486 0.536 0.473 0.698
0.536 0.549 0.464 0.693

SAS program:

DATA prirast;
INPUT vitI vitII prirast @@;
DATALINES;
1 1 0.585 2 1 0.473
1 1 0.536 2 1 0.450
1 1 0.458 2 1 0.869
1 1 0.486 2 1 0.473
1 1 0.536 2 1 0.464
1 2 0.567 2 2 0.684
1 2 0.545 2 2 0.702
1 2 0.589 2 2 0.900
1 2 0.536 2 2 0.698
1 2 0.549 2 2 0.693
;
PROC GLM;
CLASS vitI vitII;
MODEL prirast= vitI vitII vitI*vitII;
LSMEANS vitI*vitII / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;

SAS ispis:
Dependent Variable: prirast
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 3 0.14521095 0.04840365 4.39 0.0196
Error 16 0.17648360 0.01103023
Corrected Total 19 0.32169455
R-Square Coeff Var Root MSE prirast Mean
0.451394 17.81139 0.10502 0.58965

Source DF Type III SS Mean Square F Value Pr > F


vitI 1 0.05191805 0.05191805 4.71 0.0454
vitII 1 0.06418445 0.06418445 5.82 0.0282
vitI*vitII 1 0.02910845 0.02910845 2.64 0.1238

Least Squares Means

88
Adjustment for multiple comparisons: Tukey
vit vit Standard LSMEAN
I II prirast LSMEAN Error Pr > |t| Number
1 1 0.52020000 0.04696855 0.0001 1
1 2 0.55720000 0.04696855 0.0001 2
2 1 0.54580000 0.04696855 0.0001 3
2 2 0.73540000 0.04696855 0.0001 4

Least Squares Means for effect vitI*vitII


Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: prirast

i/j 1 2 3 4
1 0.9433 0.9799 0.0238
2 0.9433 0.9981 0.0701
3 0.9799 0.9981 0.0506
4 0.0238 0.0701 0.0506

89
13 Hijerarhijski pokusni planovi

- Uzorci se biraju u dva ili više koraka.


- dvo-, tro- ili više hijerarhijski planovi

Primjer :
- 3 razine faktora A
- 3 razine faktora B unutar razina faktora A
- slučajni uzorak unutar razina B

A 1 2 3
6 44 7 4 4
8 6 44 7 4 4
8 6 44 7 4 4
8

B 1 2 3 4 5 6 7 8 9
y111 y121 y131 y141 y151 y161 y171 y181 y191
y112 y122 y132 y142 y152 y162 y172 y182 y192

y11n y12n y13n y14n y15n y16n y17n y18n y19n

Statistički model:
yijk = µ + Ai + B(A)ij + εijk
i = 1,....,a; j = 1,....,b; n = 1,......,n

yijk = k-to opažanje za razinu i faktora A i razinu j faktora B


µ = ukupni prosjek korigiran na sve utjecaje,
Ai = utjecaj i razine faktora A
B(A)ij = utjecaj razine j faktora B unutar razine i faktora A
εijk - ostatak, slučajni N(0, σ2)

- razine faktora B nezavisne između različitih razina faktora A.

Sume kvadrata:
SSUKUP = SSA + SSB(A) + SSUnutar B

stupnjevi slobode:
(abn–1) = (a–1) + (b–1) + a(b–1) + ab(n–1)

Sume kvadrata definirane su kao:


SSUKUP = ∑i ∑ j ∑k ( yijk − y...) 2
SS A = ∑i ∑ j ∑k ( yi .. − y...) 2 = bn∑i ( yi .. − y...) 2
SS B ( A) = ∑i ∑ j ∑k ( y ij . − y i ..) 2 = n ∑i ∑ j ( y ij . − y i ..) 2

SSUNUTAR B = ∑∑ ∑ ( y
i j k ijk − yij .) 2

90
Skraćeni način računanja:

1) Ukupna suma: i j ΣΣΣ


k yijk
2) Korekcijski faktor za srednju vrijednost:

C=
(∑ ∑ ∑ y )
i j k ij
2

=
(ukupna suma)2
abn ukupni broj opazanja

3) SSUKUP = Σ Σ Σ (y
i j k ijk)
2
–C

4) SS A = ∑i
(∑ ∑ y ) − C
j k ijk
2

nb

5) SS B ( A) = ∑∑
(∑ y ) k ijk
2

− SS A − C
i j
n
6) SSUnutar B = SSUKUP – SSA – SSB(A)

ANOVA tablica:

Izvor SS df MS=SS/df
A SSA a–1 MSA
B unutar A SSB(A) a(b–1) MSB(A)
Unutar B SSUnutar B ab(n–1) MSUnutar B
Ukupno SSUKUP abn–1

Utjecaj 'Unutar B' je neprotumačeni utjecaj ili ostatak.

Očekivanja prosjeka kvadrata (E(MS)) ovise da li su utjecaji A i B fiksni ili slučajni:

E(MS) (A fix i B fix) (A fix i B sluč.) (A sluč. i B sluč.)


E(MSA) σ2 + Q(A) σ2 + n σ2B + Q(A) σ2 + n σ2B + nb σ2A
E(MSB(A)) σ2 + Q(B(A)) σ2 + n σ2B σ2 + n σ2B
E(MSUntr B) σ2 σ2 σ2

n = broj razina unutar B


Q = neki fiksni, izračunati broj

Definicija pokusne greške, a time i F provjera ovisi da li su utjecaji (faktori) fiksni ili slučajni.
Najčešće je B slučajan:
- pokusna greška za provjeru utjecaja A je: MSB(A)
- pokusna greška za utjecaj B je: MSUnutar B.
F-statistika za utjecaj A:
MS A
F=
MS B ( A)
F-statistika za utjecaj B:
MS B ( A)
F=
MSUnutarB

91
13.1 SAS primjer za hijerarhijski plan

Primjer:Cilj pokusa je bio utvrditi utjecaj majki i očeva na varijabilnost porodne težine prasadi.
Upotrijebljen je hijerarhijski plan: Slučajno je izabrano 4 nerasta, po svakom nerastu dvije krmače i
po svakoj krmači dva praseta. Podaci, zajedno sa sumama i kvadratima po nerastovima i krmačama,
prikazani su u slijedećoj tablici:

Nerast Krmača Prase Težina


1 1 1 1.2
1 1 2 1.2
1 2 3 1.2
1 2 4 1.3
1 3 5 1.1
1 3 6 1.2
2 4 7 1.2
2 4 8 1.2
2 5 9 1.1
2 5 10 1.2
2 6 11 1.2
2 6 12 1.1
3 7 13 1.2
3 7 14 1.2
3 8 15 1.3
3 8 16 1.3
3 9 17 1.2
3 9 18 1.2
4 10 19 1.3
4 10 20 1.3
4 11 21 1.4
4 11 22 1.4
4 12 23 1.3
4 12 24 1.3

SAS program za MIXED proceduru:

DATA pig;
INPUT boar sow piglet por_tezina @@;
DATALINES;
1 1 1 1.2 1 1 2 1.2 1 2 1 1.2
1 2 2 1.3 1 3 1 1.1 1 3 2 1.2
2 1 1 1.2 2 1 2 1.2 2 2 1 1.1
2 2 2 1.2 2 3 1 1.2 2 3 2 1.1
3 1 1 1.2 3 1 2 1.2 3 2 1 1.3
3 2 2 1.3 3 3 1 1.2 3 3 2 1.2
4 1 1 1.3 4 1 2 1.3 4 2 1 1.4
4 2 2 1.4 4 3 1 1.3 4 3 2 1.3
;
PROC MIXED DATA=pig METHOD = TYPE3;
CLASS boar sow;
MODEL por_tezina = / DDFM = KENWARDROGER;
RANDOM boar sow(boar)/S;
RUN;

92
SAS ispis MIXED procedure
Type 3 Analysis of Variance

Sum of
Source DF Squares Mean Square Expected Mean Square
boar 3 0.093333 0.031111 Var(Residual)+2Var(sow(boar))+6Var(boar)
sow(boar) 8 0.040000 0.005000 Var(Residual)+2Var(sow(boar))
Residual 12 0.020000 0.001667 Var(Residual)

Error
Source Error Term DF F Value Pr > F
boar MS(sow(boar)) 8 6.22 0.0174
sow(boar) MS(Residual) 12 3.00 0.0424
Residual . . . .

Covariance Parameter
Estimates

Cov Parm Estimate


boar 0.004352
sow(boar) 0.001667
Residual 0.001667

Solution for Random Effects

Std Err
Effect boar sow Estimate Pred DF t Value Pr > |t|
boar 1 -0.02798 0.04239 3.96 -0.66 0.5456
boar 2 -0.05595 0.04239 3.96 -1.32 0.2579
boar 3 3.26E-15 0.04239 3.96 0.00 1.0000
boar 4 0.08393 0.04239 3.96 1.98 0.1195
sow(boar) 1 1 -0.00357 0.03390 7.87 -0.11 0.9187
sow(boar) 1 2 0.02976 0.03390 7.87 0.88 0.4060
sow(boar) 1 3 -0.03690 0.03390 7.87 -1.09 0.3085
sow(boar) 2 1 0.01508 0.03390 7.87 0.44 0.6684
sow(boar) 2 2 -0.01825 0.03390 7.87 -0.54 0.6051
sow(boar) 2 3 -0.01825 0.03390 7.87 -0.54 0.6051
sow(boar) 3 1 -0.02222 0.03390 7.87 -0.66 0.5308
sow(boar) 3 2 0.04444 0.03390 7.87 1.31 0.2268
sow(boar) 3 3 -0.02222 0.03390 7.87 -0.66 0.5308
sow(boar) 4 1 -0.01151 0.03390 7.87 -0.34 0.7431
sow(boar) 4 2 0.05516 0.03390 7.87 1.63 0.1430
sow(boar) 4 3 -0.01151 0.03390 7.87 -0.34 0.7431

93
14 Pokusni planovi sa kavezima i
pregonima
Pojedinačni tretman životinja:
Blok
I II
T2 T1
T1 T2
T1 T1
T2 T2

4 životinja po svakom bloku i na njih slučajno primijenimo 2 tretmana.

ANOVA tablica:

Izvor Stupnjevi slobode


Blok (b–1) = 1
Tretman (a–1) = 1
Blok x tretman (b–1)(a–1) = 1
Ostatak (Greška) ab(n–1)= 4
Ukupno (abn–1)= 7

Često je nemoguće životinje tretirati pojedinačno


cijeli kavez (boks, pregon) je pokusna jedinica.

Blok
I II
T1 T2
T1 T2
T2 T1
T2 T1

2 životinje u svakom kavezu


po 2 kaveza u bloku
na svaki kavez u bloku je slučajno primijenjen tretman

ANOVA tablica:

Izvor Stupnjevi slobode


Blok (b–1) = 1
Tretman (a–1) = 1
Pokusna greška = Blok × tretman (b–1)(a–1) = 1
Ostatak ab(n–1)= 4
Ukupno (abn–1)= 7

Pokusna greška za tretman ovdje je jednaka interakciji blok × tretman


94
pokusna jedinica je kavez (kombinacija blok × tretman)
Interakcija blok × tretman provjerava se ostatkom

Linearni model takvog plana je:


yijk = µ + τi + βj + δij + εijk

i = 1,......,a; a = broj tretmana


j = 1,......,b; b = broj blokova
k = 1,.....,n; n = broj ponavljanja

Gdje su:
yijk = opažanje k za tretman i u bloku j
µ, = ukupni prosjek
τi = fiksni utjecaj tretmana i
βj = fiksni utjecaj bloka j
δij = slučajna greška između pokusnih jedinica za provjeru tretmana s prosjekom 0 i varijancom σ2δ,
(interakcija tretman x blok)
εij = slučajna greška unutar pokusne jedinice s prosjekom 0 i varijancom σ2

Hipoteze:
H0: τ1 = τ2 =... = τa , nema utjecaja tretmana
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji

Očekivanja od MS:
E(MSpok gr) σ2 + n σ2δ
E(MSOST) σ2

95
15 Dvostruki blokovi
Primjer: 3 tretmana, 2 spol, 4 bloka prema početnoj težini
(8 blokova, 4 bloka unutar spola)
Ukupno trebamo 3×2×4=24 životinje.

Moguća shema plana pokusa:

Muški Ženke
Blok I Blok II Blok V Blok VI
T1 T2 T3 T1
T2 T1 T2 T2
T3 T3 T1 T3
Blok III Blok IV Blok VII Blok VIII
T1 T2 T2 T3
T3 T1 T1 T2
T2 T3 T3 T1

broj spolova, s = 2,
broj blokova unutar spola: b = 4,
broj tretmana: a = 3.

Izvor Stupnjevi slobode


Blok (2b–1) = 7
Spol (s–1) = 1
Blok unutar spola s(b–1) = 6
Tretman (a–1) = 2
Blok x tretman (2b–1)(a–1) = 14
Spol x tretman (s–1)(a–1) = 2
Ostatak s(b–1)(a–1) = 12
Ukupno (abs–1) = 23

Pokusni plan i statistički model ovisi da li se neki utjecaj definira kao blok ili tretman

96
Primjer:
3 tretmana (a = 3)
2 pasmine (p = 2)
4 Bloka (broj laktacije, b = 4)

Pokusni plan 1): Pasmina kao blok


- zanima nas najveća preciznost provjere utjecaja tretmana

Pasmina A Pasmina B

Lakt. I Lakt. II Lakt. I Lakt. II


T1 T2 T3 T1
T2 T1 T2 T2
T3 T3 T1 T3
Lakt. III Lakt. IV Lakt. III Lakt. IV
T1 T2 T2 T3
T3 T1 T1 T2
T2 T3 T3 T1

ANOVA tablica je:

Izvor Stupnjevi slobode


Pasmina (p–1)= 1
Laktacija unutar pasmine p(b–1)= 6
Tretman (a–1)= 2
Pasmina × tretman (p–1)(a–1)= 2
Ostatak p(b–1)(a–1)= 2
Ukupno (abp–1)= 23

Pokusni plan 2): Pasmina kao tretman


faktorijalni plan (2 × 3), postavljenih u slučajni blok plan (laktacije)
preciznija provjera utjecaja pasmine i pasmina × tretman

Lakt. I Lakt. II Lakt. III Lakt. IV


A T1 B T3 A T1 A T2
B T2 A T2 B T3 A T1
B T3 A T1 B T2 B T3
A T2 A T1 A T2 A T3
B T1 B T2 B T1 B T2
A T3 A T3 A T3 B T1

A i B su pasmine

97
ANOVA tablica:

Izvor Stupnjevi slobode


Laktacija (b–1)= 3
Pasmine (p–1)= 1
Tretman (a–1)= 2
Pasmina × tretman (p–1)(a–1)= 2
Ostatak (b–1)[(p–1)+(a–1)+(p–1)(a–1)] = 15
Ukupno (abp–1)= 23

Pokusni plan 3):


a) grupiramo prema laktaciji u četiri bloka;.
b) blokove podijelimo u dva boksa i u svaki od njih slučajno rasporedimo jednu pasminu;
c) na svaku pasminu unutar bloka primijenimo slučajno tretmane.

Split plot plan


- Dvije ‘vrste’ pokusnih jedinica:
- pasmina unutar laktacije
- tretman unutar pasmine unutar laktacije
- Dvije različite pokusne greške

Lakt. I Lakt. II
Pasmina A Pasmina B Pasmina B Pasmina A
T1 T2 T3 T1
T2 T1 T2 T2
T3 T3 T1 T3
Lakt. III Lakt. IV
Pasmina B Pasmina A Pasmina A Pasmina B
T1 T2 T2 T3
T3 T1 T1 T2
T2 T3 T3 T1

ANOVA tablica:

Izvor Stupnjevi slobode


Laktacija (b–1)= 3
Pasmine (p–1)= 1
Greška a (Laktacija × Pasmina) (b–1)(p–1)= 3
Glavni plot (b–1)+(p–1)+(b–1)(p–1) = 7

Tretman (a–1) = 2
Pasmina × tretman (p–1)(a–1) = 2
Greška b p(a–1)(b–1) = 12

Ukupno (abp–1) = 23

Izbor plana ovisi o:


- mogućnosti smještaja
- željenoj preciznosti pokusa za pojedine faktore
98
Redoslijed preciznosti pokusa za pojedine faktore:

Plan 1 Plan 2 Plan 3


Tretman 1 3 2
Pasmina 3 1 2
Pasmina × Trtetman 3 1 1

99
16 Split plot pokusni plan

Značajke:
- pokusni materijal podjeli u više glavnih jedinica (plotovi) na koje se apliciraju razine nekog
faktora, a zatim se cijele jedinice podijele u podjedinice (split plotovi) na koje se primjenjuju
razine drugog faktora

- plan može uključiti jedan ili više potpuno slučajni, slučajni blok plan ili latinski kvadrat koji
se primjenjuju na jedinice ili podjedinice

- tretmani se dodjeljuju slučajno u dvije stepenice:


1. razine faktora A slučajno na glavne jedinice (plotove)
2. razine faktora B se slučajno na svaku podjedinicu (subplotove)

Split plot plan se može koristiti:


1. kada jedan faktor zahtjeva više pokusnog materijala nego neki drugi faktor.
- u poljskim ili laboratorijskim pokusima.
- pripreme zemlje (A) varijetet (B)
2. Kada se jedan faktor primjenjuje kasnije. Taj faktor se primjenjuje na subjedinice (faktor B).
3. Varijabilnost između cijelih jedinica se očekuje da će biti veća nego ona između subjedinica.
4. Ako je veća preciznost potrebna za jedan od faktora. Taj faktor se primjenjuje na subjedinice
(faktor B).

16.1 Faktor A (glavni faktor) kao slučajni blok plan

Blok 1 Blok 2 Blok 3


B2 B2 B1 B2 B1 B2 B1 B1 B2 B1 B2 B1

B1 B1 B2 B1 B2 B1 B2 B2 B1 B2 B1 B2

A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3

Model:
yijk = µ + Blokk + Ai + δik + Bj +(AB)ij + εijk
i = 1,....,a; j = 1,....,b ; k = 1,......,n

yijk = k-to opažanje za razinu i faktora A i razinu j faktora B


µ = ukupni prosjek korigiran na sve utjecaje
Blokk = utjecaj bloka
Ai = utjecaj faktora A
Bj = utjecaj faktora B
(AB)ij = utjecaj interakcije A × B
100
δik = cijeli plot greška N(0, σ2t) = interakcija Blokk × Ai
εijk = split plot greška N(0, σ2)

Također je µij = Ai + Bj +(AB)ij = prosjek ij-te A x B kombinacije.

a = broj razina tretmana A


b = broj razina tretmana B
n = broj blokova (ponavljanja)

Cijeli plot greška i split plot greška su nezavisni.

Primjer:
a = 4, b = 2, n = 3
ANOVA tablica

Izvor Stupnjevi slobode


Blok (n–1) = 2
Tretmani A (a–1) = 3
Cijeli plot (n–1)(a–1) = 6
greška
Tretmani B (b–1) = 1
AxB (a–1)(b–1)= 3
Split plot greška a(b–1)(n–1) = 8
Ukupno (abn–1)= 23

F provjera za faktor A:
MS A
F=
MSCijeli plot geska
Cijeli plot pokusna greška je prosjek kvadrata za interakcija blok × A.

F-provjera za faktor B:
MS B
F=
MSSplit plot greska
Split plot greška je prosjek kvadrata ostatka.

F-provjera za interakciju A × B:
MS AxB
F=
MSSplit plot greska

16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi

SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na
mliječnost krava je slijedeći. Načini tretiranja pašnjaka primijenjeni su na glavne jedinice kao
slučajni blok plan.

101
SAS program:

DATA spltblk;
INPUT blok past min milk @@;
DATALINES;
1 4 2 30 1 4 1 29 1 1 2 27 1 1 1 25
1 2 1 26 1 2 2 28 1 3 2 26 1 3 1 24
2 2 1 32 2 2 2 37 2 1 2 30 2 1 1 31
2 4 1 34 2 4 2 37 2 3 1 33 2 3 2 32
3 1 2 34 3 1 1 31 3 2 1 30 3 2 2 31
3 4 2 36 3 4 1 38 3 3 1 33 3 3 2 32
;
PROC MIXED DATA = spltblk;
CLASS blok past min;
MODEL milk =past min past*min / DDFM = KENWARDROGER;
RANDOM blok blok*past/;
LSMEANS past min past*min / DIFF ADJUST=TUKEY ;
RUN;

SAS ispis:

Covariance Parameter
Estimates

Cov Parm Estimate


blok 12.7431
blok*past 1.0486
Residual 2.2500

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
past 3 6 5.46 0.0377
min 1 8 3.63 0.0932
past*min 3 8 0.86 0.4981

Least Squares Means

Standard
Effect past min Estimate Error DF t Value Pr > |t|

past 1 29.6667 2.2298 2.51 13.30 0.0022


past 2 30.6667 2.2298 2.51 13.75 0.0020
past 3 30.0000 2.2298 2.51 13.45 0.0021
past 4 34.0000 2.2298 2.51 15.25 0.0015
min 1 30.5000 2.1266 2.09 14.34 0.0041
min 2 31.6667 2.1266 2.09 14.89 0.0038
past*min 1 1 29.0000 2.3124 2.9 12.54 0.0013
past*min 1 2 30.3333 2.3124 2.9 13.12 0.0011
past*min 2 1 29.3333 2.3124 2.9 12.69 0.0013
past*min 2 2 32.0000 2.3124 2.9 13.84 0.0010
past*min 3 1 30.0000 2.3124 2.9 12.97 0.0012
past*min 3 2 30.0000 2.3124 2.9 12.97 0.0012
past*min 4 1 33.6667 2.3124 2.9 14.56 0.0008
past*min 4 2 34.3333 2.3124 2.9 14.85 0.0008

102
Differences of Least Squares Means

Standard
Effect past min _past _min Estimate Error DF t Value Pr>|t| Adjust Adj P
past 1 2 -1.0000 1.2038 6 -0.83 0.4379 Tuk-Kr 0.8385
past 1 3 -0.3333 1.2038 6 -0.28 0.7911 Tuk-Kr 0.9918
past 1 4 -4.3333 1.2038 6 -3.60 0.0114 Tuk-Kr 0.0427
past 2 3 0.6667 1.2038 6 0.55 0.5997 Tuk-Kr 0.9421
past 2 4 -3.3333 1.2038 6 -2.77 0.0325 Tuk-Kr 0.1135
past 3 4 -4.0000 1.2038 6 -3.32 0.0159 Tuk-Kr 0.0587
min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932
past*min 1 1 1 2 -1.3333 1.2247 8 -1.09 0.3080 Tuk-Kr 0.9425
past*min 1 1 2 1 -0.3333 1.4829 11.5 -0.22 0.8261 Tuk-Kr 1.0000
past*min 1 1 2 2 -3.0000 1.4829 11.5 -2.02 0.0669 Tuk-Kr 0.5207
past*min 1 1 3 1 -1.0000 1.4829 11.5 -0.67 0.5134 Tuk-Kr 0.9955
past*min 1 1 3 2 -1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955
past*min 1 1 4 1 -4.6667 1.4829 11.5 -3.15 0.0088 Tuk-Kr 0.1407
past*min 1 1 4 2 -5.3333 1.4829 11.5 -3.60 0.0039 Tuk-Kr 0.0792
past*min 1 2 2 1 1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955
...
...
past*min 3 1 3 2 -222E-18 1.2247 8 -0.00 1.0000 Tuk-Kr 1.0000
past*min 3 1 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217
past*min 3 1 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868
past*min 3 2 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217
past*min 3 2 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868
past*min 4 1 4 2 -0.6667 1.2247 8 -0.54 0.6011 Tuk-Kr 0.9988

16.2 Faktor A (glavni faktor) kao potpuno slučajni plan

B2 B2 B1 B2 B1 B2 B1 B1

B1 B1 B2 B1 B2 B1 B2 B2

A4 A1 A2 A3 A2 A1 A4 A3

Model:
yijk = µ + Ai + δik + Bj +(AB)ij + εijk
i = 1,....,a; j = 1,....,b ; k = 1,......,n

ANOVA tablica

Izvor Stupnjevi slobode


Tretman A (a–1) = 3
Cijeli plot a(n–1) = 8
greška
Tretman B (b–1) = 1
A×B (a–1)(b–1)= 3
Split plot greška a(b–1)(n–1) = 8
Ukupno (abn–1)= 23

103
F provjera za A:
MS A
F=
MS Cijeli plot geska
Cijeli plot pokusna greška je prosjek kvadrata između plotova.
F-provjera za B:
MS B
F=
MS Split plot greska
Split plot greška je prosjek kvadrata ostatka.

F-provjera za interakciju A × B:
MS AxB
F=
MS Split plot greska

16.2.1 SAS primjer: Glavne jedinice u potpuno slučajnom planu

SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na
mliječnost krava kada su tretmani pašnjaka primijenjeni na glavne jedinice kao potpuno slučajni
plan.

SAS program:

DATA splt;
INPUT plot pas min milk @@;
DATALINES;
1 4 2 30 1 4 1 29 2 1 2 27 2 1 1 25
3 2 1 26 3 2 2 28 4 3 2 26 4 3 1 24
5 2 1 32 5 2 2 37 6 1 2 30 6 1 1 31
7 4 1 34 7 4 2 37 8 3 1 33 8 3 2 32
9 1 2 34 9 1 1 31 10 2 1 30 10 2 2 31
11 4 2 36 11 4 1 38 12 3 1 33 12 3 2 32
;
PROC MIXED DATA = splt;
CLASS plot pas min;
MODEL milk =pas min pas*min / DDFM = KENWARDROGER;
RANDOM plot(pas) /;
LSMEANS pas min pas*min / DIFF ADJUST=TUKEY ;
RUN;

SAS ispis:

Covariance Parameter
Estimates

Cov Parm Estimate


plot(pas) 13.7917
Residual 2.2500

Type 3 Tests of Fixed Effects

Num Den
Effect DF DF F Value Pr > F
pas 3 8 0.80 0.5302
min 1 8 3.63 0.0932
pas*min 3 8 0.86 0.4981

104
Least Squares Means

Standard
Effect pas min Estimate Error DF t Value Pr > |t|
pas 1 29.6667 2.2298 8 13.30 <.0001
pas 2 30.6667 2.2298 8 13.75 <.0001
pas 3 30.0000 2.2298 8 13.45 <.0001
pas 4 34.0000 2.2298 8 15.25 <.0001
min 1 30.5000 1.1562 9.2 26.38 <.0001
min 2 31.6667 1.1562 9.2 27.39 <.0001
pas*min 1 1 29.0000 2.3124 9.2 12.54 <.0001
pas*min 1 2 30.3333 2.3124 9.2 13.12 <.0001
pas*min 2 1 29.3333 2.3124 9.2 12.69 <.0001
pas*min 2 2 32.0000 2.3124 9.2 13.84 <.0001
pas*min 3 1 30.0000 2.3124 9.2 12.97 <.0001
pas*min 3 2 30.0000 2.3124 9.2 12.97 <.0001
pas*min 4 1 33.6667 2.3124 9.2 14.56 <.0001
pas*min 4 2 34.3333 2.3124 9.2 14.85 <.0001

Differences of Least Squares Means

Stand
Effect past min _pas _min Estimate Error DF t Pr>|t| Adj Adj P
pas 1 2 -1.0000 3.1535 8 -0.32 0.7593 Tuk-Kr 0.9881
pas 1 3 -0.3333 3.1535 8 -0.11 0.9184 Tuk-Kr 0.9995
pas 1 4 -4.3333 3.1535 8 -1.37 0.2067 Tuk-Kr 0.5469
pas 2 3 0.6667 3.1535 8 0.21 0.8379 Tuk-Kr 0.9964
pas 2 4 -3.3333 3.1535 8 -1.06 0.3214 Tuk-Kr 0.7231
pas 3 4 -4.0000 3.1535 8 -1.27 0.2403 Tuk-Kr 0.6053
min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932

105
17 Analiza kovarijance
Karakteristike:
- kategoričke + numeričke nezavisne varijable
- numerička varijabla = kovarijabla (kovarijanta)

Analiza kovarijance se koristi za:


- kontrolu pokusne greške i povećanja preciznosti
- korigiranje prosjeka tretmana na temelju nezavisne varijable
- procjena izgubljenih podataka
- procjena razlika nagiba krivulja između tretmana

17.1 Potpuno slučajni pokusni plan sa kovarijablom


- Za korigiranje prosjeka tretmana
- Kontrola pokusne greške
- Povećanje preciznosti

Model:
yij = β0 + β1xij + τi + εij i = 1,.....,a j = 1,...,n

Gdje su:
yij = Opažanje jedinice j u grupi i (tretmanu i)
β0 = odsječak na y osi
β1 = regresijski koeficijent
xij = kontinuirana nezavisna varijabla sa prosjekom µx
τi = fiksni utjecaj grupe ili tretmana i
εij = slučajna greška

Ukupni prosjek: µ = β0 + β1µx ,


Prosjek grupe i: µi = β0 + β1µx + τi . µx = prosjek kovarijable x.

Pretpostavke su slijedeće:
1) kovarijabla je fiksna i nezavisna od tretmana
2) greške su nezavisne jedna od druge
3) greška ima normalnu raspodjelu sa prosjekom 0 i homogenom varijancom.

106
Površina ispod standardne normalne krivulje (z > zα)

zα 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121

0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611

1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681

1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233

2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064

2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014

3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002

107
Kritične vrijednosti studentove t-raspodjele (t > tα)


Stupnjevi
t0.1 t0.05 t0.025 t0.01 t0.005 t0.001
slobode

1 3.078 6.314 12.706 31.821 63.656 318.289


2 1.886 2.920 4.303 6.965 9.925 22.328
3 1.638 2.353 3.182 4.541 5.841 10.214
4 1.533 2.132 2.776 3.747 4.604 7.173
5 1.476 2.015 2.571 3.365 4.032 5.894

6 1.440 1.943 2.447 3.143 3.707 5.208


7 1.415 1.895 2.365 2.998 3.499 4.785
8 1.397 1.860 2.306 2.896 3.355 4.501
9 1.383 1.833 2.262 2.821 3.250 4.297
10 1.372 1.812 2.228 2.764 3.169 4.144

11 1.363 1.796 2.201 2.718 3.106 4.025


12 1.356 1.782 2.179 2.681 3.055 3.930
13 1.350 1.771 2.160 2.650 3.012 3.852
14 1.345 1.761 2.145 2.624 2.977 3.787
15 1.341 1.753 2.131 2.602 2.947 3.733

16 1.337 1.746 2.120 2.583 2.921 3.686


17 1.333 1.740 2.110 2.567 2.898 3.646
18 1.330 1.734 2.101 2.552 2.878 3.610
19 1.328 1.729 2.093 2.539 2.861 3.579
20 1.325 1.725 2.086 2.528 2.845 3.552

21 1.323 1.721 2.080 2.518 2.831 3.527


22 1.321 1.717 2.074 2.508 2.819 3.505
23 1.319 1.714 2.069 2.500 2.807 3.485
24 1.318 1.711 2.064 2.492 2.797 3.467
25 1.316 1.708 2.060 2.485 2.787 3.450

26 1.315 1.706 2.056 2.479 2.779 3.435


27 1.314 1.703 2.052 2.473 2.771 3.421
28 1.313 1.701 2.048 2.467 2.763 3.408
29 1.311 1.699 2.045 2.462 2.756 3.396
30 1.310 1.697 2.042 2.457 2.750 3.385

40 1.303 1.684 2.021 2.423 2.704 3.307


50 1.299 1.676 2.009 2.403 2.678 3.261
60 1.296 1.671 2.000 2.390 2.660 3.232
120 1.289 1.658 1.980 2.358 2.617 3.160
∝ 1.282 1.645 1.960 2.326 2.576 3.090

108
Kritične vrijednosti hi-kvadrat raspodjele, χ2 > χ2α,

χα
Stupnjevi
χ20.1 χ20.05 χ20.025 χ20.01 χ20.005 χ20.001
slobode
0.1000 0.0500 0.0250 0.0100 0.0050 0.0010

1 2.706 3.841 5.024 6.635 7.879 10.827


2 4.605 5.991 7.378 9.210 10.597 13.815
3 6.251 7.815 9.348 11.345 12.838 16.266
4 7.779 9.488 11.143 13.277 14.860 18.466
5 9.236 11.070 12.832 15.086 16.750 20.515

6 10.645 12.592 14.449 16.812 18.548 22.457


7 12.017 14.067 16.013 18.475 20.278 24.321
8 13.362 15.507 17.535 20.090 21.955 26.124
9 14.684 16.919 19.023 21.666 23.589 27.877
10 15.987 18.307 20.483 23.209 25.188 29.588

11 17.275 19.675 21.920 24.725 26.757 31.264


12 18.549 21.026 23.337 26.217 28.300 32.909
13 19.812 22.362 24.736 27.688 29.819 34.527
14 21.064 23.685 26.119 29.141 31.319 36.124
15 22.307 24.996 27.488 30.578 32.801 37.698

16 23.542 26.296 28.845 32.000 34.267 39.252


17 24.769 27.587 30.191 33.409 35.718 40.791
18 25.989 28.869 31.526 34.805 37.156 42.312
19 27.204 30.144 32.852 36.191 38.582 43.819
20 28.412 31.410 34.170 37.566 39.997 45.314

21 29.615 32.671 35.479 38.932 41.401 46.796


22 30.813 33.924 36.781 40.289 42.796 48.268
23 32.007 35.172 38.076 41.638 44.181 49.728
24 33.196 36.415 39.364 42.980 45.558 51.179
25 34.382 37.652 40.646 44.314 46.928 52.619

26 35.563 38.885 41.923 45.642 48.290 54.051


27 36.741 40.113 43.195 46.963 49.645 55.475
28 37.916 41.337 44.461 48.278 50.994 56.892
29 39.087 42.557 45.722 49.588 52.335 58.301
30 40.256 43.773 46.979 50.892 53.672 59.702

40 51.805 55.758 59.342 63.691 66.766 73.403


50 63.167 67.505 71.420 76.154 79.490 86.660
60 74.397 79.082 83.298 88.379 91.952 99.608
70 85.527 90.531 95.023 100.425 104.215 112.317
80 96.578 101.879 106.629 112.329 116.321 124.839
90 107.565 113.145 118.136 124.116 128.299 137.208
100 118.498 124.342 129.561 135.807 140.170 149.449

109
Kritične vrijednosti F raspodjele, F> Fα, α = 0.05

Stupnjevi slobode brojnika


1 2 3 4 5 6 7 8

1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88


2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29
Stupnjevi slobode nazivnika

29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28


30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18
50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10
70 3.98 3.13 2.74 2.50 2.35 2.23 2.14 2.07
80 3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06
90 3.95 3.10 2.71 2.47 2.32 2.20 2.11 2.04
100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02

110
Kritične vrijednosti F raspodjele, F> Fα, α = 0.05


Stupnjevi slobode brojnika
9 10 12 15 20 24 30 60 120

1 240.54 241.88 243.90 245.95 248.02 249.05 250.10 252.20 253.25


2 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.48 19.49
3 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.57 8.55
4 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.69 5.66
5 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.43 4.40
6 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.74 3.70
7 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.30 3.27
8 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.01 2.97
9 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.79 2.75
10 3.02 2.98 2.91 2.85 2.77 2.74 2.70 2.62 2.58
11 2.90 2.85 2.79 2.72 2.65 2.61 2.57 2.49 2.45
12 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.38 2.34
13 2.71 2.67 2.60 2.53 2.46 2.42 2.38 2.30 2.25
14 2.65 2.60 2.53 2.46 2.39 2.35 2.31 2.22 2.18
15 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.16 2.11
16 2.54 2.49 2.42 2.35 2.28 2.24 2.19 2.11 2.06
17 2.49 2.45 2.38 2.31 2.23 2.19 2.15 2.06 2.01
18 2.46 2.41 2.34 2.27 2.19 2.15 2.11 2.02 1.97
19 2.42 2.38 2.31 2.23 2.16 2.11 2.07 1.98 1.93
20 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.95 1.90
21 2.37 2.32 2.25 2.18 2.10 2.05 2.01 1.92 1.87
22 2.34 2.30 2.23 2.15 2.07 2.03 1.98 1.89 1.84
23 2.32 2.27 2.20 2.13 2.05 2.01 1.96 1.86 1.81
24 2.30 2.25 2.18 2.11 2.03 1.98 1.94 1.84 1.79
25 2.28 2.24 2.16 2.09 2.01 1.96 1.92 1.82 1.77
26 2.27 2.22 2.15 2.07 1.99 1.95 1.90 1.80 1.75
27 2.25 2.20 2.13 2.06 1.97 1.93 1.88 1.79 1.73
28 2.24 2.19 2.12 2.04 1.96 1.91 1.87 1.77 1.71
Stupnjevi slobode nazivnika

29 2.22 2.18 2.10 2.03 1.94 1.90 1.85 1.75 1.70


30 2.21 2.16 2.09 2.01 1.93 1.89 1.84 1.74 1.68
40 2.12 2.08 2.00 1.92 1.84 1.79 1.74 1.64 1.58
50 2.07 2.03 1.95 1.87 1.78 1.74 1.69 1.58 1.51
60 2.04 1.99 1.92 1.84 1.75 1.70 1.65 1.53 1.47
70 2.02 1.97 1.89 1.81 1.72 1.67 1.62 1.50 1.44
80 2.00 1.95 1.88 1.79 1.70 1.65 1.60 1.48 1.41
90 1.99 1.94 1.86 1.78 1.69 1.64 1.59 1.46 1.39
100 1.97 1.93 1.85 1.77 1.68 1.63 1.57 1.45 1.38
120 1.96 1.91 1.83 1.75 1.66 1.61 1.55 1.43 1.35

111
Kritične vrijednosti F raspodjele, F> Fα, α = 0.01


Stupnjevi slobode brojnika
1 2 3 4 5 6 7 8

1 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95


2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89
17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23
Stupnjevi slobode nazivnika

29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20


30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99
50 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82
70 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78
80 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74
90 6.93 4.85 4.01 3.53 3.23 3.01 2.84 2.72
100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66

112
Kritične vrijednosti F raspodjele, F> Fα, α = 0.01


Stupnjevi slobode brojnika
9 10 12 15 20 24 30 60 120

1 6022.40 6055.93 6106.68 6156.97 6208.66 6234.27 6260.35 6312.97 6339.51


2 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.48 99.49
3 27.34 27.23 27.05 26.87 26.69 26.60 26.50 26.32 26.22
4 14.66 14.55 14.37 14.20 14.02 13.93 13.84 13.65 13.56
5 10.16 10.05 9.89 9.72 9.55 9.47 9.38 9.20 9.11
6 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.06 6.97
7 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.82 5.74
8 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.03 4.95
9 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.48 4.40
10 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.08 4.00
11 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.78 3.69
12 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.54 3.45
13 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.34 3.25
14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.18 3.09
15 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.05 2.96
16 3.78 3.69 3.55 3.41 3.26 3.18 3.10 2.93 2.84
17 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.83 2.75
18 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.75 2.66
19 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.67 2.58
20 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.61 2.52
21 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.55 2.46
22 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.50 2.40
23 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.45 2.35
24 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.40 2.31
25 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.36 2.27
26 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.33 2.23
27 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.29 2.20
28 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.26 2.17
Stupnjevi slobode nazivnika

29 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.23 2.14


30 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.21 2.11
40 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.02 1.92
50 2.78 2.70 2.56 2.42 2.27 2.18 2.10 1.91 1.80
60 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.84 1.73
70 2.67 2.59 2.45 2.31 2.15 2.07 1.98 1.78 1.67
80 2.64 2.55 2.42 2.27 2.12 2.03 1.94 1.75 1.63
90 2.61 2.52 2.39 2.24 2.09 2.00 1.92 1.72 1.60
100 2.59 2.50 2.37 2.22 2.07 1.98 1.89 1.69 1.57
120 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.66 1.53

113
Kritične vrijednosti studentiziranog raspona, q(a,v)

a = broj grupa
v = stupnjevi slobode pokusne greške
α = 0.05

Broj grupa (a)

V 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

1 18.00 27.00 32.80 37.20 40.50 43.10 45.40 47.30 49.10 50.60 51.90 53.20 54.30 55.40 56.30
2 6.09 8.33 9.80 10.89 11.73 12.43 13.03 13.54 13.99 14.39 14.75 15.08 15.38 15.65 15.91
3 4.50 5.91 6.83 7.51 8.04 8.47 8.85 9.18 9.46 9.72 9.95 10.16 10.35 10.52 10.69
4 3.93 5.04 5.76 6.29 6.71 7.06 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.67 8.80

5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83
6 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 6.65 6.79 6.92 7.04 7.14 7.24
7 3.34 4.16 4.68 5.06 5.35 5.59 5.80 5.99 6.15 6.29 6.42 6.54 6.65 6.75 6.84
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57
9 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 5.87 5.98 6.09 6.19 6.28 6.36

10 3.15 3.88 4.33 4.66 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.12 6.20
11 3.11 3.82 4.26 4.58 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.98 6.06
12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.61 5.71 5.80 5.88 5.95
13 3.06 3.73 4.15 4.46 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.56 5.64 5.72 5.79

15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.72
16 3.00 3.65 4.05 4.34 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66
17 2.98 3.62 4.02 4.31 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.55 5.61
18 2.97 3.61 4.00 4.28 4.49 4.67 4.83 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.57
19 2.96 3.59 3.98 4.26 4.47 4.64 4.79 4.92 5.04 5.14 5.23 5.32 5.39 5.46 5.53

20 2.95 3.58 3.96 4.24 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.50
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38
30 2.89 3.48 3.84 4.11 4.30 4.46 4.60 4.72 4.83 4.92 5.00 5.08 5.15 5.21 5.27
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 4.82 4.90 4.98 5.05 5.11 5.17

60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06
120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.84 4.90 4.95
∝ 2.77 3.32 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.84

114

You might also like