Professional Documents
Culture Documents
Miroslav Kapš
tel: 239-3949
e-mail: mkaps@agr.hr
1 UVOD ............................................................................................................................................................................. 1
1.1 PODACI I VARIJABLE .................................................................................................................................................. 1
1.2 PRIKAZ PODATAKA .................................................................................................................................................... 3
1.2.1 Grafički prikazi ................................................................................................................................................. 3
1.2.2 Numeričke metode za opis kvantitativnih podataka.......................................................................................... 3
1.2.3 Simboli .............................................................................................................................................................. 3
1.2.4 Aritmetička srednja vrijednost:......................................................................................................................... 4
1.2.5 Varijanca uzorka: ............................................................................................................................................. 4
1.2.6 Standardna devijacija uzorka ........................................................................................................................... 5
1.2.7 Uvodni SAS primjer .......................................................................................................................................... 5
1.3 ZAKLJUČCI O POPULACIJAMA NA TEMELJU UZORAKA ................................................................................................ 6
1.4 SLUČAJNE VARIJABLE I NJIHOVE RASPODJELE ........................................................................................................... 6
1.4.1 Raspodjele vjerojatnosti za diskretne slučajne varijable.................................................................................. 7
1.4.2 Raspodjele vjerojatnosti za kontinuirane slučajne varijable ............................................................................ 8
1.5 FUNKCIJE SLUČAJNE VARIJABLE .............................................................................................................................. 14
1.5.1 Neke statistike i njihove raspodjele................................................................................................................. 15
1.5.2 Stupnjevi slobode ............................................................................................................................................ 16
1.6 ZAKLJUČIVANJE O POPULACIJI NA TEMELJU UZORAKA ............................................................................................ 16
1.7 PROCJENA PARAMETARA ......................................................................................................................................... 16
1.7.1 Procjena srednje vrijednosti populacije ......................................................................................................... 17
1.7.2 Procjena varijance u normalnoj populaciji.................................................................................................... 17
1.8 PROVJERA HIPOTEZA ............................................................................................................................................... 17
1.8.1 P-vrijednost..................................................................................................................................................... 18
1.8.2 Statistička i praktična značajnost ................................................................................................................... 19
1.8.3 Moguće greške kod statističkog zaključivanja i snaga provjere..................................................................... 19
2 JEDNOSTAVNA LINEARNA REGRESIJA ........................................................................................................... 21
2.1 UVOD ...................................................................................................................................................................... 21
2.2 PROCJENA PARAMETARA Β0 I Β1 ............................................................................................................................... 23
2.3 OSTATAK I SVOJSTVA OSTATKA............................................................................................................................... 24
2.4 PROSJECI I VARIJANCE PROCJENITELJA .................................................................................................................... 24
2.5 STUDENTOVA T-PROVJERA I INTERVAL POUZDANOSTI PROCJENE PARAMETARA ...................................................... 25
2.6 INTERVAL POUZDANOSTI ZA Β1 ................................................................................................................................ 26
2.7 INTERVALI POUZDANOSTI ZAVISNE VARIJABLE ....................................................................................................... 26
2.8 RAŠČLANJENJE UKUPNE VARIJABILNOSTI ................................................................................................................ 28
2.8.1 Veza između suma kvadrata............................................................................................................................ 29
2.9 PROVJERA HIPOTEZA - F- PROVJERA ........................................................................................................................ 30
2.10 KOEFICIJENT DETERMINACIJE (R2) ........................................................................................................................ 31
2.11 SAS PRIMJER ZA JEDNOSTAVNU LINEARNU REGRESIJU .......................................................................................... 32
3 KOEFICIJENT KORELACIJE ................................................................................................................................ 34
3.1 PROCJENA KOEFICIJENTA KORELACIJE..................................................................................................................... 35
4 VEKTORI I MATRICE ............................................................................................................................................. 36
4.1 TIPOVI I SVOJSTVA MATRICA ................................................................................................................................... 36
4.1.1 Operacije s matricama i vektorima: ............................................................................................................... 37
5 JEDNOSTAVNA REGRESIJA U MATRIČNOM PRIKAZU............................................................................... 40
6 MULTIPLA REGRESIJA.......................................................................................................................................... 43
6.1 DVIJE NEZAVISNE VARIJABLE .................................................................................................................................. 43
6.1.1 Raščlanjenje ukupne varijabilnosti i provjera hipoteza ................................................................................. 45
6.2 PARCIJALNE I STUPNJEVITE EKSTRA SUME KVADRATA ............................................................................................ 46
6.3 SAS PRIMJER ZA MULTIPLU REGRESIJU ................................................................................................................... 47
6.4 KRIVOLINIJSKA REGRESIJA DRUGOG STUPNJA ......................................................................................................... 48
6.4.1 SAS primjer za kvadratnu regresiju................................................................................................................ 49
6.5 MOGUĆE POTEŠKOĆE KOD UPOTREBE REGRESIJE .................................................................................................... 50
6.5.1 Analiza ostataka i narušenost pretpostavki modela........................................................................................ 51
6.5.2 Loša opažanja................................................................................................................................................. 52
6.5.3 Multikolinearnost............................................................................................................................................ 52
6.6 IZGRADNJA MODELA I KRITERIJI ZA IZBOR MODELA................................................................................................. 53
7 JEDNOSTRUKA ANALIZA VARIJANCE ............................................................................................................. 54
7.1 MODEL JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA ........................................................................ 55
7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti: ......................................................................... 56
7.1.2 Postavljanje hipoteza i F-provjera ................................................................................................................. 57
7.2 USPOREDBA SREDNJIH VRIJEDNOSTI POJEDINIH GRUPA ........................................................................................... 59
7.2.1 Najmanja značajna razlika (LSD) .................................................................................................................. 59
7.2.2 Tukey provjera (HSD)..................................................................................................................................... 59
7.3 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE S FIKSNIM UTJECAJIMA .............................................................. 60
7.4 MODEL SA SLUČAJNIM UTJECAJIMA GRUPA ............................................................................................................. 61
7.5 INTRAKLASNA KORELACIJA ..................................................................................................................................... 63
7.6 SAS PRIMJER JEDNOSTRUKE ANALIZE VARIJANCE SA SLUČAJNIM UTJECAJIMA ....................................................... 64
8 NAČELA PLANIRANJA POKUSA.......................................................................................................................... 65
8.1 POKUSNA JEDINICA I TRETMANI .............................................................................................................................. 66
8.2 PONAVLJANJA I POKUSNA GREŠKA .......................................................................................................................... 66
8.3 POTREBAN BROJ PONAVLJANJA ............................................................................................................................... 67
9 POTPUNO SLUČAJNI POKUSNI PLAN................................................................................................................ 68
15 DVOSTRUKI BLOKOVI......................................................................................................................................... 96
Varijabla
– Označava skup podataka
– Poprima različite vrijednosti
• vrijednosti varijable pokazuju varijabilnost
– Primjeri: težina, količina mlijeka, spol, boja očiju
–
Podaci su vrijednosti koje varijabla poprima.
- težina od 200 kg, ili količina mlijeka od 20 kg.
VARIJABLE
KVALITATIVNE KVANTITATIVNE
(ATRIBUTIVNE, KATEGORIČKE). (NUMERIČKE)
VARIJABLE
A) kvantitativne (numeričke)
- čije se vrijednosti prikazuju brojevima, a razlike između brojeva imaju numeričko značenje
- težina životinja, broj mladih u leglu, temperatura, vrijeme
a) diskretne
- konačna ili beskonačna
- prebrojiva, mjeri sa cijelim ili prirodnim brojevima
- broj mladih u leglu ili broj jaja
1
b) kontinuirane
- poprima beskonačno mnogo vrijednosti
- njene vrijednosti mjere se realnim brojevima
- količina mlijeka ili težina
Statističke metode
Biometrika (Biostatisika), a posebno statističke metode uključuju dva glavna pristupa u donošenju
zaključaka:
1. Opis nekog skupa podataka (opisna statistika)
2. Izbor uzoraka iz većeg skupa podataka (populacije, izvora podataka) i korištenje tih uzoraka za
zaključak o toj populaciji (populacijama)
2
1.2 Prikaz podataka
1.2.1 Grafički prikazi
Primjer: Histogram:
-raspodjela frekvencija nekog skupa podataka
- podaci se svrstavaju u razrede
- prikazuje broj opažanja u pojedinom razredu
- prava ili relativna frekvencija
16
16
14 12 12
12
Broj teladi
10 8 8 8
8 7 7
6
6 5 5
4 2 2
2 1 1
0
190 200 210 220 230 240 250 260 270 280 290 300 310 320 330
Sredine razreda
1.2.3 Simboli
3
Primjer:
y y1 y2 y3
2 4 6
x x1 x2 x3
3 6 7
Σ y = y + y + y = 2 + 4 +6 = 12
i i 1 2 3
Σ y = y + y + y = 2 + 4 +6 = 56
i
2
i
2
1
2
2
2
3
2 2 2
y=
∑y i i
n
2. ∑ ( y − y ) = minimum
i i
2
drugim riječima ∑ (y
i i − y) <
2
∑ (yi i − a)
2
, za bilo koji broj a.
Ako se i prosjek izračunava iz istog uzorka kao y (tj. ako je nepoznat prosjek populacije)
s 2
=
∑( y i i − y )2
n −1
s =
2 i i ∑
( y − µ )2
n
∑( y i i − y) = 2
∑y 2
i i
− i i
n
4
1.2.6 Standardna devijacija uzorka
s = s2
prosječno odstupanje od prosjeka
Pogledajmo rješavanje primjera o uzorku težine teladi koristeći SAS software. Na detaljna
objašnjenja upotrebe programa čitaoca upućujem na iscrpnu SAS literaturu, dio koje može vidjeti u
popisu literature na kraju ove knjige. Ovdje možemo samo ukratko spomenuti da se svaki SAS
program sastoji od dva dijela: 1) DATA step, koji služi za unos ili kreiranje skupa podataka za koji
se želi napraviti analiza, i 2) PROC step, koji služi za analizu podataka. Treba još reći da SAS
software daje mogućnost obrade podataka i bez pisanja programa sa instrukcijama, tj. koristeći i
birajući ponuđene opcije za željenu analizu. Međutim, pisanje programa daje korisniku veće
mogućnosti i znanje o korištenju programa bez obzira na kompjutersku platformu. SAS ima tri
osnovna prozora: Program prozor (PGM) u koji se upisuje program, Ispis prozor (OUT) u kojem
korisnik može vidjeti ispis i LOG prozor u kojem se može provjeriti detalje o provedbi programa i
moguće greške. Vratimo se primjeru o težinama teladi. Izmjereni su slijedeći podaci 20 teladi:
SAS program:
DATA telad;
INPUT tezina @@;
DATALINES;
260 260 230 280 290 280 260 270 260 300
280 290 260 250 270 320 320 250 320 220
;
PROC MEANS DATA = telad N MEAN MIN MAX VAR STD CV ;
VAR tezina;
RUN;
Objašnjenje: SAS naredbe pisat ćemo uvijek velikim slovima da ih istaknemo, makar to u programu
nije potrebno, tj. program jednako tretira i velika i mala slova. Imena koja sam korisnik daje
varijablama i drugim oznakama pisat ćemo malim slovima. Naredba DATA definira ime datoteke
koja će sadržavati podatke, a ovdje je telad ime datoteke. Naredba INPUT definira ime varijable, a
naredba DATALINES govori da slijede podaci. Ovdje je varijabla tezina. SAS treba podatke
varijabli u kolonama, pa se u pravilu podaci i pišu u kolone. Na primjer,
INPUT tezina;
DATALINES;
260
260
…
220
;
učitava podatke varijable tezina. Podaci se mogu pisati i jedan za drugim u redu ako se koristi
oznaka @@ kod naredbe INPUT. SAS čita podatke jedan po jedan i sprema ih u kolonu. Program
koristi proceduru MEANS. Da bi označili da je to ime procedure treba napisati PROC MEANS.
DATA = telad, definira za koju datoteku će se računati statistike. Slijedi popis statistika koje
tražimo: N = broj podataka, MEAN = aritmetička srednja vrijednost, MIN = minimum, MAX =
maksimum, VAR = varijanca, STD= standardna devijacija, CV = koeficijent varijacije. Naredba
VAR definira varijablu (tezina) koja će se analizirati.
5
SAS ispis:
SAS ispis prikazuje ime varijable koja će se analizirati (Analysis varijabla: TEZINA), a zatim
opisnu statistiku.
• Populacija:
– Skup jedinki koje imaju neka zajednička svojstva od interesa
– Izvor podataka
• Parametri:
– Opisni pokazatelji populacije
– Obično nepoznate vrijednosti
– Primjer: prosjek populacije
• Koliki je prosjek količine mlijeka u laktaciji?
• Uzorak:
– Skup jedinki (podataka) izabran iz populacije
– Služi za procjenu i (ili) zaključivanje o populaciji.
– Vjerodostojnost procjene i zaključaka o populaciji je veća:
• ako je uzorak dobar predstavnik populacije
• uzorak mora biti slučajno izabran
• Statistike:
– Numerički opisni pokazatelji uzorka (eng. statistics)
– Mogu se izračunati iz uzoraka
– Primjer: aritmetička srednja vrijednost uzorka
6
– Barem dio te vrijednosti zato smatramo slučajnim
• Slučajna varijabla poprima određenu numeričku vrijednost s određenom vjerojatnosti
y je oznaka za varijablu
yi predstavlja vrijednost i-tog opažanje
- određeno opažanje: y1, y2
y ≤ y0 su sve vrijednosti koje su manje ili jednake od y0
Slučajne varijable
Vrijednost varijable y
- numerički događaj
- ima određenu vjerojatnost da se dogodi
Raspodjela vjerojatnosti slučajne varijable y:
- tablica, grafikon ili formula koji pokazuje vjerojatnost da y poprimi određenu vrijednost
Uvjeti:
1. O ≤ p(y) ≤ 1
2. Σ (svi y) p(y) =1
7
Primjeri diskretnih varijabli
• Binarna varijabla
– samo dva moguća rezultata neke pojave
– DA i NE ili 0 i 1 bolestan – zdrav i sl
• Binomna varijabla
– Broj povoljnih pokušaja (y) u ukupno n pokušaja
– U pojedinačnom pokušaju moguća samo dva rezultata
• broj ženske teladi u 4 telenja, broj bijelih praščića u leglu
Binomna raspodjela
- raspodjela vjerojatnosti y povoljnih opažanja (pokušaja) u ukupno n pokušaja
- broj ženske teladi u 4 telenja
- broj bijelih praščića u leglu
Raspodjela vjerojatnosti od y:
- određena parametrom p i brojem pokušaja n:
n
p ( y ) = p y q n − y
y
(y = 0,1,2,,...., n)
A) B)
0.3 0.4
fre 0.25 fre
kve 0.2 kve 0.3
nci nci
0.15 0.2
ja ja
0.1
0.1
0.05
0 0
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
broj povoljnih pokušaja broj povoljnih pokušaja
8
– Teoretski vrijednost kontinuirane varijable je točka, a matematički točka nema
dimenzije
– Vjerojatnost da slučajna varijabla poprimi neku određenu vrijednost je jednaka nuli
• VAŽNO:
– promatrati vjerojatnost da varijabla y poprima vrijednosti u nekom intervalu
– vjerojatnost se pridružuje numeričkom događaju koji se odnosi na neki interval
-∝ < y < +∝
0.4
σ=1
σ = 1.5
Frr 0.3
ekv
en
cija 0.2
0.1
0
-4 -3 -2 -1 0 1 2 3 4
Vjerojatnost da se slučajno izabrana jedinka (s nekom vrijednosti y) nalazi u intervalu (y1, y2) je
jednaka površini ispod normalne krivulje ograničena vrijednostima y1 i y2. (Uzima se da je
ukupna površina 1 ili 100%)
Ova vjerojatnost je jednaka proporciji jedinki s vrijednostima između y1 i y2
y1 = 170 y2 = 210
µ = 200
Slika 1-5: Površina ispod normalne krivulje ograničena vrijednostima 170 i 210
Primjer:
Vjerojatnost da y < 230
µ = 200 y0 = 230
10
• Budući da oblik krivulje ovisi samo o varijanci (odnosno stanardnoj devijaciji σ), sve
normalne krivulje se mogu standardizirati tj. prevesti u standardnu normalnu krivulju
• Standardizacija: slučajna normalna varijabla y se izrazi u jedinicama standardne devijacije:
y−µ
z=
σ
Standardna normalna krivulja je takva normalna krivulja kojoj je prosjek 0 i standardna devijacija 1
=> µ = 0 i σ = 1
2π
1.96 -1 0 1 1.96
95%
gdje su
y1 − µ y2 − µ
z1 = i z2 =
σ σ
11
Primjer
µ=200 y0=230 y
0 1.5 z
Slika 1-8: Prikaz normalne i standardne normalne krivulje. Prikazane su dvije skale: originalna skala y
i standardna normalna skala z. Vrijednost varijable y0 = 230 odgovara vrijednosti z0 = 1.5.
1.5 0 .5 z
12
f(z)
P
f(z0)
z0 zS z
0
Slika 1-10 Prosjek odabranih z vrijednosti. f(z0) = ordinata krivulje za z = z0, P je površina, odnosno
vjerojatnost P(z>z0) i zS je prosjek vrijednosti većih od z0.
Primjer:
Slučajna varijabla
χ2 = Σz j
2
j
13
stupnjevi slobode v = 16
stupnjevi slobode v = 2
Studentova t raspodjela je po obliku slična normalnoj samo što sa smanjenjem stupnjeva slobode
krivulja postaje više razvučenija (deblja) prema repovima (Slika 1.13).
Kada stupnjevi slobode idu prema beskonačnosti, t raspodjela prelazi u normalnu..
1.4.2.4 F-RASPODJELA
Neka su χ21 i χ22 hi-kvadrat slučajne varijable sa stupnjevima slobode v1 i v2. I neka su χ21 i χ22
nezavisni. Tada je:
χ12 v1
F= 2
χ 2 v2
slučajna varijabla sa F-raspodjelom
Oblik F raspodjele ovisi o stupnjevima slobode
f(F)
1.0 v1=2; v2=6
0.9
0.8 v1=10; v2=20
0.7
0.6 v1=6; v2=10
0.5
0.4
0.3
0.2
0.1
0.0 F
0 1 2 3 4 5
Slika 1.13 Funkcije gustoće F raspodjela sa stupnjevima slobode: a) v1=2 i v2 = 6; b) v1=6 i v2 = 10; c)
v1=10 i v2 =20
14
Statistike (engl. statistics)
• Numerički opisni pokazatelji izračunati iz uzorka
• Funkcije slučajne varijable => i same su slučajne varijable
• Primjeri: y i s2 su statistike
• Imaju poznate teoretske raspodjele
– => moguća procjena vjerojatnosti sa kojom se određena vrijednost statistike
pojavljuje
– => koriste se za donošenje zaključaka o populaciji
Ako se slučajno izabiru uzorci veličine n iz neke populacije sa srednjom vrijednosti µ i varijancom
σ2 i kada je n dovoljno velik, raspodjela srednjih vrijednosti uzoraka može se predočiti normalnom
funkcijom gustoće sa prosjekom
µy = µ
i standardnom devijacijom
σ
σy = .
n
σ y = standardna greška procijene prosjeka populacije
ili samo standardna greška
µ y
Slika 1-14: Raspodjela srednjih vrijednosti uzoraka
( n − 1) s 2
=
∑ ( y − y)
i
2
σ2 σ2
ima hi-kvadrat raspodjela sa v = (n–1) stupnjevima slobode, ako je y normalna varijabla.
15
y−µ
Statistika t = imai studentovu t raspodjelu sa (n–1) stupnjeva slobode, ako je y normalna
s2
n
varijabla.
Npr. prema centralnom graničnom teoremu raspodjela prosjeka uzorka će biti približno normalna za
velike uzorke ( n > 30), sa srednjom vrijednosti µ i standardnom devijacijom σ / n
16
1.7.1 Procjena srednje vrijednosti populacije
Jedinstveni procjenitelj od µ je y
Svojstava:
Očekivanje od aritmetičkog prosjeka je jedanko prosjeku populacije
- odstupanja ( y i − y ) imaju najmanju varijancu Var ( yi − y ) = min.
σ
- y ima normalnu raspodjelu sa µ i σ y =
n
Statistika
y−µ
z= ima standardnu normalnu raspodjelu
σy
s =
2 ∑
i
( yi − y ) 2
n −1
Ukoliko je y normalna varijabla sa prosjekom µ i varijancom σ2, tada je:
( n − 1) s 2
χ2 =
σ
2
( n − 1) s 2 ( n − 1) s 2
≤σ ≤
2
χ α2 / 2 χ (21−α / 2 )
Istraživačka hipoteza
Statistička hipoteza
17
Provjera hipoteza:
- na temelju informacija iz uzorka
- rezultira u jednoj od dvije odluke:
1. odluka da se H0 odbaci
2. odluka da se H0 ne odbaci, jer uzorak nije dao dovoljno dokaza da bi se H0 odbacila.
- H0 i H1, se uvijek postavljaju tako da isključuju jedna drugu
- kada odbacujemo H0, pretpostavljamo da je H1 točna.
- u zaključivanju koristimo zakone vjerojatnosti
1) Definiramo H0 i H1
2) Odredimo α (razinu značajnosti)
3) Izračunamo procjenu parametra
4) Odredimo statistiku za provjeru i njezinu raspodjelu kada vrijedi H0 i izračunamo njenu
vrijednost iz uzorka
5) Odredimo kritičnu vrijednost, kritično područje
6) Usporedimo izračunatu vrijednost statistike za provjeru sa kritičnim vrijednostima i donosimo
zaključak.
razina
značajnosti = α
α/2 α/2
- 0 zα/2
kritično kritična kritično
područje vrijednost područje
1.8.1 P-vrijednost
Drugi način da se odluči o prihvaćanju ili odbijanju nul hipoteze H0, je da se utvrdi vjerojatnost da
izračunata vrijednost statistike za provjeru pripada distribuciji kada H0 vrijedi. Ta vjerojatnost
obično se označava kao P vrijednost i predstavlja opaženu razinu značajnosti. Mnogi kompjuterski
statistički programi daju P vrijednost i ostavljaju istraživaču da sam odluči o prihvaćanju ili
odbijanju H0. Može se reći da se H0 odbacuje uz vjerojatnost pogreške koja je jednaka P
vrijednosti. P vrijednost se može koristiti i kada je razina značajnosti unaprijed određena. Za
zadanu razinu značajnosti α, ako je P vrijednost manja od α, H0 se odbacuje uz α razinu
značajnosti.
18
1.8.2 Statistička i praktična značajnost
Statistička značajnost ne mora uvijek značiti da istraživanje ima i praktičnu značajnost. Na primjer,
pretpostavimo pokus s upotrebom aditiva u hrani koji je povećao dnevni prirast u tovu junadi za 20
g. Ovo povećanje je relativno malo i najvjerojatnije nema ni praktično ni ekonomsko značenje.
Međutim uz dovoljno velik uzorak i takvo povećanje se može pokazati statistički značajno.
Također, razlike između populacija mogu imati praktično značenje, ali zbog malih uzoraka razlika
se nje pokazala statistički značajna u uzorcima.
Potreban je oprez u upotrebi riječi značajan. Pojam statistička značajnost vrijedi samo za uzorak.
Tako se može reći: “postoji značajna razlika između prosjeka uzoraka”, što znači da njihova
izračunata razlika vodi do izračunate P vrijednosti dovoljno male da možemo odbaciti H0. Ali treba
izbjegavati izraze kao “prosjeci populacije su značajno različiti”, jer prosjeci populacije mogu biti
samo praktično različiti, dakle oni su različiti ili nisu različiti. Potpuno je pogrešan izraz:
“alternativna hipoteza H1 je da su prosjeci dviju populacije značajno različite”, jer alternativna
hipoteza znači samo razliku, a prihvaćanje alternativne hipoteze putem statističke provjere ne znači
automatski i praktičnu značajnost.
Nije odbačena H0
provjere
P = 1–α P=β
Odluka
1 – β = snaga provjere
µ0 Raspodjela ako
vrijedi H1
Snaga provjere
µ1
Kritično područje
Snaga provjere:
- veća snaga provjere (ili analogno mali β, jer snaga je jednaka 1– β) je važna u slučaju kada
ne odbacujemo nul hipotezu
- ako provjera ima malu snagu i nije odbačena nul hipoteza, zaključak je sumnjiv i velika je
šansa da radimo tip II grešku
- obično ne donosimo zaključke o jednakosti dva ili više parametara baš zbog često velike
vjerojatnosti β, odnosne male snage (1 – β)
Snaga provjere može se odrediti ako pretpostavimo nekoliko specifičnih alternativnih hipoteza sa
različitim parametrima
20
2 Jednostavna linearna regresija
2.1 Uvod
Mjerenja više varijabli
Pitanja:
- kakav utjecaj imaju varijable jedna na drugu
- da li postoji funkcijska veza između varijabli
Primjer:
- kako promjena vanjske temperature za jedan stupanj utječe na promjenu konverziju hrane
- kako promjena razine proteina u hrani utječe na promjenu dnevnog prirasta.
Regresija
- uključuje skup statističkih procedura kojima se izvode zaključci o vezi između varijabli
- proučava statističku vezu između varijabli na taj način da se jedna varijabla definira kao
zavisna varijabla, a ostale kao nezavisne varijable
- kako promjena nezavisnih varijabli utječe na promjenu zavisne varijable
zavisna varijabla = y (konverzija hrane)
nezavisne varijable = x (temperatura)
Statistički model:
y = β 0 + β1 x + ε
Odnosno,
y1 = β0 + β1x1 + ε1
y2 = β0 + β1x2 + ε2
............
yn = β0 + β1xn + εn
21
Očekivanje zavisne varijable y za zadani x je E(y|x) i predstavlja pravac.
E(yi| xi) = β0 + β1xi = pravac
y
E(y|x)
*
*
* *
*
* εi
*
* * (xi,yi )
Slika 2-1: Pravac linearne regresije. Zvjezdicama su prikazana prava mjerenja (xi,yi), Pravac E(y|x) je
očekivanje zavisne varijable, εi je odstupanje mjerenja od očekivanja
β1 β1
β0
∆x=1 x
y a) b) c)
x
y y
x x x
22
2.2 Procjena parametara β0 i β1
1) izabrati slučajni uzorak
2) izmjeriti y i x
Cilj: pronaći krivulju koja će ‘najbolje‘ opisati dani skup podataka; pronaći procjenitelje parametara
β 0 i β1 .
Procjenitelji parametara: β̂ 0 i βˆ1 ili b0 i b1.
E(yi|xi) se procjenjuje sa:
yˆ i = b0 + b1 xi
= procijenjeni pravac (krivulja) regresije, procijenjeni model
Ostatak:
ei = yi − yˆ i
Svako opažanje u uzorku se može napisati:
yi = b0 + b1xi + ei i = 1,.....n
y y$
* *
y$ i *
*
* * ei = yi − yˆi
*
* * yi
*
x
Slika 2-4: Procijenjeni pravac jednostavne linearne regresije.
23
Procjenitelji b1 i b0 :
SS xy
b1 =
SS xx
b0 = y − b1 x
Gdje su:
SS xy = ∑ (x i i − x )( y i − y )
= suma produkata y i x
∑ (x − x)
2
SS xx = i i
= suma kvadrata od x
n = veličina uzorka
Stupnjevi slobode:
n – (broj parametara koje treba procijeniti za dotičnu sumu kvadrata)
24
Nepristrani procjenitelj varijance σ2 je:
1 SSOST
s2 =
n−2
∑(y
i i − yˆ i ) =
2
n−2
= MSOST
MSOST =prosjek kvadrata za ostatak
Skraćeni način računanja sume kvadrata za ostatak:
( SS xy ) 2
SSOST = SS yy −
SS xx
Statistika za provjeru:
b −0
t= 1
sb1
Uz H0, statistika t ima t raspodjelu sa (n–2) stupnjeva slobode
Odbacujemo H0 ako je izračunata statistika |t| “velika”. Za α razinu značajnosti odbacujemo H0 ako
|t| ≥ tα/2,(n–2).
β1 = 0 b1
-tα/2 0 tα/2 t
Slika 2-5: Teoretska distribucija procjenitelja b1 i skala odgovarajuće t statistike
25
2.6 Interval pouzdanosti za β1
Procjenitelj: yˆ 0 = b0 + b1 x0 .
2 1 (xi − x )2
Var ( yˆ 0 ) = σ +
n SS xx
Standardna greška:
1 ( x − x )2
s yˆ 0 = s 2 + i
n SS xx
Interval pouzdanosti:
yˆ 0 ± s yˆ 0 t0.025, n − 2
Procjenitelj:
yˆ 0, NOVI = b0 + b1 x0 .
Varijanca procjenitelja:
1 (xi − x )2
Var ( y0, NOVI ) = σ 1 + +
ˆ 2
n SS xx
Standardna greška predviđenih novih vrijednosti zavisne varijable za danu vrijednost x0 je:
1 (xi − x )2
s yˆ0, NOVI = s 1 + +
2
.
n SS xx
26
Interval pouzdanosti za nova opažanja uz razinu značajnosti α = 0.05 je:
yˆ 0, NOVI ± s yˆ i , NOVI t0.025,n − 2
Prosjek populacije:
yˆ i ± s yˆ i pFα , p , n − p
Nova opažanja:
yˆ i ± s yˆ i , NOVI pFα , p ,n − p
Gdje su:
F = granična vrijednost F raspodjele za p i (n–p) stupnjeva slobode
p = broj parametara
n = broj opažanja
α = vjerojatnost da je barem jedan interval nekorektan.
750
700
Težina (kg)
650
600
550
212 214 216 218 220 222
Opseg trupa (cm)
Slika -6: Površine pouzdanosti za prosjeke populacije za dane vrijednosti x ( ___ )i nova opažanja (......)
27
2.8 Raščlanjenje ukupne varijabilnosti
Regresijskim modelom nastoji se objasniti što veći dio varijabilnosti zavisne varijable.
y * raspodjela
* ŷ y i oko yˆ
*
(B)
* *
raspodjela
y *
*
*
y i oko y *
(A) *
*
y
* *
* * *
* *
* *
* *
*
28
Jak linearan trend: SSOST << SSUKUP
y
* *
* *
* * *
* *
* *
*
x
Slab linearan trend: SSOST ≈ SSUKUP
Na slična način kao što se raščlanjuju sume kvadrata, tako se raščlanjuju i stupnjevi slobode:
29
Ukupani stupnjevi slobode:
- gubi se 1 stupanj slobode u procijeni aritmetičke srednje vrijednosti
Stupnjevi slobode ostatka:
- gube se 2 stupnja slobode u procijeni β0 i β1.
Stupanj slobode za regresiju:
- treba 1 stupanj slobode za procjenu β1.
Statistika za provjeru:
MS REG
F=
MS OST
Ovdje je:
SS REG
MS REG = = prosjek kvadrata za regresiju
1
SSOST
MSOST = = prosjek kvadrata ostatka
n−2
f (F 1, n-2 )
F 1,n -2
F α,1,n -2
Slika 2.9 F raspodjela i kritična vrijednost za stupnjeve slobode 1 i (n – 2). Izraz Fα,1,n–2 predstavlja
kritičnu vrijednost F raspodjele
30
Korisno je izračune i provjeru upisati u ANOVA tablicu (tablicu analize varijance)
ANOVA tablica
Izvor SS df MS F
Regresija SSREG 1 MSREG F = MSREG / MSOST
Ostatak SSOST n–2 MSOST
Ukupno SSUKUP n–1
Analiza varijance je podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih
izvora.
2
Poprima vrijednosti od 0 do 1: 0 ≤ R ≤ 1
Mjera valjanosti modela
“Dobar” model SS REG ≈ SSUKUP
“Loš” model SS OST ≈ SSUKUP
31
2.11 SAS primjer za jednostavnu linearnu regresiju
Primjer: Procijenite pravac linearne regresije težine na opseg grudi krava prema slijedećem uzorku:
Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg prsa (x): 214 215 216 217 219 221
SAS program:
DATA krave;
INPUT tezina opseg;
DATALINES;
641 214
633 215
651 216
666 217
688 219
680 221
;
PROC REG;
MODEL tezina = opseg / ;
RUN;
QUIT;
*ili;
PROC GLM;
MODEL tezina =opseg / ;
RUN;
QUIT;
Objašnjenje:Koristi se procedura GLM ili procedura REG. Naredba MODEL tezina = opseg znači
da je zavisna varijabla tezina, a nezavisna opseg.
SAS ispis:
Analiza varijance
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 1 1927.52941 1927.52941 16.642 0.0151
Error 4 463.30392 115.82598
C Total 5 2390.83333
Parameter Estimates
Parameter Standardna T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 -974.049020 400.54323178 -2.432 0.0718
OPSEG 1 7.529412 1.84571029 4.079 0.0151
32
Objašnjenje: Prvo je dana ANOVA tablica: izvor (Source), stupnjevi slobode (DF), sume kvadrata
(Sum of Squares), prosjek kvadrata (Mean Square), F vrijednost (F value) i P vrijednost (Prob>F).
Izvori varijabilnosti su Regresija (Model), Ostatak (Error) i Ukupno (C Total). Vidljivo je da je
F = 16.642 sa P vrijednosti = 0.0151, što znači da je koeficijent regresije u uzorku značajno različit
od nule. Ispod ANOVA tablice dane su standardna greška regresijskog modela (Root MSE) =
10.76225 i koeficijent determinacije (R-square) = 0.8062. Ispod podnaslova Parameter Estimates,
možemo vidjeti procijene parametara sa standardnim greškama i t provjerom da su procjenitelji
značajno različiti od nule. Ovdje je b0 (INTERCEP) = 974.046020 sa standardnom greškom
(Standard error) = 400.54323178, a b1 (opseg) = 7.529412 sa standardnom greškom 1.84571029.
Izračunata t statistika je 4.079, s P vrijednosti (Prob > |T|) = 0.0151, što pokazuje da je b1 značajno
različit od nule.
700
690
680
Težina (kg)
670
660
650
640
630
214 216 218 220 222
33
3 Koeficijent korelacije
Korelacija:
- mjera jakosti linearne veze između dvije varijable
- relativna mjera
- poprima vrijednosti između -1 i 1
- x i y su slučajne varijable sa zajedničkom bivarijatnom raspodjelom
-Varijable zajednički variraju
- Ne mora nužno postojati uzročno-posljedična veza
Koeficijent korelacije:
σ xy
ρ=
σ x2σ 2y
σ2y = Var(y)
σ2x =Var(x)
σxy = Cov(x, y) = kovarijanca između x i y
x i y su slučajne normalne varijable.
Kovarijanca:
- zajedničko variranje dvije slučajne varijable
- apsolutna mjera veze
- ako su varijable nezavisne => Cov(x, y) = 0
Korelacija je kovarijanca standardiziranih varijabli x i y
34
y
a) y
b)
x x
x x
x x
y
c) x
y
d) x
x x
x x
Slika 3-1 a) pozitivna korelacija, b) negativna korelacija, c) korelacija ne postoji d) veza između
varijabli postoji ali nije linearna
35
4 Vektori i matrice
Vektor:
jedna kolona ili jedan red
1
b=
2 2 x1
2 1
C=
1 2 2 x 2
Dijagonalna matrica
- kvadratna matrica takva da je aij = 0 za svaki i ≠ j
2 0
D=
0 2 2 x 2
Jedinična matrica:
- dijagonalna matrica
aii = 1
1 0 0
1 0
I2 = , I 3 = 0 1 0
0 1 0 0 1
Nul matrica je matrica čiji su svi članovi jednaki nuli. Nul vektor je vektor čiji su članovi jednaki
nuli.
36
0
0 0
0= , 0 = 0
0 0 0
Matrica čiji su svi članovi jednaki 1, obično se označava sa J. Vektor čiju su svi članovi jednaki 1
obično se označava sa 1.
1
1 1
J= , 1 = 1
1 1
1
Transponirana matrica:
- matrica kojoj su kolone zamijenjene s redovima
1 1 2
A' =
3 1 − 1
Zbrajanje matrica
a11 + b11 a12 + b12
A + B = a 21 + b 21 a 22 + b 22 =
a 31 + b 31 a 33 + b33
1 + 2 3 + 1 3 4
A + B = 1+1 1 + 3 = 2 4
2 + 1 − 1 + 2 3 1 3x 2
Općenito:
A = {aik}ima dimenzije r x c
B = {bkj}ima dimenziju c x s
produkt AB= {cij} ima dimenziju r x s:
∑
c
cij = a b
k =1 ik kj
37
a 11 a 12 1 3
c c12 2 1
A = a 21 a 22 = 1 1 C = 11
i
c 21 c 22 2 x 2 1 2 2 x 2
a 31 a 32 3x 2 2 − 1 3x 2
a 11 * c11 + a 12 * c 21 a 11 * c 21 + a 12 * c 22
AC = a 21 * c11 + a 22 * c 21 a 21 * c 21 + a 22 * c 22
a 31 * c11 + a 32 * c 21 a 31 * c 21 + a 32 * c 22
1 * 2 + 3 * 1 1 * 1 + 3 * 2 5 7
AC = 1 * 2 + 1 * 1 1 * 1 + 1 * 2 = 3 3
2 * 2 − 1 * 1 2 * 1 − 1 * 2 3 0
3x2
Primjer 2:
1
b = . Izračunaj Ab
2 2 x1
1 *1 + 3 * 2 7
Ab = 1 *1 + 1 * 2 = 3
2 * 2 − 1 *1 3x1 0 3x1
Kvadratni oblik:
- umnožak transponiranog vektora i samog vektora
- predstavlja sumu kvadrata elemenata vektora.
Neka je vektor
y1
y
y = 2
...
y n nx1
Kvadratni oblik je:
y1
y
y' y = [y1 y2 .. y n ] 2 = ∑i y i2 = suma kvadriranih članova vektora
...
y n
38
a 2 1 5
a = 1 X = y=
a 2 1 − 1 1
Xa = y | X–1
X–1Xa = X–1y
a = X–1y
−1
a1 2 1 5 1 / 3 1 / 3 5 2
a = 1 − 1 1 = 1 / 3 − 2 / 3 1 = 1
2
39
5 Jednostavna regresija u matričnom prikazu
ε1
y1 1 x1 ε
y 1 x
y = 2 X= 2 β
β = 0
ε = 2
... ... ... ...
β1
yn 1 xn ε n
y = Xβ + ε
Prosjek od y :
E ( y1 ) β 0 + β1 x1
E ( y ) β + β x
E (y ) = 2
= 0 1 2
= Xβ
... ...
E ( y n ) β 0 + β1 x n
Varijanca od y je:
Var(y) = σ2I
Procijenjeni model :
yˆ = Xb
e = y − yˆ = vektor ostataka
b = vektor procjenitelja
e1
e
b
b = 0 i e =
2
b
1 ...
e n
Normalne jednadžbe:
(X’X)b = X’y
40
Rješenje jednadžbe za b je:
b = (X’X)–1X’y
n
X' X =
∑ x i i
∑
i xi ∑ x i i
2
X' y =
∑ y i i
∑ x y
i i i
1 x2 x
+ −
n SS x SS xx
( X' X ) =
−1
− x 1
SS xx SS xx
s2(b) = s2(X'X)–1
Sume kvadrata:
SSOST = ( y − yˆ )' ( y − yˆ ) = ∑i (y i − ŷ )
2
SS UKUP = ( y − y )' ( y − y ) = ∑i (y i − y )
2
Primjer:Napišite procijenjeni model regresije težine na opseg grudi krava koristeći matrice i
vektore. Mjerenja 6 krava dana su u slijedećoj tablici:
Krava 1 2 3 4 5 6
Težina (y): 641 633 651 666 688 680
Opseg prsa (x): 214 215 216 217 219 221
41
Vektor y i matrica X su:
641 1 214
633 1 215
651 1 216
y= i X=
666 1 217
688 1 219
680 1 221
Prva kolona matrice X sadrži broj 1 jer procjenjujemo odsječak na osi y, b0. Kada uvrstimo X i y,
model je:
641 1 214 e1 b0 + b1 ⋅ 214 + e1
633 1 215 e b + b ⋅ 215 + e
2 0 1 2
42
6 Multipla regresija
Multipla regresija:
- regresija koja ima dvije ili više nezavisnih varijabli
- regresija koja ima tri ili više parametara
Ciljevi:
1. Pronaći model (funkciju) koja najbolje opisuje zavisnost zavisne varijable o nezavisnim
varijablama. Odnosno odrediti parametre.
2. Predviđanje vrijednosti zavisne varijable na temelju novih mjerenja nezavisnih varijabli
3. Proučiti važnost nezavisnih varijabli, odnosno procijeniti da li su sve ili samo neke nezavisne
varijable važne u modelu. To je izgradnja optimalnog modela.
Podaci:
y x1 x2 ... xp
y1 x11 x21 ... xp1
y2 x12 x22 ... xp2
. . . .
. . . .
yn x1n x2n ... xpn
Model:
yi = β0 + β1x1i + β2x2i + ... + βp–1x(p–1)i + εi i = 1,...,n
43
Ostatak:
e i = y i − ŷ i = [y i - (b 0 + b1x1i + b 2 x 2i )]
b0 , b1 i b2 = procjenitelji parametara
Model matrično:
y = Xβ + ε
y1 ε1
y 1 x11 x 21 β0 ε
β = β1
1 x x 22
y = 2 X= ε = 2
12
... ... ... ... ...
β 2
yn 1 x1n x2n ε n
e1
b0 e
b = b1 e = 2
...
b2
en
Procjena parametara: Metoda najmanjih kvadrata:
uvjet da Σ
2
i e i = e’e = min.
e'e = suma kvadrata ostataka.
e’e parcijalno derivira po b i izjednači s nulom.
Normalne jednadžbe:
X’Xb = X’y
b = (X’X)–1X’y
1 1 ... 1
1 x 11 x 21 n ∑x 1i ∑x 2i
x 22 =
i i
X' X = x 11 x 12 ... x 1n
1 x 12
... ... ...
∑x i 1i ∑x i
2
1i ∑x x
i 1i 2 i
2
x 12 x 22 ... x 2 n ∑x i 2i ∑x x
i 1i 2i ∑x i 2i
1 x 1n x 2n
y
1 1 ... 1 1 ∑iy i
y
X' y = x 11 x 12 ... x 1n 2 = ∑ix 1i y i
...
x 21 x 22 ... x 2 n ∑ix 2i y i
y n
Primjer
44
Ostatak:
e = y − yˆ
Suma kvadrata za ostatak je:
SSOST = e'e
Varijanca σ2 procjenjuje se sa
SS
s 2 = OST = MSOST
n− p
n–p = stupnjevi slobode.
Općenito: stupnjevi slobode = n – (broj parametara u modelu).
Drugi korijen iz procjene varijance:
s = s2
standardna greška regresijskog modela.
Svojstva procjenitelja:
E(b) = β
Var(b) = σ2(X’X)–1
Ukoliko se koristi varijanca procijenjena iz uzorka tada je varijanca:
s2(b) = s2(X’X)–1
s(bi ) = s 2 (bi )
∑ ( yˆ − y )
2
SS REG = ( yˆ − y )' ( yˆ − y ) = i i
= ( y − yˆ )' ( y − yˆ ) = ∑ ( y − yˆ )
2
SSOST i i
= ( y − y )' ( y − y ) = ∑ ( y − y )
2
SSUKUP i i
Hipoteze:
45
H0: β2 = ... = βp = 0
H1 : barem jedan βi ≠ 0, i = 1 do p–1
46
Ovdje je:
pREDUCIRANI = broj parametara u reduciranom modelu.
pPUNI = broj parametara u punom modelu
SSOST_PUNI / (n–pPUNI) = MSOST_PUNI = prosjek kvadrata ostatka punog modela
Primjer: Procijenite regresiju težine na opseg grudi i visina do grebena 6 mladih bikova. Podaci su
slijedeći:
Bik: 1 2 3 4 5 6 7
Težina, kg (y) 480 450 480 500 520 510 500
Opseg, cm (x1): 175 177 178 175 186 183 185
Visina, cm (x2): 128 122 124 128 131 130 124
SAS program:
DATA bikovi;
INPUT tezina opseg visina;
DATALINES;
480 175 128
450 177 122
480 178 124
500 175 128
520 186 131
510 183 130
500 185 124
;
PROC GLM;
MODEL tezina=opseg visina ;
RUN;
QUIT;
SAS ispis:
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 2 2727.655201 1363.827601 9.78 0.0288
Error 4 558.059085 139.514771
Corrected Total 6 3285.714286
47
visina 1 1326.672098 1326.672098 9.51 0.0368
Standard
Parameter Estimate Error t Value Pr > |t|
Intercept -495.0140313 225.8696150 -2.19 0.0935
opseg 2.2572580 1.0738674 2.10 0.1034
visina 4.5808460 1.4855045 3.08 0.0368
Model procijene:
yˆ = Xb
Ostatak:
e = y − yˆ
e1
b0 e
b = b1 e = 2
...
b2
en
Vektor procjena parametara izračuna se iz izraza:
b = (X’X)–1X’y
Provjera hipoteza:
48
Ako nul hipoteza vrijedi tada kvocijent
MS REG
F=
MS OST
ima F-raspodjelu sa 2 i (n–3) stupnjeva slobode.
SAS program:
DATA purani;
INPUT tezina dan @@;
DATALINES;
44 1 66 7 100 14 150 21 265 28 370 35 455 42 605 49 770 56
;
PROC GLM;
MODEL tezina=dan dan*dan/ ;
RUN;
QUIT;
Objašnjenje:Koristimo proceduru GLM. Naredba MODEL tezina = dan dan*dan znači da je zavisna
varijabla tezina, a nezavisne dan kao linearna komponenta i dan*dan kao kvadratna komponenta.
SAS ispis:
49
Source DF Type III SS Mean Square F Value Pr > F
DAN 1 859.390183 859.390183 4.09 0.0896
DAN*DAN 1 26300.733664 26300.733664 125.19 0.0001
800
700
600
Težina (g)
500
400
300
200
100
0
0 20 40 60
Dob u danim a
50
6.5.1 Analiza ostataka i narušenost pretpostavki modela
ei = yi − yˆ i
*
* * * *
0 *
* *
* * *
x ( y$ )
Model OK
Raspršenost ostatka slučajna
Varijanca konstantna
Nema ekstremnih podataka.
e
*
* *
* *
* *
0 *
* *
* *
x ( y$ )
Nelinearnost. ????Potreban xi2 ili xi3 u modelu. ???? logaritamska, eksponencijalna funkcija
* ** *
* *
0 *
* * *
*
x ( y$ )
51
e *
* *
*
* * * *
0 *
* * * *
*
*
*
x ( y$ )
2
y *
1
* 3 y
* 5
*
* * *
*
* * * *
* 4 * *
* * * * *
*
*
* * *
xi xi
Slika -2 Prikaz ekstremnih vrijednosti u analizi regresiji Ekstremne vrijednosti su zaokružene i označene
brojevima: a) ekstremi u odnosu na x su: 3, 4 i (5), b) ekstremi u odnosu na y su: 1, 2 i 4, c) ekstremi koji
imaju utjecaja na procjenu regresije su: 2, 4 i (5)
6.5.3 Multikolinearnost
Postoji značajna i visoka korelacija između nezavisnih varijabli
Nezavisne varijable su skoro linearno zavisne
Varijanca procjenitelja velika
52
Problem multiokolinearnosti može se riješiti:
a) ispuštanjem problematičnih opažanja
b) ako se iz nekoliko koreliranih nezavisnih varijabli definira jedna
c) ispuštanjem nepotrebnim varijabli iz modela
d) korištenjem drugih statističkim metoda ('Ridge' regresija ili 'Principal Components')
c) Parcijalne F-provjere
Značajnost pojedine varijable u modelu.
??? optimalan model. Kolinearnost (varijable gledane posebno mogu izgledati važne, a ukupni
model može biti vrlo neprecizan)
53
7 Jednostruka analiza varijance
Cilj:
- da li postoji razlika prosjeka više populacija
- provjera razlika aritmetičkih prosjeka uzoraka izabranih iz više populacija.
Zavisna varijabla:
- mjerenja ili opažanja
Nezavisna varijabla:
- grupa (ili način klasificiranja), često kažemo i tretmani (grupe predstavljaju populacije)
Primjer1 :
Utjecaj različite hranidbe na prirast u tovu.
Sakupljanje podataka, odnosno organiziranje pokusa:
Odredit ćemo grupe životinja slučajnim izborom, različito ih tretirati i izračunati srednje vrijednosti
grupa.
(Izabrati ćemo slučajni uzorak i slučajno primijeniti tretmane (napraviti grupe) na uzorak).
Primjer 2: Da li postoji razlika u mliječnosti krava simentalske pasmine između tri županije.
Sakupljanje podataka, odnosno plan pokusa:
– Izabrati ćemo slučajne uzorke iz županija
– Županije su definicije grupa (različitih populacija)
Pitanja?
1. Procijeniti prosjeke grupa i ukupnu srednju vrijednost,
2. Da li postoji utjecaj grupe, tj. da li su prosjeci pojedinih grupa različiti
• (Da li su aritmetičke srednje vrijednosti uzoraka grupa značajno različiti)
Odgovoriti na pitanje da li postoji utjecaj grupe, tj. da li su srednje vrijednosti pojedinih grupa
dovoljno različite da ih možemo smatrati značajno različitim.
(Značajna razlika => u smislu da možemo u velikom broju takvih ponovljenih pokusa
očekivati razliku.)
Odgovor na ova pitanja može dati statistička procedura koja se zove analiza varijance.
Analiza varijance:
- podjela ukupne varijabilnosti na izvore varijabilnosti i analiza značajnosti tih izvora.
- da li je protumačena varijabilnost (varijabilnost između prosjeka grupa) značajna u odnosu
na neprotumačenu varijabilnost (unutar grupa)
54
7.1 Model jednostruke analize varijance s fiksnim utjecajima
Pretpostavka je da postoji fiksni utjecaj, tj. utjecaj grupe je isti na svaku jedinku u toj grupi
Model:
yij = µ + τi + εij i = 1,.....,a j = 1,...,n
Nezavisna varijabla τ :
- poprima vrijednosti različitih grupa (tretmana)
- kategorička varijabla, često se zove faktor
- prema modelu faktor ima utjecaj na vrijednosti zavisne varijable y
Model procijene:
yˆ ij = µˆ i = µˆ + τˆi i = 1,.....,a j = 1,...,n
Grupa
G1 G2 G3
y11 y21 y31
y12 y22 y32
y13 y23 y33
y14 y24 y34
y15 y25 y35
55
7.1.1 Raščlanjenje ukupne varijabilnosti na izvore varijabilnosti:
Izvori varijabilnosti:
a) ukupna varijabilnost (varijabilnost opažanja bez obzira u kojoj su grupi),
b) varijabilnost opažanja unutar svake grupe i
c) varijabilnost između prosjeka grupa
∑ (y i − y)
2
∑y 2
i i
− i i
n
var = s 2
= i
=
n −1 n −1
(∑ y ) 2
Također, ∑ (y
i i − y) = ∑ y
2 2
i i
− i i
n
= suma kvadrata korigirana na srednju vrijednost (SS).
SSTRT = Suma kvadrata između grupa (tretmana) = Suma kvadrata za grupe (tretmane)
SSOST = Suma kvadrata unutar grupa = suma kvadrata za ostatak = suma kvadrata za pokusnu
grešku
SSUKUP = Ukupna suma kvadrata
Oznake prosjeka:
yi . =
∑ j
yij
= prosjek grupe i
ni
∑∑ i j
y
ij
y.. = = prosjek svih opažanja
N
N= ukupan broj opažanja
56
Sume kvadrata:
SSUKUP = ∑i ∑ j ( yij − y..) 2
ΣΣyi j ij
2) Korekcija za srednju vrijednost
C=
(∑ ∑ y )
i j ij
2
=
(ukupna suma)2
N ukupni broj opazanja
3) Ukupna (korigirana) suma kvadrata
SSUKUP = ∑i ∑ j yij 2 − C = Suma svih kvadriranih opažanja minus C
4) Suma kvadrata za grupe (tretmane)
(∑ y ) 2
(suma grupe )2
∑ j ij
SS TRT = − C = Suma za svaku grupu minus C
i
ni broj opažanja u grupi
5) Suma kvadrata za ostatak
SSOST = SSUKUP – SSTRT
57
F – provjerom pšrovjeravamo:
- da li je varijabilnost mjerenja potpuno slučajna ili je uvjetovana i nekim sistematskim utjecajem
(grupom ili tretmanom)
- da li je varijabilnost između grupa (između prosjeka grupa) značajna u odnosu na
varijabilnost unutar grupa
- da li su prosjeci grupa ili utjecaji grupa značajno različiti
MS TRT
F=
MS OST
ima F raspodjelu sa (a–1) i (N–a) stupnjeva slobode, ukoliko vrijedi H0.
:
- Odbacujemo H0 ako F > Fα,(a–1),(N–a), tj. ako je izračunata statistika F iz uzorka veća od kritične
vrijednosti
F F
Fα,(a-1),(N-a)
F F
Fα,(a-1),(N-a)
Slika 7-2: Provjera hipoteza koristeći F raspodjelu. Ako je F izračunativeći od F kritočno, tj. F > Fα,a–
1,N–a,H0 odbacujemo uz α razinu značajnosti.
ANOVA tablica:
Izvor SS df MS = SS/df F
Grupa SSTRT a–1 MSTRT MSTRT/MSOST
Ostatak SSOST N–a MSOST
Ukupno SSUKUP N–1
58
7.2 Usporedba srednjih vrijednosti pojedinih grupa
F-provjerom provjeravamo da li postoji razlika između tretmana.
Ako se H0 ne odbaci:
- nije potrebno dublje analizirati problem,
- (!!!mogućnost tip II greške)
Ako se H0 odbaci:
- ? koji tretman je utjecao na to
- između kojih tretmana je utvrđena značajna razlika.
- da li je µi ≠ µi’ za tretmane i i'
F provjera mora prethoditi LSD da osiguramo razinu značajnosti α za bilo koji broj usporedbi.
MSOST
HSD = qα , a , N − a
nt
q statistika ima Q raspodjelu (iz tablica); nt je broj opažanja po grupi
Vjerojatnost da se napravi greška tip I je jednaka α, tj razina α vrijedi za cijelu proceduru, tj. za sve
parove srednjih vrijednosti
Za nejednaki broj opažanja po grupi:
nt =
1
(N −
∑n i
2
i
)
a −1 N
59
7.3 SAS primjer jednostruke analize varijance s fiksnim utjecajima
Primjer:Postavljen je pokus u svrhu provjere razlika tri smjese u dnevnom prirastu prasadi. Tri
smjese su označene s TR1, TR2 i TR3. Podaci su dani u slijedećoj tablici:
SAS program:
DATA pigs;
INPUT smjesa $ prirast @@;
DATALINES;
TR1 270 TR2 290 TR3 290
TR1 300 TR2 250 TR3 340
TR1 280 TR2 280 TR3 330
TR1 280 TR2 290 TR3 300
TR1 270 TR2 280 TR3 300
;
PROC GLM DATA = pigs;
CLASS smjesa;
MODEL prirast = smjesa ;
LSMEANS smjesa / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;
i/j 1 2 3
1 0.9816 0.0310
2 0.9816 0.0223
3 0.0310 0.0223
60
7.4 Model sa slučajnim utjecajima grupa
Grupa ili tretman slučajna varijabla sa nekom raspodjelom.
Slijedeće dvije slike prikazuju razlike između modela s fiksnim i modela sa slučajnim utjecajima:
Slika 7-3: Prikaz izvora varijabilnosti fiksnog modela jednostruke analize varijance:
Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .
Slika 7-4: Prikaz izvora varijabilnosti slučajnog modela jednostruke analize varijance:
Ukupna varijabilnost , varijabilnost unutar grupa, varijabilnost između grupa .
Fiksni model:
• Mali (konačan) broj grupa
• Utjecaj grupe definiran i fiksan
• Varijabilnost između grupa nije objašnjena teoretskom raspodjelom
Slučajni model
• Velik (beskonačan) broj grupa
• Utjecaj pojedine grupe (prosjek) je slučajna varijabla
• Varijabilnost između grupa je objašnjena teoretskom raspodjelom
61
Pretpostavke modela:
Ciljevi:
1. Provjera hipoteza
2. Procjena komponenti varijance
3. Predviđanje τ1,.., τa.
F provjera:
MSTRT
F=
MSOST
ako vrijedi H0 tada je σ2τ = 0, i F = 1.
ANOVA tablica
Pošto je
E(MSOST) = σ2
E(MSTRT) = σ2 + n σ2τ
62
mogu se iz Anova tablice procijeniti komponente varijance koristeći jednakosti:
E ( MSTRT ) = σ 2 + nσ τ2 ⇒ MSTRT = σˆ 2 + nσˆτ2
E ( MSOST ) = σ 2 ⇒ MSOST = σˆ 2
Iz tog slijedi:
σ̂ 2 = MSOST
( MSTRT - MSOST )
σˆ τ2 =
n
σˆ i σˆτ su procijene parametara
2 2
Kovarijanca između opažanja unutar grupa jednaka komponenti varijance između grupa:
Cov(yij,yij') = Var (τi) = στ2
Intraklasna korelacija:
σ2
ρt = 2 τ 2
στ + σ
Procjena iz uzorka:
σˆτ2
rt = 2
σˆτ + σˆ 2
63
7.6 SAS primjer jednostruke analize varijance sa slučajnim utjecajima
Svinja
Mjerenje 1 2 3 4 5 6 7 8
1 5.3 6.6 4.3 4.2 8.1 7.9 5.5 7.8
2 6.3 5.6 7.0 5.6 7.9 4.7 4.6 7.0
3 4.2 6.3 7.9 6.6 5.8 6.8 3.4 7.9
SAS program:
DATA sow;
INPUT sow prog @@;
DATALINES;
1 5.3 1 6.3 1 4.2 2 6.6 2 5.6 2 6.3
3 4.3 3 7.0 3 7.9 4 4.2 4 5.6 4 6.6
5 8.1 5 7.9 5 5.8 6 7.9 6 4.7 6 6.8
7 5.5 7 4.6 7 3.4 8 7.8 8 7.0 8 7.9
;
PROC MIXED DATA=sow METHOD = REML;
CLASS sow ;
MODEL prog = / SOLUTION DDFM = SATTERTH;
RANDOM sow / SOLUTION;
RUN;
SAS ispis:
Standard
Effect Estimate Error DF t Value Pr > |t|
Intercept 6.1375 0.3632 7 16.90 <.0001
Std Err
Effect sow Estimate Pred DF t Value Pr > |t|
sow 1 -0.4599 0.5475 5.49 -0.84 0.4360
sow 2 0.0154 0.5475 5.49 0.03 0.9785
sow 3 0.1386 0.5475 5.49 0.25 0.8093
sow 4 -0.3542 0.5475 5.49 -0.65 0.5437
sow 5 0.5963 0.5475 5.49 1.09 0.3216
sow 6 0.1738 0.5475 5.49 0.32 0.7626
sow 7 -0.8647 0.5475 5.49 -1.58 0.1698
sow 8 0.7547 0.5475 5.49 1.38 0.2216
64
8 Načela planiranja pokusa
Pokus (eksperiment):
- planirano istraživanje u svrhu dobivanja novih činjenica ili potvrde odnosno osporavanja
rezultata prijašnjih pokusa
Pokusni plan:
- Način na koji se primjenjuju tretmani na pokusne jedinice
- Postavlja ga istraživač
- Unutar okvira plana mora postojati slučajnost primjene tretmana
Statistički model:
- Slijedi pokusni plan
- Pomaže pri provjeri statističkih hipoteza
- Pomaže pri donošenju zaključaka
- Sastoji se od tri dijela:
- prosjeci (očekivanja)
- disperzija (varijance i kovarijance)
- definirane raspodjele
Često prikazan matematičkom formulom
65
8.1 Pokusna jedinica i tretmani
Pokusna jedinica
- jedinica materijala na koje se primjenjuju tretmani
- jedna jedinka, npr. životinja
- ili grupa jedinki kao što je 10 pilića u jednom kavezu
Tretman
- procedura čiji utjecaj će biti mjeren i uspoređivan s drugim utjecajima
- primjer: razina hranidbe, način primjene insekticida
- određivanje populacije za koje će se donositi zaključci
Jedinica uzorka:
- može biti jednaka pokusnoj jedinici
- može biti dio pokusne jedinice
Količina informacija:
n
I= 2
s
66
Na točnu procjenu pokusne greške utječe:
- slučajnost izbora pokusnog materijala
- slučajnost primjene tretmana na pokusne jedinice
Izvori varijabilnost pokusne greške:
- varijabilnost između pokusnih jedinica koju se ne može objasniti
- postoji varijabilnost zbog pomanjkanja uniformnosti u provedbi pokusa.
r≥
( )
zα / 2 + z β
2σ 2
δ 2
zα/2 = vrijednost na apscisi standardne normalne raspodjele određen sa α/2 vjerojatnosti tipa 1
greške
zβ = vrijednost na apscisi standardne normalne krivulje određen sa β vjerojatnosti tipa 2 greške
τ = željena razlika koju želimo utvrditi
σ2 = pokusna greška, odnosno varijanca pokusnih jedinca kad ne bi bilo utjecaja tretmana.
67
9 Potpuno slučajni pokusni plan
Svojstva:
- tretmani se dodjeljuju slučajno na pokusne jedinice
- pokusne jedinice izabrane su slučajno iz populacije
jednostruka analiza varijance = jednofaktorska analiza varijance.
Koristi se:
- kada su pokusne jedinice homogene.
Primjer:
68
Radi preglednosti mogu se životinje i njihova mjerenja napisati po tretmanima
Tretmani
T1 T2 T3
Shema:
Broj životinje 1 2 3 4 5 6 7 8
Tretman T2 T1 T3 T2 T3 T1 T3 T2
Broj životinje 9 10 11 12 13 14 15
Tretman T1 T2 T3 T1 T3 T2 T1
Tretmani
T1 T2 T3
Broj Mjerenje Broj Mjerenje Broj Mjerenje
2 y11 1 y21 3 y31
6 y12 4 y22 5 y32
9 y13 8 y23 7 y33
12 y14 10 y24 11 y34
15 y15 14 y25 13 y35
69
10 Blokovi u analizi varijance
Unaprijed je poznato da će neke pokusne jedinice, iako tretirane jednako, ponašati različito
- teže životinje će imati drugačiji prirast nego lakše
- mjerenje na isti dan će biti sličnija nego ona u različitim danima
Pokusni plan:
- pokusne jedinice se klasificiraju i prema tim poznatim izvorima varijabilnosti
- smanjuje se pokusna greška
Primjer:
Stimulansi na rast junadi
- 3 tretmana
- 4 bloka prema početnoj težini
- u svakom bloku 3 životinje na koje slučajno primjenjujemo tretmane
- ukupno 12 životinja u pokusu
Blok Životinje
I 1,2,3
II 4,5,6,
III 7,8,9
IV 10,11,12
70
Blokovi
I II III IV
Rezultati mjerenja:
Blokovi
I II III IV
Model:
yij = µ + τi + βj + εij i = 1,.....,a j = 1,...,b
Sume kvadrata:
SSUKUP = SSTRT + SSBLK + SSOST
Stupnjevi slobode su:
(ba–1) = (a–1) + (b–1) + (a–1)(b–1)
Također je
(a–1)(b–1) = (ab–a–b+1)
Jednostruka ANOVA:
SSUKUP = SSTRT + SS'OST
Dvostruka ANOVA:
SSUKUP = SSTRT + SSBLK + SSOST
SSOST : suma kvadrata za ostatak kod dvostruke ANOVA-e (pokusna greška kod slučajnog blok
plana)
71
Smanjenje SS ostatka => veća preciznost slučajnog blok plana u utvrđivanju eventualnih razlika
tretmana
Sume kvadrata:
SSUKUP = ∑i ∑ j ( y ij − y..) 2
C=
(∑ ∑ y )
i j ij
2
=
(ukupna suma)2
ab ukupni broj opazanja
3) SSUKUP = ΣΣy i j ij
2
–C
(∑ y ) 2
4) SS TRT = ∑i
j ij
−C
b
(∑ y ) 2
5) SS BLK = ∑ j
ij
i
−C
a
6) SSOST = SSUKUP – SSTRT – SSBLK
F statistika
MS TRT
F=
MS OST
ima F raspodjelu sa stupnjevima slobode (a–1) i (a–1)(b–1) ukoliko vrijedi H0
Provjera za blokove:
- obično nije od primarnog interesa
- analogna kao i za tretmane.
72
Anova tablica:
Izvor SS df MS F
Blokovi SSBLK b–1 MSBLK F=MSBLK/MSOST
Tretmani SSTRT a–1 MSTRT F=MSTRT/MSOST
Ostatak SSOST (a–1)(b–1) MSOST
Ukupno SSUKUP ab–1
Primjer: Cilj pokusa je bio utvrditi utjecaj primjene tri tretmana (T1, T2 i T3) na prosječni dnevni
prirast u tovu junadi. Junad je podijeljena u četiri bloka prema početnoj težini. U svakom su bloku
dakle tri životinje na koje su slučajno dodijeljeni tretmani. Ukupno je bilo 12 životinja u pokusu.
Radi lakšeg praćenja napravimo tablicu s podacima, prosjecima i sumama po tretmanima i
blokovima:
Blokovi
I II III IV
T1 826 865 795 850
T2 827 872 721 860
T3 753 804 737 822
SAS program:
DATA steer;
INPUT trt blok $ prirast @@;
DATALINES;
1 I 826 1 II 865 1 III 795 1 IV 850
2 I 827 2 II 872 2 III 721 2 IV 860
3 I 753 3 II 804 3 III 737 3 IV 822
;
PROC GLM DATA = steer;
CLASS blok trt;
MODEL prirast = blok trt/ ;
LSMEANS trt / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;
SAS output:
73
Source DF Type III SS Mean Square F Value Pr > F
blok 3 18198.0000 6066.0000 9.91 0.0097
trt 2 6536.0000 3268.0000 5.34 0.0465
i/j 1 2 3
1 0.7165 0.0456
2 0.7165 0.1246
3 0.0456 0.1246
Primjer:Pretpostavimo opet da je cilj pokusa bio utvrditi utjecaj primjene tri tretmana (T1, T2 i T3)
na prosječni dnevni prirast u tovu junadi. Opet ćemo koristiti 4 bloka, međutim ovaj puta imamo na
raspolaganju 8 životinja po svakom bloku. Ukupno u cijelom pokusu ima 4×3×2 = 24 životinje.
Tretmani su primijenjeni na životinje u bloku slučajno. Tablica sa rezultatima mjerenja na kraju
pokusa je slijedeća:
Blokovi
Tretmani I II III IV
SAS program za primjer s junadi i dvije pokusne jedinice po kombinaciji blok x tretman je
slijedeći. Dva pristupa će biti pokazana: blokovi definirani kao fiksni koristeći GLM proceduru i
blokovi definirani kao slučajni koristeći MIXED proceduru.
SAS program:
DATA prirast;
INPUT trt blok $ prirast @@;
DATALINES;
1 I 826 1 I 806 1 II 864 1 II 834
1 III 795 1 III 810 1 IV 850 1 IV 845
74
2 I 827 2 I 800 2 II 871 2 II 881
2 III 729 2 III 709 2 IV 860 2 IV 840
3 I 753 3 I 773 3 II 801 3 II 821
3 III 736 3 III 740 3 IV 820 3 IV 835
;
PROC GLM DATA = prirast;
CLASS blok trt;
MODEL prirast = blok trt blok*trt/;
LSMEANS trt / STDERR PDIFF ADJUST=TUKEY;
LSMEANS blok*trt / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 11 49929.83333 4539.07576 25.81 <.0001
Error 12 2110.00000 175.83333
Corrected Total 23 52039.83333
i/j 1 2 3
1 0.1251 <.0001
2 0.1251 0.0020
3 <.0001 0.0020
prirast Standard
blok trt LSMEAN Error Pr > |t|
I 1 816.000000 9.376389 <.0001
I 2 813.500000 9.376389 <.0001
I 3 763.000000 9.376389 <.0001
II 1 849.000000 9.376389 <.0001
II 2 876.000000 9.376389 <.0001
II 3 811.000000 9.376389 <.0001
75
III 1 802.500000 9.376389 <.0001
III 2 719.000000 9.376389 <.0001
III 3 738.000000 9.376389 <.0001
IV 1 847.500000 9.376389 <.0001
IV 2 850.000000 9.376389 <.0001
IV 3 827.500000 9.376389 <.0001
blok 1654.06
blok*trt 586.03
Residual 175.83
Num Den
Effect DF DF F Value Pr > F
trt 2 6 2.98 0.1264
Stand
Effect trt Est Error DF t Val Pr>|t| Alpha Lower Upper
trt 1 828.75 24.1247 6 34.35 <.0001 0.05 769.72 887.78
trt 2 814.62 24.1247 6 33.77 <.0001 0.05 755.59 873.66
trt 3 784.87 24.1247 6 32.53 <.0001 0.05 725.84 843.91
Stand
Effect tr_tr Est Error DF t Val Pr > |t| Adjustment Adj P Alpha
Adj Adj
Effect trt _trt Lower Upper Lower Upper
trt T1 T2 -30.7927 59.0427 . .
trt T1 T3 -1.0427 88.7927 . .
trt T2 T3 -15.1677 74.6677 . .
76
11 'Change-over' pokusni planovi
Model:
yij = µ + τi + SUBj + εij i = 1,.....,a j = 1,...,n
Subjekt
Tretman 1 2 ......... n
T1 y11 y12 .... y1n
T2 y21 y22 .... y2n
..........................
Ta y31 y32 .... yan
Izvori varijabilnosti
Sume kvadrata :
SSUKUP = SSSUB + SSUNUTAR SUBJEKTA
SSUNUTAR SUBJEKTA = SSTRT + SSOST
77
stupnjevi slobode:
(na–1) = (n–1) + (a–1) + (n–1)(a–1)
MS = SS/df:
MSTRT = SSTRT/ (a–1)
MSOST = SSOST/[(a–1)(n–1)]
ANOVA tablica:
Izvor SS df MS F
Između subj. SSSUB n–1 MSSUB
Unutar subj. SSUNUTAR n(a–1) MSUNUTAR
Tretmani SSTRT a–1 MSTRT MSTRT/MSOST
Ostatak SSOST (n–1)(a–1) MSOST
Hipoteze:
H0: τ1 = τ2 =... = τa , nema utjecaja grupa
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između grupa postoji
F statistika:
MSTRT
F=
MSOST
Gdje su:
yijkl = opažanje ijkl
µ = ukupni prosjek korigiran na sve utjecaje
τi = utjecaj tretmana i
βk = utjecaj bloka k, blok može na primjer biti redoslijed primjene pojedinog tretmana
SUB(β)jk = slučajni utjecaj životinje (subjekta) j unutar bloka k sa prosjekom 0 i varijancom σ2g
tl = utjecaj razdoblja l
εijkl = slučajna greška s prosjekom 0 i varijancom σ2
78
a = broj tretmana i razdoblja, b = broj blokova, je nk = broj životinja unutar bloka k. n = Σknk =
ukupan broj životinja
ANOVA tablica:
Izvor varijabilnosti SS df MS = SS / df F
Blokovi SSBLK b–1 MSBLK MSBLK/MSSUB
Subjekt unutar bloka SSSUB Σk(nk–1) MSSUB
Razdoblje SSt a–1 MSt MSt/MSOST
Tretmani SSTRT a–1 MSTRT MSTRT/MSOST
Ostatak SSOST (a–1)(Σknk – 2) MSOST
Ukupno SSUKUP aΣknk – 1
MSTRT MS BLOK
F= F=
MS SUBJ ( BLOK )
MSOST
Primjer: Ispitivan je utjecaj dva tretmana na proizvodnju mlijeka kod krava. Primijenjen je 'change-
over' plan, tj. na svaku kravu primijenjena su oba tretmana. Pokus je proveden u 3. i 4. mjesecu
laktacije. Redoslijed tretmana kod svake krave utvrđen je slučajno. Na kraju pokusa dobivene su
slijedeće prosječne dnevne količine mlijeka u kg:
BLOK I
Razdoblje Tretman Krava 1 Krava 4 Krava 5 Krava 9 Krava 10
1 1 31 34 43 28 25
2 2 27 25 38 20 19
BLOK II
Razdoblje Tretman Krava 2 Krava 3 Krava 6 Krava 7 Krava 8
1 2 22 40 40 33 18
2 1 21 39 41 34 20
SAS program:
DATA Cows;
INPUT period trt order cow milk @@;
DATALINES;
1 1 1 1 31 1 2 2 2 22
2 2 1 1 27 2 1 2 2 21
1 1 1 4 34 1 2 2 3 40
2 2 1 4 25 2 1 2 3 39
1 1 1 5 43 1 2 2 6 40
2 2 1 5 38 2 1 2 6 41
1 1 1 9 28 1 2 2 7 33
2 2 1 9 20 2 1 2 7 34
1 1 1 10 25 1 2 2 8 18
2 2 1 10 19 2 1 2 8 20
;
79
PROC MIXED ;
CLASS trt cow period order;
MODEL milk = order trt period;
RANDOM cow(order) ;
LSMEANS trt/ DIFF ADJUST=TUKEY ;
RUN;
SAS ispis:
Covariance Parameter
Estimates
Num Den
Effect DF DF F Value Pr > F
order 1 8 0.11 0.7527
trt 1 8 37.90 0.0003
period 1 8 29.51 0.0006
Standard
Effect trt Estimate Error DF t Value Pr > |t|
trt 1 31.6000 2.7735 8 11.39 <.0001
trt 2 28.2000 2.7735 8 10.17 <.0001
Standard
Effect trt _trt Estimate Error DF t Value Pr > |t|
trt 1 2 3.4000 0.5523 8 6.16 0.0003
80
Primjer:
- blokovi utjecaj životinje i razdoblje
- na istu životinju se primjenjuju svi tretmani u različitim razdobljima
- latinski kvadrat => 'change-over' plan.
Primjer: r = 4
Životinje
Razdoblja 1 2 3 4
1 T1 T2 T3 T4
2 T2 T3 T4 T1
3 T3 T4 T1 T2.
4 T4 T1 T2 T3
yij(k) = mjerenje u i - tom redu (periodu), j - toj koloni (životinji), sa primijenjenim k -tim
tretmanom:
Životinje
Razdoblja 1 2 3 4
1 y11(1) y12(2) y13(3) y14(4)
2 y21(2) y22(3) y23(4) y24(1)
3 y31(3) y32(4)..y33(1)..y34(2).
4 y41(4) y42(1) y43(2) y44(3)
Statistički model:
yij(k) = µ + REDi + KOLj + τ(k) + εij(k)
i,j,k = 1,...,r
Sume kvadrata:
SSUKUP = SSRED + SSKOL + SSTRT + SSOST
stupnjevi slobode:
r2 – 1 = (r–1) + (r–1) + (r–1) + (r–1)(r–2)
Sume kvadrata:
SSUKUP = ∑∑
i j
( yij ( k ) − y..) 2
SS RED = r ∑ ( y . − y..)
i i
2
SS KOL = r ∑ ( y. − y..)
i j
2
SSTRT = r ∑ ( y − y..)
i k
2
SSOST = ∑∑
i j
(yij − yi . − y. j − yk + 2 y..)
81
Kratki način računanja:
C=
(∑ ∑ y )
i j ij ( k )
2
=
(ukupna suma)2
r2 ukupni broj opazanja
3) SSUKUP = Σ Σ (y i j ij(k))
2
–C
4) SS RED = ∑i
(∑ y ) j ijk
2
−C
r
5) SS KOL = ∑ j
(∑ y ) i ij ( k )
2
−C
r
6) SSTRT = ∑k
(∑∑ y ) − C i j ij ( k )
2
r
7) SSOST = SSUKUP – SSA – SSB – SSTRT
Hipoteze:
H0: τ1 = τ2 =... = τa , nema utjecaja tretmana
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji
MSTRT
F=
MSOST
ANOVA tablica
Izvor SS df MS F
Redovi SSRED r–1 MSRED MSRED/MSOST
Kolone SSKOL r–1 MSKOL MSKOL/MSOST
Tretmani SSTRT r–1 MSTRT MSTRT/ MSOST
Ostatak SSOST (r–1)(r–2) MSOST
Ukupno SSUKUP r2–1
Cilj pokusa je bio utvrditi utjecaj dodavanja 4 različita dodataka (A, B, C i D) na uzimanje sijena
kod tovne junadi. Pokus je proveden kao latinski kvadrat: na 4 životinje u 4 razdoblja.
82
June
Razdoblje 1 2 3 4
1 10.0(B) 9.0(D) 11.1(C) 10.8(A)
2 10.2(C) 11.3(A) 9.5(D) 11.4(B)
3 8.5(D) 11.2(B) 12.8(A) 11.0(C)
4 11.1(A) 11.4(C) 11.7(B) 9.9(D)
SAS program:
DATA a;
INPUT period steer suppl $ hay @@;
DATALINES;
1 1 B 10.0 3 1 D 8.5
1 2 D 9.0 3 2 B 11.2
1 3 C 11.1 3 3 A 12.8
1 4 A 10.8 3 4 C 11.0
2 1 C 10.2 4 1 A 11.1
2 2 A 11.3 4 2 C 11.4
2 3 D 9.5 4 3 B 11.7
2 4 B 11.4 4 4 D 9.9
;
PROC GLM;
CLASS period steer suppl;
MODEL hay = period steer suppl;
LSMEANS suppl / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;
SAS ispis:
83
i/j 1 2 3 4
1 0.4536 0.2427 0.0006
2 0.4536 0.9411 0.0019
3 0.2427 0.9411 0.0030
4 0.0006 0.0019 0.0030
Model:
yij(k)m = µ + KVm + A(KV)im + B(KV)jm+ T(k) + εij(k)m
i,j,k = 1,...,r; m = 1,...,b
gdje su:
yij(k)m = opažanje ij(k)m
µ = ukupni prosjek korigiran na sve utjecaje
KVm = utjecaj kvadrata m
RED(KV)im = fiksni utjecaj reda i unutar kvadrata m
KOL(KV)jm, = fiksni utjecaj kolone j unutar kvadrata m
τ(k) = fiksni utjecaj tretmana k
εij(k)m = slučajna greška sa prosjekom 0 i varijancom σ2
r = broj tretmana, i broj redova i kolona unutar kvadrata
b = broj kvadrata
ANOVA tablica:
Izvor df
Kvadrati (blokovi) b–1
Redovi unutar kvadrata b(r–1)
Kolone unutar kvadrata b(r–1)
Tretman b–1
Ostatak (Pokusna greška) b(r–1)(r–2)+(b–1)(r–1)
Ukupno b r2–1
F-provjera:
MSTRT
F=
MSOST
84
12 Faktorijalni pokus
- kada imamo dva ili više faktora koji se proučavaju u isto vrijeme.
- sve kombinacije faktora se provjeravaju međusobno
Interakcija:
- različiti utjecaj razina jednog faktora na razine drugog faktora
Glavni utjecaji:
- utjecaji svakog faktora gledajući samo po sebi
Protumačeni izvori varijabilnosti:
- faktor 1, faktor 2, …., interakcije između faktora
Primjer:
- pokus sa dva faktora:
prvi faktor = količina proteina (3 razine)
drugi faktor = vrsta proteinskih krmiva u obroku krava (dva krmiva)
- pojedinoj kravi u pokusu dodjeljuje se jedna od 6 kombinacija krmivo x količina.
- 3 × 2 faktorijalni pokus, tj. tri razine prvog faktora i 2 razine drugog faktora
Upotreba:
- kada malo znamo o faktorima
- potrebno je istražiti sve moguće kombinacije da se vidi koja od njih je najpovoljnija
- također je moguće istražiti interakcije između faktora, tj. da li je razlika između razina
jednog faktora ista ili različita u razinama drugih faktora.
Pokusni plan:
- potpuno slučajni
- kombinacije razina faktora se slučajno dodjeljuju pokusnim jedinicama
85
Kombinacije razine faktora A i B
Faktor B
Faktor A B1 B2
A1 A1B1 A1B2
A2 A2B1 A2B2
Sume kvadrata:
stupnjevi slobode
(abn–1) = (a–1) + (b–1) + (a–1)(b–1) + ab(n–1)
Sume kvadrata:
SSUKUP = ∑i ∑ j ∑k ( y ijk − y...) 2
SS A = ∑i ∑ j ∑k ( y i .. − y...) 2 = bn ∑i ( y i .. − y...) 2
SS B = ∑∑ ∑ ( y. . − y...) = an ∑ ( y. . − y...)
i j k j
2
i j
2
SS AB = n ∑ ∑ ( y . − y...) − SS − SS
i j ij
2
A B
SSOST = ∑ ∑ ∑ ( y − y .)
i j k ijk ij
2
SSOST = ∑ ∑ ∑ ( y − y .)
i j k ijk ij
2
C=
(∑ ∑ ∑ y )i j k ij
2
=
(ukupna suma)2
abn ukupni broj opazanja
3) SSUKUP = Σ Σ Σ (y i j k ijk)
2
–C
4) SS A = ∑i
(∑ ∑ y ) − Cj k ijk
2
nb
86
5) SS B = ∑ j
(∑ ∑ y )
i k ijk
2
−C
na
6) SS AB = ∑∑
(∑ y )
k ijk
2
− SS A − SS B − C
i j
n
7) SSOST = SSUKUP – SSA – SSB – SSAB
Prosjeci kvadrata
MSA = SSA/ (a–1)
MSB = SSB/ (b–1)
MSAB = SSAB/ (a–1)(b–1)
MSOST = SSOST/[ab(n–1)]
ANOVA tablica
Izvor SS df MS=SS/df F
A SSA a–1 MSA MSA/MSOST (2)
A2
0.75
0.70
0.65
Prirast (kg)
0.60 A2
0.55
0.50 A1
A1
0.45
0.40
B1 B2
Razine faktora B
87
12.1 SAS primjer za faktorijalni pokus
Primjer: Istraživan je utjecaj dodavanja dva vitamina (I i II) u krmivo na prosječni dnevni prirast kod
svinja. Primijenjeni su dvije razine vitamina I (0 i 40 mg) i dvije razine vitamina II (0 i 5 mg).
Izabrano je 20 životinja. Na njih su slučajnim izborom primijenjene 4 kombinacije vitamina I i II.
Izmjereni su slijedeći dnevni prirasti:
Vitamin I 0 mg 4mg
Vitamin II 0 mg 5 mg 0 mg 5 mg
0.585 0.567 0.473 0.684
0.536 0.545 0.450 0.702
0.458 0.589 0.869 0.900
0.486 0.536 0.473 0.698
0.536 0.549 0.464 0.693
SAS program:
DATA prirast;
INPUT vitI vitII prirast @@;
DATALINES;
1 1 0.585 2 1 0.473
1 1 0.536 2 1 0.450
1 1 0.458 2 1 0.869
1 1 0.486 2 1 0.473
1 1 0.536 2 1 0.464
1 2 0.567 2 2 0.684
1 2 0.545 2 2 0.702
1 2 0.589 2 2 0.900
1 2 0.536 2 2 0.698
1 2 0.549 2 2 0.693
;
PROC GLM;
CLASS vitI vitII;
MODEL prirast= vitI vitII vitI*vitII;
LSMEANS vitI*vitII / STDERR PDIFF ADJUST=TUKEY;
RUN;
QUIT;
SAS ispis:
Dependent Variable: prirast
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 3 0.14521095 0.04840365 4.39 0.0196
Error 16 0.17648360 0.01103023
Corrected Total 19 0.32169455
R-Square Coeff Var Root MSE prirast Mean
0.451394 17.81139 0.10502 0.58965
88
Adjustment for multiple comparisons: Tukey
vit vit Standard LSMEAN
I II prirast LSMEAN Error Pr > |t| Number
1 1 0.52020000 0.04696855 0.0001 1
1 2 0.55720000 0.04696855 0.0001 2
2 1 0.54580000 0.04696855 0.0001 3
2 2 0.73540000 0.04696855 0.0001 4
i/j 1 2 3 4
1 0.9433 0.9799 0.0238
2 0.9433 0.9981 0.0701
3 0.9799 0.9981 0.0506
4 0.0238 0.0701 0.0506
89
13 Hijerarhijski pokusni planovi
Primjer :
- 3 razine faktora A
- 3 razine faktora B unutar razina faktora A
- slučajni uzorak unutar razina B
A 1 2 3
6 44 7 4 4
8 6 44 7 4 4
8 6 44 7 4 4
8
B 1 2 3 4 5 6 7 8 9
y111 y121 y131 y141 y151 y161 y171 y181 y191
y112 y122 y132 y142 y152 y162 y172 y182 y192
Statistički model:
yijk = µ + Ai + B(A)ij + εijk
i = 1,....,a; j = 1,....,b; n = 1,......,n
Sume kvadrata:
SSUKUP = SSA + SSB(A) + SSUnutar B
stupnjevi slobode:
(abn–1) = (a–1) + (b–1) + a(b–1) + ab(n–1)
SSUNUTAR B = ∑∑ ∑ ( y
i j k ijk − yij .) 2
90
Skraćeni način računanja:
C=
(∑ ∑ ∑ y )
i j k ij
2
=
(ukupna suma)2
abn ukupni broj opazanja
3) SSUKUP = Σ Σ Σ (y
i j k ijk)
2
–C
4) SS A = ∑i
(∑ ∑ y ) − C
j k ijk
2
nb
5) SS B ( A) = ∑∑
(∑ y ) k ijk
2
− SS A − C
i j
n
6) SSUnutar B = SSUKUP – SSA – SSB(A)
ANOVA tablica:
Izvor SS df MS=SS/df
A SSA a–1 MSA
B unutar A SSB(A) a(b–1) MSB(A)
Unutar B SSUnutar B ab(n–1) MSUnutar B
Ukupno SSUKUP abn–1
Definicija pokusne greške, a time i F provjera ovisi da li su utjecaji (faktori) fiksni ili slučajni.
Najčešće je B slučajan:
- pokusna greška za provjeru utjecaja A je: MSB(A)
- pokusna greška za utjecaj B je: MSUnutar B.
F-statistika za utjecaj A:
MS A
F=
MS B ( A)
F-statistika za utjecaj B:
MS B ( A)
F=
MSUnutarB
91
13.1 SAS primjer za hijerarhijski plan
Primjer:Cilj pokusa je bio utvrditi utjecaj majki i očeva na varijabilnost porodne težine prasadi.
Upotrijebljen je hijerarhijski plan: Slučajno je izabrano 4 nerasta, po svakom nerastu dvije krmače i
po svakoj krmači dva praseta. Podaci, zajedno sa sumama i kvadratima po nerastovima i krmačama,
prikazani su u slijedećoj tablici:
DATA pig;
INPUT boar sow piglet por_tezina @@;
DATALINES;
1 1 1 1.2 1 1 2 1.2 1 2 1 1.2
1 2 2 1.3 1 3 1 1.1 1 3 2 1.2
2 1 1 1.2 2 1 2 1.2 2 2 1 1.1
2 2 2 1.2 2 3 1 1.2 2 3 2 1.1
3 1 1 1.2 3 1 2 1.2 3 2 1 1.3
3 2 2 1.3 3 3 1 1.2 3 3 2 1.2
4 1 1 1.3 4 1 2 1.3 4 2 1 1.4
4 2 2 1.4 4 3 1 1.3 4 3 2 1.3
;
PROC MIXED DATA=pig METHOD = TYPE3;
CLASS boar sow;
MODEL por_tezina = / DDFM = KENWARDROGER;
RANDOM boar sow(boar)/S;
RUN;
92
SAS ispis MIXED procedure
Type 3 Analysis of Variance
Sum of
Source DF Squares Mean Square Expected Mean Square
boar 3 0.093333 0.031111 Var(Residual)+2Var(sow(boar))+6Var(boar)
sow(boar) 8 0.040000 0.005000 Var(Residual)+2Var(sow(boar))
Residual 12 0.020000 0.001667 Var(Residual)
Error
Source Error Term DF F Value Pr > F
boar MS(sow(boar)) 8 6.22 0.0174
sow(boar) MS(Residual) 12 3.00 0.0424
Residual . . . .
Covariance Parameter
Estimates
Std Err
Effect boar sow Estimate Pred DF t Value Pr > |t|
boar 1 -0.02798 0.04239 3.96 -0.66 0.5456
boar 2 -0.05595 0.04239 3.96 -1.32 0.2579
boar 3 3.26E-15 0.04239 3.96 0.00 1.0000
boar 4 0.08393 0.04239 3.96 1.98 0.1195
sow(boar) 1 1 -0.00357 0.03390 7.87 -0.11 0.9187
sow(boar) 1 2 0.02976 0.03390 7.87 0.88 0.4060
sow(boar) 1 3 -0.03690 0.03390 7.87 -1.09 0.3085
sow(boar) 2 1 0.01508 0.03390 7.87 0.44 0.6684
sow(boar) 2 2 -0.01825 0.03390 7.87 -0.54 0.6051
sow(boar) 2 3 -0.01825 0.03390 7.87 -0.54 0.6051
sow(boar) 3 1 -0.02222 0.03390 7.87 -0.66 0.5308
sow(boar) 3 2 0.04444 0.03390 7.87 1.31 0.2268
sow(boar) 3 3 -0.02222 0.03390 7.87 -0.66 0.5308
sow(boar) 4 1 -0.01151 0.03390 7.87 -0.34 0.7431
sow(boar) 4 2 0.05516 0.03390 7.87 1.63 0.1430
sow(boar) 4 3 -0.01151 0.03390 7.87 -0.34 0.7431
93
14 Pokusni planovi sa kavezima i
pregonima
Pojedinačni tretman životinja:
Blok
I II
T2 T1
T1 T2
T1 T1
T2 T2
ANOVA tablica:
Blok
I II
T1 T2
T1 T2
T2 T1
T2 T1
ANOVA tablica:
Gdje su:
yijk = opažanje k za tretman i u bloku j
µ, = ukupni prosjek
τi = fiksni utjecaj tretmana i
βj = fiksni utjecaj bloka j
δij = slučajna greška između pokusnih jedinica za provjeru tretmana s prosjekom 0 i varijancom σ2δ,
(interakcija tretman x blok)
εij = slučajna greška unutar pokusne jedinice s prosjekom 0 i varijancom σ2
Hipoteze:
H0: τ1 = τ2 =... = τa , nema utjecaja tretmana
H1: τi ≠ τi’ za barem jedan par (i,i’), razlika između tretmana postoji
Očekivanja od MS:
E(MSpok gr) σ2 + n σ2δ
E(MSOST) σ2
95
15 Dvostruki blokovi
Primjer: 3 tretmana, 2 spol, 4 bloka prema početnoj težini
(8 blokova, 4 bloka unutar spola)
Ukupno trebamo 3×2×4=24 životinje.
Muški Ženke
Blok I Blok II Blok V Blok VI
T1 T2 T3 T1
T2 T1 T2 T2
T3 T3 T1 T3
Blok III Blok IV Blok VII Blok VIII
T1 T2 T2 T3
T3 T1 T1 T2
T2 T3 T3 T1
broj spolova, s = 2,
broj blokova unutar spola: b = 4,
broj tretmana: a = 3.
Pokusni plan i statistički model ovisi da li se neki utjecaj definira kao blok ili tretman
96
Primjer:
3 tretmana (a = 3)
2 pasmine (p = 2)
4 Bloka (broj laktacije, b = 4)
Pasmina A Pasmina B
A i B su pasmine
97
ANOVA tablica:
Lakt. I Lakt. II
Pasmina A Pasmina B Pasmina B Pasmina A
T1 T2 T3 T1
T2 T1 T2 T2
T3 T3 T1 T3
Lakt. III Lakt. IV
Pasmina B Pasmina A Pasmina A Pasmina B
T1 T2 T2 T3
T3 T1 T1 T2
T2 T3 T3 T1
ANOVA tablica:
Tretman (a–1) = 2
Pasmina × tretman (p–1)(a–1) = 2
Greška b p(a–1)(b–1) = 12
Ukupno (abp–1) = 23
99
16 Split plot pokusni plan
Značajke:
- pokusni materijal podjeli u više glavnih jedinica (plotovi) na koje se apliciraju razine nekog
faktora, a zatim se cijele jedinice podijele u podjedinice (split plotovi) na koje se primjenjuju
razine drugog faktora
- plan može uključiti jedan ili više potpuno slučajni, slučajni blok plan ili latinski kvadrat koji
se primjenjuju na jedinice ili podjedinice
B1 B1 B2 B1 B2 B1 B2 B2 B1 B2 B1 B2
A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3
Model:
yijk = µ + Blokk + Ai + δik + Bj +(AB)ij + εijk
i = 1,....,a; j = 1,....,b ; k = 1,......,n
Primjer:
a = 4, b = 2, n = 3
ANOVA tablica
F provjera za faktor A:
MS A
F=
MSCijeli plot geska
Cijeli plot pokusna greška je prosjek kvadrata za interakcija blok × A.
F-provjera za faktor B:
MS B
F=
MSSplit plot greska
Split plot greška je prosjek kvadrata ostatka.
F-provjera za interakciju A × B:
MS AxB
F=
MSSplit plot greska
16.1.1 SAS Primjer: Split plot plan, glavne jedinice kao slučajni blokovi
SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na
mliječnost krava je slijedeći. Načini tretiranja pašnjaka primijenjeni su na glavne jedinice kao
slučajni blok plan.
101
SAS program:
DATA spltblk;
INPUT blok past min milk @@;
DATALINES;
1 4 2 30 1 4 1 29 1 1 2 27 1 1 1 25
1 2 1 26 1 2 2 28 1 3 2 26 1 3 1 24
2 2 1 32 2 2 2 37 2 1 2 30 2 1 1 31
2 4 1 34 2 4 2 37 2 3 1 33 2 3 2 32
3 1 2 34 3 1 1 31 3 2 1 30 3 2 2 31
3 4 2 36 3 4 1 38 3 3 1 33 3 3 2 32
;
PROC MIXED DATA = spltblk;
CLASS blok past min;
MODEL milk =past min past*min / DDFM = KENWARDROGER;
RANDOM blok blok*past/;
LSMEANS past min past*min / DIFF ADJUST=TUKEY ;
RUN;
SAS ispis:
Covariance Parameter
Estimates
Num Den
Effect DF DF F Value Pr > F
past 3 6 5.46 0.0377
min 1 8 3.63 0.0932
past*min 3 8 0.86 0.4981
Standard
Effect past min Estimate Error DF t Value Pr > |t|
102
Differences of Least Squares Means
Standard
Effect past min _past _min Estimate Error DF t Value Pr>|t| Adjust Adj P
past 1 2 -1.0000 1.2038 6 -0.83 0.4379 Tuk-Kr 0.8385
past 1 3 -0.3333 1.2038 6 -0.28 0.7911 Tuk-Kr 0.9918
past 1 4 -4.3333 1.2038 6 -3.60 0.0114 Tuk-Kr 0.0427
past 2 3 0.6667 1.2038 6 0.55 0.5997 Tuk-Kr 0.9421
past 2 4 -3.3333 1.2038 6 -2.77 0.0325 Tuk-Kr 0.1135
past 3 4 -4.0000 1.2038 6 -3.32 0.0159 Tuk-Kr 0.0587
min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932
past*min 1 1 1 2 -1.3333 1.2247 8 -1.09 0.3080 Tuk-Kr 0.9425
past*min 1 1 2 1 -0.3333 1.4829 11.5 -0.22 0.8261 Tuk-Kr 1.0000
past*min 1 1 2 2 -3.0000 1.4829 11.5 -2.02 0.0669 Tuk-Kr 0.5207
past*min 1 1 3 1 -1.0000 1.4829 11.5 -0.67 0.5134 Tuk-Kr 0.9955
past*min 1 1 3 2 -1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955
past*min 1 1 4 1 -4.6667 1.4829 11.5 -3.15 0.0088 Tuk-Kr 0.1407
past*min 1 1 4 2 -5.3333 1.4829 11.5 -3.60 0.0039 Tuk-Kr 0.0792
past*min 1 2 2 1 1.0000 1.4829 11.5 0.67 0.5134 Tuk-Kr 0.9955
...
...
past*min 3 1 3 2 -222E-18 1.2247 8 -0.00 1.0000 Tuk-Kr 1.0000
past*min 3 1 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217
past*min 3 1 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868
past*min 3 2 4 1 -3.6667 1.4829 11.5 -2.47 0.0301 Tuk-Kr 0.3217
past*min 3 2 4 2 -4.3333 1.4829 11.5 -2.92 0.0133 Tuk-Kr 0.1868
past*min 4 1 4 2 -0.6667 1.2247 8 -0.54 0.6011 Tuk-Kr 0.9988
B2 B2 B1 B2 B1 B2 B1 B1
B1 B1 B2 B1 B2 B1 B2 B2
A4 A1 A2 A3 A2 A1 A4 A3
Model:
yijk = µ + Ai + δik + Bj +(AB)ij + εijk
i = 1,....,a; j = 1,....,b ; k = 1,......,n
ANOVA tablica
103
F provjera za A:
MS A
F=
MS Cijeli plot geska
Cijeli plot pokusna greška je prosjek kvadrata između plotova.
F-provjera za B:
MS B
F=
MS Split plot greska
Split plot greška je prosjek kvadrata ostatka.
F-provjera za interakciju A × B:
MS AxB
F=
MS Split plot greska
SAS program za primjer s utjecajem četiri tretmana na pašnjacima i dva dodatka minerala na
mliječnost krava kada su tretmani pašnjaka primijenjeni na glavne jedinice kao potpuno slučajni
plan.
SAS program:
DATA splt;
INPUT plot pas min milk @@;
DATALINES;
1 4 2 30 1 4 1 29 2 1 2 27 2 1 1 25
3 2 1 26 3 2 2 28 4 3 2 26 4 3 1 24
5 2 1 32 5 2 2 37 6 1 2 30 6 1 1 31
7 4 1 34 7 4 2 37 8 3 1 33 8 3 2 32
9 1 2 34 9 1 1 31 10 2 1 30 10 2 2 31
11 4 2 36 11 4 1 38 12 3 1 33 12 3 2 32
;
PROC MIXED DATA = splt;
CLASS plot pas min;
MODEL milk =pas min pas*min / DDFM = KENWARDROGER;
RANDOM plot(pas) /;
LSMEANS pas min pas*min / DIFF ADJUST=TUKEY ;
RUN;
SAS ispis:
Covariance Parameter
Estimates
Num Den
Effect DF DF F Value Pr > F
pas 3 8 0.80 0.5302
min 1 8 3.63 0.0932
pas*min 3 8 0.86 0.4981
104
Least Squares Means
Standard
Effect pas min Estimate Error DF t Value Pr > |t|
pas 1 29.6667 2.2298 8 13.30 <.0001
pas 2 30.6667 2.2298 8 13.75 <.0001
pas 3 30.0000 2.2298 8 13.45 <.0001
pas 4 34.0000 2.2298 8 15.25 <.0001
min 1 30.5000 1.1562 9.2 26.38 <.0001
min 2 31.6667 1.1562 9.2 27.39 <.0001
pas*min 1 1 29.0000 2.3124 9.2 12.54 <.0001
pas*min 1 2 30.3333 2.3124 9.2 13.12 <.0001
pas*min 2 1 29.3333 2.3124 9.2 12.69 <.0001
pas*min 2 2 32.0000 2.3124 9.2 13.84 <.0001
pas*min 3 1 30.0000 2.3124 9.2 12.97 <.0001
pas*min 3 2 30.0000 2.3124 9.2 12.97 <.0001
pas*min 4 1 33.6667 2.3124 9.2 14.56 <.0001
pas*min 4 2 34.3333 2.3124 9.2 14.85 <.0001
Stand
Effect past min _pas _min Estimate Error DF t Pr>|t| Adj Adj P
pas 1 2 -1.0000 3.1535 8 -0.32 0.7593 Tuk-Kr 0.9881
pas 1 3 -0.3333 3.1535 8 -0.11 0.9184 Tuk-Kr 0.9995
pas 1 4 -4.3333 3.1535 8 -1.37 0.2067 Tuk-Kr 0.5469
pas 2 3 0.6667 3.1535 8 0.21 0.8379 Tuk-Kr 0.9964
pas 2 4 -3.3333 3.1535 8 -1.06 0.3214 Tuk-Kr 0.7231
pas 3 4 -4.0000 3.1535 8 -1.27 0.2403 Tuk-Kr 0.6053
min 1 2 -1.1667 0.6124 8 -1.91 0.0932 Tuk-Kr 0.0932
105
17 Analiza kovarijance
Karakteristike:
- kategoričke + numeričke nezavisne varijable
- numerička varijabla = kovarijabla (kovarijanta)
Model:
yij = β0 + β1xij + τi + εij i = 1,.....,a j = 1,...,n
Gdje su:
yij = Opažanje jedinice j u grupi i (tretmanu i)
β0 = odsječak na y osi
β1 = regresijski koeficijent
xij = kontinuirana nezavisna varijabla sa prosjekom µx
τi = fiksni utjecaj grupe ili tretmana i
εij = slučajna greška
Pretpostavke su slijedeće:
1) kovarijabla je fiksna i nezavisna od tretmana
2) greške su nezavisne jedna od druge
3) greška ima normalnu raspodjelu sa prosjekom 0 i homogenom varijancom.
106
Površina ispod standardne normalne krivulje (z > zα)
zα
zα 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
107
Kritične vrijednosti studentove t-raspodjele (t > tα)
tα
Stupnjevi
t0.1 t0.05 t0.025 t0.01 t0.005 t0.001
slobode
108
Kritične vrijednosti hi-kvadrat raspodjele, χ2 > χ2α,
χα
Stupnjevi
χ20.1 χ20.05 χ20.025 χ20.01 χ20.005 χ20.001
slobode
0.1000 0.0500 0.0250 0.0100 0.0050 0.0010
109
Kritične vrijednosti F raspodjele, F> Fα, α = 0.05
Fα
110
Kritične vrijednosti F raspodjele, F> Fα, α = 0.05
Fα
Stupnjevi slobode brojnika
9 10 12 15 20 24 30 60 120
111
Kritične vrijednosti F raspodjele, F> Fα, α = 0.01
Fα
Stupnjevi slobode brojnika
1 2 3 4 5 6 7 8
112
Kritične vrijednosti F raspodjele, F> Fα, α = 0.01
Fα
Stupnjevi slobode brojnika
9 10 12 15 20 24 30 60 120
113
Kritične vrijednosti studentiziranog raspona, q(a,v)
a = broj grupa
v = stupnjevi slobode pokusne greške
α = 0.05
V 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 18.00 27.00 32.80 37.20 40.50 43.10 45.40 47.30 49.10 50.60 51.90 53.20 54.30 55.40 56.30
2 6.09 8.33 9.80 10.89 11.73 12.43 13.03 13.54 13.99 14.39 14.75 15.08 15.38 15.65 15.91
3 4.50 5.91 6.83 7.51 8.04 8.47 8.85 9.18 9.46 9.72 9.95 10.16 10.35 10.52 10.69
4 3.93 5.04 5.76 6.29 6.71 7.06 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.67 8.80
5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83
6 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 6.65 6.79 6.92 7.04 7.14 7.24
7 3.34 4.16 4.68 5.06 5.35 5.59 5.80 5.99 6.15 6.29 6.42 6.54 6.65 6.75 6.84
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57
9 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 5.87 5.98 6.09 6.19 6.28 6.36
10 3.15 3.88 4.33 4.66 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.12 6.20
11 3.11 3.82 4.26 4.58 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.98 6.06
12 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.61 5.71 5.80 5.88 5.95
13 3.06 3.73 4.15 4.46 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.56 5.64 5.72 5.79
15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.72
16 3.00 3.65 4.05 4.34 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66
17 2.98 3.62 4.02 4.31 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.55 5.61
18 2.97 3.61 4.00 4.28 4.49 4.67 4.83 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.57
19 2.96 3.59 3.98 4.26 4.47 4.64 4.79 4.92 5.04 5.14 5.23 5.32 5.39 5.46 5.53
20 2.95 3.58 3.96 4.24 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.50
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38
30 2.89 3.48 3.84 4.11 4.30 4.46 4.60 4.72 4.83 4.92 5.00 5.08 5.15 5.21 5.27
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 4.82 4.90 4.98 5.05 5.11 5.17
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06
120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.84 4.90 4.95
∝ 2.77 3.32 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.84
114