Professional Documents
Culture Documents
VEŽBA 1
Pod homogenošću hidrološkog niza podrazumeva se da on potiče iz jedne populacije veličine koja se razmatra.
Tipičan primer nehomogenog niza je niz godišnjih maksimuma proticaja među kojima su oni nastali usled jakih
letnjih pljuskova i oni nastali usled prolećnog otapanja snega.
Testiranje homogenosti i slučajnosti niza obavlja se odgovarajućim statističkim testovima. U opštem slučaju pro-
cedura testiranja se sastoji od sledećih koraka:
− Formulisanje nulte hipoteze H0 da nema razlike između dva niza podataka.
− Izbor statističkog testa.
− Izbor praga značajnosti α.
− Utvrđivanje regiona prihvatanja H0 za tu vrstu testa i za usvojeno α.
− Proračun vrednosti statistike na kojoj se zasniva test. Ako je sračunata vrednost izvan regiona prihvatanja,
odbaciti H0.
Parametarski testovi se zasnivaju na testiranju neke karakteristike niza (srednja vrednost, varijansa) i uključuju
određene pretpostavke o nizu:
a) podaci su međusobno nezavisni;
b) podaci potiču iz normalno raspoređenih populacija;
c) te populacije moraju imati istu varijansu.
Za neparametarske testove, koji ne koriste statistike niza, obično je dovoljna prva pretpostavka. Najčešće koriš-
ćeni parametarski testovi su z-test i t-test za testiranje srednje vrednosti i F-test za testiranje varijanse. Među
neparametarskim testovima to su testovi Men-Vitni (Mann-Whitney) i Kolmogorov-Smirnov.
Ovaj test testira jednakost srednjih vrednosti dva uzorka. Koristi se se za veliki uzorak. Pretpostavlja se da dva
uzorka potiču iz dve normalno raspoređene populacije, X1: N(µ1, σ1) i X2: N(µ2, σ2). Uzorak X1, dužine N1, ima
srednju vrednost x1 i standardnu devijaciju S1, dok uzorak X2, dužine N2 ima srednju vrednost x 2 i standardnu
devijaciju S2. Nulta i alternativna hipoteza glase:
H 0 : µ1 = µ 2
H a : µ1 ≠ µ 2
Ako se posmatra razlika srednjih vrednosti dva uzorka, ona takođe predstavlja normalno raspoređenu slučajnu
promenljivu:
X 1 − X 2 : N (µ1 − µ 2 , σ12 / N 1 + σ 22 / N 2 )
1
Stohastička hidrologija
Promenljiva z ima raspodelu N(0,1). Ovaj test je dvostrani test, jer vrednost z može biti i pozitivna i negativna.
Za zadati prag značajnosti α, region prihvatanja hipoteze H0 je (vidi sliku):
z α / 2 < z < z1−α / 2
region prihvatanja Ho
1−α
α/2 α/2
zα/2 0 z1−α/2
1.1.2 Testiranje jednakosti dve srednje vrednosti sa nepoznatim ali jednakim varijansama: t-test
Ovaj test je sličan z-testu, osim što se primenjuje za uzorke manjeg obima. Dodatna pretpostavka je da su vari-
janse dva uzorka jednake, tako da ovu hipotezu treba proveriti pre sprovođenja testa (pomoću Fišerovog F-testa
za varijanse). Ocena jedinstvene varijanse σ za dva uzorka glasi:
N 1 S12 + N 2 S 22
S2 =
N1 + N 2 − 2
Razlika srednjih vrednosti dva uzorka X 1 − X 2 kao slučajna promenljiva ima srednju vrednost µ1 − µ 2 (koja
je, prema H0, jednaka 0) i varijansu σ 1 / N 1 + 1 / N 2 . Standardizovana promenljiva
x1 − x 2
t=
S 1 / N1 + 1 / N 2
prati Studentovu raspodelu sa N 1 + N 2 − 2 stepeni slobode (videti dodatak A). I ovde se radi o dvostranom
testu, pa je region prihvatanja hipoteze H0 definisan sa
t α / 2 < t < t1−α / 2
Nulta hipoteza ovog testa je da su varijanse dva niza jednake. Posmatra se statistika
S12
F=
S 22
u kojoj je S12 veća od dve varijanse ( S12 > S 22 ). Ova statistika prati Fišerovu (Fisher) F-raspodelu sa ν1 = N1 − 1
i ν2 = N2 − 1 stepeni slobode (videti dodatak A). Ovaj test je jednostrani test, pa je region prihvatanja nulte
hipoteze:
F < F1−α ,ν1 ,ν 2
2
Stohastička hidrologija
Dva testa o kojima će ovde biti reči koriste se za ispitivanje istorodnosti raspodela dva poduzorka (dobijena
podelom originalnog uzorka).
Nulta hipoteza ovog testa je da je uzorak homogen. Dva poduzorka dužina N1 i N2 se spajaju i uređuju u rastući
niz, pri čemu se označava pripadnost prvom odnosno drugom poduzorku. Označava se redosled (rang) članova
zajedničkog niza. Sabiranjem rangova članova prvog poduzorka dobija se zbir R1, a sabiranjem rangova drugog
poduzorka dobija se zbir R2. Zatim se računaju statistike
N1 ( N1 + 1)
U 1 = N1 N 2 + − R1
2
N ( N + 1)
U 2 = N1 N 2 + 2 2 − R2
2
Između ovih statistika postoji veza:
U 1 + U 2 = N1 N 2
Za N1, N2 > 8, statistika U približno prati normalnu raspodelu sa srednjom vrednošću i varijansom:
N1 N 2 N N ( N + N 2 + 1)
µU = , σU2 = 1 2 1
2 12
a statistika
U − µU
u=
σU
prati standardnu normalnu raspodelu N(0,1). Region prihvatanja nulte hipoteze za prag značajnosti α je:
u α / 2 < u < u1−α / 2
Dva poduzorka se poređaju u rastući niz, a zatim se sračunaju njihove kumulativne relativne frekvencije F1(xi) i
F2(xj). Na grafiku x-F(x) posmatra se najveća razlika između ordinata kumulativnih relativnih frekvencija dva
poduzorka:
Dmax = max F1 ( xi ) − F2 ( x j )
gde je:
N1 N 2
n=
N1 + N 2
3
Stohastička hidrologija
Nulta hipoteza ovog testa je da se uzorak sastoji od međusobno nezavisnih podataka osmatranja iz normalno
raspoređene populacije. Varijansa populacije σ2 ocenjuje se na dva načina. Prva ocena je kvadrat nepristrasne
ocene standardne devijacije:
1 N
S2 = ∑ ( xi − x ) 2
N − 1 i =1
Druga ocena koristi kvadrate razlika uzastopnih članova neuređenog uzorka:
d2 1 N −1
= ∑ ( xi +1 − xi ) 2
2 2( N − 1) i =1
d2 /2
δ=
S2
i pod pretpostavkom da važi nulta hipoteza, očekivanje i varijansa promenljive δ su:
N −2
µ δ = 1, σ δ2 =
N 2 −1
Statistika
δ − µδ δ −1
u= =
σδ N −2
N 2 −1
prati standardizovanu normalnu raspodelu N(0,1). Region prihvatanja nulte hipoteze za prag značajnosti α je
tada:
u α / 2 < u < u1−α / 2
U ovom testu nulta hipoteza je da je uzorak sastavljen od nezavisnih članova i da je stacionaran. Za uzorak
obima N, WW-test posmatra statistiku R:
N −1
R = ∑ xi xi +1
i =1
U slučaju da su članovi niza nezavisni, statistika R prati normalnu raspodelu sa srednjom vrednošću i vari-
jansom:
s12 − s 2
R=
N −1
s 22 − s 4 s14 − 4s12 s 2 + 4 s1 s3 + s 22 − 2s 4
σ 2R = + −R2
N −1 ( N − 1)( N − 2)
4
Stohastička hidrologija
N
gde je s k = ∑ xik . Veličina
i =1
R−R
u=
σR
prati standardnu normalnu raspodelu N(0,1). Region prihvatanja nulte hipoteze za prag značajnosti α je tada:
u α / 2 < u < u1−α / 2
Međusobna zavisnost članova nekog niza odražava se i na vrednosti koeficijenta autokorelacije. Koeficijent
autokorelacije prvog reda je mera zavisnosti između uzastopnih članova niza. Analogno tome, koeficijent auto-
korelacije k-tog reda je mera zavisnosti između svakog k-tog člana niza. Red k se naziva i pomak.
1 k
S rk = 1 + 2 ∑ r j2 , k = 1,2, K
N
j =1
Region prihvatanja nulte hipoteze za prag značajnosti α je:
z α / 2 ⋅ S rk < rk < z1−α / 2 ⋅ S rk
gde su z α / 2 i z1−α / 2 standardizovane normalne promenljive sa funkcijom raspodele α/2 odnosno 1 – α/2.